Google 为开发者推出了新的 AI 视频模型,而且比之前便宜——便宜得多。 Veo 3.1 Lite 本周通过 Gemini API 上线,价格低于 Veo 3.1 Fast 的一半,后者是 Google 视频生成产品线中的中档选项。该模型支持文本转视频(Text-to-Video)和图像转视频(Image-to-Video),横屏(16:9)与竖屏(9:16)两种格式,以及 720p 和 1080p 分辨率。视频时长可在 4、6 或 8 秒之间调整,费用会随之按比例变化。 换个角度来看:Veo 3.1 之前通过 API 生成带音频的视频每秒大约花费 $0.40,而 Veo 3.1 Fast 为 $0.15/秒。Lite 将这一门槛进一步降到 720p 每秒 $0.05——这终于让高频视频应用对更小规模的创作者在财务上变得可行
我们尝试了该模型,生成过程非常快,且没有明显的画质下降。时长为 8 秒的(目前可用的最长)视频,生成用时不到 1 分钟。对提示词的遵循程度还算不错,字母排版上出现了一个小故障。除此之外,Veo 3.1 Lite 和 Veo 3.1 Fast 之间的差异,并不像 Veo 3.1 Fast 和最初的完整版 Veo 3.1 之间那样显著
Google 并不止步于“有竞争力”的定价。4 月 7 日,Veo 3.1 Fast 的定价也同样在下调。公司表示,这“完善了 Veo 3.1 模型家族,让开发者能够根据需求选择灵活的档位”。传递给构建者的信息很明确:选你的档位,而不是你的天花板。 这很重要,因为成本一直是 AI 视频生成的那个不太体面的秘密。演示中的效果看起来很棒,但通常那些都是精挑细选的生成结果,而视频 AI 仍然过于随机,难以稳定地持续使用。
OpenAI 则是吃了苦头。据报道,Sora 每天在烧 $15 million,公司上周宣布将彻底关闭该产品。如今 OpenAI 在“转向世界仿真研究以推动机器人技术发展”——这是非常“公司化”的说法,本质上就是没能做成。与迪士尼达成的 10 亿美元交易也在这场事故中被拖进了废墟。 Veo 3 于 2025 年 5 月上线,作为 Google 最大声的 AI 展示,定位为“一体化生成器”,不仅生成视频,还能生成完整的声音:环境噪音、音效,甚至对话。随后在 10 月推出 Veo 3.1,与 Sora 2 正面硬刚。画质令人印象深刻,但价格标签对任何试图以规模化方式交付内容的人来说,并不算友好。 中国的竞争对手很早就发现了这一差距。快手的 Kling AI 以远低于 Google 的 250 美元 Ultra 方案,甚至也低于 20 美元的专业版替代方案,提供了相当的免费视频生成能力。腾讯的 Hunyuan Video 走得更进一步:推出开源模型并免费提供,且时间点正好对齐 OpenAI 在 2024 年推出 Sora 时的宣传热潮。中国市场不仅仅在“质量”上竞争。它在“经济性”上竞争,而这场辩论它已经赢了很久。 在更专业的层面,像 Utopai 的 PAI 这样的工具正在开辟完全不同的细分领域:以长篇方式讲述具有一致角色的电影级故事,提供详尽的分镜脚本,并在场景级别由 AI 驱动剪辑。PAI 也不便宜——100 美元买 1 万 credits,但消耗很快——不过这表明认真做内容的人们想要的方向。他们想要的是控制权,而不只是生成。 Veo 3.1 Lite 并不试图成为 PAI 那样的电影级内容流水线,也不是要在价格上击败 Kling。它瞄准的是中间地带:需要以规模化方式交付视频功能的开发者,而又不希望在每一次迭代中都把 API credits 大量烧掉。该模型是 Google 面向下一代应用的基础设施布局:把视频当作标准组件,而不是高价噱头。 如果 4 月 7 日对 Veo 3.1 Fast 的降价如承诺般继续兑现,那么在一周内,使用 AI 视频构建的成本将会在 Google 整个产品线范围内下调。