Google 这次给了两个很硬的价格锚点:Nano Banana 2 Lite 约 4 秒生成一张 1K 图,每张约 0.034 美元;Gemini Omni Flash 的视频输出价格是 0.10 美元/秒。

这不像一次普通模型上新。它更像 Google 在告诉开发者和营销团队:别只拿 AI 做几张样片了,可以开始把“批量出图—生成视频—继续编辑”接进自己的生产流程。

我更在意的也是这点。生成式媒体的竞争,正在从单次效果,转向成本、延迟、可控性和入口归属。

两个模型,分工很清楚

Nano Banana 2 Lite 负责把图做便宜、做快。Omni Flash 负责把静态素材推成可编辑视频。

项目关键信息直接影响
Nano Banana 2 Lite文生图约 4 秒;1K 图约 0.034 美元;替代旧版 Nano Banana适合高吞吐出图、快速原型、电商素材草稿
Gemini Omni Flash开发者首次可用;视频 0.10 美元/秒;与 Veo 3.1 Fast 相同适合图生视频、短视频生成、自然语言多轮编辑
可用入口AI Studio、Gemini API、Enterprise Agent Platform方便开发者试用、接入和企业集成
透明机制两款模型使用 SynthID 水印,可通过 Gemini app、Chrome、Search 验证有利于内容溯源、审核和品牌风控

Nano Banana 2 Lite 的定位很直白:快、便宜、够用。Google 也明确建议旧版 Nano Banana 用户迁移。

Omni Flash 管下一段工序。它支持文本、图像、视频输入下的视频生成,也支持自然语言多轮编辑。通过 Interactions API,还能保留上下文,最多连续编辑三次。

但要说清楚:它目前主要还是 10 秒视频生成,不是完整视频制作系统。

典型链路会很像这样:先用 Nano Banana 2 Lite 批量生成商品图、场景图、人物设定图;再交给 Omni Flash 做短视频、镜头运动和局部修改。

这套东西不太像给艺术家准备的单点工具。它更像给营销部门、内容工具公司和 AI 应用开发者准备的批量接口。

受影响最大的,是开发者和电商内容团队

AI 应用开发者先要做一件事:重新算模型路由。

如果产品里有海报生成、商品图生成、广告素材草稿、UGC 视频模板,Nano Banana 2 Lite 可能会变成默认候选。原因不是它一定效果最好,而是价格和速度足够适合试错。

开发者可以先把低价值、高频次的出图任务迁过去。比如草稿、预览图、A/B 素材、模板填充。高要求成片再交给更贵、更稳的模型或人工环节。

采购上也不用急着全量迁移。更现实的做法是灰度接入:先测三件事——失败率、改稿轮次、角色一致性。价格便宜,只能说明单次调用便宜,不说明整条链便宜。

内容生产和电商营销团队的动作更具体:把它当“素材前置工厂”,别当“自动成片机器”。

商品主图、场景图、短视频第一版,可以交给这条链路先跑。真正要上线的广告、品牌视频、复杂分镜,还要保留人工审核和后期修正。

这会改变团队分工。设计师少做空白起稿,多做筛选、修图和风格把关;运营少等素材,多做版本测试;但审核压力会上来,因为生成得越快,错误也会来得越快。

生成式媒体最怕的不是失败一次。最怕的是第七轮才发现产品变形、人物换脸、镜头接不上。

Google 卖的是闭环,也是在收入口

我不太买账的一点,是把官方基准图表直接当胜负表。

那不是独立第三方评测。现在不能据此宣布它打赢 Midjourney、Runway 或 OpenAI。更稳妥的说法是:Google 把价格、速度和工作流连得更紧了。

真正的竞争变量很朴素:

  • 一千张图多少钱;
  • 一条 10 秒视频要改几轮;
  • 角色和商品能不能稳住;
  • API 能不能接进现有工具;
  • 水印、审核、存储和人审成本谁来承担。

“天下熙熙,皆为利来。”放在这里,就是创意生产也要进成本表。模型再惊艳,如果每次改稿都贵、慢、不可控,就很难进日常生产。

Google 这次做对的地方,是没有只卖一个模型。它把 AI Studio、Gemini API、Enterprise Agent Platform 接起来,再往 Search、Gemini app、Photos、Flow、Ads 这些入口扩散。

便利是真的。锁定也是真的。

一旦创意团队的出图、视频编辑、广告投放、内容验证都落在 Google 的入口里,Google 拿到的就不只是调用费。它会更接近创意生产链的调度台。

这像早期铁路,不完全一样,但逻辑相通。刚开始大家看速度,后来真正值钱的是站点、货运网络、时刻表和调度权。AI 视频也会走到这一步:单点模型决定热闹,管线和入口决定归属。

别把低单价看成低总成本

限制要摊开讲。

Omni Flash 还在 preview。它暂不支持音频参考和场景延展。API 虽然接受最长 3 秒的视频参考,但模型目前不能正确处理。跨场景或镜头移动时,角色一致性也有限。

这些限制对 demo 影响不大。对商业生产影响很大。

电商短视频要的是产品别变形。品牌广告要的是人物、色彩、构图稳定。工具开发者要的是失败可控、成本可估、结果可复现。

低价也不等于低总成本。大规模生成还要算调用量、编辑轮次、存储、审核、人审、素材管理和系统集成。0.034 美元一张图很便宜,但如果一条素材要反复重生成几十次,账单会换个地方回来。

接下来最该观察的不是发布会上的样片,而是三件事:

观察项为什么关键
实际失败率和改稿轮次决定总成本,不是单次价格
角色、商品、风格一致性决定能不能进入广告和电商生产
平台入口绑定程度决定开发者是在接能力,还是被接管工作流

所以,这次发布的分水岭不在模型名字。

它表明生成式媒体正在从“会不会生成”,走向“能不能稳定生产”。Google 把价格压下来,把速度拉上去,把入口铺开。开发者会更容易做端到端产品,内容团队也会更快拿到素材。

代价也摆在台面上:创意生产链的门把手,可能又被平台握紧了一点。