Google 这次给了两个很硬的价格锚点:Nano Banana 2 Lite 约 4 秒生成一张 1K 图,每张约 0.034 美元;Gemini Omni Flash 的视频输出价格是 0.10 美元/秒。
这不像一次普通模型上新。它更像 Google 在告诉开发者和营销团队:别只拿 AI 做几张样片了,可以开始把“批量出图—生成视频—继续编辑”接进自己的生产流程。
我更在意的也是这点。生成式媒体的竞争,正在从单次效果,转向成本、延迟、可控性和入口归属。
两个模型,分工很清楚
Nano Banana 2 Lite 负责把图做便宜、做快。Omni Flash 负责把静态素材推成可编辑视频。
| 项目 | 关键信息 | 直接影响 |
|---|---|---|
| Nano Banana 2 Lite | 文生图约 4 秒;1K 图约 0.034 美元;替代旧版 Nano Banana | 适合高吞吐出图、快速原型、电商素材草稿 |
| Gemini Omni Flash | 开发者首次可用;视频 0.10 美元/秒;与 Veo 3.1 Fast 相同 | 适合图生视频、短视频生成、自然语言多轮编辑 |
| 可用入口 | AI Studio、Gemini API、Enterprise Agent Platform | 方便开发者试用、接入和企业集成 |
| 透明机制 | 两款模型使用 SynthID 水印,可通过 Gemini app、Chrome、Search 验证 | 有利于内容溯源、审核和品牌风控 |
Nano Banana 2 Lite 的定位很直白:快、便宜、够用。Google 也明确建议旧版 Nano Banana 用户迁移。
Omni Flash 管下一段工序。它支持文本、图像、视频输入下的视频生成,也支持自然语言多轮编辑。通过 Interactions API,还能保留上下文,最多连续编辑三次。
但要说清楚:它目前主要还是 10 秒视频生成,不是完整视频制作系统。
典型链路会很像这样:先用 Nano Banana 2 Lite 批量生成商品图、场景图、人物设定图;再交给 Omni Flash 做短视频、镜头运动和局部修改。
这套东西不太像给艺术家准备的单点工具。它更像给营销部门、内容工具公司和 AI 应用开发者准备的批量接口。
受影响最大的,是开发者和电商内容团队
AI 应用开发者先要做一件事:重新算模型路由。
如果产品里有海报生成、商品图生成、广告素材草稿、UGC 视频模板,Nano Banana 2 Lite 可能会变成默认候选。原因不是它一定效果最好,而是价格和速度足够适合试错。
开发者可以先把低价值、高频次的出图任务迁过去。比如草稿、预览图、A/B 素材、模板填充。高要求成片再交给更贵、更稳的模型或人工环节。
采购上也不用急着全量迁移。更现实的做法是灰度接入:先测三件事——失败率、改稿轮次、角色一致性。价格便宜,只能说明单次调用便宜,不说明整条链便宜。
内容生产和电商营销团队的动作更具体:把它当“素材前置工厂”,别当“自动成片机器”。
商品主图、场景图、短视频第一版,可以交给这条链路先跑。真正要上线的广告、品牌视频、复杂分镜,还要保留人工审核和后期修正。
这会改变团队分工。设计师少做空白起稿,多做筛选、修图和风格把关;运营少等素材,多做版本测试;但审核压力会上来,因为生成得越快,错误也会来得越快。
生成式媒体最怕的不是失败一次。最怕的是第七轮才发现产品变形、人物换脸、镜头接不上。
Google 卖的是闭环,也是在收入口
我不太买账的一点,是把官方基准图表直接当胜负表。
那不是独立第三方评测。现在不能据此宣布它打赢 Midjourney、Runway 或 OpenAI。更稳妥的说法是:Google 把价格、速度和工作流连得更紧了。
真正的竞争变量很朴素:
- 一千张图多少钱;
- 一条 10 秒视频要改几轮;
- 角色和商品能不能稳住;
- API 能不能接进现有工具;
- 水印、审核、存储和人审成本谁来承担。
“天下熙熙,皆为利来。”放在这里,就是创意生产也要进成本表。模型再惊艳,如果每次改稿都贵、慢、不可控,就很难进日常生产。
Google 这次做对的地方,是没有只卖一个模型。它把 AI Studio、Gemini API、Enterprise Agent Platform 接起来,再往 Search、Gemini app、Photos、Flow、Ads 这些入口扩散。
便利是真的。锁定也是真的。
一旦创意团队的出图、视频编辑、广告投放、内容验证都落在 Google 的入口里,Google 拿到的就不只是调用费。它会更接近创意生产链的调度台。
这像早期铁路,不完全一样,但逻辑相通。刚开始大家看速度,后来真正值钱的是站点、货运网络、时刻表和调度权。AI 视频也会走到这一步:单点模型决定热闹,管线和入口决定归属。
别把低单价看成低总成本
限制要摊开讲。
Omni Flash 还在 preview。它暂不支持音频参考和场景延展。API 虽然接受最长 3 秒的视频参考,但模型目前不能正确处理。跨场景或镜头移动时,角色一致性也有限。
这些限制对 demo 影响不大。对商业生产影响很大。
电商短视频要的是产品别变形。品牌广告要的是人物、色彩、构图稳定。工具开发者要的是失败可控、成本可估、结果可复现。
低价也不等于低总成本。大规模生成还要算调用量、编辑轮次、存储、审核、人审、素材管理和系统集成。0.034 美元一张图很便宜,但如果一条素材要反复重生成几十次,账单会换个地方回来。
接下来最该观察的不是发布会上的样片,而是三件事:
| 观察项 | 为什么关键 |
|---|---|
| 实际失败率和改稿轮次 | 决定总成本,不是单次价格 |
| 角色、商品、风格一致性 | 决定能不能进入广告和电商生产 |
| 平台入口绑定程度 | 决定开发者是在接能力,还是被接管工作流 |
所以,这次发布的分水岭不在模型名字。
它表明生成式媒体正在从“会不会生成”,走向“能不能稳定生产”。Google 把价格压下来,把速度拉上去,把入口铺开。开发者会更容易做端到端产品,内容团队也会更快拿到素材。
代价也摆在台面上:创意生产链的门把手,可能又被平台握紧了一点。
