
6月30日,Google DeepMind 发布两款新模型——Nano Banana 2 Lite 和 Gemini Omni Flash,分别聚焦高速图像生成与高质量视频创作,并已在 Google AI Studio、Gemini API 及企业代理平台同步上线。

Nano Banana 2 Lite(gemini-3.1-flash-lite-image)是 Nano Banana 家族中速度最快、成本最低的图像模型,文本转图像仅需约4秒,定价为每千张0.034美元。该模型专为高吞吐、低延迟场景设计,适用于快速原型开发和交互式视觉草图,在提示遵循度、角色一致性和图内文字渲染方面保持了可靠表现。它已在搜索AI模式、Gemini App、NotebookLM、Google Photos 等消费端产品中逐步铺开。
同期发布的 Gemini Omni Flash(gemini-omni-flash-preview)面向视频生成与对话式编辑。该模型支持文本、图像和视频多模态输入,用户可通过自然语言对视频进行编辑操作,并借助 Gemini 的知识储备增强视频内容的叙事逻辑。目前视频生成长度上限为10秒,定价为每秒0.10美元,音频参考输入和场景扩展功能暂未开放。

两个模型的组合使用值得关注:Nano Banana 2 Lite 快速生成图像后,可将其作为参考输入传递给 Gemini Omni Flash,实现图像到动画的转换。Google 同步推出了三个演示应用——Anywhere(照片瞬移地标)、Space Lift(室内设计动画化)和 Omni Product Studio(商品图转电商视频),以展示这一组合工作流。
安全层面,两款模型均集成 SynthID 水印,可通过 Gemini App、Chrome 和搜索验证 AI 内容。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/16692