昨天 20:58阅读时长 8 分钟

Nano Banana 2 Lite：快图模型真正改变的是迭代成本

Google 发布 Nano Banana 2 Lite，把 Gemini 图像生成拆出更便宜、更快的一档。本文基于官方资料梳理价格、能力边界和开发者该怎么选。

Nano Banana 2 Lite 图像生成工作流

Google 这次把 Nano Banana 家族拆得更清楚了：Nano Banana 2 继续做通用主力，Nano Banana Pro 面向复杂专业任务，新发布的 Nano Banana 2 Lite 则专门服务一个更朴素的需求：少花钱、少等待，多试几版。

截至 2026-07-03，Nano Banana 2 Lite 已在 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 可用。它的正式模型名是 gemini-3.1-flash-lite-image，官方定位是 Gemini 图像模型里最快、最省的一档，用来承接高频草图、广告变体、批量素材和交互式产品里的快速视觉反馈。

先看最硬的数字

Google 发布博客给出的核心卖点是：text-to-image 输出约 4 秒，每张 1K 图像价格约 0.034 美元。Gemini API 定价页写得更细：1K 输出消耗 1120 个 image output tokens，按标准模式每百万图像 token 30 美元计价，等效约 0.0336 美元一张；如果走批处理，等效约 0.0168 美元一张。

这和 Nano Banana 2 的标准 1K 图价形成清晰差距：Nano Banana 2 标准模式约 0.067 美元一张，批处理约 0.034 美元一张。换句话说，Lite 标准价接近主力模型批处理价，Lite 批处理价则更适合大规模生成初稿。

官方模型页还写到 Lite 目标是 sub-2 second end-to-end latency，但发布博客同时用 4 秒描述 text-to-image 输出。两者口径不完全一样，开发者最好把它当成“低延迟方向”而不是保证值：真实速度仍会受区域、队列、提示长度、输入图片和 API 负载影响。

它适合做什么

Nano Banana 2 Lite 最像一个视觉草稿引擎。你不一定拿它产出最终海报，但可以用它在很短时间内探索风格、构图、配色、商品陈列和社媒封面方向。对产品团队来说，这种模型的价值不是“单张图更惊艳”，而是让一次创意会议能多看几十种可能。

它也适合 A/B 测试和自动化内容流水线。例如电商商品图可以先批量生成不同场景草案，营销团队再挑出少数方向交给 Nano Banana 2 或 Pro 做更精修的版本。社交产品、头像工具、模板站、广告投放后台，也都更在意吞吐、延迟和成本稳定性。

Google 文档同时强调，Lite 支持 1K 输出、常见宽高比、文本到图像、图像加文本编辑，以及一些局部快速修改。对“换颜色、做贴纸、调背景、快速变体”这类任务，它比高端模型更像一个可以频繁调用的工作层。

任务	更合适的模型层
快速草图、低成本批量候选图、广告变体	Nano Banana 2 Lite
通用高质量生成、多参考图、一致性要求更高的编辑	Nano Banana 2
品牌关键图、复杂指令、专业素材、对文字和细节要求极高的任务	Nano Banana Pro

它不适合做什么

便宜不是万能。Google 的图像生成文档明确说，Lite 不是为多个参考输入或多轮连续编辑优化的。它也不支持 Gemini 3.1 Flash Image 那类 Google Search grounding 能力；如果你要做包含事实细节的图表、近期事件、复杂品牌规范或需要多张参考图保持严格一致的内容，主力模型或 Pro 仍然更稳。

另一个容易忽略的限制是分辨率。Lite 聚焦 1K 输出，而 Nano Banana 2 支持 0.5K、1K、2K、4K，Pro 也面向更复杂的专业资产生产。如果最终用途是大屏海报、印刷物、复杂包装或带大量文字的信息图，Lite 更适合做前期方向，不一定适合做最终交付。

和 Gemini Omni Flash 的组合

这次 Google 还把 Gemini Omni Flash 推给开发者公开预览。它主打视频生成和自然语言视频编辑，价格为每秒 0.10 美元。Google 展示的组合思路是：先用 Nano Banana 2 Lite 快速生成静态视觉，再把选中的图像送进 Omni Flash 做短视频或电商展示。

这个组合比单独发布一个快图模型更有意思。对于电商、广告和内容工具来说，真正的产品流程可能会变成：快速出图，挑方向，转成视频，再用自然语言继续改镜头、动作或风格。Google 的 Omni Product Studio 演示就是沿着这条链路走。

不过 Omni Flash 目前仍是 preview，并且官方列出了一些限制：Gemini API 里的视频生成以 10 秒为当前能力边界，音频参考和场景扩展尚不支持，视频参考处理也有未完全可用的地方。生产环境里要把它当成可探索的新能力，而不是已经完全稳定的媒体流水线。

对普通创作者和开发者的意义

对普通创作者，Nano Banana 2 Lite 的变化不是“终于有一个更强模型”，而是“试错更便宜”。如果一个封面方向要生成 20 张候选图，模型单价直接决定你敢不敢多试。更低价格会鼓励用户把 AI 生图从偶尔使用，变成日常草稿流程。

对开发者，它更像是架构上的新档位。过去很多产品只有一个图像模型入口：用户点击生成，就调用最强模型。现在更合理的做法是分层：草稿、预览、低价值批处理用 Lite；需要高一致性和更复杂推理时切到 Nano Banana 2；需要专业控制、品牌一致性或复杂素材时再用 Pro。

还要注意安全与透明度。Google 表示 Nano Banana 2 Lite 和 Gemini Omni 使用 SynthID 水印，并可通过 Gemini app、Chrome 或 Search 的相关能力帮助识别 AI 内容。对面向用户的产品来说，标注 AI 生成、保留审核链路、避免误导性素材，会比单纯追求更快出图更长期。

我的判断

Nano Banana 2 Lite 不一定会让单张作品立刻超越高端模型，但它会改变大量产品的默认交互。以前用户会等一张图，现在用户会期待“像拖动滑杆一样”快速刷新一组视觉方案。成本降下来之后，AI 图像生成更容易嵌入模板工具、广告后台、电商运营和个人创作流程。

真正值得关注的不是 4 秒这个数字本身，而是 Google 把图像模型拆成了更清晰的工作流层级：Lite 管速度和规模，2 管通用质量，Pro 管复杂专业控制。开发者接下来要做的不是盲目替换模型，而是把自己的生成任务拆开，给每一层选对价格、延迟和质量。