最好用的 Nano Banana Pro 提示词,不是把一堆风格词和平台热词塞进同一个输入框,而是把任务写成一份结构清楚的制作说明:主体、构图、动作、场景、风格,再加上这次任务真正需要的额外约束。如果你拿它来做海报、信息图、参考图编辑或分镜,这种写法比收藏一百条“神级提示词”更有用。
这不是写作偏好,而是当前官方建议。Google 最新的 Nano Banana Pro 提示技巧 和官方 Gemini 图片生成文档 都在强调:描述式场景提示,通常比零散关键词更稳。按 Google 这份文档在 2026 年 3 月 23 日 的更新状态来看,Nano Banana Pro 也就是 gemini-3-pro-image-preview,仍然是 Gemini 图片路线里更偏专业资产和复杂指令控制的那一档。
但有一个前提必须先说清楚。Nano Banana Pro 并不是所有图片任务的默认答案。同一份 Google 文档在 2026 年 3 月 23 日 的说明里也明确写着,Gemini 3.1 Flash Image 才是大多数新图片工作流的默认起点;只有当你真的在乎文字可读性、构图控制、参考图约束,或者最终成品质量时,Pro 才值得升级。如果你现在要的是更快的草稿路线,先去看 Nano Banana 2 vs Nano Banana Pro。如果你现在卡在更干净的文字、更稳的编辑和更可控的成图,那这篇提示词指南才是更对路的入口。
| 你的任务类型 | 建议先用的提示模式 | 最不能省略的部分 |
|---|---|---|
| 海报、广告图、社媒图 | 精准文字提示 + 排版约束 | 重要文案全部加引号,并明确它应该放在哪里 |
| 信息图、标注图、结构图 | 事实约束提示 | 把组件、层级和标签写死,再人工复核 |
| 多参考图融合 | 角色分配型多图提示 | 告诉模型每张图各自负责主体、风格、产品还是环境 |
| 基于现有图片的局部修改 | 只改一处提示 | 明确“改什么”,也明确“其他什么必须保持不变” |
| 分镜、漫画页、序列镜头 | 场景 + 面板提示 | 先写场景,再写面板逻辑 |
| 高价值品牌图、英雄图 | 描述式场景段落 | 用镜头、光线、材质描述替代泛泛风格词 |
要点速览
- 想让 Nano Banana Pro 出好图,先写清楚主体、构图、动作、场景、风格和编辑指令,再按任务补充文字、事实约束或锁定元素。
- 文字海报、信息图、参考图融合、分镜和高价值交付图,都是 Pro 更值得上场的场景;如果只是批量草稿和快速试方向,Nano Banana 2 通常更划算。
- 参考图不要一口气堆满,通常 2 到 3 张最稳。最有效的写法,是给每张图明确角色,并在每轮里只改一个变量。
- 图片里一旦涉及精确文字、事实标签或多语言替换,生成之后都必须人工复核。Pro 能把错误内容做得很像真的,这正是你不能跳过审核的原因。
- 真正高命中的顺序通常是:先拿到对的构图,再补精确文字;先做对原图结构,再在同一会话里做本地化;一旦连续编辑开始重复或发糊,就立刻换新会话而不是继续硬压。
Nano Banana Pro 最吃哪种提示结构

理解 Nano Banana Pro 最简单的方式,是把它当成一个更吃“制作说明”的模型,而不是一个靠关键词堆砌触发灵感的模型。Google 自己的提示指南把提示拆成六个部分,这依然是最稳的起点。
主体:画面里是谁,或者是什么。构图:镜头类型、取景、比例,以及主体在画面里的位置。动作:主体正在做什么,或者你希望图片发生什么变化。场景:环境、时代、空间语境。风格:真实度、设计语言、光线、色调、镜头质感、材质感。编辑说明:精确文字、锁定元素、局部修改要求。
实际写起来,一个好的 Nano Banana Pro 提示通常更像一小段制作说明,而不是购物清单。官方图片文档已经明确说过,描述式场景提示比离散关键词更强;这也和社区里真正把模型用顺手的人摸出来的经验是一致的。
如果你不知道从哪里开始,可以先用这套基础模板:
text[主体]。构图为 [镜头 / 画幅比例]。主体正在 [动作或变化]。 场景设定在 [环境 / 语境]。视觉风格为 [风格、光线、镜头、材质]。 如果是编辑任务:只修改 [X],其余 [Y 和 Z] 必须完全不变。 如果涉及文字:请准确渲染 “[TEXT]”,并说明 [字体 / 位置 / 层级]。 如果涉及准确性:必须包含 [组件 / 标签 / 事实],并保持布局清晰。
最后这一行,正是 Nano Banana Pro 提示和普通图片提示最关键的区别。你不需要每次都把所有高级控制都写进去,只需要补上和这次任务真正对应的那一项:
- 做海报、菜单、广告图和结构图时,加“精确文字”;
- 做编辑和连续角色时,加“锁定不变元素”;
- 做信息图时,加“事实和组件约束”;
- 用多张参考图时,加“每张图的角色分工”。
最常见的错误,是想在一个提示里同时解决生成、排版、本地化和语义编辑四件事。Nano Banana Pro 很擅长多轮协作,但这不等于“所有创意决策都在一条提示里完成”。如果图片既要强场景,也要精确文字,先把构图做对,再在同一会话里收紧文字;如果图片后面还要做本地化,先把基础信息图结构做稳,再在原会话里要求换语言。把工作拆开,反而更能减少模型乱发挥。
如果你在开始试之前想先看更完整的能力背景,可以先读英文的 Nano Banana Pro capabilities。但对大多数人来说,先掌握一个可复用提示结构,再根据任务微调,会更快进入有效迭代。
按任务拆开的 15 个 Nano Banana Pro 提示模板
这些模板的意义,不是让你永久复制粘贴,而是让你看到“什么任务适合什么提示结构”。具体内容可以换,但结构最好别乱。
1. 带精确主标题的海报
当文字本身就是画面的一部分,而不是后期再贴上去时,用这一类写法。
text制作一张 4:5 的城市摄影展海报。画面是柏林雨夜街道,地面有反光,霓虹光斑柔和。整体为电影感 editorial 风格,真实光线,轻微胶片颗粒。 请准确渲染标题“雨后之城”,使用粗体白色窄体无衬线字体,放在顶部。 请准确渲染副标题“柏林,2026 年 6 月”,使用更小的白色文字,放在标题下方。 保证文字干净、居中,并且在缩略图尺寸下仍然可读。
2. 产品发布横幅
当你需要品牌级质感,但又不想把画面做成一张拥挤广告图时,这类结构更稳。
text制作一张 16:9 的产品发布横幅。主体是一台哑黑色无线音箱,放在石材底座上。三分之四英雄视角,边缘柔光,精致棚拍阴影,背景为深炭灰并带轻微纹理。 请在左侧准确渲染文案“安静而有力”,使用优雅的大写无衬线字形。 保持产品真实,背景简洁,文字层级清楚。
3. 技术信息图
当模型要负责“解释”,而不是只负责“好看”时,用这种写法。
text制作一张现代 16:9 信息图,解释无反相机传感器结构。请准确展示从前到后的这些标注层:保护玻璃、微透镜阵列、彩色滤镜阵列、光电二极管、布线层、传感器基底。 使用干净的扁平矢量风格、宽留白、黑色无衬线标签和细引线。 整体布局要有教学感、事实感,并且容易快速扫读。
4. 本地化现有图形
Google 当前文档明确展示了这种“在同一会话里翻译信息图”的做法。
text把这张信息图更新为西班牙语版本,不要修改图片中的其他元素。 保持原有布局、配色、图标位置和视觉层级不变。
5. 只修改一个元素
当你希望模型停止擅自改动画面,这是最安全的语义编辑模式。
text基于提供的图片,只把这位男士的领带改成森林绿色。 保持姿势、表情、身体位置、背景、光线和裁切完全不变。 不要修改任何其他服装细节。
6. 换装但保留身份
当你要做稍强一点的编辑,但仍然需要人物连续性时,用这一类提示。
text基于提供的人像,把当前服装替换成结构感明显的海军蓝羊毛大衣和炭灰色围巾。 保持相同的脸部、发型、肤色、表情、姿势、背景透视和光线。 让服装变化看起来自然且真实。
7. 多参考图融合,并明确角色分工
不要上传三张图,然后赌模型自己猜到重点。
text使用图片 A 作为人物脸部和身体比例参考。 使用图片 B 作为插画风格和色彩处理参考。 使用图片 C 作为森林环境和雾气氛围参考。 创作一张 3:4 的奇幻书封人物肖像,表现这个人物在黎明时分穿过森林。 脸部尽量接近图片 A,笔触风格尽量接近图片 B,氛围尽量接近图片 C。
8. 基于参考图的产品场景图
这比一句“做张真实的产品场景图吧”要可控得多。
text使用图片 A 作为手袋参考,使用图片 B 作为生活方式摄影风格参考。 制作一张 4:5 的时尚 campaign 图片,表现一位女性在巴黎黄金时刻街头行走,手上拿着图片 A 中的手袋。 保持手袋的设计、材质和轮廓忠于参考图。 沿用图片 B 的 editorial 色调和柔和镜头泛光。
9. 保持角色一致性的场景图
当你想让同一个吉祥物或主角出现在多张图里时,这一类提示更稳。
text把提供的角色图作为唯一的标准参考。 创建一张 16:9 场景图,表现同一角色站在明亮的创业办公室里,手持平板,正在和一个小团队交流。 保持相同的脸部、头发轮廓、服装颜色和身体比例。 只改变姿势、镜头角度和背景。
10. Editorial 人像
这通常比堆一串风格形容词更有效。
text创作一张陶艺师在阳光工作室中的半身写实人像。3:4 构图,人物略微偏离中心,浅景深。 光线从镜头左侧窗边射入,手部有暖高光,空气中有轻微尘埃感。 整体呈现 85mm 人像镜头质感,陶土纹理丰富,氛围安静且具有 editorial 感。
11. 高价值产品英雄图
当图片本身就是交付物,而不只是草稿时,Pro 更值得出场。
text制作一张 16:9 的高端产品英雄图,主体是一台不锈钢意式咖啡机,放在打磨石材台面上。 低机位三分之四构图,右侧柔和晨光,可见蒸汽,反射真实,拉丝金属纹理清晰。 整体为高端商业摄影风格,背景干净,不要额外道具。
12. 分镜
这是官方 DeepMind 页面目前最明确展示的 Pro 强项之一。
text为这个场景制作 3 格分镜。 第 1 格:广角建立镜头,年轻宇航员独自站在霓虹照亮的城市街道上。 第 2 格:中景镜头,她抬头看向楼顶发光信号。 第 3 格:近景镜头,她的手启动腕部装置。 三格都保持相同的人物设计和配色体系。
13. 带风格化标题的漫画封面
当插画和标题都同样重要时,用这种写法更靠谱。
text制作一张复古漫画封面,让参考图中的人物变成一位在复古未来主义城市中的新英雄。 使用高饱和主色调、戏剧化动作姿势和半色调纹理。 请在顶部准确渲染标题“最后轨道”,使用复古漫画字形。 角落里可以加入一个通用的刊号徽章,但不要出现真实品牌名。
14. 改画幅比例
当你已经有一张不错的图,只是需要适配平台尺寸时,这类提示很有用。
text把这张图片的比例改为 9:16,通过减少背景来完成,同时完整保留主体。 保持角色在当前位置,维持原有光线、表情和整体风格不变。
15. 修复“太干净”的图片
Nano Banana Pro 很多时候是在你告诉它“别那么完美”之后才开始变好。
text创作一张纪录片风格的街头照片,表现花店店主在黄昏收店。 手持镜头构图,自然轻微晃动,手上的包花动作不要太工整,地面有柔和反光,门口附近有真实杂物。 保持光线可信、材质有生活痕迹、氛围亲近而不是精修广告感。
15 个模板背后的规律其实是同一个:图片越依赖画面内文字、连续性锁定和高风险构图,你就越应该明确告诉 Pro “允许改什么” 和 “必须保留什么”。
如何用参考图,但不把画面带偏

参考图,是 Nano Banana Pro 相比普通图片模型最容易体现优势的地方,但也是提示写错以后最容易崩的地方。Google 当前文档写得很清楚:Gemini 3 图片模型最多支持 14 张参考图,同时 Google 在提示技巧里也提醒过,实际可用上限会随着产品表面不同而变化。换句话说,“能上传很多张” 不等于 “应该默认上传很多张”。
真实工作流里,两到三张参考图通常比十张更容易控制。先用最少的一组图把任务描述完整:一张管身份,一张管风格,一张管环境,往往比一堆“灵感图”更稳定。每多一张图,如果你不解释它的职责,就会多一层歧义。
一个最好养成的习惯,是给每张参考图一个明确角色:
图片 A:人物或主体身份;图片 B:插画或摄影风格;图片 C:环境、构图或氛围;图片 D:产品、道具或物体细节。
如果你不做这层角色分工,模型就只能自己猜;而“自己猜”正是身份漂移最常见的起点。编辑任务也是同样的逻辑。只要你要改局部,就要把必须保持不变的部分一起写出来:
- 脸和表情保持不变;
- 背景透视保持不变;
- 除了外套以外,其余服装不变;
- 物体比例和材质不变。
第二条经验,是在会话开始发“僵”之前及时重开。社区里 r/GeminiAI 那条关于 Nano Banana 变得“顽固”的讨论,很典型地提到了长编辑链会开始发糊、重复同一张图,或者明明收到指令却不再执行。遇到这种情况,不要继续在同一串会话里硬压。直接拿最后一张还算满意的图,开一个新会话,用更窄的指令重新开始,往往比连续追问更有效。
这个“及时重开”的规则,比很多所谓高级提示技巧都更有价值。多轮编辑当然强,但前提是每一轮都在收紧问题,而不是给一条已经失控的链继续叠变量。
如何把文字、图表和本地化图形做对

这正是 Nano Banana Pro 现在最有口碑的部分。Google 的提示技巧和 DeepMind 模型页都在强调文字密集图和图表类任务,但这并不代表模型会自动读懂你的意图。你仍然需要像设计师写说明,而不是像写 slogan 一样只给一句概念词。
做文字型图片时,至少要补齐这四类信息:
- 把关键文字放进引号里;
- 说明文字应该出现在哪里;
- 说明字体气质、字重或类别;
- 控制文案长度,让它落在模型能稳住的范围内。
如果图片本身是结构图、信息图或带标注的解释图,还需要再加一层事实约束:
- 列出必须出现的组件;
- 指定布局方式;
- 定义标签样式;
- 指出哪一种层级最重要。
Google 当前文档还给出了一条很实用的本地化路径:保留同一条会话,让模型“把这张图更新为另一种语言,同时不要修改其他元素”。这比重新生成整张图再赌它能不能保住原结构,要稳得多。
但就算这样,也不要把质检外包给模型。我们在 2026 年 3 月 28 日 核查 DeepMind 的 Nano Banana Pro 页面时,Google 仍然明确提醒了拼写、细节、语法、文化语境、事实准确性和复杂混合任务的风险。所以最稳的规则其实很简单:先用 Pro 把图做得更快,再在发布前人工检查每一个词、每一个数字和每一个事实。
这也是你需要区分产品表面的地方。在 Gemini 应用里,你面对的是一个带产品路由和额度限制的对话 UI;在 AI Studio 或 API 里,你面对的是更直接的模型表面和更可控的迭代环境。本文里的提示模式在两边都能用,但如果任务依赖大量参考图、精确文字或多轮编辑,通常还是在更直接的模型表面里更容易排错。
如果你下一步更关心 API 表面本身怎么走,继续看 Gemini 图片生成 API Base URL。如果你已经开始关心高分辨率输出差异,则可以补读英文的 Nano Banana Pro maximum resolution。
什么时候该用 Nano Banana Pro,而不是 Nano Banana 2
现在最稳的判断规则,不是 “Pro 更强,所以一律用 Pro”。Google 自己已经不再这么描述这条产品线了。在 2026 年 3 月 23 日 更新的官方图片生成文档里,Gemini 3.1 Flash Image 被明确放在大多数新图片任务的默认位置,而 Nano Banana Pro 则是更偏专业交付的一条高阶路线。
以下情况更适合直接用 Nano Banana Pro:
- 图片里需要可读文字;
- 你在做信息图、标注图、幻灯片式视觉;
- 你需要更可控的参考图约束;
- 编辑质量比纯速度更重要;
- 图片本身就是高价值交付物,而不是先出个草稿看看。
以下情况更适合先走 Nano Banana 2:
- 你在做快速探索;
- 你需要更便宜的日常草稿;
- 你要同时试很多方向;
- 文字精度和精细排版并不是任务核心。
这个路由规则,能让这篇提示词指南保持诚实。因为真正好的提示词,不只和句子怎么写有关,也和你是不是选对模型有关。
为什么结果还是会翻车,以及该怎么修
再好的 Nano Banana Pro 提示,也还是会以一些很可预测的方式出错。多数时候,正确修法不是“再催一次”,而是把指令收紧、把任务拆开,或者在模型开始漂移前直接重开会话。
| 症状 | 常见原因 | 更稳的修法 |
|---|---|---|
| 文字拼错、字形难看 | 文案太长、排版要求太模糊,或文字区域太小 | 缩短文案,把关键字放进引号,说明字体风格和位置,并人工复核 |
| 模型忽略其中一张参考图 | 你上传了多张图,却没写各自角色 | 明确每张图分别负责主体、风格、产品或环境 |
| 只是想改一处,整张图却都变了 | 你写了变化,但没写锁定项 | 加上“只修改 X”,并逐项列出必须保持不变的元素 |
| 后续编辑越来越糊,或者开始重复同一结果 | 会话已经进入编辑回路 | 用当前最好的一张图开新会话,并把指令缩窄 |
| 图片太假、太干净、太像模板图 | 提示里只有风格词,没有真实场景线索 | 增加动作、材质、瑕疵和环境线索 |
| 信息图看起来很像真的,但事实有误 | 模型替你脑补了事实 | 提供精确标签和组件,然后人工逐项核对 |
最后这一点尤其重要。Nano Banana Pro 强就强在,它有能力把一张“其实错了”的信息图也做得很可信。所以你的提示越涉及事实、标签和结构,越应该把这些约束写死;你的工作流越接近发布,就越不能跳过人工检查。
如果这篇文章你只记住一条规则,那就记住这一句:把 Nano Banana Pro 当成制作说明来提示,再把它当成协作草稿来迭代。 这是拿到更好文字、更稳修图和更少参考图漂移的最短路径。
