Nano Banana Pro 提示词：15 个适合文字、修图与参考图的高命中模板

AI 工具专家

•2026年3月28日•16 分钟阅读•AI图片生成

真正好用的 Nano Banana Pro 提示词，不是堆满关键词的大杂烩，而是结构清晰的制作说明。本文给你一套更稳的提示公式、15 个可直接改写的任务模板，以及当文字变形、修图失控或参考图漂移时应该怎么修。

展示 Nano Banana Pro 六段式提示结构、任务模板和修复思路的提示词指南封面

最好用的 Nano Banana Pro 提示词，不是把一堆风格词和平台热词塞进同一个输入框，而是把任务写成一份结构清楚的制作说明：主体、构图、动作、场景、风格，再加上这次任务真正需要的额外约束。如果你拿它来做海报、信息图、参考图编辑或分镜，这种写法比收藏一百条“神级提示词”更有用。

这不是写作偏好，而是当前官方建议。Google 最新的 Nano Banana Pro 提示技巧和官方 Gemini 图片生成文档都在强调：描述式场景提示，通常比零散关键词更稳。按 Google 这份文档在 2026 年 3 月 23 日 的更新状态来看，Nano Banana Pro 也就是 gemini-3-pro-image-preview，仍然是 Gemini 图片路线里更偏专业资产和复杂指令控制的那一档。

但有一个前提必须先说清楚。Nano Banana Pro 并不是所有图片任务的默认答案。同一份 Google 文档在 2026 年 3 月 23 日 的说明里也明确写着，Gemini 3.1 Flash Image 才是大多数新图片工作流的默认起点；只有当你真的在乎文字可读性、构图控制、参考图约束，或者最终成品质量时，Pro 才值得升级。如果你现在要的是更快的草稿路线，先去看 Nano Banana 2 vs Nano Banana Pro。如果你现在卡在更干净的文字、更稳的编辑和更可控的成图，那这篇提示词指南才是更对路的入口。

你的任务类型	建议先用的提示模式	最不能省略的部分
海报、广告图、社媒图	精准文字提示 + 排版约束	重要文案全部加引号，并明确它应该放在哪里
信息图、标注图、结构图	事实约束提示	把组件、层级和标签写死，再人工复核
多参考图融合	角色分配型多图提示	告诉模型每张图各自负责主体、风格、产品还是环境
基于现有图片的局部修改	只改一处提示	明确“改什么”，也明确“其他什么必须保持不变”
分镜、漫画页、序列镜头	场景 + 面板提示	先写场景，再写面板逻辑
高价值品牌图、英雄图	描述式场景段落	用镜头、光线、材质描述替代泛泛风格词

要点速览

想让 Nano Banana Pro 出好图，先写清楚主体、构图、动作、场景、风格和编辑指令，再按任务补充文字、事实约束或锁定元素。
文字海报、信息图、参考图融合、分镜和高价值交付图，都是 Pro 更值得上场的场景；如果只是批量草稿和快速试方向，Nano Banana 2 通常更划算。
参考图不要一口气堆满，通常 2 到 3 张最稳。最有效的写法，是给每张图明确角色，并在每轮里只改一个变量。
图片里一旦涉及精确文字、事实标签或多语言替换，生成之后都必须人工复核。Pro 能把错误内容做得很像真的，这正是你不能跳过审核的原因。
真正高命中的顺序通常是：先拿到对的构图，再补精确文字；先做对原图结构，再在同一会话里做本地化；一旦连续编辑开始重复或发糊，就立刻换新会话而不是继续硬压。

Nano Banana Pro 最吃哪种提示结构

总结 Nano Banana Pro 六段式提示公式，以及“只添加当前任务真正需要的控制项”的提示蓝图看板。

理解 Nano Banana Pro 最简单的方式，是把它当成一个更吃“制作说明”的模型，而不是一个靠关键词堆砌触发灵感的模型。Google 自己的提示指南把提示拆成六个部分，这依然是最稳的起点。

主体：画面里是谁，或者是什么。
构图：镜头类型、取景、比例，以及主体在画面里的位置。
动作：主体正在做什么，或者你希望图片发生什么变化。
场景：环境、时代、空间语境。
风格：真实度、设计语言、光线、色调、镜头质感、材质感。
编辑说明：精确文字、锁定元素、局部修改要求。

实际写起来，一个好的 Nano Banana Pro 提示通常更像一小段制作说明，而不是购物清单。官方图片文档已经明确说过，描述式场景提示比离散关键词更强；这也和社区里真正把模型用顺手的人摸出来的经验是一致的。

如果你不知道从哪里开始，可以先用这套基础模板：

text
[主体]。构图为 [镜头 / 画幅比例]。主体正在 [动作或变化]。
场景设定在 [环境 / 语境]。视觉风格为 [风格、光线、镜头、材质]。
如果是编辑任务：只修改 [X]，其余 [Y 和 Z] 必须完全不变。
如果涉及文字：请准确渲染 “[TEXT]”，并说明 [字体 / 位置 / 层级]。
如果涉及准确性：必须包含 [组件 / 标签 / 事实]，并保持布局清晰。

最后这一行，正是 Nano Banana Pro 提示和普通图片提示最关键的区别。你不需要每次都把所有高级控制都写进去，只需要补上和这次任务真正对应的那一项：

做海报、菜单、广告图和结构图时，加“精确文字”；
做编辑和连续角色时，加“锁定不变元素”；
做信息图时，加“事实和组件约束”；
用多张参考图时，加“每张图的角色分工”。

最常见的错误，是想在一个提示里同时解决生成、排版、本地化和语义编辑四件事。Nano Banana Pro 很擅长多轮协作，但这不等于“所有创意决策都在一条提示里完成”。如果图片既要强场景，也要精确文字，先把构图做对，再在同一会话里收紧文字；如果图片后面还要做本地化，先把基础信息图结构做稳，再在原会话里要求换语言。把工作拆开，反而更能减少模型乱发挥。

如果你在开始试之前想先看更完整的能力背景，可以先读英文的 Nano Banana Pro capabilities。但对大多数人来说，先掌握一个可复用提示结构，再根据任务微调，会更快进入有效迭代。

按任务拆开的 15 个 Nano Banana Pro 提示模板

这些模板的意义，不是让你永久复制粘贴，而是让你看到“什么任务适合什么提示结构”。具体内容可以换，但结构最好别乱。

1. 带精确主标题的海报

当文字本身就是画面的一部分，而不是后期再贴上去时，用这一类写法。

text
制作一张 4:5 的城市摄影展海报。画面是柏林雨夜街道，地面有反光，霓虹光斑柔和。整体为电影感 editorial 风格，真实光线，轻微胶片颗粒。
请准确渲染标题“雨后之城”，使用粗体白色窄体无衬线字体，放在顶部。
请准确渲染副标题“柏林，2026 年 6 月”，使用更小的白色文字，放在标题下方。
保证文字干净、居中，并且在缩略图尺寸下仍然可读。

2. 产品发布横幅

当你需要品牌级质感，但又不想把画面做成一张拥挤广告图时，这类结构更稳。

text
制作一张 16:9 的产品发布横幅。主体是一台哑黑色无线音箱，放在石材底座上。三分之四英雄视角，边缘柔光，精致棚拍阴影，背景为深炭灰并带轻微纹理。
请在左侧准确渲染文案“安静而有力”，使用优雅的大写无衬线字形。
保持产品真实，背景简洁，文字层级清楚。

3. 技术信息图

当模型要负责“解释”，而不是只负责“好看”时，用这种写法。

text
制作一张现代 16:9 信息图，解释无反相机传感器结构。请准确展示从前到后的这些标注层：保护玻璃、微透镜阵列、彩色滤镜阵列、光电二极管、布线层、传感器基底。
使用干净的扁平矢量风格、宽留白、黑色无衬线标签和细引线。
整体布局要有教学感、事实感，并且容易快速扫读。

4. 本地化现有图形

Google 当前文档明确展示了这种“在同一会话里翻译信息图”的做法。

text
把这张信息图更新为西班牙语版本，不要修改图片中的其他元素。
保持原有布局、配色、图标位置和视觉层级不变。

5. 只修改一个元素

当你希望模型停止擅自改动画面，这是最安全的语义编辑模式。

text
基于提供的图片，只把这位男士的领带改成森林绿色。
保持姿势、表情、身体位置、背景、光线和裁切完全不变。
不要修改任何其他服装细节。

6. 换装但保留身份

当你要做稍强一点的编辑，但仍然需要人物连续性时，用这一类提示。

text
基于提供的人像，把当前服装替换成结构感明显的海军蓝羊毛大衣和炭灰色围巾。
保持相同的脸部、发型、肤色、表情、姿势、背景透视和光线。
让服装变化看起来自然且真实。

7. 多参考图融合，并明确角色分工

不要上传三张图，然后赌模型自己猜到重点。

text
使用图片 A 作为人物脸部和身体比例参考。
使用图片 B 作为插画风格和色彩处理参考。
使用图片 C 作为森林环境和雾气氛围参考。
创作一张 3:4 的奇幻书封人物肖像，表现这个人物在黎明时分穿过森林。
脸部尽量接近图片 A，笔触风格尽量接近图片 B，氛围尽量接近图片 C。

8. 基于参考图的产品场景图

这比一句“做张真实的产品场景图吧”要可控得多。

text
使用图片 A 作为手袋参考，使用图片 B 作为生活方式摄影风格参考。
制作一张 4:5 的时尚 campaign 图片，表现一位女性在巴黎黄金时刻街头行走，手上拿着图片 A 中的手袋。
保持手袋的设计、材质和轮廓忠于参考图。
沿用图片 B 的 editorial 色调和柔和镜头泛光。

9. 保持角色一致性的场景图

当你想让同一个吉祥物或主角出现在多张图里时，这一类提示更稳。

text
把提供的角色图作为唯一的标准参考。
创建一张 16:9 场景图，表现同一角色站在明亮的创业办公室里，手持平板，正在和一个小团队交流。
保持相同的脸部、头发轮廓、服装颜色和身体比例。
只改变姿势、镜头角度和背景。

10. Editorial 人像

这通常比堆一串风格形容词更有效。

text
创作一张陶艺师在阳光工作室中的半身写实人像。3:4 构图，人物略微偏离中心，浅景深。
光线从镜头左侧窗边射入，手部有暖高光，空气中有轻微尘埃感。
整体呈现 85mm 人像镜头质感，陶土纹理丰富，氛围安静且具有 editorial 感。

11. 高价值产品英雄图

当图片本身就是交付物，而不只是草稿时，Pro 更值得出场。

text
制作一张 16:9 的高端产品英雄图，主体是一台不锈钢意式咖啡机，放在打磨石材台面上。
低机位三分之四构图，右侧柔和晨光，可见蒸汽，反射真实，拉丝金属纹理清晰。
整体为高端商业摄影风格，背景干净，不要额外道具。

12. 分镜

这是官方 DeepMind 页面目前最明确展示的 Pro 强项之一。

text
为这个场景制作 3 格分镜。
第 1 格：广角建立镜头，年轻宇航员独自站在霓虹照亮的城市街道上。
第 2 格：中景镜头，她抬头看向楼顶发光信号。
第 3 格：近景镜头，她的手启动腕部装置。
三格都保持相同的人物设计和配色体系。

13. 带风格化标题的漫画封面

当插画和标题都同样重要时，用这种写法更靠谱。

text
制作一张复古漫画封面，让参考图中的人物变成一位在复古未来主义城市中的新英雄。
使用高饱和主色调、戏剧化动作姿势和半色调纹理。
请在顶部准确渲染标题“最后轨道”，使用复古漫画字形。
角落里可以加入一个通用的刊号徽章，但不要出现真实品牌名。

14. 改画幅比例

当你已经有一张不错的图，只是需要适配平台尺寸时，这类提示很有用。

text
把这张图片的比例改为 9:16，通过减少背景来完成，同时完整保留主体。
保持角色在当前位置，维持原有光线、表情和整体风格不变。

15. 修复“太干净”的图片

Nano Banana Pro 很多时候是在你告诉它“别那么完美”之后才开始变好。

text
创作一张纪录片风格的街头照片，表现花店店主在黄昏收店。
手持镜头构图，自然轻微晃动，手上的包花动作不要太工整，地面有柔和反光，门口附近有真实杂物。
保持光线可信、材质有生活痕迹、氛围亲近而不是精修广告感。

15 个模板背后的规律其实是同一个：图片越依赖画面内文字、连续性锁定和高风险构图，你就越应该明确告诉 Pro “允许改什么” 和 “必须保留什么”。

如何用参考图，但不把画面带偏

工作流图示：图片 A 负责主体，图片 B 负责风格，图片 C 负责环境，并强调锁定不变元素、每轮只改一个变量、结果重复时重开会话。

参考图，是 Nano Banana Pro 相比普通图片模型最容易体现优势的地方，但也是提示写错以后最容易崩的地方。Google 当前文档写得很清楚：Gemini 3 图片模型最多支持 14 张参考图，同时 Google 在提示技巧里也提醒过，实际可用上限会随着产品表面不同而变化。换句话说，“能上传很多张” 不等于 “应该默认上传很多张”。

真实工作流里，两到三张参考图通常比十张更容易控制。先用最少的一组图把任务描述完整：一张管身份，一张管风格，一张管环境，往往比一堆“灵感图”更稳定。每多一张图，如果你不解释它的职责，就会多一层歧义。

一个最好养成的习惯，是给每张参考图一个明确角色：

图片 A：人物或主体身份；
图片 B：插画或摄影风格；
图片 C：环境、构图或氛围；
图片 D：产品、道具或物体细节。

如果你不做这层角色分工，模型就只能自己猜；而“自己猜”正是身份漂移最常见的起点。编辑任务也是同样的逻辑。只要你要改局部，就要把必须保持不变的部分一起写出来：

脸和表情保持不变；
背景透视保持不变；
除了外套以外，其余服装不变；
物体比例和材质不变。

第二条经验，是在会话开始发“僵”之前及时重开。社区里 r/GeminiAI 那条关于 Nano Banana 变得“顽固”的讨论，很典型地提到了长编辑链会开始发糊、重复同一张图，或者明明收到指令却不再执行。遇到这种情况，不要继续在同一串会话里硬压。直接拿最后一张还算满意的图，开一个新会话，用更窄的指令重新开始，往往比连续追问更有效。

这个“及时重开”的规则，比很多所谓高级提示技巧都更有价值。多轮编辑当然强，但前提是每一轮都在收紧问题，而不是给一条已经失控的链继续叠变量。

如何把文字、图表和本地化图形做对

展示文字海报、结构图和本地化图形应该如何提示的规则看板，强调精确文字、布局层级、事实组件和同会话本地化。

这正是 Nano Banana Pro 现在最有口碑的部分。Google 的提示技巧和 DeepMind 模型页都在强调文字密集图和图表类任务，但这并不代表模型会自动读懂你的意图。你仍然需要像设计师写说明，而不是像写 slogan 一样只给一句概念词。

做文字型图片时，至少要补齐这四类信息：

把关键文字放进引号里；
说明文字应该出现在哪里；
说明字体气质、字重或类别；
控制文案长度，让它落在模型能稳住的范围内。

如果图片本身是结构图、信息图或带标注的解释图，还需要再加一层事实约束：

列出必须出现的组件；
指定布局方式；
定义标签样式；
指出哪一种层级最重要。

Google 当前文档还给出了一条很实用的本地化路径：保留同一条会话，让模型“把这张图更新为另一种语言，同时不要修改其他元素”。这比重新生成整张图再赌它能不能保住原结构，要稳得多。

但就算这样，也不要把质检外包给模型。我们在 2026 年 3 月 28 日 核查 DeepMind 的 Nano Banana Pro 页面时，Google 仍然明确提醒了拼写、细节、语法、文化语境、事实准确性和复杂混合任务的风险。所以最稳的规则其实很简单：先用 Pro 把图做得更快，再在发布前人工检查每一个词、每一个数字和每一个事实。

这也是你需要区分产品表面的地方。在 Gemini 应用里，你面对的是一个带产品路由和额度限制的对话 UI；在 AI Studio 或 API 里，你面对的是更直接的模型表面和更可控的迭代环境。本文里的提示模式在两边都能用，但如果任务依赖大量参考图、精确文字或多轮编辑，通常还是在更直接的模型表面里更容易排错。

如果你下一步更关心 API 表面本身怎么走，继续看 Gemini 图片生成 API Base URL。如果你已经开始关心高分辨率输出差异，则可以补读英文的 Nano Banana Pro maximum resolution。

什么时候该用 Nano Banana Pro，而不是 Nano Banana 2

现在最稳的判断规则，不是 “Pro 更强，所以一律用 Pro”。Google 自己已经不再这么描述这条产品线了。在 2026 年 3 月 23 日 更新的官方图片生成文档里，Gemini 3.1 Flash Image 被明确放在大多数新图片任务的默认位置，而 Nano Banana Pro 则是更偏专业交付的一条高阶路线。

以下情况更适合直接用 Nano Banana Pro：

图片里需要可读文字；
你在做信息图、标注图、幻灯片式视觉；
你需要更可控的参考图约束；
编辑质量比纯速度更重要；
图片本身就是高价值交付物，而不是先出个草稿看看。

以下情况更适合先走 Nano Banana 2：

你在做快速探索；
你需要更便宜的日常草稿；
你要同时试很多方向；
文字精度和精细排版并不是任务核心。

这个路由规则，能让这篇提示词指南保持诚实。因为真正好的提示词，不只和句子怎么写有关，也和你是不是选对模型有关。

为什么结果还是会翻车，以及该怎么修

再好的 Nano Banana Pro 提示，也还是会以一些很可预测的方式出错。多数时候，正确修法不是“再催一次”，而是把指令收紧、把任务拆开，或者在模型开始漂移前直接重开会话。

症状	常见原因	更稳的修法
文字拼错、字形难看	文案太长、排版要求太模糊，或文字区域太小	缩短文案，把关键字放进引号，说明字体风格和位置，并人工复核
模型忽略其中一张参考图	你上传了多张图，却没写各自角色	明确每张图分别负责主体、风格、产品或环境
只是想改一处，整张图却都变了	你写了变化，但没写锁定项	加上“只修改 X”，并逐项列出必须保持不变的元素
后续编辑越来越糊，或者开始重复同一结果	会话已经进入编辑回路	用当前最好的一张图开新会话，并把指令缩窄
图片太假、太干净、太像模板图	提示里只有风格词，没有真实场景线索	增加动作、材质、瑕疵和环境线索
信息图看起来很像真的，但事实有误	模型替你脑补了事实	提供精确标签和组件，然后人工逐项核对

最后这一点尤其重要。Nano Banana Pro 强就强在，它有能力把一张“其实错了”的信息图也做得很可信。所以你的提示越涉及事实、标签和结构，越应该把这些约束写死；你的工作流越接近发布，就越不能跳过人工检查。

如果这篇文章你只记住一条规则，那就记住这一句：把 Nano Banana Pro 当成制作说明来提示，再把它当成协作草稿来迭代。 这是拿到更好文字、更稳修图和更少参考图漂移的最短路径。

#Nano Banana Pro #Gemini 3 Pro Image #AI提示词 #参考图编辑 #文字渲染