AIFreeAPI Logo

Nano Banana Pro 提示词:15 个适合文字、修图与参考图的高命中模板

A
16 分钟阅读AI图片生成

真正好用的 Nano Banana Pro 提示词,不是堆满关键词的大杂烩,而是结构清晰的制作说明。本文给你一套更稳的提示公式、15 个可直接改写的任务模板,以及当文字变形、修图失控或参考图漂移时应该怎么修。

展示 Nano Banana Pro 六段式提示结构、任务模板和修复思路的提示词指南封面

最好用的 Nano Banana Pro 提示词,不是把一堆风格词和平台热词塞进同一个输入框,而是把任务写成一份结构清楚的制作说明:主体、构图、动作、场景、风格,再加上这次任务真正需要的额外约束。如果你拿它来做海报、信息图、参考图编辑或分镜,这种写法比收藏一百条“神级提示词”更有用。

这不是写作偏好,而是当前官方建议。Google 最新的 Nano Banana Pro 提示技巧 和官方 Gemini 图片生成文档 都在强调:描述式场景提示,通常比零散关键词更稳。按 Google 这份文档在 2026 年 3 月 23 日 的更新状态来看,Nano Banana Pro 也就是 gemini-3-pro-image-preview,仍然是 Gemini 图片路线里更偏专业资产和复杂指令控制的那一档。

但有一个前提必须先说清楚。Nano Banana Pro 并不是所有图片任务的默认答案。同一份 Google 文档在 2026 年 3 月 23 日 的说明里也明确写着,Gemini 3.1 Flash Image 才是大多数新图片工作流的默认起点;只有当你真的在乎文字可读性、构图控制、参考图约束,或者最终成品质量时,Pro 才值得升级。如果你现在要的是更快的草稿路线,先去看 Nano Banana 2 vs Nano Banana Pro。如果你现在卡在更干净的文字、更稳的编辑和更可控的成图,那这篇提示词指南才是更对路的入口。

你的任务类型建议先用的提示模式最不能省略的部分
海报、广告图、社媒图精准文字提示 + 排版约束重要文案全部加引号,并明确它应该放在哪里
信息图、标注图、结构图事实约束提示把组件、层级和标签写死,再人工复核
多参考图融合角色分配型多图提示告诉模型每张图各自负责主体、风格、产品还是环境
基于现有图片的局部修改只改一处提示明确“改什么”,也明确“其他什么必须保持不变”
分镜、漫画页、序列镜头场景 + 面板提示先写场景,再写面板逻辑
高价值品牌图、英雄图描述式场景段落用镜头、光线、材质描述替代泛泛风格词

要点速览

  • 想让 Nano Banana Pro 出好图,先写清楚主体、构图、动作、场景、风格和编辑指令,再按任务补充文字、事实约束或锁定元素。
  • 文字海报、信息图、参考图融合、分镜和高价值交付图,都是 Pro 更值得上场的场景;如果只是批量草稿和快速试方向,Nano Banana 2 通常更划算。
  • 参考图不要一口气堆满,通常 2 到 3 张最稳。最有效的写法,是给每张图明确角色,并在每轮里只改一个变量。
  • 图片里一旦涉及精确文字、事实标签或多语言替换,生成之后都必须人工复核。Pro 能把错误内容做得很像真的,这正是你不能跳过审核的原因。
  • 真正高命中的顺序通常是:先拿到对的构图,再补精确文字;先做对原图结构,再在同一会话里做本地化;一旦连续编辑开始重复或发糊,就立刻换新会话而不是继续硬压。

Nano Banana Pro 最吃哪种提示结构

总结 Nano Banana Pro 六段式提示公式,以及“只添加当前任务真正需要的控制项”的提示蓝图看板。
总结 Nano Banana Pro 六段式提示公式,以及“只添加当前任务真正需要的控制项”的提示蓝图看板。

理解 Nano Banana Pro 最简单的方式,是把它当成一个更吃“制作说明”的模型,而不是一个靠关键词堆砌触发灵感的模型。Google 自己的提示指南把提示拆成六个部分,这依然是最稳的起点。

  1. 主体:画面里是谁,或者是什么。
  2. 构图:镜头类型、取景、比例,以及主体在画面里的位置。
  3. 动作:主体正在做什么,或者你希望图片发生什么变化。
  4. 场景:环境、时代、空间语境。
  5. 风格:真实度、设计语言、光线、色调、镜头质感、材质感。
  6. 编辑说明:精确文字、锁定元素、局部修改要求。

实际写起来,一个好的 Nano Banana Pro 提示通常更像一小段制作说明,而不是购物清单。官方图片文档已经明确说过,描述式场景提示比离散关键词更强;这也和社区里真正把模型用顺手的人摸出来的经验是一致的。

如果你不知道从哪里开始,可以先用这套基础模板:

text
[主体]。构图为 [镜头 / 画幅比例]。主体正在 [动作或变化]。 场景设定在 [环境 / 语境]。视觉风格为 [风格、光线、镜头、材质]。 如果是编辑任务:只修改 [X],其余 [Y 和 Z] 必须完全不变。 如果涉及文字:请准确渲染 “[TEXT]”,并说明 [字体 / 位置 / 层级]。 如果涉及准确性:必须包含 [组件 / 标签 / 事实],并保持布局清晰。

最后这一行,正是 Nano Banana Pro 提示和普通图片提示最关键的区别。你不需要每次都把所有高级控制都写进去,只需要补上和这次任务真正对应的那一项:

  • 做海报、菜单、广告图和结构图时,加“精确文字”;
  • 做编辑和连续角色时,加“锁定不变元素”;
  • 做信息图时,加“事实和组件约束”;
  • 用多张参考图时,加“每张图的角色分工”。

最常见的错误,是想在一个提示里同时解决生成、排版、本地化和语义编辑四件事。Nano Banana Pro 很擅长多轮协作,但这不等于“所有创意决策都在一条提示里完成”。如果图片既要强场景,也要精确文字,先把构图做对,再在同一会话里收紧文字;如果图片后面还要做本地化,先把基础信息图结构做稳,再在原会话里要求换语言。把工作拆开,反而更能减少模型乱发挥。

如果你在开始试之前想先看更完整的能力背景,可以先读英文的 Nano Banana Pro capabilities。但对大多数人来说,先掌握一个可复用提示结构,再根据任务微调,会更快进入有效迭代。

按任务拆开的 15 个 Nano Banana Pro 提示模板

这些模板的意义,不是让你永久复制粘贴,而是让你看到“什么任务适合什么提示结构”。具体内容可以换,但结构最好别乱。

1. 带精确主标题的海报

当文字本身就是画面的一部分,而不是后期再贴上去时,用这一类写法。

text
制作一张 4:5 的城市摄影展海报。画面是柏林雨夜街道,地面有反光,霓虹光斑柔和。整体为电影感 editorial 风格,真实光线,轻微胶片颗粒。 请准确渲染标题“雨后之城”,使用粗体白色窄体无衬线字体,放在顶部。 请准确渲染副标题“柏林,2026 年 6 月”,使用更小的白色文字,放在标题下方。 保证文字干净、居中,并且在缩略图尺寸下仍然可读。

2. 产品发布横幅

当你需要品牌级质感,但又不想把画面做成一张拥挤广告图时,这类结构更稳。

text
制作一张 16:9 的产品发布横幅。主体是一台哑黑色无线音箱,放在石材底座上。三分之四英雄视角,边缘柔光,精致棚拍阴影,背景为深炭灰并带轻微纹理。 请在左侧准确渲染文案“安静而有力”,使用优雅的大写无衬线字形。 保持产品真实,背景简洁,文字层级清楚。

3. 技术信息图

当模型要负责“解释”,而不是只负责“好看”时,用这种写法。

text
制作一张现代 16:9 信息图,解释无反相机传感器结构。请准确展示从前到后的这些标注层:保护玻璃、微透镜阵列、彩色滤镜阵列、光电二极管、布线层、传感器基底。 使用干净的扁平矢量风格、宽留白、黑色无衬线标签和细引线。 整体布局要有教学感、事实感,并且容易快速扫读。

4. 本地化现有图形

Google 当前文档明确展示了这种“在同一会话里翻译信息图”的做法。

text
把这张信息图更新为西班牙语版本,不要修改图片中的其他元素。 保持原有布局、配色、图标位置和视觉层级不变。

5. 只修改一个元素

当你希望模型停止擅自改动画面,这是最安全的语义编辑模式。

text
基于提供的图片,只把这位男士的领带改成森林绿色。 保持姿势、表情、身体位置、背景、光线和裁切完全不变。 不要修改任何其他服装细节。

6. 换装但保留身份

当你要做稍强一点的编辑,但仍然需要人物连续性时,用这一类提示。

text
基于提供的人像,把当前服装替换成结构感明显的海军蓝羊毛大衣和炭灰色围巾。 保持相同的脸部、发型、肤色、表情、姿势、背景透视和光线。 让服装变化看起来自然且真实。

7. 多参考图融合,并明确角色分工

不要上传三张图,然后赌模型自己猜到重点。

text
使用图片 A 作为人物脸部和身体比例参考。 使用图片 B 作为插画风格和色彩处理参考。 使用图片 C 作为森林环境和雾气氛围参考。 创作一张 3:4 的奇幻书封人物肖像,表现这个人物在黎明时分穿过森林。 脸部尽量接近图片 A,笔触风格尽量接近图片 B,氛围尽量接近图片 C。

8. 基于参考图的产品场景图

这比一句“做张真实的产品场景图吧”要可控得多。

text
使用图片 A 作为手袋参考,使用图片 B 作为生活方式摄影风格参考。 制作一张 4:5 的时尚 campaign 图片,表现一位女性在巴黎黄金时刻街头行走,手上拿着图片 A 中的手袋。 保持手袋的设计、材质和轮廓忠于参考图。 沿用图片 B 的 editorial 色调和柔和镜头泛光。

9. 保持角色一致性的场景图

当你想让同一个吉祥物或主角出现在多张图里时,这一类提示更稳。

text
把提供的角色图作为唯一的标准参考。 创建一张 16:9 场景图,表现同一角色站在明亮的创业办公室里,手持平板,正在和一个小团队交流。 保持相同的脸部、头发轮廓、服装颜色和身体比例。 只改变姿势、镜头角度和背景。

10. Editorial 人像

这通常比堆一串风格形容词更有效。

text
创作一张陶艺师在阳光工作室中的半身写实人像。3:4 构图,人物略微偏离中心,浅景深。 光线从镜头左侧窗边射入,手部有暖高光,空气中有轻微尘埃感。 整体呈现 85mm 人像镜头质感,陶土纹理丰富,氛围安静且具有 editorial 感。

11. 高价值产品英雄图

当图片本身就是交付物,而不只是草稿时,Pro 更值得出场。

text
制作一张 16:9 的高端产品英雄图,主体是一台不锈钢意式咖啡机,放在打磨石材台面上。 低机位三分之四构图,右侧柔和晨光,可见蒸汽,反射真实,拉丝金属纹理清晰。 整体为高端商业摄影风格,背景干净,不要额外道具。

12. 分镜

这是官方 DeepMind 页面目前最明确展示的 Pro 强项之一。

text
为这个场景制作 3 格分镜。 第 1 格:广角建立镜头,年轻宇航员独自站在霓虹照亮的城市街道上。 第 2 格:中景镜头,她抬头看向楼顶发光信号。 第 3 格:近景镜头,她的手启动腕部装置。 三格都保持相同的人物设计和配色体系。

13. 带风格化标题的漫画封面

当插画和标题都同样重要时,用这种写法更靠谱。

text
制作一张复古漫画封面,让参考图中的人物变成一位在复古未来主义城市中的新英雄。 使用高饱和主色调、戏剧化动作姿势和半色调纹理。 请在顶部准确渲染标题“最后轨道”,使用复古漫画字形。 角落里可以加入一个通用的刊号徽章,但不要出现真实品牌名。

14. 改画幅比例

当你已经有一张不错的图,只是需要适配平台尺寸时,这类提示很有用。

text
把这张图片的比例改为 9:16,通过减少背景来完成,同时完整保留主体。 保持角色在当前位置,维持原有光线、表情和整体风格不变。

15. 修复“太干净”的图片

Nano Banana Pro 很多时候是在你告诉它“别那么完美”之后才开始变好。

text
创作一张纪录片风格的街头照片,表现花店店主在黄昏收店。 手持镜头构图,自然轻微晃动,手上的包花动作不要太工整,地面有柔和反光,门口附近有真实杂物。 保持光线可信、材质有生活痕迹、氛围亲近而不是精修广告感。

15 个模板背后的规律其实是同一个:图片越依赖画面内文字、连续性锁定和高风险构图,你就越应该明确告诉 Pro “允许改什么” 和 “必须保留什么”。

如何用参考图,但不把画面带偏

工作流图示:图片 A 负责主体,图片 B 负责风格,图片 C 负责环境,并强调锁定不变元素、每轮只改一个变量、结果重复时重开会话。
工作流图示:图片 A 负责主体,图片 B 负责风格,图片 C 负责环境,并强调锁定不变元素、每轮只改一个变量、结果重复时重开会话。

参考图,是 Nano Banana Pro 相比普通图片模型最容易体现优势的地方,但也是提示写错以后最容易崩的地方。Google 当前文档写得很清楚:Gemini 3 图片模型最多支持 14 张参考图,同时 Google 在提示技巧里也提醒过,实际可用上限会随着产品表面不同而变化。换句话说,“能上传很多张” 不等于 “应该默认上传很多张”。

真实工作流里,两到三张参考图通常比十张更容易控制。先用最少的一组图把任务描述完整:一张管身份,一张管风格,一张管环境,往往比一堆“灵感图”更稳定。每多一张图,如果你不解释它的职责,就会多一层歧义。

一个最好养成的习惯,是给每张参考图一个明确角色:

  • 图片 A:人物或主体身份;
  • 图片 B:插画或摄影风格;
  • 图片 C:环境、构图或氛围;
  • 图片 D:产品、道具或物体细节。

如果你不做这层角色分工,模型就只能自己猜;而“自己猜”正是身份漂移最常见的起点。编辑任务也是同样的逻辑。只要你要改局部,就要把必须保持不变的部分一起写出来:

  • 脸和表情保持不变;
  • 背景透视保持不变;
  • 除了外套以外,其余服装不变;
  • 物体比例和材质不变。

第二条经验,是在会话开始发“僵”之前及时重开。社区里 r/GeminiAI 那条关于 Nano Banana 变得“顽固”的讨论,很典型地提到了长编辑链会开始发糊、重复同一张图,或者明明收到指令却不再执行。遇到这种情况,不要继续在同一串会话里硬压。直接拿最后一张还算满意的图,开一个新会话,用更窄的指令重新开始,往往比连续追问更有效。

这个“及时重开”的规则,比很多所谓高级提示技巧都更有价值。多轮编辑当然强,但前提是每一轮都在收紧问题,而不是给一条已经失控的链继续叠变量。

如何把文字、图表和本地化图形做对

展示文字海报、结构图和本地化图形应该如何提示的规则看板,强调精确文字、布局层级、事实组件和同会话本地化。
展示文字海报、结构图和本地化图形应该如何提示的规则看板,强调精确文字、布局层级、事实组件和同会话本地化。

这正是 Nano Banana Pro 现在最有口碑的部分。Google 的提示技巧和 DeepMind 模型页都在强调文字密集图和图表类任务,但这并不代表模型会自动读懂你的意图。你仍然需要像设计师写说明,而不是像写 slogan 一样只给一句概念词。

做文字型图片时,至少要补齐这四类信息:

  • 把关键文字放进引号里;
  • 说明文字应该出现在哪里;
  • 说明字体气质、字重或类别;
  • 控制文案长度,让它落在模型能稳住的范围内。

如果图片本身是结构图、信息图或带标注的解释图,还需要再加一层事实约束:

  • 列出必须出现的组件;
  • 指定布局方式;
  • 定义标签样式;
  • 指出哪一种层级最重要。

Google 当前文档还给出了一条很实用的本地化路径:保留同一条会话,让模型“把这张图更新为另一种语言,同时不要修改其他元素”。这比重新生成整张图再赌它能不能保住原结构,要稳得多。

但就算这样,也不要把质检外包给模型。我们在 2026 年 3 月 28 日 核查 DeepMind 的 Nano Banana Pro 页面时,Google 仍然明确提醒了拼写、细节、语法、文化语境、事实准确性和复杂混合任务的风险。所以最稳的规则其实很简单:先用 Pro 把图做得更快,再在发布前人工检查每一个词、每一个数字和每一个事实。

这也是你需要区分产品表面的地方。在 Gemini 应用里,你面对的是一个带产品路由和额度限制的对话 UI;在 AI Studio 或 API 里,你面对的是更直接的模型表面和更可控的迭代环境。本文里的提示模式在两边都能用,但如果任务依赖大量参考图、精确文字或多轮编辑,通常还是在更直接的模型表面里更容易排错。

如果你下一步更关心 API 表面本身怎么走,继续看 Gemini 图片生成 API Base URL。如果你已经开始关心高分辨率输出差异,则可以补读英文的 Nano Banana Pro maximum resolution

什么时候该用 Nano Banana Pro,而不是 Nano Banana 2

现在最稳的判断规则,不是 “Pro 更强,所以一律用 Pro”。Google 自己已经不再这么描述这条产品线了。在 2026 年 3 月 23 日 更新的官方图片生成文档里,Gemini 3.1 Flash Image 被明确放在大多数新图片任务的默认位置,而 Nano Banana Pro 则是更偏专业交付的一条高阶路线。

以下情况更适合直接用 Nano Banana Pro:

  • 图片里需要可读文字;
  • 你在做信息图、标注图、幻灯片式视觉;
  • 你需要更可控的参考图约束;
  • 编辑质量比纯速度更重要;
  • 图片本身就是高价值交付物,而不是先出个草稿看看。

以下情况更适合先走 Nano Banana 2:

  • 你在做快速探索;
  • 你需要更便宜的日常草稿;
  • 你要同时试很多方向;
  • 文字精度和精细排版并不是任务核心。

这个路由规则,能让这篇提示词指南保持诚实。因为真正好的提示词,不只和句子怎么写有关,也和你是不是选对模型有关。

为什么结果还是会翻车,以及该怎么修

再好的 Nano Banana Pro 提示,也还是会以一些很可预测的方式出错。多数时候,正确修法不是“再催一次”,而是把指令收紧、把任务拆开,或者在模型开始漂移前直接重开会话。

症状常见原因更稳的修法
文字拼错、字形难看文案太长、排版要求太模糊,或文字区域太小缩短文案,把关键字放进引号,说明字体风格和位置,并人工复核
模型忽略其中一张参考图你上传了多张图,却没写各自角色明确每张图分别负责主体、风格、产品或环境
只是想改一处,整张图却都变了你写了变化,但没写锁定项加上“只修改 X”,并逐项列出必须保持不变的元素
后续编辑越来越糊,或者开始重复同一结果会话已经进入编辑回路用当前最好的一张图开新会话,并把指令缩窄
图片太假、太干净、太像模板图提示里只有风格词,没有真实场景线索增加动作、材质、瑕疵和环境线索
信息图看起来很像真的,但事实有误模型替你脑补了事实提供精确标签和组件,然后人工逐项核对

最后这一点尤其重要。Nano Banana Pro 强就强在,它有能力把一张“其实错了”的信息图也做得很可信。所以你的提示越涉及事实、标签和结构,越应该把这些约束写死;你的工作流越接近发布,就越不能跳过人工检查。

如果这篇文章你只记住一条规则,那就记住这一句:把 Nano Banana Pro 当成制作说明来提示,再把它当成协作草稿来迭代。 这是拿到更好文字、更稳修图和更少参考图漂移的最短路径。

Nano Banana Pro

4K图像官方2折

Google Gemini 3 Pro Image · AI图像生成

已服务 10万+ 开发者
$0.24/张
$0.05/张
限时特惠·企业级稳定·支付宝/微信支付
Gemini 3
原生模型
国内直连
20ms延迟
4K超清
2048px
30s出图
极速响应
|@laozhang_cn|送$0.05

200+ AI 模型 API

2026.01
GPT-5.2Claude 4.5Gemini 3Grok 4+195
图像
官方2折
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

视频
官方2折
Veo3 · Sora2$0.15/次
省16%5分钟接入📊 99.9% SLA👥 10万+用户