AIFreeAPI Logo

Nano Banana Pro Prompts: 文字・編集・参照画像向け15テンプレート

A
16 min readAI画像生成

Nano Banana Proで効くプロンプトは、キーワードの山ではなく、短い制作ブリーフです。この記事では、いちばん再現しやすい基本式、実務向け15テンプレート、文字崩れや参照driftや編集ループを直すための具体策をまとめます。

Nano Banana Proのプロンプト構造、用途別テンプレート、文字や編集や参照画像の直し方をまとめたガイドカバー

Nano Banana Proで本当に効くプロンプトは、巨大なキーワードの寄せ集めではありません。主体、構図、動き、文脈、スタイル、編集指示を順番に置いた短い制作ブリーフです。そのうえで、その仕事に本当に必要な追加コントロールだけを足します。ポスター、インフォグラフィック、参照画像ベースの編集、ストーリーボードのような仕事では、この形のほうが「映えるプロンプト集」を何百本集めるよりずっと役に立ちます。

これは書き方の好みの話ではありません。Googleの最新 Nano Banana Pro prompt tips と公式の Gemini image generation docs は、どちらも「バラバラのキーワード列より、記述的なシーンプロンプトのほうが強い」と示しています。Googleの画像生成ドキュメントを 2026年3月23日 時点で見ると、Nano Banana Pro、つまり gemini-3-pro-image-preview は、今もなおプロ向けアセット制作と複雑な指示向けのGemini画像レーンとして置かれています。

ただし、先に見せておくべき前提があります。Nano Banana Proは、すべての画像タスクの正解ではありません。同じ 2026年3月23日 更新のGoogleドキュメントでは、Gemini 3.1 Flash Image が大半の新規画像ワークフローの既定ルートで、Proは文字の読みやすさ、構図制御、参照画像の扱い、最終品質が本当に重要なときの上位レーンとして説明されています。速いラフ出しが欲しいだけなら、先に Nano Banana 2 vs Nano Banana Pro を読んだほうが早いです。文字をもっときれいに出したい、編集をもっと安定させたい、参照画像の制御を強めたいなら、このページが正しい入り口です。

仕事の種類まず使うべきプロンプト形絶対に省けない部分
ポスター、広告、SNS画像exact text + layout指定のプロンプト重要な文言は引用符に入れ、どこに置くかまで書く
インフォグラフィック、ラベル付き図解factual constraint型プロンプト部品と階層を明示し、最後は人が確認する
参照画像のブレンド役割分担付きの multi-image promptそれぞれが subject、style、product、environment のどれかを書く
既存画像の意味編集「ここだけ変える」プロンプト変える点と、絶対に変えない点を両方書く
ストーリーボード、コミック連番シーン + パネル指定まずシーン、その後にパネルロジックを書く
高価値のhero visualやブランド画像描写中心のシーン段落genericなstyle tagではなく、カメラ・光・質感で詰める

Nano Banana Proが最も反応しやすいプロンプトの型

Nano Banana Proの6要素プロンプト式と、仕事に必要なコントロールだけを足すべきだというルールをまとめたプロンプト設計ボード。
Nano Banana Proの6要素プロンプト式と、仕事に必要なコントロールだけを足すべきだというルールをまとめたプロンプト設計ボード。

Nano Banana Proを理解するいちばん簡単な考え方はこうです。ムードボードを投げるより、クリエイティブディレクター向けのbriefのように渡したほうが安定します。Google自身のprompt guideもプロンプトを6つに分けていて、これが今でも最も扱いやすい出発点です。

  1. Subject: 画像の中に何がいるか、何があるか。
  2. Composition: 画角、フレーミング、アスペクト比、主役の位置。
  3. Action: 何が起きているか、何を変えたいか。
  4. Location: 環境、時代、シーン文脈。
  5. Style: リアリティ、デザイン言語、光、色調、レンズ感、素材感。
  6. Edit instructions: exact text、固定要素、具体的な変更点。

実際には、よいNano Banana Proプロンプトは買い物リストではなく短い段落になります。現在のGoogle画像ドキュメントでも、sceneを説明する形のほうが disconnected keywords より強いと明記されていますし、実運用しているユーザーの発見とも一致しています。

迷ったら、まずこの基本形から始めてください。

text
[主体]。[構図 / アスペクト比]で見せる。主体は[動作または変化]している。 [環境 / 文脈]に設定する。視覚スタイルは[スタイル、光、カメラ、素材]。 編集なら [X] だけを変える。[Y と Z] は完全に同じまま保つ。 文字が重要なら "[TEXT]" を [フォント / 位置 / 階層] で正確に描画する。 正確さが重要なら [部品 / ラベル / 事実] を必ず含め、layoutを見やすく保つ。

最後の一行こそが、Nano Banana Proのプロンプトを普通の画像プロンプトと分けるポイントです。毎回すべての高度な指示を足す必要はありません。仕事に合うコントロールだけを足せば十分です。

  • ポスター、メニュー、広告、図解では exact text を入れる。
  • 編集と連続性が重要なら locked elements を書く。
  • インフォグラフィックでは factual constraints を入れる。
  • 複数の参照画像を使うなら role-based references にする。

いちばん多い失敗は、生成、レイアウト、ローカライズ、意味編集を一発で全部やろうとすることです。Nano Banana Proはmulti-turnに強いですが、それは「1プロンプトで全部決めろ」という意味ではありません。シーンと文字の両方が大事なら、まず構図を固めてから文字を詰める。ローカライズが必要なら、先に元のインフォグラフィック構造を完成させて、その同じチャットで言語だけ差し替える。この分け方のほうが、Proが余計な方向へ即興する余地を減らせます。

もっと広い能力の背景を先に見たいなら、英語の Nano Banana Pro capabilities が補助になります。ただ、大半の読者にとっては、まず動くprompt shapeを持ってから調整するほうが速いはずです。

仕事別に使える Nano Banana Pro の15テンプレート

ここにあるテンプレートは、永久にコピペするためのものではありません。仕事ごとにどのprompt patternが合うかを見せるためのものです。中身は差し替えてよいですが、構造は残してください。

1. exact headline入りポスター

文字そのものがビジュアルの一部で、後載せではない仕事で使います。

text
都市写真展の4:5ポスターを作成する。雨上がりのベルリンの夕方の通り。路面は反射し、柔らかなネオンのにじみがある。シネマティックなeditorialスタイル、リアルな光、控えめなフィルム粒子感。 タイトル「雨のあと、街は光る」を上部に白い太めの condensed sans-serif で正確に描画する。 サブヘッド「Berlin, June 2026」をその下に小さめの白文字で入れる。 縮小表示でも読めるように、文字は中央でクリーンに保つ。

2. プロダクトローンチのバナー

ブランド感は欲しいが、ごちゃついた広告にはしたくないときに向いています。

text
マットブラックのワイヤレススピーカーを石の台座に置いた16:9のローンチバナーを作成する。3/4のhero angle、柔らかな縁光、プレミアムなスタジオシャドウ、わずかにテクスチャのあるダークチャコール背景。 左側に「NOISE LESS, SOUND MORE」という正確な文字を上品な大文字sans-serifで描画する。 商品はリアルに、背景は最小限に、文字階層は明快に保つ。

3. 技術インフォグラフィック

モデルに「飾る」より「説明する」役目を持たせたいときに使います。

text
ミラーレスカメラのセンサーを説明する16:9のモダンなインフォグラフィックを作成する。前から順に次の層を正確にラベル表示する: cover glass, microlens array, color filter array, photodiodes, wiring layer, sensor substrate. クリーンなフラットベクタースタイル、広い余白、黒のsans-serifラベル、細いリーダーラインを使う。 教育用として分かりやすく、事実感があり、素早く読めるlayoutにする。

4. 既存グラフィックのローカライズ

Googleの現行ドキュメントが、同じチャット内でのこのパターンを明示しています。

text
このインフォグラフィックをスペイン語版に更新する。他の画像要素は変更しない。 layout、色設計、アイコン位置、視覚階層は同じまま保つ。

5. 1要素だけ変更する

モデルに余計な即興をさせたくないときの、いちばん安全な意味編集パターンです。

text
提供した画像を使い、男性のネクタイだけをフォレストグリーンに変更する。 ポーズ、表情、体の位置、背景、照明、トリミングは完全に同じまま保つ。 それ以外の衣服ディテールは変更しない。

6. 本人性を保ったまま衣装だけ差し替える

もう少し強い編集が必要でも continuity を保ちたいときに使います。

text
提供したポートレートを使い、現在の服装を構築感のあるネイビーのウールコートとチャコールグレーのマフラーに置き換える。 顔、髪型、肌色、表情、ポーズ、背景パース、照明はそのまま保つ。 衣装変更が自然でリアルに見えるようにする。

7. 役割を明示した参照画像ブレンド

3枚の画像を入れて、モデルが勝手に重要度を推測してくれると思わないことです。

text
Image A は人物の顔と体の比率の参照として使う。 Image B はイラストスタイルと色処理の参照として使う。 Image C は森の環境と霧のムードの参照として使う。 被写体が夜明けの森を歩く3:4のファンタジー書影ポートレートを作る。 顔はImage Aに最も近く、筆致はImage Bに最も近く、空気感はImage Cに最も近くする。

8. 参照画像から作る product mockup

「リアルなmockupを作って」と祈るより、こちらのほうがはるかに安定します。

text
Image A をハンドバッグの参照として使い、Image B をライフスタイル写真のスタイル参照として使う。 Parisのgolden hourを歩く女性が、Image Aのバッグを持っている4:5のfashion campaign imageを作る。 バッグのデザイン、素材、シルエットは参照に忠実に保つ。 Image B のeditorialな色調と柔らかなlens bloomを使う。

9. キャラクター一貫性が必要なシーン

同じマスコットや主人公を複数出力で維持したいときに使います。

text
提供したキャラクター画像を唯一のcanonical referenceとして使う。 その同じキャラクターが明るいstartup officeでタブレットを持ち、小さなチームに話している16:9のシーンを作る。 顔、髪型の輪郭、衣装色、体の比率は同じに保つ。 変えるのはポーズ、カメラ角度、背景だけにする。

10. Editorialポートレート

カメラ方向のないstyle adjectivesを積み上げるより、こちらのほうが安定します。

text
日差しの入るスタジオにいる陶芸家の、フォトリアルな上半身ポートレートを作る。3:4構図、被写体は少しオフセンター、浅い被写界深度。 カメラ左から柔らかな窓光、手に暖かいハイライト、空気中にわずかな埃感。 85mmポートレートレンズのような見え方、豊かな土の質感、静かなeditorial mood。

11. 高価値プロダクトのhero image

画像自体が納品物で、単なる草案ではないときにProを使う価値があります。

text
磨かれた石のカウンター上にあるステンレス製エスプレッソマシンの16:9 premium hero imageを作る。 ローアングルの3/4構図、右から入る柔らかな朝光、見える蒸気、リアルな反射、細かなヘアライン金属感。 高級商業写真スタイル、背景はクリーン、余計な小物なし。

12. ストーリーボード

これはDeepMind公式ページでも現在かなり分かりやすく打ち出されているProの強みのひとつです。

text
このシーンの3コマ storyboard を作成する。 Panel 1: ネオンに照らされた都市の通りに若い宇宙飛行士が一人で立つワイド establishing shot。 Panel 2: 彼女が屋上の光る信号を見上げるミディアムショット。 Panel 3: 手首のデバイスを起動する手のクローズアップ。 全パネルで同じキャラクターデザインとカラーパレットを保つ。

13. スタイライズされたタイトル付きコミック表紙

イラストと文字の両方が大事なときに使います。

text
参照画像の人物をレトロフューチャー都市の新しいヒーローとして描いた、ヴィンテージコミック風カバーを作る。 大胆な原色アート、ドラマチックなアクションポーズ、ハーフトーンテクスチャ。 上部に「LAST ORBIT」という正確なタイトルをヴィンテージコミックレタリングで入れる。 隅にgenericなissue badgeを追加してよいが、実在ブランド名は使わない。

14. アスペクト比の変更

すでに強い画像があり、subjectを壊さず別プラットフォーム用に変形したいときに便利です。

text
この画像のアスペクト比を9:16に変更する。背景を減らして、subjectはそのまま正確に保つ。 キャラクターの位置、照明、表情、スタイリングは元のまま固定する。

15. きれい過ぎる画像を直す

Nano Banana Proは、「もっと不完全にしてよい」と伝えたほうが良くなることが少なくありません。

text
夕暮れに店を閉める花屋を写したドキュメンタリー調のストリート写真を作る。 自然な手持ち構図、手元には少しだけ動き、花束の包みは完璧すぎない、路面には柔らかな反射、入口まわりには現実的な散らかりを残す。 光は信じられるものにし、質感は使い込まれた感じにし、雰囲気は広告的な磨き込みではなく親密さを優先する。

15テンプレートに共通するパターンはひとつです。画像が画面内テキスト、連続性ロック、高リスク構図に依存するほど、Proに対して「変えてよいもの」と「絶対に残すもの」を明示する必要があります。

参照画像を使っても drift させない方法

Image A をsubject、Image B をstyle、Image C をenvironmentとして扱い、変えない要素を固定し、1ターン1変数で進め、出力が繰り返し始めたらチャットをリセットすることを示すワークフロー図。
Image A をsubject、Image B をstyle、Image C をenvironmentとして扱い、変えない要素を固定し、1ターン1変数で進め、出力が繰り返し始めたらチャットをリセットすることを示すワークフロー図。

参照画像は、Nano Banana Proがgenericな画像モデルより強く感じられる場面ですが、同時に悪いプロンプトが最速で崩れる場所でもあります。Googleの現行ドキュメントでは Gemini 3 image models が最大14枚の参照画像を扱えるとされていますが、Googleのprompt tipsには「実用上の上限はsurfaceによって変わる」という重要な caveat もあります。つまり「たくさん入れられる」ことを、そのまま「たくさん入れるべき」と解釈しないほうがいい、ということです。

実際の仕事では、10枚より2〜3枚のほうが制御しやすいことが多いです。identity、style、environment をそれぞれ1枚で押さえる最小セットから始めてください。大量の「inspiration image」を積むほど、役割を書かない限り曖昧さが増えます。

いちばん有効な習慣は、各参照画像に1つの役割だけを与えることです。

  • Image A: 主体のidentity
  • Image B: イラストや写真のstyle
  • Image C: environmentや構図の手がかり
  • Image D: productやobject fidelity

役割を与えないと、モデルは推測するしかありません。そして推測が始まる場所こそ、identity drift の起点です。編集でも同じです。1カ所だけ変えたいなら、変えてはいけないものもセットで書く必要があります。

  • 顔と表情は同じまま
  • 背景パースは同じまま
  • ジャケット以外の衣装は同じまま
  • 物体の比率と素材は同じまま

もう1つの重要なルールは、会話が stubborn になる前に切ることです。r/GeminiAI の「Nano Bananaがimpossibly stubbornになる」という話でも、長い編集チェーンのあとに画像がぼやけたり、同じ結果を繰り返したり、単純な変更を無視したりするパターンが見えます。そうなったら同じチャットを叩き続けないでください。最後に良かった画像を持って、新しい会話を開き、もっと狭い指示でやり直したほうが速いです。

この「リセットする」ルールは、多くの上級prompt hackより役に立ちます。multi-turn prompting が強いのは確かですが、それは各ターンが仕事を絞るときだけです。すでに不安定な編集チェーンに変数を足し続けるのは逆効果です。

文字、図解、ローカライズ画像をうまく作る方法

文字入りポスター、図解、ローカライズ画像に対して、exact text、layout、factual components、同一チャットでの言語更新をどう指示するかをまとめたルールボード。
文字入りポスター、図解、ローカライズ画像に対して、exact text、layout、factual components、同一チャットでの言語更新をどう指示するかをまとめたルールボード。

ここがまさに、Nano Banana Proが評価される理由です。Googleのprompt tipsやDeepMindのモデルページは、文字が多い仕事や図解をProの強みとして示しています。ただし、それはモデルが何も言わなくても意図を読んでくれる、という意味ではありません。文字はスローガンのように投げるのではなく、デザイナーに指示するように書く必要があります。

文字が多い出力では、最低でも次の4点を入れてください。

  • 重要な語句を引用符に入れる
  • 文字をどこに置くかを書く
  • フォントの系統、太さ、トーンを書く
  • copyを短くして、きれいに描画できる長さに保つ

画像がdiagramやinfographicなら、さらに事実制約を重ねます。

  • 必ず入る部品を列挙する
  • layoutの型を指定する
  • ラベルの見せ方を指定する
  • 何の階層が最重要かを書く

Googleの現行ドキュメントは、ローカライズの流れもかなり明快に示しています。同じチャットを保ち、「この画像を別の言語に更新して。他の要素は変えないで」と頼む方法です。これは画像を丸ごと作り直して、翻訳版が同じ構造を保ってくれることを祈るより、ずっと強いパターンです。

それでも品質管理をモデルに丸投げしてはいけません。今回の調査で 2026年3月28日 に確認したDeepMindのNano Banana Proページでも、Googleは spelling、細部、grammar、文化的ニュアンス、factの正確性、複雑なblendについて引き続き注意を出しています。つまりルールは単純で、Proにはグラフィックの初稿を早く作らせ、人間が最後にすべての文字と事実を確認する、ということです。

また、surfaceの違いも効きます。Gemini app では product-level routing と quota のある会話UIの中で作業します。AI Studio や API では、モデル面と反復ループをもっと直接に扱えます。このガイドのprompt patternはどちらでも使えますが、reference-heavyでtext-heavyな仕事は、より直接的なsurfaceのほうがデバッグしやすいことが多いです。

次にAPI surfaceそのものを詰めたいなら、実務上の続きは Gemini Image Generation API Base URL です。解像度側の挙動差が気になるなら、英語の Nano Banana Pro maximum resolution も補助になります。

Nano Banana 2 ではなく Nano Banana Pro を使うべきタイミング

今の最もきれいなルールは、「Proのほうが上だから全部Pro」ではありません。Google自身がもうそういう並べ方をしていません。2026年3月23日 更新の公式image-generation docsでは、Gemini 3.1 Flash Image が大半の新しい画像仕事の既定で、Nano Banana Pro はもっと厳しいアセット向けのプロレーンになっています。

Nano Banana Pro を使うべきなのは、次のようなときです。

  • 画像の中に読める文字が必要
  • インフォグラフィックや図解を作る
  • 参照画像をより強く制御したい
  • 速度より編集品質が大事
  • 画像そのものが最終納品物で、単なる草案ではない

Nano Banana 2 を先に使うべきなのは、次のようなときです。

  • 速い試行錯誤をしたい
  • 毎日の安いmockupが欲しい
  • 多くの方向を一気に試したい
  • 文字精度や整ったlayoutが仕事の中心ではない

このrouting ruleがあるからこそ、このページは正直でいられます。良いプロンプトは、文の書き方だけで決まるわけではありません。自分の仕事に合うモデルを選べているかでも決まります。

なぜまだ失敗するのか、どう直すのか

どれだけ良いNano Banana Proプロンプトでも、失敗の仕方にはかなり予測可能な型があります。多くの場合、直し方は「もっと頑張って言う」ことではありません。指示を狭める、仕事を分ける、もしくはモデルがdriftする前に会話を切り直すことです。

症状起こりやすい原因プロンプトでの直し方
文字の綴りが崩れる、見た目が悪いcopyが長すぎる、文字指示が曖昧、置き場所が小さすぎる文言を短くし、引用符に入れ、フォントと配置を明示し、人が確認する
参照画像の1枚が無視される複数画像を入れたが役割を書いていないどの画像がsubject、style、product、environmentを担当するか書く
小さな編集のはずが全体が変わる変化は書いたが固定要素を書いていないchange only X を入れ、残す要素を列挙する
追加入力のたびにぼやける、同じ結果を繰り返す会話が edit loop に入っているいちばん良い現画像を持って新しいチャットを始め、指示を狭める
画像が不自然にきれいで無機質style wordしかなく、生活感の手がかりがない動作、物理的な質感、不完全さ、environment cues を足す
インフォグラフィックがもっともらしいが間違っているモデルが事実を補ってしまったexact labels と components を入れ、最後に人が事実確認する

最後の点がいちばん重要です。Nano Banana Proは、間違ったインフォグラフィックさえ、それらしく見せてしまえるだけの力があります。だからこそ、fact-heavyな仕事ではpromptに制約が必要で、workflowには人間のレビューが必要です。

このガイドから1つだけ覚えるなら、このルールにしてください。Nano Banana Proには制作ブリーフとしてプロンプトを書き、結果は共同作業の下書きとして編集する。 それが、より良い文字、より良い編集、より少ない参照driftに最短で届く方法です。

Nano Banana Pro

4K画像80%OFF

Google Gemini 3 Pro Image · AI画像生成

10万+の開発者にサービス提供
$0.24/枚
$0.05/枚
期間限定·企業レベル安定性·Alipay/WeChat
Gemini 3
ネイティブモデル
ダイレクト接続
20ms遅延
4K超高解像度
2048px
30秒生成
超高速
|@laozhang_cn|$0.05獲得

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+