AIFreeAPI Logo

Gemini画像生成チュートリアル: アプリ・AI Studio・APIの使い方

A
17 min readAI画像生成

2026年3月22日時点で、Gemini の画像生成はすでに実用段階です。いちばん自然な出発点は Nano Banana 2 ですが、本当に先に決めるべきなのは設定ではなく、Gemini アプリ、AI Studio、Gemini API のどこから始めるかです。

Gemini アプリ、AI Studio、Gemini API と現在の Nano Banana モデル構成を整理した Gemini 画像生成チュートリアルのカバー画像。

いま Gemini で画像生成を始めるなら、まずは Nano Banana 2 から考えるのが自然です。コードを書かずに最短で一枚目を出したいなら Gemini アプリ、開発者向け UI でプロンプトを試してから実装を考えたいなら AI Studio、再利用できるワークフローやアプリ統合が必要なら Gemini API が基本ルートになります。

このキーワードでいちばん混乱しやすいのは、Gemini が画像を作れるかどうかではありません。もう作れます。難しいのは、検索結果の多くが アプリ、AI Studio、API を同じ答えとして混ぜてしまうことです。最初の surface 選びを間違えると、その後の価格、クォータ、解像度、モデル選びまで全部ずれて見えます。

まずは最短の答えとして、このルーティング表から見てください。

やりたいこと先に使うべき場所いまそれが正しい理由いつ切り替えるか
コードなしで最速で画像を出したいGemini アプリ現在の help page は Nano Banana 2 を create / edit の中心に置いていて、一枚目までの距離が最短再現性、ログ、プログラム制御が必要になったら
UI で先にプロンプト検証したいAI Studiobuilder 目線で prompt を試しやすいが、現在の主力画像モデルは有料 API key 前提自動化やアプリ統合に進むとき
本番ワークフローや明示的な制御が必要Gemini APIモデル指定、aspect ratio、image size、再試行をきちんと扱える文字量の多い高価値アセットだけ Pro に上げる
文字中心や情報量の多い高品質画像Nano Banana Pro失敗コストが高い画像でだけ意味が大きい多くの人は最初からここに行かなくてよい

要点まとめ

最初に決めるべきなのは Gemini 画像生成の入口です

Gemini アプリ、AI Studio、Gemini API のどれから始めるべきかを比較した Gemini 画像生成のルーティング図。
Gemini アプリ、AI Studio、Gemini API のどれから始めるべきかを比較した Gemini 画像生成のルーティング図。

Gemini 画像生成で最初に起きやすい失敗は、Google の複数の surface をひとつの製品として扱ってしまうことです。

Gemini アプリ は一般ユーザー向けの入口です。現在の Gemini Apps help page では、Nano Banana 2 で画像を作る、生成済み画像を編集する、自分の画像をアップロードして修正する、複数の画像を組み合わせる、といった使い方が案内されています。同じページには、無料ユーザーのダウンロードは 1K、有料サブスクリプションは 2K と書かれています。つまり「とにかく最短で一枚出したい」なら、アプリがいちばん自然です。

AI Studio は builder 向けの playground です。コードを書く前に prompt の効き方を確かめたり、モデル挙動を UI で見たいときに向いています。ただし、ここで説明が雑なチュートリアルが増えます。billing FAQ は新規アカウントが Free tier から始まることを説明していますが、同日の Nano Banana 2 開発者向け記事AI Studio でこのモデルを使うには有料 API key が必要 だと明記しています。だから安全な読み方は「AI Studio は全部無料」でも「AI Studio は全部有料」でもなく、surface とモデルの組み合わせで条件が変わる ということです。

Gemini API は本番ルートです。明示的なモデル選択、構造化された prompt、ログ、再試行、アプリ統合が必要になった時点で、ここが本筋になります。現在の image-generation docs も、画像生成、画像編集、multi-turn refinement、aspect ratio、image size を API 観点で整理しています。

だから実用的な順番は、まず surface を決めて、その次に prompt を調整し、最後に価格やサイズ最適化を考えることです。

基本は Nano Banana 2 だが、Pro と legacy 2.5 の立ち位置も知っておく

このテーマでいちばん古くなりやすいのはモデルの話です。

現在の image-generation docsgemini-3.1-flash-image-preview を、性能とコストのバランスが最も良い標準ルートとして勧めています。これが現在の Nano Banana 2 です。deprecations ページ では、このモデルの公開日が 2026年2月26日 とされ、まだ shutdown date は出ていません。新しいワークフローの基本回答にするには十分です。

ただし、基本回答が唯一の答えというわけではありません。

モデル現在の位置づけ現在の公式価格向いている用途注意点
gemini-3.1-flash-image-preview現在の標準ライン、2026年2月26日公開公開 free tier なし。0.5K が約 $0.045、1K が $0.067、2K が $0.101、4K が $0.151新しい画像生成と編集の基本ルートpreview なのでクォータ確認は必要
gemini-3-pro-image-preview現在の上位ライン公開 free tier なし。1K / 2K が約 $0.134、4K が $0.24文字の多い画像、情報量の多い図、価値の高い最終成果物Flash Image より明確に高い
gemini-2.5-flash-imageまだ稼働中の legacy ライン公開 free tier なし。標準で約 $0.039、batch で $0.0195とにかく公式の最安ラインだけを狙う場合2026年10月2日 に shutdown 予定

多くの人にとっての実務的な答えはシンプルです。まず Nano Banana 2。画像内テキストや情報図版の重要度が高く、失敗コストが大きいときだけ Nano Banana Pro に上げる。gemini-2.5-flash-image は「まだ安い legacy ライン」と理解し、新しい標準チュートリアルの出発点にはしない方が安全です。

価格だけを深掘りしたいなら Gemini 画像生成 API 料金ガイド、無料の扱いを知りたいなら Gemini image generation free tier の方が合っています。このページはまず最初の一回を正しく通す役割に徹します。

最初の一回を最速で通すなら Gemini アプリか AI Studio から始める

まだコードを書くつもりがないなら、API から入る必要はありません。まずは prompt と結果のループを最も見やすい場所で回す方が効率的です。

Gemini アプリ での流れは短いです。

  1. Gemini を開いて Create image を使う。
  2. 「create」「draw」「generate」のように、はっきりした動詞で始める。
  3. 主体、スタイル、背景、雰囲気を一文か短い段落で書く。
  4. 新規生成ではなく編集なら、画像をアップロードして「どこだけ変えるか」を明示する。
  5. ほぼ狙い通りだが詰めが弱い場合は、有料プランなら Redo with Pro を使う。

この順番が良いのは、最初から API のフィールドを考えずに、どんな prompt が狙いに近づくかを先に学べるからです。現在の help page も、画像生成と編集の中心を Nano Banana 2 に置き、Nano Banana Pro は redo option として扱っています。

AI Studio は builder らしく試したい人に向いています。同じ prompt を少しずつ変えたり、モデルの反応を UI で観察したいなら便利です。ただし、ここを「アプリと同じ無料画像入口」とは考えない方がいいです。現在の主力モデルでは有料 API key 条件があるため、AI Studio は 無料の抜け道 ではなく 開発者向けの実験面 と考えるのが安全です。

実務的な順番は次の通りです。

  • 画像が一枚欲しいだけなら Gemini アプリ
  • コード前に prompt の挙動を見たいなら AI Studio
  • 自動化やアプリ統合が必要なら Gemini API

この順番で進めると、不要な API デバッグをかなり減らせます。画像編集が主目的なら、次は Gemini 画像編集ガイド を読む方が近道です。

再利用できるワークフローを作るなら Gemini API を使う

プロンプト、モデル、画像サイズ、出力、refinement の流れを示した Gemini API 初回ワークフロー図。
プロンプト、モデル、画像サイズ、出力、refinement の流れを示した Gemini API 初回ワークフロー図。

再現性が必要になった時点で、本当のチュートリアルは API に移ります。

現在の image-generation docs は、text-to-image だけでなく text-plus-image 編集もサポートし、さらに multi-turn refinement を明示しています。ここはとても重要です。Gemini の画像生成は、一発で完璧な巨大 prompt を作るより、まず一回出してから同じ会話の中で詰める方が現実的です。

最初の API 実行は、できるだけ単純に始めるのが安全です。gemini-3.1-flash-image-preview を使い、必要なら aspect ratio を指定し、本当に必要な場合だけ image size を明示します。

js
import { GoogleGenAI } from "@google/genai"; const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY }); const prompt = ` Create a clean 16:9 product hero image of a matte black travel mug on a light concrete surface. Use soft studio lighting, sharp detail on the mug texture, and leave calm negative space on the right. `; const response = await ai.models.generateContent({ model: "gemini-3.1-flash-image-preview", contents: prompt, config: { responseModalities: ["TEXT", "IMAGE"], imageConfig: { aspectRatio: "16:9", imageSize: "2K" } } });

この例が意図的に地味なのは、まず確実に動くことが大事だからです。ここで結果を大きく変える要素は四つあります。

  • model はコスト、品質、基本ルートを変える
  • aspectRatio は構図を変える
  • imageSize は解像度と価格を変える
  • prompt の形 はほぼそれ以外すべてに効く

編集をしたい場合は、生成よりもさらに prompt を狭く書くべきです。どこを変え、何を維持するかを明示します。Google の少し古い prompt guide でも考え方は同じで、キーワードを積むより場面を説明し、局所編集では「そこだけ変える」と言い切る方が安定します。

もう一つ大事なのは、画像生成を運用対象として扱うことです。rate-limits ページ は live limit がモデルと tier によって変わると書いていますし、コミュニティでは JS SDK と AI Studio で imageSize の挙動が違って見えた報告もあります。SDK の出力が怪しいときは、SDK のバージョン確認と AI Studio での同一 prompt 検証を先に行うべきです。

コスト対性能をさらに詰めたいなら、次は 最安の Gemini 3.1 Flash Image Preview API ガイド が近いページです。

画像が良くなりやすいプロンプトの書き方

Gemini で弱い画像が出る最速の方法は、短いキーワードだけを並べることです。

Google の prompt ガイドが何度も言う通り、キーワードの山より、場面を描写する文章の方が強い です。Gemini の現在の画像ラインでも、この原則はそのまま通用します。

実用的なチュートリアルとして覚えておきたいのは次の四つです。

1. ゼロから作る text-to-image。
主体 + 動作 + 環境 + スタイル + 構図で書くと安定しやすいです。たとえば「夜明けの木製テーブルの上に置かれた陶器のマグカップを、やわらかな側光と湯気つきで 16:9 の写実的な商品写真として作成する」といった書き方です。

2. 画像の一部だけを変える local edit。
この場合は blunt に書く方が良く、「入力画像を使い、青いソファだけを深い緑のベルベットに変え、照明、部屋の配置、他の家具は変えない」といった形が強いです。多くの edit prompt は新しい要素だけを説明して、元画像を守る指示を書いていません。

3. 複数画像の合成や style transfer。
Gemini の画像スタックは multi-image workflow を扱えます。だからこそ、各画像が何を担当するかを書く必要があります。たとえば「画像1のバッグを画像2のスタジオ背景に置き、バッグの比率を保ち、画像2の上部照明に合わせる」という書き方です。

4. 文字量の多い画像や情報図版。
ここは Nano Banana Pro を検討する意味が大きい場面です。出したい文字、見出し、レイアウトの方向性を明示します。たとえば「水循環を説明する 16:9 のクリーンな図を作成し、'Evaporation'、'Condensation'、'Precipitation' を太い sans-serif で読みやすく配置する」といった形です。

共通するルールは一つで、Gemini に 何が重要か、何を守るべきか、どんな視覚ロジックを期待するか をはっきり伝えることです。

トラブルシューティング: Gemini 画像生成が難しく感じる理由

surface の選び間違い、クォータの混乱、曖昧なプロンプト、SDK の不一致、legacy モデル選択などを切り分ける Gemini 画像生成のトラブルシューティング図。
surface の選び間違い、クォータの混乱、曖昧なプロンプト、SDK の不一致、legacy モデル選択などを切り分ける Gemini 画像生成のトラブルシューティング図。

Gemini 画像生成で厄介なのは、失敗が最初は「プロンプトのせい」に見えやすいことです。実際には surface の問題であることが少なくありません。

一つ目は surface の選び間違い です。プロンプトの効き方を学ぶ段階なら、アプリか AI Studio の方が API より観察しやすいです。逆に、自分のプロダクトに組み込みたいのにアプリを基準に考えると、比較の前提がずれます。

二つ目は 無料と有料の話を混ぜること です。billing FAQ、Nano Banana 2 の開発者記事、pricing ページはそれぞれ違う層を説明しています。これを分けずに読むと、説明が全部矛盾して見えます。

三つ目は prompt が曖昧すぎること です。Gemini は以前の画像モデル群より文脈理解が強くても、守るべき領域を言わなければ推測には限界があります。編集で変わりすぎるなら範囲を狭め、新規生成が平凡なら場面の言語を増やす方が効きます。

四つ目は クォータや key の状態 です。rate-limits ページ は tier 依存を明記していますし、コミュニティでも paid key 連携直後に挙動が分かりにくい例が報告されています。AI Studio が free generation 切れのように見えるなら、古いスクリーンショットを信じる前に project と live usage を確認すべきです。

五つ目は SDK の不一致 です。docs では imageSize が使えるのに、特定 SDK バージョンだと期待通りの 2K 出力にならない報告がありました。こういうときは API 自体を疑う前に、SDK 更新と AI Studio での比較を行う方が正しいです。

六つ目は 最初のモデル選びが古いこと です。gemini-2.5-flash-image はまだ使えますが、deprecations ページ では 2026年10月2日 に shutdown 予定です。新しいワークフローの出発点としては、やはり Nano Banana 2 を基準にすべきです。

もし本当の疑問が「いつ limit が戻るか」「無料扱いはどこまでか」であれば、Gemini image generation limit resetGemini image API free tier の方が直接答えになります。

結論

2026年の良い Gemini 画像生成チュートリアルは、モデル名の一覧でも、Google docs 一枚の言い換えでもありません。

多くのケースでは Nano Banana 2 から始めます。最速の no-code なら Gemini アプリ。builder 向けの検証なら AI Studio。再現性、画像サイズ制御、再試行、アプリ統合が必要なら Gemini API。そして Nano Banana Pro は、文字量の多い画像や高価値アセットでだけ上げる。gemini-2.5-flash-image は安い legacy ラインとして理解し、新しい標準ルートとは分けて考える。

最初に正しい surface を選べば、Gemini 画像生成は検索結果の印象ほど複雑ではありません。難しいのはモデルそのものより、入口の選び方です。

Nano Banana Pro

4K画像80%OFF

Google Gemini 3 Pro Image · AI画像生成

10万+の開発者にサービス提供
$0.24/枚
$0.05/枚
期間限定·企業レベル安定性·Alipay/WeChat
Gemini 3
ネイティブモデル
ダイレクト接続
20ms遅延
4K超高解像度
2048px
30秒生成
超高速
|@laozhang_cn|$0.05獲得

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+