2026年3月20日時点で、最小コストと安定運用を優先するなら Gemini 2.5 Flash-Lite がまだ無難なデフォルトです。Gemini 3.1 Flash-Lite は、2.5 Flash-Lite の品質上限に当たり始めていて、より高い料金を払ってでも後継レーンを先に学びたい場合に選ぶ価値があります。 これがこの比較の実用的な答えです。
なぜこの比較が重要なのかというと、Google が同時に二つのメッセージを出しているからです。公式の deprecations ページ では gemini-3.1-flash-lite-preview が gemini-2.5-flash-lite の推奨置き換え先になっており、安定版 2.5 Flash-Lite には 2026年7月22日 という最短シャットダウン日も付いています。ところが、公式 pricing ページ では 2.5 Flash-Lite のほうが今もかなり安い。つまり本当の問いは「どちらが新しいか」ではなく、「今すぐ移行するか、待つか、ワークロードごとに分けるか」です。
短く言えば、安いバックグラウンド処理は 2.5 Flash-Lite に残し、品質の差が効く軽量ワークロードだけ 3.1 Flash-Lite へ移し、2026年7月22日までに段階的な移行を終える のが一番現実的です。
要点まとめ
- Gemini 2.5 Flash-Lite は、今も「安くて安定した lite レーン」です。
- Gemini 3.1 Flash-Lite は、料金は上がるが品質が大きく伸びる後継レーンです。
- もし
gemini-2.5-flash-lite-preview-09-2025をまだ使っているなら、移行は先延ばしにしないほうがいいです。
| 項目 | Gemini 3.1 Flash-Lite | Gemini 2.5 Flash-Lite | 実際の意味 |
|---|---|---|---|
| 現在の状態 | Preview | Stable | 3.1 は新しいが、2.5 のほうが運用リスクは低い |
| Model ID | gemini-3.1-flash-lite-preview | gemini-2.5-flash-lite | 置き換えではなく明示的ルーティングが必要 |
| リリース時期 | 2026-03-03 | 2025-07-22 | 3.1 は新ライン、2.5 は成熟ライン |
| 置き換え / シャットダウン | シャットダウン日未発表 | 最短 2026-07-22 に停止、推奨置き換え先は 3.1 Flash-Lite | 今すぐではないが移行判断は必要 |
| 入力価格 | $0.25 / 1M | $0.10 / 1M | 3.1 は入力が 2.5 倍高い |
| 出力価格 | $1.50 / 1M | $0.40 / 1M | 3.1 は出力が 3.75 倍高い |
| 標準無料枠 | 現行価格表では表示なし | あり | 安く試すなら 2.5 が有利 |
| Search grounding | free tier 500 RPD、paid tier 1,500 RPD | 同じ | grounding は差分になりにくい |
| 公開 Batch 上限 | 2.5 と同等 | 3.1 と同等 | 公開表では 3.1 に明確な優位はない |
この比較は Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash とは性格が違います。2.5 Flash と比べると 3.1 Flash-Lite がコスト面でも魅力的に見える場面がありますが、2.5 Flash-Lite と比べると「強いが高い」が中心テーマになります。
これはスペック比較ではなく移行判断
このキーワードの SERP はまだ薄く、価格表、モデルページ、ベンチマーク、デプリケーション表が別々に出てきます。どれも事実は教えてくれますが、「結局どう動くべきか」までは整理してくれません。
公式ページで今いちばん重要なのは次の事実です。
gemini-3.1-flash-lite-previewは 2026年3月3日 に公開gemini-2.5-flash-liteは 2025年7月22日 に公開- 安定版
gemini-2.5-flash-liteの最短停止日は 2026年7月22日 - Google の推奨置き換え先は
gemini-3.1-flash-lite-preview
ここで特に注意すべきなのが、安定版 2.5 Flash-Lite と古い preview ID は締切が違う ことです。gemini-2.5-flash-lite-preview-09-2025 の最短停止日は 2026年3月31日。この ID をまだ使っている人は、安定版ユーザーよりもずっと急いで移行する必要があります。
価格と無料枠: 3.1 Flash-Lite は強いが、安くはない

Google の発表文では 3.1 Flash-Lite は「非常に cost-effective」と表現されています。ただし、それは「2.5 Flash-Lite より安い」という意味ではありません。2026年3月20日時点の価格表では次の通りです。
- Gemini 3.1 Flash-Lite Preview: input
\$0.25、output\$1.50 - Gemini 2.5 Flash-Lite: input
\$0.10、output\$0.40
つまり 3.1 Flash-Lite は:
- input が 2.5 倍
- output が 3.75 倍
この差は小さくありません。だからこそ、2.5 Flash-Lite は今でも「安い要約・圧縮・低リスク分類」のレーンとして意味があります。Lite モデルの役割が「十分よく、しかも安いこと」であるなら、3.1 へ全量移行する根拠は弱くなります。
しかも現行の pricing ページでは、2.5 Flash-Lite には標準無料枠があり、3.1 Flash-Lite Preview にはそれが見えません。安価な試用や個人利用では 2.5 がまだ扱いやすいです。
grounding も、今回の比較では大きな差になりません。両方とも現在は:
- free tier で 500 RPD
- paid tier で 1,500 RPD
が表示されています。つまり、今の本質的な差はかなり単純です。
- 2.5 Flash-Lite は安い安定レーン
- 3.1 Flash-Lite は強いが高い後継レーン
無料枠まわりを詳しく確認したいなら、Gemini API free quota 2026 も合わせて見ておく価値があります。
3.1 Flash-Lite が実際に強くなる点
もっとも説得力のある公式比較は、DeepMind の Gemini 3.1 Flash-Lite ページ です。ここでは 3.1 Flash-Lite と 2.5 Flash-Lite が同じ表に入っています。
主要な行だけ抜き出すとこうです。
| 指標 | Gemini 3.1 Flash-Lite | Gemini 2.5 Flash-Lite | 優位 |
|---|---|---|---|
| Input price | $0.25 / 1M | $0.10 / 1M | Gemini 2.5 Flash-Lite |
| Output price | $1.50 / 1M | $0.40 / 1M | Gemini 2.5 Flash-Lite |
| Output speed | 363 tokens/s | 366 tokens/s | ほぼ同等 |
| GPQA Diamond | 86.9% | 66.7% | Gemini 3.1 Flash-Lite |
| MMMU-Pro | 76.8% | 51.0% | Gemini 3.1 Flash-Lite |
| SimpleQA Verified | 43.3% | 11.5% | Gemini 3.1 Flash-Lite |
| LiveCodeBench | 72.0% | 34.3% | Gemini 3.1 Flash-Lite |
| MRCR v2 128k | 60.1% | 30.6% | Gemini 3.1 Flash-Lite |
この差はかなり大きいです。だから 3.1 Flash-Lite は次のようなケースで魅力があります。
- 後処理を減らしたい翻訳
- JSON や抽出精度が重要なパイプライン
- 最初の判断ミスが高くつく routing / triage 層
- 2.5 Flash-Lite では脆いと感じる軽量コード支援
ただし、これは「すべての lite 仕事を 3.1 に移すべき」という意味ではありません。その品質向上が、増えたコストを回収できるか をワークロード単位で見ないといけません。
Preview リスク、公開上限、移行タイムライン

公式の rate limits ページ には、preview モデルはより厳しい制限になる可能性があり、実際の容量は変わりうると書かれています。これは 3.1 Flash-Lite が必ず不安定という意味ではありませんが、preview を安定版と同じ感覚で全量デフォルトにするのは危険だ、という意味ではあります。
さらに、同じページの公開 Batch API 表では、3.1 Flash-Lite Preview と 2.5 Flash-Lite の上限は同等です。つまり、今の公式公開情報だけでは「3.1 は Batch でも明確に有利」とは言えません。
したがって判断の軸は次の三つです。
- 古い preview ID を使っているなら先に移行する
- 安定版 2.5 を使っているなら、7月22日までに評価と準備を済ませる
- 将来の置き換えが確実なら、今から段階的に学ぶ
どのワークロードを残し、移し、併用するべきか

いちばん実用的なのは、結論を routing ルールにすることです。
2.5 Flash-Lite に残す:
- memory compaction
- bulk summarization
- low-stakes classification
- とにかく安く終わればよいバックグラウンド処理
3.1 Flash-Lite へ移す:
- translation
- extraction
- routing
- 品質差がそのまま価値差になる lite タスク
両方を併用する:
- mixed traffic
- phased migration
- 安い仕事と重要な lite 仕事が混在しているチーム
多くのチームにとって、今の最適解はこの「併用」です。2.5 のコスト優位を残しつつ、3.1 という公式後継レーンを学べます。
後悔しない移行手順
- 今の 2.5 Flash-Lite の用途を分解する
- 品質差が効くタスクだけ 3.1 を試す
- ベンチマークの点数ではなく、総コストと総効果で比べる
- 古い preview ユーザーを先に移行する
- 実トラフィックで十分確認できるまで 2.5 を fallback として残す
部分移行後に見るべき指標
この比較でいちばん危ないのは、料金表だけを見て「3.1 は高いから損」と決めること、あるいはベンチマークだけを見て「3.1 は強いから全部移すべき」と決めることです。Flash-Lite の移行では、その二つの見方だけでは判断を誤りやすくなります。見るべきなのは、実トラフィックの中でどの仕事が本当に改善され、その改善がどれだけコスト差を打ち返すかです。
たとえば翻訳なら、完成文の見栄えだけでなく、初回出力のあとに何回手直しが必要だったかを見るべきです。抽出や JSON 生成なら、一発で正しい構造が返る率を追うほうが実務に近いです。routing や triage のような入口タスクでは、最初の誤判定が後続コストを増やすので、単純な品質点よりも「最初の判断を外した割合」のほうが重要になることがあります。
実際には、次のような指標を並べて比べると判断しやすくなります。
- 手修正なしで通った割合
- リトライ回数と再生成回数
- 後段のより高価なモデルに送る必要があった割合
- 1 回の API 呼び出し単価ではなく、1 件の有効結果あたりの総コスト
- 3.1 から 2.5 に戻した fallback 率
こうして見ると、3.1 Flash-Lite は「いつも高すぎるモデル」でも「常に置き換えるべきモデル」でもないことがはっきりします。安い要約や圧縮では 2.5 が残る場面が多い一方で、抽出、翻訳、routing のように最初の質がそのまま手戻り率に効く仕事では 3.1 のほうが総合的に得になることがあります。移行の正解はモデル名ではなく、仕事単位で決まります。
FAQ
Gemini 3.1 Flash-Lite は Gemini 2.5 Flash-Lite より安いですか?
いいえ。2026年3月20日時点の公式価格表では、3.1 Flash-Lite は \$0.25 / \$1.50、2.5 Flash-Lite は \$0.10 / \$0.40 です。
では、なぜ 3.1 Flash-Lite へ移る価値があるのですか?
DeepMind の公式比較表で、複数の品質指標に大きな差があるからです。品質差がリトライや後処理の削減につながるなら、高い料金でも元が取れます。
両方とも grounding はありますか?
あります。現行価格表では、両方とも free tier 500 RPD、paid tier 1,500 RPD の Search grounding が表示されています。
gemini-2.5-flash-lite-preview-09-2025 を使っているなら今すぐ移行すべきですか?
はい。公式 deprecations ページでは 2026年3月31日が最短停止日になっています。
安定版 2.5 Flash-Lite も今すぐ全部 3.1 に置き換えるべきですか?
普通はそこまで急ぐ必要はありません。まずは 2.5 を安い仕事に残し、価値の高い lite ワークロードだけ 3.1 を試しながら、7月22日までに段階的移行を進めるほうが安全です。
