Генерация изображений в Gemini: как пользоваться app, AI Studio и API

AI Tools Expert

•22 мар. 2026 г.•17 min read•Генерация изображений с ИИ

По состоянию на 22 марта 2026 года Gemini уже подходит для реальной генерации изображений. Базовый старт сейчас дает Nano Banana 2, но главный первый шаг — не настройки, а выбор между Gemini app, AI Studio и Gemini API.

Обложка tutorial по генерации изображений в Gemini с разделением на Gemini app, AI Studio, Gemini API и текущую линейку Nano Banana.

Если вам нужно начать с генерацией изображений в Gemini уже сегодня, в большинстве случаев правильно стартовать с Nano Banana 2. Для самого быстрого no-code сценария лучше подходит Gemini app. Если вам нужен builder-friendly интерфейс, где можно сначала погонять prompt в UI, подойдет AI Studio. Если же нужен повторяемый workflow, логирование, ретраи, явный контроль размера и интеграция в продукт, то основной ответ — Gemini API.

Главная путаница в этом keyword family не в том, умеет ли Gemini вообще генерировать картинки. Умеет. Путаница в том, что page one до сих пор смешивает app, AI Studio и API в один якобы универсальный ответ. Если вы ошибаетесь уже на уровне surface, дальше у вас сразу едет логика по pricing, quota, image size и выбору модели.

Если нужен самый короткий, но полезный ответ, начните с этой таблицы.

Что вам нужно	С чего начать	Почему это правильный default	Когда переключаться
Самый быстрый запуск без кода	Gemini app	Текущая help page уже строит create/edit flow вокруг Nano Banana 2, и это самый короткий путь к первой картинке	Когда вам нужна повторяемость, логи или автоматизация
Сначала поэкспериментировать как builder	AI Studio	Удобно для prompt-итераций в UI, но для текущей основной image-модели нужен paid API key	Когда вы готовы идти в production и в программную интеграцию
Стабильный workflow внутри продукта	Gemini API	Именно здесь есть явный контроль модели, aspect ratio, image size, retries и integration logic	На Pro имеет смысл уходить только у дорогих активов
Более дорогой текст-heavy или premium asset	Nano Banana Pro	Имеет смысл, когда цена слабого результата уже выше, чем переплата за модель	Не используйте как стартовую линию по умолчанию

Краткое содержание

Для самого быстрого no-code результата логично начать с официальной help page Gemini Apps и просто запускать image creation в app.
Если нужен builder UI, можно идти в Google AI Studio, но держите в голове, что в developer post про Nano Banana 2 Google прямо пишет: для текущей модели там нужен paid API key.
Если вам нужен workflow, который можно бюджетировать и автоматизировать, ориентируйтесь на документацию по image generation и страницу pricing.

Сначала выберите правильную поверхность: app, AI Studio или API

Маршрутная схема, сравнивающая Gemini app, AI Studio и Gemini API для генерации изображений в Gemini.

Самая дорогая ошибка в Gemini image generation сегодня — это воспринимать все Google surfaces как один продукт.

Gemini app — это потребительский маршрут. Текущая help page Gemini Apps говорит, что вы можете создавать изображения через Nano Banana 2, редактировать уже сгенерированную картинку, загружать свое изображение для правки и комбинировать несколько input images в новый результат. Та же страница отдельно указывает, что бесплатные пользователи скачивают результат в 1K, а платные — в 2K. Поэтому если задача звучит как "мне просто нужна первая картинка и не хочется писать код", app — самый естественный старт.

AI Studio — это не просто "еще одно место, где можно нажать generate". Это builder playground. Он полезен, когда вы хотите сначала посмотреть, как модель реагирует на разные prompt-формулировки, а уже потом решать, стоит ли переносить это в код. Но именно здесь чаще всего ломается логика простых tutorial pages. Billing FAQ по-прежнему объясняет free-tier posture в широком смысле, однако developer post про Nano Banana 2 отдельно уточняет: в AI Studio для этой модели нужен paid API key. То есть AI Studio не стоит воспринимать как скрытую бесплатную image lane для текущего main model.

Gemini API — это уже production-маршрут. Как только задача перестает быть ручным экспериментом и превращается в repeatable workflow с cost control, retries, logs и product integration, именно API становится главным ответом. Текущая image-generation documentation как раз строит историю вокруг generation, editing, multi-turn refinement, aspect ratio и explicit image size.

Практическое правило отсюда простое: сначала выберите surface, а уже потом спорьте о prompt-нюансах.

Nano Banana 2 — правильный default, но важно понимать, когда ответ меняется

Вот где старые Gemini tutorials устаревают быстрее всего.

Текущая image-generation docs прямо рекомендует gemini-3.1-flash-image-preview как основную image model с лучшим balance между качеством, latency и стоимостью. Именно эта линия и есть сегодняшний Nano Banana 2. На странице deprecations для нее указана дата релиза 26 февраля 2026 года и не указана дата shutdown. Этого уже достаточно, чтобы считать ее базовым ответом для новых workflow.

Но default не равен единственно правильному ответу.

Модель	Текущий статус	Текущая официальная цена	Лучший fit	Что помнить
`gemini-3.1-flash-image-preview`	Текущая базовая линия, релиз 26 февраля 2026	Нет публичного free tier; около $0.045 за 0.5K, $0.067 за 1K, $0.101 за 2K, $0.151 за 4K	Лучший all-around старт для новых image workflows	Preview-квоты и tier все еще важны
`gemini-3-pro-image-preview`	Текущая premium-линия	Нет публичного free tier; около $0.134 за 1K/2K и $0.24 за 4K	Более дорогие text-heavy, infographic и premium assets	Значительно дороже Flash Image
`gemini-2.5-flash-image`	Линия legacy, но еще живая	Нет публичного free tier; около $0.039 стандартно и $0.0195 в batch	Самая дешевая официальная Gemini lane, пока она жива	Google уже поставил shutdown date на 2 октября 2026 года

Практическая логика здесь очень простая. Для большинства задач начинайте с Nano Banana 2. На Nano Banana Pro поднимайтесь только тогда, когда вам критичны текст внутри изображения, premium polish или высокая цена ошибки. А Gemini 2.5 Flash Image используйте только если вы осознанно оптимизируете под legacy-cost lane, понимая ее срок жизни.

Если вас на самом деле интересует не tutorial, а подробный cost breakdown, лучше открыть гайд по Gemini image API free tier или страницу про pricing Gemini image generation. Эта статья должна оставаться именно start-here tutorial.

Как быстро получить первый результат через Gemini app или AI Studio

Если вы пока не готовы писать код, не начинайте с API только потому, что он звучит "профессиональнее". На старте важнее всего быстро пройти цикл prompt -> result -> correction.

В Gemini app базовый путь короткий:

Откройте Gemini и используйте Create image.
Начните с ясного глагола: "create", "generate", "draw".
В одном предложении опишите subject, style, background и mood.
Если вам нужна не новая картинка, а правка существующей, загрузите image и явно скажите, что нужно изменить.
Если результат уже близок, но нужен более premium finish, а у вас paid plan, используйте Redo with Pro.

Сила app в том, что вы быстро понимаете, какие prompt-паттерны вообще дают нужную картинку, не проваливаясь сразу в SDK и API settings.

AI Studio стоит использовать тогда, когда вы уже мыслите как builder. Вам мало просто "получить одну картинку". Вы хотите понять, как модель ведет себя на разных prompt-формулировках, чтобы потом повторить эту логику в коде. Но не стоит путать это с бесплатным image surface. В случае текущей main image line AI Studio скорее работает как удобный UI для paid-route experimentation.

На практике самый безопасный порядок такой:

нужна ручная картинка быстро: Gemini app
нужна UI-площадка для prompt-итераций: AI Studio
нужен production workflow: Gemini API

Именно этот порядок помогает не спутать "мне нужен хороший prompt" с "мне уже нужен API".

Если ваша реальная задача — не общая генерация, а image-to-image editing, следующий логичный материал — редактирование изображений в Gemini.

Как строить repeatable workflow через Gemini API

Схема первого полезного цикла Gemini API для генерации изображений: prompt, модель, размер изображения, результат и refinement.

Как только вам нужна повторяемость, именно API становится центральной частью tutorial.

Текущая документация по image generation поддерживает и text-to-image, и text-plus-image editing. Кроме того, она прямо рекомендует multi-turn refinement. Это важно: лучший Gemini image workflow чаще всего выглядит не как "один огромный prompt и идеальный результат", а как короткий ясный prompt, первая версия, затем еще один шаг уточнения в той же conversation.

Для первого вызова через API лучше держать задачу простой: gemini-3.1-flash-image-preview, понятный aspect ratio и explicit image size только тогда, когда он действительно нужен.

js
import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });

const prompt = `
Create a clean 16:9 product hero image of a matte black travel mug on a light concrete surface.
Use soft studio lighting, sharp detail on the mug texture, and leave calm negative space on the right.
`;

const response = await ai.models.generateContent({
  model: "gemini-3.1-flash-image-preview",
  contents: prompt,
  config: {
    responseModalities: ["TEXT", "IMAGE"],
    imageConfig: {
      aspectRatio: "16:9",
      imageSize: "2K"
    }
  }
});

Этот пример нарочно не пытается быть "максимально умным". Он должен работать и показывать, какие рычаги действительно меняют результат:

model — качество, стоимость и default route
aspectRatio — композиция
imageSize — разрешение и цена
prompt shape — почти все остальное

Если вы редактируете картинку, а не создаете ее с нуля, prompt должен быть уже, чем вам кажется. Говорите, что именно менять и что должно остаться неизменным. Старый, но до сих пор полезный Google prompt-guide объясняет это правильно: описывайте сцену, а не складывайте keyword-пачку, и для local edits обязательно фиксируйте, какие части исходной картинки защищены.

Еще одно важное API-правило: относитесь к image generation как к operational system, а не как к магической функции. Rate-limits page прямо говорит, что лимиты зависят от model и tier. Форумные threads дополнительно показывают, что SDK, imageSize и AI Studio могут вести себя по-разному. Если JS SDK ведет себя странно, сначала проверьте SDK version и сравните тот же prompt в AI Studio.

Если вам нужен более узкий ответ именно по текущему cost-performance route, следующая страница — самый дешевый Gemini 3.1 Flash Image Preview API.

Промпт-паттерны, которые дают более сильные изображения

Самый быстрый способ получить слабый результат в Gemini — это закинуть короткий список keywords и надеяться, что модель сама достроит остальную сцену.

Google в своих prompt-рекомендациях формулирует полезный принцип очень прямо: описывайте сцену, а не перечисляйте keywords. Для текущей Gemini image line этот совет по-прежнему работает лучше всего.

В практическом tutorial стоит запомнить четыре типа prompt-задач.

1. Descriptive text-to-image.
Когда вы генерируете с нуля, лучше всего работает subject + action + environment + style + composition. Например: "Create a photorealistic 16:9 image of a ceramic coffee mug on a weathered wooden table at sunrise, with soft side lighting and visible steam." Это почти всегда сильнее, чем "coffee mug cinematic realistic".

2. Local edit.
Если у вас уже есть изображение и нужно поменять только часть, формулировка должна быть жесткой: "Using the provided image, change only the blue sofa to a dark green velvet sofa. Keep the lighting, room layout, and all other furniture unchanged." Большинство edit-prompts ломаются именно потому, что они описывают только новое, но не защищают старое.

3. Multi-image composition.
Gemini image stack поддерживает composition workflows, и current docs обсуждают reference-image use cases. В prompt обязательно должно быть сказано, какую роль играет каждая input image. Иначе у модели слишком много свободы.

4. Text-heavy и infographic задачи.
Здесь уже чаще меняется ответ в пользу Nano Banana Pro. Если картинка должна не просто выглядеть красиво, а содержать читаемый текст, labels или диаграммную структуру, текст, layout и visual style нужно формулировать явно.

Суть одна и та же: дайте модели понять, что важно, что нужно сохранить и какая визуальная логика должна остаться прежней.

Troubleshooting: почему Gemini image generation ощущается сложнее, чем есть на самом деле

Диагностическая схема для проблем Gemini image generation: неверный surface, путаница с quota, слишком общий prompt, mismatch SDK и выбор legacy-модели.

Раздражает в Gemini image generation чаще всего не сама модель, а то, что многие failures сначала выглядят как "плохой prompt", хотя причина сидит выше.

Первая проблема — не та поверхность. Если вы пока только учитесь формулировать prompt, app или AI Studio почти всегда полезнее, чем API. Если вы строите продукт, наоборот, app не должен быть главным эталоном. Люди часто прыгают между surfaces, а потом считают, что модель нестабильна.

Вторая проблема — путаница между free и paid story. Официальные страницы не противоречат друг другу, просто они говорят о разных слоях системы: billing FAQ, Nano Banana 2 developer post и pricing page описывают не одно и то же. Если это не развести явно, ответ всегда будет звучать противоречиво.

Третья проблема — слишком общий prompt. Gemini не угадает, какие части изображения нельзя трогать, если вы этого не сказали. Если edits меняют слишком многое, сузьте формулировку. Если generation выглядит generic, добавьте больше сцены, контекста и композиции.

Четвертая проблема — quota и key state. Rate-limits page прямо говорит, что реальные limits зависят от tier. Форумные обсуждения также показывают, что после привязки paid key пользователи могут еще какое-то время видеть поведение, похожее на free-tier lockout. Если AI Studio говорит, что вы out of free generations, сначала проверьте project, тип key и live usage в AI Studio.

Пятая проблема — SDK mismatch. Документация показывает поддержку imageSize, но на форуме были кейсы, когда JS SDK не отдавал ожидаемые 2K, в то время как AI Studio с тем же prompt работал правильно. Это повод проверять tooling, а не повод объявлять feature неработающей.

Шестая проблема — старт не с той модели. Если вы выбрали gemini-2.5-flash-image только потому, что он дешевле, вы, возможно, оптимизируете не под ту цель. Модель еще жива, но deprecations page уже ставит ей shutdown date 2 октября 2026 года. Для нового workflow default answer должен оставаться Nano Banana 2.

Если ваш реальный вопрос уже сдвинулся от tutorial к limit-reset или free-tier behavior, логичнее открыть объяснение по сбросу лимитов Gemini image generation и разбор Gemini image generation free tier.

Итог

Лучший tutorial по Gemini image generation в 2026 году — это не список model names и не копия одной официальной docs page.

Начинайте с Nano Banana 2. Для самого быстрого no-code старта используйте Gemini app. Для builder-style experimentation — AI Studio, но без иллюзии, что это скрытая бесплатная image lane для текущей модели. Для repeatable workflow, automation, retries и control — Gemini API. На Nano Banana Pro поднимайтесь только тогда, когда text-heavy или premium asset реально оправдывает цену. А gemini-2.5-flash-image воспринимайте как дешевую legacy-линию, а не как базовый default для нового гайда 2026 года.

Когда вы выбираете правильную поверхность с самого начала, Gemini image generation оказывается куда понятнее, чем это выглядит по текущей SERP-картине.

Nano Banana Pro

4K Изображение-80%

Google Gemini 3 Pro Image · AI Генерация

Обслужено 100K+ разработчиков

$0.24/изобр.

$0.05/изобр.

Спецпредложение·Стабильный·Alipay/WeChat

Gemini 3

Нативная модель

Прямой доступ

20мс задержка

4K Ultra HD

2048px

30сек генерация

Сверхбыстро

|@laozhang_cn|$0.05 бонус

200+ AI Models API

Jan 2026

GPT-5.2Claude 4.5Gemini 3Grok 4+195

Image

80% OFF

gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video

80% OFF

Veo3 · Sora2$0.15/gen

16% OFF⚡ 5-Min📊 99.9% SLA👥 100K+

Get $0.1 Free Docs

#генерация изображений в Gemini #Nano Banana 2 #Gemini app #AI Studio #Gemini API