AIFreeAPI Logo

Редактирование изображений в Gemini: app, API и лучший выбор модели

A
17 min readГенерация изображений с ИИ

По состоянию на 22 марта 2026 года Gemini уже умеет делать image-to-image как в приложении Gemini, так и через Gemini API. Для большинства пользователей правильной отправной точкой будет Nano Banana 2, но оптимальный путь зависит от того, что вам важнее: скорость, автоматизация или премиальное качество.

Обложка гайда по редактированию изображений в Gemini с сравнением Gemini app, Gemini API и маршрута через Nano Banana Pro.

Да, Gemini уже умеет редактировать изображения по схеме image-to-image, и для большинства случаев логичнее всего начинать с Nano Banana 2. По состоянию на 22 марта 2026 года главный вопрос уже не в том, поддерживает ли Gemini редактирование картинок вообще. Поддерживает. Главное решение теперь другое: использовать приложение Gemini, Gemini API или подниматься до Nano Banana Pro, когда важнее финальное качество и точность.

Проблема в том, что текущая выдача все еще раскладывает ответ по нескольким страницам Google. Официальная документация по image generation объясняет возможности и код, страница помощи Gemini Apps объясняет сценарии приложения, а продуктовые посты рассказывают, почему Nano Banana 2 стала новой основной линией. Каждая из этих страниц полезна, но пользователю, который уже держит в руках изображение и хочет его изменить, по-прежнему приходится собирать ответ вручную.

Короткая практическая версия такая. Если вы хотите быстро загрузить фото, поменять фон, объект, одежду или смешать несколько картинок без кода, берите Gemini app. Если вам нужен повторяемый процесс, многошаговая доработка, интеграция в свой продукт, контроль размера и логирование, берите Gemini API. А Nano Banana Pro имеет смысл включать тогда, когда стоимость слабого результата уже выше, чем переплата за модель.

Краткое содержание

Если нужна самая короткая полезная версия ответа, начните с этой таблицы.

Что вам нужноЛучшая текущая дорожкаПочему
Быстрое редактирование без кодаGemini app + Nano Banana 2Самый короткий путь для загрузки, правок, смешивания и повторных итераций
Повторяемый рабочий процесс в продуктеGemini API + gemini-3.1-flash-image-previewЭто текущая базовая модель для image-to-image с хорошим multi-turn сценарием
Больше качества, текста и премиального контроляRedo с Nano Banana Pro в приложении или gemini-3-pro-image-preview в APIИмеет смысл, когда ценность финального изображения действительно высока
Минимальная официальная ценаgemini-2.5-flash-imageПока еще самая дешевая линия, но уже с явным статусом legacy и датой отключения 2 октября 2026 года

Для этого семейства запросов критичны две даты: 26 февраля 2026 года, когда появился gemini-3.1-flash-image-preview, и 2 октября 2026 года, когда, согласно официальной странице deprecations, должен быть отключен gemini-2.5-flash-image. Поэтому сегодня наиболее разумный базовый совет чаще всего сводится к Nano Banana 2.

Gemini уже умеет image-to-image, но правильный путь зависит от того, где вы работаете

Схема, показывающая, когда для редактирования изображений стоит выбирать Gemini app, Gemini API или Nano Banana Pro.
Схема, показывающая, когда для редактирования изображений стоит выбирать Gemini app, Gemini API или Nano Banana Pro.

На поверхности кажется, что это один и тот же функциональный вопрос. На практике Google сегодня дает его через разные поверхности. В приложении Gemini это потребительский сценарий: вы загружаете картинку, просите изменить ее, затем продолжаете дорабатывать результат в том же чате и при необходимости объединяете несколько изображений в одну сцену. По текущей справке, основная линия здесь - Nano Banana 2, а Nano Banana Pro доступна как вариант redo для платных подписчиков.

В Gemini API логика другая. Документация прямо описывает это как text-and-image-to-image: вы отправляете изображение и инструкцию, а в ответ получаете новое изображение. Более того, сама документация рекомендует multi-turn редактирование, то есть последовательную доработку в рамках одной беседы. Поэтому API - это правильный путь, если вам нужны интеграция, контроль, повторяемость и состояние диалога.

Самая частая ошибка - смешивать приложение и API так, как будто у них одни и те же правила доступа и оплаты. Это не так. Текущая страница помощи Gemini Apps пишет, что бесплатные пользователи скачивают результат в 1K, а платные подписчики - в 2K. А разработческий пост от 26 февраля 2026 года отдельно уточняет, что для Nano Banana 2 в Google AI Studio требуется платный API key. Именно поэтому заявления "Gemini умеет бесплатно редактировать фото" и "Gemini image editing - платная функция" могут одновременно быть верными, если речь идет о разных поверхностях.

Если вы уже понимаете, что строите продуктовый workflow, переходите к API-разделу. Если вам просто нужно быстро исправить изображение руками, приложение обычно окажется короче и удобнее.

Выбирайте модель Gemini до того, как начнете редактирование

Сильнее всего здесь устаревает именно модельная часть. Если смотреть на текущие официальные docs, pricing и deprecations вместе, картина понятна: gemini-3.1-flash-image-preview - текущая базовая линия, gemini-3-pro-image-preview - премиальная линия, а gemini-2.5-flash-image все еще жива, но уже как legacy-вариант.

МодельТекущий статусСтандартная ценаДля чего подходит лучше всегоЧто важно помнить
gemini-3.1-flash-image-previewТекущий preview по умолчанию, запуск 26 февраля 2026 года$0.045 в 0.5K, $0.067 в 1K, $0.101 в 2K, $0.151 в 4KБольшинство новых сценариев, быстрые правки, многошаговая доработкаПо-прежнему preview и платная API-поверхность
gemini-3-pro-image-previewТекущий премиальный preview$0.134 в 1K/2K и $0.24 в 4KБолее дорогие финальные активы, текст-насыщенные изображения, сложные брифыСущественно дороже Nano Banana 2
gemini-2.5-flash-imageLegacy-линия, плановое отключение 2 октября 2026 года$0.039 в 1024x1024Самая дешевая официальная 1K генерацияЕсть явный жизненный риск для новых проектов

Почему именно Nano Banana 2 лучше всего подходит как дефолтный совет? Не потому, что она во всем лучше остальных, а потому, что она лучше всего отвечает на широкий вопрос про редактирование изображений в Gemini. Google позиционирует ее как быструю и высокопроизводительную линию, удобную для многошаговой работы, а pricing страница дает ей практический диапазон размеров от 0.5K до 4K.

Переходить на Nano Banana Pro стоит тогда, когда одно из трех условий становится настоящим. Во-первых, когда в изображении очень важен текст: инфографика, постеры, схемы, интерфейсные макеты. Во-вторых, когда сам актив дорогой, а цена плохого результата или ручной переделки уже ощутима. В-третьих, когда вы уже получили хорошую композицию в приложении и хотите добиться более дорогого финального качества через redo с Pro.

Если вам нужен более подробный API-разбор Nano Banana 2, в этом репозитории лучше всего продолжить с Gemini Flash Image API Guide.

Как редактировать изображения в Gemini app без борьбы с интерфейсом

Приложение Gemini - самый короткий путь, если вам не нужен собственный pipeline. По текущей инструкции Google вы заходите на gemini.google.com, выбираете Create image или загружаете картинку, затем описываете правку и продолжаете редактирование по результату. Сегодня это уже не просто "текст в картинку", а вполне практичный image-to-image путь для реальных задач: заменить объект, фон, одежду, совместить несколько фото или сделать несколько локальных правок подряд.

Здесь сильнее всего ощущается эффект Nano Banana 2. В обновлении приложения Google акцентирует внимание на сохранении сходства человека или питомца, замене фона, смешивании нескольких изображений и многошаговой локальной редактуре. Для обычного пользователя это значит простую вещь: приложение уже можно рассматривать как рабочий инструмент для image-to-image, а не как демонстрацию возможностей модели.

Лучше всего app-сценарий работает на конкретных инструкциях. Вместо "сделай фото лучше" лучше писать: "Измени только цвет стены на темно-зеленый. Оставь мебель, освещение и угол камеры без изменений." Такая форма помогает Gemini понять и зону изменения, и ту часть кадра, которую трогать нельзя.

Есть три app-ограничения, о которых важно знать заранее. Во-первых, функция зависит от поддерживаемых языков и регионов Gemini Apps, так что иногда проблема не в промпте, а в доступности самой поверхности. Во-вторых, запрос может уткнуться в политику безопасности, и пользователь воспримет это как "модель не умеет". В-третьих, изображения, созданные или отредактированные в Gemini app, получают видимый watermark и SynthID.

Для платных подписчиков самый полезный трюк - Redo with Pro. Сначала вы создаете и редактируете результат через Nano Banana 2, а потом используете Pro для более дорогой финальной версии.

Как делать image-to-image через Gemini API

Схема multi-turn процесса в Gemini API от входного изображения и промпта до текущей модели, выбора размера и уточненного результата.
Схема multi-turn процесса в Gemini API от входного изображения и промпта до текущей модели, выбора размера и уточненного результата.

API - правильный выбор, когда вам нужны надежность, повторяемость и интеграция. Официальная документация показывает редактирование как стандартный вызов generateContent: отправляется изображение плюс инструкция, а модель возвращает текстовые и графические части. Для сегодняшнего workflow наиболее естественный дефолт - gemini-3.1-flash-image-preview.

Ключевая идея не в том, чтобы "послать одну картинку и получить одну картинку". В документации прямо сказано, что multi-turn conversation - рекомендуемый способ редактирования. Это важно, потому что реальные image-to-image задачи почти всегда живут в несколько шагов: поменять фон, затем уменьшить объект, затем поправить освещение, затем перевести текст.

Вот минимальный Python-пример с актуальным названием модели и формулировкой локальной правки, которая обычно ведет себя стабильно:

python
import os import base64 from google import genai from PIL import Image client = genai.Client(api_key=os.environ["GEMINI_API_KEY"]) source = Image.open("living-room.png") response = client.models.generate_content( model="gemini-3.1-flash-image-preview", contents=[ "Using the provided image, change only the blue sofa to a vintage brown leather chesterfield. " "Keep the pillows, room layout, camera angle, and lighting unchanged.", source, ], ) for part in response.candidates[0].content.parts: if part.inline_data: with open("edited-room.png", "wb") as f: f.write(base64.b64decode(part.inline_data.data))

Такой пример нарочно узкий: в image-to-image именно конкретные запросы чаще всего дают предсказуемый результат. Если нужна следующая правка, не начинайте новый запрос с нуля. Продолжайте в рамках той же беседы. Для текущих моделей Gemini 3 image docs также показывают imageConfig, где задаются aspectRatio и imageSize, например 1K, 2K или 4K.

Есть и два API-момента, которые лучше озвучить прямо. Первый: у активных image-моделей Gemini на официальной pricing странице нет публичного free tier. Второй: текущая страница rate limits говорит, что реальные лимиты зависят от вашего tier и смотрятся в AI Studio, а не в какой-то универсальной таблице. Если вы строите реальный продукт, относитесь к этому как к обычной API-интеграции - с бюджетом, ограничением скорости, retry и логами.

Если вам нужен более широкий контекст про бесплатный доступ и платные дорожки, следующая локализованная страница - Gemini image generation free tier. Для legacy-перехода есть Gemini 2.5 Flash Image replacement.

Какие промпты дают более стабильное редактирование в Gemini

Многие неудачные правки выглядят как проблема модели, хотя на деле проблема в слабом промпте. Официальный гайд по prompting для image-линии Gemini формулирует принцип очень точно: описывайте сцену, а не просто перечисляйте keywords. В image-to-image это особенно важно, потому что модели нужно одновременно изменить одно и сохранить другое.

Первый полезный шаблон - добавить или убрать один элемент. Лучше всего работает формула: описать исходное изображение, описать изменение и описать, как новый элемент должен вписаться в сцену. Например: "Возьми фото кота и добавь маленькую вязаную шляпу волшебника. Сделай так, чтобы она выглядела естественно и соответствовала мягкому оконному свету." Здесь важен не только сам объект, но и логика его интеграции.

Второй шаблон - поменять только одну часть изображения. Это лучший путь, если вы не хотите глобальной перерисовки. Самая безопасная форма звучит буквально: "Измени только синий диван на винтажный коричневый кожаный chesterfield. Все остальное, включая подушки, освещение и композицию комнаты, оставь без изменений."

Третий шаблон - перенос стиля. Здесь задача не "сделай красивее", а "возьми цвет, текстуру или художественный язык из одной картинки и применяй его к другой". Поскольку Gemini поддерживает несколько входных изображений, полезнее писать так: "Используй объект с изображения 1, но перенеси палитру и текстуру с изображения 2. Сохрани силуэт и чистую композицию."

Четвертый шаблон - мульти-изображенческая композиция. В текущих документах для Gemini 3 image указано, что можно использовать до 14 reference images. Это значит, что сценарий не ограничивается одной локальной правкой. Сильнее всего работает тот промпт, где у каждой картинки есть роль: "Помести собаку с изображения 1 на баскетбольную площадку с изображения 2. Сохрани реалистичный масштаб, подгони освещение и используй низкий ракурс второй картинки."

Пятый шаблон - защитить кадр и пропорции. Google пишет, что при редактировании Gemini обычно старается сохранить исходное соотношение сторон, но это не абсолютная гарантия. Если кадр критичен, пишите это прямо: "Обнови входное изображение, но не меняй исходный aspect ratio." А в API дополнительно фиксируйте это через imageConfig.aspectRatio и imageConfig.imageSize.

Хороший image-to-image промпт почти всегда делает три вещи одновременно: называет изменение, фиксирует защищаемые части и описывает, какая визуальная логика должна остаться прежней.

Устранение проблем: почему правка в Gemini ломается и как это чинить

Дерево решений для устранения проблем при редактировании изображений в Gemini: неверная поверхность, потеря консистентности, смена aspect ratio и сбои с повторными запросами.
Дерево решений для устранения проблем при редактировании изображений в Gemini: неверная поверхность, потеря консистентности, смена aspect ratio и сбои с повторными запросами.

Первая типичная причина - не та поверхность или устаревшее понимание модели. Если вы смотрите на tutorial эпохи 2.5 и уже не узнаете названия, проблема может быть не в вашем промпте. На март 2026 года основная линия - это Nano Banana 2, а не старая preview-линия.

Вторая причина - слишком общий запрос вместо локальной правки. Формулировка вроде "сделай эту картинку лучше" оставляет модели слишком много свободы. Гораздо надежнее: "измени только стену на темно-зеленую, мебель, свет и угол камеры не меняй".

Третья причина - дрейф консистентности после многих итераций. Официальный prompt-guide сам рекомендует в такой ситуации начать новый разговор с более полной исходной инструкцией, а не бесконечно спасать уже уехавший контекст.

Четвертая причина - неожиданное изменение aspect ratio или кадра. В приложении это ощущается как странный кроп или перестроение композиции. В API это чинится проще: задайте ratio и размер явно.

Пятая причина - операционная нестабильность. Сообщество по старым preview-линиям уже показывало, что image generation остается API-поверхностью, а не идеально детерминированной функцией. Если это идет в прод, закладывайте retry, timeout и логирование заранее.

Шестая причина - путаница между trigger, policy и реальной недоступностью функции. Иногда пользователь думает, что "Gemini не умеет это делать", хотя причина в политике, регионе или неверном входе в фичу. Если приложение отказало в безобидной правке, сначала проверьте доступность функции и сам сценарий вызова.

FAQ

Gemini действительно умеет image-to-image, а не только text-to-image?
Да. Текущие docs прямо поддерживают text-and-image-to-image, а страница Gemini Apps также позволяет редактировать загруженные изображения и собирать новую сцену из нескольких картинок.

Какая модель сейчас лучше всего подходит для image editing в Gemini?
Для большинства пользователей - gemini-3.1-flash-image-preview. Это текущая линия Nano Banana 2 и самый логичный баланс между скоростью, стоимостью и удобством многошаговой работы.

Когда стоит включать Nano Banana Pro?
Когда в изображении критичен текст, когда актив дорогой или когда цена неудачного результата выше, чем разница в стоимости модели.

Gemini image editing бесплатен?
Зависит от поверхности. У приложения Gemini свои правила. Для активных image-моделей Gemini API официальная pricing страница публичного free tier не показывает.

Можно ли править одну и ту же картинку в несколько шагов?
Да. Более того, официальный multi-turn подход как раз и рекомендуется для последовательного refinement.

Какая ошибка в промптах встречается чаще всего?
Слишком общие формулировки. У хорошего промпта всегда есть и зона изменения, и зона сохранения.

Итог

Лучшая текущая формулировка ответа - не просто "Gemini умеет редактировать изображения". Полезный ответ звучит так: какой путь в Gemini лучше всего подходит именно под вашу задачу.

Если нужен быстрый no-code сценарий, идите в Gemini app. Если нужен повторяемый product workflow, идите в Gemini API. В большинстве случаев начинайте с Nano Banana 2, переходите на Nano Banana Pro только тогда, когда это оправдано, а gemini-2.5-flash-image воспринимайте как дешевую legacy-линию, а не как главную рекомендацию для нового гайда 2026 года.

Nano Banana Pro

4K Изображение-80%

Google Gemini 3 Pro Image · AI Генерация

Обслужено 100K+ разработчиков
$0.24/изобр.
$0.05/изобр.
Спецпредложение·Стабильный·Alipay/WeChat
Gemini 3
Нативная модель
Прямой доступ
20мс задержка
4K Ultra HD
2048px
30сек генерация
Сверхбыстро
|@laozhang_cn|$0.05 бонус

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+