Gemini Image Generation REST API: актуальный cURL-гайд

AI Tools Expert

•27 мар. 2026 г.•10 min read•Генерация изображений с ИИ

По состоянию на 27 марта 2026 года самый безопасный default для Gemini image generation через raw REST — native generateContent с `gemini-3.1-flash-image-preview`, а не попытка начать с OpenAI-compatible image endpoint.

Гайд по Gemini image generation REST API, который показывает native route generateContent, выбор текущей модели и cURL workflow.

По состоянию на 27 марта 2026 года самый безопасный default для Gemini image generation через raw REST — POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent. Начинайте с этой точки, добавляйте responseModalities и imageConfig, сохраняйте возвращенный inlineData, и только потом решайте, нужен ли вам OpenAI-compatible слой, прокси или другой model branch.

Это лучший current default не потому, что compatibility route бесполезен, а потому, что Google по-прежнему разносит ответ по разным страницам. Image generation docs показывают native path, API reference фиксирует generateContent и imageConfig, а OpenAI compatibility docs объясняют отдельный совместимый endpoint family. Если читать эти страницы подряд, легко решить, что они одинаково подходят как первый шаг. Для нового raw REST workflow это не так.

Второй caveat надо назвать сразу. Текущие Gemini 3 image models остаются preview, а naming и рекомендуемые пути за последние месяцы менялись достаточно быстро, чтобы старые snippets продолжали путать разработчиков. В официальном OpenAI-compatible image example до сих пор фигурирует gemini-2.5-flash-image, тогда как в native image docs в центре уже стоят gemini-3.1-flash-image-preview и gemini-3-pro-image-preview. Если не разделить эти два слоя заранее, вы рискуете дебажить не ту часть системы.

Краткое содержание

Ситуация	Первый path	С какой model лучше начать	Почему это current default	Главный caveat
Новый raw REST integration	`POST /v1beta/models/gemini-3.1-flash-image-preview:generateContent`	`gemini-3.1-flash-image-preview`	Это самый прямой путь к текущему native Gemini image contract	Текущие Gemini 3 image models все еще preview
Нужны text-heavy posters или более дорогой visual output	Та же native `generateContent` route	`gemini-3-pro-image-preview`	Лучше подходит для premium image branch	Дороже и тоже preview
Нужно сохранить существующий OpenAI-style client	`POST /v1beta/openai/images/generations`	Смотрите актуальную совместимую surface	Минимальные изменения на стороне клиента	Это отдельный contract, а не default для новых Gemini image REST calls
AI Studio работает, а cURL нет	Обычно проблема не только в URL	Проверьте тот же project и model	Billing, tier и access часто важнее host	У Google нет одной статической public limit-table для всех

Если вам важен именно split между host и path, без полного workflow, начните с Base URL для Gemini image generation API. Если нужны примеры SDK вместе с cURL, дальше логично идти в примеры кода Gemini image generation.

Сначала используйте native Gemini REST route

Маршрутная схема, показывающая native Gemini generateContent stack как default REST path, а выбор модели и compatibility context как второстепенные элементы.

Для нового REST workflow полезно держать одну простую мысль: Gemini image generation — это обычный native Gemini API request, который возвращает image data, а не отдельный загадочный image host. Текущий API reference по-прежнему определяет contract внутри generateContent, и image-generation guide учит той же самой method family.

Именно это важно raw REST пользователю, потому что в первой успешной request вы обычно хотите доказать сразу три вещи:

какой host и model path сейчас правильные
где лежат image-specific controls
как выглядит реальный response без SDK abstractions

Native route дает все три. Host понятен, docs свежие, а imageConfig живет в том же request-body без совместимого translation layer. Для cURL-debugging, самописных wrappers и unsupported languages это самый ясный default.

Практический starting model — gemini-3.1-flash-image-preview. Google по-прежнему показывает его в models как текущую efficient image line, а gemini-3-pro-image-preview оставляет для более дорогого premium branch. Legacy lane gemini-2.5-flash-image еще жива, но Google в deprecations уже ставит ей shutdown date 2 октября 2026 года и рекомендует вместо нее gemini-3.1-flash-image-preview.

Скопируйте одну working cURL request

Не пытайтесь сразу построить production pipeline. Сначала докажите host, model и image output. Минимальная request должна быть скучной: один prompt, одна текущая model, одно image output, явный aspectRatio и imageSize.

bash
curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {
          "text": "Create a clean 16:9 product image of a matte black travel mug on a light concrete surface with soft studio lighting and premium ecommerce styling."
        }
      ]
    }],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "2K"
      }
    }
  }'

Эта request ценна тем, что одновременно подтверждает native path, current model и image controls. По текущему API reference, imageConfig по-прежнему поддерживает aspectRatio и imageSize, а доступные size values — 512, 1K, 2K и 4K.

Если ваша задача — posters, diagrams или text-heavy visuals, где ошибка дорогая, меняйте только model path на gemini-3-pro-image-preview. Если следующий вопрос уже про cost, а не про REST shape, логичнее открыть цены Gemini image generation API.

Сохраните картинку из REST response

Диаграмма потока, показывающая Gemini image REST request, возвращаемые inline image data и шаг decode-to-file.

Большинство REST-страниц останавливаются на моменте, когда request уже ушла. Но raw REST чаще ломается на следующем шаге: native Gemini response не отдает вам готовый file path, а возвращает image bytes внутри inlineData в JSON.

Именно поэтому многие думают, что “API вернул только JSON и не нарисовал картинку”. Обычно проблема не в том, что model не сработала. Проблема в том, что вы еще не сделали decode и save step.

На native route безопасный порядок такой:

прочитать candidates[0].content.parts
найти part с inlineData
вытащить .inlineData.data
сделать base64 decode и записать файл

Один из простых shell-вариантов:

bash
curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {
          "text": "Create a square studio photo of a red ceramic teacup on a white background."
        }
      ]
    }],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "1:1",
        "imageSize": "1K"
      }
    }
  }' \
| jq -r '.candidates[0].content.parts[] | select(.inlineData) | .inlineData.data' \
| base64 --decode > gemini-image.png

На macOS вместо base64 --decode может понадобиться base64 -D. Суть не в конкретном shell flag, а в том, что успешный native response все еще требует явного decode-to-file шага. Именно это отличает “получил JSON” от “получил готовый PNG на диске”.

Когда OpenAI-compatible image path действительно уместен

OpenAI-compatible route реальна, и у нее есть нормальный use case. Google в текущих compatibility docs по-прежнему показывает:

text
https://generativelanguage.googleapis.com/v1beta/openai/

и image endpoint:

text
/v1beta/openai/images/generations

Если ваш project уже завязан на OpenAI-style client surface и business goal звучит как “подключить Gemini с минимальным rewrite”, эта route имеет смысл. Она позволяет быстро проверить совместимость без полной переделки client-side logic.

Но это не лучший default под запрос “gemini image generation rest api”. Здесь читателю нужен текущий native Gemini contract, а не самый дешевый migration layer для OpenAI tooling. Это разные задачи.

Разница хорошо видна и в docs, и в community friction. На 27 марта 2026 года официальный совместимый image example все еще использует gemini-2.5-flash-image, тогда как current native docs уже учат Gemini 3 image line. В forum threads видно и другое: как только разработчики пытаются передать native image expectations через OpenAI-compatible route, появляются 404 или invalid-payload errors.

Практическое правило поэтому короткое:

новый проект, cURL, raw REST, current docs: native Gemini first
уже существующий OpenAI-style stack: compatibility route по необходимости
не мешайте эти два contract в одной первой debug-сессии

Какие model, pricing и status caveats реально меняют решение

Даже корректный REST syntax не гарантирует, что вы выбрали правильную implementation route. На решение влияют model lane, preview status, billing и live limits.

Model lane	Текущая роль	Когда выбирать	Текущий caveat
`gemini-3.1-flash-image-preview`	Default для новых raw REST image calls	Большинство current image generation и editing сценариев	Все еще preview
`gemini-3-pro-image-preview`	Более дорогой premium branch	Когда важны layout, text rendering и high-stakes visuals	Дороже и тоже preview
`gemini-2.5-flash-image`	Legacy lane, которая все еще мелькает в compatibility examples	Только для старых examples или deliberate migration context	Google уже поставил shutdown date 2 октября 2026 года

Billing и limits тоже нельзя игнорировать. Google на billing page по-прежнему пишет, что новые accounts стартуют с Free Tier и что только certain models доступны в этих рамках. А rate-limits page прямо говорит: limits зависят от usage tier и смотрятся в AI Studio, а не угадываются по чужому tutorial.

Именно поэтому эта страница не обещает вам “полностью бесплатный Gemini image REST API”. Current surface сложнее. Request может быть написана правильно, но проблема все равно окажется в model access, project tier или preview-limit policy.

Troubleshooting: сначала поймите, какой слой реально сломан

Карта troubleshooting, показывающая, как разделять 404, invalid payload, project mismatch и пропущенный image decode step в Gemini image REST workflow.

У этого keyword есть явный troubleshooting-intent. Очень часто разработчик ищет его только после первого провала, а не заранее. Хорошая новость в том, что самые частые failures повторяются из раза в раз.

Что вы видите	Что это обычно значит	Что делать дальше
404 на `/v1beta/openai/images/generations`	Вы попали на compatibility route, где current model или request shape не совпадает с surface endpoint	Повторите ту же задачу на native Gemini `generateContent`
`Unknown name "generationConfig"` или `generation_config`	Вы отправили native Gemini fields в OpenAI-compatible contract	Либо полностью переходите на native route, либо полностью переписывайте request под compatibility schema
`model not found` у старой image model	Вы скопировали устаревший model ID из старого snippet или forum thread	Сначала перепроверьте current models и deprecations
AI Studio работает, а cURL нет	API key, billing или model access в project не совпадают с browser-context	Сверьте тот же project, key и model
JSON есть, а картинки нет	Request отработала, но вы не сделали decode `inlineData`	Достаньте `.inlineData.data` и сохраните файл после base64 decode

Главный time saver здесь один: меняйте по одному слою за раз. Не переключайте одновременно host, model, prompt и save logic. Сначала докажите native request, потом save step, потом уже сравнивайте quotas, wrappers и compatibility behavior.

Если ваш problem-space уже перешел из endpoint-choice в 429, 400 или 500, следующая полезная страница — Gemini API error fix 2026: 429, 400, 500.

FAQ

Неправильный ли `/v1beta/openai/images/generations` сам по себе?

Нет. Эта route существует и подходит, когда у вас уже есть OpenAI-style client surface и вы сознательно хотите сохранить совместимую схему вызова. Но для нового raw REST workflow это не лучший первый шаг. В большинстве случаев быстрее сначала доказать native generateContent, а уже потом сравнивать compatibility behavior. Так вы сразу поймете, проблема в endpoint family, в payload shape или уже в migration layer поверх базового Gemini contract.

Почему API возвращает только JSON, а не готовый файл?

Потому что на native route успешный ответ и должен возвращать image bytes внутри JSON, обычно в inlineData. Это не признак ошибки. Это признак того, что последний шаг еще не выполнен: нужно извлечь .inlineData.data, сделать base64 decode и записать картинку в файл.

С какой image model сейчас реально начинать?

Практический default сейчас — gemini-3.1-flash-image-preview, потому что именно на нее указывает текущая native documentation как на рабочую эффективную image lane. Если вам нужны posters, diagrams или text-heavy visuals, где цена ошибки выше, имеет смысл смотреть на gemini-3-pro-image-preview. Старый gemini-2.5-flash-image еще встречается в compatibility examples, но Google уже поставил ему shutdown date: 2 октября 2026 года.

Что проверять первым, если AI Studio работает, а cURL нет?

Сначала проверьте не URL, а context. Должны совпадать project, API key и model access. Затем уже смотрите billing, tier и live limits. Очень многие проблемы, которые выглядят как REST bug, на деле оказываются несоответствием project state между browser test и raw API call. Если один и тот же prompt работает в UI, но не воспроизводится через cURL, почти всегда полезнее сравнить project binding и access policy, чем сразу переписывать весь request body.

Итог

Для текущего raw HTTP image generation начинайте с native Gemini Developer API:

text
POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent

Используйте responseModalities и imageConfig, сохраните inlineData, и только потом переходите к /v1beta/openai/images/generations, если ваш stack действительно должен сохранить OpenAI-compatible semantics.

Это и есть самый безопасный current default: он совпадает с актуальными native Gemini docs, использует текущую image-model family и убирает главное заблуждение вокруг этого keyword — попытку считать совместимый OpenAI image path universal starting point для всех Gemini image REST scenarios.

Проще говоря: сначала докажите native route, потом сохранение файла, и только после этого принимайте решение о compatibility layer. Такой порядок почти всегда сокращает время дебага заметно.

Nano Banana Pro

4K Изображение-80%

Google Gemini 3 Pro Image · AI Генерация

Обслужено 100K+ разработчиков

$0.24/изобр.

$0.05/изобр.

Спецпредложение·Стабильный·Alipay/WeChat

Gemini 3

Нативная модель

Прямой доступ

20мс задержка

4K Ultra HD

2048px

30сек генерация

Сверхбыстро

|@laozhang_cn|$0.05 бонус

200+ AI Models API

Jan 2026

GPT-5.2Claude 4.5Gemini 3Grok 4+195

Image

80% OFF

gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video