AIFreeAPI Logo

Бесплатная квота Gemini API в 2026 году: что еще работает и где реальные лимиты

A
17 min readAPI Guides

В марте 2026 года у Gemini Developer API все еще есть бесплатная квота. Но публичная страница rate limits больше не дает полноценную гарантированную матрицу бесплатных лимитов. Важно отделять стабильные публичные факты от текущих активных лимитов, которые теперь надо проверять в AI Studio.

Гид по бесплатной квоте Gemini API в 2026 году: публичные факты, лимиты AI Studio и 429

Короткий ответ на 18 марта 2026 года: бесплатная квота у Gemini Developer API все еще есть. Google по-прежнему пишет в официальном quickstart для Gemini API, что API key можно создать бесплатно. На официальной странице pricing Gemini 2.5 Pro, Gemini 2.5 Flash и Gemini 2.5 Flash-Lite по-прежнему отмечены как free of charge для стандартного использования. Проблема не в том, что бесплатный вход исчез, а в том, что публичная документация перестала быть полной и удобной заменой актуальной таблицы лимитов для каждого проекта.

Сейчас безопаснее мыслить в два слоя. Первый слой — это то, что Google все еще подтверждает публично: как считаются лимиты, когда обновляется RPD, как устроены tier, какие модели остаются бесплатными на стандартном уровне, какие юридические ограничения действуют для unpaid usage. Второй слой — это то, что уже нельзя уверенно брать из старых статей и скриншотов: точный текущий потолок для вашего проекта и конкретной модели. Именно поэтому новая официальная страница rate limits отправляет разработчика в AI Studio смотреть active limits, а не публикует одну “вечную” бесплатную матрицу.

Краткое содержание

Бесплатная квота Gemini API в марте 2026 года реальна, но трактовать ее как фиксированный публичный контракт уже нельзя. Публичные документы по-прежнему надежны для правил и механики: лимиты считаются по project, а не по API key, RPD сбрасывается в полночь по Pacific Time, у paid tier есть четкие пороги перехода, а 2.5 Pro / Flash / Flash-Lite все еще видны как бесплатные для standard usage. Но точный живой предел именно вашего проекта все больше относится к AI Studio, а не к одной общей публичной таблице.

Именно здесь большинство рейтинговых статей начинают вводить в заблуждение. Они дают конкретные RPM и RPD как будто это сегодняшняя универсальная истина, хотя текущая публичная страница rate limits уже прямо говорит: active limits нужно смотреть в AI Studio, а actual capacity may vary. Поэтому лучший практический ответ на запрос о “бесплатной квоте Gemini API в 2026” звучит так: да, бесплатный путь все еще есть, но пользоваться им надо как входом для прототипов, а не как заменой стабильной продовой емкости.

ВопросБезопасный ответ на 18.03.2026
У Gemini API еще есть бесплатная квота?Да. Бесплатное создание API key и бесплатное standard usage для ключевых 2.5 моделей все еще видны публично.
Где смотреть точные активные лимиты?В AI Studio, а не только в старых статьях и таблицах.
Что сегодня подтверждено публично?Механика RPM/TPM/RPD, project-level enforcement, сброс в полночь PT, пороги tier, pricing state, условия unpaid usage.
Можно ли считать free tier продовой гарантией?Нет. Это хороший вход для экспериментов, но не эквивалент оплаченной емкости.
С какой модели лучше начать?Для большинства — Gemini 2.5 Flash; для простых высокочастотных задач — Flash-Lite.
Когда пора включать billing?Когда нужны стабильность, приватность, европейский запуск или предсказуемый темп разработки.

Если после этого вопроса вы переходите от “можно ли стартовать бесплатно” к “во сколько обойдется нормальная эксплуатация”, полезно посмотреть наш сравнительный гайд Gemini vs OpenAI vs Claude. Для сравнения с текущей ситуацией у OpenAI есть и русская статья про OpenAI API free trial.

Что сегодня на самом деле означает “бесплатная квота Gemini API”

В 2026 году эту тему опасно понимать по старой привычке. Раньше разработчики часто воспринимали бесплатную квоту как относительно стабильную опубликованную таблицу: вот RPM, вот TPM, вот RPD, достаточно встроить локальный rate limiter — и все будет работать. Сейчас такой модели уже недостаточно. Бесплатный доступ как продуктовый факт остался, но публичная прозрачность точных лимитов стала другой.

Официальный quickstart подтверждает бесплатный вход. Официальная pricing page подтверждает, что у нескольких ключевых 2.5 моделей стандартное использование по-прежнему бесплатное. Но официальная rate limits page уже фокусируется на механике и tier, а за конкретными активными лимитами отправляет в AI Studio. Эта разница и есть главная мысль всей статьи: нельзя больше безоговорочно ставить знак равенства между старой публичной таблицей и сегодняшней реальной бесплатной емкостью вашего проекта.

Это особенно важно после изменений конца 2025 года. В декабре 2025 года многие разработчики заметили резкое ухудшение бесплатного опыта: прежние ожидания по RPD и RPM перестали совпадать с тем, что они видели в реальной работе. Сообщество на Google AI Developers Forum обсуждало не только конкретные цифры, но и сам факт того, что бесплатный tier стал восприниматься как best-effort, а не как нечто, на чем безопасно строить пользовательский сервис.

Для практики это означает следующее. Free tier отлично подходит для обучения, прототипа, тестового MVP, внутреннего proof of concept, разовой проверки идеи. Но как только вы начинаете считать бесплатную квоту основой пользовательского продукта, вы переносите на бесплатный слой ожидания, которые сама документация уже не поддерживает в прежнем виде.

Что Google по-прежнему подтверждает публично

Инфографика, разделяющая публично подтвержденные факты Gemini API и лимиты, которые надо проверять в AI Studio
Инфографика, разделяющая публично подтвержденные факты Gemini API и лимиты, которые надо проверять в AI Studio

Ниже — только те вещи, которые все еще опираются на актуальные публичные страницы Google. Это не “все, что вам хотелось бы знать”, но именно это дает надежный базовый слой для принятия решений.

ТемаЧто сегодня подтверждается публичноПочему это важно
Бесплатный стартAPI key можно создать бесплатноЗначит, бесплатный вход остается официальной частью продукта
Единица лимитаЛимиты применяются на уровне project, а не API keyНесколько ключей в одном project не увеличивают квоту
Сброс RPDRPD сбрасывается в полночь Pacific TimeЭто объясняет суточный ритм восстановления квоты
Основные измеренияПублично описаны RPM, TPM и RPDБез этого невозможно правильно диагностировать 429
Где смотреть активные лимитыGoogle направляет в AI StudioЗначит, живая картина лимитов зависит от состояния проекта
Tier 1Включение billing переводит проект в Tier 1Это первый шаг, когда free tier перестает хватать
Tier 2$100 суммарных платежей и не менее 3 дней после первого успешного платежаВажно для планирования роста
Tier 3$1000 суммарных платежей и не менее 30 дней после первого успешного платежаВажно для высоких нагрузок
Бесплатный pricing stateGemini 2.5 Pro, Flash и Flash-Lite остаются бесплатными для standard usageБесплатный статус не отменен
Search groundingДля Flash и Flash-Lite публично виден бесплатный shared limit 500 RPDОдин из немногих точных бесплатных лимитов, которые все еще видны
Long contextНа странице Gemini 2.5 Pro указаны 1,048,576 input tokens и 65,536 output tokensЭто критично для больших документов и кодовых баз
Условия unpaid usageВвод и вывод unpaid services могут использоваться для улучшения продуктов GoogleБесплатный слой не подходит для чувствительных данных
EEA / Швейцария / UKДля клиентских приложений в этих регионах требуются paid servicesБесплатный путь не годится как путь к запуску там

Эта таблица полезна еще и тем, что помогает отбросить шум. Если вы не видите некий тезис на текущих публичных страницах, его нельзя считать устойчивым фактом только потому, что он встречается в блогах или старых постах на форумах.

Как проверить реальные активные лимиты в AI Studio

Самый практический совет по этой теме предельно прост: сразу после создания API key откройте в AI Studio лимиты именно того проекта, который вы будете использовать в коде. Не просто “какого-то проекта под этим аккаунтом”, а того самого, где живут ваши реальные запросы.

Рабочая последовательность выглядит так:

  1. Создаете API key в AI Studio.
  2. Проверяете, к какому project он привязан.
  3. Открываете rate limit view в AI Studio.
  4. Смотрите именно нужные model names.
  5. Записываете RPM, TPM, RPD и статус модели: stable, preview или experimental.

Почему это важно? Потому что два самых распространенных заблуждения звучат так. Первое: “если у меня несколько API key, то и бесплатные лимиты должны быть разными”. Нет, если это один и тот же project. Второе: “preview ведет себя почти так же, как stable”. Тоже нет. Публичная документация прямо предупреждает, что preview и experimental модели могут иметь более жесткие ограничения.

Еще одна полезная практика — сохранять скриншот лимитов до включения billing и после. Это дает не теоретическое, а фактическое сравнение. Во многих командах споры о том, “Google что-то тихо урезал” или “мы сами неправильно поняли лимит”, на самом деле прекращаются после первого же сравнения скриншотов одного и того же проекта в двух состояниях.

Какую модель выбрать на бесплатном этапе: Flash, Flash-Lite или Pro

Сравнение трех сценариев: когда на бесплатном этапе лучше брать Flash-Lite, Flash или Pro
Сравнение трех сценариев: когда на бесплатном этапе лучше брать Flash-Lite, Flash или Pro

На бесплатном этапе стоит выбирать не самую престижную модель, а ту, которая лучше решает ваш текущий узкий вопрос. Для большинства разработчиков этот вопрос звучит так: “смогу ли я достаточно быстро и достаточно много раз прогнать идею, чтобы понять, стоит ли вообще развивать продукт дальше?”

МодельКогда подходит лучше всегоОсновное преимуществоГлавный компромисс
Gemini 2.5 Flash-LiteИзвлечение, классификация, роутинг, высокочастотные простые вызовыСамая экономичная и быстраяНе лучший выбор для сложного reasoning
Gemini 2.5 FlashПрототипы, чат, демо, универсальные сценарииЛучший баланс качества и практичностиЖивые лимиты надо уточнять в AI Studio
Gemini 2.5 ProБольшие документы, сложный код, тяжелый reasoningСамая сильная reasoning-модель из трехНа free tier ее легче “упереть” в практические ограничения

Именно поэтому Flash обычно остается лучшей точкой входа. Она и достаточно сильна, и достаточно практична. Flash-Lite полезна там, где главное — количество итераций и низкая стоимость ошибки. Pro имеет смысл, когда задача по-настоящему упирается в сложность рассуждения или в длинный контекст, а не просто “хочется самую умную модель”.

Почему на бесплатном tier вы все равно ловите 429

Схема, разделяющая 429 по трем основным причинам: RPM, TPM и RPD
Схема, разделяющая 429 по трем основным причинам: RPM, TPM и RPD

Ошибка 429 в Gemini API — это не диагноз, а общий симптом. Важно понять, что именно закончилось: запросы в минуту, токены в минуту или дневная квота. И еще важнее — понять, поможет ли в вашем случае retry вообще.

СимптомЧто чаще всего произошлоЧто делать
Серия вызовов падает почти сразуRPM exhaustedОграничить burst, добавить очередь и backoff
Большие prompt падают даже при низком request rateTPM exhaustedРезать контекст, дробить запросы, кешировать
Утром работает, вечером больше нетRPD exhaustedЖдать сброса по PT или включать billing
Несколько сервисов падают одновременноОбщий project bucketРазносить нагрузки по проектам
Preview падает чаще, чем ожидалосьБолее жесткий preview limitПо возможности уходить на stable
Billing включен, а ощущение все равно плохоеНе тот project, неверное ожидание tier, живая емкость нижеЕще раз проверить AI Studio

Главная мысль здесь простая: не каждая 429 лечится более умным retry. Для RPM и некоторых transient случаев retry нужен. Для исчерпанной дневной квоты — нет. Если вы уже выжали RPD, то вместо улучшения backoff вы просто тратите инженерное время на обход очевидного решения: платный tier или снижение нагрузки.

Минимальная retry-обертка может выглядеть так:

python
import asyncio import random from google import genai client = genai.Client(api_key="YOUR_GEMINI_API_KEY") async def generate_with_retry(prompt: str, retries: int = 5): for attempt in range(retries): try: return client.models.generate_content( model="gemini-2.5-flash", contents=prompt, ) except Exception as exc: if "429" not in str(exc) or attempt == retries - 1: raise delay = min(2 ** attempt + random.random(), 30) await asyncio.sleep(delay)

Но такую обертку нужно воспринимать трезво. Она хороша для коллизий по RPM, а не как универсальная стратегия “удержать бесплатный tier любой ценой”. Если нужен более глубокий разбор механики, можно использовать English reference: Gemini API rate limit explained.

Когда бесплатный слой уже перестает быть разумным

Бесплатная квота максимально полезна там, где цена ошибки низкая. Когда цена ошибки становится выше, чем цена billing, бесплатный режим начинает стоить дороже, чем кажется.

СценарийБесплатный tier еще уместен?Почему
Учеба, PoC, хакатонДаЭто его естественное применение
Небольшой внутренний инструментИногдаЕсли допустимы паузы и колебания
Публичный продукт для пользователейНетНужна предсказуемая емкость
Работа с чувствительными даннымиНетНе подходит из-за условий unpaid usage
Запуск для пользователей в EEA / Швейцарии / UKНетТребуются paid services
Уже написано много обходной логикиОбычно нетВремя команды становится дороже счета

Хорошее практическое правило такое: как только вам становятся важны стабильность, приватность, европейская совместимость или скорость командной разработки, free tier надо переставать считать нормальной производственной опорой.

Как бесплатно создать key и отправить первый запрос

Вход в Gemini API по-прежнему прост. Нужно создать key в Google AI Studio, положить его в GEMINI_API_KEY, сделать первый запрос через Flash, а затем вернуться в AI Studio и записать реальные active limits проекта.

Python:

python
from google import genai import os client = genai.Client(api_key=os.environ["GEMINI_API_KEY"]) response = client.models.generate_content( model="gemini-2.5-flash", contents="Объясни простыми словами, что такое векторная база данных.", ) print(response.text)

Node.js:

ts
import { GoogleGenAI } from "@google/genai"; const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY }); const response = await ai.models.generateContent({ model: "gemini-2.5-flash", contents: "Объясни простыми словами, что такое векторная база данных.", }); console.log(response.text);

Самое важное тут не код, а дисциплина. Не встраивайте key во фронтенд. И если вы тестируете Pro или preview-модель, не доверяйте старой статье вместо AI Studio.

FAQ

Нужна ли банковская карта, чтобы создать Gemini API key?

Нет. Quickstart по-прежнему описывает бесплатный старт.

Использует ли Google prompts и responses из бесплатного tier для улучшения своих продуктов?

Да, unpaid usage это допускает. Поэтому бесплатный слой не стоит использовать для конфиденциальных или чувствительных данных.

Можно ли запускать приложение для пользователей из EEA, Швейцарии или UK на бесплатном tier?

Нет. Для таких клиентских приложений нужны paid services.

Можно ли в 2026 году доверять старым таблицам 5 RPM, 10 RPM, 15 RPM как текущим значениям?

Только как исторической подсказке. Для текущего проекта надо смотреть AI Studio.

С какой модели лучше начинать?

Обычно с Flash. Если нужен максимум простых повторяемых вызовов — с Flash-Lite. Если задача реально упирается в reasoning и длинный контекст — с Pro.

Включение billing решает проблему сразу?

Оно решает главную структурную проблему, но не отменяет необходимости проверить actual state проекта и модели в AI Studio.

Nano Banana Pro

4K Изображение-80%

Google Gemini 3 Pro Image · AI Генерация

Обслужено 100K+ разработчиков
$0.24/изобр.
$0.05/изобр.
Спецпредложение·Стабильный·Alipay/WeChat
Gemini 3
Нативная модель
Прямой доступ
20мс задержка
4K Ultra HD
2048px
30сек генерация
Сверхбыстро
|@laozhang_cn|$0.05 бонус

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+