¿Gemini 2.5 Flash-Lite Preview se descontinúa? El endpoint que realmente se apaga el 31 de marzo

AI Free API Team

•21 mar 2026•Actualizado 22 mar 2026•13 min read•Migración de API

La documentación de Gemini API de Google lista `gemini-2.5-flash-lite-preview-09-2025` para apagado el 31 de marzo de 2026 y recomienda `gemini-3.1-flash-lite-preview`. Eso no significa que `gemini-2.5-flash-lite` estable ya haya desaparecido. Esta guía de troubleshooting explica el split real, el salto de precio y qué mover primero.

Guía de cierre de Gemini 2.5 Flash-Lite Preview con endpoint deprecated, modelo estable y ruta de reemplazo

A fecha de 22 de marzo de 2026, gemini-2.5-flash-lite-preview-09-2025 esta en una ruta publica de cierre, pero eso no significa que el estable gemini-2.5-flash-lite haya desaparecido hoy. Lo primero es comprobar que endpoint exacto esta llamando tu codigo.

Esa distincion lo es todo. Google pone al preview 09-2025 fecha de cierre el 31 de marzo de 2026 y manda a gemini-3.1-flash-lite-preview, mientras la lane estable gemini-2.5-flash-lite tiene un horizonte posterior, el 22 de julio de 2026.

Resumen rápido

gemini-2.5-flash-lite-preview-09-2025 es el endpoint que entra en cierre el 31 de marzo de 2026.
gemini-2.5-flash-lite estable es aparte y, por ahora, Google le marca cierre el 22 de julio de 2026.
el sucesor oficial es gemini-3.1-flash-lite-preview, pero cuesta bastante más, así que no lo trates como un simple rename gratis.

Si solo necesitas la decisión práctica, usa esta tabla y luego salta a la sección que coincide con tu caso.

Lo que usas hoy	Estado actual en docs públicas	Fecha clave	Mejor siguiente paso
`gemini-2.5-flash-lite-preview-09-2025`	Preview deprecated	31 de marzo de 2026	Planifica migración ya; el reemplazo de Google es `gemini-3.1-flash-lite-preview`
`gemini-2.5-flash-lite`	Stable	22 de julio de 2026	No hace falta rename de emergencia hoy; benchmarkea y migra con control de coste
`gemini-3.1-flash-lite-preview`	Sucesor preview actual	Sin fecha de cierre anunciada en docs de Gemini API	Úsalo si quieres seguir la ruta sucesora documentada
La página de Vertex AI todavía muestra la versión preview	Ambigüedad por superficie	Revisa tu superficie y comportamiento real del endpoint	Confirma antes de renombrar en masa, pero no ignores la señal de deprecación de Gemini API
`gemini-flash-lite-latest` u otros aliases ocultos en wrappers	Riesgo de alias	Depende de a qué resuelva hoy el alias	Inspecciona el model string resuelto antes de asumir que estás a salvo

La idea clave es que aquí hablamos de un endpoint, no de un nombre de familia. Si tu código, herramienta de prompts o configuración guardada solo dice "Flash-Lite", todavía te falta el dato que define si esto es urgente o no.

¿De verdad están descontinuando Gemini 2.5 Flash-Lite Preview?

Cronología con el preview Flash-Lite antiguo, el preview 09-2025 con cierre el 31 de marzo de 2026 y la línea estable separada de 2.5 Flash-Lite.

Para Gemini API, la respuesta oficial más limpia es sí: gemini-2.5-flash-lite-preview-09-2025 está programado para apagado el 31 de marzo de 2026. Google lo publica de forma explícita en la página de deprecations de Gemini, donde también aparece gemini-3.1-flash-lite-preview como reemplazo recomendado.

La razón por la que mucha gente sigue dudando es que la documentación pública de Google no lo cuenta como una historia única y lineal. El changelog deja el ciclo de vida en piezas:

gemini-2.5-flash-lite-preview-06-17 apareció primero en junio de 2025
gemini-2.5-flash-lite estable llegó en julio de 2025
gemini-2.5-flash-lite-preview-09-2025 llegó después, en septiembre de 2025
en marzo de 2026, Google anunció que el preview 09-2025 se apaga el 31 de marzo

Eso implica que "Gemini 2.5 Flash-Lite Preview" puede referirse a más de un model ID histórico. Si alguien recuerda un alias viejo, un selector de AI Studio o un post comunitario de otro mes, puede estar recordando la familia correcta pero el endpoint equivocado. Por eso muchos usuarios siguen confundidos incluso después de abrir docs oficiales.

La otra fuente de ruido es el alcance por producto. Las docs públicas de Gemini API sí son claras sobre el apagado del preview 09-2025 el 31 de marzo de 2026. Pero la página de Flash-Lite en Vertex AI todavía muestra un bloque de versión preview para gemini-2.5-flash-lite-preview-09-2025 junto a la GA gemini-2.5-flash-lite. Por eso la frase segura no es "Google eliminó Flash-Lite Preview en todos lados". La frase segura es:

Las docs de ciclo de vida de Gemini API listan gemini-2.5-flash-lite-preview-09-2025 para cierre el 31 de marzo de 2026. gemini-2.5-flash-lite estable es separado. Las docs públicas de Vertex aún muestran la versión preview, así que debes verificar tu superficie real antes de cambiar el routing de producción.

No es una respuesta tan cómoda como un sí/no absoluto, pero es la que sostienen las fuentes públicas.

La parte confusa: endpoint preview, modelo estable y previews antiguos son cosas distintas

Panel que separa el preview antiguo 06-17, el preview 09-2025 deprecated y el endpoint estable gemini-2.5-flash-lite que sigue activo.

La mayoría de páginas flojas para esta keyword fallan porque responden por nombre de familia y se saltan el split por endpoint. Eso produce consejos dramáticos pero poco útiles operativamente. Aquí hay que separar tres cosas.

Primero, está gemini-2.5-flash-lite estable. La página oficial del modelo lo describe como la opción multimodal eficiente de la familia 2.5 y lo marca como Stable. Esa misma página marca gemini-2.5-flash-lite-preview-09-2025 como Deprecated. Solo ese bloque de versiones ya desmonta la lectura de pánico de que "Flash-Lite Preview discontinued" signifique "Flash-Lite ya murió".

Segundo, está el endpoint preview 09-2025 deprecated. Ese model string es el que importa para la fecha del 31 de marzo de 2026. Si aparece tal cual en tu código, configuración, prompt guardado o defaults del wrapper, la migración sí es urgente.

Tercero, está el endpoint preview antiguo 06-17. Ese ya es historia. El changelog de Google lo ubica en el aviso de deprecación del 4 de noviembre de 2025 con fecha de cierre el 18 de noviembre de 2025. Este detalle importa porque explica por qué posts comunitarios, snippets copiados y capturas viejas hablan de "Flash-Lite Preview" pero apuntan a otro evento de ciclo de vida distinto del actual.

Por eso tampoco basta con buscar "Flash-Lite" en tu repo. Busca los model strings completos:

bash
rg "gemini-2.5-flash-lite-preview-09-2025|gemini-2.5-flash-lite|gemini-flash-lite-latest"

Si solo ves gemini-2.5-flash-lite, no estás en el bloque de urgencia del 31 de marzo. Si ves gemini-2.5-flash-lite-preview-09-2025, sí lo estás. Si ves aliases como gemini-flash-lite-latest, tienes que comprobar a qué resuelven hoy en vez de asumirlo.

Ese último punto pesa más de lo que parece. Muchos equipos migran el código principal y olvidan:

archivos .env
herramientas internas de administración
plantillas de prompts guardadas
notebooks
harnesses de evaluación
jobs batch
defaults en wrappers

Los bugs de deprecación casi nunca viven solo en el path principal. Suelen sobrevivir en una superficie de configuración olvidada.

A qué deberías cambiar ahora mismo

El reemplazo oficial de gemini-2.5-flash-lite-preview-09-2025 es gemini-3.1-flash-lite-preview. Esa es la respuesta de Google en la página de deprecations, y si tu objetivo es seguir la ruta sucesora documentada, ese es el model ID que debes probar primero.

Pero eso no significa automáticamente que todo el mundo deba tratar la migración como un rename sin coste. Aquí mandan dos preguntas prácticas:

¿De verdad estás hoy en el endpoint preview deprecated?
¿Quieres la ruta sucesora oficial o, sobre todo, mantener la economía más barata de la línea 2.5 Flash-Lite aún activa?

Si estás en gemini-2.5-flash-lite-preview-09-2025 dentro de Gemini API o Google AI Studio, el movimiento oficial más limpio es:

text
gemini-2.5-flash-lite-preview-09-2025
-> gemini-3.1-flash-lite-preview

Si en cambio tu objetivo principal de negocio es "mantener viva la ruta Flash-Lite de menor coste el mayor tiempo posible", entonces gemini-2.5-flash-lite estable sigue siendo una línea real, visible en la página oficial del modelo y con precios publicados iguales a la fila preview deprecated. No es el reemplazo documentado que Google pone para la deprecación del preview, así que no lo llamaría la respuesta oficial de migración. Pero sí es una consideración operativa válida para equipos donde pesan más la disciplina de coste y el estado estable que adoptar 3.1 de inmediato.

Esa distinción encaja con la comparación más amplia que ya publicamos en Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash-Lite. La versión corta es:

usa gemini-3.1-flash-lite-preview si quieres la ruta sucesora documentada
quédate en gemini-2.5-flash-lite si todavía priorizas la ruta estable de menor coste

Lo que no conviene hacer es migrar a 3.1 a ciegas y sorprenderte luego con la factura. El reemplazo no está tarifado como el modelo del que salen muchos equipos.

Qué cambia en precio, límites y riesgo de migración

Aquí es donde la migración deja de ser teórica.

En la página oficial de pricing, gemini-2.5-flash-lite estable y gemini-2.5-flash-lite-preview-09-2025 deprecated comparten hoy la misma tarifa publicada. El reemplazo oficial no.

Modelo	Estado	Precio estándar de entrada	Precio estándar de salida	Lectura práctica
`gemini-2.5-flash-lite-preview-09-2025`	Preview deprecated	$0.10 / 1M	$0.40 / 1M	Barato, pero ya con reloj de cierre al 31 de marzo
`gemini-2.5-flash-lite`	Stable	$0.10 / 1M	$0.40 / 1M	Misma economía publicada, con cierre más tardío el 22 de julio
`gemini-3.1-flash-lite-preview`	Sucesor preview actual	$0.25 / 1M	$1.50 / 1M	Reemplazo oficial, pero materialmente más caro

Eso significa que el reemplazo recomendado es:

2.5x más caro en input
3.75x más caro en output

Este es el dato que muchas páginas actuales esconden. El usuario no solo quiere saber si un modelo desaparece. Quiere saber si la migración va a romper en silencio la economía de una línea que se eligió justo por ser barata.

La historia de límites es más matizada. La página oficial de rate limits dice que los modelos preview pueden tener límites más restrictivos y que hay que revisar los límites activos en AI Studio. Al mismo tiempo, la tabla pública de Batch API muestra hoy los mismos techos publicados de batch-enqueued tokens para Gemini 2.5 Flash-Lite y Gemini 2.5 Flash-Lite Preview. Por eso la conclusión segura no es "3.1 te da más throughput público sí o sí". La lectura más prudente es:

las docs públicas no muestran ahora una ventaja de throughput clara que justifique la migración por sí sola
el comportamiento de límites en preview puede ser menos predecible que en estable
el caso para cambiar al reemplazo es sobre ciclo de vida y calidad del modelo, no por una ventaja pública documentada de capacidad batch

Por eso la pregunta correcta no es "cuál es el nombre nuevo". Es "¿la ruta 3.1 me aporta valor suficiente para justificar una factura por token bastante más alta antes de que me obliguen a salir del preview viejo?"

Si necesitas más contexto de cuota y precio, las siguientes lecturas son nuestra guía de Gemini API rate limits por tier y la guía de precios Gemini API 2026.

Troubleshooting después del rename: Gemini API, Google AI Studio y Vertex AI

Esta es la sección que más se salta la SERP actual. Mucha gente renombra el modelo y aun así siente que la migración falló. Casi siempre no falla el aviso de deprecación: falla porque la referencia obsoleta vive en otra superficie distinta a la obvia.

Gemini API

Si tu aplicación llama a Gemini Developer API con el model string exacto gemini-2.5-flash-lite-preview-09-2025, trátalo como migración activa. Las docs públicas de ciclo de vida en Gemini API son lo bastante explícitas como para que esperar hasta final de marzo sea un riesgo innecesario. Cambia el model string de forma deliberada y vuelve a probar con una solicitud mínima antes de depurar cualquier otra cosa.

Google AI Studio

Si un prompt, template o workspace viejo todavía referencia el preview deprecated, tienes esencialmente el mismo problema que en código API: una referencia de modelo obsoleta. La diferencia es dónde está. En la práctica, las migraciones de AI Studio fallan porque los equipos actualizan código y olvidan:

workspaces de prompts guardados
capturas internas
documentación de onboarding
notebooks copiados

Si un usuario de AI Studio dice "la semana pasada todavía funcionaba", no concluyas enseguida que el aviso de deprecación era incorrecto. Revisa si está usando un prompt guardado, otro proyecto o un alias de modelo que nadie auditó.

Vertex AI

Esta es la superficie más difícil de explicar porque las docs públicas generan ambigüedad. La página pública de Flash-Lite en Vertex AI sigue mostrando gemini-2.5-flash-lite estable como GA y también incluye un bloque preview para gemini-2.5-flash-lite-preview-09-2025. Eso significa que no conviene mandar un anuncio interno tipo "Flash-Lite Preview ya no existe en ninguna parte". Pero tampoco conviene ignorar la señal de ciclo de vida de Gemini API solo porque la página pública de Vertex todavía enseña la fila preview.

La regla operativa más segura es:

si usas Gemini Developer API o Google AI Studio, usa las páginas de ciclo de vida de Gemini API para el calendario de migración
si usas Vertex AI, verifica el comportamiento exacto del endpoint en tu proyecto antes de renombrar en masa, pero planifica igual que la línea preview va a agotarse y no que seguirá indefinidamente

No es una respuesta perfecta, pero es mejor que fingir una alineación total que hoy no existe entre fuentes públicas.

Checklist de migración segura

Si esta keyword te llega desde un flujo de producción real, usa este orden:

Busca el model ID deprecated completo, no solo el nombre de familia.
Separa gemini-2.5-flash-lite-preview-09-2025 (preview) de gemini-2.5-flash-lite (estable) en todos los sitios donde aparezcan.
Decide si tu objetivo principal es el sucesor oficial gemini-3.1-flash-lite-preview o la línea estable 2.5 más barata.
Reprueba con una solicitud mínima antes de depurar prompts o pipelines grandes.
Audita prompts guardados, wrappers, notebooks y configuración de despliegue buscando model strings obsoletos.
Si estás en Vertex AI, confirma el comportamiento real en tu superficie antes de cambios masivos.
Recalcula costes antes de mover una línea de alto volumen a 3.1 Flash-Lite Preview.

Si quieres un default práctico en una sola vista:

migra ya si estás fijado explícitamente a gemini-2.5-flash-lite-preview-09-2025
no entres en pánico si ya estás en gemini-2.5-flash-lite estable
no trates 3.1 como rename gratis porque no está tarifado así

Si después del rename te aparecen errores 400, 403 o 429 más amplios, el siguiente paso correcto es nuestra guía de troubleshooting de errores de Gemini API, no seguir adivinando sobre el aviso de ciclo de vida.

FAQ

¿`gemini-2.5-flash-lite` estable ya está descontinuado?

No. A 22 de marzo de 2026, la documentación pública de Gemini API sigue listando gemini-2.5-flash-lite estable por separado respecto al preview deprecated. La fecha de cierre que Google muestra actualmente para la línea estable es 22 de julio de 2026, no 31 de marzo de 2026.

¿Qué endpoint exacto se apaga el 31 de marzo de 2026?

La página oficial de deprecations de Gemini API lista gemini-2.5-flash-lite-preview-09-2025 para apagado el 31 de marzo de 2026. Ese es el preview al que se refiere la mayoría de búsquedas con esta keyword. En esa misma página, Google marca gemini-3.1-flash-lite-preview como reemplazo.

¿Esto también afecta a Vertex AI?

Las docs públicas de Vertex AI todavía muestran la versión preview, así que no conviene asumir un estado único para todas las superficies de Google. La lectura segura es que las docs de ciclo de vida de Gemini API sí señalan claramente el cierre del preview, mientras que el comportamiento en Vertex debe confirmarse en la superficie real que uses. Ese split también explica por qué sigue habiendo confusión aunque la documentación pública exista.

#Gemini 2.5 Flash-Lite #Gemini API #deprecación de modelos #Google AI Studio #Vertex AI