gemini-2.5-flash-lite-preview-09-2025 está en el reloj de apagado del 31 de marzo de 2026, mientras que gemini-2.5-flash-lite estable es una línea separada y no comparte ese cierre. El reemplazo oficial para ese preview es gemini-3.1-flash-lite-preview, pero esta guía se centra en el contexto real de Gemini API / Google AI Studio y en la ambigüedad que todavía existe en Vertex AI. El valor práctico aquí es decidir si debes migrar hoy mismo, qué endpoint te conviene y cómo evitar una subida de coste inesperada.
La confusión es lógica porque Google mantiene tres capas de ciclo de vida Flash-Lite superpuestas en documentación pública: un preview 06-17 que ya se retiró, un preview 09-2025 que ahora tiene fecha de cierre, y la línea estable activa gemini-2.5-flash-lite. Además, la página pública de modelos de Vertex AI todavía muestra la versión preview 09-2025, y eso hace que algunos usuarios crean que el aviso de deprecación es parcial o un error. No es tan simple. La pregunta útil es qué endpoint exacto estás usando en código o prompts, y en qué superficie de producto estás corriendo realmente.
Resumen rápido
gemini-2.5-flash-lite-preview-09-2025es el endpoint que entra en cierre el 31 de marzo de 2026.gemini-2.5-flash-liteestable es aparte y, por ahora, Google le marca cierre el 22 de julio de 2026.- el sucesor oficial es
gemini-3.1-flash-lite-preview, pero cuesta bastante más, así que no lo trates como un simple rename gratis.
Si solo necesitas la decisión práctica, usa esta tabla y luego salta a la sección que coincide con tu caso.
| Lo que usas hoy | Estado actual en docs públicas | Fecha clave | Mejor siguiente paso |
|---|---|---|---|
gemini-2.5-flash-lite-preview-09-2025 | Preview deprecated | 31 de marzo de 2026 | Planifica migración ya; el reemplazo de Google es gemini-3.1-flash-lite-preview |
gemini-2.5-flash-lite | Stable | 22 de julio de 2026 | No hace falta rename de emergencia hoy; benchmarkea y migra con control de coste |
gemini-3.1-flash-lite-preview | Sucesor preview actual | Sin fecha de cierre anunciada en docs de Gemini API | Úsalo si quieres seguir la ruta sucesora documentada |
| La página de Vertex AI todavía muestra la versión preview | Ambigüedad por superficie | Revisa tu superficie y comportamiento real del endpoint | Confirma antes de renombrar en masa, pero no ignores la señal de deprecación de Gemini API |
gemini-flash-lite-latest u otros aliases ocultos en wrappers | Riesgo de alias | Depende de a qué resuelva hoy el alias | Inspecciona el model string resuelto antes de asumir que estás a salvo |
La idea clave es que aquí hablamos de un endpoint, no de un nombre de familia. Si tu código, herramienta de prompts o configuración guardada solo dice "Flash-Lite", todavía te falta el dato que define si esto es urgente o no.
¿De verdad están descontinuando Gemini 2.5 Flash-Lite Preview?

Para Gemini API, la respuesta oficial más limpia es sí: gemini-2.5-flash-lite-preview-09-2025 está programado para apagado el 31 de marzo de 2026. Google lo publica de forma explícita en la página de deprecations de Gemini, donde también aparece gemini-3.1-flash-lite-preview como reemplazo recomendado.
La razón por la que mucha gente sigue dudando es que la documentación pública de Google no lo cuenta como una historia única y lineal. El changelog deja el ciclo de vida en piezas:
gemini-2.5-flash-lite-preview-06-17apareció primero en junio de 2025gemini-2.5-flash-liteestable llegó en julio de 2025gemini-2.5-flash-lite-preview-09-2025llegó después, en septiembre de 2025- en marzo de 2026, Google anunció que el preview 09-2025 se apaga el 31 de marzo
Eso implica que "Gemini 2.5 Flash-Lite Preview" puede referirse a más de un model ID histórico. Si alguien recuerda un alias viejo, un selector de AI Studio o un post comunitario de otro mes, puede estar recordando la familia correcta pero el endpoint equivocado. Por eso muchos usuarios siguen confundidos incluso después de abrir docs oficiales.
La otra fuente de ruido es el alcance por producto. Las docs públicas de Gemini API sí son claras sobre el apagado del preview 09-2025 el 31 de marzo de 2026. Pero la página de Flash-Lite en Vertex AI todavía muestra un bloque de versión preview para gemini-2.5-flash-lite-preview-09-2025 junto a la GA gemini-2.5-flash-lite. Por eso la frase segura no es "Google eliminó Flash-Lite Preview en todos lados". La frase segura es:
Las docs de ciclo de vida de Gemini API listan gemini-2.5-flash-lite-preview-09-2025 para cierre el 31 de marzo de 2026. gemini-2.5-flash-lite estable es separado. Las docs públicas de Vertex aún muestran la versión preview, así que debes verificar tu superficie real antes de cambiar el routing de producción.
No es una respuesta tan cómoda como un sí/no absoluto, pero es la que sostienen las fuentes públicas.
La parte confusa: endpoint preview, modelo estable y previews antiguos son cosas distintas

La mayoría de páginas flojas para esta keyword fallan porque responden por nombre de familia y se saltan el split por endpoint. Eso produce consejos dramáticos pero poco útiles operativamente. Aquí hay que separar tres cosas.
Primero, está gemini-2.5-flash-lite estable. La página oficial del modelo lo describe como la opción multimodal eficiente de la familia 2.5 y lo marca como Stable. Esa misma página marca gemini-2.5-flash-lite-preview-09-2025 como Deprecated. Solo ese bloque de versiones ya desmonta la lectura de pánico de que "Flash-Lite Preview discontinued" signifique "Flash-Lite ya murió".
Segundo, está el endpoint preview 09-2025 deprecated. Ese model string es el que importa para la fecha del 31 de marzo de 2026. Si aparece tal cual en tu código, configuración, prompt guardado o defaults del wrapper, la migración sí es urgente.
Tercero, está el endpoint preview antiguo 06-17. Ese ya es historia. El changelog de Google lo ubica en el aviso de deprecación del 4 de noviembre de 2025 con fecha de cierre el 18 de noviembre de 2025. Este detalle importa porque explica por qué posts comunitarios, snippets copiados y capturas viejas hablan de "Flash-Lite Preview" pero apuntan a otro evento de ciclo de vida distinto del actual.
Por eso tampoco basta con buscar "Flash-Lite" en tu repo. Busca los model strings completos:
bashrg "gemini-2.5-flash-lite-preview-09-2025|gemini-2.5-flash-lite|gemini-flash-lite-latest"
Si solo ves gemini-2.5-flash-lite, no estás en el bloque de urgencia del 31 de marzo. Si ves gemini-2.5-flash-lite-preview-09-2025, sí lo estás. Si ves aliases como gemini-flash-lite-latest, tienes que comprobar a qué resuelven hoy en vez de asumirlo.
Ese último punto pesa más de lo que parece. Muchos equipos migran el código principal y olvidan:
- archivos
.env - herramientas internas de administración
- plantillas de prompts guardadas
- notebooks
- harnesses de evaluación
- jobs batch
- defaults en wrappers
Los bugs de deprecación casi nunca viven solo en el path principal. Suelen sobrevivir en una superficie de configuración olvidada.
A qué deberías cambiar ahora mismo
El reemplazo oficial de gemini-2.5-flash-lite-preview-09-2025 es gemini-3.1-flash-lite-preview. Esa es la respuesta de Google en la página de deprecations, y si tu objetivo es seguir la ruta sucesora documentada, ese es el model ID que debes probar primero.
Pero eso no significa automáticamente que todo el mundo deba tratar la migración como un rename sin coste. Aquí mandan dos preguntas prácticas:
- ¿De verdad estás hoy en el endpoint preview deprecated?
- ¿Quieres la ruta sucesora oficial o, sobre todo, mantener la economía más barata de la línea 2.5 Flash-Lite aún activa?
Si estás en gemini-2.5-flash-lite-preview-09-2025 dentro de Gemini API o Google AI Studio, el movimiento oficial más limpio es:
textgemini-2.5-flash-lite-preview-09-2025 -> gemini-3.1-flash-lite-preview
Si en cambio tu objetivo principal de negocio es "mantener viva la ruta Flash-Lite de menor coste el mayor tiempo posible", entonces gemini-2.5-flash-lite estable sigue siendo una línea real, visible en la página oficial del modelo y con precios publicados iguales a la fila preview deprecated. No es el reemplazo documentado que Google pone para la deprecación del preview, así que no lo llamaría la respuesta oficial de migración. Pero sí es una consideración operativa válida para equipos donde pesan más la disciplina de coste y el estado estable que adoptar 3.1 de inmediato.
Esa distinción encaja con la comparación más amplia que ya publicamos en Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash-Lite. La versión corta es:
- usa
gemini-3.1-flash-lite-previewsi quieres la ruta sucesora documentada - quédate en
gemini-2.5-flash-litesi todavía priorizas la ruta estable de menor coste
Lo que no conviene hacer es migrar a 3.1 a ciegas y sorprenderte luego con la factura. El reemplazo no está tarifado como el modelo del que salen muchos equipos.
Qué cambia en precio, límites y riesgo de migración
Aquí es donde la migración deja de ser teórica.
En la página oficial de pricing, gemini-2.5-flash-lite estable y gemini-2.5-flash-lite-preview-09-2025 deprecated comparten hoy la misma tarifa publicada. El reemplazo oficial no.
| Modelo | Estado | Precio estándar de entrada | Precio estándar de salida | Lectura práctica |
|---|---|---|---|---|
gemini-2.5-flash-lite-preview-09-2025 | Preview deprecated | $0.10 / 1M | $0.40 / 1M | Barato, pero ya con reloj de cierre al 31 de marzo |
gemini-2.5-flash-lite | Stable | $0.10 / 1M | $0.40 / 1M | Misma economía publicada, con cierre más tardío el 22 de julio |
gemini-3.1-flash-lite-preview | Sucesor preview actual | $0.25 / 1M | $1.50 / 1M | Reemplazo oficial, pero materialmente más caro |
Eso significa que el reemplazo recomendado es:
- 2.5x más caro en input
- 3.75x más caro en output
Este es el dato que muchas páginas actuales esconden. El usuario no solo quiere saber si un modelo desaparece. Quiere saber si la migración va a romper en silencio la economía de una línea que se eligió justo por ser barata.
La historia de límites es más matizada. La página oficial de rate limits dice que los modelos preview pueden tener límites más restrictivos y que hay que revisar los límites activos en AI Studio. Al mismo tiempo, la tabla pública de Batch API muestra hoy los mismos techos publicados de batch-enqueued tokens para Gemini 2.5 Flash-Lite y Gemini 2.5 Flash-Lite Preview. Por eso la conclusión segura no es "3.1 te da más throughput público sí o sí". La lectura más prudente es:
- las docs públicas no muestran ahora una ventaja de throughput clara que justifique la migración por sí sola
- el comportamiento de límites en preview puede ser menos predecible que en estable
- el caso para cambiar al reemplazo es sobre ciclo de vida y calidad del modelo, no por una ventaja pública documentada de capacidad batch
Por eso la pregunta correcta no es "cuál es el nombre nuevo". Es "¿la ruta 3.1 me aporta valor suficiente para justificar una factura por token bastante más alta antes de que me obliguen a salir del preview viejo?"
Si necesitas más contexto de cuota y precio, las siguientes lecturas son nuestra guía de Gemini API rate limits por tier y la guía de precios Gemini API 2026.
Troubleshooting después del rename: Gemini API, Google AI Studio y Vertex AI

Esta es la sección que más se salta la SERP actual. Mucha gente renombra el modelo y aun así siente que la migración falló. Casi siempre no falla el aviso de deprecación: falla porque la referencia obsoleta vive en otra superficie distinta a la obvia.
Gemini API
Si tu aplicación llama a Gemini Developer API con el model string exacto gemini-2.5-flash-lite-preview-09-2025, trátalo como migración activa. Las docs públicas de ciclo de vida en Gemini API son lo bastante explícitas como para que esperar hasta final de marzo sea un riesgo innecesario. Cambia el model string de forma deliberada y vuelve a probar con una solicitud mínima antes de depurar cualquier otra cosa.
Google AI Studio
Si un prompt, template o workspace viejo todavía referencia el preview deprecated, tienes esencialmente el mismo problema que en código API: una referencia de modelo obsoleta. La diferencia es dónde está. En la práctica, las migraciones de AI Studio fallan porque los equipos actualizan código y olvidan:
- workspaces de prompts guardados
- capturas internas
- documentación de onboarding
- notebooks copiados
Si un usuario de AI Studio dice "la semana pasada todavía funcionaba", no concluyas enseguida que el aviso de deprecación era incorrecto. Revisa si está usando un prompt guardado, otro proyecto o un alias de modelo que nadie auditó.
Vertex AI
Esta es la superficie más difícil de explicar porque las docs públicas generan ambigüedad. La página pública de Flash-Lite en Vertex AI sigue mostrando gemini-2.5-flash-lite estable como GA y también incluye un bloque preview para gemini-2.5-flash-lite-preview-09-2025. Eso significa que no conviene mandar un anuncio interno tipo "Flash-Lite Preview ya no existe en ninguna parte". Pero tampoco conviene ignorar la señal de ciclo de vida de Gemini API solo porque la página pública de Vertex todavía enseña la fila preview.
La regla operativa más segura es:
- si usas Gemini Developer API o Google AI Studio, usa las páginas de ciclo de vida de Gemini API para el calendario de migración
- si usas Vertex AI, verifica el comportamiento exacto del endpoint en tu proyecto antes de renombrar en masa, pero planifica igual que la línea preview va a agotarse y no que seguirá indefinidamente
No es una respuesta perfecta, pero es mejor que fingir una alineación total que hoy no existe entre fuentes públicas.
Checklist de migración segura
Si esta keyword te llega desde un flujo de producción real, usa este orden:
- Busca el model ID deprecated completo, no solo el nombre de familia.
- Separa
gemini-2.5-flash-lite-preview-09-2025(preview) degemini-2.5-flash-lite(estable) en todos los sitios donde aparezcan. - Decide si tu objetivo principal es el sucesor oficial
gemini-3.1-flash-lite-previewo la línea estable 2.5 más barata. - Reprueba con una solicitud mínima antes de depurar prompts o pipelines grandes.
- Audita prompts guardados, wrappers, notebooks y configuración de despliegue buscando model strings obsoletos.
- Si estás en Vertex AI, confirma el comportamiento real en tu superficie antes de cambios masivos.
- Recalcula costes antes de mover una línea de alto volumen a 3.1 Flash-Lite Preview.
Si quieres un default práctico en una sola vista:
- migra ya si estás fijado explícitamente a
gemini-2.5-flash-lite-preview-09-2025 - no entres en pánico si ya estás en
gemini-2.5-flash-liteestable - no trates 3.1 como rename gratis porque no está tarifado así
Si después del rename te aparecen errores 400, 403 o 429 más amplios, el siguiente paso correcto es nuestra guía de troubleshooting de errores de Gemini API, no seguir adivinando sobre el aviso de ciclo de vida.
FAQ
¿gemini-2.5-flash-lite estable ya está descontinuado?
No. A 21 de marzo de 2026, la documentación pública de Gemini API sigue listando gemini-2.5-flash-lite estable por separado respecto al preview deprecated. La fecha de cierre que Google muestra actualmente para la línea estable es 22 de julio de 2026, no 31 de marzo de 2026.
¿Qué endpoint exacto se apaga el 31 de marzo de 2026?
La página oficial de deprecations de Gemini API lista gemini-2.5-flash-lite-preview-09-2025 para apagado el 31 de marzo de 2026. Ese es el preview al que se refiere la mayoría de búsquedas con esta keyword. En esa misma página, Google marca gemini-3.1-flash-lite-preview como reemplazo.
¿Esto también afecta a Vertex AI?
Las docs públicas de Vertex AI todavía muestran la versión preview, así que no conviene asumir un estado único para todas las superficies de Google. La lectura segura es que las docs de ciclo de vida de Gemini API sí señalan claramente el cierre del preview, mientras que el comportamiento en Vertex debe confirmarse en la superficie real que uses. Ese split también explica por qué sigue habiendo confusión aunque la documentación pública exista.
