AIFreeAPI Logo

¿Gemini 2.5 Flash-Lite Preview se descontinúa? Qué migrar antes del 31 de marzo

A
13 min readMigración API

La documentación de Gemini API de Google lista `gemini-2.5-flash-lite-preview-09-2025` para apagado el 31 de marzo de 2026 y recomienda `gemini-3.1-flash-lite-preview`. Eso no significa que `gemini-2.5-flash-lite` estable ya haya desaparecido. Esta guía de troubleshooting explica el split real, el salto de precio y qué mover primero.

Guía de cierre de Gemini 2.5 Flash-Lite Preview con endpoint deprecated, modelo estable y ruta de reemplazo

gemini-2.5-flash-lite-preview-09-2025 está en el reloj de apagado del 31 de marzo de 2026, mientras que gemini-2.5-flash-lite estable es una línea separada y no comparte ese cierre. El reemplazo oficial para ese preview es gemini-3.1-flash-lite-preview, pero esta guía se centra en el contexto real de Gemini API / Google AI Studio y en la ambigüedad que todavía existe en Vertex AI. El valor práctico aquí es decidir si debes migrar hoy mismo, qué endpoint te conviene y cómo evitar una subida de coste inesperada.

La confusión es lógica porque Google mantiene tres capas de ciclo de vida Flash-Lite superpuestas en documentación pública: un preview 06-17 que ya se retiró, un preview 09-2025 que ahora tiene fecha de cierre, y la línea estable activa gemini-2.5-flash-lite. Además, la página pública de modelos de Vertex AI todavía muestra la versión preview 09-2025, y eso hace que algunos usuarios crean que el aviso de deprecación es parcial o un error. No es tan simple. La pregunta útil es qué endpoint exacto estás usando en código o prompts, y en qué superficie de producto estás corriendo realmente.

Resumen rápido

  • gemini-2.5-flash-lite-preview-09-2025 es el endpoint que entra en cierre el 31 de marzo de 2026.
  • gemini-2.5-flash-lite estable es aparte y, por ahora, Google le marca cierre el 22 de julio de 2026.
  • el sucesor oficial es gemini-3.1-flash-lite-preview, pero cuesta bastante más, así que no lo trates como un simple rename gratis.

Si solo necesitas la decisión práctica, usa esta tabla y luego salta a la sección que coincide con tu caso.

Lo que usas hoyEstado actual en docs públicasFecha claveMejor siguiente paso
gemini-2.5-flash-lite-preview-09-2025Preview deprecated31 de marzo de 2026Planifica migración ya; el reemplazo de Google es gemini-3.1-flash-lite-preview
gemini-2.5-flash-liteStable22 de julio de 2026No hace falta rename de emergencia hoy; benchmarkea y migra con control de coste
gemini-3.1-flash-lite-previewSucesor preview actualSin fecha de cierre anunciada en docs de Gemini APIÚsalo si quieres seguir la ruta sucesora documentada
La página de Vertex AI todavía muestra la versión previewAmbigüedad por superficieRevisa tu superficie y comportamiento real del endpointConfirma antes de renombrar en masa, pero no ignores la señal de deprecación de Gemini API
gemini-flash-lite-latest u otros aliases ocultos en wrappersRiesgo de aliasDepende de a qué resuelva hoy el aliasInspecciona el model string resuelto antes de asumir que estás a salvo

La idea clave es que aquí hablamos de un endpoint, no de un nombre de familia. Si tu código, herramienta de prompts o configuración guardada solo dice "Flash-Lite", todavía te falta el dato que define si esto es urgente o no.

¿De verdad están descontinuando Gemini 2.5 Flash-Lite Preview?

Cronología con el preview Flash-Lite antiguo, el preview 09-2025 con cierre el 31 de marzo de 2026 y la línea estable separada de 2.5 Flash-Lite.
Cronología con el preview Flash-Lite antiguo, el preview 09-2025 con cierre el 31 de marzo de 2026 y la línea estable separada de 2.5 Flash-Lite.

Para Gemini API, la respuesta oficial más limpia es sí: gemini-2.5-flash-lite-preview-09-2025 está programado para apagado el 31 de marzo de 2026. Google lo publica de forma explícita en la página de deprecations de Gemini, donde también aparece gemini-3.1-flash-lite-preview como reemplazo recomendado.

La razón por la que mucha gente sigue dudando es que la documentación pública de Google no lo cuenta como una historia única y lineal. El changelog deja el ciclo de vida en piezas:

  • gemini-2.5-flash-lite-preview-06-17 apareció primero en junio de 2025
  • gemini-2.5-flash-lite estable llegó en julio de 2025
  • gemini-2.5-flash-lite-preview-09-2025 llegó después, en septiembre de 2025
  • en marzo de 2026, Google anunció que el preview 09-2025 se apaga el 31 de marzo

Eso implica que "Gemini 2.5 Flash-Lite Preview" puede referirse a más de un model ID histórico. Si alguien recuerda un alias viejo, un selector de AI Studio o un post comunitario de otro mes, puede estar recordando la familia correcta pero el endpoint equivocado. Por eso muchos usuarios siguen confundidos incluso después de abrir docs oficiales.

La otra fuente de ruido es el alcance por producto. Las docs públicas de Gemini API sí son claras sobre el apagado del preview 09-2025 el 31 de marzo de 2026. Pero la página de Flash-Lite en Vertex AI todavía muestra un bloque de versión preview para gemini-2.5-flash-lite-preview-09-2025 junto a la GA gemini-2.5-flash-lite. Por eso la frase segura no es "Google eliminó Flash-Lite Preview en todos lados". La frase segura es:

Las docs de ciclo de vida de Gemini API listan gemini-2.5-flash-lite-preview-09-2025 para cierre el 31 de marzo de 2026. gemini-2.5-flash-lite estable es separado. Las docs públicas de Vertex aún muestran la versión preview, así que debes verificar tu superficie real antes de cambiar el routing de producción.

No es una respuesta tan cómoda como un sí/no absoluto, pero es la que sostienen las fuentes públicas.

La parte confusa: endpoint preview, modelo estable y previews antiguos son cosas distintas

Panel que separa el preview antiguo 06-17, el preview 09-2025 deprecated y el endpoint estable gemini-2.5-flash-lite que sigue activo.
Panel que separa el preview antiguo 06-17, el preview 09-2025 deprecated y el endpoint estable gemini-2.5-flash-lite que sigue activo.

La mayoría de páginas flojas para esta keyword fallan porque responden por nombre de familia y se saltan el split por endpoint. Eso produce consejos dramáticos pero poco útiles operativamente. Aquí hay que separar tres cosas.

Primero, está gemini-2.5-flash-lite estable. La página oficial del modelo lo describe como la opción multimodal eficiente de la familia 2.5 y lo marca como Stable. Esa misma página marca gemini-2.5-flash-lite-preview-09-2025 como Deprecated. Solo ese bloque de versiones ya desmonta la lectura de pánico de que "Flash-Lite Preview discontinued" signifique "Flash-Lite ya murió".

Segundo, está el endpoint preview 09-2025 deprecated. Ese model string es el que importa para la fecha del 31 de marzo de 2026. Si aparece tal cual en tu código, configuración, prompt guardado o defaults del wrapper, la migración sí es urgente.

Tercero, está el endpoint preview antiguo 06-17. Ese ya es historia. El changelog de Google lo ubica en el aviso de deprecación del 4 de noviembre de 2025 con fecha de cierre el 18 de noviembre de 2025. Este detalle importa porque explica por qué posts comunitarios, snippets copiados y capturas viejas hablan de "Flash-Lite Preview" pero apuntan a otro evento de ciclo de vida distinto del actual.

Por eso tampoco basta con buscar "Flash-Lite" en tu repo. Busca los model strings completos:

bash
rg "gemini-2.5-flash-lite-preview-09-2025|gemini-2.5-flash-lite|gemini-flash-lite-latest"

Si solo ves gemini-2.5-flash-lite, no estás en el bloque de urgencia del 31 de marzo. Si ves gemini-2.5-flash-lite-preview-09-2025, sí lo estás. Si ves aliases como gemini-flash-lite-latest, tienes que comprobar a qué resuelven hoy en vez de asumirlo.

Ese último punto pesa más de lo que parece. Muchos equipos migran el código principal y olvidan:

  • archivos .env
  • herramientas internas de administración
  • plantillas de prompts guardadas
  • notebooks
  • harnesses de evaluación
  • jobs batch
  • defaults en wrappers

Los bugs de deprecación casi nunca viven solo en el path principal. Suelen sobrevivir en una superficie de configuración olvidada.

A qué deberías cambiar ahora mismo

El reemplazo oficial de gemini-2.5-flash-lite-preview-09-2025 es gemini-3.1-flash-lite-preview. Esa es la respuesta de Google en la página de deprecations, y si tu objetivo es seguir la ruta sucesora documentada, ese es el model ID que debes probar primero.

Pero eso no significa automáticamente que todo el mundo deba tratar la migración como un rename sin coste. Aquí mandan dos preguntas prácticas:

  1. ¿De verdad estás hoy en el endpoint preview deprecated?
  2. ¿Quieres la ruta sucesora oficial o, sobre todo, mantener la economía más barata de la línea 2.5 Flash-Lite aún activa?

Si estás en gemini-2.5-flash-lite-preview-09-2025 dentro de Gemini API o Google AI Studio, el movimiento oficial más limpio es:

text
gemini-2.5-flash-lite-preview-09-2025 -> gemini-3.1-flash-lite-preview

Si en cambio tu objetivo principal de negocio es "mantener viva la ruta Flash-Lite de menor coste el mayor tiempo posible", entonces gemini-2.5-flash-lite estable sigue siendo una línea real, visible en la página oficial del modelo y con precios publicados iguales a la fila preview deprecated. No es el reemplazo documentado que Google pone para la deprecación del preview, así que no lo llamaría la respuesta oficial de migración. Pero sí es una consideración operativa válida para equipos donde pesan más la disciplina de coste y el estado estable que adoptar 3.1 de inmediato.

Esa distinción encaja con la comparación más amplia que ya publicamos en Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash-Lite. La versión corta es:

  • usa gemini-3.1-flash-lite-preview si quieres la ruta sucesora documentada
  • quédate en gemini-2.5-flash-lite si todavía priorizas la ruta estable de menor coste

Lo que no conviene hacer es migrar a 3.1 a ciegas y sorprenderte luego con la factura. El reemplazo no está tarifado como el modelo del que salen muchos equipos.

Qué cambia en precio, límites y riesgo de migración

Aquí es donde la migración deja de ser teórica.

En la página oficial de pricing, gemini-2.5-flash-lite estable y gemini-2.5-flash-lite-preview-09-2025 deprecated comparten hoy la misma tarifa publicada. El reemplazo oficial no.

ModeloEstadoPrecio estándar de entradaPrecio estándar de salidaLectura práctica
gemini-2.5-flash-lite-preview-09-2025Preview deprecated$0.10 / 1M$0.40 / 1MBarato, pero ya con reloj de cierre al 31 de marzo
gemini-2.5-flash-liteStable$0.10 / 1M$0.40 / 1MMisma economía publicada, con cierre más tardío el 22 de julio
gemini-3.1-flash-lite-previewSucesor preview actual$0.25 / 1M$1.50 / 1MReemplazo oficial, pero materialmente más caro

Eso significa que el reemplazo recomendado es:

  • 2.5x más caro en input
  • 3.75x más caro en output

Este es el dato que muchas páginas actuales esconden. El usuario no solo quiere saber si un modelo desaparece. Quiere saber si la migración va a romper en silencio la economía de una línea que se eligió justo por ser barata.

La historia de límites es más matizada. La página oficial de rate limits dice que los modelos preview pueden tener límites más restrictivos y que hay que revisar los límites activos en AI Studio. Al mismo tiempo, la tabla pública de Batch API muestra hoy los mismos techos publicados de batch-enqueued tokens para Gemini 2.5 Flash-Lite y Gemini 2.5 Flash-Lite Preview. Por eso la conclusión segura no es "3.1 te da más throughput público sí o sí". La lectura más prudente es:

  • las docs públicas no muestran ahora una ventaja de throughput clara que justifique la migración por sí sola
  • el comportamiento de límites en preview puede ser menos predecible que en estable
  • el caso para cambiar al reemplazo es sobre ciclo de vida y calidad del modelo, no por una ventaja pública documentada de capacidad batch

Por eso la pregunta correcta no es "cuál es el nombre nuevo". Es "¿la ruta 3.1 me aporta valor suficiente para justificar una factura por token bastante más alta antes de que me obliguen a salir del preview viejo?"

Si necesitas más contexto de cuota y precio, las siguientes lecturas son nuestra guía de Gemini API rate limits por tier y la guía de precios Gemini API 2026.

Troubleshooting después del rename: Gemini API, Google AI Studio y Vertex AI

Mapa de superficies que muestra cómo la pregunta de cierre se comporta distinto en Gemini API, Google AI Studio y Vertex AI.
Mapa de superficies que muestra cómo la pregunta de cierre se comporta distinto en Gemini API, Google AI Studio y Vertex AI.

Esta es la sección que más se salta la SERP actual. Mucha gente renombra el modelo y aun así siente que la migración falló. Casi siempre no falla el aviso de deprecación: falla porque la referencia obsoleta vive en otra superficie distinta a la obvia.

Gemini API

Si tu aplicación llama a Gemini Developer API con el model string exacto gemini-2.5-flash-lite-preview-09-2025, trátalo como migración activa. Las docs públicas de ciclo de vida en Gemini API son lo bastante explícitas como para que esperar hasta final de marzo sea un riesgo innecesario. Cambia el model string de forma deliberada y vuelve a probar con una solicitud mínima antes de depurar cualquier otra cosa.

Google AI Studio

Si un prompt, template o workspace viejo todavía referencia el preview deprecated, tienes esencialmente el mismo problema que en código API: una referencia de modelo obsoleta. La diferencia es dónde está. En la práctica, las migraciones de AI Studio fallan porque los equipos actualizan código y olvidan:

  • workspaces de prompts guardados
  • capturas internas
  • documentación de onboarding
  • notebooks copiados

Si un usuario de AI Studio dice "la semana pasada todavía funcionaba", no concluyas enseguida que el aviso de deprecación era incorrecto. Revisa si está usando un prompt guardado, otro proyecto o un alias de modelo que nadie auditó.

Vertex AI

Esta es la superficie más difícil de explicar porque las docs públicas generan ambigüedad. La página pública de Flash-Lite en Vertex AI sigue mostrando gemini-2.5-flash-lite estable como GA y también incluye un bloque preview para gemini-2.5-flash-lite-preview-09-2025. Eso significa que no conviene mandar un anuncio interno tipo "Flash-Lite Preview ya no existe en ninguna parte". Pero tampoco conviene ignorar la señal de ciclo de vida de Gemini API solo porque la página pública de Vertex todavía enseña la fila preview.

La regla operativa más segura es:

  • si usas Gemini Developer API o Google AI Studio, usa las páginas de ciclo de vida de Gemini API para el calendario de migración
  • si usas Vertex AI, verifica el comportamiento exacto del endpoint en tu proyecto antes de renombrar en masa, pero planifica igual que la línea preview va a agotarse y no que seguirá indefinidamente

No es una respuesta perfecta, pero es mejor que fingir una alineación total que hoy no existe entre fuentes públicas.

Checklist de migración segura

Si esta keyword te llega desde un flujo de producción real, usa este orden:

  1. Busca el model ID deprecated completo, no solo el nombre de familia.
  2. Separa gemini-2.5-flash-lite-preview-09-2025 (preview) de gemini-2.5-flash-lite (estable) en todos los sitios donde aparezcan.
  3. Decide si tu objetivo principal es el sucesor oficial gemini-3.1-flash-lite-preview o la línea estable 2.5 más barata.
  4. Reprueba con una solicitud mínima antes de depurar prompts o pipelines grandes.
  5. Audita prompts guardados, wrappers, notebooks y configuración de despliegue buscando model strings obsoletos.
  6. Si estás en Vertex AI, confirma el comportamiento real en tu superficie antes de cambios masivos.
  7. Recalcula costes antes de mover una línea de alto volumen a 3.1 Flash-Lite Preview.

Si quieres un default práctico en una sola vista:

  • migra ya si estás fijado explícitamente a gemini-2.5-flash-lite-preview-09-2025
  • no entres en pánico si ya estás en gemini-2.5-flash-lite estable
  • no trates 3.1 como rename gratis porque no está tarifado así

Si después del rename te aparecen errores 400, 403 o 429 más amplios, el siguiente paso correcto es nuestra guía de troubleshooting de errores de Gemini API, no seguir adivinando sobre el aviso de ciclo de vida.

FAQ

¿gemini-2.5-flash-lite estable ya está descontinuado?

No. A 21 de marzo de 2026, la documentación pública de Gemini API sigue listando gemini-2.5-flash-lite estable por separado respecto al preview deprecated. La fecha de cierre que Google muestra actualmente para la línea estable es 22 de julio de 2026, no 31 de marzo de 2026.

¿Qué endpoint exacto se apaga el 31 de marzo de 2026?

La página oficial de deprecations de Gemini API lista gemini-2.5-flash-lite-preview-09-2025 para apagado el 31 de marzo de 2026. Ese es el preview al que se refiere la mayoría de búsquedas con esta keyword. En esa misma página, Google marca gemini-3.1-flash-lite-preview como reemplazo.

¿Esto también afecta a Vertex AI?

Las docs públicas de Vertex AI todavía muestran la versión preview, así que no conviene asumir un estado único para todas las superficies de Google. La lectura segura es que las docs de ciclo de vida de Gemini API sí señalan claramente el cierre del preview, mientras que el comportamiento en Vertex debe confirmarse en la superficie real que uses. Ese split también explica por qué sigue habiendo confusión aunque la documentación pública exista.

Nano Banana Pro

Imagen 4K80% DESC.

Google Gemini 3 Pro Image · Generación de imágenes AI

Más de 100K desarrolladores atendidos
$0.24/img
$0.05/img
Oferta limitada·Estable empresarial·Alipay/WeChat
Gemini 3
Modelo nativo
Acceso directo
20ms latencia
4K Ultra HD
2048px
30s generación
Ultra rápido
|@laozhang_cn|Obtén $0.05

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+