AIFreeAPI Logo

Gemini 2.5 Flash-Lite Preview 종료? 2026년 3월 31일 전 대응 정리

A
21 min readAPI 트러블슈팅

Google Gemini API 문서 기준 `gemini-2.5-flash-lite-preview-09-2025`는 2026년 3월 31일 종료 예정이고, 대체는 `gemini-3.1-flash-lite-preview`입니다. 하지만 안정판 `gemini-2.5-flash-lite`까지 지금 즉시 사라진 것은 아닙니다. 이 글은 엔드포인트 구분, 비용 차이, 지금 해야 할 마이그레이션 우선순위를 정리합니다.

종료 예정 preview 엔드포인트, 안정판 모델, 대체 경로를 함께 보여주는 Gemini 2.5 Flash-Lite 가이드

gemini-2.5-flash-lite-preview-09-2025는 2026년 3월 31일 종료 일정이 잡힌 엔드포인트이고, 안정판 gemini-2.5-flash-lite는 별도 라인입니다. Google의 Gemini API 종료 정책은 이 두 모델을 분리해 다루며, Vertex AI 공개 문서에는 preview 버전이 여전히 함께 보이기 때문에 표면별로 해석을 나눠야 합니다. 이 글은 지금 당장 코드 변경이 필요한 경우와 비용을 감안해 어떤 마이그레이션 경로를 택해야 하는지 빠르게 결정할 수 있도록 핵심만 정리합니다.

헷갈리기 쉬운 이유는 Google 문서에 Flash-Lite 수명주기가 3개 층으로 동시에 보이기 때문입니다. 이미 종료된 06-17 preview, 2026년 3월 31일 종료가 잡힌 09-2025 preview, 그리고 아직 살아 있는 안정판 gemini-2.5-flash-lite가 섞여 보입니다. 여기에 Vertex AI 공개 페이지에 09-2025 preview 블록이 아직 표시되어 있어 "종료 공지가 부분 적용인가?"라는 의심도 생깁니다. 핵심은 문구가 아니라, 여러분 코드나 프롬프트 표면이 실제로 어떤 엔드포인트를 호출하는지입니다.

핵심 요약

  • 2026년 3월 31일 종료 시계에 올라간 것은 gemini-2.5-flash-lite-preview-09-2025입니다.
  • 안정판 gemini-2.5-flash-lite는 별도 라인이며, Google 수명주기 문서상 현재 종료일은 2026년 7월 22일입니다.
  • 공식 후속 모델은 gemini-3.1-flash-lite-preview지만, 비용이 크게 올라가므로 단순 이름 치환으로 보면 안 됩니다.

실무 판단만 빨리 원한다면 아래 표를 먼저 보고, 본문에서는 본인 환경에 맞는 섹션만 읽으면 됩니다.

지금 사용 중인 모델공개 문서상 현재 상태신경 써야 할 날짜지금 가장 좋은 다음 행동
gemini-2.5-flash-lite-preview-09-2025종료 예정 preview2026년 3월 31일지금 마이그레이션 계획 시작; Google 권장 대체는 gemini-3.1-flash-lite-preview
gemini-2.5-flash-liteStable2026년 7월 22일오늘 당장 긴급 변경은 아님; 비용 기준으로 이전 계획 수립
gemini-3.1-flash-lite-preview현재 preview 후속 라인Gemini API 문서에 종료일 미공지공식 후속 경로를 따르려면 이 라인 사용
Vertex AI 페이지에 preview 버전이 여전히 표시됨표면별 해석 차이 발생실제 사용 표면/엔드포인트를 확인해야 함대량 치환 전 실제 표면 동작 검증, 단 Gemini API 종료 신호는 무시하지 말 것
gemini-flash-lite-latest 같은 alias/래퍼 사용alias 해석 리스크alias가 현재 무엇으로 resolve되는지에 따라 다름"Flash-Lite"라는 이름만 믿지 말고 실제 resolve 모델 문자열 확인

핵심은 "패밀리 이름"이 아니라 "엔드포인트"입니다. 코드나 프롬프트 설정에 Flash-Lite만 적혀 있으면, 이슈가 긴급한지 아닌지를 아직 판단한 것이 아닙니다.

Gemini 2.5 Flash-Lite Preview, 실제로 종료되나요?

기존 Flash-Lite preview, 2026년 3월 31일 종료 예정인 09-2025 preview, 그리고 별도 안정판 2.5 Flash-Lite 라인을 구분해 보여주는 타임라인
기존 Flash-Lite preview, 2026년 3월 31일 종료 예정인 09-2025 preview, 그리고 별도 안정판 2.5 Flash-Lite 라인을 구분해 보여주는 타임라인

Gemini API 기준으로 가장 명확한 공식 답은 "예"입니다. gemini-2.5-flash-lite-preview-09-2025는 2026년 3월 31일 종료 예정입니다. Google이 공개 Gemini deprecations 페이지에서 이 모델 ID를 직접 종료 대상으로 명시하고, 대체 모델도 **gemini-3.1-flash-lite-preview**로 적어두고 있습니다.

그런데도 많은 사용자가 계속 헷갈리는 이유는 문서가 한 곳에서 일괄 설명되지 않기 때문입니다. 공개 changelog을 보면 수명주기가 조각나 있습니다.

  • gemini-2.5-flash-lite-preview-06-17이 2025년 6월 먼저 등장
  • 안정판 gemini-2.5-flash-lite가 2025년 7월 등장
  • gemini-2.5-flash-lite-preview-09-2025가 2025년 9월에 추가
  • 2026년 3월, Google이 09-2025 preview를 3월 31일에 종료한다고 공지

즉 "Gemini 2.5 Flash-Lite Preview"라는 표현은 시점에 따라 서로 다른 모델 ID를 가리킬 수 있습니다. 옛 preview alias, AI Studio 모델 선택기, 커뮤니티 글의 캡처 화면을 기억하고 있으면 패밀리 이름은 맞아도 엔드포인트가 달라질 수 있습니다.

또 다른 혼선은 제품 표면입니다. Gemini API 문서는 09-2025 preview의 2026년 3월 31일 종료일을 명시합니다. 반면 공개 Vertex AI Flash-Lite 페이지에는 GA gemini-2.5-flash-lite와 함께 gemini-2.5-flash-lite-preview-09-2025 preview 블록이 여전히 보입니다. 그래서 안전한 표현은 다음과 같습니다.

Google의 Gemini API 수명주기 문서에서는 gemini-2.5-flash-lite-preview-09-2025가 2026년 3월 31일 종료 대상이고, 안정판 gemini-2.5-flash-lite는 별도 라인입니다. Vertex 공개 문서에는 preview 버전이 여전히 표시되므로, 실제 운영 라우팅을 바꾸기 전 본인 제품 표면을 반드시 확인해야 합니다.

깔끔한 예/아니오보다 불편한 답이지만, 공개 근거가 뒷받침하는 답은 이것입니다.

헷갈리는 핵심: preview 엔드포인트, 안정판 모델, 과거 preview ID는 서로 다릅니다

이미 종료된 06-17 preview, 종료 예정 09-2025 preview, 그리고 아직 살아 있는 안정판 gemini-2.5-flash-lite를 분리한 보드
이미 종료된 06-17 preview, 종료 예정 09-2025 preview, 그리고 아직 살아 있는 안정판 gemini-2.5-flash-lite를 분리한 보드

이 키워드에서 품질 낮은 페이지는 거의 항상 패밀리 이름만 다루고 엔드포인트 분리를 건너뜁니다. 그러면 문장은 자극적인데 실제 운영 판단에는 도움이 안 됩니다. 최소한 아래 3가지는 분리해서 봐야 합니다.

첫째, **안정판 gemini-2.5-flash-lite**입니다. Google 모델 페이지 Versions 블록에는 이 모델이 Stable로, **gemini-2.5-flash-lite-preview-09-2025**는 Deprecated로 표시됩니다. 이 한 줄만으로도 "Preview 종료 = Flash-Lite 전체 즉시 종료"라는 해석이 틀렸다는 점이 드러납니다.

둘째, 09-2025 deprecated preview 엔드포인트입니다. 2026년 3월 31일 마감과 직접 연결되는 문자열이 바로 이것입니다. 코드, 설정, 저장된 프롬프트, 래퍼 기본값 어디든 이 ID가 있으면 긴급 이관 대상으로 봐야 합니다.

셋째, 과거 06-17 preview 엔드포인트입니다. 이건 이미 과거 이슈입니다. changelog에는 2025년 11월 4일 공지, 2025년 11월 18일 종료로 기록되어 있습니다. 이 이력이 중요한 이유는 커뮤니티 글이나 복붙 코드가 같은 "Flash-Lite Preview"를 말해도 서로 다른 종료 이벤트를 가리킬 수 있기 때문입니다.

그래서 저장소에서 "Flash-Lite"만 찾으면 부족합니다. 아래처럼 전체 모델 문자열로 검색해야 합니다.

bash
rg "gemini-2.5-flash-lite-preview-09-2025|gemini-2.5-flash-lite|gemini-flash-lite-latest"

gemini-2.5-flash-lite만 보이면 3월 31일 긴급군은 아닙니다. gemini-2.5-flash-lite-preview-09-2025가 보이면 긴급군입니다. gemini-flash-lite-latest 같은 alias가 보이면 "아마 안전하겠지"라고 가정하지 말고, 현재 실제 resolve 값을 확인해야 합니다.

이 포인트는 생각보다 중요합니다. 팀이 메인 코드만 바꾸고 아래 표면을 놓치는 경우가 매우 흔합니다.

  • .env 파일
  • 내부 운영 도구
  • 저장된 프롬프트 템플릿
  • 노트북
  • 평가 하네스
  • 배치 작업
  • 래퍼 기본값

종료 이슈는 메인 경로 하나에서만 생기지 않습니다. 대개 "어딘가에 남은 옛 문자열"에서 오래 살아남습니다.

지금 무엇으로 바꿔야 하나

gemini-2.5-flash-lite-preview-09-2025의 공식 대체 모델은 **gemini-3.1-flash-lite-preview**입니다. deprecations 페이지에서 Google이 제시하는 답이고, 문서화된 후속 경로를 따르려면 이 모델 ID를 먼저 검증하는 것이 맞습니다.

다만 모든 사용자가 이를 단순 rename으로 처리해도 된다는 뜻은 아닙니다. 실무에서는 두 질문이 먼저입니다.

  1. 지금 정말 deprecated preview 엔드포인트를 쓰고 있는가?
  2. 공식 후속 라인을 타려는가, 아니면 가장 저렴한 2.5 Flash-Lite 경제성을 최대한 유지하려는가?

Gemini API 또는 Google AI Studio에서 **gemini-2.5-flash-lite-preview-09-2025**를 실제 사용 중이라면, 공식적으로 가장 깔끔한 이동은 아래입니다.

text
gemini-2.5-flash-lite-preview-09-2025 -> gemini-3.1-flash-lite-preview

반대로 비즈니스 목표가 "저비용 Flash-Lite 라인을 가능한 오래 유지"라면, 안정판 **gemini-2.5-flash-lite**는 현재도 공식 모델 페이지에 살아 있고, 공개 가격도 deprecated preview와 같은 행입니다. Google이 preview 종료 항목의 "공식 대체"로 적은 답은 아니므로 표준 마이그레이션 답으로 부르기는 어렵지만, 비용 중심 팀에게는 충분히 유효한 운영 선택지입니다.

이 구분은 이미 발행된 Gemini 3.1 Flash-Lite vs Gemini 2.5 Flash-Lite 비교 결론과도 같습니다. 짧게 정리하면:

  • 문서화된 후속 경로를 원하면 gemini-3.1-flash-lite-preview
  • 최저 비용의 안정 라인이 더 중요하면 gemini-2.5-flash-lite 유지

절대 피해야 할 것은, 3.1로 무심코 옮긴 뒤 청구서를 보고 놀라는 시나리오입니다. 이 교체는 가격이 같은 rename이 아닙니다.

가격, 한도, 마이그레이션 리스크에서 달라지는 점

여기서부터가 실제 운영 판단입니다.

공식 pricing 페이지 기준으로, 안정판 **gemini-2.5-flash-lite**와 deprecated **gemini-2.5-flash-lite-preview-09-2025**는 현재 공개 단가가 같습니다. 공식 대체 모델은 다릅니다.

모델상태Standard 입력 가격Standard 출력 가격실무 요약
gemini-2.5-flash-lite-preview-09-2025Deprecated preview$0.10 / 1M$0.40 / 1M저렴하지만 2026년 3월 31일 종료 시계 위에 있음
gemini-2.5-flash-liteStable$0.10 / 1M$0.40 / 1M공개 경제성 동일, 종료일은 더 늦은 2026년 7월 22일
gemini-3.1-flash-lite-preview현재 preview 후속 라인$0.25 / 1M$1.50 / 1M공식 대체 모델이지만 비용이 유의미하게 높음

즉 권장 대체 모델은:

  • 입력 기준 2.5배 비쌉니다
  • 출력 기준 3.75배 비쌉니다

현재 검색 결과 다수가 이 부분을 작게 다룹니다. 사용자는 "사라지느냐"만 궁금한 게 아니라, 마이그레이션이 조용히 비용 구조를 바꾸는지까지 알고 싶어 합니다.

속도 제한(한도) 쪽은 결론이 조금 더 미묘합니다. 공식 rate-limits 페이지는 preview 모델이 더 제한적일 수 있다고 말하며, AI Studio에서 실제 활성 한도를 확인하라고 안내합니다. 동시에 공개 Batch API 표에는 Gemini 2.5 Flash-Lite와 Gemini 2.5 Flash-Lite Preview의 batch enqueued token 상한이 동일하게 표시됩니다. 따라서 안전한 결론은 "3.1이 공개 처리량에서 무조건 우위"가 아니라 다음입니다.

  • 현재 공개 문서만으로는 마이그레이션 정당화용 처리량 우위가 명확하지 않음
  • preview 한도 동작은 stable보다 예측이 어려울 수 있음
  • 교체의 핵심 근거는 공개 용량 우위보다 수명주기와 모델 품질 쪽에 가까움

그래서 진짜 질문은 "새 이름이 뭐냐"가 아니라, "3.1 라인이 강제 이관 전에 더 높은 토큰 비용을 정당화할 만큼 가치가 있느냐"입니다.

주변 한도·요금 맥락이 더 필요하면 Gemini API rate-limits-per-tier 가이드Gemini API pricing 2026 가이드를 이어서 보면 됩니다.

이름 바꾼 뒤 트러블슈팅: Gemini API, Google AI Studio, Vertex AI

Gemini API, Google AI Studio, Vertex AI에서 종료 이슈가 다르게 나타나는 표면별 마이그레이션 맵
Gemini API, Google AI Studio, Vertex AI에서 종료 이슈가 다르게 나타나는 표면별 마이그레이션 맵

현재 SERP가 가장 자주 놓치는 파트입니다. 모델명을 바꿨는데도 이관 실패처럼 보이는 경우가 많은데, 대개 종료 공지가 틀린 게 아니라 참조가 다른 표면에 남아 있기 때문입니다.

Gemini API

애플리케이션이 Gemini Developer API에서 **gemini-2.5-flash-lite-preview-09-2025**를 직접 호출한다면, 이것은 현재 진행형 마이그레이션 항목으로 취급해야 합니다. Gemini API 수명주기 문서는 충분히 명시적이므로 3월 말까지 미루는 것은 불필요한 리스크입니다. 모델 문자열을 먼저 바꾸고, 가장 작은 요청으로 재검증한 뒤 추가 디버깅으로 넘어가세요.

Google AI Studio

옛 프롬프트, 템플릿, 워크스페이스에 deprecated preview ID가 남아 있으면 API 코드와 본질적으로 같은 문제입니다. 다만 위치만 다릅니다. 실무에서 AI Studio 이관이 자주 실패하는 이유는 코드만 고치고 아래를 놓치기 때문입니다.

  • 저장된 프롬프트 워크스페이스
  • 내부 스크린샷
  • 온보딩 문서
  • 복사된 노트북

그래서 "지난주엔 됐는데요"라는 피드백이 나와도 종료 공지 자체를 바로 의심하지 말고, 저장 프롬프트/다른 프로젝트/미점검 alias 경로를 먼저 확인해야 합니다.

Vertex AI

가장 설명이 까다로운 표면입니다. 공개 문서 자체가 모호함을 만들기 때문입니다. Vertex AI Flash-Lite 공개 페이지에는 안정판 gemini-2.5-flash-lite가 GA로 표시되고, 동시에 gemini-2.5-flash-lite-preview-09-2025 preview 블록도 보입니다. 따라서 "Flash-Lite Preview가 모든 표면에서 끝났다"는 일괄 공지는 피해야 합니다. 그렇다고 Vertex 문서에 preview 행이 보인다는 이유로 Gemini API 종료 신호를 무시해서도 안 됩니다.

운영 관점에서 가장 안전한 규칙은 다음입니다.

  • Gemini Developer API 또는 Google AI Studio를 쓴다면, 마이그레이션 타이밍은 Gemini API 수명주기 문서를 기준으로 판단
  • Vertex AI를 쓴다면, 대량 치환 전에 프로젝트 표면의 실제 엔드포인트 동작을 검증하되 preview 라인이 영구 유지된다고 가정하지 말 것

완벽히 만족스러운 답은 아니지만, 공개 근거를 왜곡하지 않고 운영에 쓸 수 있는 답은 이쪽입니다.

안전한 마이그레이션 체크리스트

이 키워드가 실제 프로덕션 이슈라면 아래 순서를 권장합니다.

  1. 패밀리 이름이 아니라 deprecated 모델 전체 ID를 검색합니다.
  2. 찾은 위치마다 preview gemini-2.5-flash-lite-preview-09-2025와 안정판 gemini-2.5-flash-lite를 분리해 기록합니다.
  3. 목표를 gemini-3.1-flash-lite-preview(공식 후속)로 둘지, 2.5 안정 저비용 라인 유지로 둘지 먼저 결정합니다.
  4. 큰 파이프라인 디버깅 전에 최소 요청 1건으로 재검증합니다.
  5. 저장 프롬프트, 래퍼, 노트북, 배포 설정까지 옛 모델 문자열을 감사(audit)합니다.
  6. Vertex AI라면 일괄 변경 전에 실제 표면 동작을 확인합니다.
  7. 3.1 Flash-Lite Preview로 고트래픽 라인을 옮기기 전에 비용 모델을 다시 계산합니다.

실무 기본값을 하나만 고르면 아래가 가장 안전합니다.

  • 지금 옮겨야 하는 경우: gemini-2.5-flash-lite-preview-09-2025에 명시적으로 고정돼 있음
  • 당장 패닉할 필요 없는 경우: 이미 안정판 gemini-2.5-flash-lite 사용 중
  • 절대 주의할 점: 3.1은 무료 rename이 아니므로 비용 검증 없이 일괄 전환하지 말 것

모델명 교체 뒤 400, 403, 429 같은 광범위 오류가 이어지면 수명주기 추측을 반복하기보다 Gemini API 오류 트러블슈팅 가이드를 바로 확인하는 편이 빠릅니다.

FAQ

안정판 gemini-2.5-flash-lite도 이미 종료됐나요?

아니요. 2026년 3월 21일 기준 Google의 공개 Gemini API 문서에서는 안정판 gemini-2.5-flash-lite를 deprecated preview 행과 분리해 표시합니다. 현재 표시된 안정판 종료일은 2026년 3월 31일이 아니라 2026년 7월 22일입니다.

2026년 3월 31일에 정확히 무엇이 종료되나요?

공식 Gemini API deprecations 페이지에서 **gemini-2.5-flash-lite-preview-09-2025**가 2026년 3월 31일 종료 대상으로 표시됩니다. 이 키워드에서 대부분 사용자가 의미하는 대상도 이 preview 엔드포인트입니다. 같은 페이지는 대체 모델로 **gemini-3.1-flash-lite-preview**를 제시합니다.

이 이슈는 Vertex AI에도 동일하게 적용되나요?

공개 Vertex AI 문서에는 preview 버전이 여전히 표시되므로, Google 모든 표면이 완전히 같은 상태라고 가정하면 위험합니다. 안전한 해석은 Gemini API 수명주기 문서가 preview 종료 신호를 분명히 준다는 점, 그리고 Vertex 쪽은 실제 사용 표면에서 동작을 직접 확인해야 한다는 점입니다. 이 표면 차이가 공개 문서가 있어도 계속 혼선을 만드는 이유입니다.

Nano Banana Pro

4K 이미지80% 할인

Google Gemini 3 Pro Image · AI 이미지 생성

10만+ 개발자 서비스 제공
$0.24/장
$0.05/장
한정 특가·엔터프라이즈 안정성·Alipay/WeChat
Gemini 3
네이티브 모델
직접 접속
20ms 지연
4K 초고화질
2048px
30초 생성
초고속
|@laozhang_cn|$0.05 획득

200+ AI Models API

Jan 2026
GPT-5.2Claude 4.5Gemini 3Grok 4+195
Image
80% OFF
gemini-3-pro-image$0.05

GPT-Image-1.5 · Flux

Video
80% OFF
Veo3 · Sora2$0.15/gen
16% OFF5-Min📊 99.9% SLA👥 100K+