지금 Gemini로 이미지 생성을 시작하려면 먼저 Nano Banana 2 부터 보면 됩니다. 코드를 쓰지 않고 가장 빨리 첫 이미지를 만들고 싶다면 Gemini 앱, 개발자 UI에서 프롬프트를 먼저 시험해 보고 싶다면 AI Studio, 반복 가능한 워크플로와 제품 통합이 필요하다면 Gemini API가 기본 경로입니다.
이 키워드가 헷갈리는 이유는 Gemini가 이미지를 만들 수 있는지 여부가 아닙니다. 이미 만들 수 있습니다. 문제는 검색 결과가 앱, AI Studio, API를 서로 다른 작업이 아니라 같은 답처럼 섞어 놓는다는 점입니다. 시작 surface를 잘못 고르면 그 뒤의 가격, quota, 해상도, 모델 선택까지 전부 흐려집니다.
가장 짧지만 쓸모 있는 답부터 보려면 먼저 이 표를 보면 됩니다.
| 필요한 것 | 먼저 가야 할 곳 | 지금 이 경로가 맞는 이유 | 언제 바꿔야 하나 |
|---|---|---|---|
| 코드 없이 가장 빨리 이미지 만들기 | Gemini 앱 | 현재 help page가 Nano Banana 2를 create / edit 기본 흐름으로 두고 있고 첫 결과까지 가장 짧다 | 재현성, 로깅, 프로그램 제어가 필요해질 때 |
| UI에서 먼저 프롬프트 실험하기 | AI Studio | builder 관점에서 prompt를 시험하기 좋지만 현재 주력 이미지 모델은 유료 API key가 필요하다 | 자동화나 제품 통합으로 넘어갈 때 |
| 운영 가능한 워크플로와 명시적 제어 | Gemini API | 모델 선택, aspect ratio, image size, 재시도를 구조적으로 다룰 수 있다 | 텍스트가 많거나 더 비싼 자산일 때만 Pro로 올리면 된다 |
| 텍스트가 많거나 더 고품질이 필요한 이미지 | Nano Banana Pro | 실패 비용이 큰 이미지에서만 프리미엄 비용이 정당화된다 | 대부분의 사용자는 여기서 시작할 필요가 없다 |
핵심 요약
- 코드 없이 가장 빠르게 결과를 보려면 Gemini Apps 도움말을 보고 앱부터 시작하는 것이 가장 쉽습니다.
- builder용 UI가 필요하면 Google AI Studio를 쓸 수 있지만, Google의 2026년 2월 26일 Nano Banana 2 개발자 글은 이 모델에 유료 API key가 필요하다고 적고 있습니다.
- 예산, 크기 제어, 자동화 가능한 흐름이 필요하면 Gemini image-generation docs와 pricing 페이지를 기준으로 API 경로를 설계해야 합니다.
먼저 결정할 것은 Gemini 이미지 생성의 입구다

Gemini 이미지 생성에서 가장 비싼 실수는 Google의 여러 surface를 하나의 제품처럼 취급하는 것입니다.
Gemini 앱은 일반 사용자용 경로입니다. 현재 Gemini Apps 도움말은 Nano Banana 2로 이미지를 만들고, 만든 이미지를 수정하고, 사용자의 이미지를 올려 바꾸고, 여러 장을 합쳐 새 장면을 만드는 흐름을 안내합니다. 같은 페이지는 무료 사용자가 1K, 유료 구독자가 2K로 내려받는다고도 설명합니다. 그래서 목표가 "일단 빨리 한 장 만들기"라면 앱이 가장 자연스러운 시작점입니다.
AI Studio는 builder용 playground입니다. 코드를 쓰기 전에 prompt 구조를 시험하거나 모델 반응을 UI에서 비교하고 싶을 때 유용합니다. 하지만 여기서 많은 튜토리얼이 흐려집니다. billing FAQ는 새 계정이 Free tier에서 시작한다고 설명하지만, 같은 날 공개된 Nano Banana 2 개발자 글은 AI Studio에서 이 모델을 쓰려면 유료 API key가 필요하다고 분명히 말합니다. 안전한 해석은 "AI Studio는 무조건 무료"도 아니고 "무조건 유료"도 아니라, surface와 모델 조합에 따라 조건이 달라진다는 것입니다.
Gemini API는 운영 경로입니다. 명시적인 모델 선택, 구조화된 prompt, 로그, 재시도, 자체 서비스 안의 통합이 필요해지는 순간 여기로 넘어와야 합니다. 현재 image-generation docs도 이미지 생성, 편집, multi-turn refinement, aspect ratio, image size를 API 관점에서 설명합니다.
그래서 실전 순서는 surface를 먼저 고르고, 그 다음 프롬프트를 다듬고, 마지막에 가격과 해상도 최적화를 붙이는 쪽이 맞습니다.
기본값은 Nano Banana 2지만 Pro와 legacy 2.5의 자리도 알아야 한다
이 주제에서 가장 빨리 낡는 부분은 모델 추천입니다.
현재 image-generation docs는 **gemini-3.1-flash-image-preview**를 품질과 비용의 균형이 가장 좋은 기본 이미지 모델로 설명합니다. 이것이 지금의 Nano Banana 2입니다. deprecations 페이지는 이 모델의 공개일을 2026년 2월 26일로 적고 있고, 아직 종료일은 표시하지 않습니다. 새 워크플로의 기본 답으로 삼기에 충분합니다.
하지만 기본값이 유일한 답은 아닙니다.
| 모델 | 현재 위치 | 현재 공식 가격 | 잘 맞는 용도 | 주의할 점 |
|---|---|---|---|---|
gemini-3.1-flash-image-preview | 현재 기본 라인, 2026년 2월 26일 출시 | 공개 free tier 없음. 0.5K 약 $0.045, 1K $0.067, 2K $0.101, 4K $0.151 | 새 이미지 생성과 편집의 기본 루트 | preview이므로 quota 확인 필요 |
gemini-3-pro-image-preview | 현재 상위 라인 | 공개 free tier 없음. 1K / 2K 약 $0.134, 4K $0.24 | 텍스트가 많은 이미지, 인포그래픽, 고가치 최종 결과물 | Flash Image보다 훨씬 비싸다 |
gemini-2.5-flash-image | 아직 살아 있는 legacy 라인 | 공개 free tier 없음. 표준 약 $0.039, batch $0.0195 | 공식 최저가 라인만 노릴 때 | 2026년 10월 2일 종료 예정 |
대부분의 사용자는 먼저 Nano Banana 2로 시작하면 됩니다. 이미지 안 텍스트 정확도나 정보량이 중요한 경우에만 Nano Banana Pro를 올리고, gemini-2.5-flash-image는 "아직 저렴한 legacy 라인" 정도로 이해하는 편이 맞습니다.
가격만 깊게 보고 싶다면 Gemini 이미지 생성 API 가격 가이드, 무료 여부가 궁금하다면 Gemini image generation free tier가 더 직접적인 페이지입니다. 이 글은 우선 첫 실행 경로를 제대로 잡는 데 집중합니다.
가장 빠른 첫 실행은 Gemini 앱이나 AI Studio에서 시작된다
아직 코드를 쓸 준비가 안 됐다면, 굳이 API부터 들어갈 필요는 없습니다. 먼저 프롬프트와 결과의 루프를 가장 잘 볼 수 있는 곳에서 시작하는 편이 낫습니다.
Gemini 앱에서는 흐름이 짧습니다.
- Gemini를 열고 Create image를 누른다.
- "create", "draw", "generate"처럼 명확한 동사로 시작한다.
- 피사체, 스타일, 배경, 분위기를 한 문장이나 짧은 단락으로 설명한다.
- 새 이미지가 아니라 편집이라면 이미지를 업로드하고 무엇만 바꿀지 분명히 말한다.
- 거의 맞지만 마감 품질이 아쉽고 유료 플랜이라면 Redo with Pro를 쓴다.
이 순서가 좋은 이유는 처음부터 API 필드를 고민하지 않아도, 어떤 prompt가 원하는 결과에 가까운지 먼저 배울 수 있기 때문입니다. 현재 도움말도 이미지 생성과 편집의 중심을 Nano Banana 2에 두고 있고, Nano Banana Pro는 redo option으로 배치합니다.
AI Studio는 builder처럼 시험하고 싶은 사람에게 더 어울립니다. 비슷한 prompt를 여러 방식으로 바꿔 보거나, 모델 반응을 UI에서 확인하고 싶다면 편합니다. 다만 이곳을 "앱과 같은 무료 이미지 입구"로 보면 안 됩니다. 현재 주력 모델에는 유료 API key 조건이 붙어 있으므로, AI Studio는 무료 우회로가 아니라 개발자용 실험면으로 보는 것이 안전합니다.
실전 순서는 다음과 같습니다.
- 결과 한 장이 먼저 필요하면 Gemini 앱
- 코딩 전에 프롬프트 동작을 보고 싶으면 AI Studio
- 자동화와 제품 통합이 필요하면 Gemini API
이 순서를 지키면 불필요한 API 디버깅을 많이 줄일 수 있습니다. 이미지 편집이 주목적이라면 다음 읽을 글은 Gemini 이미지-투-이미지 편집 가이드입니다.
반복 가능한 흐름을 만들려면 Gemini API로 가야 한다

재현성이 필요한 순간부터 진짜 튜토리얼은 API 영역으로 들어갑니다.
현재 image-generation docs는 text-to-image뿐 아니라 text-plus-image 편집도 지원하고, multi-turn refinement를 명시적으로 권장합니다. 이 점이 중요합니다. Gemini 이미지 생성은 거대한 프롬프트 한 번으로 끝내려 하기보다, 한 번 생성하고 같은 대화 안에서 계속 다듬는 흐름이 더 현실적입니다.
첫 API 호출은 최대한 단순하게 시작하는 편이 안전합니다. gemini-3.1-flash-image-preview를 쓰고, 필요하다면 aspect ratio를 지정하고, 정말 필요할 때만 image size를 명시합니다.
jsimport { GoogleGenAI } from "@google/genai"; const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY }); const prompt = ` Create a clean 16:9 product hero image of a matte black travel mug on a light concrete surface. Use soft studio lighting, sharp detail on the mug texture, and leave calm negative space on the right. `; const response = await ai.models.generateContent({ model: "gemini-3.1-flash-image-preview", contents: prompt, config: { responseModalities: ["TEXT", "IMAGE"], imageConfig: { aspectRatio: "16:9", imageSize: "2K" } } });
이 예제가 일부러 평범한 이유는, 먼저 확실히 동작하는 기준점을 만드는 것이 중요하기 때문입니다. 실제 결과를 크게 바꾸는 요소는 네 가지입니다.
- model은 비용, 품질, 기본 경로를 바꾼다
- aspectRatio는 구도를 바꾼다
- imageSize는 해상도와 가격을 바꾼다
- prompt 형태는 거의 나머지 전부에 영향을 준다
편집이 목적이라면 생성보다 더 좁게 써야 합니다. 어디를 바꾸고 무엇을 유지할지 정확히 적어야 합니다. Google의 다소 오래된 prompt guide도 같은 원칙을 말합니다. 키워드를 쌓기보다 장면을 설명하고, 로컬 편집에서는 "그 부분만 바꾸라"고 못 박는 쪽이 안정적입니다.
또 하나 중요한 점은 이미지 생성을 운영 시스템으로 다루는 것입니다. rate-limits 페이지는 live limit이 모델과 tier에 따라 달라진다고 적고 있고, 커뮤니티에서는 JS SDK와 AI Studio 사이에서 imageSize 동작이 다르게 보였다는 보고도 있습니다. SDK 출력이 이상하다면 모델을 탓하기 전에 SDK 버전을 확인하고, 같은 prompt를 AI Studio에서 교차 검증하는 편이 맞습니다.
비용 대비 성능을 더 좁혀 보고 싶다면 가장 저렴한 Gemini 3.1 Flash Image Preview API 가이드가 다음 읽을 거리입니다.
결과가 더 좋아지는 프롬프트 패턴
Gemini에서 약한 이미지를 가장 빨리 얻는 방법은 짧은 키워드만 던지고 모델이 알아서 채우길 기대하는 것입니다.
Google의 prompt 가이드가 반복해서 말하듯, 키워드 묶음보다 장면을 묘사하는 문장이 더 잘 통합니다. 현재 Gemini 이미지 라인에서도 이 원칙은 그대로 유효합니다.
실전 튜토리얼에서 특히 중요한 패턴은 네 가지입니다.
1. 처음부터 만드는 text-to-image.
피사체 + 동작 + 환경 + 스타일 + 구도로 쓰면 안정적입니다. 예를 들어 "해가 막 뜨는 시간의 오래된 나무 테이블 위에 놓인 도자기 머그컵을, 부드러운 측면 조명과 보이는 김까지 포함한 16:9 사실적 제품 사진으로 만들어라" 같은 식입니다.
2. 이미지 일부만 바꾸는 local edit.
이 경우에는 직설적인 프롬프트가 좋습니다. "입력 이미지를 사용해 파란 소파만 짙은 초록색 벨벳 소파로 바꾸고, 조명과 방 배치, 다른 가구는 그대로 유지하라" 같은 식입니다. 많은 edit prompt는 새 요소만 말하고 원본을 보호하는 지시를 빼먹습니다.
3. 여러 이미지 합성이나 style transfer.
Gemini 이미지 스택은 multi-image workflow를 다룰 수 있습니다. 그래서 각 이미지가 무슨 역할을 하는지 적어야 합니다. 예를 들어 "이미지 1의 가방을 이미지 2의 스튜디오 장면 안에 넣고, 가방 비율은 유지하고, 이미지 2의 상단 조명에 맞춰라"처럼 써야 합니다.
4. 텍스트가 많거나 인포그래픽 성격의 이미지.
이 구간은 Nano Banana Pro를 검토할 의미가 커집니다. 화면 안에 들어갈 문구, 레이아웃, 그래픽 스타일을 명시해야 합니다. 예를 들어 "물의 순환을 설명하는 16:9 인포그래픽을 만들고, 'Evaporation', 'Condensation', 'Precipitation'을 굵은 sans-serif로 읽기 쉽게 배치하라" 같은 식입니다.
공통 원칙은 하나입니다. Gemini에게 무엇이 중요한지, 무엇을 지켜야 하는지, 어떤 시각 언어를 기대하는지를 분명히 말해야 합니다.
트러블슈팅: 왜 Gemini 이미지 생성이 생각보다 어렵게 느껴질까

Gemini 이미지 생성이 답답한 이유는 많은 실패가 처음엔 "프롬프트가 나빴다"처럼 보이기 때문입니다. 실제로는 surface 문제인 경우가 적지 않습니다.
첫 번째는 surface를 잘못 고른 경우입니다. 프롬프트 감각을 배우는 단계라면 앱이나 AI Studio가 API보다 관찰하기 쉽습니다. 반대로 제품에 넣으려는 기능을 앱 경험으로 판단하면 기준이 잘못됩니다.
두 번째는 무료와 유료 이야기를 섞는 경우입니다. billing FAQ, Nano Banana 2 개발자 글, pricing 페이지는 서로 다른 층을 설명합니다. 이를 구분하지 않고 한 문장으로 묶으면 전부 모순처럼 들립니다.
세 번째는 프롬프트가 지나치게 모호한 경우입니다. Gemini가 문맥을 잘 이해하더라도, 지켜야 할 영역을 말하지 않으면 한계가 있습니다. 편집에서 너무 많이 바뀌면 범위를 줄이고, 새 이미지가 평범하면 장면 언어를 더 늘려야 합니다.
네 번째는 quota와 key 상태입니다. rate-limits 페이지는 tier 의존성을 명시하고 있고, 커뮤니티에는 paid key를 붙인 직후에도 상태가 헷갈렸다는 보고가 있습니다. AI Studio가 free generation이 끝난 것처럼 보인다면, 오래된 캡처를 믿기 전에 project와 live usage를 확인해야 합니다.
다섯 번째는 SDK 불일치입니다. docs에는 imageSize 지원이 나오지만, 특정 SDK 버전에서는 기대한 2K 출력이 안 보였던 사례가 있습니다. 이런 경우는 API 기능이 없다는 뜻이 아니라, SDK 업데이트와 AI Studio 비교 검증이 먼저라는 뜻입니다.
여섯 번째는 시작 모델이 이미 오래된 경우입니다. gemini-2.5-flash-image는 아직 사용할 수 있지만, deprecations 페이지는 2026년 10월 2일 종료를 예고합니다. 새 워크플로의 출발점은 여전히 Nano Banana 2여야 합니다.
실제 질문이 "언제 limit이 리셋되나"나 "어디까지 무료인가"라면, Gemini image generation limit reset과 Gemini image API free tier가 더 직접적인 답을 줍니다.
결론
2026년의 좋은 Gemini 이미지 생성 튜토리얼은 모델 이름만 나열한 페이지도 아니고, Google docs 한 장을 요약한 페이지도 아닙니다.
대부분의 경우 Nano Banana 2부터 시작하면 됩니다. 가장 빠른 no-code 경로는 Gemini 앱, builder용 실험 경로는 AI Studio, 재현성, 이미지 크기 제어, 재시도, 제품 통합이 필요하면 Gemini API입니다. Nano Banana Pro는 텍스트가 많거나 더 비싼 자산일 때만 올리고, gemini-2.5-flash-image는 저렴한 legacy 라인으로 별도로 이해하는 편이 맞습니다.
처음에 올바른 surface를 고르면 Gemini 이미지 생성은 검색 결과가 주는 인상보다 훨씬 덜 혼란스럽습니다. 실제로 어려운 부분은 모델보다 시작 경로입니다.
