[릴리즈노트]제미나이(Gemini) 2.5: 3가지 모델 업데이트
※ 본문은 구글의 <Gemini 2.5: Updates to our family of thinking models>를 신속하게 전달하기 위해 AI 번역 및 요약을 사용했습니다. 일부 문장에 오역이나 부자연스러운 표현이 있을 수 있으니 참고하시기 바랍니다.
[Gemini 2.5 모델군 주요 업데이트 요약]
1. Gemini 2.5 Pro 및 2.5 Flash 정식 출시
- Gemini 2.5 Pro와 Gemini 2.5 Flash 정식 공개 (각각 06-05, 05-20 미리보기 때와 동일한 모델)
- 두 모델 모두 사고(Reasoning) 능력이 탑재되어, 응답 전 사고 예산(thinking budget)을 설정할 수 있음
- 개발자는 사고 예산을 직접 제어해 모델이 ‘생각’하는 정도를 원하는 만큼 조정할 수 있음
2. Gemini 2.5 Flash-Lite 프리뷰 출시
- Gemini 2.5 Flash-Lite가 프리뷰 형태로 새롭게 공개
- 2.5 모델군 중 가장 낮은 지연 시간(latency)과 비용
- 기존 1.5, 2.0 Flash 대비 성능이 올랐으며, 최초 토큰 응답 속도와 초당 토큰 변환 속도 개선
- 분류와 대규모 요약 등 대량 처리(hight throughput)에 적합
3. Gemini 2.5 Flash 가격 정책 변경
- 입력(input): 기존 1백만 토큰당 $0.15 → $0.30로 인상
- 출력(output): 기존 1백만 토큰당 $3.50 → $2.50으로 인하
- 사고 여부(think/non-think) 가격 구분 폐지, 입력 토큰 크기와 무관하게 단일 요금제 적용
- 2.5 Flash Preview 04-17 모델은 2025년 7월 15일까지 기존 요금 유지 후 서비스 종료 예정
4. Gemini 2.5 Pro 성장세 및 활용 확대
- 코딩, 에이전트 기반 작업 등 최고 수준의 지능과 기능이 필요한 분야에서 강점
- Cursor, Bolt, Cline, Cognition, Windsurf, GitHub, Lovable, Replit, Zed Industries 등 주요 개발 도구가 2.5 Pro 기반으로 동작
요약
Gemini 2.5 모델군의 정식 출시로 다양한 용도 및 비용 구조를 제공. Flash-Lite는 저비용·저지연 작업에, Pro는 고난도·고지능 작업에 최적화.
오늘 저희는 Gemini 2.5 모델 제품군 전반에 걸친 업데이트 소식을 전해드립니다.
- Gemini 2.5 프로(Pro)를 정식으로 출시하며 안정화되었습니다(06-05 프리뷰 버전과 동일).
- Gemini 2.5 플래시(Flash) 역시 정식으로 출시하며 안정화되었습니다(05-20 프리뷰 버전과 동일, 아래 가격 업데이트 참고).
- Gemini 2.5 플래시-라이트(Flash-Lite)가 프리뷰 버전으로 새롭게 제공됩니다.
Gemini 2.5 모델은 사고(thinking) 기반 모델로, 응답을 생성하기 전에 스스로 사고 과정을 거치기 때문에 성능과 정확성이 크게 향상되었습니다. 각 모델은 사고 예산(thinking budget)을 제어할 수 있어, 개발자는 응답 생성 전 모델이 언제, 얼마나 “사고”할지 직접 선택할 수 있습니다.

Gemini 2.5 플래시-라이트(Flash-Lite) 소개
2.5 플래시-라이트(Flash-Lite)를 미리보기 버전으로 선보입니다. 이 모델은 2.5 모델 제품군 중 가장 짧은 지연 시간과 가장 낮은 비용을 자랑합니다. 기존 1.5 및 2.0 플래시(Flash) 모델의 비용 효율적인 업그레이드로 설계되었으며, 대부분의 평가 지표에서 더 나은 성능을 제공하고, 첫 토큰 생성까지의 시간이 더 짧으며, 초당 토큰 처리 속도도 더 높습니다. 대규모 분류나 요약 등 높은 처리량이 요구되는 작업에 적합합니다.
Gemini 2.5 플래시-라이트(Flash-Lite)는 사고 기반 모델로, 응용프로그램 인터페이스(API) 매개변수를 통해 사고 예산을 동적으로 제어할 수 있습니다. 플래시-라이트(Flash-Lite)는 비용과 속도에 최적화되어 있기 때문에, 다른 모델과 달리 기본적으로 사고 기능이 꺼져 있습니다. 2.5 플래시-라이트(Flash-Lite)는 구글 검색 연동(Grounding with Google Search), 코드 실행(Code Execution), 주소(URL) 기반 맥락 제공(URL Context), 함수 호출(Function Calling) 등 모든 기본 도구를 지원합니다.

Gemini 2.5 플래시(Flash) 및 가격 정책 업데이트
지난 1년간 저희 연구팀은 플래시(Flash) 모델 시리즈의 한계를 지속적으로 확장해왔습니다. 2.5 플래시(Flash)를 처음 발표할 당시, 2.5 플래시-라이트(Flash-Lite)의 기능이 아직 확정되지 않았으며, 사고 기능 유무에 따라 가격을 달리 적용해 개발자 혼란이 있었습니다.
이번에 정식으로 출시되는 Gemini 2.5 플래시(Flash)는(구글 I/O에서 공개된 5월 20일자 미리보기 버전과 동일) 뛰어난 성능을 바탕으로 가격 정책을 다음과 같이 조정합니다.
- 입력 토큰 100만 개당 0.30달러(기존 0.15달러에서 인상)
- 출력 토큰 100만 개당 2.50달러(기존 3.50달러에서 인하)
- 사고 기능 유무에 따른 가격 차등을 없앴습니다.
- 입력 토큰 크기와 관계없이 단일 가격 체계를 유지합니다.
저희는 미리보기와 정식 버전 간 가격 변동을 최소화하려 노력하고 있으나, 이번 조정은 플래시(Flash) 모델의 뛰어난 가성비를 반영한 예외적인 조치로, 여전히 최고의 비용 대비 지능을 제공합니다.
또한 Gemini 2.5 플래시-라이트(Flash-Lite)를 통해, 사고 기능 유무와 관계없이 더 낮은 비용과 지연 시간으로, 상대적으로 적은 모델 지능이 필요한 비용 및 속도 민감형 활용 사례에 적합한 선택지를 제공하게 되었습니다.

만약 Gemini 2.5 플래시(Flash) 미리보기 4월 17일자 버전을 사용 중이라면, 해당 미리보기 가격은 2025년 7월 15일까지 유지되며, 이후 해당 모델 엔드포인트는 종료될 예정입니다. 정식 버전인 “gemini-2.5-flash”로 전환하거나, 더 저렴한 옵션인 2.5 플래시-라이트(Flash-Lite) 미리보기로 변경하실 수 있습니다.
Gemini 2.5 프로(Pro)의 지속적인 성장
Gemini 2.5 프로(Pro)에 대한 성장세와 수요는 지금까지 저희가 선보인 모든 모델 중 가장 가파르게 증가하고 있습니다. 더 많은 고객이 실제 환경에서 이 모델을 활용할 수 있도록, 6월 5일자 버전을 안정화 버전으로 지정하며, 기존과 동일한 파레토 프론티어(Pareto Frontier) 가격 정책을 유지합니다.
최고 수준의 지능과 다양한 기능이 요구되는 상황, 예를 들어 코딩이나 에이전트 기반 작업 등에서 프로(Pro) 모델의 강점을 확인하실 수 있습니다. Gemini 2.5 프로(Pro)는 많은 개발자들이 사랑하는 주요 개발 도구의 핵심에 자리하고 있습니다.

Gemini 2.5 프로(Pro)를 활용하는 대표적인 개발 도구로는 Cursor, Bolt, Cline, Cognition, Windsurf, GitHub, Lovable, Replit, Zed Industries 등이 있습니다.
만약 2.5 프로(Pro) 미리보기 5월 6일자 버전을 사용 중이라면, 해당 모델은 2025년 6월 19일까지 제공되며 이후 종료됩니다. 2.5 프로(Pro) 미리보기 6월 5일자 버전을 사용 중이라면, 모델 문자열을 “gemini-2.5-pro”로 변경하시면 됩니다.
앞으로도 더 많은 분야에서 2.5 프로(Pro)의 지능을 활용하는 사례가 늘어나길 기대하며, 프로(Pro)를 넘어서는 확장에 대한 소식도 곧 전해드릴 수 있기를 바랍니다.