AI[릴리즈노트]오픈AI GPT-5 핵심 요약
에디터가 직접 고른 실무 인사이트
매주 목요일에 만나요.
0명 뉴스레터 구독 중 >를 신속하게 전달하기 위해 AI 번역 및 요약을 사용했습니다. 일부 문장에 오역이나 부자연스러운 표현이 있을 수 있으니 참고하시기 바랍니다. GPT-5를 활용해 번역 및 요약했습니다.
GPT-5 출시 핵심 요약
성능 향상
- 이전 모델 대비 전 분야 지능 대폭 향상: 코딩·수학·글쓰기·건강·시각 인식 등 최고 성능 기록
- 수학 AIME 2025(도구 미사용) 94.6%, 실무 코딩 SWE-bench Verified 74.9%, 건강 HealthBench Hard 46.2% 달성
- 환각(사실 오류) 발생률 GPT-4o 대비 약 45%↓, OpenAI o3 대비 약 80%↓(추론 모드)
AIME
코딩 벤치마크
모델 구조
- 하나의 통합 시스템
- 일반 질문용 기본 모델
- 난도 높은 문제용 깊은 추론 모델(GPT-5 사고)
- 대화 유형·복잡도·도구 필요성에 따라 자동 선택하는 실시간 라우터
- 사용 한도 초과 시에도 축소판(mini) 모델로 대응
코딩 성능
- 복잡한 프론트엔드 생성, 대규모 저장소 디버깅 능력 향상
- 단일 지시로 완성도 높은 웹·앱·게임 구현 가능
- 디자인 요소(여백, 글꼴, 공백) 이해도 개선
글쓰기
- 구조적 난이도가 높은 글쓰기(자유시, 운율)에서 안정적인 완성
- 일상 문서 작성·편집 지원 능력 강화
건강 분야
- HealthBench 평가 최고 성능, 이전 모델 대비 더 정밀하고 신뢰도 높은 답변
- 사용자의 상황·지식 수준·지역 맥락에 맞춘 대응
- 의사 대체가 아닌 건강 이해·질문 준비·선택지 검토 보조
시쓰
암 위험 이해
추가 개선 사항
- 지시 수행·도구 활용·멀티모달(문자+이미지+영상) 처리 능력 향상
- 맞장구 성향 14.5%→6% 미만 감소, 불필요한 이모지 사용 축소
- 안전한 완성(Safe Completion) 도입으로 위험 가능성 있는 요청에 균형 있는 대응
GPT-5 프로(Pro)
- 장시간 추론 수행, 과학·의학·수학·코딩에서 최고 성능
- 전문가 평가에서 GPT-5 사고 모델 대비 67.8% 선호, 주요 오류 22% 감소
이용 가능 대상
- 기본 모델로 GPT-4o, o3, o4-mini, GPT-4.1, GPT-4.5를 대체
- 플러스·프로·팀·무료 사용자 순차 제공, 엔터프라이즈·교육용은 1주 후 제공
- 무료 사용자는 한도 도달 시 GPT-5 미니로 전환
- 이 요약은 원문 전체의 핵심 비교·수치·대상 정보를 포함하였으므로, 독자가 2분 내에 주요 내용을 모두 파악할 수 있습니다.