요즘IT
위시켓
콘텐츠프로덕트 밸리
요즘 작가들컬렉션물어봐
놀이터
콘텐츠
프로덕트 밸리
요즘 작가들
컬렉션
물어봐
놀이터
새로 나온
인기
개발
AI
IT서비스
기획
디자인
비즈니스
프로덕트
커리어
트렌드
스타트업
서비스 전체보기
위시켓요즘IT
고객 문의
02-6925-4867
10:00-18:00주말·공휴일 제외
yozm_help@wishket.com
요즘IT
요즘IT 소개작가 지원
기타 문의
콘텐츠 제안하기광고 상품 보기
요즘IT 슬랙봇크롬 확장 프로그램
이용약관
개인정보 처리방침
청소년보호정책
㈜위시켓
대표이사 : 박우범
서울특별시 강남구 테헤란로 211 3층 ㈜위시켓
사업자등록번호 : 209-81-57303
통신판매업신고 : 제2018-서울강남-02337 호
직업정보제공사업 신고번호 : J1200020180019
제호 : 요즘IT
발행인 : 박우범
편집인 : 노희선
청소년보호책임자 : 박우범
인터넷신문등록번호 : 서울,아54129
등록일 : 2022년 01월 23일
발행일 : 2021년 01월 10일
© 2013 Wishket Corp.
로그인
요즘IT 소개
콘텐츠 제안하기
광고 상품 보기
AI

[릴리즈 노트] OpenAI, GPT 5.2 공개

AI입니다만
3분
4시간 전
315
에디터가 직접 고른 실무 인사이트 매주 목요일에 만나요.
newsletter_profile0명 뉴스레터 구독 중

※ 본문은 오픈AI의  <Introducing GPT- 5.2>를 신속하게 전달하기 위해 AI 번역 및 요약을 사용했습니다. 일부 문장에 오역이나 부자연스러운 표현이 있을 수 있으니 참고하시기 바랍니다. GPT-5를 활용해 번역 및 요약했습니다.

 

한줄 요약

GPT-5.2는 AI가 이미 업무 속도와 품질을 개선하고 있는 현 상황에서, 사용자에게 더 큰 경제적 가치를 제공하도록 새롭게 설계된 모델입니다.

 

주요 성능 및 특징 요약

전문가 수준 도달

  • 44개 직종의 지식 업무를 평가하는 GDPval 벤치마크에서 최초로 인간 전문가 수준에 도달한 모델입니다.
  • 어려운 지식 작업의 70.7%에서 업계 최고 전문가와 동등하거나 능가하는 결과를 보였습니다. (처리 속도 3배 빠름, 비용 약 1% 수준)

 

<출처: 오픈AI 블로그>

 

코딩 성능

  • 실제 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Pro에서 55.6%를 기록하며 최고 기록을 달성했습니다 (이전 최고 기록 50.8%).
  • SWE-bench Verified에서도 80.0%를 기록했습니다.
  • 프로덕션 코드 디버깅, 기능 구현, 대규모 코드베이스 리팩터링 등 개발 업무 안정성이 크게 향상되었습니다.
  • 프런트엔드 작업, 특히 3D 요소를 포함한 복잡하거나 비표준적인 UI 작업에서 성능 향상이 두드러집니다.

 

<출처: 오픈AI 블로그>

 

사실성 및 정확도

  • GPT-5.1 Thinking 대비 환각 오류가 약 38% 감소했습니다.
  • 연구, 분석, 의사 결정 지원 등 전문 작업의 신뢰도가 높아졌습니다.

 

과학 및 수학

  • 석박사급 난이도의 과학 문제 벤치마크인 GPQA Diamond에서 GPT-5.2 Pro가 93.2%를 기록하며 세계 최고 수준을 보였습니다.
  • 고급 수학 문제 벤치마크인 FrontierMath (Tier 1–3)에서 40.3%를 기록했습니다 (이전 31.0%).

 

 

개발자를 위한 추가 개선 사항

긴 컨텍스트 추론 강화

  • 최대 256k 토큰에 걸친 심층 문서 분석에서 일관성과 정확성을 유지합니다.
  • 긴 문서, 계약서, 다중 파일 프로젝트 등 방대한 정보 기반 추론 작업에 특히 유리합니다.
  • 최대 컨텍스트 윈도우를 넘어서는 추론을 위해 /compact 엔드포인트가 새롭게 제공됩니다.

 

 

도구 호출 (에이전트 기능)

  • Tau2-bench Telecom에서 98.7%를 기록하며 장기·다중 단계 작업 전반에서 도구를 안정적으로 활용합니다.
  • 여러 시스템에서 데이터 수집, 분석, 최종 산출물 생성을 포함하는 복잡한 엔드 투 엔드 워크플로를 안정적으로 처리할 수 있습니다.

 

비전 기능

  • 차트 해석 및 GUI 스크린샷 이해 (ScreenSpot-Pro 86.3%) 등 시각 정보가 중요한 워크플로를 정확하게 지원합니다.

 

 

모델 라인업 및 특징

GPT-5.2 시리즈는 사용 목적에 따라 Instant, Thinking, Pro 세 가지 모델로 구됩니다.

 

GPT-5.2 Thinking(gpt-5.2)

  • 전문가용 작업에서 가장 뛰어난 성능과 정교함을 제공하는 핵심 모델입니다.
  • API에서 작업 난이도에 따라 다섯 가지 추론 강도(새로운 xhigh 포함)를 선택하여 성능을 최적화할 수 있습니다.

 

GPT-5.2 Instant (gpt-5.2-chat-latest):

  • 빠른 속도와 강력한 성능의 균형을 갖춘 모델로, 일상 업무 및 학습 전반에 적합합니다.

 

GPT-5.2 Pro (gpt-5.2-pro):

  • 가장 뛰어난 지능과 신뢰도를 제공하며, 난이도 높은 질문이나 복잡한 프로그래밍, 과학 분야에 최적화되어 있습니다.

 

 

출시 및 가격 정보

  • ChatGPT 출시: 오늘부터 유료 플랜(Plus, Pro, Business, Enterprise)을 대상으로 순차적으로 공개됩니다.
  • API 출시: 오늘부터 모든 개발자가 사용 가능합니다.
  • API 가격 (100만 토큰당)

gpt-5.2 / gpt-5.2-chat-latest: 입력 $1.75, 출력 $14 (GPT-5.1 대비 성능 향상에 따라 가격 상승. 단, 캐시된 입력값은 90% 할인 적용)

gpt-5.2-pro: 입력 $21, 출력 $168

 

 

안전성 및 향후 계획

  • 안전성 개선: 자살/자해, 정신 건강, 감정적 의존 등 민감한 대화에서 부적절한 응답이 감소했습니다.
  • 미래: GPT-5.2는 지속적인 개선 과정의 일부이며, 과도한 거절 문제 해결 및 전반적인 안전성/신뢰성 강화 작업이 계속 진행될 예정입니다.