요즘IT
위시켓
AIDP - AX
콘텐츠프로덕트 밸리
요즘 작가들컬렉션물어봐
놀이터
콘텐츠
프로덕트 밸리
요즘 작가들
컬렉션
물어봐
놀이터
새로 나온
인기
개발
AI
IT서비스
기획
디자인
비즈니스
프로덕트
커리어
트렌드
스타트업
서비스 전체보기
위시켓요즘ITAIDP - AX
고객 문의
02-6925-4867
10:00-18:00주말·공휴일 제외
yozm_help@wishket.com
요즘IT
요즘IT 소개작가 지원
기타 문의
콘텐츠 제안하기광고 상품 보기
요즘IT 슬랙봇크롬 확장 프로그램
이용약관
개인정보 처리방침
청소년보호정책
㈜위시켓
대표이사 : 박우범
서울특별시 강남구 테헤란로 211 3층 ㈜위시켓
사업자등록번호 : 209-81-57303
통신판매업신고 : 제2018-서울강남-02337 호
직업정보제공사업 신고번호 : J1200020180019
제호 : 요즘IT
발행인 : 박우범
편집인 : 노희선
청소년보호책임자 : 박우범
인터넷신문등록번호 : 서울,아54129
등록일 : 2022년 01월 23일
발행일 : 2021년 01월 10일
© 2013 Wishket Corp.
로그인
요즘IT 소개
콘텐츠 제안하기
광고 상품 보기
AI

[릴리즈 노트] AI가 직접 컴퓨터 조작, 오픈AI GPT-5.4 출시

AI입니다만
3분
2026.03.06.
3.3K
에디터가 직접 고른 실무 인사이트 매주 목요일에 만나요.
newsletter_profile0명 뉴스레터 구독 중

※ 본문은 OpenAI의 <Introducing GPT-5.4>를 신속하게 전달하기 위해 AI 번역 및 요약을 사용했습니다. 요즘IT 실무자에게 필요한 정보 전달을 위해 내용을 일부 생략하고 배치를 조정했습니다.

 

GPT-5.4 요약

1. 핵심

  • GPT-5.3-Codex의 코딩 성능과 GPT-5.2의 추론·전문 지식을 하나로 통합한 프론티어 모델
  • 오픈AI 범용 모델 최초로 네이티브 컴퓨터 사용(Computer Use) 기능 내장
  • 최대 100만 토큰 컨텍스트 윈도우 지원(API·Codex 프리뷰)
  • GPT-5.2 대비 개별 팩트 오류 33% 감소, 전체 응답 오류 포함 확률 18% 감소

 

2. 가격 및 제공 범위

  • ChatGPT Plus, Team, Pro 구독자에게 GPT-5.4 Thinking으로 순차 제공(GPT-5.2 Thinking 대체)
  • GPT-5.4 Pro는 Pro 및 Enterprise 요금제 전용
  • API: 입력 백만 토큰당 2.50달러 / 출력 백만 토큰당 15달러 (GPT-5.4 Pro는 30달러/180달러)
  • GPT-5.2 Thinking은 레거시 모델로 3개월 유지 후 2026년 6월 5일 종료

 

3. 달라진 점

  • 코딩·추론·에이전트 워크플로우·컴퓨터 조작을 하나의 모델에 통합해, 별도 모델 전환 없이 복잡한 작업 처리
  • ChatGPT에서 응답 전 사고 계획을 미리 보여줘, 작업 도중 방향 수정 가능
  • 토큰 단가는 GPT-5.2보다 높지만, 동일 작업을 더 적은 토큰으로 처리해 실질 비용은 상쇄 가능

 

 

 

네이티브 컴퓨터 사용: 범용 모델 최초

GPT-5.4는 오픈AI 범용 모델 중 처음으로 네이티브 컴퓨터 사용 기능을 내장했습니다. 스크린샷을 읽고 마우스·키보드 명령을 내려 데스크톱 환경을 직접 조작하며, Playwright 같은 라이브러리를 활용한 코드 기반 조작도 가능합니다.

 

데스크톱 환경 탐색 벤치마크 OSWorld-Verified에서 75.0%를 기록해 GPT-5.2(47.3%)는 물론 인간 기준(72.4%)도 넘어섰습니다. 브라우저 사용 벤치마크 WebArena-Verified에서는 67.3%, 스크린샷 기반 브라우저 탐색 Online-Mind2Web에서는 92.8%를 달성했습니다.

 

 

개발자 메시지로 모델 동작을 조정하거나, 커스텀 확인 정책을 설정해 안전 수준을 유스케이스별로 제어할 수 있습니다.

 

 

Tool Search: 에이전트 개발자를 위한 핵심 변화

기존에는 모델에 도구를 제공할 때 모든 도구 정의를 프롬프트에 미리 포함해야 했습니다. 도구가 많아질수록 수천~수만 토큰이 매 요청마다 추가되면서 비용과 지연이 함께 올라갔습니다.

 

GPT-5.4는 API에서 Tool Search를 도입해 이 문제를 구조적으로 해결합니다. 모델은 가벼운 도구 목록과 검색 기능만 받고, 실제 도구 정의는 필요할 때만 가져옵니다. 36개 MCP 서버를 활성화한 Scale MCP Atlas 벤치마크 250개 태스크에서, Tool Search 적용 시 토큰 사용량이 47% 감소하면서 정확도는 동일하게 유지됐습니다.

 

대규모 도구 생태계 위에 에이전트를 구축하는 개발자에게 비용 절감과 응답 속도 향상으로 직결되는 변화입니다.

 

 

코딩: 속도가 진짜 차이

GPT-5.4는 GPT-5.3-Codex의 코딩 능력을 흡수한 최초의 메인라인 추론 모델입니다. SWE-Bench Pro에서 57.7%(GPT-5.3-Codex 56.8%, GPT-5.2 55.6%)로, 수치상 차이는 크지 않습니다.

 

실질적 차이는 속도입니다. Codex의 /fast 모드로 토큰 처리 속도가 최대 1.5배 빨라지며, 모델 품질은 동일합니다. 복잡한 프론트엔드 작업에서도 이전 모델 대비 눈에 띄게 미려하고 기능적인 결과물을 생성합니다.

 

실험적 Codex 스킬 Playwright (Interactive)도 함께 공개됐습니다. 웹 및 Electron 앱을 시각적으로 디버깅하며, 빌드 중인 앱을 직접 테스트할 수도 있습니다.

 

"GPT-5.4는 현재 우리 내부 벤치마크에서 1위입니다. 이전 모델보다 더 자연스럽고 주체적이며, 모호한 문제에서도 스스로 판단하고 작업을 병렬로 처리합니다." — Lee Robinson, Cursor VP of Developer Education

 

 

전문 업무: 스프레드시트·프레젠테이션·법률 문서

44개 직종의 지식 업무를 측정하는 GDPval에서 83.0%(GPT-5.2 70.9%), 투자은행 스프레드시트 모델링 내부 벤치마크에서 87.3%(GPT-5.2 68.4%)를 기록했습니다. 프레젠테이션 품질에서는 인간 평가자가 GPT-5.2 대비 GPT-5.4 결과물을 68% 선호했습니다.

 

엔터프라이즈 고객을 위해 ChatGPT for Excel 애드인도 동시 출시됐으며, FactSet·MSCI·Moody's 등 금융 데이터 앱 연동도 함께 제공됩니다.

 

 

이용 안내

  • ChatGPT Plus·Team·Pro: GPT-5.4 Thinking 순차 배포 중
  • Enterprise·Edu: 관리자 설정에서 얼리 액세스 활성화
  • API: gpt-5.4 / gpt-5.4-pro
  • Codex: 앱·CLI·IDE 확장·웹 모두 지원
  • 100만 토큰 컨텍스트 윈도우: Codex에서 실험적 제공, model_context_window와 model_auto_compact_token_limit 설정으로 활성화
  • GPT-5.2 Thinking: 레거시 모델로 3개월 유지 → 2026년 6월 5일 종료