※ 본문은 OpenAI의 <Introducing GPT‑5.5>를 신속하게 전달하기 위해 AI 번역 및 요약을 사용했습니다. 요즘IT 실무자에게 필요한 정보 전달을 위해 내용을 일부 생략하고 배치를 조정했습니다. Opus 4.7을 활용해 번역 및 요약했습니다.
[GPT-5.5 공개 핵심 요약]
한눈에 보기
- 오픈AI가 지금까지 내놓은 모델 가운데 가장 똑똑하고 직관적인 GPT-5.5 공개
- GPT-5.4 대비 지능은 한 단계 높이면서도 토큰당 지연 시간(latency)은 동일
- 같은 코덱스(Codex) 작업을 더 적은 토큰으로 처리해 효율성도 개선
- 에이전트형 코딩, 컴퓨터 조작, 지식 노동, 초기 과학 연구 네 영역에서 성능 향상이 두드러짐
실제 사용 사례 (오픈AI 내부)
- 직원 85% 이상이 매주 코덱스 사용
- 재무팀: 24,771건(71,637쪽) 의 K-1 세금 서식 검토를 작년 대비 2주 단축
- 세일즈·마케팅 직원: 주간 리포트 자동화로 주당 5~10시간 절약
- 내부 인프라 개선: 코덱스가 트래픽 패턴을 분석해 휴리스틱 알고리즘을 작성, 토큰 생성 속도 20% 이상 향상
이용 범위와 요금
[챗GPT]
- GPT-5.5 싱킹(Thinking): 플러스, 프로, 비즈니스, 엔터프라이즈 사용자
- GPT-5.5 프로: 프로, 비즈니스, 엔터프라이즈 사용자 (더 어려운 문제·높은 정확도 작업용)
[코덱스]
- 플러스, 프로, 비즈니스, 엔터프라이즈, 에듀(Edu), 고(Go) 요금제 / 400K 컨텍스트 윈도
- 패스트(Fast) 모드: 토큰 1.5배 빠르게 생성, 비용 2.5배
누구에게 유용한가
- 소프트웨어 엔지니어: 거대한 코드베이스 전반의 맥락 유지, 모호한 오류 추론, 대규모 리팩터 작업에 특히 강점; 시니어 엔지니어 테스트에서 클로드 오퍼스 4.7(Claude Opus 4.7)보다 추론·자율성 면에서 뛰어나다는 평가
- 지식 노동자: 문서·스프레드시트·슬라이드 작성, 운영 리서치, 컴퓨터 조작 자동화가 필요한 실무자
- 연구자·전문직: 논문 비평, 기술 논거 시험, 데이터 분석 파트너; 특히 비즈니스·법률·교육·데이터 사이언스 영역에서 GPT-5.4 프로 대비 응답 품질 향상 보고
- 사이버 방어 담당자: '사이버용 신뢰 접근(Trusted Access for Cyber)' 프로그램을 통해 검증된 방어 업무에는 제한 완화

지금까지 내놓은 모델 가운데 가장 똑똑하고 직관적으로 쓸 수 있는 GPT-5.5를 공개합니다. 이번 공개는 컴퓨터로 일하는 새로운 방식을 향한 다음 걸음이기도 합니다.
GPT-5.5는 사용자가 무엇을 하려는지 더 빠르게 파악하고, 더 많은 일을 스스로 처리할 수 있습니다. 코드 작성과 디버깅, 온라인 조사, 데이터 분석, 문서와 스프레드시트 작성, 소프트웨어 조작은 물론, 작업이 끝날 때까지 여러 도구를 오가며 일하는 데에도 뛰어납니다. 모든 단계를 일일이 챙길 필요 없이, 여러 단계가 뒤얽힌 복잡한 작업을 GPT-5.5에 맡겨 두면 스스로 계획을 세우고, 도구를 쓰고, 작업 내용을 점검하고, 모호한 상황을 헤쳐 나가면서 일을 이어 나갑니다.
성능 향상이 특히 두드러진 분야는 에이전트형 코딩, 컴퓨터 조작, 지식 노동, 초기 단계 과학 연구입니다. 맥락을 가로지르며 추론하고 시간에 걸쳐 행동해야 성과가 나는 영역들이죠. GPT-5.5는 이런 지능 향상을 이루면서도 속도를 포기하지 않았습니다. 보통 모델이 커지고 성능이 좋아질수록 응답이 느려지기 마련이지만, GPT-5.5는 실제 서비스 환경에서 토큰당 지연 시간이 GPT-5.4와 같은 수준을 유지하면서 훨씬 높은 지능을 보여 줍니다. 또한 같은 코덱스(Codex) 작업을 끝내는 데 쓰는 토큰의 양이 눈에 띄게 줄었기 때문에, 성능뿐 아니라 효율성 측면에서도 한 단계 올라섰습니다.
이번 GPT-5.5는 지금까지 마련한 것 가운데 가장 강력한 안전장치와 함께 공개됩니다. 이는 유익한 작업에 대한 접근성은 그대로 유지하면서 오용은 줄이기 위한 장치입니다. 오픈AI는 자체 안전·대비 평가 체계 전반에 걸쳐 이 모델을 점검했고, 사내외 레드팀과 협력했으며, 고도화된 사이버 보안 및 생물학 분야 역량에 대한 표적 테스트를 추가했습니다. 또한 공개에 앞서 믿을 수 있는 얼리 액세스 파트너 약 200곳에서 실제 사용 사례에 관한 피드백을 모았습니다.
오늘부터 GPT-5.5는 챗GPT와 코덱스의 플러스(Plus), 프로(Pro), 비즈니스(Business), 엔터프라이즈(Enterprise) 사용자에게 차례로 배포되며, GPT-5.5 프로는 챗GPT의 프로, 비즈니스, 엔터프라이즈 사용자에게 배포됩니다. API 배포에는 또 다른 안전장치가 필요하기에, 대규모 서비스를 위한 안전 및 보안 요건을 놓고 파트너사 및 고객과 긴밀히 협의하고 있습니다. GPT-5.5와 GPT-5.5 프로는 머지않아 API로도 만나 볼 수 있습니다.

오픈AI는 에이전트형 AI를 위한 세계적 인프라를 구축하고 있습니다. 전 세계 개인과 기업이 AI로 일을 해낼 수 있게 하기 위해서입니다. 지난 1년 사이 AI는 소프트웨어 엔지니어링의 속도를 극적으로 끌어올렸습니다. 이제 코덱스와 챗GPT에 GPT-5.5가 들어가면서, 같은 변화의 물결이 과학 연구와 사람들이 컴퓨터로 하는 폭넓은 업무로 번져 나가기 시작했습니다.
여러 분야에 걸쳐 GPT-5.5는 단지 더 똑똑해진 데 그치지 않습니다. 문제를 풀어 나가는 방식 자체가 더 효율적이어서, 더 적은 토큰과 더 적은 재시도만으로도 수준 높은 결과를 내놓는 경우가 많습니다. 아티피셜 애널리시스가 산출하는 코딩 지수에서, GPT-5.5는 경쟁하는 최상위 코딩 모델의 절반 비용으로 최고 수준의 지능을 보여 줍니다.

오늘부터 GPT-5.5는 챗GPT와 코덱스의 플러스, 프로, 비즈니스, 엔터프라이즈 사용자에게 차례로 배포되며, GPT-5.5 프로는 챗GPT의 프로, 비즈니스, 엔터프라이즈 사용자에게 배포됩니다. GPT-5.5와 GPT-5.5 프로는 머지않아 API로도 만나 볼 수 있습니다.
챗GPT에서 GPT-5.5 싱킹은 플러스, 프로, 비즈니스, 엔터프라이즈 사용자가 쓸 수 있습니다. 더 어려운 질문과 더 높은 정확도를 요구하는 작업을 위해 설계된 GPT-5.5 프로는 프로, 비즈니스, 엔터프라이즈 사용자에게 제공됩니다.
코덱스에서는 GPT-5.5가 플러스, 프로, 비즈니스, 엔터프라이즈, 에듀(Edu), 고(Go) 요금제에서 제공되며, 400K 컨텍스트 윈도를 지원합니다. GPT-5.5는 패스트(Fast) 모드로도 쓸 수 있습니다. 이 모드는 토큰을 1.5배 빠르게 생성하는 대신, 비용이 2.5배로 책정됩니다.
API 개발자에게는 곧 Responses API와 Chat Completions API에서 gpt-5.5를 사용할 수 있게 됩니다. 요금은 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 30달러이며, 컨텍스트 윈도는 100만 토큰입니다. 배치 및 플렉스 요금은 표준 API 요금의 절반이며, 우선 처리 요금은 표준 요금의 2.5배입니다. 더 높은 정확도가 필요한 작업을 위해 gpt-5.5-pro도 API로 공개될 예정이며, 요금은 입력 토큰 100만 개당 30달러, 출력 토큰 100만 개당 180달러입니다. 자세한 내용은 요금 페이지를 참고하시기 바랍니다.
GPT-5.5는 GPT-5.4보다 요금이 높게 책정되었지만, 지능도 더 뛰어나고 토큰 효율도 훨씬 좋습니다. 오픈AI는 코덱스에서 대다수 사용자가 GPT-5.4보다 더 적은 토큰으로 더 좋은 결과를 얻을 수 있도록 경험을 세심하게 다듬었으며, 구독 등급별로 넉넉한 이용량을 계속 제공합니다.

GPT-5.5는 오픈AI가 지금까지 선보인 에이전트형 코딩 모델 가운데 가장 강력합니다. 계획 수립, 반복 수행, 도구 조율 능력을 평가하는 복잡한 명령줄(command-line) 워크플로우 테스트인 터미널-벤치 2.0에서 GPT-5.5는 82.7%라는 최고 수준의 정확도를 기록했습니다. 실제 깃허브(GitHub) 이슈 해결 능력을 평가하는 SWE-Bench Pro에서는 58.6%를 달성해, 이전 모델보다 더 많은 과제를 한 번의 시도로 끝까지 해결해 냈습니다. 사람이 작업을 끝내는 데 드는 시간의 중앙값이 20시간에 이르는 장기 코딩 과제를 다루는 오픈AI의 내부 최상위 평가인 Expert-SWE에서도, GPT-5.5는 GPT-5.4보다 앞선 성적을 냈습니다.
세 가지 평가 모두에서 GPT-5.5는 GPT-5.4보다 더 적은 토큰을 쓰면서도 더 높은 점수를 받았습니다.
이 모델의 코딩 역량은 코덱스에서 특히 또렷하게 드러납니다. 코덱스 환경에서 GPT-5.5는 구현과 리팩터(refactor)부터 디버깅, 테스트, 검증에 이르기까지 폭넓은 엔지니어링 작업을 맡아서 처리할 수 있습니다. 초기 테스트 결과를 보면, GPT-5.5는 실제 엔지니어링 업무의 바탕이 되는 여러 행동—예컨대 거대한 시스템 전반에 걸쳐 맥락을 유지하기, 원인이 뚜렷하지 않은 오류를 두고 논리적으로 추론하기, 도구를 써서 가정을 점검하기, 주변 코드베이스 전체에 변경 사항을 이어서 반영하기—에서 더 나은 모습을 보여 줍니다.

벤치마크 수치를 떠나, 얼리 테스터들은 GPT-5.5가 시스템의 구조를 이해하는 능력이 한층 뛰어나다고 말합니다. 무엇이 왜 실패하고 있는지, 수정은 어디에 들어가야 하는지, 이 변경이 코드베이스의 어디에 또 영향을 미치는지를 꿰뚫어 본다는 뜻입니다.
"지금까지 써 본 코딩 모델 가운데, 진정한 의미의 개념적 명료함을 갖춘 첫 모델입니다."
Every의 창업자이자 CEO인 댄 십퍼(Dan Shipper)는 GPT-5.5를 두고 "지금까지 써 본 코딩 모델 가운데, 진정한 의미의 개념적 명료함을 갖춘 첫 모델"이라고 표현했습니다. 그는 앱을 출시한 뒤 생긴 문제를 며칠 동안 디버깅하다가, 결국 소속 최정예 엔지니어 한 명을 투입해 시스템의 일부를 다시 짜게 했다고 합니다. 그는 GPT-5.5를 시험해 보려 사실상 시계를 되감아 보았습니다. 망가진 상태를 모델에 보여 주고, 엔지니어가 끝내 택했던 것과 같은 방향의 재작성을 이 모델도 내놓을 수 있을지 확인해 본 것입니다. GPT-5.4는 해내지 못했지만, GPT-5.5는 해냈습니다.
"정말로 저보다 높은 지능과 함께 일하고 있다는 느낌이 들었고, 거의 경외에 가까운 감정마저 생겼습니다."
MagicPath의 CEO인 피에트로 스키라노(Pietro Schirano) 역시 비슷한 도약을 목격했습니다. GPT-5.5가 수백 건의 프론트엔드 변경과 리팩터가 담긴 브랜치를, 그 사이 크게 바뀌어 있던 메인 브랜치로 병합해 냈고, 이 작업을 단 한 번에 약 20분 만에 마무리했기 때문입니다.
이 모델을 시험해 본 시니어 엔지니어들은, 추론 능력과 자율성 측면에서 GPT-5.5가 GPT-5.4와 클로드 오퍼스 4.7(Claude Opus 4.7)보다 눈에 띄게 뛰어나다고 입을 모았습니다. 별도의 지시가 없어도 문제를 미리 잡아내고, 앞으로 어떤 테스트와 검토가 필요할지를 내다본다는 것입니다. 한 사례에서는 어느 엔지니어가 협업형 마크다운 편집기의 댓글 시스템을 다시 설계해 보라고 맡긴 뒤, 돌아와 보니 거의 완성 단계에 이른 12개짜리 변경(diff) 묶음이 준비돼 있었다고 합니다. 다른 테스터들은 놀라울 만큼 구현을 고쳐 줄 일이 적었으며, GPT-5.4와 비교해 GPT-5.5가 내놓은 계획에 대한 신뢰도가 더 높았다고 이야기했습니다.
일찌감치 이 모델을 써 본 엔비디아(NVIDIA) 소속의 한 엔지니어는 이렇게까지 말했습니다. "GPT-5.5를 더는 쓸 수 없게 된다면, 마치 신체 일부가 잘려 나간 기분일 겁니다."
GPT-5.5를 코딩에 강하게 만드는 능력들은, 컴퓨터로 하는 일상 업무에서도 그대로 힘을 발휘합니다. 사용자의 의도를 더 잘 파악하기 때문에, 지식 노동의 전 과정—정보를 찾고, 무엇이 중요한지 판단하고, 도구를 쓰고, 결과물을 점검하며, 원재료를 쓸모 있는 무언가로 다듬어 내는 흐름—을 한층 매끄럽게 오갈 수 있습니다.
코덱스에서 GPT-5.5는 문서, 스프레드시트, 슬라이드 자료를 만들어 내는 능력이 GPT-5.4보다 뛰어납니다. 알파 테스터들은 운영 리서치, 스프레드시트 모델링, 뒤엉킨 비즈니스 자료를 계획으로 빚어내는 작업 등에서 GPT-5.5가 이전 모델보다 더 좋은 결과를 냈다고 전했습니다. 여기에 코덱스의 컴퓨터 조작 기능이 더해지면, "모델이 나와 함께 컴퓨터를 쓴다"는 감각에 한 걸음 더 가까워집니다. 화면에 무엇이 있는지 살피고, 클릭하고, 입력하고, 인터페이스를 넘나들고, 여러 도구를 정교하게 오가는 일을 모두 해낸다는 뜻입니다.

오픈AI 내부 팀들은 이 강점을 이미 실제 업무 흐름에 녹여 쓰고 있습니다. 오늘날 오픈AI 직원의 85% 이상이 매주 코덱스를 사용하며, 소프트웨어 엔지니어링, 재무, 커뮤니케이션, 마케팅, 데이터 사이언스, 제품 관리 등 다양한 직군에 두루 걸쳐 있습니다. 커뮤니케이션 팀은 GPT-5.5를 코덱스에 얹어 6개월치 강연 요청 데이터를 분석했고, 평가 점수 체계와 위험도 판별 틀을 설계한 뒤, 위험도가 낮은 요청은 자동으로 처리하고 높은 요청은 사람 검토로 넘기도록 하는 슬랙 자동 에이전트를 검증했습니다. 재무 팀은 총 71,637쪽에 달하는 24,771건의 K-1 세금 서식(K-1 tax form)을 코덱스로 검토하면서, 개인 정보를 제외하는 작업 흐름을 짜 작년보다 2주 앞당겨 일을 마무리했습니다. 세일즈·마케팅(Go-to-Market) 팀에서는 한 직원이 주간 비즈니스 리포트 작성을 자동화해, 매주 5~10시간을 아낀 사례도 있습니다.
챗GPT에서 GPT-5.5 싱킹(Thinking)은 어려운 문제를 더 빠르게 풀어냅니다. 더 똑똑하면서도 더 간결한 답을 내놓기 때문에, 복잡한 일을 더 효율적으로 끝낼 수 있게 도와줍니다. 코딩, 리서치, 정보 종합과 분석, 문서 기반의 업무 같은 전문적인 작업에서 특히 뛰어나며, 플러그인을 함께 쓰는 상황에서 진가를 발휘합니다.
GPT-5.5 프로의 경우, 얼리 테스터들은 챗GPT가 감당할 수 있는 작업의 난이도와 결과물의 품질이 한 단계 올라섰다고 평가합니다. 더욱이 응답 지연 시간이 줄어들어, 까다로운 작업에 실질적으로 쓰기 훨씬 수월해졌습니다. GPT-5.4 프로와 비교했을 때 GPT-5.5 프로의 답변은 훨씬 포괄적이고, 구조가 잘 짜여 있으며, 정확하고, 관련성 높고, 쓸모 있다는 평가를 받았습니다. 특히 비즈니스, 법률, 교육, 데이터 사이언스 영역에서 성능이 두드러졌습니다.
GPT-5.5는 이런 작업을 대표하는 여러 벤치마크에서 최고 수준의 성능에 올라섰습니다. 44개 직업군에 걸쳐 명확한 요구 사항을 갖춘 지식 노동을 에이전트가 수행하는 능력을 평가하는 GDPval에서 GPT-5.5는 84.9%를 기록했습니다. 모델이 실제 컴퓨터 환경을 스스로 조작할 수 있는지 측정하는 OSWorld-Verified에서는 78.7%를, 복잡한 고객 응대 업무 흐름을 다루는 Tau2-bench Telecom에서는 프롬프트 튜닝 없이 98.0%를 달성했습니다. 이 외에 다른 지식 노동 벤치마크에서도 좋은 성적을 냈습니다. FinanceAgent에서 60.0%, 내부 투자은행 모델링 과제에서 88.5%, OfficeQA Pro에서 54.1%를 기록했습니다.
GPT-5.5는 과학·기술 연구 작업 흐름에서도 눈에 띄는 발전을 보여 줍니다. 이런 작업은 어려운 질문 하나에 답하는 것으로 끝나지 않습니다. 연구자는 아이디어를 탐색하고, 근거를 모으고, 가정을 시험하고, 결과를 해석하고, 다음에 무엇을 시도할지 결정해야 합니다. GPT-5.5는 이 반복 과정을 다른 모델보다 더 끈질기게 이어 갑니다.
특히 GPT-5.5는 유전학과 정량 생물학 영역의 다단계 과학 데이터 분석에 초점을 맞춘 새로운 평가인 GeneBench에서 GPT-5.4보다 또렷한 개선을 보였습니다. 이런 문제를 풀려면, 모델은 관리·감독이 거의 없는 환경에서 모호하거나 오류를 품은 데이터를 놓고 추론할 줄 알아야 하고, 숨은 교란 변수나 품질 관리(QC) 실패처럼 현실적인 난관을 다룰 줄 알아야 하며, 최신 통계 기법을 올바르게 구현하고 해석해 내야 합니다. 이런 과제가 과학 전문가에게도 여러 날이 걸리는 프로젝트에 해당한다는 점을 감안하면, 이 모델의 성능은 더욱 놀랍게 다가옵니다.
마찬가지로, 실제 생물정보학 및 데이터 분석을 바탕으로 설계된 벤치마크인 BixBench에서도 GPT-5.5는 점수가 공개된 모델들 가운데 가장 앞선 성능을 기록했습니다. 이 모델의 과학적 역량은 이제 생물의학 연구의 최전선에서 연구 속도를 실질적으로 끌어올릴 만큼, 명실상부한 공동 연구자로 기능할 수 있는 수준에 올라섰습니다.
또 다른 사례로, 맞춤형 하네스를 적용한 GPT-5.5의 내부 버전은 조합론의 핵심 대상 중 하나인 램지 수에 관한 새로운 증명을 발견하는 데 기여했습니다. 조합론은 그래프, 네트워크, 집합, 패턴처럼 서로 떨어져 있는 대상들이 어떻게 맞물리는지를 연구하는 분야입니다. 램지 수는 거칠게 말해, 어떤 네트워크가 얼마나 커져야 일정한 종류의 질서가 반드시 나타나게 되는지를 묻는 값입니다. 이 영역의 성과는 드물고, 기술적으로도 까다로울 때가 많습니다. 그런데 이번에 GPT-5.5는 비대각 램지 수에 관한 오랜 점근적 사실을 뒷받침하는 증명을 찾아냈고, 이는 이후 린으로 검증되었습니다. 이 결과는 GPT-5.5가 단순히 코드를 짜거나 설명을 덧붙이는 데 그치지 않고, 핵심 연구 분야에서 예상치 못한 유용한 수학적 논증까지 기여할 수 있다는 구체적인 예시입니다.
얼리 테스터들은 챗GPT의 GPT-5.5 프로를 한 번에 답을 내주는 엔진처럼 쓰기보다는, 연구 파트너처럼 활용하는 모습을 보였습니다. 여러 차례 원고를 비평해 나가거나, 기술적 논거를 시험해 보거나, 분석 방안을 제안하게 하거나, 코드·메모·PDF 자료를 함께 다루는 식입니다. 공통점은 하나입니다. GPT-5.5가 연구자의 작업을 질문에서 실험으로, 실험에서 결과물로 더 매끄럽게 이끌어 준다는 것입니다.
잭슨 유전체 의학 연구소의 면역학 교수이자 연구자인 데리야 우누트마즈(Derya Unutmaz)는, 62개 표본과 약 2만 8천 개 유전자로 이뤄진 유전자 발현 데이터셋을 GPT-5.5 프로로 분석했습니다. 그 결과 그는 단순히 발견 사항을 요약하는 데 그치지 않고, 핵심 질문과 통찰까지 짚어 주는 상세한 연구 보고서를 받아 들었습니다. 본인 말로는 자신의 팀이 해냈다면 몇 달은 걸렸을 작업이라고 합니다.
폴란드 포즈난(Poznań)의 아담 미츠키에비치 대학교 수학과 조교수인 바르토시 나스크렝키(Bartosz Naskręcki)는 GPT-5.5를 탑재한 코덱스로, 단 한 번의 프롬프트만으로 11분 만에 대수기하학 앱을 만들어 냈습니다. 이 앱은 두 이차 곡면이 만나는 교선을 시각화한 뒤, 그로부터 얻어진 곡선을 바이어슈트라스 모델로 변환했습니다.
이후 그는 더 안정적인 특이점 시각화 기능과, 후속 연구에 재활용할 수 있는 정확한 계수 표기를 덧붙여 앱을 확장했습니다. 그에게 더 큰 변화는, 이전에는 전용 도구가 있어야 가능했던 맞춤형 수학 시각화와 컴퓨터 대수 작업 흐름을, 이제 코덱스가 함께 구현해 준다는 점입니다. 이 사례들은, GPT-5.5가 전문가의 의도를 실제로 작동하는 연구 도구와 분석 결과로 바꿔 낼 수 있음을 보여 줍니다.

GPT-5.5를 GPT-5.4와 같은 지연 시간으로 서비스하려면, 추론(inference)을 개별 최적화의 묶음이 아닌 하나의 통합 시스템으로 새롭게 바라봐야 했습니다. GPT-5.5는 엔비디아 GB200 및 GB300 NVL72 시스템에 맞춰 함께 설계되고, 그 위에서 학습되고, 그 위에서 서비스됩니다. 오픈AI가 목표한 성능 수준에 도달하는 과정에서 코덱스와 GPT-5.5가 핵심 역할을 했습니다. 코덱스는 팀이 아이디어에서 벤치마크 가능한 구현까지 더 빠르게 나아가도록 도왔고, 접근 방식을 스케치하고, 실험을 구성하고, 어떤 최적화 방안에 더 깊이 투자할 가치가 있는지 가려내는 일을 함께 해냈습니다. GPT-5.5는 스택 자체에 담아야 할 핵심 개선점을 찾아내고 구현하는 과정에도 기여했습니다. 간단히 말해, 이 모델은 자기 자신을 서비스하는 인프라의 개선에 힘을 보탠 셈입니다.
그런 개선 중 하나가 부하 분산과 분할 휴리스틱입니다. GPT-5.5 이전에는 하나의 가속기에 들어오는 요청을 미리 정해진 개수의 덩어리로 쪼개서 여러 연산 코어에 고르게 나눴습니다. 큰 요청과 작은 요청이 같은 GPU에서 함께 돌아갈 수 있게 하기 위해서입니다. 그러나 미리 정해 둔 고정 개수의 덩어리가 모든 트래픽 모양에 맞는 것은 아니었습니다. GPU를 더 잘 쓰기 위해, 코덱스는 몇 주치 실제 운영 트래픽 패턴을 분석한 뒤, 작업을 최적으로 나누고 분배하는 맞춤형 휴리스틱 알고리즘을 직접 짰습니다. 이 노력은 기대를 웃도는 효과로 돌아왔고, 토큰 생성 속도를 20% 넘게 끌어올렸습니다.
보안 취약점을 찾아내고 메우는 일에 매우 능한 AI가 등장할 세상을 준비하는 일은 혼자 해낼 수 없는 과제입니다. 생태계 전체가 함께 회복탄력성을 쌓아 올려야 합니다. 이를 위해서는 모델 접근의 보편화와 반복적인 배포를 통해 새로운 사이버 방어 시대를 열어 나가야 합니다.
최전선 모델은 사이버 보안 영역에서 점점 더 강력해지고 있습니다. 이 역량은 앞으로 폭넓게 퍼져 나갈 것이기에, 오픈AI는 이 힘을 사이버 방어의 속도를 높이고 생태계를 탄탄하게 만드는 방향으로 쓰이게 하는 것이 가장 올바른 길이라고 믿습니다.
GPT-5.5는 사이버 보안처럼 세상에서 가장 어려운 과제 중 일부를 풀어낼 수 있는 AI로 향해 가는, 점진적이지만 중요한 한 걸음입니다. 지난 12월 GPT-5.2를 공개하면서 오픈AI는 이미 모델이 사이버 영역에서 오용될 여지를 줄이기 위해 필요한 안전장치를 선제적으로 마련했습니다. 이번 GPT-5.5에서는 사이버 위험 가능성을 걸러 내는 분류기를 한층 엄격하게 적용합니다. 시간을 두고 이 분류기를 조정해 나가는 동안, 일부 사용자는 처음에는 다소 불편함을 느낄 수 있습니다.
오픈AI는 모델이 점진적으로 발전해 온 지난 수년 동안 사이버 보안을 준비 태세 프레임워크의 한 범주로 다뤄 왔고, 그 사이 완화 조치를 반복적으로 개발하고 보정해 왔습니다. 의미 있는 사이버 보안 역량을 갖춘 모델을 책임감 있게 내놓을 수 있도록 준비해 온 셈입니다.
오픈AI는 이 정도의 사이버 역량에 걸맞은 업계 최고 수준의 안전장치를 배포합니다. 지난해 GPT-5.2에서 사이버 보안 전용 안전장치를 처음 도입한 이래, 이를 꾸준히 시험하고 다듬으며 이후 배포 때마다 확장해 왔습니다. GPT-5.5에서는 위험도가 더 높은 활동과 민감한 사이버 요청에 한층 촘촘한 통제 장치를 설계했고, 반복적인 오용을 겨냥한 보호 장치도 덧붙였습니다. 폭넓은 접근성은 모델 안전성, 인증된 사용, 금지된 용도에 대한 모니터링 영역에 꾸준히 투자한 덕에 가능해졌습니다. 외부 전문가들과 여러 달에 걸쳐 협력하며 이 안전장치의 견고함을 개발하고, 시험하고, 다듬어 왔습니다. GPT-5.5와 함께라면 개발자는 자신의 코드를 한결 수월하게 지킬 수 있고, 동시에 악의적 행위자에 의해 피해가 커질 가능성이 가장 높은 사이버 작업 흐름에는 더 강한 통제가 걸리게 됩니다.
모든 층위에서 사이버 방어 속도를 끌어올리기 위해 접근 범위를 넓힙니다. 오픈AI는 사이버 허용 모델을 '사이버용 신뢰 접근' 프로그램을 통해 제공하며, 그 첫 출발을 코덱스로 시작합니다. 여기에는 출시 시점에 특정 신뢰 신호를 충족한 검증된 사용자에게 적용되는 제한 완화와 함께, GPT-5.5의 고급 사이버 보안 역량에 대한 확장된 접근 권한이 포함됩니다. 중요 기반시설 방어를 책임지는 조직은, 엄격한 보안 요건을 충족한다는 전제 아래 내부 시스템 보호를 위해 GPT-5.4-Cyber 같은 사이버 허용 모델을 쓰기 위한 신청을 할 수 있습니다. 이를 통해, 폭넓은 범위의 검증된 방어 담당자들이 정당한 보안 업무에 필요한 더 강력한 도구를, 불필요한 마찰 없이 쓸 수 있게 됩니다. 중요한 방어 역량에 대한 접근을 보편화하겠다는 뜻입니다. 사용자는 chatgpt.com/cyber에서 신뢰 접근을 신청할 수 있으며, 검증된 방어 업무에 GPT-5.5를 쓸 때 불필요한 거부가 줄어듭니다.
공공의 이익을 위해 중요 기반시설을 지키고자 정부 파트너들과 협력하고 있습니다. 오픈AI는 정부 파트너들과 함께, 사람들의 삶을 지탱하는 시스템—납세자의 중요한 데이터를 지키는 디지털 시스템부터 지역사회의 전력망과 상수도에 이르기까지—을 책임지는 믿을 만한 공직자들의 방어 업무를 고도화된 AI가 어떻게 뒷받침할 수 있을지 모색하고 있습니다.
오픈AI는 GPT-5.5의 생물학·화학 및 사이버 보안 역량을 준비 태세 프레임워크상 '높음(High)' 등급으로 다룹니다. GPT-5.5가 사이버 보안 역량의 '치명적(Critical)' 수준에는 이르지 않았지만, 평가와 테스트 결과는 GPT-5.4보다 한 단계 올라선 역량을 갖고 있음을 보여 주었습니다.
여기에 더해 GPT-5.5는 공개 전 오픈AI의 안전 및 거버넌스 절차 전 과정을 거쳤습니다. 준비 태세 평가, 도메인별 테스트, 고도화된 생물학 및 사이버 보안 역량을 겨냥한 새로운 평가, 그리고 외부 전문가와 함께한 충실한 테스트가 모두 포함됩니다.
이러한 움직임은, 모델의 역량이 커져 갈수록 필요하다고 판단되는 오픈AI의 'AI 회복탄력성' 접근 방식을 보여 줍니다. 오픈AI는 시스템과 기관과 공공을 지키는 일을 하는 사람들의 손에 강력한 AI가 들어가기를 바랍니다. 이를 위해 가야 할 현실적인 길은 신뢰 접근, 역량 확장에 맞춰 함께 확장되는 견고한 안전장치, 그리고 심각한 오용을 감지하고 대응할 수 있는 운영 역량입니다.