[릴리즈노트]오픈AI 코딩 에이전트 코덱스(Codex) 소개
※ 본문은 오픈AI의 <Introducing Codex>를 신속하게 전달하기 위해 AI 번역을 사용했습니다. 일부 문장에 오역이나 부자연스러운 표현이 있을 수 있으니 참고하시기 바랍니다.
코덱스(Codex) 핵심 요약
■주요 특징 및 신기술
- 클라우드 기반 소프트웨어 개발 에이전트
- 코덱스-1(codex-1) 모델 기반, 실제 코딩 작업을 강화 학습으로 훈련
- 여러 작업을 동시에 처리하며, 각 작업은 독립된 클라우드 샌드박스 환경에서 실행
- 기능 작성, 코드 질의응답, 버그 수정, 풀 요청(Pull Request) 제안 등 자동화
- 파일 읽기/수정, 테스트 도구·린터·타입 검사기 실행 가능
- 작업 완료까지 1~30분 소요, 실시간 진행 상황 모니터링
- 작업 결과는 터미널 로그·테스트 결과 등 검증 자료와 함께 제공
- AGENTS.md 파일로 프로젝트별 맞춤 안내 가능, 명확한 개발 환경·문서 제공 시 성능 극대화
- 최대 19만 2천 토큰 문맥 길이, 중간 추론 노력 설정 지원
- 오픈에이아이 o3 대비 더 깔끔한 패치와 표준 작업 흐름 통합 용이
■ 보안 및 신뢰성
- 악성코드 등 악의적 요청은 식별·거부, 정당한 작업은 지원
- 정책 및 안전성 평가 강화, o3 시스템 카드 부록 공개
- 인터넷 차단된 격리 환경에서만 코드 실행, 외부 서비스 접근 불가
- 사용자는 결과물을 반드시 직접 검토·검증 필요
■ 활용 사례 및 대상 사용자
- 반복적·범위 명확한 작업(리팩터링, 이름 변경, 테스트 작성 등) 자동화에 효과적
- 신규 기능 설계, 컴포넌트 연결, 버그 수정, 문서 초안 작성 등에도 활용
- 오픈에이아이, 시스코, 템포럴, 슈퍼휴먼, 코디악 등 다양한 기업에서 실제 적용
- 여러 에이전트에 명확한 작업을 병렬 할당하면 효율 극대화
■ 명령줄 도구(CLI) 및 가격 정책
- 코덱스 명령줄 도구(CLI) 출시, o4-미니 기반 소형 모델도 제공
- 챗지피티 계정 연동으로 API 키 자동 설정, 플러스/프로 이용자 무료 크레딧 제공
- codex-mini-latest 모델: 1백만 입력 토큰당 1.5달러, 출력 토큰당 6달러(프롬프트 캐싱 75% 할인)
- 초기에는 추가 비용 없이 넉넉한 사용량 제공, 이후 유연한 요금제 도입 예정
■ 한계 및 향후 계획
- 프론트엔드 이미지 입력, 작업 중 경로 수정 등 일부 기능 미지원
- 원격 위임은 대화형 편집보다 시간이 더 소요될 수 있음
- 실시간 협업과 비동기 위임이 통합된 미래형 개발 환경 지향
- 향후, 작업 중 지침 제공·진행 상황 업데이트 등 상호작용성 강화 예정
- 다양한 개발 도구와의 연계 확대 계획
■ 이런 사용자에게 유용
- 반복적·자동화 가능한 개발 업무가 많은 팀
- 코드 품질과 표준화, 협업 효율을 중시하는 조직
- 다양한 코드베이스와 복잡한 개발 환경에서 생산성 향상을 원하는 개발자
■ 참고
- 라이브 스트림 다시보기: https://www.youtube.com/live/hhdpnbfH6NU?feature=shared
- 시스템 메시지: AGENTS.md에 명시된 테스트 실행 등 기본 동작은 사용자가 필요에 따라 조정 가능
코덱스는 클라우드 기반 소프트웨어 개발 에이전트로, 코덱스-1(codex-1) 기술을 바탕으로 여러 작업을 동시에 처리할 수 있습니다. 현재 챗지피티 프로(ChatGPT Pro), 팀(Team), 엔터프라이즈(Enterprise) 이용자에게 제공되며, 곧 플러스(Plus) 이용자에게도 제공될 예정입니다.
오늘 저희는 코덱스(Codex)의 연구 미리보기(Research Preview)를 출시합니다. 코덱스는 클라우드 기반 소프트웨어 개발 에이전트로, 여러 작업을 동시에 처리할 수 있습니다. 코덱스는 기능 작성, 코드베이스에 대한 질문 응답, 버그 수정, 검토를 위한 풀 요청(Pull Request) 제안 등 다양한 작업을 대신 수행할 수 있습니다. 각 작업은 사용자의 저장소가 미리 로드된 별도의 클라우드 샌드박스 환경에서 실행됩니다.
코덱스는 소프트웨어 개발에 최적화된 오픈에이아이(OpeanAI) o3의 변형인 코덱스-1(codex-1)로 구동됩니다. 이 모델은 다양한 환경에서 실제 코딩 작업을 바탕으로 강화 학습을 통해 훈련되었으며, 사람의 스타일과 풀 요청(PR) 선호도를 반영한 코드를 생성하고, 지시에 정확히 따르며, 테스트가 통과할 때까지 반복적으로 테스트를 실행할 수 있습니다. 오늘부터 챗지피티 프로(ChatGPT Pro), 엔터프라이즈(Enterprise), 팀(Team) 이용자에게 코덱스가 순차적으로 제공되며, 곧 플러스(Plus)와 에듀(Edu) 이용자도 지원할 예정입니다.
코덱스(Codex) 작동 방식
현재 챗지피티(ChatGPT) 사이드바를 통해 코덱스에 접근할 수 있으며, 프롬프트를 입력하고 “코드(Code)” 버튼을 클릭하여 새로운 코딩 작업을 할당할 수 있습니다. 코드베이스에 대해 코덱스에 질문하고 싶다면 “질문(Ask)” 버튼을 클릭하면 됩니다. 각 작업은 사용자의 코드베이스가 미리 로드된 별도의 독립된 환경에서 개별적으로 처리됩니다. 코덱스는 파일을 읽고 수정할 수 있으며, 테스트 도구, 린터(linter), 타입 검사기(type checker) 등 다양한 명령어를 실행할 수 있습니다. 작업의 복잡도에 따라 작업 완료까지 일반적으로 1분에서 30분 정도 소요되며, 사용자는 코덱스의 진행 상황을 실시간으로 모니터링할 수 있습니다.
코덱스가 작업을 완료하면, 해당 환경에서 변경 사항을 커밋합니다. 코덱스는 터미널 로그와 테스트 출력 결과에 대한 인용을 통해 자신의 작업에 대한 검증 가능한 증거를 제공합니다. 이를 통해 사용자는 작업 완료 과정의 각 단계를 추적할 수 있습니다. 이후 결과를 검토하고 추가 수정을 요청하거나, 깃허브(GitHub) 풀 요청을 생성하거나, 변경 사항을 직접 로컬 환경에 통합할 수 있습니다. 제품 내에서 코덱스 환경을 실제 개발 환경과 최대한 유사하게 구성할 수도 있습니다.

코덱스(Codex)는 저장소 내에 위치한 AGENTS.md 파일을 통해 안내받을 수 있습니다. AGENTS.md 파일은 README.md와 유사한 텍스트 파일로, 코덱스에게 코드베이스를 어떻게 탐색해야 하는지, 테스트를 위해 어떤 명령어를 실행해야 하는지, 그리고 프로젝트의 표준 관행을 어떻게 준수해야 하는지 등을 안내할 수 있습니다. 사람 개발자와 마찬가지로, 코덱스 에이전트는 구성된 개발 환경, 신뢰할 수 있는 테스트 환경, 명확한 문서가 제공될 때 최상의 성능을 발휘합니다.
코딩 평가와 내부 기준 시험에서도, 코덱스-1(codex-1)은 AGENTS.md 파일이나 맞춤형 환경 설정 없이도 우수한 성능을 보입니다.

안전하고 신뢰할 수 있는 에이전트 개발
저희는 점진적 배포 전략에 따라 코덱스(Codex)를 연구 미리보기(Research Preview) 형태로 공개합니다. 코덱스 설계 시 보안과 투명성을 최우선으로 고려하여, 사용자가 결과물을 직접 검증할 수 있도록 하였습니다. 인공지능 모델이 점차 더 복잡한 코딩 작업을 독립적으로 처리하게 되고, 안전에 대한 고려가 진화함에 따라 이러한 검증 절차는 더욱 중요해지고 있습니다. 사용자는 코덱스의 작업 결과를 인용, 터미널 로그, 테스트 결과를 통해 확인할 수 있습니다. 코덱스 에이전트는 불확실한 상황이나 테스트 실패에 직면했을 때, 이러한 문제를 명확하게 전달하여 사용자가 다음 단계를 신중하게 결정할 수 있도록 돕습니다. 그럼에도 불구하고, 사용자가 에이전트가 생성한 모든 코드를 통합 및 실행하기 전에 직접 검토하고 검증하는 것은 여전히 필수적입니다.


사람의 선호에 맞춘 조정
코덱스-1(codex-1)을 훈련하는 주요 목표 중 하나는 결과물이 사람의 코딩 선호와 기준에 최대한 부합하도록 하는 것이었습니다. 오픈에이아이 o3(OpenAI o3)와 비교했을 때, 코덱스-1은 항상 더 깔끔한 패치를 생성하여 즉시 사람의 검토와 표준 작업 흐름에 통합할 수 있도록 합니다.
오용 방지
인공지능 기반 소프트웨어 개발의 악의적 활용, 예를 들어 악성코드 개발과 같은 문제를 방지하는 것은 점점 더 중요해지고 있습니다. 동시에, 보호 조치가 커널 수준의 저수준 개발과 같이 때때로 악성코드 개발에도 사용될 수 있는 기술을 포함하는 정당하고 유익한 활용을 과도하게 제한하지 않는 것도 중요합니다.
안전성과 실용성의 균형을 위해, 코덱스(Codex)는 악성 소프트웨어 개발을 목적으로 한 요청을 식별하고 이를 정확하게 거부하도록 훈련되었으며, 정당한 작업은 명확히 구분하여 지원합니다. 또한 정책 체계를 강화하고, 엄격한 안전성 평가를 도입하여 이러한 경계를 효과적으로 유지하고 있습니다. 이러한 평가 내용을 반영하기 위해o3 시스템 카드(System Card) 부록도 공개하였습니다.
안전한 실행 환경
코덱스 에이전트는 클라우드 내에서 완전히 안전하고 격리된 컨테이너 환경에서 작동합니다. 작업 수행 중에는 인터넷 접속이 차단되어, 에이전트는 깃허브(GitHub) 저장소를 통해 명시적으로 제공된 코드와 사용자가 설치 스크립트로 구성한 사전 설치된 의존성에만 접근할 수 있습니다. 에이전트는 외부 웹사이트, 응용프로그램 인터페이스(API), 기타 서비스에는 접근할 수 없습니다.
초기 활용 사례
오픈에이아이(OpenAI)의 기술팀은 코덱스를 일상적인 도구로 활용하기 시작했습니다. 오픈에이아이 엔지니어들은 주로 반복적이고 범위가 명확한 작업, 예를 들어 코드 리팩터링, 이름 변경, 테스트 작성 등 집중력을 방해할 수 있는 작업을 코덱스에 맡기고 있습니다. 또한 새로운 기능의 구조 설계, 컴포넌트 연결, 버그 수정, 문서 초안 작성 등에도 유용하게 활용되고 있습니다. 팀들은 코덱스를 활용해 온콜 이슈를 분류하고, 하루의 작업을 계획하며, 백그라운드 작업을 위임하는 등 새로운 업무 습관을 만들어가고 있습니다. 코덱스는 맥락 전환을 줄이고, 잊혀진 할 일을 드러내어, 엔지니어가 더 빠르게 결과를 내고 중요한 일에 집중할 수 있도록 돕습니다.
[영상]https://openai.com/index/introducing-codex/?video=1084810944
출시를 앞두고, 저희는 다양한 코드베이스와 개발 프로세스, 팀 환경에서 코덱스(Codex)의 성능을 더 깊이 이해하기 위해 소규모 외부 테스터 그룹과 협력해왔습니다.
- 시스코(Cisco)는 코덱스가 자사의 엔지니어링 팀이 더 빠르게 혁신적인 아이디어를 실현할 수 있도록 어떻게 지원할 수 있는지 탐구하고 있습니다. 초기 설계 파트너로서, 시스코는 자사 제품 포트폴리오 전반에 걸친 실제 활용 사례를 평가하고 오픈에이아이(OpenAI) 팀에 피드백을 제공함으로써 코덱스의 미래를 함께 만들어가고 있습니다.
- 템포럴(Temporal)은 코덱스를 활용하여 기능 개발 가속화, 이슈 디버깅, 테스트 작성 및 실행, 대규모 코드베이스 리팩터링을 수행하고 있습니다. 또한 복잡한 작업을 백그라운드에서 실행함으로써 엔지니어가 흐름을 유지하고 반복 작업 속도를 높일 수 있도록 돕고 있습니다.
- 슈퍼휴먼(Superhuman)은 테스트 커버리지 개선, 통합 실패 수정 등 작지만 반복적인 작업을 빠르게 처리하기 위해 코덱스를 사용하고 있습니다. 또한, 제품 관리자도 엔지니어의 개입 없이(코드 리뷰를 제외하고) 간단한 코드 변경에 기여할 수 있도록 하여, 제품 출시 속도를 높이고 있습니다.
- 코디악(Kodiak)은 코덱스를 활용해 디버깅 도구 작성, 테스트 커버리지 개선, 코드 리팩터링을 진행하며, 자율주행 기술인 코디악 드라이버(Kodiak Driver) 개발 속도를 높이고 있습니다. 코덱스는 또한 엔지니어가 스택의 익숙하지 않은 부분을 이해할 수 있도록 관련 맥락과 과거 변경 사항을 제공하는 유용한 참고 도구로 자리잡았습니다.
초기 테스터들의 경험을 바탕으로, 저희는 명확하게 범위가 정해진 작업을 여러 에이전트에게 동시에 할당하고, 다양한 유형의 작업과 프롬프트를 실험해 모델의 역량을 효과적으로 탐색할 것을 권장합니다.
코덱스 명령줄 도구(CLI) 업데이트
지난달, 저희는 터미널에서 실행되는 경량 오픈소스 코딩 에이전트인 코덱스 명령줄 도구(Codex CLI)를 출시했습니다. 이 도구는 o3, o4-미니(o4-mini)와 같은 모델의 성능을 로컬 작업 흐름에 접목시켜, 작업을 더 빠르게 완료할 수 있도록 지원합니다.
오늘은 코덱스 명령줄 도구에서 사용하기 위해 특별히 설계된 o4-미니 기반의 소형 코덱스-1(codex-1) 버전도 함께 공개합니다. 이 새로운 모델은 명령줄 환경에서 더 빠른 작업 흐름을 지원하며, 저지연 코드 질의응답 및 편집에 최적화되어 있으면서도, 지시 이행과 스타일 측면의 강점을 그대로 유지합니다. 현재 코덱스 명령줄 도구의 기본 모델이자, 응용프로그램 인터페이스(API)에서는 codex-mini-latest로 제공됩니다. 코덱스-미니(Codex-mini) 모델의 성능이 향상될 때마다 기본 스냅샷도 정기적으로 업데이트될 예정입니다.
또한 개발자 계정을 코덱스 명령줄 도구에 더욱 쉽게 연결할 수 있도록 개선하였습니다. 이제는 응용프로그램 인터페이스(API) 토큰을 직접 생성하고 설정하는 대신, 챗지피티(ChatGPT) 계정으로 로그인하고 사용할 응용프로그램 인터페이스 조직을 선택하면, 저희가 자동으로 응용프로그램 인터페이스 키를 생성 및 설정해 드립니다. 플러스(Plus) 및 프로(Pro) 이용자는 챗지피티로 코덱스 명령줄 도구에 로그인하면, 각각 5달러 및 50달러 상당의 무료 응용프로그램 인터페이스 크레딧을 오늘부터 30일간 사용할 수 있습니다.
코덱스 제공 범위, 가격, 제한 사항
오늘부터 전 세계 챗지피티 프로, 엔터프라이즈, 팀 이용자에게 코덱스가 순차적으로 제공되며, 곧 플러스 및 에듀(Edu) 이용자도 지원될 예정입니다. 앞으로 몇 주간은 추가 비용 없이 넉넉한 사용량이 제공되어 코덱스의 기능을 자유롭게 체험할 수 있으며, 이후에는 사용량 제한 및 추가 사용량을 필요에 따라 구매할 수 있는 유연한 가격 정책이 도입될 예정입니다. 플러스 및 에듀 이용자에 대한 지원도 곧 확대할 계획입니다.
codex-mini-latest로 개발하는 경우, 해당 모델은 응답 응용프로그램 인터페이스(Responses API)에서 제공되며, 1백만 입력 토큰당 1.5달러, 1백만 출력 토큰당 6달러에 이용할 수 있습니다. 프롬프트 캐싱이 적용될 경우 75% 할인 혜택이 제공됩니다.
코덱스는 아직 개발 초기 단계에 있습니다. 연구 미리보기로 제공되는 현재 버전은 프론트엔드 작업을 위한 이미지 입력, 작업 중 에이전트의 경로를 수정하는 기능 등 일부 기능이 지원되지 않습니다. 또한 원격 에이전트에게 작업을 위임하는 경우, 대화형 편집에 비해 시간이 더 소요될 수 있으며, 이에 익숙해지는 과정이 필요할 수 있습니다. 시간이 지남에 따라 코덱스 에이전트와의 상호작용은 동료와의 비동기 협업과 점점 더 유사해질 것입니다. 모델의 역량이 발전함에 따라, 에이전트가 더 복잡한 작업을 장기간에 걸쳐 처리할 수 있을 것으로 기대합니다.
향후 계획
저희는 개발자가 자신이 직접 맡고 싶은 작업을 주도하고, 나머지는 에이전트에게 위임하여 더 빠르고 생산적으로 일할 수 있는 미래를 그리고 있습니다. 이를 위해, 실시간 협업과 비동기 위임을 모두 지원하는 코덱스 도구 모음을 개발하고 있습니다.
코덱스 명령줄 도구 등 인공지능 도구와 함께 작업하는 것은 이미 업계의 표준이 되어가고 있으며, 개발자들이 더 빠르게 코드를 작성할 수 있도록 돕고 있습니다. 그러나 저희는 챗지피티에서 코덱스가 도입한 비동기 다중 에이전트 작업 흐름이 고품질 코드를 생산하는 사실상의 표준 방식이 될 것으로 보고 있습니다.
궁극적으로, 실시간 협업과 작업 위임이라는 두 가지 상호작용 방식이 하나로 통합될 것으로 예상합니다. 개발자는 통합된 작업 흐름에서 통합 개발 환경(IDE)과 일상적인 도구 전반에 걸쳐 인공지능 에이전트와 협업하며, 질문을 하거나, 제안을 받고, 장기 작업을 위임할 수 있게 될 것입니다.
앞으로는 더욱 상호작용적이고 유연한 에이전트 작업 흐름을 도입할 계획입니다. 개발자는 곧 작업 중간에도 지침을 제공하고, 구현 전략을 함께 논의하며, 능동적인 진행 상황 업데이트를 받을 수 있게 될 것입니다. 또한 이미 사용 중인 도구와의 연계도 더욱 깊어질 예정입니다. 현재 코덱스는 깃허브와 연동되고 있으며, 앞으로는 코덱스 명령줄 도구, 챗지피티 데스크톱, 이슈 트래커나 지속적 통합(CI) 시스템 등 다양한 도구에서 직접 작업을 할당할 수 있게 될 것입니다.
소프트웨어 개발 분야는 인공지능 기반 생산성 향상의 효과를 가장 먼저 경험하고 있는 산업 중 하나로, 개인과 소규모 팀에게 새로운 가능성을 열어주고 있습니다. 저희는 이러한 발전에 대해 낙관적이지만, 동시에 파트너들과 협력하여 에이전트의 광범위한 도입이 개발자 업무 흐름, 역량 개발, 그리고 다양한 지역과 수준에 미치는 영향을 더 깊이 이해하고자 합니다.
이제 시작에 불과합니다. 여러분이 코덱스로 어떤 것을 만들어낼지 기대하고 있습니다.
라이브 스트림 다시보기
https://www.youtube.com/live/hhdpnbfH6NU?feature=shared
부록
시스템 메시지
저희는 개발자들이 모델의 기본 동작을 이해하고, 맞춤형 작업 흐름에 맞게 코덱스(Codex)를 효과적으로 활용할 수 있도록 코덱스-1(codex-1) 시스템 메시지를 공유합니다. 예를 들어, 코덱스-1 시스템 메시지는 코덱스가 AGENTS.md 파일에 언급된 모든 테스트를 실행하도록 권장하지만, 시간이 부족한 경우에는 이러한 테스트를 건너뛰도록 코덱스에 요청할 수 있습니다.
# Instructions
- The user will provide a task.
- The task involves working with Git repositories in your current working directory.
- Wait for all terminal commands to be completed (or terminate them) before finishing.
# Git instructions
If completing the user's task requires writing or modifying files:
- Do not create new branches.
- Use git to commit your changes.
- If pre-commit fails, fix issues and retry.
- Check git status to confirm your commit. You must leave your worktree in a clean state.
- Only committed code will be evaluated.
- Do not modify or amend existing commits.
# AGENTS.md spec
- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
- Instructions in AGENTS.md files:
- The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
- For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
- Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
- More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
- Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
- This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
# Citations instructions
- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
- File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
- `line_start` is the 1-indexed start line number of the relevant output within that file.
2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
- Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
- Do not cite completely empty lines inside the chunk, only cite lines that have content.
- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
- For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
- For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.