[릴리즈노트] 오픈AI API에서 제공하는 최신 이미지 생성 모델 소개
※ 본문은 오픈AI의 <Introducing our latest image generation model in the API>를 신속하게 전달하기 위해 AI 번역을 사용했습니다. 일부 문장에 오역이나 부자연스러운 표현이 있을 수 있으니 참고하시기 바랍니다.
[요약]
챗지피티(ChatGPT)에 도입된 이미지 생성 기능의 기반 모델인 gpt-image-1이 API로 공개됨.
gpt-image-1의 주요 특징
- 다양한 스타일의 이미지 생성 가능
- 맞춤형 지침을 충실히 반영
- 폭넓은 세계 지식 활용
- 글자(문자) 표현이 정확
- 여러 분야에서 실질적 활용 가능
기존 모델 대비 개선점
- 전문가 수준의 고품질 이미지 생성
- 글자 표현력과 맞춤형 지침 반영 능력 강화
- 다양한 산업에서의 실질적 적용 가능성 확대
주요 활용 사례
- 디자인 및 편집: 캔바(Canva)에서 손그림을 그래픽으로 변환, 고화질 편집 지원(2억 3천만 명 사용자 대상)
- 로고 제작 및 편집: 고대디(GoDaddy)에서 손쉬운 로고 제작, 배경 제거, 글꼴 생성, 브랜드 자료 제작
- 마케팅 자료 제작: 허브스팟(HubSpot)에서 전문 디자인 역량 없이 고품질 이미지 제작 지원
- 레시피 및 장보기: 인스타카트(Instacart)에서 레시피와 장보기 목록 이미지 자동 생성
- 동영상 편집: 인비디오(invideo)에서 글자 생성, 세밀한 편집, 고급 스타일 가이드 제공
안전성
- 챗지피티 4o와 동일한 안전 장치 적용
- 유해 이미지 생성 제한, 생성 이미지에 C2PA 메타데이터 포함
- 민감도 조절(moderation) 기능 제공(자동/낮음 선택 가능)
- API 데이터는 학습에 사용하지 않음, 정책 준수 필요
요금 정책
- 글자 입력: 100만 토큰당 5달러
- 이미지 입력: 100만 토큰당 10달러
- 이미지 출력: 100만 토큰당 40달러
- 실제 사용 예시: 저화질 0.02달러, 중화질 0.07달러, 고화질 0.19달러(이미지 1장 기준)
대상 사용자
- 자체 서비스에 전문가 수준 이미지 생성 기능을 통합하려는 개발자 및 기업
- 디자인, 마케팅, 전자상거래, 교육, 동영상 등 다양한 산업군
시작 방법
- 전 세계적으로 API 제공
- 일부 조직은 사전 인증 필요
- 플레이그라운드에서 체험 및 안내서 제공
지난달 챗지피티(ChatGPT)에 이미지 생성 기능을 도입한 이후, 이 기능은 빠르게 가장 인기 있는 기능 중 하나로 자리잡았습니다. 전 세계 1억 3천만 명 이상의 사용자가 첫 주에만 7억 장이 넘는 이미지를 생성하였습니다.
오늘부터 챗지피티에서 이 경험을 가능하게 했던 본래의 다중 모달(multimodal) 모델을 gpt-image-1이라는 이름으로 API를 통해 제공합니다. 이를 통해 개발자와 기업은 고품질의 전문가 수준 이미지 생성 기능을 손쉽게 자체 도구와 플랫폼에 직접 통합할 수 있습니다. 이 모델은 다양한 스타일의 이미지를 생성할 수 있을 뿐만 아니라, 맞춤형 지침을 충실히 따르고, 폭넓은 세계 지식을 활용하며, 글자를 정확하게 표현할 수 있어 여러 분야에서 실질적인 활용 사례를 무한히 확장할 수 있습니다.
창작 도구, 전자상거래, 교육, 기업용 소프트웨어, 게임 등 다양한 산업 분야의 선도 기업과 신생 기업들이 이미 자사 제품과 서비스에 이미지 생성 기능을 도입하고 있습니다. 아래에는 이러한 활용 사례 중 일부를 소개합니다.

또한, 저희는 개발자 및 기업과 지속적으로 협력하여 API 기반 이미지 생성이 다양한 사용 사례에 어떻게 기여할 수 있을지 새로운 방안을 모색하고 있습니다. 주요 사례는 다음과 같습니다.
디자인 및 편집: 캔바(Canva)는 오픈에이아이(OpenAI)의 gpt-image-1을 자사 캔바 인공지능(Canva AI) 및 매직 스튜디오(Magic Studio) 도구에 통합하여 디자인 생성과 편집의 한계를 확장하는 방안을 모색하고 있습니다. gpt-image-1의 기능을 활용해 손그림을 인상적인 그래픽 요소로 변환하거나, 고화질 시각적 편집을 가능하게 함으로써, 캔바는 2억 3천만 명의 사용자가 완전히 새로운 방식으로 아이디어를 실현할 수 있도록 지원할 예정입니다.
로고 제작 및 편집: 고대디(GoDaddy)는 고객이 손쉽게 편집 가능한 로고를 만들고, 배경을 제거하며, 전문가 수준의 글꼴을 생성할 수 있도록 이미지 생성 기능의 통합을 적극적으로 실험하고 있습니다. 또한, 고대디 아이로(GoDaddy Airo®)의 새로운 경험을 통해, 고객이 고유한 브랜드 정체성을 반영한 소셜 미디어 게시물과 마케팅 자료를 직접 생성할 수 있도록 지원하고 있습니다.
마케팅 자료 제작: 허브스팟(HubSpot)은 오픈에이아이의 새로운 인공지능 이미지 생성 기능이 고객의 마케팅 및 영업 자료 제작에 어떻게 도움이 될 수 있을지 탐구하고 있습니다. 허브스팟은 성장하는 기업을 위한 인공지능 기반 도구를 지속적으로 추가하고 있으며, 이러한 이미지 생성 기능은 고객이 전문적인 디자인 역량 없이도 소셜 미디어, 이메일 마케팅, 랜딩 페이지에 사용할 고품질 이미지를 제작하는 방식을 혁신할 잠재력을 지니고 있습니다.
레시피 및 장보기 목록 생성: 인스타카트(Instacart)는 레시피와 장보기 목록에 사용할 이미지를 포함해, API를 활용한 이미지 생성의 새로운 활용 방안을 시험하고 있습니다.
동영상 편집: 인비디오(invideo)는 수백만 명의 사용자가 인공지능을 활용해 아이디어를 동영상으로 변환할 수 있도록 지원합니다. gpt-image-1 통합을 통해, 이 플랫폼은 더욱 향상된 글자 생성, 세밀한 편집 제어, 고급 스타일 가이드를 제공하게 되었습니다.
안전성
API에서 제공되는 gpt-image-1 모델은 챗지피티의 4o 이미지 생성과 동일한 안전 장치를 적용하고 있습니다. 여기에는 유해한 이미지 생성을 제한하는 보호 장치와, 생성된 이미지에 C2PA 메타데이터를 포함하는 기능이 포함되어 있습니다. 이에 대한 자세한 내용은 이전 블로그 게시글에서 확인하실 수 있습니다. 또한, 개발자는 moderation
매개변수를 통해 필터링 민감도를 직접 조정할 수 있습니다. 기본값인 자동(auto)은 표준 필터링을 제공하며, 낮음(low)으로 설정하면 제한이 완화됩니다. 자세한 내용은 문서를 참고하시기 바랍니다.
기본적으로 저희는 고객 API 데이터를 학습에 사용하지 않으며, 모든 이미지 입력 및 출력은API 사용 정책의 적용을 받습니다.
가격 정책
gpt-image-1 사용 요금은 토큰(token) 단위로 부과되며, 글자와 이미지 토큰에 대해 각각 별도의 요금이 적용됩니다.
- 글자 입력 토큰(프롬프트 글자): 100만 토큰당 5달러
- 이미지 입력 토큰(입력 이미지): 100만 토큰당 10달러
- 이미지 출력 토큰(생성 이미지): 100만 토큰당 40달러
실제 사용 시, 저화질, 중화질, 고화질 정사각형 이미지는 각각 약 0.02달러, 0.07달러, 0.19달러의 비용이 발생합니다. 이미지 품질 및 크기별 상세 요금은 문서를 참고하시기 바랍니다.
시작 안내
gpt-image-1 모델은 현재 전 세계적으로 이미지 API를 통해 제공되고 있으며, 곧 응답 API(Responses API)도 지원할 예정입니다. 일부 개발자는 모델 사용 전 조직 인증이 필요할 수 있습니다. 조직 설정에서 이미 접근 권한이 있는지 확인해 주시기 바랍니다.
시작하시려면, 플레이그라운드에서 모델의 기능을 직접 체험해보고, 이미지 생성 안내서를 참고해 주시기 바랍니다. 여러분이 만들어갈 다양한 활용 사례를 기대합니다.