요즘IT
위시켓
AIDP
콘텐츠프로덕트 밸리
요즘 작가들컬렉션물어봐
놀이터
콘텐츠
프로덕트 밸리
요즘 작가들
컬렉션
물어봐
놀이터
새로 나온
인기
개발
AI
IT서비스
기획
디자인
비즈니스
프로덕트
커리어
트렌드
스타트업
서비스 전체보기
위시켓요즘ITAIDP
고객 문의
02-6925-4867
10:00-18:00주말·공휴일 제외
yozm_help@wishket.com
요즘IT
요즘IT 소개작가 지원
기타 문의
콘텐츠 제안하기광고 상품 보기
요즘IT 슬랙봇크롬 확장 프로그램
이용약관
개인정보 처리방침
청소년보호정책
㈜위시켓
대표이사 : 박우범
서울특별시 강남구 테헤란로 211 3층 ㈜위시켓
사업자등록번호 : 209-81-57303
통신판매업신고 : 제2018-서울강남-02337 호
직업정보제공사업 신고번호 : J1200020180019
제호 : 요즘IT
발행인 : 박우범
편집인 : 노희선
청소년보호책임자 : 박우범
인터넷신문등록번호 : 서울,아54129
등록일 : 2022년 01월 23일
발행일 : 2021년 01월 10일
© 2013 Wishket Corp.
로그인
요즘IT 소개
콘텐츠 제안하기
광고 상품 보기
AI

[릴리즈 노트] 사람만큼 컴퓨터를 다루는 LLM, Claude Sonnet 4.6

AI입니다만
8분
2시간 전
215
에디터가 직접 고른 실무 인사이트 매주 목요일에 만나요.
newsletter_profile0명 뉴스레터 구독 중

※ 본문은 Anthropic의  <Introducing Claude Sonnet 4.6>를 신속하게 전달하기 위해 AI 번역 및 요약을 사용했습니다. 요즘IT 실무자에게 필요한 정보 전달을 위해 내용을 일부 생략하고 배치를 조정했습니다. GPT-5.2를 활용해 번역 및 요약했습니다.

 

[Claude Sonnet 4.6 요약]

 

1. 핵심

  • 클로드 소넷 4.6(Claude Sonnet 4.6)은 Sonnet 계열 가운데 가장 뛰어난 모델로, 코딩·컴퓨터 사용·긴 문맥 추론·에이전트 계획·지식 업무·디자인 능력이 전반적으로 향상된 업그레이드 버전입니다.
  • 베타 단계에서 100만 토큰 문맥 창을 지원합니다.

 

2. 가격 및 제공 범위

  • Free와 Pro 요금제에서 기본 모델로 제공됩니다.
  • 가격은 Sonnet 4.5와 동일하며, 백만 토큰당 3달러/15달러부터 시작합니다.

 

3. 성능 체감 변화

  • 코딩 일관성, 지시 이해 능력이 개선되면서 초기 개발자들이 이전 모델보다 Sonnet 4.6을 더 선호했습니다.
  • 일부 경우에는 2025년 11월 기준 최고 모델이던 Opus 4.5보다도 선호되는 사례가 있었습니다.

 

4. 컴퓨터 사용 능력

  • API 없이도 사람이 하듯 마우스 클릭과 키보드 입력으로 소프트웨어를 조작하는 능력이 향상됐습니다.
  • 실제 사용에서는 복잡한 스프레드시트 탐색, 다단계 웹 양식 작성, 여러 브라우저 탭을 넘나드는 작업 등에서 사람 수준 능력이 관찰됐습니다.
  • 다만 숙련된 인간 사용자보다는 아직 일부 작업에서 뒤처진다고 설명합니다.

 

5. 안전성 변화

  • 프롬프트 주입 공격 등 위험에 대한 저항력이 Sonnet 4.5 대비 크게 개선됐습니다.
  • 연구진은 전반적으로 정직하고 사회적으로 이로운 성향을 보이며, 고위험 상황에서 큰 정렬 문제는 발견되지 않았다고 평가했습니다.

 

6. 개발자 플랫폼 업데이트

  • 적응형 사고와 확장 사고를 모두 지원합니다.
  • 문맥 압축 기능(베타)으로 오래된 대화를 자동 요약해 실제 활용 가능한 문맥 길이를 늘립니다.
  • API에서 검색 결과를 걸러내기 위한 코드를 자동 작성·실행해 응답 품질과 토큰 효율을 개선합니다.
  • 코드 실행, 기억 기능, 도구 호출, 도구 검색 기능이 정식 제공됩니다.

 

7. 엑셀 연동 기능

  • Excel용 Claude에서 MCP 연결 장치를 지원합니다.
  • 외부 데이터 도구와 연동해, 스프레드시트 안에서 바로 작업할 수 있습니다.

 

8. 사용 가능 환경

  • 모든 Claude 요금제, Claude Cowork, Claude Code, API, 주요 클라우드에서 즉시 사용 가능합니다.
  • 무료 요금제도 기본 모델이 Sonnet 4.6으로 업그레이드됐습니다.
  • 파일 생성, 연결 기능, 기술 기능, 문맥 압축 기능이 포함됩니다.
  • 개발자는 API에서 claude-sonnet-4-6 모델을 바로 사용할 수 있습니다.

 

Claude Sonnet 4.6은 지금까지 나온 Sonnet 계열 가운데 가장 뛰어난 모델입니다. 코딩, 컴퓨터 사용, 긴 문맥 추론, 에이전트 계획, 지식 업무, 디자인 전반에서 능력이 크게 향상된 완전한 업그레이드 버전입니다. 또한 Sonnet 4.6은 베타 단계에서 100만 토큰 문맥 창(context window)을 지원합니다.

 

Free와 Pro 요금제를 사용하는 이용자에게는 Sonnet 4.6이 이제 claude.ai와 Claude Cowork의 기본 모델로 제공됩니다. 가격은 Sonnet 4.5와 동일하며, 백만 토큰당 3달러/15달러부터 시작합니다.

 

Sonnet 4.6은 더 많은 사용자에게 크게 향상된 코딩 능력을 제공합니다. 일관성, 지시 이해 능력 등 여러 부분이 개선되면서, 초기 이용 개발자들은 이전 모델보다 Sonnet 4.6을 훨씬 선호하는 모습을 보였습니다. 심지어 2025년 11월 기준 가장 뛰어난 모델이었던 Claude Opus 4.5보다도 더 선호되는 경우가 많았습니다.

 

이전에는 Opus급 모델이 필요했던 성능, 특히 실제 업무에서 경제적 가치가 있는 사무 작업도 이제 Sonnet 4.6으로 처리할 수 있습니다. 또한 이전 Sonnet 모델과 비교해 컴퓨터 사용 능력도 크게 향상되었습니다.

 

새로운 Claude 모델이 나올 때마다 그렇듯, Sonnet 4.6 역시 폭넓은 안전성 평가를 거쳤습니다. 그 결과, 최근 Claude 모델과 비교해도 동일하거나 더 높은 수준의 안전성을 보였습니다. 안전성 연구진은 Sonnet 4.6에 대해 “전반적으로 따뜻하고, 정직하며, 사회적으로 이로운 성향을 보이고, 때로는 유머도 있으며, 안전 행동이 매우 뛰어나고, 고위험 상황에서의 큰 정렬 문제 징후는 없다”고 평가했습니다.

 

 

컴퓨터 사용 능력

거의 모든 조직에는 자동화하기 어려운 소프트웨어가 존재합니다. 현대적인 인터페이스인 API가 등장하기 전에 만들어진 특수 시스템이나 도구들입니다. 이런 소프트웨어를 AI가 사용하려면, 기존에는 사용자 측에서 별도의 연결 장치를 직접 만들어야 했습니다. 하지만 사람이 컴퓨터를 다루는 방식 그대로 사용할 수 있는 모델이 등장하면서 상황이 달라졌습니다.

 

우리는 2024년 10월, 범용 컴퓨터 사용 모델을 처음 공개했습니다. 당시에는 “아직 실험 단계이며, 다소 번거롭고 오류가 있을 수 있다”고 설명했지만, 빠른 개선을 예상했습니다. AI의 컴퓨터 사용 능력을 평가하는 표준 벤치마크인 OSWorld는 모델의 발전을 잘 보여줍니다. 이 벤치마크는 가상 컴퓨터 환경에서 Chrome, LibreOffice, VS Code 등 실제 소프트웨어를 사용해 수백 가지 작업을 수행하도록 구성되어 있습니다. 별도의 API나 전용 연결 장치 없이, 모델은 사람이 하듯 가상 마우스를 클릭하고 가상 키보드로 입력하며 컴퓨터를 조작합니다.

 

지난 16개월 동안 Sonnet 계열 모델은 OSWorld에서 꾸준히 성능을 끌어올려 왔습니다. 이런 향상은 벤치마크를 넘어 실제 사용에서도 확인됩니다. 초기 Sonnet 4.6 사용자들은 복잡한 스프레드시트를 탐색하거나 여러 단계로 이루어진 웹 양식을 작성하는 작업 등에서 사람 수준의 능력을 경험하고 있습니다. 이후 여러 브라우저 탭을 넘나들며 작업을 종합하는 능력도 보여주고 있습니다.

 

물론 컴퓨터 사용 능력에서는 여전히 가장 숙련된 인간 사용자보다 뒤처지는 부분이 있습니다. 하지만 발전 속도는 매우 인상적입니다. 이는 컴퓨터 사용 기능이 다양한 업무에서 훨씬 더 실용적으로 쓰일 수 있음을 의미하며, 앞으로 더 뛰어난 모델이 등장할 가능성도 보여줍니다.

 

Claude Sonnet 4.5 이전 점수는 기존 OSWorld 기준이며, Sonnet 4.5 이후부터는 OSWorld-Verified 기준으로 측정되었습니다. OSWorld-Verified(2025년 7월 공개)는 기존 OSWorld 벤치마크를 개선한 버전으로, 과제 품질, 평가 방식, 기반 구조가 업데이트되었습니다.

 

동시에, 컴퓨터 사용 기능에는 위험 요소도 존재합니다. 악의적인 사용자가 웹사이트에 숨겨진 지시문을 통해 모델을 조종하려는, 이른바 프롬프트 주입 공격을 시도할 수 있기 때문입니다. 우리는 이런 공격에 대한 저항력을 높이기 위해 모델을 지속적으로 개선해 왔습니다. 안전성 평가 결과, Sonnet 4.6은 이전 모델인 Sonnet 4.5보다 크게 개선되었으며, Opus 4.6과 비슷한 수준의 성능을 보였습니다. 프롬프트 주입 등 안전 문제를 완화하는 방법에 대해서는 API 문서에서 더 자세히 확인할 수 있습니다.

 

 

 

Claude Sonnet 4.6 평가

컴퓨터 사용 능력뿐 아니라, Claude Sonnet 4.6은 전반적인 벤치마크에서 성능이 향상되었습니다. 더 많은 작업에 현실적으로 적용할 수 있는 가격대에서 Opus급 지능에 가까운 성능을 보여줍니다. Sonnet 4.6의 기능과 안전성 관련 행동에 대한 자세한 내용은 시스템 카드에서 확인할 수 있으며, 아래에는 최근 모델들과의 비교 요약이 제시되어 있습니다.

 

 

Claude Code에서 진행한 초기 시험에서는, 사용자들이 Sonnet 4.6을 Sonnet 4.5보다 약 70%의 비율로 더 선호하는 것으로 나타났습니다. 사용자들은 코드 수정 전에 문맥을 더 잘 읽고, 동일한 로직을 중복 작성하기보다 공통 로직을 통합하는 점을 높이 평가했습니다. 그 결과, 이전 모델보다 긴 세션에서도 덜 답답하게 사용할 수 있었다고 보고했습니다.

 

사용자들은 심지어 2025년 11월 기준 최신 모델이었던 Opus 4.5보다도 Sonnet 4.6을 59%의 비율로 더 선호했습니다. Sonnet 4.6이 과도한 설계나 ‘게으른’ 처리 경향이 훨씬 적고, 지시를 따르는 능력도 의미 있게 개선되었다는 평가였습니다. 또한 성공을 잘못 주장하는 경우나 환각 현상이 줄었고, 여러 단계로 이루어진 작업에서도 더 일관되게 마무리했다는 의견이 많았습니다.

 

Sonnet 4.6의 100만 토큰 문맥 창은 전체 코드 기반, 긴 계약서, 혹은 수십 편의 연구 논문을 한 번의 요청에 담을 수 있을 만큼 충분한 크기입니다. 더 중요한 점은, Sonnet 4.6이 그 모든 문맥을 바탕으로 효과적으로 추론한다는 사실입니다. 이는 장기적인 계획 수립 능력을 크게 향상시킬 수 있습니다. 이러한 특성은 가상 기업을 일정 기간 운영하도록 하는 Vending-Bench Arena 평가에서 특히 뚜렷하게 나타났습니다. 이 평가는 여러 AI 모델이 서로 경쟁하며 가장 큰 수익을 내도록 하는 요소를 포함하고 있습니다.

 

Sonnet 4.6은 흥미로운 새로운 전략을 보여주었습니다. 처음 열 달 동안은 생산 능력 확대에 집중하며 경쟁 모델보다 훨씬 많은 비용을 투자했고, 이후에는 전략을 급격히 전환해 수익성 중심 운영에 집중했습니다. 이러한 전환 시점이 적절하게 맞아떨어지면서, 최종 결과에서 경쟁 모델보다 크게 앞서는 성과를 냈습니다.

 

초기 고객들도 전반적인 성능 향상을 보고했으며, 특히 프런트엔드 코드 작성과 재무 분석에서 두드러진 개선이 나타났습니다. 사용자들은 Sonnet 4.6이 만들어 낸 시각 결과물이 이전 모델보다 훨씬 더 정교하고, 레이아웃·애니메이션·디자인 감각이 개선되었다고 평가했습니다. 또한 실제 서비스에 사용할 수준의 결과물에 도달하기까지 필요한 반복 횟수도 줄어들었다고 보고했습니다.

 

 

제품 업데이트

Claude 개발자 플랫폼에서 Sonnet 4.6은 적응형 사고(adaptive thinking)와 확장 사고(extended thinking)를 모두 지원하며, 베타 단계의 문맥 압축(context compaction) 기능도 제공합니다. 이 기능은 대화가 한계에 가까워지면 오래된 문맥을 자동으로 요약해 교체함으로써, 실제로 활용 가능한 문맥 길이를 늘려 줍니다.

 

응용 프로그램 연결 환경(API)에서는 Claude의 웹 검색 및 가져오기 도구가 이제 검색 결과를 걸러내고 처리하기 위한 코드를 자동으로 작성하고 실행합니다. 이를 통해 문맥에는 관련 내용만 남게 되어, 응답 품질과 토큰 효율이 모두 개선됩니다. 또한 코드 실행, 기억 기능, 프로그램 방식 도구 호출, 도구 검색, 도구 사용 예시 기능이 이제 정식으로 제공됩니다.

 

Sonnet 4.6은 확장 사고를 끈 상태에서도, 어떤 노력 수준에서든 안정적인 성능을 보여줍니다. Sonnet 4.5에서 이전하는 경우, 속도와 안정적인 성능 사이에서 가장 적절한 균형을 찾을 수 있도록 다양한 설정을 시험해 보는 것을 권장합니다.

 

가장 깊은 수준의 추론이 필요한 작업—예를 들어 코드 기반 전체 구조를 다시 설계하는 작업, 여러 에이전트를 조율하는 작업, 혹은 정확성이 특히 중요한 문제—에서는 여전히 Opus 4.6이 가장 강력한 선택지라고 판단합니다.

 

Excel용 Claude를 사용하는 사용자에게는, 이제 추가 기능에서 MCP 연결 장치(connectors)를 지원합니다. 이를 통해 S&P Global, LSEG, Daloopa, PitchBook, Moody’s, FactSet 같은 일상 업무 도구와 연동할 수 있습니다. 이제 스프레드시트를 벗어나지 않고도 외부 맥락을 불러와 Claude에게 작업을 요청할 수 있습니다. 이미 claude.ai에서 MCP 연결을 설정해 두었다면, 동일한 연결이 Excel에서도 자동으로 적용됩니다. 이 기능은 Pro, Max, Team, Enterprise 요금제에서 사용할 수 있습니다.

 

 

Claude Sonnet 4.6 사용 방법

Claude Sonnet 4.6은 모든 Claude 요금제, Claude Cowork, Claude Code, 응용 프로그램 연결 환경(API), 그리고 주요 클라우드 플랫폼에서 지금 바로 사용할 수 있습니다. 무료 요금제도 기본 모델이 Sonnet 4.6으로 업그레이드되었으며, 파일 생성, 연결 기능, 기술 기능, 문맥 압축 기능이 포함됩니다.

 

개발자라면 Claude API에서 claude-sonnet-4-6 모델을 사용해 바로 시작할 수 있습니다.