<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel xmlns:content="http://purl.org/rss/1.0/modules/content/"><title>요즘IT » AI » 피드</title><link>https://yozm.wishket.com/magazine/list/ai</link><description>쉽고 재미있는 IT 이야기를 다룹니다. 업계 전문가들이 전하는 IT 트렌드, 기획, 디자인, 개발, 인사이트 소식들이 가득합니다.</description><atom:link href="https://yozm.wishket.com/magazine/list/ai/feed/" rel="self"/><language>ko-kr</language><lastBuildDate>Thu, 18 Jun 2026 14:34:51 +0000</lastBuildDate><item><title>AI PRD는 무엇이 달라야 하는가</title><link>https://yozm.wishket.com/magazine/detail/3809</link><description>집에서 쓰는 요리 노트는 '소금 약간'으로도 매번 맛있지만, 미슐랭 주방에선 '천일염 2.3g' 이라고 적혀야 누가 만들어도 같은 맛이 납니다. 기존 PRD는 전자에 가까웠습니다. 같은 입력에 같은 출력이 나오니 '무엇이 일어나야 하는가'만 적으면 됐죠. 그런데 AI 기능은 같은 사람이 만들어도 매번 답이 달라집니다. 그래서 AI PRD는 '허용 가능한 답변의 범위'와 그걸 어떻게 판단할지(Eval Plan)까지 약속해야 합니다. AI PRD에 꼭 들어가야 할 8가지와 가격 모델을 기획하는 법까지 짚었습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3809</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;&amp;lt;AI 프로덕트 매니지먼트 시리즈&amp;gt;&lt;/i&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;새로운 시대의 AI 프로덕트가 기존의 프로덕트와 무엇이 다른지를 다룹니다. PM의 관점에서 말하지만, AI 프로덕트를 다루는 모두 참고할 만한 이야기를 묶었습니다. 필자가 출간할 예정인 〈AI Product Management(가제)〉 책의 일부를 요즘IT 독자의 시선에 맞춰 재가공했습니다.&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;① &lt;a href="https://yozm.wishket.com/magazine/detail/3775/"&gt;AI는 왜 자꾸 틀리는가&lt;/a&gt;&lt;br&gt;② &lt;a href="https://yozm.wishket.com/magazine/detail/3784/"&gt;PM은 LLM을 어디까지 이해해야 할까?&lt;/a&gt;&lt;br&gt;③ &lt;a href="https://yozm.wishket.com/magazine/detail/3797/"&gt;AI 기능은 프롬프트가 아니라 시스템으로 만든다&lt;/a&gt;&lt;br&gt;&lt;strong&gt;④ AI PRD는 무엇이 달라야 하는가&lt;/strong&gt;&lt;/p&gt;&lt;hr&gt;&lt;p style="text-align:justify;"&gt;집에서 어머니가 쓰시는 요리 노트를 한 번 펼쳐봅시다. “소금 약간”, “국간장 한 큰술”, “불 줄여 한소끔 끓이기.” 우리는 이 익숙한 표현에 어색함을 느끼지 못합니다. 어머니는 “약간”이 얼마인지 손끝의 감각으로 재고, “한소끔”이 어느 정도인지 냄비의 소리로 짐작합니다. 그래도 결과는 매번 맛있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;한편 미슐랭 별을 받은 셰프의 레시피를 보면 어떨까요? 같은 미역국이라도 표현이 다릅니다. “천일염 2.3g”, “국간장 15ml”, “75°C 유지하며 정확히 4분간 끓임.” 단위가 다르고, 단어가 다르며, 무엇보다 “읽고 그대로 따라 했을 때 같은 결과가 나오도록” 정밀하게 정의되어 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;두 레시피는 같은 음식을 만들기 위한 자료처럼 보이지만, 사실 전혀 다른 문서입니다. 어머니의 레시피는 “이미 요리를 아는 사람을 위한 참고서”이고, 셰프의 레시피는 “이 요리를 처음 보는 사람도 같은 결과를 만들어내도록 하는 설계도”입니다. 미슐랭 레스토랑 주방에서 어머니의 “소금 약간”으로 레시피를 운용한다면, 서로 다른 셰프가 만들었을 때 음식 맛이 완전히 달라질 것입니다. 그건 레스토랑의 지속성을 해치는 일입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;PRD&lt;span style="color:#999999;"&gt;(Product Requirements Document, 제품 요구사항 정의서)&lt;/span&gt;도 비슷합니다. 기존 소프트웨어의 PRD는 어머니의 레시피에 가까웠습니다. “버튼을 누르면 결제 페이지로 이동한다” 정도의 정의만으로도 엔지니어가 자기 손끝의 감각을 믿으며 만들어냈고, 결과는 매번 똑같았습니다. 그런데 AI 기능&lt;span style="color:#999999;"&gt;(feature)&lt;/span&gt;을 만들 때는 이 스타일로 PRD를 쓰면, 만든 사람마다 결과가 달라질뿐더러, 심지어 같은 사람이 만들어도 매번 결과가 달라집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;따라서 AI 시대의 PM에게는 “미슐랭 셰프의 레시피”가 필요합니다. 그게 바로 오늘 다룰 주제입니다. AI PRD는 기존 PRD와 무엇이 어떻게 달라야 할까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;1. 기존 PRD는 왜 AI 기능에 안 맞는가&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;기존 소프트웨어 PRD의 핵심은 “행동의 정의”입니다.&lt;/strong&gt; 사용자가 X를 하면 시스템은 Y를 한다. 사용자가 “결제” 버튼을 누르면 결제 페이지가 뜨고, 카드 정보를 입력하고 “확인”을 누르면 결제가 처리된다. PRD는 이런 동작들을 빠짐없이 적어두는 문서였습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이런 메커니즘의 설계가 가능했던 이유는, 기존 소프트웨어가 결정론적&lt;span style="color:#999999;"&gt;(deterministic)&lt;/span&gt; 시스템이었기 때문입니다. 같은 입력에 같은 출력이 나오니까, “무엇이 일어나야 하는가”만 정의하면 충분했습니다. 행동이 정의되면 결과가 따라왔습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 기능은 다릅니다. &lt;a href="https://yozm.wishket.com/magazine/detail/3775/"&gt;1편&lt;/a&gt;의 에어캐나다 챗봇 사례처럼 사용자가 “가족 사별로 인한 할인이 있나요?”라고 물었을 때, 모델은 어떤 답을 낸다고 정의해야 할까요? PRD에 “고객 지원 챗봇은 사용자의 질문에 정확하게 답한다”라고 적어둔다고 그 답이 정확해질까요? “정확하다”의 기준은 무엇인가요? 90%만 맞히면 정확한 건가요, 99% 맞혀야 하나요? 어떤 질문에는 답하고 어떤 질문에는 답하지 말아야 하나요? 같은 질문에 매번 다른 답이 나오는 것은 버그인가요, 기능인가요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;AI PRD에서는 “무엇이 일어나야 하는가”가 아니라 “어떤 답이 받아들여질 만한가”를 정의해야 합니다. 그리고 그 “받아들여질 만한가”를 어떻게 판단할지 함께 설계해야 합니다.&lt;/strong&gt; &lt;strong&gt;기존 PRD가 “단일 행동”을 정의했다면, AI PRD는 “허용 가능한 답변의 범위”를 정의합니다. 이게 두 문서의 가장 근본적인 차이입니다.&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 AI PRD에는 기존 PRD에 없던 새로운 섹션들이 필요합니다. 그중 가장 중요한 것이 Eval Plan&lt;span style="color:#999999;"&gt;(평가 계획)&lt;/span&gt;입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3809/image3.png"&gt;&lt;figcaption&gt;기존 PRD와 AI PRD 비교 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;2. AI PRD의 새로운 심장: Eval Plan&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;Eval&lt;span style="color:#999999;"&gt;(이밸, evaluation의 줄임말)&lt;/span&gt;은 AI 기능이 “잘 동작하고 있는가”를 판단하는 기준이자 도구입니다. 그리고 Eval Plan은 그 기준과 도구를 PRD에 명시적으로 적어두는 문서입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;쉽게 말하면 이렇습니다. 음식점이 미슐랭 별을 받으려면 평가단이 무엇을 보고 별을 매기는지 알아야 합니다. “신선도”, “창의성”, “일관성” 같은 기준들이죠. AI 기능도 마찬가지입니다. 우리가 만든 챗봇이 “잘 동작하고 있다”고 말하려면, 무엇을 기준으로 그렇게 판단할지를 먼저 정해야 합니다. 기준이 없으면 “잘 동작한다”라는 말은 그저 느낌일 뿐입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Eval은 실제로 어떻게 쓰이는가&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Eval Plan이라고 하면 거창해 보이지만, 핵심은 단순합니다. “테스트 케이스의 모음”이라고 생각하면 충분합니다. 이를 쓸 때는 사용자가 입력할 만한 질문들을 모아두고, 각 질문에 대해 “이런 답이면 합격”, “이런 답이면 불합격”의 기준을 적어둡니다. 실제로 많은 팀이 스프레드시트 한 장으로 시작합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;예를 들어 고객 지원 챗봇의 Eval 스프레드시트는 이런 식으로 쓰입니다. 한 행에 입력&lt;span style="color:#999999;"&gt;(사용자 질문)&lt;/span&gt;, 기대 출력&lt;span style="color:#999999;"&gt;(어떤 답이면 좋은가)&lt;/span&gt;, 실제 출력&lt;span style="color:#999999;"&gt;(모델이 실제로 한 답)&lt;/span&gt;, 점수, 합격 여부가 들어갑니다. “배송이 늦어요”란 입력에 대한 기대 출력이 “주문 번호 확인 후 배송 상태를 안내하고, 필요시 환불·교환 옵션 제시”라고 하겠습니다. 이때, 실제 출력이 “죄송합니다. 배송이 지연되고 있는 점 양해 부탁드립니다”로 끝나버린다면 그건 불합격입니다. 사용자가 진짜로 알고 싶은 “내 주문은 어떻게 되는가”에 답을 안 해줬으니까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;처음에는 20~30개 케이스로만 시작해도 충분합니다. 그러다 시간이 지나면서 새로운 실패 케이스가 발견될 때마다 스프레드시트에 한 줄씩 추가합니다. 6개월쯤 지나면 200줄짜리 단단한 Eval 셋이 만들어집니다. 이게 팀의 가장 큰 자산이 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Eval 피라미드: 어떻게 평가할 것인가&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;다만, Eval 셋이 200개가 넘어가면 새로운 문제가 생깁니다. 매번 사람이 200개를 다 읽고 채점할 수는 없다는 것입니다. 그래서 실제 운영에서는 평가 방식을 “피라미드” 모양으로 조합합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;피라미드의 맨 아래는 규칙 기반(Rule-based) 평가&lt;/strong&gt;입니다. “답에 특정 단어가 포함되어야 한다”, “답이 100자를 넘으면 안 된다”, “답에 회사 기밀이 포함되면 안 된다” 같은 명확한 규칙으로 답변을 자동 채점합니다. 빠르고 비용이 거의 들지 않습니다. 대신 “답이 정말 사용자에게 도움이 되는가” 같은 미묘한 평가는 어렵습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;중간층은 LLM-as-a-Judge입니다.&lt;/strong&gt; 다른 LLM을 “채점자”로 써서 답의 품질을 평가하게 하는 방식입니다. “이 답이 사용자 질문에 적절한가?”를 사람 대신 LLM이 판단합니다. 사람보다 100배 빠르고 훨씬 저렴하지만, 채점자 LLM 자체의 편향이나 환각이 영향을 줄 수 있어 완전히 믿을 수는 없습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;꼭대기는 사람 평가&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(Human Eval)&lt;/span&gt;&lt;strong&gt;입니다.&lt;/strong&gt; 실제 사람이 답을 읽고 점수를 매깁니다. 가장 정확하지만 가장 느리고 비쌉니다. 그래서 가장 까다로운 케이스, 또는 새로 발견된 실패 패턴에만 선별적으로 적용합니다. 무엇보다 &lt;strong&gt;회귀 테스트의 “기준점”을 만들 때는 사람 평가가 필수입니다.&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3809/image4.png"&gt;&lt;figcaption&gt;Eval의 3가지 종류 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제 운영 과정에서는 이 세 가지를 피라미드처럼 쌓아서 운영합니다. 일상적으로는 규칙 기반과 LLM-as-a-Judge로 빠르게 돌리고, 중요한 변경이 있을 때 사람 평가를 추가합니다. PM이 Eval Plan을 짤 때 “이 케이스는 어느 층으로 평가할 것인가”를 함께 정해두면, 출시 후 평가 비용이 통제됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;회귀 테스트: “프롬프트 수렁”의 해결책&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;AI 기능을 만들어 본 PM이라면 다들 한 번씩 겪는 일이 있습니다. 어떤 케이스가 잘 안된다고 해서 프롬프트를 손봤더니, 잘 되던 다른 케이스가 갑자기 망가지는 것입니다. A를 고치니 B가 깨지고, B를 고치니 C가 깨지고. 이걸 업계에서는 “프롬프트 수렁&lt;span style="color:#999999;"&gt;(Prompt Swamp)&lt;/span&gt;”이라고 부릅니다. 시간은 다 쓰는데 전체 성능은 그대로인 늪 같은 상태입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;프롬프트 수렁의 근본 원인은 회귀 테스트&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(regression test)&lt;/span&gt;&lt;strong&gt;의 부재입니다.&lt;/strong&gt; 이 테스트는 소프트웨어에서 코드를 수정할 때마다 기존 기능이 망가지지 않았는지 자동으로 확인하는 것으로, AI 기능의 구현에서도 똑같이 필요합니다. 프롬프트를 수정할 때마다 그동안 누적된 Eval 셋 전체를 다시 돌려서, 점수가 떨어진 케이스가 없는지 확인하는 식입니다. 이게 안 되면 우리는 영원히 “이쪽 고치면 저쪽이 망가지는” 순환에 갇히고 맙니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Eval Plan이 PRD에 명시되어 있다는 건, 결국 “이 기능을 출시한 후에도 팀은 계속 같은 기준으로 성능을 측정할 것이며, 그 기준은 시간이 지나면서 더 단단해질 것”이라는 약속입니다. 이 약속이 PRD에 적혀 있느냐 없느냐가, 6개월 후 그 기능의 운명을 가릅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;3. AI PRD에 반드시 들어가야 할 8가지&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;그렇다면 Eval Plan을 포함해서, AI PRD에 빠뜨리지 말아야 할 것은 무엇일까요? 다음 여덟 가지가 기본 체크리스트입니다. 일반 PRD에도 있는 항목들이지만, AI 맥락에서는 채워야 할 내용이 다릅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;1. &lt;strong&gt;기능 개요:&lt;/strong&gt; 이 AI 기능이 풀려는 사용자 문제는 무엇인가? 여기에는 “AI를 쓰고 싶어서”가 아니라 &lt;strong&gt;“이 문제는 AI가 가장 잘 풀기 때문에”라는 답이 나와야 합니다.&lt;/strong&gt; AI를 위한 AI는 가장 흔한 실패의 출발점입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;2. &lt;strong&gt;입출력 명세:&lt;/strong&gt; 사용자가 어떤 형태의 입력을 보내고, 시스템은 어떤 형태의 출력을 돌려주는가? 텍스트인가, 이미지인가, 길이는 어느 정도인가, 어떤 언어를 지원하는가. 입력의 범위와 출력의 형식을 미리 정의해두지 않으면, 모델이 받는 “날것의 입력”이 무엇이 될지 통제할 수 없습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;3. &lt;strong&gt;시스템 프롬프트 초안:&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/detail/3797/"&gt;3편&lt;/a&gt;에서 다룬 시스템 프롬프트를 PRD 단계에서 미리 짜둡니다. 모델의 역할, 답변의 톤과 형식, 참고해야 할 정보, 하지 말아야 할 것, 막혔을 때의 출구 등등. “엔지니어가 알아서 짤 거다”라고 미루지 않고, PM이 PRD에 초안 수준으로라도 명시합니다. 이게 곧 기능의 “인격”을 결정합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;4. &lt;strong&gt;품질 기준:&lt;/strong&gt; “이 정도면 합격”의 기준입니다. 사실관계는 어디까지 정확해야 하는가, 톤은 어떠해야 하는가, 답변의 길이는 어느 정도여야 하는가. 이 기준이 명확해야 다음에 나오는 Eval Plan을 짤 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;5. &lt;strong&gt;실패 정의:&lt;/strong&gt; 어떤 답이 나오면 “실패”인지를 명시적으로 정의합니다. 사실과 다른 정보를 자신만만하게 답한 경우&lt;span style="color:#999999;"&gt;(환각)&lt;/span&gt;, 회사 정책과 어긋나는 약속을 한 경우, 사용자에게 위험한 조언을 한 경우 등등. 에어캐나다 챗봇 사고는 이 “실패 정의”가 PRD에 없었기 때문에 일어났습니다. 무엇이 실패인지 모르면 막을 수도 없습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;6. &lt;strong&gt;평가 계획:&lt;/strong&gt; 위에서 자세히 다룬 그 내용입니다. 어떤 입력에 어떤 답이면 합격인지, Eval 셋은 어떻게 관리할 것인지, 평가는 어떤 층&lt;span style="color:#999999;"&gt;(규칙 기반/LLM-as-a-Judge/사람)&lt;/span&gt;으로 운영할 것인지, 회귀 테스트는 어떻게 돌릴 것인지 다룹니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;7. &lt;strong&gt;모니터링 계획:&lt;/strong&gt; 출시 후 이 기능이 잘 동작하고 있는지를 어떻게 추적할 것인가? 어떤 지표를 대시보드에 띄울 것인가, 어떤 신호가 보이면 알람을 받을 것인가, 어떤 주기로 Eval을 다시 돌릴 것인가 정의합니다. AI 프로덕트의 성공 지표는 다음 회에서 다루겠지만, 그 지표를 “어떻게 관찰할 것인가”는 이미 PRD에 들어가야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;8. &lt;strong&gt;리스크 및 제한사항:&lt;/strong&gt; 이 기능이 가진 한계와 위험을 솔직하게 적어둡니다. 어떤 도메인에서는 잘 동작하지 않는가, 비용은 어떤 시나리오에서 폭발할 수 있는가, 규제 측면에서 어떤 위험이 있는가. 흔히 PRD의 가장 짧은 섹션이지만, 위기 상황에서 가장 자주 들춰지는 부분입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3809/image5.png"&gt;&lt;figcaption&gt;AI PRD 필수 항목 8가지 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 여덟 가지가 다 들어 있는 PRD라면, “미슐랭 셰프의 레시피”에 가깝습니다. 누가 만들든 비슷한 결과가 나오고, 만든 결과가 "잘 됐는지" 객관적으로 판단할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;4. 가격 전략도 PRD에 적어야 한다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;마지막으로 한 가지 더. AI 프로덕트의 PRD에는 기존 PRD에서는 잘 다루지 않았던 항목이 하나 더 있어야 합니다. 가격 모델입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;“가격은 비즈니스팀이 정하는 거 아닌가요?”라고 물으실 수 있습니다. 기존 SaaS에서는 그랬습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;그런데 AI 프로덕트에서는 가격 모델이 제품 설계와 분리될 수 없습니다. 왜냐하면 여기서는 사용자 한 명이 한 번 쓸 때마다 실제 비용(토큰 비용)이 발생하기 때문입니다.&lt;/strong&gt; 기존 SaaS처럼 “한 명당 월 9,900원”으로 받았다가, 그 사용자가 PDF를 계속 붙여 넣고 요약을 시키면 한 달 만에 9,900원의 열 배가 넘는 비용이 나갑니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;최근 AI 프로덕트의 가격 모델은 크게 세 방향으로 진화하고 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;첫째, 사용량 기반&lt;span style="color:#999999;"&gt;(Usage-based)&lt;/span&gt;. 토큰이나 API 호출 단위로 과금. OpenAI의 토큰 과금이 대표적입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;둘째, 성과 기반&lt;span style="color:#999999;"&gt;(Outcome-based)&lt;/span&gt;. “해결된 케이스 1건당” 같은 비즈니스 성과로 과금. Zendesk나 Intercom의 AI 고객 지원이 이 방식입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;셋째, 하이브리드&lt;span style="color:#999999;"&gt;(Hybrid)&lt;/span&gt;. 기본료 + 사용량 추가. 실제로 가장 많이 채택되는 방식입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;PM이 PRD를 쓸 때 이 가격 모델을 어떻게 잡을지가 제품 설계에 직접 영향을 줍니다. 만약 성과 기반으로 간다면, PRD의 성공 지표도 성과 중심으로 설계되어야 합니다. “해결된 케이스” 단위로 과금하기로 했다면, 무엇이 “해결”인지를 Eval Plan에서 먼저 정의해야 하니까요. 가격 모델과 성공 지표가 따로 노는 AI 프로덕트는, 팀이 무엇을 최적화해야 할지 모르는 상태로 출발하는 셈입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제 시장에서도 이 정합성의 차이가 명백히 드러나고 있습니다. 세일즈포스는 Agentforce를 통해 고객사의 작업 시간을 큰 폭으로 줄이는 가치를 만들어내고, 그것을 Flex Credits라는 사용량 기반 과금으로 명확히 연결했습니다. 가치 창출과 가격 모델이 한 방향으로 정렬되니까 시장이 신뢰하기 쉽습니다. 반면 어도비는 같은 시기 Firefly로 AI 기능을 출시했지만 그 AI 투자가 어떻게 수익으로 이어질지를 시장에 명확히 설명하지 못했고, 주가는 큰 폭으로 떨어졌습니다. 같은 AI 기능을 출시해도, PRD 단계에서 가격 모델과 가치 정의를 함께 짠 회사와 그렇지 않은 회사의 결과는 다릅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;알아가야 할 핵심은 하나입니다. &lt;strong&gt;AI PRD에서는 기능 정의, Eval Plan, 성공 지표, 가격 모델이 모두 하나의 시스템처럼 정합성을 가져야 합니다.&lt;/strong&gt; 어느 하나만 성격이 달라지면 그 PRD는 결국 작동하지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며: PRD는 약속이다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;처음으로 돌아갑니다. 어머니의 “소금 약간”과 셰프의 “천일염 2.3g”의 차이는 단순히 정밀도가 아닙니다. 처음 레시피를 쓰는 시점부터 “누가 어떻게 만들든 같은 결과가 나오게 하겠다”는 약속의 강도가 다른 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI PRD도 마찬가지입니다. 기존 PRD가 “이 기능을 만든다”는 약속이었다면, AI PRD는 “이 기능이 어떻게 행동할지, 잘 동작하는지 어떻게 판단할지, 망가지면 어떻게 알아챌지, 비용이 폭발하지 않게 어떻게 막을지”까지 모두 약속하는 문서입니다. 약속의 범위가 훨씬 넓어진 만큼, 문서도 훨씬 정밀해져야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리고 그 약속의 한가운데에 Eval Plan이 있습니다. “잘 동작한다”는 말을 느낌이 아니라 측정 가능한 기준으로 바꿔주는 장치입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;시리즈의 가장 처음에서 본 에어캐나다 챗봇 사고도, 결국 “무엇을 답하지 말아야 하는가”가 PRD에 정의되어 있지 않았기 때문에 일어났습니다. 그 챗봇의 PRD에 Eval Plan이 있었다면, 출시 전에 “여행 후 사별 할인 신청” 같은 케이스가 테스트되었을 것이고, 그 답이 회사 정책과 다르다는 점 역시발견되었을 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;AI 시대의 PM은 “기능을 정의하는 사람”이 아니라 “기능의 행동 범위와 판단 기준을 함께 정의하는 사람”&lt;/strong&gt;입니다. 그리고 그 정의가 한 장의 PRD에 담길 때, 비로소 AI 기능은 “운에 맡기는 기술”이 아니라 “관리 가능한 시스템”이 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>당신이 매달 내는 20달러는 진짜 AI의 몸값이 아니다</title><link>https://yozm.wishket.com/magazine/detail/3808</link><description>매달 결제되는 20달러의 AI 구독 알림은 이제 꽤 익숙해졌습니다. ChatGPT, Claude, GitHub Copilot 등을 구독하며, 우리는 넷플릭스를 쓰듯 가벼운 마음으로 사실상 한도 없는 초지능을 누려왔습니다. 그러나 냉정하게 질문을 던져봐야 합니다. 그 20달러가 정말로 AI의 진짜 몸값일까요? 우리가 누려온 AI 구독 가격 정책은 오픈AI, 구글, 앤트로픽을 비롯해 글로벌 AI 기업들이 시장 선점을 위해 천문학적인 적자를 감당하며 뿌린 일종의 보조금에 가깝습니다. 월 20달러의 구독 방식이 점차 토큰 기반의 종량제 방식으로 변하는 시점에서, 기업은 실제 비용에 기반한 냉혹한 현실과 직접 마주하게 될 것입니다. </description><guid>https://yozm.wishket.com/magazine/detail/3808</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;AI 종량제 시대, 살아남는 프로덕트의 조건&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;매달 결제되는 20달러의 AI 구독 알림은 이제 꽤 익숙해졌습니다. ChatGPT, Claude, GitHub Copilot 등을 구독하며, 우리는 넷플릭스를 쓰듯 가벼운 마음으로 사실상 한도 없는 초지능을 누려왔습니다. 그러나 냉정하게 질문을 던져봐야 합니다. 그 20달러가 정말로 AI의 진짜 몸값일까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;우리가 누려온 AI 구독 가격 정책은 오픈AI, 구글, 앤트로픽을 비롯해 글로벌 AI 기업들이 시장 선점을 위해 천문학적인 적자를 감당하며 뿌린 일종의 보조금에 가깝습니다. 비즈니스 플랫폼의 역사에서 이러한 전략은 익숙한 흐름입니다. 우버가 택시보다 저렴한 요금으로 탑승객을 모으고, 배달 플랫폼들이 무료 배달을 앞세워 시장을 장악한 뒤, 가격을 인상했던 역사가 AI 기업에서도 반복되는 것이죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;기존 소프트웨어(SaaS)는 가입자가 늘어나도, 서비스 복제에 드는 한계 비용이 제로에 수렴했습니다. 반면, AI 모델은 질문을 던지고 에이전트가 구동되는 모든 순간마다, GPU 연산 자원과 물리적 전력이 실시간으로 소모됩니다. 사용량에 비례해 비용이 정비례하는 마치 전력 인프라와 같은 원가 구조를 가집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3808/1_%EC%A0%84%ED%86%B5_SaaS_vs_Generative_AI_%EC%9B%90%EA%B0%80_%EA%B5%AC%EC%A1%B0.png"&gt;&lt;figcaption&gt;&amp;lt;출처: GPT Image 2, 작가 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;따라서 프로덕트 메이커와 의사결정권자가 선제적으로 확보해야 할 핵심 역량은 앞으로 다가올 가격 구조 개편과 종량제 과금 체계로의 전환에 탄력적으로 대응할 수 있는 원가 통제력입니다. 아무리 기능적으로 뛰어난 제품을 설계하더라도, 이를 상용화 단계에서 안정적으로 지탱해 줄 재무적 타당성을 확보하지 못한다면 비즈니스의 영속성을 담보하기 어렵기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;월 20달러의 구독 방식이 점차 토큰 기반의 종량제 방식으로 변하는 시점에서, 기업은 실제 비용에 기반한 냉혹한 현실과 직접 마주하게 될 것입니다. 이제는 정액제가 주는 착시에서 벗어나, 실질 원가 구조를 파악하고 지속 가능한 원가 관리 체계를 설계해야 할 때입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;미리 요점만 콕 집어보면?&lt;/strong&gt;&lt;/h4&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;li&gt;그동안 익숙했던 정액 구독제($20) 방식이 서서히 저물고, 호출당 비용을 지불하는 무거운 '토큰 종량제' 시대가 빠르게 다가오고 있습니다.&lt;/li&gt;&lt;li&gt;자율형 에이전트 도입과 실리콘밸리 테크 기업들의 새로운 토큰 소비 패러다임은 프로덕트 조직에 전혀 예상치 못한 거대한 재무적 충격을 가져다줄 수 있습니다.&lt;/li&gt;&lt;li&gt;청구서 숫자가 실제로 바뀌기 전, 실시간 관측성 확보, 비용 스트레스 테스트, 공급처 다변화(Vendor Optionality)를 통해 지속 가능한 디지털 원가 방정식을 선제적으로 설계해야만 합니다.&lt;/li&gt;&lt;/ul&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;'SaaS'의 가면을 쓴 '전력 인프라': AI 무제한 구독의 구조적 난제&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;지난 수십 년간 글로벌 테크 시장을 지배해 온 소프트웨어 서비스(SaaS) 모델의 핵심 경쟁력은 한계 비용의 혁신에 있었습니다. 슬랙(Slack), 세일즈포스(Salesforce), 피그마(Figma) 같은 기존 소프트웨어는 가입자 수가 1만 명에서 100만 명으로 늘어나더라도 서비스 복제와 추가 제공에 따르는 한계 비용이 제로에 수렴하는 이른바 서비스의 무한 복제가 가능했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;따라서 SaaS 기업들은 일단 초기 개발 단계에서 대규모 고정비를 지출하고 나면, 가입자가 늘어날수록 마진율이 기하급수적으로 개선되는 '규모의 경제'를 누릴 수 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러나 생성형 AI의 원가 구조는 이와 정반대의 물리적 법칙을 따릅니다. AI 추론은 단순히 이미 만들어진 코드를 서버에서 복사해 사용자 화면에 뿌려주는 작업이 아닙니다. 사용자가 질문을 던지거나 에이전트가 작동할 때마다, 초당 수억 ~ 수조 번의 연산이 데이터센터의 GPU에서 실시간으로 일어나야 합니다. 이는 필연적으로 막대한 물리적 연산 자원과 전력 소모를 수반합니다. 즉, AI 서비스의 원가는 사용량에 정확히 비례하여 선형적으로 증가하는 변동비 구조를 가집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;최근 오픈AI의 제품 부사장이자 ChatGPT 총괄인 닉 털리(Nick Turley)가 무제한 요금제 방식의 장기적 유지 가능성에 의문을 제기하며 남긴 비유는 이러한 본질을 가장 명확하게 짚고 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;"현재의 인프라 기술 수준에서 무제한 구독 플랜을 유지하는 것은 사실상 '무제한 전기 요금제'를 내놓는 것과 같습니다. 이는 구조적으로 앞뒤가 맞지 않는 방식입니다."&lt;/i&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3808/2_Nick_Turley_%EB%AC%B4%EC%A0%9C%ED%95%9C_%EC%9A%94%EA%B8%88%EC%A0%9C%EC%9D%98_%EC%A2%85%EB%A7%90.png"&gt;&lt;figcaption&gt;&amp;lt;출처: (발언) OpenAI is rethinking ChatGPT pricing — and 'unlimited' plans may not last, its boss says, Business Insider // (이미지) GPT Image 2, 작가 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그의 지적처럼 우리가 사용하는 물이나 전기 같은 인프라를 무제한 정액제로 쓸 수 없듯이, 매 호출마다 전력과 반도체 감가상각이 발생하는 AI 인프라 역시 영원한 무제한 정액 모델을 유지하기란 구조적으로 지극히 어렵습니다. 그렇다면 지금까지 기업들이 월 20달러라는 파격적인 정액 요금제로 고성능 AI를 무제한에 가깝게 쓸 수 있었던 비결은 무엇일까요? 답은 글로벌 AI 기업들이 시장 점유율을 선점하기 위해 감당해 온 천문학적인 적자 구조에 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제 비즈니스 현장에서 헤비 유저 한 명이 클로드 프로(Claude Pro, 월 $20) 환경에서 매일 수십 페이지의 문서를 업로드하고 복잡한 데이터 분석과 코딩 작업을 지시할 때, 뒤에서 소모되는 실제 토큰 사용량을 API 단가로 환산하면 월 $200(한화 약 30만 원)에서 많게는 $400(한화 약 60만 원)를 훌쩍 상회합니다. 사용자가 쓰면 쓸수록 공급업체가 적자를 보는 역마진 구조죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이러한 가격 구조의 불균형은 주요 외신 보도를 통해서도 여러 차례 증명됐습니다. 월스트리트저널(WSJ)의 보도에 따르면, 마이크로소프트가 월 $10 수준의 정액 요금제로 제공하던 깃허브 코파일럿(GitHub Copilot) 서비스는 유저 한 명당 매달 평균 $20의 적자를 기록했습니다(출처: Big Tech Struggles to Turn AI Hype Into Profits, The Wall Street Journal).&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;특히 코드를 밤낮으로 생성하는 하드 유저들의 경우, 마이크로소프트가 한 사람당 월 최대 $80에 달하는 실제 연산 손실을 감당해야 했습니다. 업계 분석에 따르면, 앤트로픽 역시 초기 인프라 운영 당시 구독 매출 1달러를 올리기 위해 최대 8달러에 상응하는 인프라 연산 비용을 지출하는 기형적인 비용 구조를 버텨낸 것으로 알려져 있고요(Cursor Goes To War For AI Coding Dominance, The Forbes).&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3808/2-1_%EA%B8%80%EB%A1%9C%EB%B2%8C_AI_%EA%B8%B0%EC%97%85%EC%9D%98_unit_economy.png"&gt;&lt;figcaption&gt;&amp;lt;출처: GPT Image 2, 작가 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이러한 계획된 적자 전략은 시장 형성 초기에는 유효할지 몰라도, 영원히 지속될 수는 없습니다. 글로벌 AI 기업들이 점차 시장 독점력을 확보하고 상장을 준비하면서, 투자자들로부터 단위 경제학(Unit Economics)의 타당성을 입증하라는 강력한 압박을 받기 시작했기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;월 20달러의 구독 방식에 추가 사용량(토큰)을 구매하는 종량제 방식의 도입은 프로덕트 메이커와 예산 집행권자들이 그동안 외면해 왔던 엄청난 AI 비용과 정면으로 마주하게 될 텐데요. 이제 우리가 주목해야 할 것은 단순한 AI 기술의 신기함이 아닌, 실제 우리 프로덕트 뒤에서 흐르는 토큰 원가의 현실입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;에이전트 전환과 AI 요금제의 대변화&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;우리가 '20달러 요금제'의 변화를 글로벌 기업들의 수익 극대화로만 해석한다면, 가장 중요한 기술적 본질을 놓치게 됩니다. 과금 체계 개편을 부추기는 근본적인 동력은 사용자의 이용 패턴 변화, 구체적으로는 '단순 챗봇'에서 '자율형 에이전트'로의 전환에 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;과거의 생성형 AI 인터페이스는 사용자가 질문을 던지면 AI가 단 한 번의 연산을 거쳐 답변을 내놓는 1회성 호출 구조였습니다. 이 수준에서는 개별 유저의 사용량을 예측하고 인프라 비용을 통제하는 것이 비교적 용이했습니다. 그러나 2025년을 기점으로 본격적으로 상용화되기 시작한 에이전틱 AI는 작동 메커니즘 자체가 완전히 다릅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;사용자가 "경쟁사들의 최근 분기 실적 보고서를 웹에서 모두 수집해 분석 테이블을 만들고 오류를 검증해 줘"라는 단 한 줄의 명령을 입력하면, 에이전트는 백그라운드에서 스스로 계획을 수립하고, 다수의 웹페이지를 탐색하며, 코드를 실행하고, 실행 결과를 자체적으로 검증하는 복잡한 연쇄 추론을 진행합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3808/3_%EA%B3%BC%EA%B1%B0_%EC%83%9D%EC%84%B1%ED%98%95_AI_%EC%9D%B8%ED%84%B0%ED%8E%98%EC%9D%B4%EC%8A%A4_vs_%EC%97%90%EC%9D%B4%EC%A0%84%ED%8B%B1_AI.png"&gt;&lt;figcaption&gt;&amp;lt;출처: GPT Image 2, 작가 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 과정에서 AI 내부적으로는 수십 번에서 수백 번에 이르는 API 상호 호출과 재시도 연산이 실시간으로 일어납니다. 즉, 사용자는 단 한 줄의 프롬프트를 입력했을 뿐이지만, 이를 연산하는 GPU 데이터센터에서는 수백 배에 달하는 입출력 토큰 연산이 단 몇 분 만에 이루어지는 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기서 핵심은 에이전트가 최종 목표를 달성하기까지 내부적으로 수행한 자율 추론 루프의 횟수입니다. 에이전트 워크로드의 확대는 인프라 공급 기업에 고정 요금제로는 도저히 감당할 수 없는 한계 비용 폭증의 임계점을 제공했습니다. 빅테크 기업들이 서둘러 기존의 정액 구독제를 무너뜨리고, 사용량 중심의 요금 장벽을 구축하기 시작한 이유가 여기에 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;2026년, 글로벌 AI 시장을 선도하는 빅테크 기업들은 이러한 비용 구조적 한계를 극복하기 위해 기존 요금제를 전면적으로 개편하기 시작했습니다. 단순한 단가 조정을 넘어, 고정 비용 형태의 정액형 제품 포트폴리오를 축소하고 사용량과 가치 중심의 하이브리드 종량제 구조를 정비하는 모양새입니다. 주요 4대 AI 기업의 요금제 개편 흐름은 다음과 같은데요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3808/3-1_4%EB%8C%80_AI_%EA%B8%B0%EC%97%85_%EA%B0%80%EA%B2%A9_%EC%A0%95%EC%B1%85_%EB%B3%80%ED%99%94.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 각 사 홈페이지, GPT Image 2, 작가 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;위 표를 통해 업계의 표준으로 여겨졌던 '인당 월 20달러' 요금제는 이제 더 이상 생존할 수 없는 비즈니스 모델로 분류되고 있다는 점입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;특히 가장 저렴한 AI 개발 도구인 깃허브 코파일럿이 2026년 6월 1일을 기점으로 기존 무제한 구조를 폐기하고, '기본 크레딧 초과 시 종량 과금' 형태로 전환하는 것은 경쟁사의 가격 정책 변화를 비롯해 시장 전체에 파급력을 미쳤습니다. 이는 이제까지 개인과 기업들이 간접적으로 누려왔던 빅테크의 출혈 경쟁이 실질적인 마감 단계에 접어들었음을 뜻하죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이제 기업과 프로덕트 메이커들이 바로 준비해야 할 건 이미 시작된 AI 도구의 종량제 가격 압박이 우리 프로덕트, 비즈니스의 영업이익률에 영향을 주기 전에, 공급망의 구체적인 토큰 소모 단위와 실질 원가 구조를 분석하고, 이를 통제할 수 있는 재무적·아키텍처적 대비책을 확보하는 일입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;토큰 이코노미와 우리가 알아야 할 것&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;최근 AI 생태계의 중심인 실리콘밸리 기업들 사이에서는 AI 서비스 도입 비용을 바라보는 관점이 근본적으로 변화하고 있습니다. 과거에는 슬랙과 같은 B2B SaaS 솔루션처럼 토큰 소모량을 '최대한 통제하고 줄여야 하는 운영 비용으로 취급했다면, 이제는 이를 개발, 기획 등 지식 노동의 레버리지를 극대화하기 위한 핵심 원자재로 재정의하는 흐름이 나타나고 있습니다. 업계 일각에서는 이를 토큰 사용량의 극대화가 곧 기업의 생산성이라는 관점으로 해석하기도 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이러한 패러다임의 전환을 가장 극명하게 보여주는 인물이 엔비디아의 젠슨 황 CEO입니다. 그는 2026년 3월 GTC 기간 중 진행된 미디어 및 분석가 세션에서 지식 노동의 비용 효율성에 대해 다음과 같은 이색적인 관점을 제시했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;"연봉 50만 달러를 지불하는 우수한 소프트웨어 엔지니어가 그에 걸맞은 수준의 토큰을 업무에 소비하지 않는다면, 이는 기업 생산성 측면에서 매우 우려할 만한 일입니다. 과거에 제도판을 놔두고 연필과 종이로만 반도체 칩을 설계하던 시대로 돌아가는 것과 다름없기 때문입니다."&lt;/i&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3808/4_%EC%A0%A0%EC%8A%A8_%ED%99%A9_%ED%86%A0%ED%81%B0_%EC%9D%B4%EC%BD%94%EB%85%B8%EB%AF%B8.png"&gt;&lt;figcaption&gt;&amp;lt;출처: GPT Image 2, 작가 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 발언은 인적 자원의 고정비 대비 AI 연산 자원의 변동비를 적극적으로 매칭시켰을 때 얻을 수 있는 한계 생산성이 훨씬 크다는 점을 보여줍니다. 즉, 엔지니어가 수십만 달러어치의 토큰을 소모하더라도, 그 결과물로 수백만 달러 가치의 제품 개발 주기를 단축할 수 있다면, 토큰 소모는 낭비가 아닌 고효율 투자라는 논리인데요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 이러한 철학을 엔터프라이즈 비즈니스 전반에 공격적으로 이식하는 거대 기업도 등장했습니다. 세일즈포스의 마크 베니오프 CEO는 2026년 5월, All-In 팟캐스트에 출연하여 자사의 개발 인프라와 에이전트 구동을 위한 대담한 재무적 지출 계획을 밝혔습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;"올해 세일즈포스는 코딩 자동화 및 고객 대응 에이전트 시스템을 안정적으로 가동하기 위해 앤트로픽(Anthropic) 모델의 토큰 구매에만 약 3억 달러(한화 약 4,540억)를 지출할 계획입니다."&lt;/i&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;젠슨 황과 마크 베니오프의 발언은 디지털 서비스 공급망의 가장 밑단에 위치한 '연산 토큰'을 마치 제조 기업의 원자재 공급 계약처럼 토큰을 대량 구매하고 가치 창출의 도구로 활용하겠다는 의지의 표명입니다. 이제 글로벌 테크 기업들은 토큰을 소모하는 규모 자체가 곧 해당 조직의 기술적 성숙도와 디지털 생산성을 대변하는 지표가 될 수 있음을 공식 인정하고 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이번에는 토큰 이코노미와 두 CEO의 이야기를 ROI(Return on Investment)의 관점으로 더 파고들어 보겠습니다. AI가 만드는 가치(Return)는 막대하지만, 비용(Investment)은 괜찮을까요? 시뮬레이션을 해보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;50명 규모의 마케팅·고객 지원 조직이 정액 요금제로 지불하던 인프라 비용은 월 $1,000($20 * 50) 수준입니다. 하지만 이들이 수집된 고객 데이터와 시장 정보를 바탕으로 매일 수십 차례 자동으로 검색, 요약, 초안 작성, 자가 검증을 수행하는 자율형 에이전트 파이프라인을 구축했다고 가정해 보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;에이전트가 완수해야 할 과업당 평균 10회의 자율 추론 루프가 발생하고, 일일 처리 건수가 누적되면 조직 전체가 하루에 소모하는 토큰의 양은 수억 개에 달하게 됩니다. 이를 현재의 엔터프라이즈 API 단가로 환산하면, 실제 청구될 금액은 최소 $1,000의 수십 배에 달하는 월 $15,000에서 최대 $40,000에 육박하게 됩니다. 고정 비용 중심의 예산 계획 시스템 아래에서는 도저히 관리할 수 없는 재무적 충격이 발생하죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3808/4-1_50%EC%9D%B8_%EC%A1%B0%EC%A7%81_%EA%B8%B0%EC%A4%80_AI_%EB%B9%84%EC%9A%A9_%EC%8B%9C%EB%AE%AC%EB%A0%88%EC%9D%B4%EC%85%98.png"&gt;&lt;figcaption&gt;&amp;lt;출처: GPT Image 2, 작가 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이것이 바로 프로덕트 매니저(PM)와 기업이 단순 기능 구현을 넘어, 제품의 '단위 경제학(Unit Economics)' 관점에서 AI 원가를 바라보고 정교하게 설계해야 하는 이유입니다. 제품의 최종 마진을 보장하는 단위 경제학 방정식은 다음과 같이 정의할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기서 기업이 사용자 또는 자사 고객으로부터 얻는 사용자당 고정 매출(구독료 등)과 에이전트가 구동되는 동안 소모하는 입력 및 출력 토큰의 총량과 각 벤더사 API 단가의 곱의 총합을 감산해 이익을 산출합니다. 만약 프로덕트 메이커가 프롬프트의 길이를 최적화하지 못하거나, 불필요하게 무거운 모델을 라우팅 구조 없이 호출하여 무한 추론 루프를 방치한다면, 고정 매출을 가볍게 넘어서며 파는 만큼 손해를 보는 역마진 구조에 직면하게 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결국 토큰 소비를 통한 생산성 향상이라는 편익을 온전히 얻기 위해서는, 먼저 제품 뒤에서 발생하는 토큰 원가를 실시간으로 들여다보고, 정교하게 제어할 수 있는 시스템을 갖추어야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며: 프로덕트와 함께 지속 가능한 원가 구조를 설계할 때&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3808/5_%EA%B2%B0%EB%A1%A0.png"&gt;&lt;figcaption&gt;&amp;lt;출처: GPT Image 2, 작가 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;월 20달러라는 파격적인 정액 요금제로 누려온 AI 가격 정책의 과도기는 이제 종착역을 향해 가고 있습니다. 쓰면 쓸수록 연산 비용이 발생하는 전력 인프라형 구조의 특성과 OpenAI, 앤트로픽의 상장 압박은 종량제 기반의 가격 현실화를 필연적으로 유도하고 있습니다. 지금까지 수많은 프로덕트 조직은 생성형 AI의 화려한 기능과 가능성에만 집중해 왔습니다. 그러나 앞으로는 비즈니스의 영속성을 확보하기 위해, 우리는 이제 방향을 바꾸어야 합니다. &lt;strong&gt;"AI 주도의 개발 혹은 AI 기반의 기능에 지속 가능한 원가 구조를 설계되었는가?"&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 비즈니스의 진짜 경쟁력은 성능과 함께 비즈니스를 지속 가능하게 만드는 원가 통제력에 있습니다. 아무리 뛰어난 사용자 경험을 설계하더라도, 매출보다 비용이 커지는 순간 그 제품은 시장에서 살아남을 수 없습니다. 이제 기업들과 프로덕트 메이커들은 청구서의 토큰 비용이 현실화되기 전 생각해야 할 것은 세 가지로 요약됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;첫째, 우리는 프로덕트가 소비하는 토큰의 실시간 흐름을 파악하고 있는가?&lt;/strong&gt; 사후 청구서에 의존하는 현재 방식은 에이전트 도입 시 발생하는 재무적 충격을 예방할 수 없습니다. 프롬프트와 API 호출 단위별로 소비량을 예측할 수 있는 시스템이 반드시 필요합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;둘째, 글로벌 빅테크의 출혈 경쟁이 끝나고 가격 현실화 장벽에 도달했을 때를 가정한 재무적 스트레스 테스트를 거쳤는가?&lt;/strong&gt; 일반 IT 고정비와 혼재된 예산 구조를 명확히 분리하고, 변동성 예산을 별도로 관리하는 시스템이 필요합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;셋째, 가격 변동이나 벤더사의 정책 변화에 유연하게 대처할 수 있는 아키텍처적 대비책을 가지고 있는가?&lt;/strong&gt; 특정 독점 모델의 API와 프롬프트에 완벽히 종속되는 리스크를 줄이기 위해, 경량형 모델(sLLM)이나 오픈소스를 상황에 맞게 스위칭하는 기술적 유연성을 확보해야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞으로는 단순한 기술 구현을 넘어, 지속 가능한 디지털 원가 구조를 선제적으로 설계하는 기업만이 다가올 토큰 이코노미 시대를 새로운 성장 동력으로 바꿔낼 수 있을 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>GEO를 둘러싼 3가지 오해와 팩트체크</title><link>https://yozm.wishket.com/magazine/detail/3806</link><description>'GEO'라는 단어 앞에서 당혹감을 감추기 어려웠다면, 혼자만의 고민이 아닙니다. 요즘IT 'GEO 팩트체크' 세미나 패널토크에서 라이너·빌더블·서치나인 세 사람이 GEO에 관해 많은 사람들이 가지고 있는 세 가지 오해를 풀었습니다. GEO는 SEO와 완전히 다른가, 인용 횟수가 늘면 잘하는 건가, 예산부터 필요한가. 인용보다 추천, 횟수보다 전환 지표, 예산보다 우선순위로 답을 좁혀가며 실무자가 당장 손댈 체크리스트까지 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3806</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p&gt;&lt;strong&gt;공다솜 라이너 콘텐츠 담당(진행) · 이소연 빌더블 대표 · 양용준 서치나인 대표 | 요즘IT 'GEO 팩트체크' 세미나 패널토크&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;이 글은 2026년 5월 21일 열린 요즘IT 'GEO 팩트체크' 세미나의 패널토크를 1인칭 시점으로 정리한 글입니다. 공다솜 라이너 콘텐츠 담당의 진행으로, 이소연 빌더블 대표와 양용준 서치나인 대표가 사전 질문에서 추린 세 가지 오해(GEO는 SEO와 완전히 다르다, AI 인용 횟수가 늘면 잘하는 것이다, GEO는 예산부터 필요하다)를 차례로 풀어낸 대담을, 흐름에 맞춰 정리했습니다.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;hr&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3806/image3.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &amp;nbsp;요즘IT&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 안녕하세요. 저는 라이너에서 콘텐츠를 맡고 있는 공다솜이라고 합니다. 반갑습니다. 사실 오늘 이 자리를 준비하게 된 데에는 제 개인적인 어려움도 있었어요. 저도 SEO를 계속 해 왔는데, 명색이 검색 엔진 회사에 다니면서도 'GEO'라는 단어를 들었을 때 당혹감을 감출 수가 없었거든요. 그래서 오늘 초대한 두 연사분들께도 열심히 메시지를 보내면서 "이건 해도 돼? 저건 하면 안 돼?" 하고 계속 물어봤습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;사실 앞서 발표해 주신 라이너 엔지니어분께 제가 질문을 많이 했었는데요. 친절하게 답해 주시면서도 "이걸 왜 해요?"라고 오히려 반문하실 때도 있더라고요. 기술적으로 보면 쉽게 답이 나오는 것들인데, 현업에서는 복잡하게 바라보는 것들이 있었던 것이죠. 제가 FOMO 때문에 어렵게 생각하거나 헤매고 있었던 게 아닌가 하는 깨달음 덕분에 저도 이 세션을 즐겁게 준비하게 됐습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;오늘 세션을 준비하기 전에 사전 질문을 정말 많이 받았습니다. 다들 정성껏 보내주셨는데, 질문들을 모아보니 크게 &lt;strong&gt;세 가지 오해&lt;/strong&gt;가 보였습니다. 첫 번째는 "GEO는 SEO와 진짜 달라서, 뭔가 완전히 새로운 걸 해야 한다"는 것이고요. 두 번째는 "AI 인용 횟수가 늘어나면 우리 회사가 잘하고 있는 것"이라는 생각입니다. 여기엔 "AI 인용 횟수를 늘려 드릴게요, 그러니 우리 솔루션을 쓰세요" 하는 광고에 솔깃해지는 경우도 포함되죠. 솔직히 저도 그런 데에 제 정보를 내준 적이 있어요. 세 번째는 "GEO를 하려면 일단 든든한 예산부터 채워야 한다"는 생각입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;질문을 조금 더 깊이 들여다보면, 각 질문이 실제로 담고 있는 고민은 이런 것 같아요. 첫 번째는 SEO와 GEO, AIO 같은 개념에 약간의 혼동이 섞여&amp;nbsp; 있었던 것 같습니다. 두 번째는 "막상 GEO를 해 보려니 어떻게 해야 하지? 대표님께, 또 팀원들께 무엇을 한다고 설명해야 하지?"라는 실행 단계의 고민이 담겨 있었죠. 세 번째는 “실질적인 전략을 세우지 못하겠는데 예산이라도 확보해야 하나” 하는 고민에서 이어진 오해 같습니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이제 각 오해를 살펴볼 텐데요, 여러 분께서 실제로 보내주신 관련 질문을 각 주제에 따라 나눠서 세부적으로도 짚어보겠습니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3806/%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2026-06-16_104251.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &amp;nbsp;공다솜 라이너 콘텐츠 리드&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;오해 1. GEO는 SEO와 완전히 다른 것일까&lt;/strong&gt;&lt;/h3&gt;&lt;h4&gt;&lt;strong&gt;'인용' VS '추천' 우리 산업에 맞는 GEO 무게중심 찾기&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; “SEO와 GEO는 확연히 다르다”라는 첫 번째 오해부터 살펴볼게요. 앞서 강연도 진행되었으니 이제 SEO나 GEO, AEO라는 개념을 모르시는 분은 없으실 것 같아요. 얼마 전 구글도 공식 입장을 발표했죠. AI 검색은 SEO의 한 갈래이고, SEO를 잘하던 사람은 GEO나 AEO에서도 분명 두각을 나타낼 거라는 내용이었습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;관련한 질문으로는 이런 게 있었어요. "SEO 성과가 좋은 콘텐츠는 AI 인용에서도 유리한가요?" 앞서 두 연사분들의 강연에서 이미 ‘유리하다’고 말씀해 주셨는데요. 막상 인용이 잘됐다고 해서 우리 브랜드 가시성이 전부 올라가는 건 아닌 것 같더라고요. 저도 한때 AI 모델이 저희 콘텐츠를 엄청 긁어 가서 신났는데, 정작 검색 성과를 보여주는 서치 콘솔 데이터를 열어보면 생각만큼 효과가 크지 않았어요. 이게 SEO 성과가 좋은 콘텐츠라서 AI가 잘 인용한 건지, 아니면 우리가 따로 손볼 부분이 있는 건지, 두 분께 힌트를 얻고 싶습니다. 소연님이 먼저 말씀해 주시면 좋겠어요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연(빌더블 대표)&lt;/strong&gt; 네. SEO 성과가 좋은 콘텐츠가 AI 인용에도 유리한 건 맞습니다. 다만 정말 중요하게 봐야 할 건, 제가 발표에서 말씀드렸듯이 '인용'보다 '추천'이에요. 그래서 어떤 프롬프트를 입력하느냐에 따라 답변에 우리 제품이나 브랜드가 나오기도 하고 경쟁사가 나오기도 하는데, 우선 우리 제품이나 브랜드가 등장하는 프롬프트가 있긴 한지부터 확인해야 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;거기서 인용이 되고 추천까지 되면 더할 나위 없이 좋죠. 그런데 가끔 인용은 됐는데 우리 브랜드명을 언급하지 않는 경우가 있어요. 저는 그런 경우도 또 하나의 기회라고 봅니다. 빈 자리가 보인다는 뜻이니까요. 그래서 체크해 보셔야 할 부분을 두 가지로 요약하고 싶어요. 첫째, 단순히 인용되는 데 그치지 않고 제품을 명확하게 추천하거나 브랜드명을 분명히 언급하는가. 둘째, 그 프롬프트에서 우리 제품이 언급되더라도 구체적으로 '어떻게' 언급되는가. 이 두 가지를 함께 보시는 게 좋습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;양용준&lt;/strong&gt; 지금 제가 쓰고 있는 툴인 체인시프트를 기준으로 보면, 산업에 따라 AI가 인용하기 좋아하는 채널의 형태가 다르다고 판단했습니다. 예를 들어 동네 가게처럼 로컬 기반의 오프라인 비즈니스라면, 홈페이지 인용이 아무리 많아도 정작 추천에 결정적인 영향을 주는 건 지도에 노출되는 ‘구글 비즈니스 프로필’이었습니다. 반대로 이커머스 쪽에서는 실제로 제품이 추천되거나 GPT가 인용되는 것을 보면 ‘머천트 센터(google merchant center)’에 세팅한 쇼핑 카테고리 피드에서 정보를 많이 가져왔습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;또한, 저는 비즈니스 프로필이나 홈페이지 같은 것도 중요하지만, 상대적으로 사용자가 로그인을 해서 리뷰를 남기는, 그런 비정형화된 후기 데이터를 더 많이 인용해 간다고 판단하고 있습니다. 그러니 먼저 우리 산업군이 어떻게 구성돼 있는지를 보고, 홈페이지, 비즈니스프로필, 머천트센터 같은 자산은 구축하되, 그밖의 어떤 채널이 더 많이 인용되는지를 확인한 다음, 무게중심을 그쪽으로 옮겨가야 한다고 봅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 그러니까 GEO에서는 SEO 때보다 훨씬 많은 채널과 관계를 맺으며 인용되고 추천되는데, 산업 분야에 따라 내가 어떤 채널에서 더 언급돼야 하고 어떤 채널에 콘텐츠를 더 쌓아야 하는지, 그 특수성을 반영해야 한다는 말이군요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;기존 SEO 콘텐츠를 GEO에 맞게 리뉴얼하는 현실적인 순서&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt;그럼 두 번째 질문으로 넘어가 보겠습니다. 이것도 산업마다 다르다는 답이 나올 것 같은데요. "기존 SEO 콘텐츠 자산을 GEO까지 고려해 리뉴얼한다면, 현실적인 접근 순서와 방식이 있을까요?"라는 질문입니다. 좀 더 구체적으로는 "사이트 구조 같은 기술적인 부분부터 먼저 손봐야 하나요, 아니면 콘텐츠만 조금 고쳐도 AI 인용을 끌어낼 수 있는 요소가 있나요?"라는 구체적인 고민이었어요. 이와 관련한 팁을 주실 수 있을까요?&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt; 만약 기존에 SEO를 고려한 콘텐츠가 충분히 쌓여 있고 트래픽도 어느 정도 들어오고 있다면, 저는 기술 구조보다 콘텐츠를 먼저 손보는 게 낫다고 봅니다. 그리고 콘텐츠를 손볼 때는, 용준 대표님도 계속 말씀하셨듯이 클릭이 많이 들어오는 페이지부터 보세요. 구글 검색 성과를 보여주는 서치 콘솔에 들어가면 클릭 수가 높은 순으로 페이지를 쭉 정렬할 수 있거든요. 그런 페이지를 우선 참고할 것 같습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이미 그 콘텐츠는 우리가 어떤 키워드를 염두에 두고 쓴 글일 테니, 그걸 프롬프트 형태로 변형하는 건 그리 어려운 일이 아니에요. 그러니 새로 무언가를 만들기 전에, 이미 SEO로 트래픽을 가져오고 있는 페이지부터 확인해 보시길 권합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;양용준&lt;/strong&gt; 저는 리뉴얼 콘텐츠를 두 갈래로 나눠서 봅니다. 하나는 키워드 의도가 명확하게 반영된, 사람이 직접 작성한 콘텐츠입니다. 목표하는 키워드를 바탕으로 작성하는 글인데, 만약에 기존 글이 제대로 된 목차 없이 두서없이 쓴 거라면, 다시 쓰는 식으로 리뉴얼하는 것이 좋습니다. 그밖에 그런 글이 아니라 템플릿화할 수 있는 콘텐츠, 즉 일일이 손으로 작성할 수 없고 그럴 필요 없는 콘텐츠도 있는데요. 동일 구조의 템플릿으로 인사이트를 만들 수 있는 콘텐츠는 pSEO를 하거나, 이커머스인 경우라면 제품 카테고리를 정형화시키는 방식으로 리뉴얼을 하는 게 좋다고 생각합니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 두 분의 답변을 듣고 궁금해지는 게 있는데요. 기존에 여러 정보가 들어 있던 하나의 콘텐츠를 여러 개로 쪼개서 내면서 더 세밀한 내용을 담는 방식도 의미 있는 리뉴얼이 될까요? 예를 들어 하나의 콘텐츠를 세 가지 주제로 나누고 각각 세 개의 콘텐츠를 발행하는 방식 말입니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;양용준&lt;/strong&gt; 구글 머천트 센터의 쇼핑 카테고리 데이터를 분석하면서 색다르게 느낀 게 있었어요. AI가 그 머천트 센터 데이터를 가져오는 데 그치지 않고 제품의 특징이 담긴 부분을 따로 골라 요약하는 경우가 많더라고요. 그런데 그런 특징에 관한 내용은 머천트 센터 데이터에 있는 내용이 아니었습니다. 그 페이지의 내부 링크를 타고 들어가 세부 내용을 가져오는 것이었죠.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;SEO 콘텐츠에서는 한 주제를 깊게 다루는 기둥 같은 '필러 콘텐츠'와 링크가 연결된 세분화된 콘텐츠를 작성하는 게 좋다고 알려져 있습니다. 그래서 필러 콘텐츠에 들어갈 만한 내용은 각각의 세부적인 콘텐츠로도 만드는 것이 저는 SEO에서도 GEO에서도 좋다고 생각합니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt; 저는 조금 다른 관점입니다. 저에게 SEO나 GEO는, 우리가 필요한 정보를 가급적 한 번에 찾아주는 과정이라고 느껴지거든요. 그래서 가장 좋은 콘텐츠는 그 글 하나로 내 궁금증이 한 번에 풀리는 것이라고 생각합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;앞선 강의에서 나왔던 "석촌호수 맛집 추천해줘"를 떠올려 볼게요. 누군가에게 그 질문을 던졌을 때, 딱 한 곳을 명확히 짚어주는 사람도 좋지만, 어떤 순간에는 "너 누구랑 갈 건데? 그때는 여기가 좋더라. 좀 특별한 걸 먹고 싶으면 이런 메뉴가 괜찮아" 하고 맥락까지 풀어주는 사람이 더 반가울 때가 있잖아요. 좋은 콘텐츠도 그렇다고 봐요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그래서 하나의 콘텐츠로 충분히 설명할 수 있는데도, GEO 때문에 단지 양을 늘리려고 얇은 글을 여러 개 만들어 내부 링크로 엮는 방식은, AI가 알아서 다 읽어갈 수는 있겠지만 궁극적으로 좋은 콘텐츠라고 보지 않습니다. 기술이 사람의 의도와 심리를 따라 발전한다고 가정하면, 결국 한 번에 좋은 답을 주는 콘텐츠가 더 좋은 콘텐츠로 남지 않을까요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 두 분의 말씀에 모두 일리가 있는 것 같습니다.결국 콘텐츠는 소비자의 의도를 명확하게 담아야 한다는 것, 그리고 AI가 그걸 판단하는 기준도 사람과 크게 다르지 않다는 교훈을 다시 새기게 됩니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3806/image2.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &amp;nbsp;공다솜 라이너 콘텐츠 리드&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;오해 2. AI 인용 횟수가 늘면 잘하고 있는 것일까&lt;/strong&gt;&lt;/h3&gt;&lt;h4&gt;&lt;strong&gt;내부에서 GEO 가시성을 측정하는 법&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 두 번째, “AI 인용 횟수가 늘면 GEO를 잘하고 있는 것”이라는 오해입니다. 업계를 보면 AI 인용 횟수를 자랑하거나 그 횟수를 강조해 FOMO를 일으키는 경우가 있는 것 같아요. 아까 양용준 대표님이 GEO를 보는 여러 지표와 성과 분석 방법에 대해 강연하시면서, 결국 본질은 인용 횟수 그 자체가 아니라 추천이나 우리 비즈니스로 연결되는 지표가 무엇인지를 조직 내에서 먼저 정의하고, 그걸 들여다볼 방법을 찾는 데서 시작해야 한다고 말씀해주셨는데요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그럼에도 우리는 가시성 측정을 해보고 싶잖아요. 그런 면에서 LLM 인용 횟수, 답변 인용률, AI 가시성을 더 잘 측정하는 팁이 있을까요? 혹은 지금 나와 있는 툴조차 온전히 믿기 어려운 상황에서, 내부적으로 객관적인 지표를 세우려면 어떤 활동을 하면 좋을지 팁을 주실 수 있을까요?&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt; 저는 실무자라고 가정하고 답해 볼게요. 실무자가 어떻게든 예산도 더 받고 시간도 확보해서 GEO를 하려면, 결국 "이게 효과가 있었다"는 걸 증명해야 하잖아요. "쓴 비용만큼 도움이 됐다"고 말하려면 근거가 필요한 거죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;문제는 그 근거를 잡기가 까다롭다는 데 있습니다. 메타 광고를 돌리면 광고비 대비 매출, 즉 ROAS가 바로 찍히죠. 그런데 AI는 아쉽게도 그렇게 깔끔하게 나오지 않아요. AI를 보고 처음 들어온 고객이 다음에 다른 경로로 들어와서 결제할 수도 있으니, 그 숫자 하나를 곧 성과라고 단정하긴 어렵거든요. 그래서 저는 두 가지를 봅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;첫 번째는 'AI가 우리 페이지를 얼마나 많이 읽어갔는가'예요. 작업하기 전보다 지금 더 많이 학습해 가는지, 그리고 유저가 검색했을 때 실제로 방문하기 시작했는지를 보는 거죠. 방문자로 찍힌 데이터를 모아서 추이를 보는 방법이 하나 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;두 번째는 우리 페이지를 '전환에 가까운 페이지'와 '정보성 페이지'로 나눠서 보는 겁니다. 전환에 가까운 페이지란 케이스 스터디, 상세 페이지, 제품이나 서비스 소개 페이지 같은 것들이에요. 이런 페이지가 AI에서 얼마나 노출됐는지를 봅니다. 콘텐츠를 소비자 의도와 맥락에 맞춰 이런 페이지부터 손보다 보면, 실제로 그 페이지들이 가장 많이 걸리거든요. 그러면 그 페이지의 유입 횟수를 지표로 삼는 거죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;여기에 제가 간접 지표로 하나 더 보는 게 체류 시간입니다. 사실 저는 SEO를 할 때 체류 시간을 그렇게 중요하게 보는 사람은 아니었어요. 오래 머문다고 꼭 만족했다는 뜻은 아니니까요. 그런데 콘텐츠가 워낙 넘치는 요즘은, 마음에 드는 콘텐츠를 만나면 저도 모르게 그 사이트에 더 오래 머물게 되더라고요. 사람에 빗대면, 한마디 나눠 봤는데 아는 것도 많고 매력적이고 설명도 잘해 주면 '10분만 더 얘기해 볼까' 싶어지는 것과 같아요. 그래서 저는 AI를 통해 들어온 사람들의 체류 시간을 방문자 분석 도구(GA)에서 확인합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이런 것들을 근거로 보고할 때는 이렇게 말할 것 같아요. "지금 AI 트래픽이 전체 대비 몇 퍼센트라 아직은 미약합니다. 하지만 들어온 사람들의 체류 시간을 보면 만족도가 굉장히 높고, AI를 통해 들어오는 페이지가 단순 정보성 페이지가 아니라 전환에 가까운 페이지입니다. 우리가 이런 전환 페이지로 고객을 데려오려고 평소 얼마나 많은 돈을 쓰는지 생각하면, GEO는 아주 효율 좋은 전략입니다.”&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그리고 앞으로 AI를 쓰는 사람은 더 많아질 거예요. 이제 막 시작이니, 사용량이 늘수록 우리가 측정할 표본도 풍부해질 겁니다. 그러니 이 부분은 크게 걱정하지 않으셔도 됩니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;양용준&lt;/strong&gt; 회사에서 SEO를 한다고 하면, 보통 자사 데이터 외에 Ahref나 Semrush 같은 분석 툴을 구매해 쓰는 분이 많습니다. 그런데 저는 그런 분석 툴의 데이터가 우리 자체 데이터와 100% 일치하지는 않는다고 봅니다. 그동안 여러 툴을 써 봤지만 결국 저마다 측정 방식의 제약이 있거든요. 그러니 GEO도, 지금 당장 완벽히 트래킹할 수 있는 툴이 없다면 어떤 툴을 쓰든 그 툴 하나를 기준점으로 잡아서, 같은 경쟁 환경의 브랜드를 함께 세팅하고 동일한 잣대로 비교 측정하는 게 중요하다고 봅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그리고 직접 테스트하면서 깨달은 게 있어요. 프롬프트를 열심히 바꿔가면서 세팅해 놓고 하루에 한 번 가시성을 체크하는데, '이게 잘못된 방식인가?' 싶더라고요. 그래서 최근에는 방법을 바꿨습니다. 처음부터 프롬프트를 너무 많이 잡지 않는 거예요. 프롬프트를 많이 잡는다고 인용이 올라가거나 GEO 성과가 높아지는&amp;nbsp; 경험을 못 했거든요. 대신 꼭 필요하다고 판단한 핵심 프롬프트 리스트를 먼저 추리고, 그것들을 하루에 10번 집중적으로 여러 번 돌려봅니다. 그 결과를 기준으로, 작업 전후에 가시성이 어떻게 달라지는지를 비교하는 거죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;여기에 함께 보는 게 AI 크롤러 유입 로그입니다. 프롬프트를 세팅해 두고 AI 크롤러 기록을 봤더니, GPT 봇이 들어와 사이트나 가이드를 먼저 읽고 그다음 최근 소식을 읽는 식의 패턴이 또렷이 보이더라고요. 그래서 저는 인용률과 AI 크롤러 유입, 이 두 가지를 섞어서 함께 봅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;유의미한 프롬프트 리스트는 어떻게 만들까?&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 그런데 앞서 언급하신 프롬프트 리스트라는 것도, 어디서부터 어떻게 만들어야 우리 비즈니스에 정말 유의미한 프롬프트인지 판단하기가 쉽지 않을 것 같아요. 산업 특성에 따라 다르기도 하고, 우리가 최선을 다해 리스트를 만들어도 정작 고객은 전혀 다른 프롬프트로 들어올 수도 있잖아요. 프롬프트 리스트를 만드는 팁이 있으면 추천해 주세요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;양용준&lt;/strong&gt; 처음 테스트했을 때는 무작정 키워드를 던지고 "관련된 질문으로 프롬프트를 뽑아줘"라고 해봤어요. 그런데 제가 넣은 재료 데이터 자체가 부실하다 보니 결과도 부실하게 나오더라고요. 그래서 두 번째로는 검색량, 즉 키워드 볼륨을 기준으로 접근했습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;왜 볼륨 기준이냐면, 사람들이 검색창에 어떤 키워드를 넣는다는 건 그게 이미 대중이 많이 찾는 키워드라는 뜻이거든요. 거기에는 이미 '가격'이라든가, SEO 업종이라면 'SEO 업체 추천'처럼 사람들의 검색 의도가 굳어져 있습니다. AI가 그 프롬프트를 출발점 삼아 질문을 팬아웃할 때, 이렇게 굳어진 의도가 반영된 키워드가 유용한 토대가 돼요. 그래서 저는 구글 서치 콘솔에서 클릭이 높은 키워드, 또 클릭이 없더라도 노출이 높은 의미 있는 키워드를 뽑고, 거기에 사이트맵이나 RSS처럼 홈페이지의 특성을 담은 정보, 그리고 연관 키워드를 함께 조합해 프롬프트를 만들어달라고 했습니다. 이렇게 하니 만족도가 높았고, 제 사이트에서 직접 테스트했을 때도 AI 인용이 올라간 페이지가 이후 검색 결과에서도 페이지 단위로 함께 노출되더라고요. 그래서 충분히 의미가 있다고 봅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt; 방금 말씀하신 방법론도 쓰고요. 거기에 조금 더 분명한 방법을 하나 보태자면, 저는 고객 인터뷰를 많이 합니다. 처음 고객 인터뷰를 시작한 이유는 콘텐츠를 더 잘 쓰기 위해서였어요. 제가 발표에서 말씀드렸듯이, 내가 어떤 계기로 SEO를 해야겠다고 마음먹는 것과, 누군가가 저에게 컨설팅을 맡기거나 제 강의를 사는 것은 전혀 다른 얘기잖아요. 그 간극이 궁금해서 직접 인터뷰를 요청했습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;수많은 SEO 전문가 중에서 왜 굳이 나를, 내 강의를 택했는지가 알고 싶었어요. 제가 생각한 차별점(USP)이 아니라, 고객이 직접 말하는 차별점을 듣고 싶었던 거죠. 그렇게 들어보니 의외의 답이 나왔습니다. 저는 온라인 강의를 탈잉에서 론칭하면서 제 경쟁자가 패스트캠퍼스 같은 교육 플랫폼일 거라고 짐작했거든요. 그런데 인터뷰를 거듭해 보니 아니었어요. 제 진짜 경쟁자는 'AI와 함께 독학하는 사람'이었습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그래서 저는 콘텐츠를 전부 바꿨어요. 아시는 분도 계시겠지만 저는 웹사이트나 블로그뿐 아니라 링크드인 콘텐츠도 많이 하는데, 그 글들을 보면 표현을 조금씩 달리했습니다. 예전엔 제가 하고 싶은 말로 썼다면, 지금은 고객이 실제로 쓰는 언어로 씁니다. "네이버 매출을 잘 내고 있었는데 한순간에 반토막이 났다", "AI랑 열심히 얘기하는데 처음엔 그럴듯한 답을 주더니 정작 나한테 필요한 정보는 안 알려준다" 같은 말들이요. 이런 이야기를 너무 많이 듣다 보니, '아, 이게 진짜 키워드이자 프롬프트가 된다' 싶었습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그래서 실제 컨설팅에 들어갈 때는 고객사 미팅에 직접 함께 갑니다. 거기서 나오는 이야기를 다 수집하고, 그 안에서 '이런 문제가 있구나'라고 짚은 다음, 그게 키워드 검색량이 있는지 확인하고, 더 나아가 프롬프트로 만드는 거죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;저는 지금이 정말 좋은 시대라고 봐요. 예전 SEO에서는 좋은 제품이나 서비스를 가진 사람들도 하나의 키워드에 다 같이 몰리니 경쟁이 너무 치열했습니다. 그래서 정작 좋은 제품이 아닌데도 온갖 편법으로 노출을 끌어올려 1위에 뜨는 경우가 있었죠. 그런데 프롬프트는 다릅니다. 그 누구도 똑같이 검색하지 않거든요. 우리는 흔히 "강남에서 20명이 회식할 곳 추천해줘" 같은 식으로 검색한다고 생각하지만, 실제로 그렇게 딱 떨어지게 묻는 사람은 많지 않아요. 다들 자기 상황과 취향을 담아, 여기도 알아보고 저기도 알아보며 나만의 디테일한 프롬프트를 만들어 갑니다. 그렇다면 하나의 콘텐츠가 그 모든 프롬프트를 다 예측할 수 있을까요? 저는 아니라고 봅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그래서 고객 인터뷰에서 길어 올린 인사이트로 콘텐츠를 만드시면, 디테일 하나를 염두에 두고 썼는데 수백 가지 프롬프트에서 노출되는 경험을 하실 수 있을 거예요.SEO에 빗대자면 롱테일 하나를 잡았는데 거기에 백 가지 롱테일이 줄줄이 딸려오는 것처럼요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 정말 감사합니다. 결국 고객의 의도에 맞는 키워드를 AI가 맥락으로 이해하니, 키워드를 출발점 삼아 다양한 맥락으로 펼쳐 나가다 보면 프롬프트 리스트를 잘 만드실 수 있겠네요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3806/image5.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &amp;nbsp;공다솜 라이너 콘텐츠 리드&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;오해 3. GEO는 예산부터 필요할까&lt;/strong&gt;&lt;/h3&gt;&lt;h4&gt;&lt;strong&gt;처음 시작하는 실무자를 위한 체크리스트&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 마지막 오해입니다. 마케팅을 하다 보면 예산이 든든해야 마음이 놓이고, 또 예산을 쓰면 그만큼 매출이 받쳐줘야 한다는 부담이 들잖아요. 그러다 보니 "여기서 막 돈을 쓸 수는 없는데, 지금 당장 어떤 액션을 해야 할까?"를 고민하는 질문이 많았습니다. "체크리스트가 있으면 좋겠다"는 분도 계셨고요. "GEO가 다양한 채널에서 소스를 가져와 우리 브랜드를 언급한다는데, 우리 회사엔 마케터가 한 명뿐이라 하나밖에 못 한다. 그럼 채널 우선순위를 어떻게 가져가야 하나?"라는 질문, "웹사이트만 손을 댈 수 있는데, 그래도 할 수 있는 액션은 무엇이냐?"는 질문도 있었습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;처음 시작하는 실무자를 위한 '이것만은' 체크리스트를 물어봐 주셨는데, 시간 관계상 많이는 못 받고 두 분께 딱 한 가지씩만 부탁드릴게요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt; 저는 '우리 고객은 어떤 채널을 가장 많이 이용하는가'를 파악하는 게 1순위라고 봅니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;양용준&lt;/strong&gt;저는 데이터 보는 걸 좋아해서, GEO 툴 하나를 세팅할 것 같습니다. 측정 툴도 여러 가지가 있겠지만, 처음부터 GEO 툴 하나를 딱 정해 거기에 매달리기보다는, 한 달에 몇백만 원 정도의 예산이 있다면 잘 알려진 주요 툴을 한 달씩 번갈아 구독해보는 거예요. 같은 방식으로 프롬프트를 세팅해서 인용 결과가 비슷하게 나오는지 비교한 다음, 그중 가장 마음에 드는 걸 고르는 거죠.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 어느 경우든 공통점은 지금 우리 고객이 어디에 있고 그 상황이 어떤지부터 점검하는 데서 출발한다는 것이네요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;GEO를 위한 채널 우선순위 전략&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt;두 번째는 앞선 맥락과 이어지는 것 같아요. 채널 우선순위를 짚는 방법은, 결국 우리 고객이 어디에서 가장 많이 들어오고, 어디에서 우리를 가장 많이 언급하고, 어떤 채널을 거쳐 AI 인용까지 이어졌는지를 확인하는 일이 되겠죠. 이 부분에서도 전달해 주실 팁이 있을까요?&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;양용준&lt;/strong&gt; 이것도 산업마다 다르다고 봅니다. 유튜브는 AI나 AI 모드 쪽에서 영향력이 조금 더 올라가는 걸로 보이고요. 비슷한 맥락에서 네이버 블로그도 AI Mode나 AIO에서의 인용이 높은 편이구요. 구글은 학습봇을 제외 하곤 별도의 AI 크롤러를 두지 않는 구조이기도 하고요. 그리고 급상승하는 특정 소셜 뉴스 같은 것을 빼면, 매거진, 뉴스 사이트 들의 경우 단순히 '거기서 인용이 많이 된다'는 관점으로 접근하기보다, 그 매체의 하루 평균 발행량을 따져봐야 합니다. 살펴보니 하루 220개에서 240개가량 쏟아지더라고요. 그렇게 많은 글 중에서 우리와 연관된 콘텐츠가 어떤 게 인용되는지가 더 중요하다고 봅니다. 그런 기준으로, 내가 어떤 LLM을 목적으로 하는지에 따라 채널을 먼저 정하는 거죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt; 앞선 질문에 대한 저의 답변이 “우리 고객은 지금 어떤 채널을 많이 이용하는가”를 파악해야 한다고 했는데요. 제가 만약 미용실을 운영하는 사람이라면, 일단 직접 구글에 검색을 해볼 겁니다. "강남 미용실 추천", "드라이 잘하는 곳" 이런 식으로요. 그러면 AI는 필연적으로 위치 정보나 지도에 달린 후기들을 많이 읽어갈 거예요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그렇다면 제가 가장 먼저 신경 써야 할 건, AI가 랜딩 페이지를 많이 읽든 유튜브를 많이 읽든 상관없이, 카카오맵이나 네이버 같은 지도 플레이스에 달린 리뷰 정보입니다. 저는 그것부터 챙길 것 같아요. 우리에게 늘 시간이 넉넉한 게 아니니까요. 'GEO를 하려면 이렇게 해야 AI에 노출되겠지'라고 따로 머리를 싸매기보다, 더 효율적인 길이 있습니다. 어차피 로컬 비즈니스라면 원래 해야 했던 일을 제대로 하는 거예요. 리뷰, 플레이스를 관리하고, 한국 손님은 카카오를 많이 보고 오니 카카오맵을, 외국 손님은 구글맵을 관리하는 것이죠. 이걸 잘해두면 AI에도 자연스럽게 함께 노출되거든요. 그래서 저는 일단 직접 검색해 가장 많이 노출되는 출처를 확인하고, 거기에 더해 그동안 쌓인 제 경험적 데이터에 비춰 고객이 가장 많이 쓰는 곳부터 챙길 것 같습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 여기서 또 하나의 교훈을 얻네요. 일단 프롬프트를 먼저 넣어 출처가 어떤 순서로 뜨는지 파악하고, 그 출처에서 우리가 잘 인용될 만한 액션을 하고 있는지를, 산업 부문마다 다르니 한번 점검해 보라는 말씀이죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;사일로 조직의 GEO 전략: AI가 먼저 찾아오는 웹사이트의 조건&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt;이번에는 "자사 웹사이트만 손볼 수 있는 팀이라면 어디까지 할 수 있나요?"라는 질문을 다뤄 보려는데요. 회사 규모가 커지다 보니 소셜 미디어를 관리하는 팀, 웹사이트를 관리하는 팀, 이런 식으로 팀이 분화되고 예산도 팀별로 따로 책정되면서 사일로가 생긴 상황에서 주신 질문입니다. 질문자는 그중에서도 웹사이트만 관리할 수 있는 상황인데, 이때 GEO를 웹사이트만 갖고 해야 한다면 무엇을 할 수 있고 얼만큼의 효과를 낼 수 있는지를 질문 주셨어요.&amp;nbsp;&lt;/p&gt;&lt;p&gt;*현장에서는 실제 질문자에게 질문의 의도를 추가로 문의하는 과정이 있었습니다. 추가 문의 과정은 편집 과정에서 생략하고, 진행자의 질문 내용에 반영했습니다.&amp;nbsp;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;양용준&lt;/strong&gt; 앞서 계속 말씀드린 것처럼, 저는 먼저 어떤 콘텐츠가 인용이 많이 되는지부터 분석할 것 같습니다. 웹사이트만 관리할 수 있고, 머천트 센터의 관리 권한이 다른 팀에 있는 상황이신데요. 사이트맵 같은 기본은 이미 갖춰 두셨을 테니, 아까 말씀드린 키워드 볼륨 등을 기반으로 프롬프트를 짜서 모니터링하면 어떤 종류의 콘텐츠가 많이 인용되는지가 보입니다. 만약 그게 PR 차원의 외부 기사를 인용한 거라면, 그 기사 내용을 우리 자사의 뉴스룸 콘텐츠로 가져와서 우리 페이지가 인용되도록 만드는 거죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;또 떠오르는 건 템플릿화할 수 있는 콘텐츠를 만드는 건데요. 예를 들어 "아이폰 13 vs 아이폰 14"처럼 비교 콘텐츠를 검색하면, 동적으로 바뀌는 템플릿 페이지가 가장 먼저 뜹니다. 이런 걸 보면, 비교 콘텐츠를 하나하나 손으로 쓰는 것도 중요하지만, 템플릿화해서 자동으로 생성할 수 있는 것들은 페이지를 대량으로 찍어내는 편이 나을 수 있다고 생각합니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그러니 '특정 매체에 PR을 꼭 해야 하나, 외부 인용에 의존해야 하나'를 고민하기보다는, 어떤 주제를 AI가 더 좋아하고 가져가는지를 보고 그걸 하나의 콘텐츠로 잡을 수 있느냐, 템플릿화된 콘텐츠로 제작할 수 있느냐로 접근하는 게 좋습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt; 상황마다 다르겠지만, 저는 우리에게 '전환에 가장 가까운 곳'이 어디인지를 볼 것 같습니다. 커머스라면 사람들이 후기에 많이 모이겠죠. "이거 후기 좀 알려줘" 하는 식으로요. 그러면 저는 후기부터 관리할 것 같습니다. B2B라면 고객이 케이스 스터디를 가장 많이 보고 결정하실 테니, 그 케이스 스터디부터 AI가 더 잘 읽어갈 수 있는 형태로 다시 발행할 거예요. 또 다른 회사라면 그 지점이 상세 페이지일 수도 있고요. 그러니 '자사 사이트만 손볼 수 있다'면, 우리에게 전환에서 가장 큰 임팩트를 주는 페이지가 어디인지부터 찾아 거기에 집중하시면 됩니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;공다솜(진행)&lt;/strong&gt; 감사합니다. 두 분 이야기를 들으니, 지금 우리가 잘하고 있는 것, 그리고 무언가 했더니 반응이 있었던 것을 그냥 흘려보내지 말고, '이걸 AI에게 어떻게 인식시킬까'를 고민해보면 액션 플랜을 한결 빨리 얻으실 수 있을 것 같아요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;정리하며&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;오늘 패널 두 분과 연사 세 분이 정말 많은 이야기를 들려주셨는데, 정리하면 이렇습니다. 우리는 그동안 해 오던 일과 크게 다르지 않은, 다만 조금 더 확장된 일을 하는 시대로 들어선 것 같아요. 그러니 환경이 달라졌다고 당황하기보다는, 일단 우리가 잘하는 것에서 출발해 보면 좋겠습니다. 인용 횟수는 어디까지나 보조 지표예요. 그보다는 우리 비즈니스에서 고객이 좋아할 만한, 또 우리에게 실제로 돈이 될 만한 지표가 무엇인지를 팀원들과 함께 고민해 보시는 편이 훨씬 의미가 있을 겁니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3806/%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2026-06-16_104459.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &amp;nbsp;공다솜 라이너 콘텐츠 리드&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그리고 예산부터 마련하려 들기보다는, 우선순위를 먼저 세우고 그 우선순위가 어떤 임팩트를 냈는지를 보세요. 오늘 이야기를 들어보니, 여러분은 이미 마음속에 답을 다 가지고 계신 것 같습니다. 돌아가셔서 하나씩 시도해 보시면 좋겠어요. 패널 분들도 말씀하셨듯이, 누군가는 이 상황을 위기라고 말하지만 사실은 새로운 채널이 하나 더 생긴 것이고요. AI가 아무리 빠르게 발전한다 해도 아직은 시간이 있습니다. AI가 충분히 똑똑해지기 전에, 우리가 미리 준비해 둘 기회가 생겼다고 생각하면서 함께 시작해 보면 좋겠습니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;패널 토크는 여기까지입니다. 감사합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;Q&amp;amp;A&lt;/strong&gt;&lt;/h3&gt;&lt;h4&gt;&lt;strong&gt;Q. 가시성 측정은 어떻게 하시나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;양용준:&lt;/strong&gt; 고객사와 대행사가 합의하여 도출한 핵심 프롬프트(질문어) 리스트를 기준으로 측정합니다. 데이터는 API 연동 대신 웹 스크래핑 방식으로 정보를 수집하는 GEO(생성형 AI 검색 최적화) 툴을 활용하고 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;물론 현재의 가시성 측정은 외부 써드파티(3rd party) 솔루션에 의존하고 있어, 어디까지나 간접적인 지표로 참고하는 수준입니다. 다만 향후 구글 서치콘솔에 ‘AI 가시성 보고서’가 업데이트되면, 이를 기준으로 어떤 GEO 툴을 선택해 활용해야 할지 더욱 명확해질 것으로 기대합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt;: 구글써치콘솔과 구글애널리틱스, 빙 웹마스터 도구를 우선으로 보고 있습니다. 타겟하는 프롬프트가 존재하지만, 프롬프트는 키워드보다 훨씬 개인차가 크기 때문에 항상 해당 프롬프트로만 들어오지 않는 걸 이해하는 게 중요합니다. 그래서 3개의 도구로 실제로 어떤 프롬프트에 노출되고 들어오는지 체크합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;타겟하는 프롬프트는 Ubersuggest나 SEMrush, onthe.ai 등 외부 툴을 활용하여 모니터링하고 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;Q.인용률을 높이는 가장 쉬운 방법은 무엇인가요?&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;양용준:&lt;/strong&gt; ‘가장 쉽고 빠른 건 없다’고 생각합니다. 자사 홈페이지 콘텐츠나 구조만 잘 설계해도 인용률은 올라간다고 보고, 또 실제 케이스도 그렇게 확인되고 있습니다.&lt;/p&gt;&lt;p&gt;&lt;br&gt;무작정 Offsite SEO를 한다는 건 전략없이 하겠다는 것과 마찬가지입니다. 그래서 어떤 채널에서 해야할지 모르겠다면 OnSite SEO에 집중하는 것을 권장드립니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt;: 넘버링을 활용한 문장, 표 등이 인용률이 높다는 연구 결과도 많지만, 저는 고객님들이 쓰시는 표현을 그대로 활용하는 걸 선호합니다. 세일즈 미팅에서 나오는 질문들, 공식 계정 SNS에 달리는 댓글, CS, 리뷰 등에서 고객님들의 궁금한 점을 그대로 가져와 콘텐츠를 만들고 표현도 고객님들의 보이스에 맞춰 작성하는 것을 추천합니다. 결국 AI 검색엔진이 원하는 건, 이 질문에 적절한 답을 해주는 콘텐츠를 인용하여 궁금증을 해소해주는 것일테니까요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;더불어, 모델이 이미 자주 인용하는 페이지(좋은 비교 리스티클, 활발한 레딧/커뮤니티/스레드 등)에 한 번 제대로 인용되는 것이, 내 블로그 글 몇 달치보다 인용을 더 끌어올 때도 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;Q.GEO가 신뢰할 수 있는 출처에서의 추천이 필요하다는 것이라면, 신생 스타트업이나 아직 네임밸류가 높지 않은 브랜드는 어떤 식으로 GEO 최적화를 하는 것이 가장 효율적이라고 생각하시나요? 어떤 문제를 어떻게 해결하는지 자사 블로그에 올린다고 해도 소스가 한정적이니 한계가 있을거라는 생각이 듭니다.&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;양용준:&lt;/strong&gt; 과거 전통적인 SEO 시장에서도 상위 노출을 하려면 무조건 DR(도메인 권위도) 점수를 높여야 한다는 말이 있었고, 어느 정도 일리는 있었지만 100% 정답은 아니었습니다. GEO 역시 마찬가지입니다. 대형 미디어나 높은 인지도 같은 외부 조건에 지레 겁먹기보다, 신생 스타트업일수록 우선 '자사 홈페이지 내실'에 집중하라는 말씀을 드리고 싶습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;1인 기업으로 활동하는 저 역시 GEO 최적화를 위해 다양한 방안을 시도해 보았는데요. 해외에 비해 국내는 아직 경쟁 강도가 낮기 때문에, 구조적으로 잘 관리된 홈페이지 하나만으로도 충분히 (AI 검색 엔진의 추천 궤도에) 어느 정도 오를 수 있다고 봅니다. 그렇게 자사 채널에서 먼저 기초 체력을 증명한 다음에, 더 넓은 영역으로 경쟁력을 확장해 보는 것은 어떨까요?&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt;: AI는 사용자의 질문을 여러 개의 작은 하위 질문으로 쪼개서 각각 검색합니다. AI 검색에는 구글 같은 고정된 1위 자리가 없고, 가시성은 '얼마나 자주 등장하느냐'의 빈도 문제로 볼 수 있습니다. 신생 브랜드가 “제일 좋은 CRM"을 이길 순 없지만, "1인 세무사를 위한 CRM" 같은 니치한 질문은 경쟁이 가능하다고 봅니다. 그래서 더더욱 고객에 대한 이해가 필요합니다. 가장 뾰족한 니치한 질문에 대한 답변을 그들도 원할 테니까요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;니치한 질문을 찾았다면, 콘텐츠를 퍼뜨리는 것도 중요합니다. AI 모델은 이미 신뢰하고 자주 retrieval 하는 소스를 우선 인용하는 경향이 있습니다. 그래서 자사 블로그 뿐만 아니라 우리의 니치한 질문에서 자주 인용되는 페이지에 가서 댓글 혹은 콘텐츠를 퍼뜨리는 것을 권장드립니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;Q.ai 가시성을 측정할 때, api를 통해 답변을 받는 것과 실제 url로 ai 서비스에 유저처럼 접근해서 답변을 긁어오는 것에 차이가 있나요? api 답변으로 측정해도 정확하다고 볼 수 있을지 궁금합니다&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;양용준:&lt;/strong&gt; 이 부분은 GEO 툴을 전문적으로 개발하는 곳들의 이야기를 들어보는 것이 가장 확실한데요. 제가 업계 관계자들과 소통하며 확인한 바로는, 현재 API를 통해 수집하는 데이터는 웹 스크래핑으로 수집한 결과와 비교했을 때 실제 유저 화면을 대변하기 어려울 정도로 퀄리티 차이가 큽니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;가시성을 제대로 측정하려는 전문 기업들이 공수가 적게 드는 API 방식 대신, 굳이 복잡한 웹 스크래핑이나 자체적인 수집 방식을 고집하는 데에는 명확한 이유가 있다고 봅니다.&lt;/p&gt;&lt;p&gt;따라서 사용자 화면에서 직접 답변을 수집하거나, 웹 스크래핑 기반의 GEO 툴이 아니라면, 단순히 API 연동에만 의존하는 GEO 툴의 데이터는 신뢰하지 않는 편입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이소연&lt;/strong&gt;: 약간은 다르다고 생각합니다. 컨슈머 UI(ChatGPT, Perplexity, Gemini, AI Overviews)는 실시간 웹 위에서 RAG를 돌리고 자체 랭킹·후처리를 거칩니다. 반면 API는 갱신 빈도가 더 낮고, 웹 UI는 RAG 파이프라인으로 실시간 정보를 즉석에서 가져오며, API에는 그런 개인화가 상대적으로 덜 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;같은 질문도 유저마다 답이 다른데, API는 이걸 잡기 어려울 수 있기 때문에 약간의 차이는 있다고 봅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="media"&gt;&lt;oembed url="https://youtu.be/byeH28MmmZE?si=U4Y0YEvkFJ-Vs4OS"&gt;&lt;/oembed&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>앤트로픽 페이블 5(Fable 5) 차단 사건의 전말</title><link>https://yozm.wishket.com/magazine/detail/3805</link><description>출시 사흘 만에, 미국 정부의 편지 한 장으로 최고 수준 LLM의 사용이 중단됐습니다. 앤트로픽의 최신 모델, 페이블 5(Fable 5)에 벌어진 사건입니다. 나흘이 지난 지금, 6월 15일에도 모델에는 접근할 수 없죠. 정부는 보안 우회를, 앤트로픽은 '좁고 보편적이지 않은 우회일 뿐'이라 맞섰고, 방아쇠는 최대 투자자 아마존의 제보였습니다. 사건의 전말과 법적 근거, 오픈소스·소버린 AI로 번진 파장과 함께 지금 우리가 알아야 할 것을 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3805</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;출시 사흘 만에, 미국 정부의 제재로 최고 수준 LLM 접근이 차단됐습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앤트로픽의 최신 모델, 페이블 5&lt;span style="color:#999999;"&gt;(Fable 5)&lt;/span&gt;에 벌어진 사건입니다. 나흘이 지난 지금, 6월 15일에도 모델에는 접근할 수 없죠. 사건의 개요와 타임라인, 특징과 함께 지금 우리가 알아야 할 것을 정리했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3805/Gemini_Generated_Image_c1gdfvc1gdfvc1gd_70y3VPP.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;사건 개요&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;무엇이, 언제, 어떻게 됐는지부터 끊어서 보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;1. 페이블 5&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;앤트로픽이 2026년 6월 9일 &lt;strong&gt;최고 성능 모델 클로드 페이블 5&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(Claude Fable 5)&lt;/span&gt;&lt;strong&gt;를 공개. 일부에게만 선공개된 미토스 5&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(Mythos 5)&lt;/span&gt;에 안전장치를 추가한 모델.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;2. 미국 정부의 편지&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;사흘 뒤인 6월 12일 오후 5시 21분&lt;span style="color:#999999;"&gt;(미 동부시간)&lt;/span&gt;, 앤트로픽은 상무부 장관 하워드 러트닉&lt;span style="color:#999999;"&gt;(Howard Lutnick)&lt;/span&gt; 명의의 편지를 받음. ‘국가안보 권한&lt;span style="color:#999999;"&gt;(national security authorities)&lt;/span&gt;’을 근거로 외국 국적자의 페이블 5 접근을 막으라는 지시.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;3. 앤트로픽의 대응&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;“실시간으로 누가 외국인인지 식별할 수 없다”는 이유로, 같은 날 오후 7시 1분&lt;span style="color:#999999;"&gt;(태평양시간)&lt;/span&gt; &lt;strong&gt;전 고객 대상으로&lt;/strong&gt; 페이블 5와 미토스 5를 &lt;a href="https://www.anthropic.com/news/fable-mythos-access"&gt;전면 비활성화&lt;/a&gt;. 외국인만 가려서 막을 수가 없으니 전부 차단.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;4. 차단 범위&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;두 모델 모두 클로드 API·Claude.ai·아마존 베드락·구글 버텍스·MS 파운드리 등 &lt;strong&gt;모든 채널에서 동시에&lt;/strong&gt;, 미국 시민과 외국인을 가리지 않고 내려감. 반면 Opus 4.8·Sonnet·Haiku 등 다른 클로드 모델은 그대로.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;5. 지금 상태&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;이 글을 쓰는 6월 15일 현재까지 페이블 5는 &lt;strong&gt;여전히 차단 상태&lt;/strong&gt;. 복구 여부를 자동 추적하는 &lt;a href="http://isfable5back.com"&gt;isfable5back.com&lt;/a&gt; 기준.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;6. 왜 차단했는가?&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;정부는 “페이블 5에서 보안 우회&lt;span style="color:#999999;"&gt;(jailbreak)&lt;/span&gt;가 발견됐고, 이게 국가안보 위협”이라는 입장. 그러나 앤트로픽은 “특정 코드베이스를 읽혀 소프트웨어 결함을 찾게 하는 좁고 보편적이지 않은&lt;span style="color:#999999;"&gt;(narrow, non-universal)&lt;/span&gt; 우회일 뿐이며, GPT-5.5를 포함한 다른 모델에서도 일상적으로 가능한 수준”이라고 반박. 어느 쪽 말이 맞는지 검증한 &lt;strong&gt;제3자 보고는 아직.&lt;/strong&gt;&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;타임라인&lt;/strong&gt;&lt;/h4&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3805/timeline_2xWPoRL.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;figure class="table" style="text-align:justify;"&gt;&lt;table style="border-bottom:none;border-left:none;border-right:none;border-top:none;"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td style="background-color:hsl(0, 0%, 90%);border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;&lt;strong&gt;시점&lt;/strong&gt;&lt;/td&gt;&lt;td style="background-color:hsl(0, 0%, 90%);border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;&lt;strong&gt;사건&lt;/strong&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;2026-06-09&lt;/td&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;페이블 5·미토스 5 출시 ($10/$50, 미토스는 ‘Project Glasswing’ 한정)&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;2026-06-11 또는 12&lt;/td&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;아마존 CEO 앤디 재시(Andy Jassy), 행정부에 페이블 5 우회 우려 보고&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;2026-06-12 17:21 ET&lt;/td&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;상무부 장관 러트닉 → 다리오 아모데이 앞 편지. ‘국가안보 권한’ 인용&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;2026-06-12 19:01 PT&lt;/td&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;앤트로픽, 전 고객 대상 페이블 5·미토스 5 전면 중단&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;2026-06-15&lt;/td&gt;&lt;td style="border-bottom:0.5pt solid #000000;border-left:0.5pt solid #000000;border-right:0.5pt solid #000000;border-top:0.5pt solid #000000;padding:0pt 5.4pt;vertical-align:top;"&gt;여전히 차단 상태&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;사건 관전 포인트 4가지&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. 정부가 “AI 모델을 회수한다”&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이 사건이 중요한 이유는 단순히 성능 좋은 AI 모델 하나가 막혔기 때문만은 아닙니다. &lt;strong&gt;일반에 공개된 최첨단 LLM이 정부 지시로 시장에서 내려간 첫 사례&lt;/strong&gt;라서죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그동안 AI 발전의 핵심이었던 모델은 출시되면 가격이 내리거나 성능이 올라가며 쌓여만 갔습니다. “어제 쓰던 최고 모델이 오늘 사라진다”는 경험은 생각하기도 어려웠죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 이어질 진짜 충격은 신뢰의 영역에서 올 것으로 보입니다. 내 서비스 핵심에 들어가 있는 모델이, 내 잘못이나 계약 위반과 무관하게 &lt;strong&gt;기업이나 개인이 통제할 수 없는 정부 개입으로 꺼질 수 있다&lt;/strong&gt;는 사실이죠. 이는 즉, 미국 모델과 컴퓨트에 의존하는 기업이라면 사업 의존성과 장기 로드맵을 전면 재검토해야 한다는 뜻입니다. 이러한 위협으로 온프레미스·오프라인 기반 접근에 대한 압력이 압도적으로 커질 수 있습니다. 일종의 지각변동을 부를 사건입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3805/%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA_2026-06-15_%E1%84%8B%E1%85%A9%E1%84%8C%E1%85%A5%E1%86%AB_11_18_56.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 앤트로픽&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. 누구에게 책임이 있는가?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;게다가 이 차단 사건을 두고 서로 말하는 바도 조금씩 다릅니다. 논란 거리가 몇 가지 있는데요, 영역별로 쪼개서 보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;첫째, 우회를 보는 해석이 다릅니다.&lt;/strong&gt; 정부는 “보안 우회 발견 → 국가안보 위협”이라는 단순한 입장을 내세웠습니다. 반면 앤트로픽의 설명은 정반대예요. &lt;a href="https://www.anthropic.com/news/fable-mythos-access"&gt;공식 성명&lt;/a&gt;에서 회사는 지금까지 정부가 제시한 게 잠재적인 좁고 비보편적인 우회에 대한 구두 증거뿐이며, 그 능력은 다른 모델에서도 널리 쓰이고 시스템을 지키는 방어자들이 매일 사용하는 수준이라고 했습니다. 어느 쪽 말이 맞는지 가릴 &lt;strong&gt;독립적 검증은 당연히 아직&lt;/strong&gt; 없습니다. 정부가 보낸 지시의 본문도 공개되지 않았고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;둘째, 논쟁은 공개적으로 번졌습니다&lt;/strong&gt;. 미국 대통령과학기술자문위원회 의장 데이비드 색스&lt;span style="color:#999999;"&gt;(David Sacks)&lt;/span&gt;는 6월 13일 &lt;a href="https://x.com/DavidSacks/status/2065853007619588171"&gt;X&lt;/a&gt;에 글을 올렸습니다. 앤트로픽과 미 정부 양쪽의 신뢰할 만한 파트너가 페이블을 테스트하다 우회를 발견했고, 행정부가 앤트로픽 CEO 다리오 아모데이에게 모델을 고치거나 내리라고 요청했지만, 그가 거부했다는 내용이었죠. 이에 대한 앤트로픽의 공식 반박은 확인되지 않았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3805/%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA_2026-06-15_%E1%84%8B%E1%85%A9%E1%84%8C%E1%85%A5%E1%86%AB_11_19_48.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 데이비드 색스 X&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;셋째, 이 보안 우회를 보고한 ‘신뢰할 만한 파트너’는 아마존이었던 것으로 보입니다&lt;/strong&gt;. &lt;a href="https://fortune.com/2026/06/14/how-a-warning-from-amazon-led-the-white-house-to-shut-down-anthropics-mythos-model/"&gt;해외 보도&lt;/a&gt;를 종합하면, 아마존 CEO 앤디 재시가 6월 11일에서 12일 사이, 직접 재무장관 스콧 베센트 등에게 페이블 5 우회를 시연·보고했다고 합니다. 사실 아마존은 앤트로픽의 최대 투자자 중 하나라서 논란은 더 커졌죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;넷째, ‘막을 수 있는 권한이 있었나’부터가 논쟁입니다&lt;/strong&gt;. 미국 행정부의 지시는 ‘국가안보 권한’만 언급할 뿐 어떤 조항을 기반했는지 등이 비공개 상태입니다. 물론 앤트로픽 스스로도 정부가 안전하지 않은 배포를 막을 권한 자체는 인정한다고 했습니다. 다만 그것은 투명하고 공정하며 기술적 사실에 근거한 법적 절차여야 하는데, 이번 조치는 그 원칙을 따르지 않았다는 입장입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3. 앤트로픽의 “위험 마케팅”과 부메랑&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이 사건이 퍼지고 나서 커뮤니티에서는 다양한 반응이 나왔는데요. 그 중 가장 많은 지적은, 앤트로픽이 1년 넘게 “우리 모델은 위험하다”고 강조해온 것이 바로 모델을 막는 빌미가 된 것 아니냐는 이야기입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;자업자득 프레임&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;앤트로픽은 앞서 미토스를 처음 선보이며, 이 모델은 너무 위험해 일반 대중에게 풀 수 없다는 이야기를 합니다. 그에 따라 소수의 인증된 단체에게만 활용 권한을 쥐어줬고, 나아가 수많은 안전 가드레일을 붙인 상태로 모델을 출시합니다. 다만, 이는 IPO를 앞두고 자사의 기술력을 강조하기 위한 “위험 마케팅”이라는 지적이 있었죠. 결국 이번 사태는 그동안의 겁주기에 대한 대가를 치르는 것이라는 프레임이 나옵니다. 안전을 브랜드로 내세운 회사가, 안전을 이유로 가장 강하게 제재받은 셈입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;앤트로픽 vs. 미국 행정부의 누적된 마찰&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;또 한 쪽에서는, 행정부와 앤트로픽 사이의 마찰이 쌓이며 이번 차단이 생겼다고도 봅니다. 미국 행정부가 전쟁 등에 클로드 모델을 사용하는 것을 앤트로픽이 꾸준히 반대해 왔거든요. 2025년 10월 ‘규제 포획&lt;span style="color:#999999;"&gt;(regulatory capture)&lt;/span&gt;’ 의혹이 있었고, 2026년 2월에는 펜타곤이 ‘공급망 위험’으로 지정했습니다. 6월 2일 AI 행정명령에는 ‘일방적 수출통제라는 강한 안전장치&lt;span style="color:#999999;"&gt;(hard backstop)&lt;/span&gt;’ 조항이 담겼죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;4. 남은 일들: 복구·오픈소스·소버린 AI·오픈AI 새 모델&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;복구 전망은 아직입니다.&lt;/strong&gt; 색스는 안전 문제가 해결되면 수출통제를 가능한 빨리 해제하길 바란다고 했고, 앤트로픽도 접근을 빠르게 복구하려고 협의 중이라 밝혔습니다. 예측시장에서는 6월 20일 이전 복구 확률이 70% 수준까지 올랐고요. 다만 이건 모두 전망이고, 구체적 일정은 정해지지 않았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;역설적으로 이로 인해 &lt;strong&gt;중국 중심의 오픈소스 모델 시장&lt;/strong&gt;이 주목받기 시작할 수 있습니다. 언제든 차단될지 모르는 모델을 쓰느니, 우리가 컨트롤할 수 있는 오픈소스 모델을 쓰는 쪽으로 가는 거죠. 공교롭게도 페이블이 차단된 바로 그날, 중국 문샷 AI는 오픈웨이트 코딩 모델 &lt;strong&gt;Kimi K2.7-Code를 허깅페이스에 공개&lt;/strong&gt;했습니다. Kimi의 성능이 거의 Opus 4.6 정도와 맞먹을 지도 모른다는 이야기가 나오는 만큼, 이번 미국 정부의 결정이 어쩌면 중국 AI 생태계에 힘을 실어줄지도 모른다는 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그와 함께 &lt;strong&gt;소버린 AI 논의&lt;/strong&gt; 역시 떠오릅니다. 주권 AI가 뜨거워질 거라며 코히어&lt;span style="color:#999999;"&gt;(캐나다)&lt;/span&gt;·미스트랄&lt;span style="color:#999999;"&gt;(프랑스)&lt;/span&gt;에 관심이 몰릴 거로 보이죠. 실제로 미국 정부의 요청 역시 “외국인 사용자에 대한 제재”였으니까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그와 함께 &lt;strong&gt;오픈AI와 GPT 새 모델&lt;/strong&gt;에도 시선이 쏠립니다. 앤트로픽이 성명에서 GPT-5.5도 같은 능력이 가능하다며 이름까지 콕 집은데다, 곧 GPT-5.6이 나올 거라는 소문이 돌거든요. 그래서 이 새 모델에도 비슷한 잣대가 적용될 지가 매우 중요한 논점입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;이 사건의 본질은 보안 우회의 진위도, 정부와 기업의 진실 공방도 아니라고 봅니다. &lt;strong&gt;늘 더 좋아지기만 할 줄 알았던 모델에 대한 믿음이 처음으로 깨졌다&lt;/strong&gt;는 데 있습니다. 능력과 무관하게, 정치와 규제만으로도 최고 수준의 모델이 오늘 갑자기 사라질 수 있다는 공포가 생긴 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그렇다면 한국에서 AI를 쓰고 만드는 입장에서는 무엇을 다르게 생각해야 할까요. 물론 지금 당장 시작하기는 어렵다 해도, 반드시 이러한 질문을 머릿 속에 가져가야 할 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;단일 벤더, 단일 국가의 모델에 묶인 의존도를 어떻게 분산할 것인가?&lt;/li&gt;&lt;li style="text-align:justify;"&gt;온프레미스나 오픈소스 모델을, 평소엔 안 쓰더라도 비상 옵션으로 확보해둘 수 있는가?&lt;/li&gt;&lt;li style="text-align:justify;"&gt;“가장 똑똑한 모델”이 아니라 “끊기지 않는 모델”이 선택 기준이 되는 순간은 언제인가?&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;분명한 건, 이번 차단 사건이 ‘내 일에는 별 영향 없잖아?’하며 그러려니 하고 넘기기 어려운 사건이라는 점입니다. 이제는 모델을 ‘믿고 쌓아두는 자산’이 아니라 ‘끊길 수 있다고 전제해야 하는 인프라’로 취급해야 할 시기가 다가오고 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>gws CLI와 클로드 코드를 같이 쓰면 어떨까?</title><link>https://yozm.wishket.com/magazine/detail/3804</link><description>LLM이 아닌 주제를 보기 힘든 요즘입니다. 그래서 최근 들어서는 최신 유행하는 LLM 기술 등을 소개하기에 약간의 반골 기질이 들더라고요. 아마 그 반골 기질의 기원은 “글쓰기만큼은 Claude에게 빼앗길 수 없다”라거나 “수많은 LLM 주제가 쏟아지는 요즘 시대에 나는 다른 걸 써도 되지 않을까?”라는 등의 마음과 생각이었던 것 같습니다. 하지만 이번만큼은 그 반골 기질을 꺾을 정도로 좋았던 경험이었고, 이 글을 혹시나 보실 분들에게 적극적으로 추천하고자 제 고집을 잠시 접고 gws CLI + Claude Code의 사용 경험을 공유해 드리고자 합니다.</description><guid>https://yozm.wishket.com/magazine/detail/3804</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;GeekNews나 Medium, 혹은 LinkedIn 같은 커뮤니티에서 LLM이 아닌 주제를 보기 힘든 요즘입니다. 그래서 최근 들어서는 최신 유행하는 LLM 기술 등을 소개하기에 약간의 반골 기질이 들더라고요. 아마 그 반골 기질의 기원은 “글쓰기만큼은 Claude에게 빼앗길 수 없다”라거나 “수많은 LLM 주제가 쏟아지는 요즘 시대에 나는 다른 걸 써도 되지 않을까?”라는 등의 마음과 생각이었던 것 같습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이제는 거의 클로드 코드(Claude Code) 없이 개발을 못 하는 처지에 이런 마음이 드는 것도 웃깁니다. 하지만 이번만큼은 그 반골 기질을 꺾을 정도로 좋았던 경험이었고, 이 글을 혹시나 보실 분들에게 적극적으로 추천하고자 제 고집을 잠시 접고 gws CLI + Claude Code의 사용 경험을 공유해 드리고자 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3804/1.webp"&gt;&lt;figcaption&gt;&amp;lt;출처: &lt;a href="https://github.com/googleworkspace/cli"&gt;&lt;u&gt;gws CLI&amp;gt;&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;gws CLI 가 뭐죠?&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;gws CLI의 풀 네임은 Google Workspace CLI입니다. 말 그대로 Google Workspace를 CLI로 다룰 수 있는 프로그램이죠. Google Workspace에 포함되는 Gmail(메일), Sheets(스프레드시트), Slides(프레젠테이션), GDrive(드라이브), Docs(문서), Calendar(캘린더) 등을 CLI로 사용할 수 있는 간단한 도구입니다. 물론 전부 무료로 사용할 수 있고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;gws CLI가 만약 5년 전에 나왔다면, 모두가 "이딴 제품을 왜 내놓은 거야?"라며 욕하기 바빴을지도 모릅니다.&lt;/strong&gt;적어도 사람에게는, 앞서 말한 작업들을 당연히 GUI로 처리하는 게 훨씬 편하기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;LLM 모델과 gws CLI가 만나다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;gws CLI는 사람이 쓰기에 굉장히 불편하고 힘든 도구입니다. 왜냐고요? 아래 명령어를 보시면 바로 이해가 가실 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3804/2.webp"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;과연 이 명령어를 사람이 직접 쓸 수 있어 보이나요? 심지어 이 명령어는 단순 서식에 불과합니다. 스프레드시트(Sheets)에서 마우스로 드래그하고 색상을 고른 뒤 굵게(Bold) 버튼을 누르면 끝날 일을, CLI로 처리하려면 이 JSON 괴물을 직접 써야 합니다. 인간에게는 굉장히 비효율적인 방식이죠. 하지만 Claude Code 같은 LLM에게는 식은 죽 먹기입니다. 네, 여러분이 짐작하신 것처럼 &lt;strong&gt;gws CLI는 사람이 아니라 AI 에이전트(AI Agent)가 쓰라고 만든 도구입니다.&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;gws CLI의 리포지토리(Repository)에 들어가 보면, AI 에이전트를 위해 만든 흔적이 곳곳에 보입니다. &lt;code&gt;README.md&lt;/code&gt; 첫 문단부터 'built for humans and AI agents'라고 명시되어 있으며, &lt;code&gt;gws generate-skills&lt;/code&gt; 명령어를 통해 모든 워크스페이스 API의 에이전트용 스킬을 곧바로 만들어낼 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이런 걸 보면 gws CLI는 사람을 위한 UX가 아니라, AI 에이전트를 위한 경험을 설계한 것처럼 보이죠. 요즘 업계에서는 이를 &lt;strong&gt;AX(Agent Experience)&lt;/strong&gt;라고 부르더군요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;gws CLI의 전반적인 설명이나 설치 방법, 간단한 사용법 등은 제가 즐겨 보는 코딩애플님의 &lt;a href="https://youtu.be/Pq12GuQw0_c?si=y14WEkol7RKG7iV1"&gt;&lt;u&gt;gws CLI 영상&lt;/u&gt;&lt;/a&gt;을 보시는 걸 추천합니다. 이번 아티클에서는 제가 직접 사용하며 겪은 후기와, 무엇이 가능했고 어떤 작업을 처리했는지 경험담을 푸는 편이 더 유용할 것 같네요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;Google Sheets 사용&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;저는 타입캐스트(Typecast)에서 최적화 엔지니어로 일하고 있습니다. 제가 최적화 엔지니어로서 자주 하는 작업 중 하나가 바로 '측정'인데요. 이 측정 결과를 내부 팀이나, 의사 결정권자분들에게 투명하게 공유하는 게 매우 중요합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그 측정 결과에 따라 “어떤 것을 최적화해야 하는가?”, “최적화의 우선순위가 무엇인가?”, “모델 품질 저하가 일어났다면 어디서 발생했는가?” 등을 파악할 수 있기 때문이죠. 그래서 팀원들에게 측정 결과를 공유하기 위해 구글 스프레드시트를 정말 자주 사용합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그동안은 스크립트로 도출된 측정 결과를 정리해 CSV 파일로 만들고, 이를 시트에 임포트(Import)한 뒤, 서식을 적용하는 일련의 과정들이 꽤 큰 병목 지점이었습니다. 시트 작업에만 한 시간이 넘는 시간을 허비하는 게 예사였죠. 게다가 중간에 수정할 일이라도 생기면 무척 귀찮아지곤 했습니다. 시트 다루는 솜씨가 그리 훌륭하지 못하다 보니, 매번 서식이나 수식, 조건부 서식을 다루는 건 쉽지 않은 일이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 이 gws CLI를 도입하고 나서 이러한 병목이 완전히 사라졌습니다. 병목이 사라진 덕분에, 측정한 뒤 반복적으로 개선하는 과정에서 시트를 보며 훨씬 더 정확하고 빠르게 반복 개선을 이어갈 수 있었죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;아래는 제가 클로드 코드(Claude Code)로 gws CLI를 활용한 대략적인 예시입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;❯ 시트 생성 및 평가 데이터를 업로드 해주세요.&lt;/code&gt;&lt;/pre&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;⏺ 새 스프레드시트를 생성하고 평가 데이터를 업로드하겠습니다.\
⏺ Bash(gws sheets spreadsheets create --json "{\"properties\":{\"title\":\"모델 평가 결과\"}}")
  ⎿  {
     … +67 lines (ctrl+o to expand)
⏺ 스프레드시트가 생성되었습니다. 이제 헤더와 평가 데이터를 업로드합니다.
⏺ Bash(SHEET_ID="1sWjCgCbRjHq2QS7vsLvZ0lWe-I9n2WXBIHmeFot2IOw"…)
  ⎿  {
     … +4 lines (ctrl+o to expand)
⏺ 스프레드시트 생성 및 데이터 업로드가 완료되었습니다.&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3804/3.webp"&gt;&lt;figcaption&gt;깔끔하게 추가된 모습&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;사실 이 정도는 그리 놀랍지 않습니다. 시트를 생성한 뒤 데이터를 집어넣은 것이니까요. 하지만 이 시트를 수정하고 추가하는 부분에서 놀라움을 느꼈습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞서 생성한 시트만으로는 어떤 데이터가 좋고 나쁜지 한눈에 안 보여서, 가장 좋은 결과에 서식을 입혀달라고 요청했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;❯ 이 시트에서 조건부 서식을 적용해 봅시다. 각 Vocie 별 가장 수치가 높은 평가를 연한 빨간색으로 조건부 서식을 해주세요.&lt;/code&gt;&lt;/pre&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;⏺ 각 Voice(행)별로 가장 높은 수치에 연한 빨간색 조건부 서식을 적용하겠습니다.
⏺ Bash(SHEET_ID="1sWjCgCbRjHq2QS7vsLvZ0lWe-I9n2WXBIHmeFot2IOw"…)
  ⎿  {
     … +3 lines (ctrl+o to expand)
⏺ 조건부 서식이 적용되었습니다. 각 Voice 행에서 C~F열(MOS, WER, PESQ, STOI) 중 가장 높은 수치를 가진 셀이 연한 빨간색으로 표시됩니다.
  - 수식: =C2=MAX($C2:$F2)
  - 범위: C2:F6 (전체 메트릭 영역)
  - 서식: 연한 빨간색 배경
❯ 음 각 메트릭 별로 높으면 좋은게 있고, 낮으면 좋을게 있을텐데, 이걸 고려해서 조건부 서식도 가능할까요?
⏺ 네, 가능합니다. 메트릭 특성에 맞게 적용하겠습니다.
  - 높을수록 좋음 (MAX 강조): MOS, PESQ, STOI
  - 낮을수록 좋음 (MIN 강조): WER
⏺ Bash(SHEET_ID="1sWjCgCbRjHq2QS7vsLvZ0lWe-I9n2WXBIHmeFot2IOw"…)
  ⎿  {
     … +42 lines (ctrl+o to expand)
⏺ 적용 완료했습니다.
  - MOS, PESQ, STOI: 각 열에서 가장 높은 값이 연한 빨간색 (MAX)
  - WER: 가장 낮은 값이 연한 빨간색 (MIN) — 에러율이므로 낮을수록 좋음
❯ 이제 이 시트에서 7행에 각 열에 평균을 넣어줄 수 있나요?
⏺ Bash(SHEET_ID="1sWjCgCbRjHq2QS7vsLvZ0lWe-I9n2WXBIHmeFot2IOw"…)
  ⎿  {
     … +4 lines (ctrl+o to expand)
⏺ 7행에 각 메트릭의 평균을 AVERAGE 수식으로 추가했습니다. 시트에서 값이 자동 계산됩니다.&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3804/4.webp"&gt;&lt;figcaption&gt;조건부 서식까지 완료&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;처음에는 WER(Word Error Rate)이라는 수치가 낮을수록 좋은 것임에도, 높은 수치에 빨간색을 칠하는 실수를 하기도 했습니다. 그래서 각 메트릭의 특성에 맞춰 조건부 서식을 다시 적용해달라고 요청하니 제대로 수정해 주었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;또한 표 하단에 평균 수치가 없어서 평균값을 구하는 수식을 추가해달라고 요청했는데요. 직접 계산해서 넣는 게 아닌 진짜 수식을 넣어서 해결한 모습도 인상적이었죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그 다음은 이렇게 완성된 시트를 JSON 파일로 가져오는 것도 가능했습니다. gws CLI는 시트의 내용을 긁어와 JSON 파일로 내보내는(Export) 기능도 함께 제공하기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;❯ 시트에 있는 데이터를 JSON으로 뽑아주세요.&lt;/code&gt;&lt;/pre&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;⏺ Bash(gws sheets spreadsheets values get \
        --params "{\"spreadsheetId\":\"1sWjCgCbRjHq2QS7vsLvZ0lWe-I9n2WXBIHmeFot2IOw\",\"range\":\"Sheet1!A1:F6\"}")
  ⎿  {
     … +51 lines (ctrl+o to expand)
⏺ 데이터를 JSON 파일로 저장하겠습니다.
⏺ Write(evaluation_results.json)
[
  {"Voice": "Aria", "Language": "ko", "MOS": 4.21, "WER": 0.032, "PESQ": 3.85, "STOI": 0.96},
  ...
  {"Voice": "Ella", "Language": "ja", "MOS": 4.19, "WER": 0.038, "PESQ": 3.78, "STOI": 0.95}
]&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이게 된다는 건 시트에 있는 내용을 내 코드로 가져오거나, 과거의 시트를 가져와 데이터를 분석할 때도 용이하다는 뜻입니다. 내용이 너무 길어져 예시를 더 가져오진 못했지만, 핵심은&lt;strong&gt;“시트의 세부적인 내용을 반복해서 수정할 수 있고, 조건부 서식과 수식을 손쉽게 적용할 수 있을 뿐 아니라, 시트 데이터를 JSON 형식으로 언제든 추출할 수 있다”&lt;/strong&gt;라는 점입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;지금 보여드린 기능은 그야말로 새발의 피에 불과합니다. 현재 제 실무에서는 이보다 훨씬 더 많은 데이터와 복잡한 수식, 그리고 차트까지 한꺼번에 다루고 있습니다. 이 도구가 어디까지 해낼 수 있을지 저도 감이 오지 않는 상태입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다음으로 스프레드시트만큼이나 자주 쓰는 도구가 구글 캘린더(Calendar)인데요. 이 캘린더 역시 gws CLI로 사용할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;Google Calendar 사용&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;저희 회사에서는 Google Calender를 통해 회의를 잡고, 회의실을 추가하는 용도로 사용합니다. 또 개인적인 용무, 바쁨 상태를 Calendar에 추가하여 방해 금지 모드로 사용하는 경우도 있습니다. Calendar에 회의를 초대하는 부분이 가장 어려운 지점인데요. 회의에 참여하시는 분들의 빈 일정을 각각 확인하고, 그 시간에 비어 있는 회의실까지 찾아야 합니다. 인원이 적으면 괜찮지만, 회의 참석 인원이 많아지면 더 어려워지죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리고 도저히 위 조건들이 안 맞을 때도 충분히 있습니다. 그러면 특정 분께 기존 일정을 좀 옮겨주실 수 있냐고 부탁드리면서 겨우 회의를 잡습니다. 하지만 gws CLI와 AI 에이전트가 함께하면 이 복잡한 과정도 전혀 두렵지 않습니다. 예시를 보시죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;❯ 내일 성현님과 현승님이랑 스트리밍 관련해서 sync 업을 해야합니다. 
빈 회의실을 찾고, 빈 시간을 찾아서 후보지를 알려주세요.&lt;/code&gt;&lt;/pre&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;⏺ 내일 일정과 회의실 정보를 확인하겠습니다.
⏺ 내일(3/11) 세 분의 일정과 회의실 예약 현황을 분석했습니다.
  참석자 일정 요약
  추천 후보
  후보 1: 13:00 - 14:00 (1시간)
She
  - 성현님 사무실 도착 직후, 세 분 모두 비는 시간
  - 빈 회의실:
    - HQ-5-Turing (5인)
    - HQ-5-Moon (4인)
    - HQ-5-Venus (6인)
  후보 2: 16:00 이후 (오후 늦은 시간)
  - 현승님 MADI 미팅 이후, 세 분 모두 비는 시간
  - 빈 회의실:
    - HQ-5-Turing (5인)
    - HQ-5-Earth (4인)
    - HQ-5-Sun (6인)
  ---
  참고: 성현님이 오전엔 재택이라 오후에만 오프라인 미팅이 가능합니다. 
  13:00-14:00 + Turing/Moon 조합이 가장 깔끔해 보입니다. 
  원하시는
 후보를 선택해주시면 캘린더에 일정을 잡아드리겠습니다.&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 바로 에이전트가 어느 회의실을 잡아야 할지, 어떤 후보가 좋을지 빠르게 파악했습니다. 이 회의는 30분이면 충분한 안건이었는데, 오후 4시에 진행하면 모든 분들의 업무 흐름이 끊길 것 같더군요. 그래서 오후 1시 30분부터 2시까지, 3인 기준으로 'Moon 회의실'을 잡아달라고 에이전트에게 요청했고, 손쉽게 회의를 예약할 수 있었습니다.&lt;br&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;Gmail 사용기&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;저는 주로 스프레드시트와 캘린더를 많이 쓰고 다른 기능은 크게 사용하지 않는 편인데요. 이번에는 실험 삼아, '오랫동안 나를 괴롭히던 문제로부터 해방될 수 있을까?' 하는 생각으로 Gmail도 한번 테스트해 보았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;제 오랜 고민은 바로 '자주 보지는 않지만 꾸준히 날아오는 메일'을 필터링하는 것이었습니다. 이 메일들이 받은 편지함에 쌓이지 않게 걸러내어 불필요한 알림을 차단하고 싶었죠. (예를 들면, 타입캐스트 정기 업데이트나 데이터독(Datadog)의 시스템 이메일 알림 같은 것들입니다.) 그런데 놀랍게도 이 역시 에이전트를 통해 처리할 수 있었습니다. 어떻게 해결했는지 예시를 한번 보시죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;❯ 'Datadog' via dev도 필터링되면 좋겠습니다.&lt;/code&gt;&lt;/pre&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;⏺ Bash(# Create filter for Datadog via dev
      gws gmail users settings filters create --params '{"userId":"me"}' --json '{…)
  ⎿  {
       "action": {
         "addLabelIds": [
     … +12 lines (ctrl+o to expand)
⏺ Bash(# Find and batch process existing Datadog via dev emails
      gws gmail users messages list --params '{"userId":"me","q":"from:dev@neosapience.com subject:Datadog","…)
  ⎿  Done
  ⎿  (timeout 1m)
⏺ 완료했습니다.
  - 필터 추가: from:dev@neosapience.com + subject:Datadog → Datadog 라벨 + 아카이브
  - 기존 메일 정리: 기존에 쌓여있던 Datadog via dev 메일도 전부 라벨링 + 아카이브 처리
  이제 직접 오는 Datadog(dtdg.co)과 dev 그룹 경유 Datadog 둘 다 자동으로 필터링됩니다.&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3804/5.webp"&gt;&lt;figcaption&gt;빈번하게 오는 잘 보지 않는 메일의 라벨을 붙여 알람이 안 오게 하기&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;메일함이 늘 데이터독(Datadog) 알림과 정기 업데이트 소식에 파묻혀 있어, 중요한 메일을 놓칠 때가 많았습니다. 이상하게 알림 설정을 꺼두어도 계속 메일이 날아오더라고요. 나름 오랜 숙원 사업이었는데, 덕분에 1년 반 동안 고통받던 것에서 해방될 수 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;구글 프레젠테이션(Google Slides) 활용기&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;여기서 순전히 호기심이 발동해, gws CLI와 AI 에이전트의 조합이 과연 어디까지 해낼 수 있는지 추가로 실험해 보았습니다. Opus 4.6의 성능이 어느 정도인지도 궁금했거든요. &lt;span style="color:#757575;"&gt;(이 글이 쓰여진 26년 4월 기준, 현재는 Opus 4.8까지 나옴)&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;구글 슬라이드도 잘 만들고 수정할 수 있는지 테스트해 보았습니다. 당장 필요한 PPT는 없었기에, Opus 4.6에게 이렇게 주문했습니다. “혹시 아무 주제나 좋으니, 슬라이드를 구성해서 발표가 가능할 정도로 PPT 내용을 채워줄 수 있나요? 창의성을 마음껏 뽐내봅시다.”라고 했더니, 뭔가 뚝딱 만들어줬습니다. 그리고 결과물을 보고 꽤나 놀랐죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3804/6.webp"&gt;&lt;figcaption&gt;디자인 감각이 저보다 낫네요.&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;딱히 오류라고 볼 만한 게 없을 정도로 너무 깔끔하게 프레젠테이션을 만들어냈습니다. 디자인마저 제가 직접 만든 것보다 나았고요. 심지어 "두 번째 페이지에 있는 올림푸스산 관련 내용을 좀 더 재미있게 바꿔달라"고 요청해 보았는데요. 전체 틀을 깨지 않고, 그 부분만 정확하게 수정하는 것 역시 가능했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;문득 'Sonnet 4.6에서도 이만큼 잘 해낼 수 있을까? 아니면 Gemini나 GPT 5.4 같은 다른 모델들은 얼마나 더 잘할까?' 하는 호기심이 생겼습니다. 마침 Sonnet 4.6은 당장 테스트해 볼 수 있는 환경이었기에, 똑같은 프롬프트로 시켜보았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3804/7.webp"&gt;&lt;figcaption&gt;이 발표 자료로 발표하면 망해버릴지도 모르겠네요.&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Sonnet 4.6은 프레젠테이션 서식의 전반적인 통일성은 잘 유지했으나, 다양성이 다소 부족하고 단순히 글자를 나열하는 수준에 그쳤습니다. 확실히 모델 간의 성능 차이가 드러나는 부분이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마무리하며&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;위 실험들은 모두 Claude 4.6 Opus에서 진행되었습니다. 앞으로 Gemini Pro나 GPT 같은 타사 모델에서는 또 어느 정도의 퍼포먼스를 보여줄지 무척 기대됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;아마 Sonnet 4.6과 Opus 4.6을 간단하게 비교했을 때, 퀄리티 차이가 드러난 걸 보면 꽤 재밌는 비교가 될 것 같습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3804/8.webp"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;최근 LLM들은 에이전트로서 얼마나 자율적이고 정밀하게 동작하는지 평가하는 '에이전틱(Agentic) 벤치마크'를 앞다투어 추가하고 있습니다. 실제로 Sonnet 4.6 출시 당시에도 이러한 &lt;a href="https://www.anthropic.com/news/claude-sonnet-4-6"&gt;에이전틱 벤치마크 성과&lt;/a&gt;를 주요 지표로 내세우기도 했죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;터미널에서 작업을 수행하거나, 스프레드시트를 조작하고, 프레젠테이션을 생성·편집하는 등 컴퓨터를 직접 제어하는 능력을 평가하는 것입니다. 실제로 구글 스프레드시트 API 호출 능력을 측정하는 &lt;a href="https://github.com/sambanova/toolbench"&gt;&lt;u&gt;ToolBench&lt;/u&gt;&lt;/a&gt;, 스프레드시트 조작 능력을 평가하는 &lt;a href="https://spreadsheetbench.github.io/"&gt;&lt;u&gt;SpreadsheetBench&lt;/u&gt;&lt;/a&gt;, 슬라이드 편집 능력을 평가하는 &lt;a href="https://github.com/KyuDan1/Talk-to-Your-Slides"&gt;&lt;u&gt;TSBench&lt;/u&gt;&lt;/a&gt;&amp;nbsp;같은 벤치마크가 이미 존재합니다. 이러한 벤치마크가 존재하면 모델을 개선할 때 이를 반영하게 되므로, 성능은 더 좋아질 수밖에 없습니다. 앞으로의 발전이 더욱 기대되는 이유입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;a href="https://www.outsourcing.co.kr/news/articleView.html?idxno=202046"&gt;에이전트 통합업체 AI 벤처 스튜디오 조사에 따르면&lt;/a&gt;, 전 세계 인구의 84%는 아직 AI를 한 번도 써본 적이 없으며, 유료 사용자는 0.3%, AI로 실제 시스템을 구축하는 사람은 0.04%에 불과하다고 합니다. 지금 AI가 주는 생산성을 제대로 누리고 있는 사람은 사실상 일부 개발자뿐인 셈입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞으로 gws CLI 같은 도구가 더 많아지고 AX가 자리 잡아서, 개발자가 아닌 일반 사용자도 자연어 한 줄만으로 이러한 생산성을 체감할 수 있는 날이 하루빨리 오기를 기대해 봅니다.&lt;/p&gt;&lt;hr&gt;&lt;p&gt;&amp;lt;원문&amp;gt;&lt;/p&gt;&lt;p&gt;&lt;a href="https://monday9pm.com/gws-cli-claude-code-%EC%82%AC%EC%9A%A9%EA%B8%B0-9b8749b2934d"&gt;gws CLI + Claude Code 사용기&lt;/a&gt;&lt;br&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>바이브 코딩을 만난 1년, 40대 비개발자에게 일어난 일들</title><link>https://yozm.wishket.com/magazine/detail/3803</link><description>2025년 4월의 어느 평일 밤이었습니다. 육아를 마치고 책상에 앉아, 처음 맡은 외주 작업의 에러 메시지를 한참 동안 멍하니 보고 있었습니다. 영어로 길게 늘어선 그 메시지를 그대로 AI에 붙여 넣고, 한 줄씩 다시 물어보며 새벽을 보냈습니다. 그때 마음 한편에는 ‘이게 정말 될까?’ 하는 의심이 있었지만, 다른 한편에는 ‘죽이 되든 밥이 되든 일단 끝까지 한번 해보자’는 생각이 더 컸습니다. 솔직히 말하면, 저도 이 목록을 다시 읽을 때마다 좀 얼떨떨합니다. 그래서 이 글은 자랑이 아니라, 평범한 40대 직장인이 AI를 만나서 겪게 된 1년 동안의 변화를 기록으로 적어 보려고 합니다. 평범한 누구나 AI를 통해 많은 것들을 이룰 수 있다는 경험을 나누고자 합니다.  </description><guid>https://yozm.wishket.com/magazine/detail/3803</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1년 전의 저는 지금의 저를 믿지 못했을 겁니다&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;2025년 4월의 어느 평일 밤이었습니다. 육아를 마치고 책상에 앉아, 처음 맡은 외주 작업의 에러 메시지를 한참 동안 멍하니 보고 있었습니다. 영어로 길게 늘어선 그 메시지를 그대로 AI에 붙여 넣고, 한 줄씩 다시 물어보며 새벽을 보냈습니다. 그때 마음 한편에는 ‘이게 정말 될까?’ 하는 의심이 있었지만, 다른 한편에는 ‘죽이 되든 밥이 되든 일단 끝까지 한번 해보자’는 생각이 더 컸습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그렇게 한 건, 또 한 건. 거창한 계획 없이 맡은 일을 하나씩 끝내다 보니 1년 사이 진행한 외주 작업이 어느덧 120건을 넘어가 있었습니다. 처음부터 뚜렷한 성과를 목표로 세웠던 것은 아닙니다. 다만 그날 밤의 에러 메시지를 끝까지 풀어보고 싶었고, 맡은 일을 가능한 한 책임지고 마무리해 보고 싶었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;돌아보면 그 작은 시작은 예상보다 멀리 갔습니다. &amp;nbsp;현재 외주 누적 매출은 5,000만 원을 넘었습니다. 요즘IT에 첫 기고를 했고, 카카오 AI TOP 100 Finalist에 선정됐으며, 두 번의 해커톤에서 연속으로 대상을 받았습니다. 카카오 AI 앰버서더로 활동하게 됐고, 책도 출간했습니다. 그리고 최근에는 본업의 방향까지 바꾸기 시작했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3803/image5.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;솔직히 말하면, 저도 이 목록을 다시 읽을 때마다 좀 얼떨떨합니다. 1년 전의 저는 이 중 단 하나도 자신 있게 그릴 수 없는 사람이었습니다. 그래서 이 글은 자랑이 아니라, 평범한 40대 직장인이 AI를 만나서 겪게 된 1년 동안의 변화를 기록으로 적어 보려고 합니다. 평범한 누구나 AI를 통해 많은 것들을 이룰 수 있다는 경험을 나누고자 합니다.&amp;nbsp;&amp;nbsp;&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI가 가져다준 새로운 능력: 바이브 코딩&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;제가 처음 AI를 만났을 때는 ChatGPT에게 미래 직장 생활에 대한 두려움을 털어놓고 있었습니다. 단순 상담으로 시작해 점차적 업무적인 질문으로 넘어가게 됐습니다. 그리고 GPT가 알려주는 대로 VS Code를 설치하고, 코드를 복사 붙여넣기 하면서 첫 번째 간단한 업무 자동화 프로그램을 만들었습니다. 이게 저의 첫 바이브 코딩 경험이었고, 제 인생을 바꾸게 될 줄은 상상하지 못했습니다.&amp;nbsp;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;지금도 내가 무언가를 컴퓨터로 만들어낼 수 있다는, 그때의 벅찬 기분을 기억하고 있습니다. 아이디어를 현실로 옮길 수 있다는 것, 그리고 그걸 빠르게 구현할 수 있다는 점 때문에 저는 바이브 코딩에 흠뻑 빠지게 되었습니다. 그러면서 제 업무뿐 아니라, 동료들의 아이디어를 받아 간단한 자동화 프로그램을 만들어 배포하는 경험까지 하게 되었죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;회사 밖에서도 내 기술이 통할까? 외주 개발 도전&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;나와 동료들의 자동화 도구를 만들다 보니, 문득 회사 밖에서도 이게 통할지 궁금해졌습니다. 거창한 포부는 아니었습니다. 단돈 1만 원이라도 누군가 내 결과물에 값을 치른다면, 그건 제 기술이 회사 안에서만 쓸모 있는 게 아니라는 증거가 될 것 같았습니다. 그래서 늦은 밤 아이를 재우고 노트북을 열어, 외주 플랫폼에 조심스럽게 상품을 하나 등록했습니다. 그렇게 한 건, 또 한 건 맡다 보니 어느새 1년이 지나 있었습니다. 돌아보니 작업은 120여 건을 넘었고, 누적 매출도 5,000만 원을 넘어서 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;매출보다 더 뿌듯한 것은 지금까지 유지하고 있는 평점 5.0점입니다. 바이브 코딩으로 만든 결과물도 회사 밖 고객 앞에서도 충분히 통한다는 걸, 이 점수가 말해 준다고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3803/image1.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;경험이 쌓이면서 저만의 노하우가 생겼고, 문제를 바라보는 시각도 넓어졌습니다. 그리고 이 경험은 회사 밖에만 머물지 않았습니다. 다시 회사 안으로 돌아와, 안과 밖에서 동시에 성과를 내는 선순환을 만들어 줬습니다. 덕분에 사내에서도 규모 있는 프로젝트들을 단독으로 맡게 되었고, 이 이야기들은 훗날 이직 과정에서 중요한 포트폴리오가 되었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;경험을 글로 옮겨 봤더니: 작가 활동 시작&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;2025년 10월, 그 경험을 처음 글로 옮겼습니다. 요즘IT의 첫 기고였습니다. 그전까지 저는 다른 사람의 콘텐츠를 '소비하는 사람'이었습니다. 그런데 막상 제 시행착오를 정리해 보니, 누군가에게는 그 어설픈 기록도 참고가 될 수 있었습니다. "40대 비개발자도 이렇게 시작할 수 있구나"라는 댓글을 보면서, 처음으로 내 경험도 누군가에게 도움이 될 수 있겠다고 생각했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3803/image4.png"&gt;&lt;figcaption&gt;요즘IT에 기고한 글들 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;글이 누군가에게 닿는 경험은 생각지 못한 곳으로 이어졌습니다. 카카오톡 오픈채팅방에서 사람들과 바이브 코딩 경험을 나누던 무렵이었습니다. 그곳에는 바이브 코딩으로 수익을 내고 싶어 하는 분이 많았지만, 정작 실제로 돈을 벌어 본 사람은 드물었습니다. 지금도 그렇지만 당시에는 더욱 희귀한 경험이었죠. 그래서였는지, 제가 외주 경험을 풀어놓을 때마다 사람들의 관심이 모였습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러던 어느 날, 그 방에서 제 이야기를 지켜보던 한 출판사 편집자분이 먼저 연락을 주셨습니다. 책을 한번 써 보지 않겠냐는 제안이었습니다. '언젠가 내 이름으로 된 책 한 권 내보고 싶다'는 막연한 꿈은 있었지만, 그게 IT 서적이 될 줄, 그것도 이렇게 찾아올 줄은 상상도 못 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;바깥에서 나를 알아봐 주기 시작했다: 대외 활동&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3803/image2.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 글과 책으로 분에 넘치는 기회가 이어졌지만, 사실 마음 한편에는 비개발자인 내가 이런 기회를 누려도 되는 걸까 하는 의심이 늘 있었습니다. 그 무렵 카카오가 주최한 AI 경진 대회 AI TOP 100 Finalist에 선정됐습니다. 그 의심을 다 지워 준 건 아니지만, 적어도 내가 여기 있어도 되겠다는 작은 자신감 하나는 생겼습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러자 이번엔 내가 어느 정도 위치인지 제대로 확인해 보고 싶어졌습니다. 그렇게 참가한 두 번의 해커톤에서 연속으로 대상을 받았습니다. 첫 번째 대상은 솔직히 운이 좋았다고 생각했습니다. 그런데 두 번째 대상을 받고 나니, 이게 우연만은 아닐 수도 있겠다는 마음이 들었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;돌아보면 해커톤은 제가 해 오던 일과 묘하게 닮아 있었습니다. 주최자의 기획 의도와 주제, 평가 기준을 읽고 무엇을 만들지 정하는 일은 회사에서 늘 하던 기획 업무와 비슷했고, 짧은 시간 안에 문제를 정의하고 빠르게 만들어 내는 일은 외주 개발로 이미 몸에 익은 것이었습니다. 거기에 바이브 코딩이 더해지니 좋은 결과로 이어졌습니다. 그러면서 AI 시대에는 나이가 약점이 아니라 오히려 강점이 될 수도 있겠다는 생각을 처음으로 하게 됐습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리고 2026년 3월, 카카오 AI 앰배서더가 되었습니다. 한 번의 대회 결과로 받는 상과 달리, 앰배서더는 제 경험을 꾸준히 나눠도 좋다고 인정받은 자리였습니다. 비개발자인 내가 여기까지 와도 되나 싶던 마음이, 그렇게 조금 더 가벼워졌습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3803/image3.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &lt;a href="https://www.kakaocorp.com/"&gt;&lt;u&gt;카카오 AI 앰배서더&lt;/u&gt;&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며: 방향과 속도가 달라진 1년&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;가장 예상하지 못한 변화는, 이 모든 일이 '부업'에서 끝나지 않았다는 점입니다. 작은 외주에서 시작한 실험이 글쓰기와 대외 활동, 해커톤을 지나 결국 본업의 선택지까지 넓혀 주었습니다. 1년 전의 저는 제 커리어가 이런 방향으로 움직일 수 있다는 걸 상상조차 하지 못했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 여전히 부족한 게 많습니다. 지금도 새로운 기술 앞에서는 머리가 복잡해지고, 낯선 에러 메시지를 보면 긴장하고, 중요한 결정 앞에서는 망설입니다. 1년이 지났어도 그건 별로 달라지지 않았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런데 딱 하나 달라진 게 있다면, 그 망설임 앞에서 '일단 해보자'고 노트북을 여는 일이 더 이상 두렵지 않다는 겁니다. 외주도, 글도, 대회도, 이직도 다 그렇게 시작됐습니다. 그리고 얼마 전, 집필 제안을 받은 지 6개월 만에 1년의 경험을 담은 한 권의 책이 세상에 나오게 되었습니다. 바이브 코딩과 외주 개발을 하며 부딪히고 배운 것들을, 1년 전의 저 같은 누군가에게 건네고 싶은 마음으로 정리했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;돌이켜보면 이 모든 변화가 제가 특별해서 일어난 일은 아니라고 생각합니다. 흔히 AI가 기업의 생산성을 끌어올린다고들 하지만, 그 힘은 기업만의 것이 아니었습니다. 평범한 개인도 향상된 생산성을 무기로, 1년 전이라면 엄두도 못 냈을 일들을 해낼 수 있는 시대가 됐습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;혹시 'AI가 나를 어디까지 바꿔 줄까' 의심스러운 분이 계시다면, 평범한 제 이야기가 작은 증거가 될 수 있을 것 같습니다. 거창한 목표는 아직 없어도 괜찮습니다. 회사에서 매주 반복하는 작업 하나, 머릿속에만 있던 작은 도구 하나, 이번 주 안에 끝낼 수 있는 어설픈 시도 하나면 충분합니다. 그다음 장면이 어떻게 이어질지는 저도 잘 모릅니다. 다만 1년 전의 저처럼, 일단 한번 시작해 보시길 권하고 싶습니다.&lt;/p&gt;&lt;hr&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;[이벤트 안내]&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;현재 골든래빗에서 이 글을 쓴 불혹의바이브코딩 작가님의 책 “요즘 바이브 코딩 커서 X 클로드 코드 실전 외주 돈 벌기” 서평 이벤트를 진행 중입니다. 관심 있으신 분들은 &lt;a href="https://goldenrabbit.co.kr/events/EVT_20260514_IntHv8"&gt;&lt;strong&gt;링크&lt;/strong&gt;&lt;/a&gt;를 통해 참여해 보세요!&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:60%;"&gt;&lt;a href="https://goldenrabbit.co.kr/events/EVT_20260514_IntHv8"&gt;&lt;img src="https://www.wishket.com/media/news/3803/unnamed__1_.png"&gt;&lt;/a&gt;&lt;figcaption&gt;&lt;a href="https://goldenrabbit.co.kr/events/EVT_20260514_IntHv8"&gt;서평 이벤트 참여하러 가기&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>AI 검색 엔지니어가 본 GEO: 무엇이 인용을 결정하는가</title><link>https://yozm.wishket.com/magazine/detail/3802</link><description>검색 엔진 엔지니어의 눈에는 명확한 사실이, 막상 GEO를 실행하는 실무자에게는 혼란스럽게 다가갑니다. 라이너 김윤기 엔지니어가 'AI 검색이 실제로 어떻게 도는가'라는 기술적 관점에서 GEO의 오해와 진실을 짚었습니다. 복잡한 질문을 키워드로 쪼개는 쿼리 팬아웃, 제목과 스니펫만 보고 본문을 가져올 문서를 추리는 선별, 그렇게 모은 정보로 인용을 다는 답변 생성까지. SEO는 GEO의 필요조건인지, 블랙햇·FAQ·AI 친화적 글쓰기는 진짜 통하는지, 6가지 질문에 엔지니어가 답합니다.</description><guid>https://yozm.wishket.com/magazine/detail/3802</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;김윤기 라이너 엔지니어 | GEO 팩트체크 세미나 '실제 살펴보는 GEO 오해와 진실' 세 번째 강연&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;이 &amp;nbsp;글은 2026년 5월 21일, 요즘IT가 라이너(Liner)의 후원을 받아 주최한 '&lt;/i&gt;&lt;/span&gt;&lt;a href="https://youtu.be/5u3yjszUDW8?si=Xdm1LunftA-COUz_"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;GEO 팩트체크 세미나&lt;/i&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;' 에서 세 번째 강연자로 나선 김윤기 라이너 엔지니어의 발표 내용을 1인칭 시점으로 정리한 글입니다.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;p style="text-align:justify;"&gt;안녕하세요. 저는 &lt;a href="https://liner.com?utm_source=blog&amp;amp;utm_medium=article&amp;amp;utm_campaign=yozm&amp;amp;utm_content=geo-logic"&gt;&lt;u&gt;라이너&lt;/u&gt;&lt;/a&gt;에서 검색 엔진 엔지니어로 일하고 있는 김윤기라고 합니다. 저는 SEO나 GEO를 전문적으로 하는 사람은 아니어서 실제로 SEO, GEO 하시는 분들이 어떤 일을 하시는지는 정확히 모릅니다. 그런데 주변에서 SEO, GEO를 실행해 보시다가 기술적으로 맞는지에 대해 질문을 많이 해 주셔서 알게 되는 것들이 있는데요. 엔지니어의 관점에서는 명확한 사실들이 업계 실무자들에게는 다소 혼란스럽게 다가가는 경우가 있는 것 같습니다. 그래서 오늘은 실제 '검색 엔진이 어떻게 돌아가는가'라는 기술적 관점에서 GEO에 대한 인사이트를 공유해 드리고자 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;본격적인 이야기에 앞서 저희 라이너를 짧게 소개해 드리자면, 전 세계 1,300만 명 이상의 사용자가 이용하는 AI 검색 서비스입니다. 전체 사용자의 95%가 해외 유저이며, 챗GPT처럼 대화형 검색 기능을 제공하면서도 '출처의 신뢰도'를 최우선으로 삼고 있습니다. 최근에는 정확한 출처를 필요로 하는 연구자들을 위해 특화된 자체 검색 엔진 'Liner Scholar'를 출시하기도 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3802/%EB%8B%A8%EB%9D%BD_%ED%85%8D%EC%8A%A4%ED%8A%B8__12_.png"&gt;&lt;figcaption&gt;라이너 김윤기 머신러닝 엔지니어 &amp;lt;출처: 요즘IT&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI 검색은 어떻게 동작하는가&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;기존 구글과 같은 전통적인 검색 엔진에서는 정보 획득을 위해 주로 '키워드'를 입력했습니다. 예를 들어 GEO와 SEO의 차이가 궁금하다면 보통GEO vs SEO라고 검색했을 것입니다. 기존에는 이렇게 키워드로 검색해 나온 URL들을 사용자가 직접 클릭하고 정보를 취합해 인사이트를 도출해야 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 AI 검색 엔진에서는 다릅니다. 사용자는 “GEO와 SEO의 차이가 무엇이고, GEO를 위해 어떤 액션을 취할 수 있을까?”처럼 복잡한 서술형 질문을 던집니다. AI 검색 엔진은 이 과정을 대신 수행해 사용자에게 최종적인 인사이트를 바로 제공합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;초기 AI 검색 시장에서는 여전히 키워드 위주의 검색이 많았지만, 점차 서술형 프롬프트 입력이 주류가 되고 있습니다. 그렇다면 AI 검색 엔진은 이러한 복잡한 입력을 어떻게 이해하고, 검색을 수행하여, 답변을 생성할까요? 그 과정을 크게 3단계로 나누어 보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1단계: 쿼리 분해&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;복잡한 서술형 쿼리가 들어오면, AI는 이를 키워드 기반의 여러 쿼리로 잘게 쪼갭니다. 이를 앞선 강연에서도 언급된 '쿼리 팬아웃'이라고 합니다. 하나의 유저 쿼리를 해결하기 위해 AI가 질문을 다각도로 나누고, 이를 기존 서치 엔진에 각각 검색합니다. 쿼리가 3개로 나뉘었다면 검색을 세 번 수행해 결과를 모으는 것입니다. 유저의 서술형 질문을 그대로 검색하지 않는 이유는, 현재 우리가 활용하는 기존 서치 엔진들이 철저히 '키워드 기반'으로 최적화되어 있기 때문입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3802/%EA%B2%80%EC%83%89%EC%97%94%EC%A7%841.png"&gt;&lt;figcaption&gt;AI 검색 엔진은 사용자의 복잡한 서술형 쿼리를 키워드 기반의 입력으로 바꾸어 검색 엔진(Search Engine)에 여러 번의 검색을 수행한다. &amp;nbsp;이렇게 서술형 쿼리를 키워드 기반의 여러 쿼리로 잘게 쪼개는 것을 ‘쿼리 팬아웃’이라고 한다. &amp;nbsp;&amp;lt;출처: &amp;nbsp;‘GEO 팩트체크’ &amp;nbsp;세미나에서 진행된 라이너 김윤기 엔지니어의 ‘AI 검색엔진이 콘텐츠를 선택하는 법’ 발표자료&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2단계: 검색 결과(SERP)에서 스니펫 보기&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;그렇게 해서 각 검색 결과물을 가져옵니다. 그런데 각 쿼리에 대한 검색 결과를 가져오더라도 AI가 모든 문서의 본문을 다 읽는 것은 아닙니다. 우선 검색 결과 페이지에 노출되는 '제목'과 짧은 설명인 '스니펫(Snippet)'만을 읽어옵니다. 구글에서 검색하면 검색 페이지의 제목과 그 아래에 짧은 설명 한두 줄 정도가 나오는데요, 그걸 스니펫이라고 합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;제목과 스니펫을 가져온 다음에, AI가 검색 결과 상위 10개~30개 정도를 보고, 그중에서 유저의 쿼리를 해결하는 데 도움이 될 것 같은 일부 문서들을 3개~5개 선별합니다. 그렇게 선택된 소수의 문서에 크롤러를 보내서 실제 본문을 가져옵니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3802/%EA%B2%80%EC%83%89%EC%97%94%EC%A7%842.png"&gt;&lt;figcaption&gt;쿼리 팬아웃을 통해 검색하고, 그렇게 검색 페이지에 노출되는 '제목'과 '스니펫'을 가져와 검색 결과 상위 10~30개 정도를 본 뒤 그중 3~5개 문서를 선별해 크롤러를 보내 실제 본문을 가져온다. &amp;nbsp;&amp;lt;출처: &amp;nbsp;‘GEO 팩트체크’ &amp;nbsp;세미나에서 진행된 라이너 김윤기 엔지니어의 ‘AI 검색엔진이 콘텐츠를 선택하는 법’ 발표자료&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3단계: AI가 답변 생성 + 인용 달기&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이제 제목과 스니펫, 그리고 그중에서 선별해 가져온 본문 정보를 잘 이용해서, AI가 최종적으로 인용을 포함한 답변을 만들어냅니다. 이것이 AI 검색 엔진의 전체적인 흐름이라고 할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;왜 모든 문서가 아니라 일부 문서에서만 본문을 가져오는지 의문이 들 수 있습니다. 그건 AI에게 입력을 넣어줄 수 있는 길이(Context Window)에 한계가 있기 때문입니다. 그래서 정말 유용하다고 판단되는 것만 본문을 가져와서 AI에 넣어주는 것입니다. 그리고 그 본문을 선택하기 위해서는 제목과 스니펫을 보는 것이죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 가져온 정보들을 가지고 AI가 답변을 써 내려갈 때, 인용을 달게 되는데요. 이는 사람이 글을 쓰는 방식과 동일합니다. 특정한 주장을 할 때 그 근거가 되는 문장이 포함된 문서를 가져와 출처를 밝히는 것입니다. AI도 마찬가지입니다. 그래서 스니펫만 노출되는 것보다 본문 전체가 AI에게 읽혀야 실제 인용으로 이어질 확률이 높아집니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;스니펫만 보고 인용하기는 어렵고, 본문을 봐야 인용할 가능성이 높아지는 것이죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3802/%EA%B2%80%EC%83%89%EC%97%94%EC%A7%843.png"&gt;&lt;figcaption&gt;AI 검색엔진은 위 1~2단계, 즉 쿼리 팬아웃을 통한 제목, 스니펫 정보를 기반으로 선별을 통해 가져온 본문 정보를 이용해 답변을 생성한다. &amp;lt;출처: &amp;nbsp;‘GEO 팩트체크’ &amp;nbsp;세미나에서 진행된 라이너 김윤기 엔지니어의 ‘AI 검색엔진이 콘텐츠를 선택하는 법’ 발표자료&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI 검색 엔진 원리로 풀어보는 GEO 오해와 진실&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;기본적인 흐름을 설명했으니, 이제 많은 분들이 갖고 계신 의문에 대해서 답해 보려고 합니다. 오늘 GEO 팩트체크 세미나의 패널 토크에서 모더레이터로 참여하시는 라이너 콘텐츠 리드를 통해서 미리 질문을 받았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Q1. 사이트 속도, 렌더링 전략, 전통적인 SEO 시그널이 GEO에서도 중요한가요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;네, 중요합니다. 앞서 설명드린 AI 검색 엔진의 흐름을 떠올려봅시다.AI는 쪼개진 키워드 쿼리를 기반으로 기존 검색 엔진의 결과를 활용합니다. 즉, 일단 상위 10~20위권 내에 노출(SEO)이 되어야만 AI가 제목과 스니펫을 읽을 기회조차 얻을 수 있습니다. 그렇기 때문에 SEO가 안 되어 있으면 GEO도 당연히 안 된다, 이것이 당연한 사실이라고 보시면 될 것 같습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;즉 AI 검색이 기존의 서치 엔진을 그대로 이용하기 때문에, SEO에서 유효했던 전략은 여전히 유효하다고 할 수 있습니다. 다만 SEO가 충분조건은 아니고, 필요조건이라고 이해해 주시면 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3802/%EA%B2%80%EC%83%89%EC%97%94%EC%A7%844.png"&gt;&lt;figcaption&gt;AI 검색 엔진의 작동 방식을 고려했을 때, 사이트 속도나 렌더링 전략 등 기존 SEO에서 유효했던 전략은 GEO에서도 유효하다 &amp;nbsp;&amp;lt;출처: &amp;nbsp;‘GEO 팩트체크’ &amp;nbsp;세미나에서 진행된 라이너 김윤기 엔지니어의 ‘AI 검색엔진이 콘텐츠를 선택하는 법’ 발표자료&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Q2. GEO에서 그레이햇(Gray-hat)이나 블랙햇(Black-hat) 기법이 실제로 작동하나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;일부는 작동하는 것도 있고, 일부는 그렇지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;우선 Prompt traffic abuse 기법은 작동하기 어렵습니다. 같은 프롬프트를 AI에 계속 입력해서 AI에 노출되게 하겠다는 기법인데요. 검색 엔진에서 똑같은 검색어를 날려서 우리 사이트를 상단에 노출시키겠다는 기법과 같은 것이죠. 이건 작동하기 어렵습니다. 하지만 AI가 어떤 콘텐츠를 인용할지 결정하는 데는 사용자 트래픽 규모가 영향을 주지 않습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;반면, 페이지 중간에 AI만 읽을 수 있도록 숨겨진 지시어를 넣는 ‘HTML Injection’ 방식은 당장은 통할 수도 있습니다. 하지만 LLM 모델과 탐지 기법은 지금 이 순간에도 비약적으로 발전하고 있습니다. 한때 챗GPT가 폭탄 만드는 법도 친절하게 알려주던 시절이 있었지만 지금은 철저히 막힌 것처럼요. 이런 꼼수들은 조만간 무력화될 가능성이 높으니 아까운 리소스를 낭비하지 않으셨으면 좋겠습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Q3. 페이지 내 위치에 따른 인용의 차이가 있나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;네, 위치가 꽤 중요합니다. 두 가지 측면에서요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;첫째,&lt;/strong&gt; 앞서 강조했듯 AI가 본문을 읽을지 말지 결정하는 기준은 &lt;strong&gt;제목과 스니펫&lt;/strong&gt;입니다. 검색 결과에 노출되는 텍스트가 AI에게 '이 페이지에 유용한 정보가 있다'는 확신을 줄 정도로 매력적이어야 합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;둘째,&lt;/strong&gt; 본문을 가져온다고 해도 전부 다 가져오지는 않습니다. 본문 길이가 너무 길면 전부 다 가져올 수 없어서, 앞에서부터 적당히 잘라서 가져오게 됩니다. 그래서 중요한 정보는 &lt;strong&gt;앞쪽, 페이지 상단에 두는 게 유리합니다.&amp;nbsp;&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Q4. FAQ 형식이 효과적이라고 하던데, 진짜인가요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;콘텐츠의 측면에서는 맞습니다. FAQ 형식 자체가 AI가 인용하기 정말 좋은 형태인 건 사실입니다. 저희 회사의 FAQ를 예로 들어 보겠습니다. “Liner, Liner Scholar, Liner Write는 무엇이 다른가요?’라는 질문이 있는데요. 어떤 유저가 “라이너 스콜라에 대해 설명해줘”라고 질문한다면, 이 FAQ에 있는 답변을 가져오기에 너무 좋은 형식입니다. 애초에 FAQ '특정 질문을 해결하기 위한 포맷'이기 때문이죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 형식적 측면에서는 그렇지 않습니다. 정보는 구체적이지 않은데 FAQ 형식만 도입하는 건 의미가 없습니다. FAQ 형식이 효과가 있다고 말씀드린 건 FAQ의 내용이 인용될 만한 콘텐츠를 많이 갖고 있기 때문에 효과적이라는 의미입니다. FAQ 형식 자체가 의미 있는 것은 아닙니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3802/%EA%B2%80%EC%83%89%EC%97%94%EC%A7%84FAQ.png"&gt;&lt;figcaption&gt;AI 검색 엔진의 작동 방식을 고려했을 때, FAQ 형식은 그것이 담고 있는 콘텐츠가 충분히 유용할 경우에 효과적이며, 콘텐츠가 충분하지 않은데 단지 그 형식만 차용할 경우에는 효과적이지 않다. &amp;lt;출처: &amp;nbsp;‘GEO 팩트체크’ &amp;nbsp;세미나에서 진행된 라이너 김윤기 엔지니어의 ‘AI 검색엔진이 콘텐츠를 선택하는 법’ 발표자료&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Q5. AI 친화적 글쓰기라는 게 있나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이 질문도 정말 많이 해 주시는데요. 두 가지 측면에서 말씀드릴게요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;먼저&lt;/strong&gt;콘텐츠 측면에서는 AI 친화적 글쓰기가 있을 수 있다고 말씀드리고 싶습니다.AI는 자기가 몰랐던 정보를 획득해서 유저에게 잘 전달하고 싶어 합니다. 따라서 &lt;strong&gt;정보량이 많고 구체적인 정보를 담고 있는&lt;/strong&gt; 콘텐츠를 인용할 가능성이 높습니다. 그리고 그 정보가 구체적이면 AI가 쓸 만한 게 많기 때문에 좋아할 수밖에 없습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;예를 들기 위해 ChatGPT와 라이너에 ‘벚꽃놀이 명소 추천해줘’라고 물었습니다. 두 엔진에서 ‘벚꽃놀이 명소 Best7’ 같은 콘텐츠가 많이 인용되는 것을 볼 수 있습니다. 제목에서부터 '이 페이지에 들어가면 최소한 7곳에 대한 정보를 얻을 수 있겠구나, 정보가 풍부하겠구나'라는 시그널을 주니 인용이 잘 된다고 할 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3802/%EA%B2%80%EC%83%89%EC%97%94%EC%A7%845.png"&gt;&lt;figcaption&gt;AI 검색 엔진의 작동 방식을 고려할 때, AI에 친화적인 특정한 형식이나 구조는 존재하지 않는다. 다만 구체적인 정보를 담고 있고, 또 정보량이 많은 페이지의 경우에는 AI 친화적일 수 있다. &amp;lt;출처: &amp;nbsp;‘GEO 팩트체크’ &amp;nbsp;세미나에서 진행된 라이너 김윤기 엔지니어의 ‘AI 검색엔진이 콘텐츠를 선택하는 법’ 발표자료&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;반면 형식이나 구조 측면에서는 ai 친화적 글쓰기란 게 없습니다.&lt;/strong&gt; 사실은 '무조건 없다'라기보다는 '없을 가능성이 있다' 혹은 '없어질 가능성이 높다'에 가깝습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 모델은 웹페이지에 있는 데이터를 학습합니다. 이때 학습에 많이 활용된 형식을 선호하게 됩니다. A라는 형식으로 쓰인 콘텐츠를 많이 학습했다면 애초에 그런 형식으로 쓰인 글을 좋아할 수밖에 없는 것이죠. 그와 달리 B형식을 많이 학습한 모델은 B를 좋아할 것입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런데 이는 모델이 새로 업데이트될 때마다 달라집니다. 최근 GPT, Gemini와 같은 모델들은 세 달 정도에 한 번씩 업데이트하고 있는데, 그럴 때마다 모델이 선호하는 형식이나 구조가 계속 바뀔 것입니다. 그리고 그것들이 어떤 형식이나 구조를 좋아하는지는 아무도 알 수 없어요. AI를 학습시키는 분들조차도 알기 어렵습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 형식·구조에 매달리기보다는 정보량이 많거나 구체적인 정보를 담고 있는 페이지를 만드는 것을 더 추천드립니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Q6. WebMCP를&amp;nbsp; 도입하면 GEO에 도움이 되나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;도움이 되지 않습니다. WebMCP는 에이전트가 웹사이트에 들어가서 장바구니에 물건을 담거나, 로그인을 하는 등 사람처럼 행동할 수 있게 해주는 도구입니다. AI 검색의 로직에 WebMCP가 끼어들 여지가 없습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;굳이 따지자면, 로그인해야만 볼 수 있는 페이지에 접근할 수 있게 해주는 정도인데요. GEO와 무관하다고 생각해도 무리 없습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;정리: AI가 우리 페이지를 인용하게 하는 방법&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;오늘 전달드리고 싶었던 내용을 바탕으로, AI가 우리 페이지를 인용하게 하는 방법으로는 딱 세 가지가 중요합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;서치 엔진 상위에 우리 페이지가 노출되어야 합니다.&lt;/strong&gt;즉 SEO에서 유용했던 전략은 여전히 중요하고, GEO에서의 필요조건이라고 할 수 있습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;AI가 우리 페이지의 제목과 스니펫을 보고 유용한 웹페이지로 인식해야 합니다.&lt;/strong&gt;즉 중요한 정보는 스니펫에 담아야 합니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;웹 페이지 본문의 정보가 다양하고 깊이 있어야 합니다.&lt;/strong&gt;즉 콘텐츠의 퀄리티가 더욱 중요한 시대라고 할 수 있습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 세 가지 말씀을 드리면서 세션은 마치도록 하겠습니다. 감사합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="media"&gt;&lt;oembed url="https://youtu.be/IKWNJjohYB8"&gt;&lt;/oembed&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#757575;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>클로드 코드를 떠나 오픈소스로 돌아간 이유</title><link>https://yozm.wishket.com/magazine/detail/3801</link><description>데모 마감 2시간 전, 치명적인 버그 앞에서 클로드 코드가 멈췄습니다. 사용 한도 초과, 4시간 후에 다시 시도하라는 메시지가 떴죠. 생계가 걸린 도구가 가장 필요한 순간에 작동하지 않는다면, 과연 그 도구를 믿을 수 있을까요? 예측하기 어려운 사용량 제한과 공지 없는 정책 변경에 지쳐 탈클로드를 결심한 엔지니어가, Ollama·DeepSeek·Qwen 3 Coder 같은 오픈소스 모델로 워크플로우를 다시 짜며 느낀 점을 썼습니다. 심상치 않은 탈클로드 코드 움직임과, 그 해결책으로 떠오르는 오픈소스 코딩 에이전트 활용법을 제 경험 기반으로 소개해보려 합니다.</description><guid>https://yozm.wishket.com/magazine/detail/3801</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;엔지니어들은 왜 다시 오픈소스로 회귀하는가?&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;클로드 코드&lt;span style="color:#757575;"&gt;(Claude Code)&lt;/span&gt;, 코덱스&lt;span style="color:#757575;"&gt;(Codex)&lt;/span&gt;와 같은 코딩 에이전트의 인기는 개발자나 바이브 코더들 사이에서 독보적입니다. 유행처럼 번지는 “이제 AI가 웬만한 신입 개발자보다 코딩을 잘한다”는 말 역시, 사실은 클로드의 Opus나 오픈AI의 GPT 같은 고성능 파운데이션 모델, 그리고 이를 기반으로 한 코딩 에이전트에 한정된 이야기 아닐까 싶습니다. 그만큼 다른 경쟁 제품과 비교해 성능이 압도적이고, 사용 경험도 편리합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저 역시 지난해 말 처음 클로드 코드를 접했을 때의 신선한 충격을 아직도 기억합니다. 무엇보다 VS Code나 IntelliJ 같은 코드 에디터에서 작동하는 Copilot 등과 달리 터미널에서 작동한다는 점이 매우 독특했습니다. 간단한 설치와 권한 부여만 마치면 자연어로 &lt;strong&gt;‘xxxx.py 파일의 124번째 줄 함수를 디버깅하고, main.py 파일에 통합해 줘.’&lt;/strong&gt;라고만 명령해도, 그런 섬세한 작업까지 수행할 수 있다는 점이 꽤 센세이셔널하게 다가왔습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그동안의 코딩 도구가 개발자의 생산성을 높여주는 ‘어시스턴트’에 머물렀다면, 클로드 코드는 ‘내 부하직원처럼 직접 코딩해주는 진짜 AI 에이전트’에 가까운 느낌이라고 할까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3801/image5.png"&gt;&lt;figcaption&gt;Claude code CLI &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앤트로픽은 저와 같은 클로드 코드 지지자들의 성원에 힘입어, 2026년 기준 연환산 매출 300억 달러&lt;span style="color:#757575;"&gt;(약 41조 원)&lt;/span&gt;를 넘어설 정도로 폭발적인 인기를 누려왔습니다. 그런데 최근 들어 개발자들 사이에서 클로드 구독을 취소하는, 이른바 ‘탈클로드’ 움직임이 빠르게 늘고 있다고 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;지금까지 입이 아플 정도로 클로드 코드의 장점을 이야기했지만, 사실 이 도구는 단점도 분명합니다. 가장 먼저 떠오르는 것은 막대한 토큰 소모량과 만만치 않은 가격입니다. 코덱스 같은 도구가 비교적 적은 소모량으로 인기를 얻었지만, 그 역시 본질적인 해결책은 아닙니다. 저 역시 이러한 문제로 탈 클로드를 결심했습니다. 그렇다면 대안은 있을까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이번 글에서는 심상치 않은 탈클로드 코드 움직임과, 그 해결책으로 떠오르는 오픈소스 코딩 에이전트 활용법을 제 경험 기반으로 소개해보려 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;엔지니어들의 탈클로드 러쉬&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;최근 개발자들이 자주 찾는 커뮤니티 레딧&lt;span style="color:#757575;"&gt;(Reddit)&lt;/span&gt;에서 눈에 띄는 스레드 하나를 발견했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;I am cancelling my Claude Pro subscription and here's my honest take.&lt;/i&gt;&lt;br&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;클로드 프로 구독 취소합니다. 솔직한 후기&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3801/image3.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Reddit r/PromptEngineering&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;댓글창은 비슷한 경험담으로 가득했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;나만 그런 게 아니었구나. 어제도 오전에만 제한이 3번 걸렸어.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;Pro 플랜인데 Free tier보다 못한 느낌. 농담 아니고.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;월 20달러 내면서 매일 ‘사용 한도 초과’ 보는 게 정상인가요?&lt;/li&gt;&lt;li style="text-align:justify;"&gt;방금 전환했습니다. DeepSeek + Ollama 조합. 솔직히 후회 없어요.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;한때 “클로드 없이 어떻게 개발해?”라고 말하던 개발자들이, 이제는 집단으로 ‘탈클로드’를 선언하고 있는 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 같은 엔지니어들의 탈클로드 움직임은 역설적으로 앤트로픽의 엄청난 성공에서 비롯됐습니다. 클로드 코드는 단순한 대화형 AI보다 훨씬 많은 컴퓨터 자원을 사용합니다. 파일을 읽고, 코드를 분석하고, 여러 파일을 동시에 수정하는 것은 물론 터미널 명령어까지 실행해야 하기 때문입니다. 사용자가 AI에 명령을 내릴 때마다 거대한 서버 자원이 쉬지 않고 돌아가야 하는 셈입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결국 앤트로픽은 불가피한 선택을 내렸습니다. 바로 사용량 제한&lt;span style="color:#757575;"&gt;(rate limit)&lt;/span&gt;을 대폭 강화한 것입니다. 그로 인해 Pro 플랜 사용자조차 하루 몇 시간만 집중적으로 작업하면 “사용 한도 초과” 메시지를 마주했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:50%;"&gt;&lt;img src="https://www.wishket.com/media/news/3801/image2_JIrUeed.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 인터넷 커뮤니티&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. 예측 불가능한 블랙박스&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이런 상황을 키우는 더 큰 문제가 있습니다. 사용량 기준이 완전히 불투명하다는 점입니다. 앤트로픽 지원팀에 “정확히 얼마나 쓸 수 있는 건가요? 요청 횟수, 토큰 수, 아니면 시간?”이라고 문의했을 때 돌아온 답변은 애매했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;“구체적인 한도는 공개하지 않습니다. 사용 패턴과 시스템 부하에 따라 달라질 수 있습니다.”&lt;/i&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결국 사용자는 언제 제한이 걸릴지 예측조차 할 수 없습니다. 똑같은 작업을 해도 어떤 날은 하루 종일 문제없지만, 어떤 날은 2시간 만에 막히기도 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 한 개발자의 실험 결과에 따르면, 중간 규모 프로젝트 리팩터링(refactoring)은 약 2시간 30분 후 제한이 걸렸고, 여러 파일을 수정하는 신규 기능 개발은 약 3시간, 버그 디버깅 작업은 약 4시간 후 제한에 도달했습니다. 풀타임으로 일하는 개발자라면, 점심시간도 오기 전에 소진되는 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저 역시 정확히 같은 문제를 겪었습니다. 데모 마감 2시간 전, AI 에이전트 데모에서 치명적인 버그를 발견했습니다. “괜찮아, 클로드한테 맡기면 10분이면 해결돼”라고 생각하며 코드 수정을 시작했는데, 불과 5분 만에 화면에 메시지가 떴습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;You've reached your usage limit. Please try again in 4 hours.&lt;/i&gt;&lt;br&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;사용 한도에 도달했습니다. 4시간 후에 다시 시도해주세요&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그 순간 머릿속이 하얘졌습니다. 결국 Gemini를 급하게 사용하고 Cursor로 보조한 다음, Stack Overflow를 뒤져가며 간신히 문제를 해결했습니다. 데모는 무사히 끝났지만, 그날 밤 한 가지를 깨달았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;제 생계가 걸린 도구가 가장 필요한 순간에 작동하지 않는다면, 과연 그 도구를 믿을 수 있을까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. 공지 없는 정책 변경&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;더 강한 결정타는 올해 2월 말 터졌습니다. 갑자기 같은 작업을 해도 이전보다 훨씬 빨리 제한이 걸리기 시작한 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;당시 어제까지 멀쩡하게 쓰던 프로젝트가 오늘은 2시간 만에 막혔다는 불만부터, 사전 공지도 없이 이런 변경을 하는 건 사실상 일방적인 계약 변경 아니냐는 항의까지 이어졌습니다. 하지만 지원팀에 문의한 사람들이 받은 답변은 “시스템 최적화”라는 모호한 설명뿐이었습니다. 트위터에서는 ‘#ClaudeLimits’ 해시태그가 트렌딩에 올랐고, 일부 사용자는 환불을 요구하기 시작했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3801/image6.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &lt;a href="https://www.reddit.com/r/Anthropic/comments/1sgomf6/its_happening_they_cut_the_usage_for_literally/"&gt;reddit r/Anthropic&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3. 무너진 비용 대비 가치&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;클로드 코드를 사용하려면 Pro는 월 20달러, Max는 월 100~200달러 수준의 구독료를 지불해야 합니다. 초기에는 클로드 코드가 가져다주는 생산성 향상이 이 비용의 가치를 충분히 증명했습니다. 많게는 하루 5~6시간씩 절약되는 시간을 시급으로 환산하면, 오히려 저렴한 투자처럼 느껴졌죠. 물론 지금도 여전히 클로드는 가성비가 좋은 편이라고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만, 불분명한 사용량과 빠르게 늘어나는 토큰 활용량으로 비용 대비 가치에 의문을 제기하는 목소리도 커지고 있습니다. 같은 돈을 내더라도 실제 사용 가능 시간은 줄어들고, 정작 가장 급한 순간에는 쓸 수 없는 상황이 반복되고 있기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;사실 이 정도 비용이면 클라우드 GPU 인스턴스를 빌려 사용량 제한 없이 오픈소스 모델을 실행할 수 있습니다. 더 나아가 중고 Mac mini를 구매해 로컬 환경에서 Ollama로 모델을 무제한 실행하는 선택지도 있죠. 결국 예측할 수 있으며 통제 가능한 비용 구조가, 오히려 더 합리적인 대안처럼 보이기 시작한 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앤트로픽은 무리한 서비스 확장 속에서 안정성과 예측 가능성이라는 가장 중요한 요소를 놓치고 있는지도 모릅니다. 클로드 코드의 불확실성에 지친 저는 자연스럽게 오픈소스 모델로 눈을 돌리게 됐습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;오픈소스 모델이 대안이 될 수 있을까?&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;솔직히 처음에는 회의적이었습니다. LLM 성능은 상당수 모델 크기에 좌우되는 만큼, SoTA 모델에 훨씬 못 미치는 오픈소스 모델이 과연 그만큼 잘할 수 있을까?라는 의구심이 쉽게 사라지지 않았기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 2026년 현재, 오픈소스 모델 진영의 발전 속도는 제 예상을 훨씬 뛰어넘고 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. 생각보다 좁혀진 성능 격차&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Meta의 Llama 3.1(405B), DeepSeek의 V3 모델, 그리고 Qwen 3 Coder 같은 오픈소스 모델은 적어도 벤치마크 기준으로는 상용 모델과의 성능 격차를 빠르게 좁히고 있습니다. 특히 코딩 특화 모델인 DeepSeek Coder V2와 Qwen 3 Coder는 HumanEval 벤치마크에서 Claude 3.5 Sonnet과 비교해도 뒤지지 않는 성능을 보여주고 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3801/image4.png"&gt;&lt;figcaption&gt;DeepSeek vs SOTA Models &amp;lt;출처: &lt;a href="https://www.bracai.eu/post/deepseek-performance"&gt;bracai&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 아직 Claude 4.5 Sonnet의 SWE-Bench Pro 점수에는 미치지 못합니다. 다만 그 격차가 점점 빠르게 줄어드는 분위기입니다. 벤치마크 기준으로 좀 더 살펴보면 다음과 같습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;DeepSeek Coder V2:&lt;/strong&gt; Claude 3.5 Sonnet과 유사한 수준입니다. 코딩 작업에서는 거의 동등한 성능을 보여줍니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;Qwen 3 Coder:&lt;/strong&gt; GPT-4 Turbo와 Claude 3 Opus 사이 정도의 성능입니다. 복잡한 코딩 작업도 대부분 처리할 수 있습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;Llama 3.1 70B:&lt;/strong&gt; GPT-3.5 Turbo나 Claude 3 Haiku 수준입니다. 기본적인 코딩 작업에는 충분하지만, 복잡한 로직에서는 다소 한계가 있습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 간단한 테스트를 진행해본 결과, 일상적인 코딩 작업에서는 DeepSeek Coder V2나 Qwen 3 Coder 같은 오픈소스 모델도 Claude 3.5 Sonnet 못지않게 충분히 실용적이었습니다. 함수 작성, 버그 수정, 코드 설명, 단위 테스트 생성 같은 작업에서는 체감상 큰 차이를 느끼기 어려웠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Llama 3.1 70B나 Mistral Large 같은 모델을 사용할 때는 분명한 한계도 있었습니다. 복잡한 로직을 설명할 때는 조금 더 명확한 지시사항이 필요했고, 여러 파일을 동시에 다루는 작업에서는 맥락(context)을 놓치는 경우도 있었습니다. 다만 프롬프트를 조금 더 세밀하게 작성하면, 대부분 원하는 결과를 얻을 수 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 복잡한 아키텍처 설계나 여러 파일에 걸친 대규모 리팩터링 작업에서는 여전히 클로드 계열이 우위에 있습니다. 이런 수준의 작업에서는 클로드 기반 모델의 뛰어난 추론 능력과 장문 맥락 처리 능력이 확실한 강점을 보여줍니다. 반면 오픈소스 모델은 때때로 복잡한 의존성을 놓치거나, 긴 요구사항을 정확히 따르지 못하는 경우가 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 현실의 개발 업무를 들여다보면, 일상적인 작업의 80~90%는 DeepSeek Coder V2나 Qwen 3 Coder 정도의 성능, 즉 Claude 3.5 Sonnet 수준으로도 충분히 처리할 수 있습니다. 반대로 Claude 4.5 Sonnet 수준이 꼭 필요한 작업은 나머지 10~20% 수준의 복잡한 업무에 가깝습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그렇다면 매일 모든 작업에 가장 강력한 모델을 써야 할까요? 아니면 대부분의 업무는 충분한 성능의 모델로 처리하고, 정말 필요한 순간에만 최고 성능 모델을 선택해야 할까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실무 관점에서 보면 후자가 훨씬 합리적입니다. 모든 작업에 안정적으로 활용할 수 없다면, 차라리 무제한 사용이 가능한 중급 성능 모델을 메인으로 사용하고, 정말 중요한 순간에만 클로드를 꺼내 쓰는 편이 더 효율적일 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. 다양해진 실행 옵션&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;과거에는 오픈소스 모델을 실행하려면 고가의 GPU 서버가 사실상 필수였습니다. 하지만 이제는 상황이 달라졌습니다. 생각보다 적은 컴퓨팅 자원만으로도 로컬 환경에서 충분히 실행할 수 있기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;대표적으로 Ollama 같은 도구를 사용하면 일반 노트북에서도 7B~14B 파라미터를 가진 모델을 쓸만한 속도로 구동할 수 있습니다. 32GB RAM 환경이라면 적절한 양자화(quantization)를 적용해 32B 모델까지도 무리 없이 돌아갑니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3801/image1.png"&gt;&lt;figcaption&gt;Ollama로 오픈소스 모델 활용하기 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;클라우드 GPU를 임대하는 방법도 있습니다. RunPod, Vast.ai 같은 서비스를 이용하면 시간당 약 0.5~1달러 수준으로 고성능 GPU를 빌릴 수 있습니다. 필요할 때만 켜고 끌 수 있어 비용 통제도 비교적 쉽습니다. 단순 계산으로 보면, 클로드 Pro 구독료(월 20달러) 수준의 비용으로 약 20~40시간 정도 GPU를 사용할 수 있는 셈입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;또한, 오픈소스 모델 호스팅 서비스를 활용하는 선택지도 있습니다. Groq이나 Together AI 같은 플랫폼은 클로드 API보다 훨씬 저렴한 가격으로 오픈소스 모델을 제공합니다. 특히 Groq은 초당 수백 토큰에 이르는 추론 속도를 제공하는 것으로 유명한데, 비용은 Claude API 대비 약 10분의 1 수준입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;게다가 Llama 같은 고품질 모델에 대해서도 사용량 제한이 Claude보다 훨씬 관대한 편입니다. 일부 모델은 사실상 제한 없이 사용할 수 있다는 점도 강점으로 꼽힙니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3801/image7.png"&gt;&lt;figcaption&gt;Groq의 거의 무제한에 가까운 사용량 &amp;lt;출처: &lt;a href="https://groq.com/groqcloud"&gt;Groq&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3. 진짜 장점은 자유와 통제권&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;제가 여러 오픈소스 모델을 다양한 방법으로 테스트하며 느낀 가장 큰 장점은 성능이나 가격이 아니었습니다. 바로 자유와 통제권입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;우선 이 방식에는 사용량 제한이 없습니다. 로컬에서 돌리든, 클라우드에서 돌리든 24시간 내내 원하는 만큼 쓸 수 있습니다. 급한 작업 도중 “사용 한도 초과” 메시지를 볼 걱정도 없습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;오프라인 환경에서도 작동한다는 점 역시 큰 장점입니다. 인터넷이 끊겨도, 서비스가 다운되어도, 로컬 모델은 계속 돌아갑니다. 보안이 중요한 프로젝트에서 코드를 외부 서버로 전송할 필요도 없습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;마지막 장점은 커스터마이징이 가능하다는 점입니다. 필요하다면 모델을 파인튜닝하거나, 프롬프트를 자유롭게 실험하고, 여러 모델을 조합해 쓸 수도 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;처음 클로드 코드를 만났을 때, 저는 진정한 AI 에이전트의 가능성을 목격했습니다. 클로드 모델의 성능은 정말 뛰어납니다. 하지만 뛰어난 성능만으로는 충분하지 않다는 것을 알았습니다. 예측하기 어려운 사용 제한, 공지 없는 정책 변경, 그리고 내가 통제할 수 없는 변수들 앞에서 저는 AI 엔지니어로서의 정체성마저 의심하게 되었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;탈클로드를 결심한 이래, 지난 수개월은 시행착오의 연속이었습니다. 하지만 그 과정에서 생각보다 많은 것을 배웠습니다. 오픈소스로의 전환은 단순히 도구를 바꾸는 일 그 이상입니다. 엔지니어로서 독립성과 안정성을 되찾는 과정이었고, 그만큼 얻은 것도 많았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;제가 현재 운영하는 워크플로우는 이렇습니다. 일상적인 코딩 작업은 로컬 Ollama에서 Qwen 3 Coder를 실행합니다. 복잡한 논리 설계가 필요할 때는 Groq의 호스팅 서비스로 DeepSeek V3를 사용합니다. 그렇게 해도 풀리지 않으면, 정말 필요한 순간에만 클로드 API를 호출합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 운영하니 비용도 줄었고, 사용량 제한에 걸릴 일도 거의 사라졌습니다. 역설적으로 의존도를 낮추자, 정작 필요할 때 클로드를 더 효과적으로 활용할 수 있게 됐습니다. 수개월간 오픈소스 코딩 에이전트를 사용하며 느낀 점은 분명했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;오픈소스 모델이 클로드의 완벽한 대체재는 아닙니다. 여전히 결과물이 다소 어색하거나 품질이 떨어지는 경우도 많습니다. 복잡한 아키텍처 설계나 대규모 리팩터링에서는 여전히 클로드 코드가 큰 우위에 있습니다. 하지만 현실의 개발 업무는 그런 이분법으로 나뉘지 않습니다. 대부분의 작업은 오픈소스 모델로도 충분히 처리할 수 있을 거라는 가능성을 보았습니다. 부족한 20%를 위해, 나머지 80%를 불안정한 서비스에 맡길 이유는 없다고 느꼈습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;개발자들의 탈클로드 움직임은 단순한 ‘가격 불만’ 때문은 아닙니다. 이것은 선택권을 되찾으려는 엔지니어들의 의식 있는 움직임에 가깝습니다. 한 회사의 정책에 종속되지 않고, 자신의 상황에 맞는 도구를 선택할 자유를 요구하는 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;소프트웨어 엔지니어링 역사를 돌아보면, 가장 성공한 기술은 늘 이런 자유도를 제공했습니다. Linux가 Windows를 넘어 서버 운영 체제의 표준이 된 이유도 단순히 가격 때문만은 아닙니다. 사용자가 원하는 방식으로 커스터마이징하고, 직접 통제할 자유가 있었기 때문입니다. 오픈소스 모델의 부상 역시 같은 맥락 안에 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이제 오픈소스 모델은 “충분히 좋은” 수준까지 올라왔습니다. 클로드 코드가 여전히 더 좋다는 점은 인정합니다. 하지만 개발자들은 합리적입니다. “더 좋은” 도구를 하루 3시간만 쓰는 것보다, “충분히 좋은” 도구를 24시간 안정적으로 쓰는 편이 실무에서는 더 가치 있을 지도 모릅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;클로드 코드 독점 시대는 서서히 끝나가고 있습니다. 이제는 개발자가 자신의 필요에 맞는 도구를 선택하는 시대입니다. 그리고 그 전환에 필요한 것은 이미 충분히 갖춰져 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>지금 진짜 쓸 만한 AI 에이전트 10가지 총정리(2) : 자율 에이전트 </title><link>https://yozm.wishket.com/magazine/detail/3800</link><description>코딩 에이전트까지는 무언가 손댈 때마다 사람에게 물었습니다. 자율 에이전트는 한 번 '여기까지는 알아서 해'라고 정해두면, 내가 자는 동안에도 24시간 혼자 돕니다. 가장 강력하고, 그래서 가장 위험한 단계죠. 메신저에 띄워두는 OpenClaw, 쓸수록 똑똑해지는 Hermes, 기억을 내 컴퓨터에만 쌓는 OpenHuman, 구글 워크스페이스 속 Gemini Spark까지 네 가지를 정리했습니다. 편리함과 위험은 같은 버튼에서 나오니, 진짜 실력은 '어디까지 맡기고 어디부터 막을지'를 정하는 감각입니다.</description><guid>https://yozm.wishket.com/magazine/detail/3800</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p&gt;&lt;strong&gt;지금 진짜 쓸 만한 AI 에이전트 10가지 총정리 시리즈&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li&gt;&lt;strong&gt;1편:&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/detail/3786/"&gt;&lt;strong&gt;&lt;u&gt;웹·코딩 에이전트 6가지&amp;nbsp;&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;/li&gt;&lt;li&gt;&lt;strong&gt;2편: 자율 에이전트 4가지 (현재 글)&lt;/strong&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/blockquote&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;a href="https://yozm.wishket.com/magazine/detail/3786/"&gt;&lt;u&gt;지난 1편&lt;/u&gt;&lt;/a&gt;에서는 가볍게 한 번 맡겨보는 웹 에이전트와, 컴퓨터를 통째로 맡기되 파일 하나 건드릴 때마다 승인을 받는 코딩 에이전트까지 모두 여섯 가지 서비스를 봤습니다. 이번 2편에서 다룰 자율 에이전트는 그 권한 위계의 맨 윗 칸입니다. &lt;span style="color:#757575;"&gt;(1편을 안 보셨어도 괜찮습니다. 지금부터 짧게 짚고 가겠습니다.)&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;잠깐 복습하면, 이 시리즈에서 에이전트는 "LLM이 도구를 루프로 돌려 목표를 달성한다"로 정의했습니다. 그리고 서비스를 가르는 축은 네 가지였죠. 무엇을 알고&lt;span style="color:#999999;"&gt;(컨텍스트)&lt;/span&gt;, 무엇으로 하고&lt;span style="color:#999999;"&gt;(도구)&lt;/span&gt;, 어디까지 해도 되고&lt;span style="color:#999999;"&gt;(권한)&lt;/span&gt;, 언제 시작하느냐&lt;span style="color:#999999;"&gt;(트리거)&lt;/span&gt;. 이 중에서도 종류를 결정적으로 가르는 건 권한이었습니다. 권한을 한 칸씩 더 내줄수록 웹에서 코딩으로, 코딩에서 자율로 올라갑니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;자율 에이전트는 그 맨 윗 칸입니다. 코딩 에이전트까지는 무언가 손댈 때마다 사람에게 "이거 해도 될까요?"를 물었습니다. 반면 자율 에이전트는 한 번 "여기까지는 알아서 해"라고 정해두면, 그 안에서는 묻지 않고 24시간 혼자 돕니다. 내가 자는 동안에도요. 가장 강력하고, 그래서 가장 위험한 단계입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;전체 10가지 중 2편에서 다루는 자율 에이전트는 네 가지입니다. 1편 끝에서 예고했으며 가장 널리 알려진 두 서비스, 자율 에이전트의 원조 격인 오픈클로&lt;span style="color:#999999;"&gt;(OpenClaw)&lt;/span&gt;와 쓸수록 똑똑해지는 헤르메스&lt;span style="color:#999999;"&gt;(Hermes)&lt;/span&gt;에 두 가지를 더했습니다. 데스크톱에서 기억을 내 컴퓨터 안에만 쌓는 오픈휴먼&lt;span style="color:#999999;"&gt;(OpenHuman)&lt;/span&gt;, 그리고 구글 생태계에 깊이 붙는 제미나이 스파크&lt;span style="color:#999999;"&gt;(Gemini Spark)&lt;/span&gt;입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;다만 시작하기 전에 하나는 분명히 해두죠. 편리함과 위험은 같은 버튼에서 나옵니다. 권한을 넓게 열수록 알아서 잘 해주지만, 그만큼 어긋났을 때 손쓸 틈도 사라집니다. 그래서 이 단계에서 진짜 실력은 기능을 외우는 게 아니라 "어디까지 맡기고, 어디부터 막을지"를 정하는 감각입니다. 그 감을 함께 잡아보겠습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;자율 에이전트: 잠도 안 자고 일하는 비서&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;h4&gt;&lt;strong&gt;7.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/openclaw/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;OpenClaw&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 컴퓨터에 상주하며 잠들지 않는 비서&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;오픈소스 자율 에이전트 중 가장 많이 알려진 서비스입니다. 1인 개발자의 주말 프로젝트로 시작했는데 폭발적인 관심을 받았죠. 공개 두어 달 만에 빅테크가 일제히 눈독을 들였고, 결국 2026년 2월 창업자 Steinberger는 OpenAI에 합류했습니다. 다만 OpenClaw 자체는 특정 회사 소유로 넘어가지 않고, OpenAI를 후원사로 둔 독립 재단으로 이관돼 MIT 라이선스 그대로 남았습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3800/image9_YYS19NO.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/openclaw/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Openclaw&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;오스트리아 개발자 Peter Steinberger가 2025년 11월 처음 공개한 오픈소스&lt;span style="color:#999999;"&gt;(MIT)&lt;/span&gt; 에이전트예요. &lt;span style="color:#757575;"&gt;(이름이 여러 번 바뀌어 2026년 1월 30일 지금의 OpenClaw로 확정됐습니다. 앤트로픽 측 상표 문제 때문이었죠.)&lt;/span&gt; 서버에 직접 설치해 쓰고, 구독료 없이 LLM 사용료만 듭니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;서버에 설치한 다음 권한을 주고, 슬랙·텔레그램·디스코드 같은 메신저에 봇으로 띄워두면 끝입니다. 평소 쓰던 메신저가 그대로 조작 화면이 되죠. 명령을 던지거나 키워드·일정을 걸어두면 알아서 처리하고 답을 줍니다&lt;span style="color:#757575;"&gt;(지원 채널 50개 이상)&lt;/span&gt;. 성격을 정의하는 파일&lt;span style="color:#757575;"&gt;(SOUL.md)&lt;/span&gt;을 두는 것도 특징인데, 켜질 때마다 이 파일을 먼저 읽어 늘 같은 말투로 움직입니다. 이런 에이전트들이 모인 AI 전용 커뮤니티 'Moltbook'이 화제가 됐고, 최근 마이크로소프트도 OpenClaw를 자사 에이전트에 집어넣겠다고 발표했습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이런 일에 강해요&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li&gt;코드 정리·자료 조사&lt;/li&gt;&lt;li&gt;길게 받은 내용 요약&lt;/li&gt;&lt;li&gt;메시지 한 줄이나 키워드로 시작되는 자동화&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;항상 띄워두고 손대지 않아도 도는 에이전트를 원한다면 가장 쉽게 접근할 수 있는 선택지입니다. 다만 셸 실행·파일·캘린더·이메일까지 권한이 넓은 만큼, 그 권한이 그대로 공격 통로가 됩니다. 초기엔 보안 취약점도 많이 보고됐으니, 기업 비밀이 담긴 컴퓨터는 피하고 권한은 좁게 시작해 하나씩 넓혀가세요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;8.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/hermes-agent/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;Hermes Agent&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 쓸수록 똑똑해진다&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;나온 지 석 달 만에 자율 에이전트 사용량 선두로 올라선 신예입니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3800/image4_rGWvrYk.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/hermes-agent/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Hermes Agent&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;Nous Research가 2026년 2월 25일 공개한 오픈소스&lt;span style="color:#757575;"&gt;(MIT)&lt;/span&gt; 에이전트예요. OpenClaw처럼 서버에 설치해 쓰고 LLM 사용료만 듭니다. 2026년 5월 10일 OpenRouter 일일 토큰 처리량에서 1위에 올라 OpenClaw를 처음 앞질렀습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;설치한 뒤 메신저나 명령어 창으로 일을 맡기면 처리합니다. 여기까지는 OpenClaw와 비슷하죠. 차이는 학습 루프예요. 한 번 해낸 작업 절차를 파일&lt;span style="color:#757575;"&gt;(스킬)&lt;/span&gt;로 저장해 두고, 비슷한 일이 오면 그 파일을 꺼내 다시 씁니다. 쓰는 도중 절차를 스스로 다듬기도 하고, 자주 부탁하는 패턴까지 익혀가고요. 최근 데스크톱 앱으로도 출시를 마치며 영역을 넓히고 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이런 일에 강해요&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li&gt;매번 똑같이 반복하는 업무 절차&lt;/li&gt;&lt;li&gt;오래 이어지는 긴 작업 &lt;span style="color:#757575;"&gt;(절차를 기억하니 중간에 끊겨도 이어감)&lt;/span&gt;&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;매번 반복하는 워크플로가 있거나, 쓸수록 손에 맞아가는 에이전트를 지금부터 길들이고 싶다면 좋은 선택지입니다. 권한을 넓게 여는 건 다른 자율 에이전트와 같으니 좁게 시작하는 게 안전하고요. &lt;span style="color:#757575;"&gt;(보안 취약점 보고는 OpenClaw보다 적은 편입니다.)&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;9.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/openhuman/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;OpenHuman&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 귀여운 다마고찌?&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;OpenHuman은 가장 최근에 등장한 자율 에이전트입니다. 2026년 5월에 나왔죠. 간단한 설치와 최적화 기능들을 앞세워, 깃허브 트렌드, 프로덕트 헌트에서 모두 1위를 차지했습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3800/image12_GDVktQ6.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/openhuman/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;OpenHuman&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;TinyHumans AI가 만든 오픈소스&lt;span style="color:#757575;"&gt;(GPL-3.0)&lt;/span&gt; 에이전트예요. 2026년 5월에 공개되며 그 주에 깃허브 트렌딩 정상에 올랐습니다. 데스크톱 앱으로 받아 쓰고, 로컬 모델을 쓰면 클라우드 없이도 돌릴 수 있어요. &lt;span style="color:#757575;"&gt;(OpenClaw 구조를 토대로 만들어졌습니다.)&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt; 데스크톱 앱에서 볼 폴더와 연결할 계정&lt;span style="color:#999999;"&gt;(OAuth)&lt;/span&gt;을 직접 지정합니다. 도구 하나하나가 아니라 계정 단위&lt;span style="color:#999999;"&gt;(Gmail·Notion·GitHub·Slack 등 118개 이상)&lt;/span&gt;로 붙여 맥락을 끌어모으는 게 특징이에요. 연결해두면 20분마다 자동으로 데이터를 가져와 압축하고, 내 컴퓨터 안 저장소에만 기억으로 쌓습니다. 이 '학습'의 방향이 Hermes와 다른데, Hermes가 일을 더 잘하는 법&lt;span style="color:#999999;"&gt;(스킬)&lt;/span&gt;을 익힌다면 OpenHuman은 나를 더 잘 아는 쪽&lt;span style="color:#999999;"&gt;(기억)&lt;/span&gt;으로 진화합니다. 기억에서 바로 답할 수 있는 건 외부 모델을 부르지 않아 토큰도 아끼고요&lt;span style="color:#757575;"&gt;(제작사는 최대 80% 절감을 내세우지만 실측 리뷰에선 70% 안팎)&lt;/span&gt;. 쌓인 기억은 마크다운 파일이라 직접 열어 읽고 고칠 수도 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이런 일에 강해요&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li&gt;내 메일·문서·일정을 미리 파악한 상태에서 시작하는 작업&lt;/li&gt;&lt;li&gt;같은 맥락을 매번 다시 설명하기 귀찮은 반복 업무&lt;/li&gt;&lt;li&gt;데이터를 밖으로 내보내고 싶지 않을 때&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;기능도 많지만 눈에 띄는 건 모니터에 머무는 귀여운 마스코트입니다. 화상 회의&lt;span style="color:#757575;"&gt;(구글 미트)&lt;/span&gt;에 참가자로 들어오기도 하고요. 마스코트와 대화하며 가볍게 에이전트를 키워보고 싶다면 괜찮습니다. 데이터를 로컬에만 두고 토큰도 암호화해 보관하지만, 여러 계정을 한꺼번에 묶는 만큼 연결 범위는 신중히 정하세요. 아직 외부 보안 감사를 받기 전이고, 막 나온 제품이라는 점도 감안하고요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;10.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/gemini-spark/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;Gemini Spark&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 구글 워크스페이스 속 자율 에이전트&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;동작 원리는 자율 에이전트랑 비슷한데, Google Workspace 안에서만 도는 특징을 가진, 변형 에이전트입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3800/image2_PT7iVof.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/gemini-spark/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Gemini Spark&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;2026년 5월 19일 구글 I/O에서 공개됐고, 아직 베타 단계로 정식 출시 전입니다&lt;span style="color:#757575;"&gt;(미국 AI Ultra 구독자 대상)&lt;/span&gt;. Gemini 3.5와 1편에서 본 Antigravity를 기반으로 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;클라우드에서 돌기 때문에 노트북을 닫아둬도 움직입니다. 전용 Gmail 주소로 동료에게 메일 보내듯 일을 시키면, Gmail·Docs 같은 워크스페이스는 물론 크롬으로 웹까지 살펴 처리하고 보고합니다. MCP로 외부 서비스도 붙일 수 있고요. 다만 단계마다 사용자 승인을 받는 구조라, 완전 무인이라기보다 '지켜보는 자율'에 가깝습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;구글 워크스페이스를 일상적으로 쓴다면 가장 손이 덜 가는 자율 에이전트가 될 수 있습니다. 클라우드·검색·저장소를 다 가진 구글 위에서 도는 만큼, Antigravity나 Gemini가 발전할수록 그 성과를 그대로 흡수할 가능성도 큽니다. 이렇게 특정 공간을 중심으로 돌며 안전장치를 갖춘 자율 에이전트는 더 지켜볼 만합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;그래서 뭐부터 써볼까요? 웹·코딩·자율 3단계&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;사실, 지금까지 소개한 에이전트 열 개를 다 써볼 필요는 없습니다. 그 대신 처음부터 자율 에이전트로 바로 점프하는 건 권하지 않습니다. 그만큼 위험한 권한을 손에 쥐거든요. 그래서 앞에서 본 순서&lt;span style="color:#757575;"&gt;(웹→코딩→자율)&lt;/span&gt;를 그대로 사다리 삼아 한 칸씩 올라가는 걸 권합니다. 한 칸 오를 때마다 에이전트한테 내주는 권한이 늘어나죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image"&gt;&lt;img src="https://www.wishket.com/media/news/3800/고양이_qd5qxJC.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가, Gemini로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;1단계: 웹으로 동작부터 구경&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;서비스가 정해둔 도구 안에서 에이전트가 어떻게 도는지 구경할 수 있습니다. 프롬프트 하나만 던지면 되니까 부담이 거의 없죠. 자료 조사나 시장 리서치처럼 평소 시간 잡아먹던 작업을 한번 통째로 맡겨보세요. 지금 당장 시작하고 싶으면 Genspark, Manus가 가장 안정적입니다. &lt;span style="color:#757575;"&gt;(자세한 소개는 &lt;/span&gt;&lt;a href="https://yozm.wishket.com/magazine/detail/3786/"&gt;1편&lt;/a&gt;&lt;span style="color:#757575;"&gt;에서)&amp;nbsp;&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;2단계: 코딩으로 직접 커스텀&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;여기서는 컨텍스트·도구·권한을 직접 다룹니다. 동작 하나하나에 승인을 거치니 통제권은 그대로 쥐고 가죠. 코드를 만지면 Claude Code·Codex·Antigravity 중 자기 생태계에 맞는 걸로, 안 만지면 같은 힘을 GUI로 쓰는 Cowork로 시작하면 됩니다. 작업 절차를 저장해 반복하는 '스킬&lt;span style="color:#757575;"&gt;(Skills)&lt;/span&gt;'을 써보겠다는 목표를 잡으면 에이전트의 동작 방식에 더 쉽게 다가갈 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;3단계: 자율로 24/7 세팅&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;권한을 상시로 내주는 대신 편리함을 챙길 수 있습니다. 워크플로를 학습시키려면 Hermes Agent, 여러 메신저에 상시로 띄우려면 OpenClaw, 가장 최근에 나온 자율 에이전트를 써보려면 OpenHuman을 추천합니다. 이 단계에서는 서비스의 특징보다 권한과 범위를 어디까지 열어둘지 감을 익히는 게 우선일 거라고 생각합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;마치며: 외우지 말고, 한 번 돌려보세요&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;에이전트가 시대의 흐름인 건 맞습니다. 그렇다고 뭔지도 잘 모르는 채로 OpenClaw 같은 자율 에이전트부터 덜컥 깔아두는 건 권하지 않습니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;먼저 갖춰야 할 건 개념입니다. LLM이 도구를 루프로 돌려 목표를 달성한다는 것, 그리고 컨텍스트·도구·권한·트리거를 중심으로 서비스가 갈린다는 이해죠. 이번에 다룬 서비스도 대부분 이제 막 나온 것들이라, 열 개의 특징을 외우는 건 그다음 일입니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;결국 어느 단계든 한 번은 직접 돌려봐야 감이 옵니다. 글로 읽은 맥락과 손으로 굴려보며 깨닫는 건 다르니까요. 에이전트가 할 수 있는 그 넓은 영역에 감이 잡히면, 그때부터 꽤 다른 세상이 열릴 겁니다. 이 글이 그 여정의 좋은 길잡이가 되면 좋겠습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>AI 활용 경험, 포트폴리오에 어떻게 담아야 할까</title><link>https://yozm.wishket.com/magazine/detail/3799</link><description>요즘 주니어 디자이너들이 모인 커뮤니티나 오픈채팅방을 보다 보면 비슷한 질문을 자주 보게 됩니다.포트폴리오에 ‘AI 활용 경험’을 넣고 싶은데, 어떤 AI 도구를 공부해야 하느냐는 질문입니다. 누군가는 Claude를 배워야 하는지 묻고, 누군가는 Figma Make나 Cursor를 써본 경험을 넣어도 되는지 고민합니다. 채용 공고에 AI 활용 역량이 적혀 있으니, 포트폴리오 한쪽에 사용 가능한 AI 도구 목록을 정리해두는 게 좋겠냐고 묻는 경우도 있습니다. 질문 자체는 충분히 이해됩니다. 시장은 빠르게 바뀌고 있고, 주변에서는 모두 AI를 쓴다고 말하고 있으며, 나만 뒤처지고 있는 것 같은 기분은 사람을 꽤 부지런하게 만듭니다. 문제는 그 부지런함이 가끔 이상한 방향으로 달려간다는 데 있습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3799</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;AI 썼습니다, 그래서 뭘 더 잘했나요&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;도구를 배워야 한다는 불안이 먼저 도착했습니다&lt;/strong&gt;&lt;/h4&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3799/01.png"&gt;&lt;figcaption&gt;하루에도 수십 개의 AI 도구가 등장하고 있습니다. &amp;lt;출처: 작가, ChatGPT로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;요즘 주니어 디자이너들이 모인 커뮤니티나 오픈채팅방을 보다 보면 비슷한 질문을 자주 보게 됩니다.&lt;strong&gt;포트폴리오에 ‘AI 활용 경험’을 넣고 싶은데, 어떤 AI 도구를 공부해야 하느냐&lt;/strong&gt;는 질문입니다. 누군가는 Claude를 배워야 하는지 묻고, 누군가는 Figma Make나 Cursor를 써본 경험을 넣어도 되는지 고민합니다. 채용 공고에 AI 활용 역량이 적혀 있으니, 포트폴리오 한쪽에 사용 가능한 AI 도구 목록을 정리해두는 게 좋겠냐고 묻는 경우도 있습니다. 질문 자체는 충분히 이해됩니다. 시장은 빠르게 바뀌고 있고, 주변에서는 모두 AI를 쓴다고 말하고 있으며, 나만 뒤처지고 있는 것 같은 기분은 사람을 꽤 부지런하게 만듭니다. 문제는 그 부지런함이 가끔 이상한 방향으로 달려간다는 데 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;특히 주니어 디자이너에게 AI는 애매한 존재입니다. 안 쓰자니 시대에 뒤처지는 것 같고, 쓴다고 말하자니 무엇을 어떻게 보여줘야 할지 막막합니다. 예전에는 포트폴리오에서 리서치, 문제 정의, 와이어프레임, UI 시안, 프로토타입, 회고 정도를 보여주면 어느 정도 기본 골격이 만들어졌습니다. 그런데 이제는 그 사이사이에 AI가 끼어듭니다. 인터뷰 내용을 요약해주고, 페르소나 초안을 만들어주고, 랜딩 페이지 시안을 여러 개 뽑아주고, 프로토타입 코드까지 만들어줍니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러다 보니 주니어 디자이너 입장에서는 자연스럽게 이런 생각을 하게 됩니다. 그렇다면 나도 “포트폴리오에 AI를 썼다는 걸 보여줘야 하지 않을까?” 여기까지는 맞습니다. 다만 그다음 질문이 ‘어떤 도구를 배워야 할까’로 바로 넘어가는 순간, 문제의 초점이 흐려집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 활용 경험은 특정 도구를 써봤다는 인증서가 아닙니다. Claude를 써봤고, ChatGPT를 써봤고, Figma Make를 눌러봤고, Cursor로 간단한 화면을 만들어봤다는 사실만으로는 포트폴리오에서 큰 힘을 갖기 어렵습니다. 도구를 직접 써본 경험이 무의미하다는 뜻은 아닙니다. 하지만 채용자가 궁금해하는 것은 도구의 이름이 아닙니다. 더 정확히는 그 도구를 통해 디자이너가 자신의 작업 방식을 어떻게 만들었는가입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;마치 요리를 해본 경험을 말해야 하는 자리에서, 칼 브랜드와 프라이팬 모델명만 줄줄 외우고 있는 것과 비슷합니다. 중요한 건 어떤 도구를 들었느냐가 아니라, 그 도구로 어떤 재료를 어떻게 손질했고, 결과적으로 음식의 맛이 어떻게 달라졌는지 말할 수 있어야 합니다.&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;‘도구 목록’이 아니라 ‘작업 방식의 변화’&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3799/02.png"&gt;&lt;figcaption&gt;AI는 시안 탐색의 속도를 높이지만, 선택의 기준까지 대신 정해주지는 않습니다. &amp;lt;출처: 작가, ChatGPT로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 시대의 포트폴리오에서 주니어 디자이너가 보여줘야 할 것은 단순한 도구 숙련도가 아닙니다. 더 중요한 것은 자신의 작업 과정 안에서 AI가 어떤 역할을 했는지 설명하는 능력입니다. 다시 말해 AI를 썼다는 사실보다, AI를 어디에 배치했는지가 중요합니다. 리서치 정리에 썼는지, 시안 탐색에 썼는지, 콘텐츠 구조를 비교하는 데 썼는지, 사용성 테스트 시나리오를 만드는 데 썼는지에 따라 이야기는 완전히 달라집니다. 그리고 그 각각의 활용 방식은 디자이너가 어떤 문제를 중요하게 봤는지, 어떤 업무를 반복적이라고 판단했는지, 어떤 부분은 사람의 판단으로 남겨두었는지를 보여줍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;좋은 AI 활용 경험은 대체로 이런 구조를 가집니다. 먼저 기존 작업 과정에 병목이 있었습니다. 비슷한 레이아웃 시안을 여러 번 반복해서 만들거나, 긴 인터뷰 원문에서 반복되는 불편 표현을 정리하거나, 랜딩 페이지의 카피와 정보 구조를 여러 방향으로 비교해야 하는 상황이 있었을 수 있습니다. 그다음 디자이너는 이 병목 중 일부를 AI로 압축했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;반복되는 시안 생성, 초안 정리, 텍스트 분류, 코드 프로토타입 제작처럼 시간이 많이 들지만 반드시 사람이 처음부터 끝까지 붙잡고 있을 필요는 없는 일을 AI에게 맡긴 것입니다. 그리고 여기서 끝나면 안 됩니다. 그렇게 확보한 시간과 사고력을 디자이너가 어디에 다시 투자했는지를 보여줘야 합니다. 사용자 문제를 더 깊게 분석했는지, 시안 간 차이를 기준에 따라 비교했는지, 문제 정의를 더 날카롭게 좁혔는지까지 이어져야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;예를 들어, 포트폴리오에 ‘Figma Make를 활용해 여러 개의 랜딩 페이지 시안을 제작했습니다’라고 적는다면, 이 문장은 아직 약합니다. AI가 시안을 만들어준 것인지, 디자이너가 그 시안을 어떻게 평가했는지, 어떤 기준으로 선택했는지 알기 어렵기 때문입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;반면 ‘초기 랜딩 페이지의 핵심 가치를 사용자가 빠르게 이해하지 못한다는 문제를 발견했고, Figma Make를 활용해 정보 배치와 메시지 우선순위가 다른 시안 5개를 빠르게 생성했습니다. 이후 각 시안을 가치 제안, CTA 인지 가능성, 신뢰 요소 노출 방식 기준으로 비교했고, 최종적으로 사용자가 3초 안에 서비스의 목적을 이해할 수 있는 구조로 재정리했습니다’라고 쓰면 이야기가 달라집니다. 이 문장에서는 AI가 주인공이 아닙니다. 주인공은 여전히 디자이너입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI 결과물이 아닌 AI를 통한 판단을&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3799/03.png"&gt;&lt;figcaption&gt;포트폴리오에는 AI 결과물보다 디자이너의 판단이 남아야 합니다. &amp;lt;출처: 작가, ChatGPT로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;주니어 디자이너가 포트폴리오에서 가장 조심해야 할 지점은 AI가 만든 결과물을 자신의 역량처럼 전면에 내세우는 것입니다. 생성형 AI는 생각보다 빠르게 그럴듯한 결과물을 만들어냅니다. 문제는 그 그럴듯함이 디자이너의 판단을 가릴 수 있다는 점입니다. 화면은 멋져 보이는데 왜 이 구조여야 하는지 설명하지 못하거나, 카피는 매끄러운데 어떤 사용자 문제를 해결하는지 불분명하거나, 프로토타입은 움직이는 데 실제 사용 흐름에서는 중요한 예외 상태가 빠져 있다면, 그 결과물은 포트폴리오에서 오히려 불안한 신호가 될 수 있습니다. 채용자는 완성된 화면만 보는 것이 아니라, &lt;strong&gt;그 화면이 어떤 사고 과정을 거쳐 만들어졌는지&lt;/strong&gt; 봅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI를 활용한 포트폴리오도 같은 기준으로 봐야 합니다. 좋은 사례는 AI가 무엇을 만들어줬는지를 자랑하지 않습니다. 오히려 AI가 만든 초안을 어떻게 의심했고, 어떤 기준으로 걸러냈고, 어디를 다시 고쳤는지를 보여줍니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;예를 들어, AI가 인터뷰 내용을 요약해 줬다면, 그 요약을 그대로 인사이트로 옮기는 것은 위험합니다. 사용자의 말은 언제나 맥락 안에서 해석되어야 하고, 많이 언급된 불편이 반드시 가장 중요한 문제라는 보장도 없습니다. 그래서 좋은 포트폴리오라면 ‘AI로 인터뷰를 요약했습니다’에서 멈추지 않고, ‘AI가 1차로 분류한 불편 표현을 실제 행동 흐름과 다시 대조했고, 빈도는 낮지만 이탈에 영향을 줄 수 있는 항목을 따로 분리했습니다’까지 가야 합니다. 이때 AI는 정리 도구이고, 디자이너의 역할은 해석과 판단입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;시안 작업에서도 마찬가지입니다. 반복되는 UI 변형을 AI로 만드는 것은 충분히 좋은 활용입니다. 다만 포트폴리오에 들어가야 할 핵심은 ‘AI로 10개의 시안을 만들었습니다’가 아닙니다. 10개의 시안 중 어떤 기준으로 3개를 추렸고, 최종안에서 어떤 사용자 경험을 강화했는지가 핵심입니다. 사용자가 처음 들어왔을 때 무엇을 먼저 이해해야 하는지, 어떤 정보가 신뢰를 만드는지, CTA는 언제 등장해야 자연스러운지, 모바일 환경에서는 어떤 요소가 과도한지 같은 판단이 있어야 합니다. AI는 선택지를 넓혀줄 수 있지만, 선택의 이유까지 대신 책임져주지는 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;결국 내 업무를 얼마나 분리하는가&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3799/04.png"&gt;&lt;figcaption&gt;AI에겐 리서치와 정보 탐색을, 디자이너는 그 결과를 해석하는 일을 할 수 있습니다. &amp;lt;출처: 작가, ChatGPT로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 활용 역량을 조금 더 실무적으로 말하면, 업무를 나누는 능력에 가깝습니다. &lt;strong&gt;무엇을 AI에게 맡길 수 있고, 무엇을 사람이 끝까지 붙잡아야 하는지 구분하는 능력&lt;/strong&gt;입니다. 이 구분이 없으면 AI는 편리한 보조 도구가 아니라, 작업 과정을 흐리는 안개가 됩니다. 주니어 디자이너가 모든 것을 AI에게 맡기면 빠르게 결과물은 나올 수 있지만, 그 결과물을 설명하는 힘은 약해질 수 있습니다. 반대로 모든 것을 직접 하겠다고 하면 속도와 탐색 범위에서 손해를 볼 수 있습니다. 중요한 것은 둘 사이의 적절한 분업입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI가 상대적으로 잘하는 일은 &lt;strong&gt;반복, 요약, 변형, 초안 생성, 패턴 탐색&lt;/strong&gt;입니다. 긴 VOC를 1차 분류하거나, 같은 메시지를 여러 톤으로 바꾸거나, 특정 레이아웃을 다른 정보 구조로 변형하거나, 간단한 프로토타입 코드를 빠르게 만들어보는 일은 AI가 잘 도와줄 수 있습니다. 반면 디자이너가 책임져야 하는 일은 문제의 우선순위를 정하고, 사용자의 맥락을 해석하고, 비즈니스 목표와 사용자 목표 사이의 균형을 잡고, 최종안을 선택하는 기준을 세우는 일입니다. 이 영역은 단순 생성으로 해결되지 않습니다. 오히려 생성된 결과물이 많아질수록 더 중요해집니다. 선택지가 늘어나면 판단의 부담도 같이 늘어나기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;포트폴리오에서는 이 분업 구조를 명확히 보여주는 것이 좋습니다. 프로젝트 과정 안에 ‘AI 활용’이라는 별도 페이지를 억지로 만들 필요는 없습니다. 오히려 리서치, 문제 정의, 아이데이션, UI 탐색, 프로토타입, 검증 과정 안에서 AI가 어디에 들어갔는지 자연스럽게 보여주는 편이 더 좋습니다. 리서치 단계에서는 인터뷰 원문 정리와 패턴 추출에 AI를 썼지만 최종 인사이트는 행동 근거와 대조해 재정의했다는 식으로 설명할 수 있습니다. UI 단계에서는 반복되는 시안 변형을 AI로 만들었지만, 최종 선택은 정보 위계, 접근성, 컴포넌트 재사용성 기준으로 결정했다고 설명할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;도구는 금방 낡지만 판단은 오래 간다&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3799/05.png"&gt;&lt;figcaption&gt;디자이너는 앞으로 더 중요한 문제를 해결하는 데 집중해야 합니다. &amp;lt;출처: 작가, ChatGPT로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 도구는 앞으로도 계속 바뀔 것입니다. 지금 많이 언급되는 도구가 몇 달 뒤에도 같은 위치에 있을지는 알 수 없습니다. 새로운 모델이 나오고, 기존 도구에 AI 기능이 붙고, 디자인 도구와 개발 도구의 경계는 더 흐려질 것입니다. 그러니 포트폴리오를 특정 도구 이름 중심으로 구성하는 것은 생각보다 위험합니다. 물론 현재 사용한 도구를 숨길 필요는 없습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 도구 이름이 제목이 되어서는 안 됩니다. ‘Claude를 활용한 UX 리서치’보다 ‘인터뷰 데이터에서 문제 가설을 좁히는 과정’이 더 오래갑니다. ‘Figma Make로 만든 랜딩 페이지’보다 ‘첫 화면의 가치 전달력을 높이기 위한 시안 비교 과정’이 더 강합니다. 도구는 시간이 지나면 바뀌지만, 문제를 정의하고 판단하는 방식은 쉽게 낡지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;주니어 디자이너가 AI 활용 경험을 포트폴리오에 넣고 싶다면, 먼저 자신이 한 프로젝트를 다시 훑어봐야 합니다. 이 프로젝트에서 반복 작업은 어디에 있었는지, 사람이 오래 붙잡고 있었지만 꼭 그럴 필요는 없었던 일은 무엇이었는지, 반대로 절대 AI에게 맡기면 안 되는 판단은 무엇이었는지 구분해 봐야 합니다. 그리고 AI를 통해 줄인 시간이 실제로 더 나은 UX 판단으로 이어졌는지 확인해야 합니다. 단순히 시간을 아꼈다는 것만으로는 부족합니다. 그 시간을 &lt;strong&gt;사용자 문제를 더 깊게 파악하는 데 썼는지, 대안을 더 많이 비교하는 데 썼는지, 실제 사용 흐름의 예외 상태를 점검하는 데 썼는지&lt;/strong&gt;까지 보여줘야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;반대로 ‘ChatGPT로 페르소나를 만들고, Claude로 문제 정의를 하고, Figma Make로 UI를 만들었습니다’처럼 쓰면 겉보기에는 AI를 많이 쓴 것 같지만, 실제로는 디자이너가 무엇을 판단했는지 보이지 않습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이건 마치 팀 프로젝트 발표에서 ‘저희는 회의도 했고, 노션도 썼고, 피그마도 썼습니다’라고 말하는 것과 비슷합니다. 중요한 건 회의를 했다는 사실이 아니라 회의에서 어떤 결정을 했느냐입니다. 노션을 썼다는 사실이 아니라 어떤 정보를 어떻게 정리했느냐입니다. AI도 똑같습니다. 도구 이름은 맥락을 보조할 뿐, 역량을 대신 증명하지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI 뒤에 숨지 않을 것&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3799/06.png"&gt;&lt;figcaption&gt;좋은 포트폴리오는 AI를 통해 더 나은 디자인 판단을 증명하는 포트폴리오입니다. &amp;lt;출처: 작가, ChatGPT로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 시대의 주니어 포트폴리오에서 가장 중요한 변화는 결과물의 의미가 조금 달라졌다는 점입니다. 결과 화면은 여전히 중요합니다. 시각적으로 완성도가 낮거나 기본적인 UI 품질이 부족하면 좋은 평가를 받기 어렵습니다. 하지만 이제 결과물만으로는 충분하지 않습니다. 생성형 AI가 어느 정도 그럴듯한 화면을 빠르게 만들어주는 시대에는 화면 뒤에 있는 판단의 흔적이 더 중요해집니다. 왜 이 문제를 골랐는지, 왜 이 사용자를 우선으로 봤는지, 왜 이 흐름을 선택했는지, 왜 다른 대안은 버렸는지, 왜 AI에게 이 작업을 맡겼고 왜 이 부분은 직접 판단했는지를 보여줘야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 주니어 디자이너가 포트폴리오에 AI 활용 경험을 넣을 때는 질문을 바꿔야 합니다. ‘어떤 AI 도구를 공부해야 할까요?’가 아니라, &lt;strong&gt;‘내 디자인 과정에서 AI가 들어가면 가장 효과적인 지점은 어디였을까요?’&lt;/strong&gt;라고 물어야 합니다. ‘이 도구를 써봤다고 적어도 될까요?’가 아니라, ‘이 도구를 통해 내 판단이 더 좋아졌다는 근거를 보여줄 수 있을까요?’라고 물어야 합니다. 질문이 바뀌면 포트폴리오의 내용도 바뀝니다. 도구 소개가 아니라 작업 과정이 보이고, 기능 나열이 아니라 문제 해결의 흐름이 보입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI FOMO는 당분간 사라지지 않을 것입니다. 새로운 도구는 계속 나오고, 누군가는 매일 더 빠르게 무언가를 만들고 있다고 말할 것입니다. 그 속에서 불안해지는 것은 자연스럽습니다. 하지만 포트폴리오는 유행하는 도구의 출석부가 아닙니다. 포트폴리오는 내가 어떤 문제를 어떻게 바라보고, 어떤 기준으로 판단하며, 어떤 방식으로 결과를 개선하는 사람인지를 보여주는 문서입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI는 그 과정을 더 빠르게 만들 수 있고, 더 넓게 탐색하게 해줄 수 있으며, 반복되는 일을 줄여줄 수 있습니다. 하지만 결국 포트폴리오에서 평가받는 것은 AI가 아니라 디자이너입니다. 좋은 포트폴리오는 ‘저는 이 도구를 쓸 줄 압니다’에서 끝나지 않습니다. &lt;strong&gt;‘저는 이 도구를 이렇게 써서, 더 중요한 판단에 집중했습니다’&lt;/strong&gt;까지 보여줄 때 비로소 진짜 설득력이 생깁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>클로드 페이블 5, 출시 하루 만에 너무 막힌다는 반응이 쏟아졌다 + 차단 소식 업데이트</title><link>https://yozm.wishket.com/magazine/detail/3798</link><description>AI한테 매번 처음부터 다시 설명하기 지치셨다면. 모델은 그대로 두고 기억만 따로 붙여주는 오픈소스 도구 supermemory, 출시 하루 만에 너무 막혀서 못 쓰겠다는 반응이 쏟아졌다는 앤트로픽 Fable 5, 그리고 1~2년이면 AI가 차원이 달라진다며 정부 검증을 요구한 앤트로픽 CEO의 제안까지. 이번 주 프로덕트 메이커가 주목할 세 가지를 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3798</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;안녕하세요, 요즘 프로덕트 메이커입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;프로덕트 소식은 넘쳐나지만 대부분 이런 게 나왔대에서 끝납니다. 그래서 뭘 어떻게 하라고? 내 작업에 어떻게 써먹지? 거기까진 연결이 잘 안 되죠. 따라서 요즘 프로덕트 메이커는 바로 쓸 수 있는 것, 그 중에서도 주목해볼 만한 것을 엄선해서 매주 금요일에 전달드리려 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;요즘 프로덕트 메이커는 매주 세 가지를 골라 전합니다:&lt;/p&gt;&lt;ol&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;써볼 것&lt;/strong&gt;: supermemory - AI가 대화 사이마다 기억을 잃는 문제를 메우는 오픈소스 메모리 엔진&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;참고할 것&lt;/strong&gt;: Claude Fable 5 - 출시 하루 만에 너무 막힌다는 반응이 쏟아진 신규 모델&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;적용해볼 것&lt;/strong&gt;: AI는 1~2년 안에 천재들의 나라가 된다는 Anthropic CEO의 정책 제안&lt;/li&gt;&lt;/ol&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3798/%ED%99%94%EB%A9%B4_%EC%BA%A1%EC%B2%98_2026-06-11_161434.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Github, supermemoryai&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;1. 써볼 것:&lt;/strong&gt; &lt;a href="https://github.com/supermemoryai/supermemory"&gt;&lt;strong&gt;AI가 대화 사이마다 기억을 잃는 문제를 메우는 오픈소스 메모리 엔진&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;supermemory는 AI에 장기 기억을 붙여주는 오픈소스 메모리·컨텍스트 엔진입니다. Dhravya Shah가 이끄는 팀이 만들고 있고, GitHub 별은 2만 6천 개를 넘었습니다. &lt;a href="https://techcrunch.com/2025/10/06/a-19-year-old-nabs-backing-from-google-execs-for-his-ai-memory-startup-supermemory/"&gt;구글과 딥마인드 임원이 참여한 시드 투자&lt;/a&gt;를 받은 곳이기도 하고요. 핵심은 AI가 대화가 끝나면 다 잊어버리는 한계를 메우는 데 있습니다. 대화에서 사실을 자동으로 뽑아 사용자 프로필을 만들고, 바뀐 정보는 갱신하고 지난 정보는 알아서 지웁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3798/%ED%99%94%EB%A9%B4_%EC%BA%A1%EC%B2%98_2026-06-11_162206.png"&gt;&lt;figcaption&gt;&amp;lt;출처: techcrunch&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;무슨 문제를 해결해 주나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;AI를 본격적으로 쓰는 사람이라면 한 번쯤 겪어봤을 거예요. 짧은 작업은 빠르고 편한데, 새 대화창을 열면 어제 알려준 맥락을 처음부터 다시 설명해야 합니다. AI는 세션이 바뀌면 이전 대화를 기억하지 못하니까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;supermemory는 이 기억을 대신 맡아 둡니다. 예를 들어 서울에 산다고 알고 있던 사람이 부산으로 이사했다고 하면, 이전 정보를 새 정보로 바꿔 기억합니다. 내일 시험이 있다 같은 임시 사실은 날짜가 지나면 알아서 지우고요. 모순되는 정보가 들어오면 자동으로 정리하고요. 기존에는 이런 걸 직접 만들려면 벡터 DB를 세팅하고 임베딩 파이프라인과 청킹 전략까지 짜야 했는데, supermemory는 그걸 하나의 API 뒤로 숨깁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떻게 쓰나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;크게 세 가지 방법이 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;코드 없이: MCP 서버나 플러그인을 설치하면 Claude Code, Cursor, VS Code 같은 도구에 기억이 붙습니다. 코드 없이 단독으로 쓰는 앱과 브라우저 확장도 따로 있고요. 저장·삭제(memory)와 검색(recall)은 AI가 알아서 호출하고, 프로필 주입(context)은 &lt;code&gt;/context&lt;/code&gt;로 부릅니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;개발자라면: npm이나 pip로 설치해 &lt;code&gt;add()&lt;/code&gt;로 대화를 저장하고, &lt;code&gt;profile()&lt;/code&gt;로 사용자 프로필과 관련 기억을 한 번에 받아옵니다. RAG와 메모리를 한 쿼리로 합친 Hybrid Search도 기본으로 동작합니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;직접 돌리고 싶다면: 단일 바이너리로 설치하면 설정 없이 &lt;code&gt;localhost:6767&lt;/code&gt;에서 동작합니다. Ollama를 붙이면 데이터가 기기 밖으로 나가지 않는 완전 오프라인으로도 쓸 수 있습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;구글 드라이브, 지메일, 노션, 원드라이브, 깃허브를 실시간으로 동기화하는 커넥터, PDF·이미지·영상·코드를 올리면 알아서 처리하는 추출기도 들어 있습니다. Vercel AI SDK, LangChain, LangGraph, n8n 같은 프레임워크용 래퍼도 있어서 쓰던 스택에 끼워 넣기 쉽습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 어디든 붙을 수 있는 건 supermemory가 기억을 모델에서 떼어내 별도 층으로 두기 때문입니다. 그래서 모델을 바꿔도 그동안 쌓인 맥락은 그대로 남고, 어떤 모델을 쓰든 기억은 내 쪽에 둘 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;성능에 대해서는, supermemory가 &lt;a href="https://github.com/xiaowu0162/LongMemEval"&gt;LongMemEval&lt;/a&gt;, &lt;a href="https://github.com/snap-research/locomo"&gt;LoCoMo&lt;/a&gt;, &lt;a href="https://github.com/Salesforce/ConvoMem"&gt;ConvoMem&lt;/a&gt; 같은 AI 메모리 벤치마크에서 자사 기준 최상위라고 밝힙니다. 다만 점수는 발표마다 다릅니다. README는 LongMemEval 81.6%, 창업자는 약 85%, 실험적 셋업으로는 약 99%를 들기도 했는데 본인이 이건 프로덕션이 아니라고 단서를 달았습니다. 특정 숫자를 그대로 믿기보다 메모리 쪽에서 앞선다고 자체 평가한다 정도로 보면 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;누구에게 좋을까요?&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;AI 앱이나 에이전트에 기억·RAG·사용자 프로필을 붙이고 싶은 개발자&lt;/li&gt;&lt;li style="text-align:justify;"&gt;메모리 시스템을 직접 만들고 굴리는 부담까지는 지고 싶지 않은 1인·소규모 팀&lt;/li&gt;&lt;li style="text-align:justify;"&gt;자기 AI 비서가 매번 까먹는 게 불편했던 사람&lt;/li&gt;&lt;li style="text-align:justify;"&gt;보안상 데이터를 밖으로 내보내기 어려운 경우. 셀프호스트와 오프라인 옵션이 있는데, 오프라인은 로컬 모델을 써야 해서 성능은 감안해야 합니다&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3798/546p1.jpg"&gt;&lt;figcaption&gt;&amp;lt;출처: Claude 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;2. 참고할 것:&lt;/strong&gt; &lt;a href="https://techcrunch.com/2026/06/10/cybersecurity-researchers-arent-happy-about-the-guardrails-on-anthropics-fable/"&gt;&lt;strong&gt;출시 하루 만에 너무 막힌다는 반응이 쏟아진 신규 모델&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="table"&gt;&lt;table&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td style="background-color:hsl(0, 0%, 90%);"&gt;&lt;p style="margin-left:0px;"&gt;&lt;strong&gt;[업데이트 · 2026.06.12]&lt;/strong&gt;&lt;/p&gt;&lt;p style="margin-left:0px;"&gt;이 글에서 소개한 Fable 5에 대한 접근이 전면중단됐습니다.&lt;br&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li&gt;&lt;strong&gt;무슨 일&lt;/strong&gt;: &lt;strong&gt;미국 정부가 국가안보 권한을 근거로 수출통제 지시를 발령&lt;/strong&gt;했고, 앤트로픽은 6월 12일 오후 5시 21분(미 동부시간) 지시를 받은 직후 &lt;strong&gt;두 모델의 모든 접근을 중단&lt;/strong&gt;했습니다. 미국 내·외, 미국 시민·외국인 직원 구분 없이 적용됩니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;이유&lt;/strong&gt;: 정부는 “Fable 5의 보안 우회(jailbreak) 기법이 발견됐다”는 점을 들었습니다. 앤트로픽이 검토한 우회는 모델에게 특정 코드베이스를 읽혀 소프트웨어 결함을 찾게 하는 좁은 범위의 비(非)보편적 기법으로, GPT-5.5 등 다른 모델에서도 흔히 가능한 수준이라고 반박했습니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;다른 모델은?&lt;/strong&gt; Opus 4.8, Sonnet, Haiku 등 나머지 앤트로픽 모델은 정상적으로 이용할 수 있습니다. 현재로선 사실상 오푸스 4.8이 유일한 선택지가 됐습니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;앞으로&lt;/strong&gt;: 앤트로픽은 “가능한 빨리 접근을 복구하기 위해 노력 중”이라고 밝혔으나 구체적 복구 일정이나 환불 언급은 없습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="margin-left:0px;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;"&gt;&lt;i&gt;출처: 앤트로픽 공식 성명 “&lt;/i&gt;&lt;a href="https://www.anthropic.com/news/fable-mythos-access"&gt;&lt;i&gt;Statement on the US government directive to suspend access to Fable 5 and Mythos 5&lt;/i&gt;&lt;/a&gt;&lt;i&gt;”, 2026.06.12)&lt;/i&gt;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Claude Fable 5는 Anthropic(앤트로픽)이 &lt;a href="https://techcrunch.com/2026/06/09/anthropics-claude-fable-5-is-a-version-of-mythos-the-public-can-access-today/"&gt;6월 9일 공개&lt;/a&gt;한 신규 모델로, 사이버보안에 강한 미토스와 같은 모델에 안전장치를 더한 공개 버전입니다. 그동안 너무 강력해서 제한적으로만 풀던 미토스급 모델을 공개로 처음 써볼 수 있게 됐다는 소식이라, 출시 직후 X와 Reddit, &lt;a href="https://news.ycombinator.com/item?id=48478969"&gt;해커뉴스&lt;/a&gt; 같은 여러 커뮤니티에서 관심이 크게 쏠렸습니다. &lt;a href="https://techcrunch.com/2026/06/10/cybersecurity-researchers-arent-happy-about-the-guardrails-on-anthropics-fable/"&gt;TechCrunch&lt;/a&gt;가 따로 다룰 만큼 반응이 뜨거웠고요. 그런데 그 상당수가 칭찬이 아니라, 안전장치가 너무 빡빡해서 평범한 작업까지 막힌다는 불만이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3798/%ED%99%94%EB%A9%B4_%EC%BA%A1%EC%B2%98_2026-06-11_162112.png"&gt;&lt;figcaption&gt;&amp;lt;출처: techcrunch&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떻게 작동하나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;가드레일이 걸리면 Fable은 대화를 멈추고 사이버보안 또는 생물학 주제로 플래그됐다고 안내한 뒤 Claude Opus 4.8로 폴백합니다. 악성코드 제작이나 생물·화학 무기 같은 위험을 막으려는 장치입니다. 앤트로픽은 이 안전장치가 평균적으로 세션의 5% 미만에서 작동하고, 더 강한 모델이 나오는 동안 오탐을 줄이려 작업 중이라고 밝혔습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떤 반응이 나왔나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;가장 많은 불만은 오탐입니다. IBM X-Force의 보안 연구자 Valentina "Chompie" Palmiotti는 &lt;a href="https://x.com/chompie1337/status/2064431038554939507"&gt;블로그 글을 읽는 것 같은 무해한 작업까지 사이버 관련으로 막힌다&lt;/a&gt;고 했습니다. Tolmo의 Matt Suiche는 안전한 코드를 짜달라고 하면 소프트웨어 엔지니어링이 아니라 사이버보안 작업으로 간주돼 다운그레이드된다며, 키워드·어휘 기반으로 보인다고 했고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;a href="https://news.ycombinator.com/item?id=48478969"&gt;해커뉴스&lt;/a&gt;에는 더 다양한 사례가 올라왔습니다. 도커 앱 로그 트러블슈팅, 자기 코드베이스의 인증·크리덴셜 코드 점검, PyTorch 같은 평범한 ML 작업, 홈 자동화 로그, 의료 내용이 든 CSV 파싱, 리버스 엔지니어링까지 막혀 계속 Opus 4.8로 내려갔다는 얘기가 이어졌습니다. 핵·생물·화학처럼 민감한 주제로 일부러 찔러보며 무엇이 막히는지 테스트한 사례도 있었고, 인구 통계나 궤도 역학 같은 학술 질문까지 걸렸다는 보고도 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;두 번째는 다운그레이드 방식입니다. 가드레일이 걸리면 Fable은 더 낮은 모델인 Opus 4.8로 내려가는데, 사이버·생물 쪽에서는 모델이 바뀌었다는 걸 사용자에게 알려줍니다. 다만 모델 카드에 따르면, 모델을 베껴 경쟁 모델을 만들려는 시도에는 모델을 바꾸지 않고 알리지도 않은 채 성능만 떨어뜨린다고 합니다. 이를 두고 해커뉴스 스레드에서 일부 사용자는 몰래 결과를 망치는 것 아니냐고 우려했는데, 그렇게까지 단정할 근거는 없다는 반박도 함께 달렸죠. 또 성능이 낮은 모델로 내려갔는데도 원래 가격을 그대로 내야 하는 건 아닌지 궁금해하는 사람도 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;세 번째는 데이터 보존입니다. 앤트로픽은 6월 9일부터 &lt;a href="https://support.claude.com/en/articles/15425996-data-retention-practices-for-mythos-class-models"&gt;Fable을 포함한 미토스급 모델에 주고받은 프롬프트와 답변을 30일간 보관&lt;/a&gt;하기로 했습니다. 일반 소비자 요금제(Free·Pro·Max)는 원래 안전 목적으로 데이터를 보관해와서 달라지는 게 없고, 새로 영향을 받는 건 그동안 데이터를 전혀 남기지 않는 조건(영점 데이터 보존, ZDR)으로 쓰던 기업입니다. AWS Bedrock, 구글 Vertex, Azure 같은 클라우드로 ZDR을 적용해 데이터를 안 남기고 쓰던 곳도, 이제 미토스급 모델을 쓰려면 30일 보관에 동의해야 합니다. 보관하는 이유로는, 요청 하나만 보면 멀쩡한데 같은 요청을 조금씩 바꿔 수백 번 던지는 식으로 여러 번에 걸쳐야 드러나는 오용이 있어서, 요청을 모아 함께 봐야 잡을 수 있기 때문이라고 설명합니다. 보호장치로는 심각한 위험으로 플래그되거나 고객이 직접 요청한 경우에만 승인된 소수의 검토자가 열람할 수 있고, 누가 언제 봤는지는 지울 수 없는 기록으로 남으며, 30일이 지나면 자동 삭제된다고 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 &lt;a href="https://news.ycombinator.com/item?id=48464258"&gt;이 정책을 두고 나온 반응&lt;/a&gt;은 곱지 않았습니다. 에이전트 코딩 도구를 쓰면 코드베이스 전체가 모델 제공사로 넘어가는데, ZDR 계약을 믿고 쓰던 기업은 곤란해진다는 거예요. &lt;a href="https://www.theverge.com/report/947575/microsoft-claude-fable-5-restricted-internally"&gt;The Verge 보도&lt;/a&gt;에 따르면 마이크로소프트는 Fable 5를 고객용 GitHub Copilot에는 넣으면서도 직원들이 쓰는 사내 GitHub Copilot 모델 목록에는 넣지 않았습니다. 데이터 보존 조건 때문이고, 다른 Claude 모델은 ZDR이 적용돼 사내에서 계속 쓸 수 있습니다. 같은 보도에 따르면, 보통 데이터는 30일 뒤 지워지지만 사용 정책을 위반한 것으로 걸러진 요청은 최대 2년까지 보관될 수 있습니다. 여기에 GDPR·NDA 관련 우려, IPO 직전에 굳이 이러느냐는 냉소도 나왔고요.&lt;br&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;네 번째는 효과 자체에 대한 회의론입니다. 키워드 기반이다 보니 작정한 공격자는 표현을 바꿔 빠져나가고 정작 정상 연구자만 막힌다는 비판입니다. 실제로 이런 식으로 우회를 시도하는 사용자도 관찰됐고, 일부 악성코드가 오히려 민감 키워드를 일부러 끼워 넣어 AI 검사 도구를 무력화하려 한다는 보안 업계 보도도 있었습니다. 이건 사용자를 지키는 가드레일이 아니라 앤트로픽을 지키는 장치라는 냉소도 보였습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;옹호하는 목소리도 있었습니다. 앞서 키워드 기반이라고 지적한 Suiche도, 초기 단계라 이해할 수 있고 시간이 지나면 완화될 거라고 덧붙였습니다. HN에도 실험적 고성능 모델이니 초기엔 과하게 막는 편이 낫다, 대안이 더 위험하다는 의견이 있었고요. 승인된 사이버 전문가에게 제한을 덜 거는 &lt;a href="https://support.claude.com/en/articles/14604842-real-time-cyber-safeguards-on-claude"&gt;Cyber Verification Program&lt;/a&gt;도 있는데, 개인으로 신청해 통과했다는 사례와 공개 취약점(CVE) 이력이 있는데도 거절됐다는 사례가 엇갈렸습니다. OpenAI(오픈AI)에도 &lt;a href="https://chatgpt.com/cyber"&gt;Trusted Access for Cyber&lt;/a&gt;라는 비슷한 프로그램이 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;무엇을 얻어가야 하나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이번 일이 보여주는 건, 모델이 강해질수록 그걸 고르는 기준도 달라진다는 점입니다. 예전엔 성능과 벤치마크가 거의 전부였다면, 이제는 안전장치가 내 작업을 막지는 않는지, 데이터 보존 조건이 회사 규정과 맞는지까지 함께 따져야 합니다. 마이크로소프트가 고객에게는 Fable 5를 팔면서 사내에서는 쓰지 않은 게 이걸 단적으로 보여주죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리고 이 마찰은 한 번 고치면 끝나는 버그가 아닐 가능성이 큽니다. 모델을 강력하게 만드는 능력이 곧 위험을 키우는 능력이라, 다음에 더 센 모델이 나와도 가드레일이든 데이터 보존이든 비슷한 제약이 반복될 공산이 크고요. 앤트로픽이 오탐을 줄이겠다고 했으니 지금 상태가 고정은 아니지만, 이 줄다리기 자체는 쉽게 사라지지 않을 겁니다. 그래서 실무적으로는, 작업을 모델 하나에 다 묶어두기보다 용도별로 나누고 갈아끼울 수 있게 해두는 게 점점 중요해질 것 같습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3798/l.jpg"&gt;&lt;figcaption&gt;&amp;lt;출처: darioamodei.com&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;3. 적용해볼 것:&lt;/strong&gt; &lt;a href="https://darioamodei.com/post/policy-on-the-ai-exponential"&gt;&lt;strong&gt;1~2년이면 AI가 차원이 달라진다는 Anthropic CEO의 정책 제안&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;Anthropic(앤트로픽) CEO Dario Amodei가 6월 10일 &lt;a href="https://darioamodei.com/post/policy-on-the-ai-exponential"&gt;Policy on the AI Exponential&lt;/a&gt;(AI 기하급수에 대한 정책)이라는 글을 올렸습니다. Fable 5 출시 바로 다음 날 나왔고, 모델 테스트 의무화를 담은 입법 제안과 일자리 대응 프레임워크를 함께 내놔서 화제가 됐는데요. &lt;a href="https://venturebeat.com/technology/anthropic-ceo-calls-for-faa-style-regulation-of-powerful-ai-models-what-enterprises-should-know"&gt;VentureBeat&lt;/a&gt;, &lt;a href="https://decrypt.co/370704/anthropic-ceo-ai-too-powerful-regulation-cant-wait"&gt;Decrypt&lt;/a&gt; 등 여러 매체가 비중 있게 다뤘습니다. AI는 시간이 갈수록 더 빠르게 발전하는데 정책은 그 속도를 못 따라간다는 게 출발점이고, 강한 모델을 비행기처럼 출시 전에 검증받게 하자는 게 핵심 주장입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떤 주장인가요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Amodei는 입법이 너무 느리다고 봅니다. 의회가 한 번 움직이는 사이에 AI는 신기한 장난감 수준에서 훨씬 강력한 단계로 건너뛸 수 있다는 거예요. 그는 이 단계를 데이터센터 속 천재들의 나라, 즉 수많은 천재가 데이터센터 안에서 한꺼번에 일하는 것과 같은 수준이라고 부릅니다. 컴퓨팅 자원을 키울수록 성능이 따라 오르는 지금의 흐름(스케일링 법칙)이 1~2년만 더 이어지면 거기에 도달한다는 거고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;그래서 회사가 안전 점검 내용을 공개하게 하는 정도로는 부족하다며, 일정 규모 이상의 컴퓨팅 자원을 들인 최신 모델은 비행기가 운항 전 안전 검사를 통과하듯 출시 전에 제3자 검증을 받게 하자고 제안합니다. 검증 항목은 사이버 공격, 생물무기, AI 통제 상실, 그리고 이런 위험을 더 키울 수 있는 AI의 자동 연구 네 가지인데, 여기서 기준에 못 미치면 정부가 출시를 막을 수 있게 하자는 내용입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;일자리 문제도 비중 있게 다룹니다. AI로 인한 일자리 감소는 바람직하지 않고 막아야 한다는 입장에서, 임금 보험이나 고용 유지 세제, 재교육 지원 같은 완충책을 제시하고 장기적으로는 기본소득까지 언급합니다. 동시에 그는 한 사람이 10억 달러 규모 회사를 만들고 몇 명짜리 팀이 수억 달러 매출을 내는 일이 이미 벌어지고 있다고도 말합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떻게 받아들여지나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;물론 반발도 있습니다. 비판하는 쪽이 먼저 짚은 건 시점입니다. Fable 5를 내놓은 바로 다음 날, 상장(IPO)을 앞둔 회사의 CEO가 강력한 모델은 정부가 출시를 막을 수 있게 하자고 제안했기 때문이죠. 내용을 두고도 말이 나옵니다. 전 마이크로소프트 윈도우 부문 사장이자 지금은 벤처 투자사 a16z 보드 파트너인 Steven Sinofsky 등은 이를 규제 포획이라고 봤습니다. 새 검증 의무가 그걸 감당할 여력이 있는 큰 회사에만 유리하고, 여력이 없는 작은 회사는 밀려나게 만든다는 뜻입니다. 게다가 어디까지 큰 모델에 적용되는 규칙인지 기준이 빠져 모호하다는 지적도 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;같은 주에 앤트로픽이 한 일들을 나란히 놓으면 이 비판이 왜 나오는지 보입니다. 에세이에서는 강력한 모델을 정부가 검증하고, 못 미더우면 출시를 막게 하자고 말하죠. 그런데 같은 시기에 내놓은 Fable 5는 스스로 가드레일을 빡빡하게 걸고 데이터 보존도 강화했습니다. 누군가는 앤트로픽의 말과 행동이 일치한다며 지지합니다. 반대로 비판하는 쪽은 이미 자기 회사에 맞춰 둔 방식을 업계 전체의 규칙으로 굳히려는 것 아니냐고 봅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;생각해볼 질문&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;정책 제안 자체는 우리가 좌우할 수 없지만, 그가 깔아둔 전제는 생각해 볼 만한 질문이라 생각합니다.&lt;/p&gt;&lt;ul&gt;&lt;li&gt;1~2년 안에 AI가 지금보다 훨씬 강력해진다면, 지금 내가 시간을 들여 쌓는 것 중에 그때 가치가 줄어들 건 무엇이고, 오히려 더 중요해질 건 무엇인가요?&lt;/li&gt;&lt;li&gt;한 사람이나 작은 팀도 큰 제품을 만들 수 있다는데, 나는 그 레버리지를 지금 어디에 쓰고 있나요?&lt;/li&gt;&lt;li&gt;내 작업이나 제품이 특정 모델 한 곳에 얼마나 묶여 있나요? 그게 막히거나 조건이 바뀌면 무슨 일이 생기나요?&lt;/li&gt;&lt;/ul&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;p style="text-align:justify;"&gt;다음 주에도 여러분이 놓치지 말아야 할 프로덕트 메이커 소식을 정리해서 찾아뵙겠습니다. 요즘 프로덕트 메이커 콘텐츠가 도움이 되셨다면, 꼭 작가 알림 설정을 부탁드립니다. 콘텐츠 내용 중 잘못된 정보나 정정이 필요한 부분이 있다면 댓글로 알려주세요. 빠르게 수정하겠습니다. 다음 주에 또 만나요!&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image"&gt;&lt;a href="https://yozm.wishket.com/magazine/@FinalCatti/"&gt;&lt;img src="https://www.wishket.com/media/news/3798/image7.gif"&gt;&lt;/a&gt;&lt;figcaption&gt;콘텐츠가 마음에 드셨다면, 꼭꼭 작가 알림 설정과 좋아요를 부탁드립니다!&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>AI 기능은 '프롬프트'가 아니라 '시스템'으로 만든다</title><link>https://yozm.wishket.com/magazine/detail/3797</link><description>두 시간짜리 영화의 엔딩 크레딧이 보여주는 진실은, 한 편이 수백 명의 시스템적 결과물이라는 사실입니다. AI 기능도 마찬가지입니다. 사용자 눈에는 '프롬프트 한 줄로 만든 챗봇'처럼 보이지만, 실제로는 입력 처리·프롬프트·출력 처리·오케스트레이션 네 레이어와 신뢰·연착륙 설계가 함께 돌아갑니다. AI가 틀린다는 사실을 한계가 아니라 설계의 출발점으로 보고, '틀릴 때 어떻게 행동하느냐'를 짜는 PM의 시선. AI 시대의 PM은 LLM을 부리는 사람이 아니라 LLM이 일할 시스템을 짓는 사람입니다.</description><guid>https://yozm.wishket.com/magazine/detail/3797</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p&gt;&lt;i&gt;&lt;strong&gt;&amp;lt;AI 프로덕트 매니지먼트&lt;/strong&gt;&lt;/i&gt; 시리즈&amp;gt; ③&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;새로운 시대의 AI 프로덕트가 기존의 프로덕트와 무엇이 다른지를 다룹니다. PM의 관점에서 말하지만, AI 프로덕트를 다루는 모두 참고할 만한 이야기를 묶었습니다. 필자가 출간할 예정인 〈AI Product Management(가제)〉 책의 일부를 요즘IT 독자의 시선에 맞춰 재가공했습니다.&lt;/i&gt;&lt;/span&gt;&lt;br&gt;&lt;br&gt;① &lt;a href="https://yozm.wishket.com/magazine/detail/3775/"&gt;&lt;u&gt;AI는 왜 자꾸 틀리는가&lt;/u&gt;&lt;/a&gt;&lt;/p&gt;&lt;p&gt;② &lt;a href="https://yozm.wishket.com/magazine/detail/3784/"&gt;&lt;u&gt;PM은 LLM을 어디까지 이해해야 할까?&lt;/u&gt;&lt;/a&gt;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;③ AI 기능은 프롬프트가 아니라 시스템으로 만든다&lt;/strong&gt;&lt;/p&gt;&lt;hr&gt;&lt;h3&gt;&lt;strong&gt;한 줄의 시나리오가 한 편의 영화가 되기까지&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;두 시간짜리 영화 한 편이 끝나고 나면, 관객들은 대부분 자리를 뜹니다. 그러나 그 자리에 그대로 앉아 화면을 끝까지 보는 사람들도 있습니다. 엔딩 크레딧 때문입니다. 영화의 모든 장면이 끝난 다음, 검은 화면 위로 흰 글씨가 끝없이 올라옵니다. 감독, 각본, 주연 배우, 조연. 거기까지는 우리도 잘 압니다. 하지만, 크레딧은 그 아래로도 계속 이어집니다. 촬영감독, 미술감독, 의상, 분장, 음향, 편집, 시각효과. 시각효과 안에서도 다시 갈라집니다. 모델링 아티스트, 텍스처 아티스트, 라이팅, 컴포지터. 끝나지 않을 것 같은 이름의 행렬이 5분 가까이 이어집니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그런데 우리는 그 영화를 "봉준호의 작품"이라고, "크리스토퍼 놀란의 영화"라고 부릅니다. 한 사람의 작품처럼 말하는 것입니다. 그러나 엔딩 크레딧이 보여주는 진실은 다릅니다. 한 편의 영화는 수백 명, 때로는 수천 명이 각자의 자리에서 만들어내는 거대한 시스템의 결과물입니다. 감독이 &amp;nbsp;"파리의 한 카페에서 두 남녀가 만난다"는 한 줄을 시나리오에 적었다면, 그 한 줄을 한 장면으로 만들기 위해 카메라가 어디에 놓이고, 조명이 어떻게 떨어지고, 의상이 무엇이며, 카페 안의 작은 컵 하나로 무엇을 쓸지는 누군가 골라야 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;AI 기능(feature)도 똑같습니다.&lt;/strong&gt;사용자의 눈에는 "프롬프트 한 줄로 만든 챗봇"처럼 보이지만, 실제로 그 챗봇이 사용자 앞에 서기까지는 영화 엔딩 크레딧만큼이나 많은 시스템 요소가 작동합니다. 그런데 많은 PM이 "AI 기능 = 한 줄의 좋은 프롬프트"라는 생각을 갖습니다. 이 환상을 깨야, 공들여 출시한 AI 기능이 왜 자꾸 이상한 답을 내놓는지 비로소 보입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이번 글에서는 AI 기능이 어떤 시스템으로 구성되는지, 그리고 그 시스템 안에 "틀릴 수 있다"는 LLM의 특성을 어떻게 새겨 넣어야 하는지를 함께 다룹니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;1. "프롬프트 한 줄"이라는 환상&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;LLM이 등장하고 PM들이 흔히 하는 말이 있습니다. "이거 프롬프트로 되겠는데요?" 회사 내부의 어떤 자동화 과제를 보면서, 어떤 사용자 기능을 떠올리면서, 이 말이 자주 나옵니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그런데 막상 만들어보면 이상한 일이 벌어집니다. 데모에서는 잘 동작하던 프롬프트가, 실제 사용자 100명이 들어오자 무너지기 시작합니다. 어떤 사용자는 질문을 너무 길게 합니다. 어떤 사용자는 회사와 전혀 관계없는 농담을 던집니다. 어떤 사용자는 영어로 질문하고, 어떤 사용자는 오타를 잔뜩 보냅니다. 그런 혼란 속에 모델은 매번 다른 결과를 내놓고, 가끔은 회사의 정책과 어긋나는 답을 자신만만하게 합니다. &lt;a href="https://yozm.wishket.com/magazine/detail/3775/"&gt;&lt;u&gt;1편&lt;/u&gt;&lt;/a&gt;에서 본 에어캐나다 챗봇이 정확히 이런 모습이었습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;프롬프트 한 줄로만 구현한 기능이 무너지는 이유는 단순합니다. 프롬프트는 "모델에게 던지는 한마디"일 뿐, 그 한마디가 어떤 환경에서 어떤 사용자를 만나 어떤 결과로 이어질지에 대한 그 어떤 설계도 담지 않기 때문입니다.&lt;/strong&gt; 그래서 데모는 잘 돌아가는데 프로덕트는 무너집니다. 데모는 우리가 보여주고 싶은 입력으로만 테스트하고, 프로덕트는 우리가 상상하지 못한 입력을 받기 때문입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그러니 결론부터 말하면, AI 기능은 프롬프트가 아니라 시스템입니다. 프롬프트는 그 시스템의 한 부품일 뿐입니다. 좋은 AI 기능을 만들려면, 그 시스템이 무엇으로 구성되는지를 알아야 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;2. AI 기능을 구성하는 네 가지 시스템 레이어&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;AI 기능을 만든다는 것은 4가지 시스템 레이어를 함께 설계하는 일입니다. 한 레이어라도 빠지면 기능이 무너지거나, 무너질 가능성을 안고 출시됩니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;레이어 1. 입력 처리(Input Handling)&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;사용자가 던지는 입력은 우리가 상상한 것과 다릅니다. 너무 길고, 너무 짧고, 욕설이 섞여 있고, 회사와 무관한 질문이며, 개인정보가 포함되어 있거나, 다른 언어로 들어옵니다. 이 모든 "날것의 입력"을 그대로 모델에게 던지면 안 됩니다. 입력을 검증하고, 정리하고, 필요하면 차단하는 단계가 필요합니다. 의료 상담 챗봇이라면 "이건 우리 서비스 영역이 아닙니다"라고 미리 거를 줄 알아야 하고, 고객 지원 챗봇이라면 긴 질문을 적절히 압축할 줄 알아야 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;레이어 2. 프롬프트(Prompt)&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;우리가 흔히 "프롬프트"라고 부르는 그 부분은 사실 시스템의 두 번째 레이어입니다. 잘 짜인 프롬프트는 단순히 "고객 질문에 답해줘" 같은 구성이 아닙니다. 모델에게 역할을 부여하고, 답변의 형식을 지정하고, 어떤 정보를 참고해야 하는지 알려주고, 어떤 답변은 하지 말아야 하는지 명시합니다. 그리고 &lt;a href="https://yozm.wishket.com/magazine/detail/3784/"&gt;&lt;u&gt;이전 편&lt;/u&gt;&lt;/a&gt;에서 다룬 RAG를 적용한다면, 이 단계에서 "참고서"가 함께 들어갑니다. 좋은 프롬프트는 한 줄이 아니라 한 페이지에 가까운 정교한 문서의 형태를 띱니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;레이어 3. 출력 처리(Output Handling)&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;모델이 답을 내놓았다고 끝이 아닙니다. 그 답이 그대로 사용자에게 가면 안 되는 경우가 많습니다. 답에 회사 기밀이 들어 있지는 않은지, 욕설이나 차별 표현이 섞여 있지는 않은지, 약속하지 말아야 할 것을 약속하지는 않았는지(에어캐나다 챗봇이 여기서 무너졌습니다), 형식이 정해진 대로 나왔는지를 검사합니다. 필요하면 답을 수정하거나, 다른 답을 다시 요청하거나, 사람에게 넘깁니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;레이어 4. 오케스트레이션(Orchestration)&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;위 세 레이어가 한 번에 끝나면 단순한 기능입니다. 그런데 실제 AI 기능은 여러 번의 모델 호출이 이어지는 경우가 많습니다. 사용자 질문을 분석해서 어떤 자료가 필요한지 판단하고(1차 호출), 그 자료를 검색해, 검색 결과를 바탕으로 답을 생성하고(2차 호출), 그 답을 검증하는(3차 호출) 식입니다. 이 흐름을 지휘하는 것이 오케스트레이션 레이어입니다. 어떤 단계가 실패하면 어떻게 복구할 것인지, 비용이 폭발하지 않도록 어디서 멈출 것인지를 함께 설계해야 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이 네 개의 레이어가 다 있어야 진정한 의미의 AI 기능입니다.&lt;/strong&gt; 프롬프트 한 줄만 있는 것은 데모이지 프로덕트가 아닙니다. PM이 AI 기능을 기획할 때, "프롬프트는 어떻게 쓸까"가 아니라 "이 네 개의 레이어를 어떻게 설계할까"를 먼저 묻기 시작해야 사고의 출발점이 달라집니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:60%;"&gt;&lt;img src="https://www.wishket.com/media/news/3797/image3.png"&gt;&lt;figcaption&gt;AI 기능을 구성하는 4가지 레이어 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;3. 시스템 프롬프트: 사용자가 보지 않는 설계자&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;두 번째 레이어인 프롬프트에 대해 한 가지 더 짚을 게 있습니다. AI 기능에는 보통 두 종류의 프롬프트가 있습니다. 사용자가 보내는 메시지(예. "가족 장례로 인한 할인 있나요?")가 하나, 그리고 사용자가 절대 보지 않는, 시스템 차원에서 모델에게 항상 주어지는 지시문이 또 하나입니다. 후자를 시스템 프롬프트라고 부릅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;시스템 프롬프트는 영화로 치면 감독이 모든 배우에게 "이 영화는 이런 톤이고, 이런 시대 배경이고, 이런 캐릭터입니다"라고 미리 알려주는 것과 같습니다. 배우는 그 디렉팅을 아주 잘 이해할 때, 감독이 원하는 모습을 그려내며 연기할 수 있습니다. 그렇기에 사용자 메시지가 아무리 다양하게 들어와도, 시스템 프롬프트가 잘 짜여 있으면 모델은 일관된 캐릭터를 유지합니다. 반대로 시스템 프롬프트가 부실하면, 한 챗봇이 어떤 사용자에게는 형님처럼, 어떤 사용자에게는 비서처럼, 어떤 사용자에게는 어린아이처럼 굴게 됩니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;좋은 시스템 프롬프트에는 보통 다섯 가지가 들어갑니다.&lt;/p&gt;&lt;ol&gt;&lt;li&gt;모델의 역할: "당신은 ○○ 회사의 고객 지원 담당자입니다"&lt;/li&gt;&lt;li&gt;답변의 톤과 형식: "존댓말로, 5문장 이내로"&lt;/li&gt;&lt;li&gt;참고해야 할 정보의 출처: "아래 정책 문서를 근거로 답하세요"&lt;/li&gt;&lt;li&gt;하지 말아야 할 것의 목록: "가격을 임의로 약속하지 마세요"&lt;/li&gt;&lt;li&gt;막혔을 때의 출구: "확실하지 않으면 '담당자에게 연결해 드리겠습니다'라고 답하세요”&lt;/li&gt;&lt;/ol&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이 다섯 가지가 빠진 채 출시되는 반쪽짜리 AI 기능이 의외로 많습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;4. AI는 왜 틀리고, 왜 그것이 UX의 문제인가&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;여기까지는 시스템의 "뼈대"를 살펴보았습니다. 입력을 받고, 모델에게 잘 묻고, 답을 검증해서 내놓는 흐름. 그런데 이 뼈대를 아무리 잘 갖춰도 AI는 여전히 틀립니다. 모델이 확률적으로 답을 생성하는 한, 어떤 시스템도 환각을 0으로 만들 수 없습니다. 그렇다면 PM은 이 "틀림"을 어떻게 다뤄야 할까요?&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;여기서 &lt;strong&gt;결정적인 시각 전환이 필요합니다. AI가 틀린다는 사실을 "기술의 한계"가 아니라 "설계의 출발점"으로 보는 일입니다.&lt;/strong&gt; 모델이 틀리는 것을 막을 수 없다는 사실을 인정한 다음, 그 틀림을 사용자가 어떻게 경험할지를 PM이 설계해야 합니다. 같은 환각이 일어나도, UX가 어떻게 설계되어 있느냐에 따라 사용자가 받는 충격은 천양지차입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;1편의 에어캐나다 챗봇 사건을 다시 봅시다. 챗봇은 "즉시 여행이 필요하시면 정상 요금으로 구매 후 90일 이내에 사별 할인을 소급 신청하실 수 있습니다"라고 답했습니다. 그 답은 “사별 할인은 사전에만 신청할 수 있다”는 회사의 진짜 정책과 달랐습니다. 그러나 사용자는 그 답을 100% 믿고 행동했고, 결국 회사가 법정에 서게 됐죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그런데 이 사건의 진짜 비극은 챗봇이 틀렸다는 현상 그 자체는 아닙니다. 챗봇이 "이건 정확하지 않을 수 있다"는 신호를 어디에도 주지 않은 채, 자신만만한 어조로 답해버렸다는 사실입니다. 만약 같은 답을 냈더라도 "정확한 정책은 여기서 확인해 주세요"라는 링크 한 줄, 혹은 "확실하지 않은 경우 상담사에게 연결해드리겠습니다"라는 옵션이 함께 떠 있었다면, 사용자는 그 답을 그대로 믿지 않거나 의심했을 테고, 법정 다툼도 일어나지 않았을 것입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이게 "AI가 틀리는 것은 UX의 문제"라는 말의 의미입니다. 모델이 틀린 답을 내는 것은 막을 수 없습니다. 하지만 사용자가 그 답을 어떻게 받아들이는지는 PM이 설계할 수 있습니다. 그리고 그 설계의 책임을 회피하면 사고로 이어집니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;AI 프로덕트의 UX 설계는 "틀리지 않는 척하는 법"이 아니라 "틀릴 수 있다는 사실을 정직하게 알리는 법"입니다.&lt;/strong&gt; 역설적으로, 이 정직함이 사용자의 신뢰를 만들어냅니다. "100% 정확합니다"라고 호언장담하는 시스템보다, "이 답은 ○○ 자료를 근거로 만들었고, 확실하지 않다면 여기서 확인하세요"라고 말하는 시스템을 우리는 더 신뢰합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;5. 불확실성을 UX로 처리하는 법&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;그렇다면 "틀릴 수 있다"는 전제를 UX에 어떻게 새겨 넣을까요? 가장 먼저 손볼 곳은 "표현"입니다. AI가 내놓는 답의 어조, 형식, 강도가 사용자의 신뢰에 결정적으로 영향을 미치기 때문입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;확신형 표현 vs 확률형 표현&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;AI 답변을 화면에 띄울 때 가장 흔히 빠지는 함정은 "확신형 표현"입니다. 사용자가 "이게 정답이에요"라고 해석할 만한 톤으로 답을 던지는 것이죠. 에어캐나다 챗봇의 "네, ~한 절차로 신청하시면 됩니다"가 정확히 그런 표현이었습니다. 모델은 사실 확률 분포에서 가장 그럴듯한 답을 뽑은 것뿐인데, 확신 기반 설계는 그것을 "확정된 사실"인 것처럼 보여줍니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;좋은 AI UX는 의도적으로 "확률형 표현"을 씁니다.&lt;/strong&gt;같은 답을 하더라도 어조가 다릅니다. "네, 90일 이내 소급 신청 가능합니다" 대신 "안내해 드린 정보가 맞다면 90일 이내 소급 신청이 가능합니다. 다만 정확한 정책은 [공식 안내 페이지]에서 한 번 더 확인해 주세요"라고 말하는 식입니다. 답을 던지되, 그 답이 어디서 왔고 얼마나 확신할 수 있는지를 함께 보여줍니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이건 단순한 친절이 아닙니다. AI가 틀렸을 때 회사와 제품을 보호하는 방어선이기도 합니다. 동시에 사용자가 "이 시스템은 정직하다"고 느끼게 만드는 신뢰의 토대이기도 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;신뢰 설계의 세 가지 패턴&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;성숙한 AI 프로덕트들이 공통적으로 채택하는 신뢰 설계 패턴이 세 가지 있습니다. 이 세 가지를 시스템의 출력 처리 레이어에 의식적으로 새겨 넣어야 합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;첫째, 출처 표시:&lt;/strong&gt; 답이 어디에서 왔는지를 함께 보여줍니다. "이 답은 회사 정책 문서 v2.3을 근거로 작성되었습니다"라거나, RAG에서 참조한 문서의 링크를 답 옆에 함께 띄우는 식입니다. Perplexity 같은 서비스가 답변 옆에 항상 참조 URL을 보여주는 것이 대표적입니다. 출처가 있으면 사용자는 그 답을 검증할 수 있고, 검증할 수 있으면 신뢰가 쌓입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;둘째, 확신 정도:&lt;/strong&gt; 모델이 얼마나 확신하는지를 표시합니다. 모든 답에 "확실해요!"라고 하기보다, 어떤 답에는 "확실합니다", 어떤 답에는 "~로 보입니다", 어떤 답에는 "잘 모르겠습니다"라고 톤을 다르게 가져갑니다. ChatGPT나 Claude가 채팅창 아래 작은 글씨로 "AI는 실수할 수 있습니다"라고 적어두는 것도 같은 맥락입니다. 사용자가 그 답을 얼마나 무게감 있게 받아들여야 하는지에 대한 신호를 주는 것입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;셋째, 사람에게로의 탈출구:&lt;/strong&gt; AI가 풀 수 없는 상황에서 사용자가 막히지 않도록, 사람에게 넘어갈 수 있는 경로를 항상 만들어둡니다. "상담사 연결" 버튼이 어디에 있는가, 어떤 상황에서 그 버튼이 두드러져 보이는가를 의식적으로 설계합니다. 좋은 시스템을 갖춘 AI 기능은 결과에 대한 자신감이 떨어질 때 스스로 "이 부분은 담당자에게 연결해 드릴까요?"라고 먼저 제안하기도 합니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;언제 "모르겠다"고 말해야 하는가&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;&lt;strong&gt;AI 프로덕트 UX에서 가장 어려운 결정 중 하나가 이것입니다.&lt;/strong&gt;어떤 질문에는 답을 내고, 어떤 질문에는 답을 거부할 것인가? 이 경계를 잘 그어두지 않으면 모델은 모든 질문에 답을 만들어내려다 실패하고(환각), 그러한 오류는 위험한 영역까지 침투합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;이 경계를 정하는 것이 PM의 일입니다.&lt;/strong&gt; 의료·법률·금융처럼 잘못된 답의 비용이 큰 영역에서는 시스템이 더 자주 "모르겠다"고 말하도록 설계해야 합니다. 반대로 추천이나 요약 같은 영역에서는 너무 자주 거부하면 도구로서의 가치가 떨어지므로 최대한 답변을 시도하는 쪽으로 기울일 수 있습니다. 어떤 영역에서는 "답을 안 하는 용기"가 "답을 내는 자신감"보다 더 큰 가치를 만듭니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;6. 연착륙 설계: 좋은 실패와 나쁜 실패의 차이&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;이러한 시스템과 UX를 아무리 잘 설계해도 AI는 결국 어디선가 실패합니다. 모델이 답을 못 내놓거나, 답이 형식에 맞지 않거나, 정책에 어긋나거나, 비용이 한도를 넘어가거나. 이 모든 "실패의 순간"에 시스템이 어떻게 반응할지를 미리 설계해 두는 것이 연착륙 설계(Graceful Degradation)입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;같은 실패도 "나쁜 실패"와 "좋은 실패"가 있습니다. 나쁜 실패는 사용자에게 "이 AI가 망가졌네"라는 인상을 남기는 실패입니다. 갑자기 화면이 빈 채로 멈춰버린다거나, "오류가 발생했습니다"라는 메시지만 보여주고 끝나버리는 식입니다. 좋은 실패는 사용자가 "이건 사람이 도와줘야겠네"라고 자연스럽게 받아들이도록 만드는 실패입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;재시도 · 폴백 · 사람 연결의 흐름&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;좋은 연착륙 설계는 보통 세 단계로 흐릅니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;첫 단계는 재시도(Retry):&lt;/strong&gt; 같은 질문을 다른 방식으로 다시 모델에 던져봅니다. 프롬프트를 살짝 바꾸거나, 다른 모델로 한 번 더 시도하거나, 컨텍스트를 정리해서 다시 묻습니다. 사용자는 시스템이 한 번 흔들렸다는 것을 알아채지 못한 채 답을 받게 됩니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;두 번째 단계는 폴백(Fallback):&lt;/strong&gt; 재시도로도 안 되면, AI가 아닌 다른 방식으로 답을 제공합니다. 자주 묻는 질문 FAQ로 보여주거나, 검색 결과를 제시하거나, 미리 준비된 안내 페이지로 연결합니다. "AI가 답을 못 했다"가 아니라 "이 질문에는 이 자료가 도움이 될 것 같다"는 형식으로 사용자에게 가치를 계속 전달합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;세 번째 단계는 사람 연결(Escalation):&lt;/strong&gt; 폴백도 부족할 때, 자연스럽게 사람에게 넘깁니다. "이 부분은 담당자가 도와드리는 것이 좋겠습니다"라고 안내하면서, 사용자가 다시 처음부터 설명하지 않아도 되도록 그동안의 대화 내용을 담당자에게 함께 전달합니다. 사용자 입장에서는 "AI에서 사람으로" 매끄럽게 이어지는 경험을 얻습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;신뢰는 정확도가 아니라 일관성과 정직함에서 온다&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;마지막으로, AI 프로덕트의 UX 설계에서 가장 흔히 하는 오해는 "정확도를 높이면 신뢰가 올라간다"는 생각입니다. 어느 정도까지는 맞지만, 어느 지점부터는 정확도를 1~2% 더 올리는 것보다 시스템이 일관되게 행동하고 정직하게 한계를 드러내는 것이 사용자 신뢰에 훨씬 큰 영향을 줍니다. 95% 정확하지만 정직한 시스템과 98% 정확하지만 자신만만하게 틀리는 시스템 중에서, 사용자는 전자를 압도적으로 더 신뢰합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;AI 프로덕트의 신뢰는 "틀리지 않음"이 아니라 "틀릴 때 어떻게 행동하느냐"에서 만들어집니다. 연착륙 설계는 그 "행동"의 구체적 형태입니다.&lt;/strong&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;7. PM이 AI 기능을 기획할 때 챙겨야 할 것&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;정리하자면, AI 기능을 기획할 때 PM의 머릿속에 있어야 할 체크리스트는 다음과 같습니다. 시스템의 뼈대와 "틀릴 수 있다"를 새기는 UX 설계를 합쳐서 정리한 것입니다. "좋은 프롬프트 한 줄"보다 훨씬 길고 복잡하지만, 이것이 "AI 기능을 시스템으로 설계한다"는 말의 진짜 의미입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;ol&gt;&lt;li&gt;&lt;strong&gt;입력 검증:&lt;/strong&gt;사용자의 어떤 입력을 받을 것이고, 어떤 입력은 미리 거를 것인가?&lt;/li&gt;&lt;li&gt;&lt;strong&gt;시스템 프롬프트:&lt;/strong&gt; 모델의 역할·톤·금지 사항·막혔을 때의 출구를 어떻게 정의할 것인가?&lt;/li&gt;&lt;li&gt;&lt;strong&gt;참고 자료(RAG):&lt;/strong&gt;모델이 무엇을 보고 답하게 할 것인가? 그 자료는 어떻게 최신으로 유지할 것인가?&lt;/li&gt;&lt;li&gt;&lt;strong&gt;출력 검증:&lt;/strong&gt;모델의 답을 그대로 보여줄 것인가, 검증 후 보여줄 것인가?&lt;/li&gt;&lt;li&gt;&lt;strong&gt;신뢰 신호(Sources, Confidence, Escalation):&lt;/strong&gt;사용자가 답을 어디까지 믿을지 짐작할 신호는 어디에 어떻게 넣을 것인가?&lt;/li&gt;&lt;li&gt;&lt;strong&gt;연착륙 설계:&lt;/strong&gt;실패 시 사용자가 어떤 경로로 빠져나갈 수 있는가? 재시도·폴백·사람 연결 중 어떤 조합으로 갈 것인가?&lt;/li&gt;&lt;li&gt;&lt;strong&gt;오케스트레이션:&lt;/strong&gt;한 번의 모델 호출로 끝나는가, 여러 단계로 흐르는가? 비용이 폭발하지 않게 어디서 멈출 것인가?&lt;/li&gt;&lt;/ol&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이 일곱 가지에 망설임 없이 답할 수 있을 때, 비로소 "AI 기능을 시스템으로 설계했다"고 말할 수 있습니다. 이걸 PRD에 어떻게 담을지, 그리고 출시 후에는 어떻게 운영할지는 다음 글에서 따로 다루겠습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;AI 기능은 한 사람의 작품이 아니다&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;처음으로 돌아갑니다. 우리는 영화 한 편을 "봉준호의 작품"이라고 부르지만, 엔딩 크레딧이 보여주는 진실은 "수많은 사람의 시스템"이 영화를 만든다는 사실입니다. 그 시스템이 잘 돌아가야만 우리는 그 영화를 "봉준호의 작품"이라고 부를 수 있습니다. 시스템이 무너지면, 아무리 좋은 감독이라도 영화의 완성도는 무너집니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;AI 기능도 이와 같습니다. 우리가 출시하는 챗봇은 "LLM의 작품"처럼 보이지만, 실제로는 입력 처리·프롬프트·출력 처리·오케스트레이션·신뢰 설계·연착륙 설계가 함께 만들어내는 거대한 시스템의 결과물입니다. 좋은 PM은 " LLM에 무엇을 물을까"가 아니라 "이 시스템 전체를 어떻게 짤까"를 묻습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;AI 시대의 PM은, LLM을 부리는 사람이 아니라 LLM이 일할 시스템을 짓는 사람입니다.&lt;/strong&gt; 그리고 그 시스템 안에 "AI는 틀릴 수 있다"는 사실이 정직하게 새겨져 있을 때, 비로소 AI 프로덕트는 사용자의 신뢰를 얻게 됩니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#757575;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>'미토스(mythos)'급 '페이블 5(Fable 5)' 공개 + 차단 소식 업데이트</title><link>https://yozm.wishket.com/magazine/detail/3796</link><description>6월 9일, 앤트로픽이 페이블 5(Fable 5)와 미토스 5(Mythos 5)를 동시에 공개했습니다. 페이블 5는 앤트로픽이 일반에 푼 모델 가운데 역대 가장 강력하고, 미토스 5는 그 페이블에서 안전장치만 들어낸 쌍둥이입니다. 앤트로픽은 지난 Opus 4.8 공개 당시, 미토스 프리뷰 소식도 함께 전하며 '미토스를 일반에 공개하기 위한 강력한 보안 조치에서 빠르게 성과가 나고 있다'고 밝힌 바 있는데요. 결국 미토스 5는 '프로젝트 글래스윙'을 통해 극소수에게만 공개되었고, 일반 사용자는 미토스 본체가 아니라 '페이블'이란 얼굴로, ‘통제’를 더한 미토스를 만나게 됐습니다. </description><guid>https://yozm.wishket.com/magazine/detail/3796</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;figure class="table"&gt;&lt;table&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td style="background-color:hsl(0, 0%, 90%);"&gt;&lt;p&gt;&lt;strong&gt;&amp;nbsp;[업데이트 · 2026.06.12]&lt;/strong&gt;&lt;/p&gt;&lt;p&gt;이 글에서 소개한 Fable 5와 Mythos 5에 대한 접근이 전면중단됐습니다.&lt;br&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li&gt;&lt;strong&gt;무슨 일&lt;/strong&gt;: &lt;strong&gt;미국 정부가 국가안보 권한을 근거로 수출통제 지시를 발령&lt;/strong&gt;했고, 앤트로픽은 6월 12일 오후 5시 21분(미 동부시간) 지시를 받은 직후 &lt;strong&gt;두 모델의 모든 접근을 중단&lt;/strong&gt;했습니다. 미국 내·외, 미국 시민·외국인 직원 구분 없이 적용됩니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;이유&lt;/strong&gt;: 정부는 “Fable 5의 보안 우회(jailbreak) 기법이 발견됐다”는 점을 들었습니다. 앤트로픽이 검토한 우회는 모델에게 특정 코드베이스를 읽혀 소프트웨어 결함을 찾게 하는 좁은 범위의 비(非)보편적 기법으로, GPT-5.5 등 다른 모델에서도 흔히 가능한 수준이라고 반박했습니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;다른 모델은?&lt;/strong&gt; Opus 4.8, Sonnet, Haiku 등 나머지 앤트로픽 모델은 정상적으로 이용할 수 있습니다. 현재로선 사실상 오푸스 4.8이 유일한 선택지가 됐습니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;앞으로&lt;/strong&gt;: 앤트로픽은 “가능한 빨리 접근을 복구하기 위해 노력 중”이라고 밝혔으나 구체적 복구 일정이나 환불 언급은 없습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;i&gt;출처: 앤트로픽 공식 성명 “&lt;/i&gt;&lt;a href="https://www.anthropic.com/news/fable-mythos-access"&gt;&lt;i&gt;Statement on the US government directive to suspend access to Fable 5 and Mythos 5&lt;/i&gt;&lt;/a&gt;&lt;i&gt;”, 2026.06.12)&lt;/i&gt;&lt;/p&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;6월 9일, 앤트로픽이 Fable 5와 Mythos 5를 동시에 공개했습니다. Fable 5는 앤트로픽이 일반에 푼 모델 가운데 역대 가장 강력한 모델로, Mythos급 성능에 안전장치를 더해 사이버보안·생물·화학 등 고위험 영역에서는 Opus 4.8로 응답을 돌립니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앤트로픽은 지난 Opus 4.8 공개 당시, Mythos 프리뷰 소식도 함께 전하며 'Mythos를 일반에 공개하기 위한 강력한 보안 조치에서 빠르게 성과가 나고 있다'고 밝힌 바 있는데요. 결국 Mythos 5는 '프로젝트 글래스윙'을 통해 극소수에게만 공개되었고, 일반 사용자는 Mythos 본체가 아니라 'Fable'이란 얼굴로, ‘통제’를 더한 미토스를 만나게 됐습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3796/image2.png"&gt;&lt;figcaption&gt;&lt;span style="color:rgb(158,158,158);"&gt;&amp;nbsp;&amp;lt;출처: Anthropic&amp;gt;&lt;/span&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;[핵심 관전 포인트]&lt;/strong&gt;&lt;/h4&gt;&lt;ol&gt;&lt;li style="text-align:justify;"&gt;가격: 6월 22일까지는 추가 비용이 없지만, 6월 23일부터는 사용량 크레딧이 필요합니다. GPT-5.5보다 성능은 앞서지만 값은 더 비쌉니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;폴백(fallback): 보안·바이오 같은 고위험 주제를 건드리면 Fable 5가 한 단계 아래 Opus 4.8로 갈아탑니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;한국: 일반 사용자가 받아 든 건 Fable이지만, 한국의 주요 기업·기관은 글래스윙을 통해 Mythos 라인에 올라 있습니다.&lt;/li&gt;&lt;/ol&gt;&lt;hr&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;같은 모델, 다른 얼굴: 페이블과 미토스&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;우선 공식 문서 &lt;a href="Claude Fable 5 and Claude Mythos 5"&gt;Claude Fable 5 and Claude Mythos 5&lt;/a&gt;를 기반으로 짚어보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Mythos가 역대 어느 모델보다 강력하다는 건 이전부터 흘러나오던 이야기이고요. Mythos와 같은 모델이지만 일반 공개를 위해 안전장치를 더한 Fable 또한 "앤트로픽이 일반에 공개한 역대 어떤 모델보다 강력하다"는 게 앤트로픽의 설명입니다. 물론 새로운 모델이 공개될 때마다 직전보다 강한 모델이 나오는 건 새삼스러운 일이 아니죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이번 공개에서 핵심은 '같은 모델을 둘로 나눠 냈다'는 점입니다. 앤트로픽 공식 발표문의 한 줄이 그걸 압축해 보여줍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;Mythos 5는 Fable 5와 같은 기반 모델이되, 일부 영역에서 안전장치만 해제했다.&lt;/strong&gt; &lt;i&gt;It's the same underlying model as Fable 5, but with the safeguards lifted in some areas.&lt;/i&gt; (앤트로픽 공식 발표문)&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;즉, Fable 5와 Mythos 5는 같은 모델입니다. 둘을 가르는 건 오직 안전장치죠. Fable은 위험한 질문에 답하지 않도록 제한을 걸어 일반에 풀었고, Mythos는 그 제한(특히 사이버 보안 영역)을 푼 채 프로젝트 글래스윙(Project Glasswing)을 통해 극소수에게만 공개됐습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;능력 자체는 역대 모델 가운데 가장 강하다는 주장에 맞게, 소프트웨어 엔지니어링, 지식 노동, 비전, 과학 연구까지 거의 모든 벤치마크에서 최고 수준을 찍었고, 작업이 길고 복잡할수록 격차가 더 벌어진다고 했죠. 특히 도드라지는 건 '오래 혼자 일하는' 능력입니다. 사람 지시 없이 여러 단계를 스스로 처리하는 에이전트형 작업에서 두드러지는데, 뒤에서 볼 SWE-Bench Pro 점수가 이를 보여줍니다. 공식 발표에서는 메모리를 줬을 때 성능이 크게 오른다는 사례도 공개했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이름도 두 모델의 관계에 맞는 단어로 붙었습니다. Fable은 라틴어 파불라(fabula), 즉 '이야기된 것'에서 온 단어로, 신화, 이야기를 뜻하는 그리스어 mythos와 비슷합니다. 같은 모델을 기반으로 차이를 둔 만큼 이름도 비슷한 것으로 지었습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 앞서도 말했지만, Mythos는 앤트로픽이 4월에 시작한 사이버 보안 협력 프로그램 프로젝트 글래스윙을 통해서만 공개됐습니다. 글래스윙은 Mythos가 악용될 위험을 우려해 일반에 풀지 않는 대신, 검증된 사이버 방어 조직과 핵심 인프라 사업자에게만 모델을 내주고, 이들이 취약점을 찾아 패치하도록 하는 통제된 접근 체계인데요. 참여 조직은 신청과 심사를 거쳐 들어갑니다. 한국도 여기에 포함되었고요. &amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;어디까지 잘하나: 벤치마크로 본 기본기&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;성능 수치는 이번 발표에서 가장 깔끔한 대목입니다. 특히 코딩이 헤드라인이고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;깃허브 이슈를 끝까지 해결하는 능력을 보는 SWE-Bench Pro에서 Fable 5와 Mythos 5는 80.3%를 기록했습니다. Opus 4.8(69.2%), GPT-5.5(58.6%), Gemini 3.1 Pro(54.2%)를 큰 격차로 따돌린 수치죠. Fable&amp;nbsp;5와 Mythos 5의 주요 스펙은 아래 표로 정리했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3796/image3.png"&gt;&lt;figcaption&gt;&lt;span style="color:rgb(158,158,158);"&gt;표의 페이블 5·미토스 5 값은 둘 중 높은 쪽입니다(두 모델 점수 차이는 1~3%포인트). 별표(*) 항목은 미토스 5 기준이고요. 사이버보안·생물 관련 질문은 페이블 5에서 차단·폴백되기 때문에, 이 항목의 실제 페이블 5 성능은 Opus 4.8에 가깝습니다. &amp;nbsp;&amp;lt;출처: Anthropic&amp;gt;&lt;/span&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;공식 발표에는 이 모델들의 능력을 보여주는 일화도 소개되어 있는데요. 결제 기업 스트라이프(Stripe)는 5천만 줄짜리 루비 코드베이스 마이그레이션을, 사람 팀이 두 달 넘게 걸릴 작업을 하루 만에 끝냈다고 전했습니다. 과학 영역에서는 모델이 연구를 거드는 단계를 넘어 연구를 하는 단계로 넘어서는 신호들이 보입니다. Mythos 5로 단백질 설계 일부를 약 10배 가속했고, 한 분자생물학 가설이 같은 문제를 독립적으로 연구하던 다른 실험실에서 실증되기도 했습니다. 100배 작은 유전체 모델이 학술지 사이언스(Science)에 실린 모델을 능가했다는 결과도 있고요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;현재는&amp;nbsp; Pro, Max, Team, Enterprise 요금제에서 추가 요금 없이 사용할 수 있는데요. 6월 23일부터는 별도 사용량 크레딧이 필요하다고 하네요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;페이블 5, 미토스 5 핵심 관전 포인트 3가지&lt;/strong&gt;&lt;/h3&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. 6월 23일부터는 추가 크레딧&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;두 모델 모두 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러입니다. 앤트로픽은 이 가격이 Mythos 프리뷰의 절반 이하라고 강조했지만, 외신들의 평가는 냉정합니다. 여전히 주요 AI 모델 중 가장 비싸다는 거죠. Opus 4.8($5/$25)의 정확히 두 배이고, 경쟁 모델 GPT-5.5($5/$30)보다도 비쌉니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런데 더 중요한 건 따로 있습니다. 앞으로 딱 약 10여일 간만 이 가격이 유지된다는 것입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Fable 5는 출시 시점부터 6월 22일까지 Pro, Max, Team, 좌석제 Enterprise 요금제 이용자라면 추가 비용 없이 사용할 수 있습니다. 하지만 6월 23일부터는 해당 요금제에서 빠지고, 쓰려면 별도 사용량 크레딧(usage credits)이 필요해집니다. 앤트로픽은 용량이 충분히 확보되면 다시 구독 요금제 기본 구성으로 되돌리겠다고 했지만, 그 시점은 정확히 언급하지 않았고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이를 두고 “줬다 뺐는다”는 사람들도 있고, “합리적”이라는 반응도 있습니다. 의도가 무엇이든, 6월 22일까지는 마음껏 테스트해 봐야겠습니다. 그 이후의 비용 구조는 미리 계산에 넣어 두는 게 안전하겠죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. 강한 안전장치로 인한 폴백(fallbacks)&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Fable 5가 Mythos에 안전 분류기만 더한 모델인 만큼 이 부분도 관전 포인트 중 하나인데요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;작동 방식은 이렇습니다. Fable&amp;nbsp; 5에는 별도 분류기(classifier, 질문이 위험한 주제인지 자동으로 가려내는 장치)가 붙어 사이버 보안 공격코드(익스플로잇) 생성, 생물·화학, 모델 디스틸레이션(증류, 큰 모델의 능력을 작은 모델로 옮기는 기법)이라는 좁은 고위험 주제를 감시합니다. 사용자의 질문이 이 분류기를 건드리면, 모델은 Opus 4.8로 갈아탑니다. 사용자는 그 사실을 통지받고, 이렇게 모델이 전환되면 Fable&amp;nbsp;요금이 청구되지 않습니다. 모델은 바뀌어도 대화는 끊기지 않고 이어지고요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앤트로픽은 이 전환이 평균적으로 전체 세션의 5% 미만에서만 발동하고, 95% 이상 세션은 전환을 전혀 겪지 않는다고 밝혔는데요. 외부에서 검증된 수치는 아닙니다. 공개 첫날부터 해커뉴스에서는 다음과 같은 여러 사례가 공유되었습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;GPU 드라이버 구현 중 벤치마크 크래시 디버깅을 맡겼다가 사이버보안 주제로 분류돼 전환됐다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;본인 혈액 검사 결과를 검토해 달라고 했더니 즉시 Opus로 돌아갔&lt;span style="background-color:rgb(255,255,255);color:rgb(49,49,49);"&gt;다&lt;/span&gt;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;"UV 인덱스가 선글라스 쓸 타이밍의 좋은 지표인가"라는 첫 테스트 질문부터 필터에 걸렸다&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 앱에서 Fable 모델에게 이 글의 편집을 부탁했는데, 폴백됐습니다. 앤트로픽이 자체적으로 추정하는 5%와 사용자들이 체감하는 것 사이 어딘가에 진짜 숫자가 있겠죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;API로 쓰는 분이라면 하나 더 챙길 게 있어요. 앱에서는 전환이 알아서 일어나지만, API에서는 자동이 아니라서 Fable이 거부하면 요청이 거기서 멈춥니다. 폴백 파라미터를 넣거나 SDK 미들웨어를 써야 Opus 4.8로 넘겨받을 수 있고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런데 안전장치가 다소 과하게 조여져 있다는 평이 많아서 초기 사용자들 사이에서도 말이 많습니다. 앤트로픽 스스로도 분류기를 보수적으로 맞춰 놨다고 하고요. 멀쩡한 질문도 가끔 걸린다는 걸 인정하면서, 시간을 두고 오탐을 줄이겠다고 했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;또 중요한 게 하나 더 있어요. Fable&amp;nbsp;5와 Mythos 5를 비롯한 Mythos 급 모델은 트래픽을 30일간 의무적으로 보존한다는 점입니다. 앤트로픽은 이 데이터를 학습에는 쓰지 않고 안전 모니터링 용도로만 쓴다고 했지만, 민감한 작업을 다루는 조직이라면 이게 꽤 걸리는 대목일 수 있겠네요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3796/image1.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가. Gemini로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3. 한국도 ‘미토스’ 라인&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;일반 사용자가 받아 든 게 Fable이라면, 글래스윙에 참여한 한국의 주요 기관은 안전장치를 푼 Mythos 라인에 올라 있는 셈인데요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;앤트로픽이 6월 초 글래스윙 참여를 15개국으로 넓히면서 약 150개 조직을 새로 들였고, 여기에 한국도 이름을 올렸습니다. SK텔레콤은 글래스윙에 합류해 Mythos 조기 접근권을 확보했다고 직접 발표했고요. 과학기술정보통신부도 산하 한국인터넷진흥원(KISA)의 참여를 확인했습니다. 삼성전자와 SK하이닉스는 파이낸셜타임스(FT)가 포함됐다고 보도했는데, 두 회사가 공식적으로 확인해 준 건 아직 아닙니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;다만 이들이 받은 건 사이버 취약점을 찾아 패치하는 용도의 &amp;nbsp;Mythos(프리뷰) 접근권입니다. 이번에 나온 Mythos 5가 글래스윙을 통해 이 프리뷰의 업그레이드로 풀리니까, 한국 기관이 올라탄 Mythos 라인도 자연스럽게 Mythos 5로 이어지는 셈이고요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이렇게 민감한 프런티어 모델이 앤트로픽의 통제 아래에서만 나눠지고 있으니, 관련 논란도 한동안 계속되지 않을까 싶습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;공개 직후 화제가 된 사례들&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;이번엔 제가 본격적으로 붙들고 돌려본 후기 대신, 공개 직후 화제가 된 시연 장면을 가져왔습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;보조 장치 없이 포켓몬을 깬 모델&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;앤트로픽은 Fable 5가 별다른 보조 장치 없이 게임 화면 픽셀만 보고 '포켓몬 파이어레드'를 처음부터 끝까지 클리어하는 영상을 공개했습니다. 이전 클로드 모델들은 지도, 내비게이션, 게임 상태 정보 같은 보조 하네스를 잔뜩 붙여줘도 쩔쩔매던 게임입니다. 비전만으로 끝까지 갔다는 건, 사람이 짜주던 발판 없이도 길고 복잡한 작업을 혼자 끌고 가는 힘이 한 단계 올라섰다는 뜻이고요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 해커뉴스에는 "파이어레드 학습 데이터가 워낙 많아서 가능했던 것 아니냐", "여러 번 돌려 가장 잘 된 판을 골랐을 수 있다"는 의심도 함께 달렸습니다. 시연 영상 한 편을 곧이곧대로 일반화하긴 이르다는 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="media"&gt;&lt;oembed url="https://youtu.be/Ty_50J84fMY"&gt;&lt;/oembed&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&lt;a href="https://youtu.be/Ty_50J84fMY"&gt;&lt;u&gt;Claude Fable 5 beats Pokémon FireRed only using vision&lt;/u&gt;&lt;/a&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;스스로 CAD 에디터를 만들고, 그 안에서 3D 모델을 설계&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;더 인상적인 건 비전을 넘어 '도구까지 스스로 만드는' 장면입니다. 앤트로픽 시연에서 Fable 5는 브라우저에서 돌아가는 CAD 에디터를 직접 코딩으로 만들었고, 그 에디터 안에서 3D 프린팅이 가능한 모델을 설계했습니다. 심지어 모델링을 돕는 AI 코파일럿까지 그 에디터에 직접 붙였고요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;비슷한 결로, &lt;a href="https://youtu.be/5f5JYLZHdhw"&gt;&lt;u&gt;코드만으로 태양계 시뮬레이션&lt;/u&gt;&lt;/a&gt;을 짜 행성 궤도를 물리 제1원리에서 유도해 일식을 예측하거나, 공장 건설 게임 '&lt;a href="https://www.anthropic.com/news/claude-fable-5-mythos-5"&gt;&lt;u&gt;팩토리오&lt;/u&gt;&lt;/a&gt;'를 혼자 전략을 세워 자동화 공장까지 굴린 사례도 함께 공개됐습니다. 이전 모델들이 '주어진 작업을 잘 처리하는' 단계였다면, Fable&amp;nbsp;5는 '작업을 처리할 도구와 환경까지 스스로 세팅하는' 단계로 넘어가는 모습을 보여준 셈입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="media"&gt;&lt;oembed url="https://youtu.be/tpjJeH1pPws"&gt;&lt;/oembed&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&lt;a href="https://youtu.be/tpjJeH1pPws"&gt;&lt;u&gt;Claude Fable 5 designs a 3D-printable model in a Claude-built CAD editor&lt;/u&gt;&lt;/a&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;주요 참조 문서&lt;/p&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;a href="https://www.anthropic.com/news/claude-fable-5-mythos-5"&gt;앤트로픽 공식 발표&lt;/a&gt;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;a href="https://platform.claude.com/docs/en/about-claude/models/introducing-claude-fable-5-and-claude-mythos-5"&gt;클로드 API 문서(Fable 5·Mythos 5 소개)&lt;/a&gt;&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며: 그래서 지금 페이블 5인가, 오푸스 4.8인가&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;Fable 5가 역대 가장 강력한 공개 모델이라는 데는 벤치마크도 커뮤니티 평도 대체로 같은 목소리예요. 문제는 두 장벽이고요. 가격이 Opus 4.8의 두 배인 데다, 보수적으로 맞춰진 분류기가 보안·바이오와 상관없는 작업까지 Opus 4.8로 돌려보낼 때가 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그래서 지금은 작업 영역별로 갈라 쓰는 게 현실적이지 않나 싶어요. 대형 코드베이스 마이그레이션이나 장기 에이전트 작업처럼 능력 격차가 곧 시간 절감으로 이어지는 일이라면, 두 배 값을 치르고도 시험해 볼 이유가 충분하고요. 반대로 사이버보안·생물학·의료에 가깝거나 임베딩·파인튜닝 같은 AI 컴포넌트를 만지는 일이라면, 폴백이 자주 걸려서 Fable 5의 진가를 느끼기 어렵지 않을까 싶습니다. 제한의 경계가 또렷해질 때까지는 Opus 4.8에 머무는 것도 나쁘지 않은 선택이고요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;최근 한 달 사이 코덱스(Codex)로 옮겨 간 분들을 되돌리려면 '두 배 값을 치를 만큼 벌어졌나'라는 질문에 각자의 워크플로로 답해야 할 텐데, 적어도 출시 첫날의 Fable 5는 그 답을 아직 사용자에게 미뤄 둔 모델에 가까워 보입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;앞으로 지켜볼 지점은 세 가지인 것 같습니다. 6월 22일 이후의 가격 정책, 보수적이라던 분류기 튜닝이 얼마나 풀릴지, 비공개로 제한되는 영역의 경계를 얼마나 또렷하게 정의할지. 여기에 따라서 Fable에 대한 평이 또 달라질 수도 있을 것 같습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>AI 오피스: 공짜로 풀고 싶었던 서비스의 수익화 고민 </title><link>https://yozm.wishket.com/magazine/detail/3794</link><description>제가 2회차 말미에서 "LLM API 비용을 90% 절감했다"고 했습니다. 그때 잠깐 안도했습니다. 그런데 곧 다른 생각이 들었습니다. "90%를 줄였다고 해도, 남은 10%는 매달 내 계좌에서 나가고 있다." 이 서비스는 처음부터 돈을 벌기 위해 시작한 게 아닙니다. "AI 에이전트들이 실제 직장인처럼 대화하고 관계를 맺는 게 가능할까?"라는 순수한 호기심이 출발점이었습니다. 그런데 그 호기심이 실제 서비스가 되고, 사용자가 생기고, 사용량이 늘어나면서 비용도 함께 늘었습니다. 많은 사람이 무료로 즐겼으면 했는데, 저도 지갑이 얇습니다. 그게 4회차의 출발점입니다.</description><guid>https://yozm.wishket.com/magazine/detail/3794</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;[Office AI Town 제작기 4회] AI 심즈를 세상에 공짜로 풀고 싶었지만… 수익화·공유·회고&lt;/strong&gt;&lt;/h4&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;시리즈 소개&lt;/strong&gt;: Flutter, Supabase, Gemini LLM을 활용해 1인 개발로 'AI 오피스 시뮬레이션'을 구축한 과정을 총 4회에 걸쳐 공유합니다. 지난 &lt;a href="https://yozm.wishket.com/magazine/detail/3766/"&gt;&lt;u&gt;2회차&lt;/u&gt;&lt;/a&gt;에서는 LLM API 비용 문제를, &lt;a href="https://yozm.wishket.com/magazine/detail/3782/"&gt;&lt;u&gt;3회차&lt;/u&gt;&lt;/a&gt;에서는 2D 픽셀 오피스와 개입 시스템을 다뤘습니다. 이번 마지막 회차는 이 오피스를 세상에 공개하면서 마주친 수익화 고민, 그리고 싸이월드처럼 타인의 오피스를 구경하는 공유 시스템 이야기를 전합니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;제가 2회차 말미에서 "LLM API 비용을 90% 절감했다"고 했습니다. 그때 잠깐 안도했습니다. 그런데 곧 다른 생각이 들었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;"90%를 줄였다고 해도, 남은 10%는 매달 내 계좌에서 나가고 있다."&lt;/i&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 서비스는 처음부터 돈을 벌기 위해 시작한 게 아닙니다. "AI 에이전트들이 실제 직장인처럼 대화하고 관계를 맺는 게 가능할까?"라는 순수한 호기심이 출발점이었습니다. 그런데 그 호기심이 실제 서비스가 되고, 사용자가 생기고, 사용량이 늘어나면서 비용도 함께 늘었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;많은 사람이 무료로 즐겼으면 했는데, 저도 지갑이 얇습니다. 그게 4회차의 출발점입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;미리 요점만 콕 집어보기&lt;/strong&gt;&lt;/h4&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;비용을 90% 줄여도 남은 10%는 내 돈입니다.&lt;/strong&gt; 지속 가능한 서비스를 위해 수익화를 고민했지만, 구독도 광고도 아닌 '후원' 방식을 선택했습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;카카오페이 후원 → LLM 크레딧 충전 구조&lt;/strong&gt;: PG 연동 없이 카카오페이 하나로 단순하게 구현했습니다. 후원금은 그 사용자의 LLM API 사용 크레딧으로 그대로 돌아갑니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;싸이월드처럼 남의 오피스를 구경하는 재미&lt;/strong&gt;: 공개 오피스 목록에서 다른 사람의 오피스를 방문하고, 직원(에이전트)들의 대화와 감정 수치를 관람할 수 있습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3794/1.jpeg%EC%9D%98_%EC%82%AC%EB%B3%B8"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;a href="https://office-town.vercel.app/"&gt;&lt;u&gt;데모 사이트&lt;/u&gt;&lt;/a&gt;&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;(*해당 서비스 특성상 PC 환경에서 확인 부탁드립니다. 모바일에서는 기능이 제한되어 있습니다.)&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;"구독은 하기 싫었습니다" 후원 모델을 선택한 이유&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;수익화를 고민하면서 가장 먼저 검토한 방식은 월정액 구독(Subscription)이었습니다. SaaS(서비스형 소프트웨어) 서비스의 표준 모델이고, 안정적인 수입을 만들 수 있다는 장점이 있습니다. 하지만 금방 포기했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;구독제는 사용자에게 의무를 만듭니다. "이달에 얼마큼 써야 본전이지?"라는 생각이 드는 순간, 서비스를 즐기는 것이 아니라 소비를 정당화하는 계산이 시작됩니다. Office AI Town은 하루에 몇 번씩 들어오는 앱이 아닙니다. 출퇴근길에 잠깐, 점심시간에 틈틈이 오피스 드라마를 들여다보는 서비스입니다. 이런 앱에 월정액을 붙이면 사용자에게 부담이 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;광고(Advertisement)도 마찬가지였습니다. 직원(에이전트)들이 야근하는 쓸쓸한 오피스 화면에 배너 광고가 뜬다고 상상해 보면, 그 즉시 몰입이 깨집니다. 3회차에서 2D 픽셀 오피스를 만드는 데 공들인 이유가 "살아있는 느낌"을 주기 위해서였는데, 광고는 그 느낌을 가장 빠르게 파괴하는 방법이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 선택한 개념이 &lt;strong&gt;후원&lt;/strong&gt;이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;후원의 심리학: 사용자가 자발적으로 지갑을 여는 순간&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;후원과 결제는 다릅니다. 결제는 기능을 얻기 위한 교환이고, 후원은 응원하고 싶을 때 하는 행동입니다. 사용자가 "이 서비스가 마음에 들어서", "개발자를 응원하고 싶어서"라는 감정적 동기에서 자발적으로 지갑을 여는 구조를 만들고 싶었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;수단을 고르기 전에, 1인 개발자가 현실적으로 쓸 수 있는 선택지를 직접 훑어봤습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3794/10-1.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;사업자 없이 자동화까지 되는 옵션은 없었습니다. Buy Me a Coffee는 자동화가 되지만 국내 사용자에게는 낯선 서비스이고, 토스페이먼츠나 포트원은 편하지만 사업자 등록이 전제입니다. 그래서 결제 수단을 &lt;strong&gt;카카오페이(KakaoPay)&lt;/strong&gt;로 선택했습니다. 개인도 QR 코드 하나로 시작할 수 있고, 국내 사용자라면 거의 대부분 계정이 있습니다. 자동화가 없다는 단점은 알고 있었지만, 서비스가 살아남을지도 모르는 시점에 PG 연동 인프라를 먼저 구축하는 건 순서가 틀린 일이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:57.81%;"&gt;&lt;img src="https://www.wishket.com/media/news/3794/2.png%EC%9D%98_%EC%82%AC%EB%B3%B8"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;후원금이 크레딧으로 돌아오는 구조&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;후원 시스템에서 가장 중요하게 설계한 부분은 "후원금이 어디에 쓰이는지 투명하게 보여주는 것"이었습니다. 사용자가 카카오페이로 후원을 하면, 그 금액은 해당 사용자의 &lt;strong&gt;LLM API 사용 크레딧&lt;/strong&gt;으로 전환됩니다. 내가 후원한 돈이 내 오피스의 직원(에이전트)들이 대화를 생성하는 데 직접 쓰인다는 뜻입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 구조가 가진 장점이 있습니다. 사용자는 "내 돈이 어디에 쓰이는지"를 명확하게 이해할 수 있습니다. '개발자 수익'이 아니라 '내 오피스 운영 비용'이 된다는 프레임이 거부감을 줄입니다. 크레딧이 쌓이고 소진되는 것을 앱 안에서 실시간으로 확인할 수 있기 때문에, 내가 낸 돈이 어떻게 쓰이는지 눈에 보입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 구현한 크레딧 관련 기능을 정리하면 이렇습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3794/10-2.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;솔직히 말하면, 이 서비스로 큰돈을 벌겠다는 생각은 처음부터 없었습니다. 호기심에서 시작한 프로젝트가 실제로 사람들의 일상에 작은 재미를 줄 수 있다면, 그것으로 충분합니다. 수익화는 그 재미가 오래 지속될 수 있도록 유지하는 장치의 일부일 뿐입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;PG 결제 연동을 구현하는 게 장기적으로 더 효과적이지 않겠냐고 조언하는 분들도 있었습니다. 맞는 말입니다. 다만 순서가 있습니다. &lt;strong&gt;1인 개발자에게 수익화 타이밍은 제품만큼 중요합니다.&lt;/strong&gt; 제 기준은 단 하나였습니다. "응원받을 자격이 생겼을 때." 사용자가 없는 시점에 후원 버튼을 달면 그냥 민망한 장식이 됩니다. 반대로 사람들이 들어와서 즐기고 있다면, 그때는 후원 버튼을 누르는 게 자연스러운 행동이 됩니다. "이거 재미있다. 계속 만들어줬으면 좋겠다." 그 감정이 생겨야 후원은 작동합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;먼저 서비스의 가능성을, 그다음 수익화 가능성을 확인한 뒤, PG 연동이나 자동화 인프라는 그 신호가 온 다음에 구축해도 전혀 늦지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;싸이월드처럼 다른 사람의 오피스를 구경하는 재미&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;수익화 구조를 정리하고 나서, 뜻밖의 인사이트를 얻었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;베타 테스트를 하면서 사용자들에게 물어봤습니다. "Office AI Town에서 가장 재미있는 순간이 언제입니까?" 예상 답변은 "내 직원(에이전트)들이 재미있는 대화를 할 때"였습니다. 그런데 실제로 돌아온 답변 중에 이런 것이 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;"다른 사람은 어떤 오피스를 만들었는지 너무 궁금합니다."&lt;/i&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그 말을 듣고 바로 알았습니다. 내 오피스만 보는 것과, 남의 오피스를 구경할 수 있는 것은 완전히 다른 경험이라는 것을. 2000년대 초반 싸이월드(Cyworld)에서 친구의 미니홈피를 방문해 방 꾸밈새를 구경하고 방명록을 남기던 그 경험을 떠올려 보면, 단순한 SNS 기능이 아니라 하나의 소셜 경험이었습니다. 내가 꾸민 공간을 남이 보고 반응한다는 것, 그 연결이 서비스를 살아있게 만들었습니다. Office AI Town에서도 그 감각을 만들고 싶었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;공개 오피스 목록: 오피스 탐색과 방문&lt;/strong&gt;&lt;/h4&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3794/3.png%EC%9D%98_%EC%82%AC%EB%B3%B8"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;공유 기능 구현에서 가장 먼저 결정한 것은 방문 방식이었습니다. 앱 내 &lt;strong&gt;공개 오피스 목록&lt;/strong&gt;을 통해 방문하는 구조를 선택했습니다. 헤더의 "공유 오피스" 버튼을 누르면 현재 공개 설정된 오피스 목록이 나타납니다. 목록에는 오피스 이름, 오피스 설명, 좋아요 수가 표시됩니다. "방문하기" 버튼을 누르면 해당 오피스의 관람 모드로 진입합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;공개/비공개는 오피스 소유자가 직접 설정합니다. 기본값은 비공개이고, 소유자가 공개로 전환한 오피스만 목록에 나타납니다. 오피스 분위기는 보여주고 싶지만, 직원(에이전트) 설정 내용은 비밀로 하고 싶은 경우가 있기 때문에 프롬프트는 보여주지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다른 사람의 오피스에 들어가면 &lt;strong&gt;관람 모드(View Mode)&lt;/strong&gt;로 자동 진입합니다. 관람 모드에서는 보는 것만 가능합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3794/10-3.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;화면 상단에는 "OOO 님의 오피스를 관람 중입니다"라는 배너가 표시됩니다. 좋아요 버튼과 "내 오피스로 돌아가기" 버튼이 함께 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3794/4.png%EC%9D%98_%EC%82%AC%EB%B3%B8"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;‘좋아요’가 만드는 소셜 레이어&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;좋아요(Like) 기능이 단순한 장식처럼 보일 수 있지만, 오피스 소유자에게는 의미 있는 피드백입니다. 내가 만들어 놓은 이 오피스가 다른 사람들에게 어떻게 보이는지, 얼마나 반응을 받는지를 헤더에 표시되는 하트 아이콘과 숫자로 확인할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;공유 기능이 추가된 이후 흥미로운 변화가 생겼습니다. 오피스를 공개하기 시작한 사용자들이 직원(에이전트) 페르소나를 더 신경 써서 설정하기 시작했습니다. 나 혼자 보는 오피스와 남에게 보여지는 오피스는 다릅니다. 구경꾼이 생기는 순간, 사람들은 자연스럽게 더 좋은 이야기를 만들고 싶어지는 것 같습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;연재를 마치며: 수익화도, 공유도, 결국 신뢰의 문제였습니다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;4회에 걸쳐 Office AI Town을 만든 과정을 공유했습니다. 1회차의 페르소나 설계부터 2회차의 LLM API 비용 폭탄, 3회차의 2D 픽셀 오피스와 개입 시스템, 그리고 이번 회차의 수익화와 공유까지. 돌아보면 이 프로젝트의 모든 선택이 결국 하나의 질문으로 수렴합니다. &lt;strong&gt;"사용자와 어떤 관계를 맺을 것인가?"&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;수익화에서 구독을 포기하고 후원을 선택한 것도, 관람 모드에서 방문자에게 개입 권한을 주지 않은 것도, 공개/비공개를 소유자가 스스로 결정하게 한 것도 모두 같은 이유에서 나왔습니다. 사용자가 자신의 공간을 스스로 통제할 수 있을 때, 그리고 개발자가 사용자의 경험을 착취하지 않는다고 느낄 때, 신뢰가 생깁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;사용자가 자발적으로 지갑을 여는 순간은 기능이 화려할 때가 아닙니다. 이 서비스가 믿을 만하다고 느낄 때입니다.&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 비개발자입니다. 게임 엔진도 몰랐고, Flutter도 처음 알았습니다. 그런데 AI와 함께 달려오다 보니, 어느 순간부터 "이건 어떻게 만들지?"가 아니라 "이건 어떻게 만들어달라고 하지?"로 질문이 바뀌어 있었습니다. 결국 중요한 건 기술이 아니라 '무엇을 만들고 싶은가'라는 질문이었습니다. AI는 그 질문에 답을 함께 찾아주는 파트너였습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Office AI Town은 아직 미완성입니다. 멀티플레이어 오피스, 더 다양한 개입 이벤트, 직원(에이전트) 커스텀 강화, 만들고 싶은 것들이 아직 많이 남아 있습니다. 하지만 그것보다 먼저, 이 연재를 읽으신 분들이 "나도 한 번 만들어볼 수 있겠다"라는 생각을 갖게 되었다면 그것으로 충분합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;4회의 긴 연재를 함께해 주셔서 감사합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>GEO 성과 측정 실전편: 인용률 트래킹과 AI 크롤러 로그 활용법</title><link>https://yozm.wishket.com/magazine/detail/3793</link><description>AI 검색 환경에서 가시성이 아무리 올라갔다 한들, 실제 전환과 결제로 이어지는 길목은 여전히 네이버의 지배력이 압도적입니다. 그래서 GEO 컨설턴트 양용준 서치나인 대표는 최종 KPI 대신 그 '전조 증상'이 되는 신호들을 성과로 본다고 말합니다. 프롬프트 구성, 주 단위 인용률 트래킹, AI 크롤러 로그, Client ID/User ID 기반 전환 추적의 한계, 브랜드 키워드 유입까지, 동탄 피부과 사례와 직접 돌린 GA4 테스트 결과를 곁들여 정리했습니다.  가시성과 인용률을 단일 KPI로 확정하기 어려운 지금, 여러 전조 증상을 함께 보며 콘텐츠 체질 개선을 판단하자는 결론과 성과 과대포장을 경계하라는 당부를 담았습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3793</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;양용준 서치나인 대표 | GEO 팩트체크 세미나 '실제 사례로 살펴보는 GEO 오해와 진실' 두 번째 강연&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;이 글은 5월 21일 열린&lt;/i&gt;&lt;a href="https://youtu.be/5u3yjszUDW8?si=Xdm1LunftA-COUz_"&gt;&lt;i&gt;GEO 팩트체크 세미나&lt;/i&gt;&lt;/a&gt;&lt;i&gt;에서 나온 양용준 서치나인 대표의 발표 내용을 1인칭 시점으로 정리한 글입니다. 앞서 공개한 세미나 사전 가이드가 “&lt;/i&gt;&lt;a href="https://yozm.wishket.com/magazine/detail/3754/"&gt;&lt;i&gt;&lt;u&gt;GEO 성과를 왜 최종 KPI가 아니라 전조 지표로 봐야 하는가&lt;/u&gt;&lt;/i&gt;&lt;/a&gt;&lt;i&gt;”를 다뤘다면, 이 글은 실제 발표에서 소개된 프롬프트 구성 방식, 인용률 주 단위 트래킹, AI 크롤러 로그, Client ID/User ID 기반 전환 추적의 한계를 사례 중심으로 정리합니다.&amp;nbsp;&lt;/i&gt;&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;p style="text-align:justify;"&gt;저는 이번 세미나에서 'GEO 성과 측정을 어떻게 접근할까'라는 주제를 맡게 된 양용준이라고 합니다. &lt;a href="https://search-nine.com/"&gt;서치나인&lt;/a&gt;에서 1인 SEO/GEO 컨설턴트로 활동하고 있고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 SEO 하시는 분들께 '물음표 살인마'라는 소리를 들을 정도로 질문을 꽤 많이 하는 편입니다. 제가 납득이 돼야 작업을 할 수 있는 성격인 만큼, 계속 질문을 던지면서 검증해온 방법들을 오늘 말씀드리고자 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;먼저 분명히 해두고 싶은 게 있는데요. 만약 '정답을 찾으러 왔다'고 하시면, 이 세션은 전혀 적합하지 않다고 생각합니다. 다만 어떤 방식으로 접근하고, 테스트하고, 성과를 측정하는지 그 '과정'을 보고 싶으시다면, 이 세션이 조금 괜찮은 인사이트가 되지 않을까 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;어차피 우리는 지금 기준으로 일부 성과만 볼 수 있다고 보고 있고, 최종 KPI를 설정해도 결국 그게 정확하지 않다면, 저는 최종 지표보다는 오히려 그것의 '전조 증상'이 되는 신호들을 성과로 보자, 라고 현재까지 1차적으로 결론을 내렸습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/%EB%8B%A8%EB%9D%BD_%ED%85%8D%EC%8A%A4%ED%8A%B8__13_.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;기본 프롬프트는 어떻게 구성했나&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;가시성 검증과 관련해 가장 많이 받는 질문 중 하나가 '기본 프롬프트는 어떻게 구성했느냐'인데요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 잘 구성되어 있는 사이트의 Sitemap.xml만 봐도 그 홈페이지의 성격을 잘 파악할 수 있다고 봅니다. 그래서 Sitemap.xml과 클릭과 노출이 높은 페이지를 조합하고, 기존 SEO 기법에 있던 키워드 클러스터링과 클렌징한(허수를 덜어낸) 검색 볼륨을 기준으로 삼아 프롬프트를 짰습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 짠 이유는, 프롬프트가 기본적으로 고객의 의도를 기반으로 한다고 생각하기 때문입니다. 단순한 키워드 검색이 이제는 구체적인 롱테일 형태의 프롬프트로 변화하는 추세입니다. 그래서 우리 홈페이지에서 지금 콘텐츠를 작성하거나 서비스를 운영하는 데 적합한 것을 골라내려면, 이런 식으로 조합하는 게 제 기준에서 가장 적합하다고 생각했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그렇게 조합하면 '가시성이 바로 올라가는 거 아니냐'라는 의문이 들 수 있는데요. 이 방식으로 진행했을 때, 생각보다 가시성이 처음부터 높게 나오는 경우는 많이 없었습니다. 오히려 이 과정을 통해서 기존의 글을 어떻게 리라이팅할지, 우리가 놓치고 있던 주제는 무엇인지, 상세페이지를 어떻게 수정해야 AI에게 충분히 인용될 가치가 있는 콘텐츠가 될 수 있는지 그 기준을 뽑아낼 수 있었다는 데 의의가 있다고 판단했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;인용율을 KPI로 잡기&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;'내 사이트가 인용이 많이 되면 가시성이 올라갈 확률이 높을까?'라는 질문에 대해, 저는 프롬프트와 산업에 따라 다르다고 생각합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;구글에서는 인용이 많이 되면 가시성이 올라갈 확률이 높았고, 라이너에서도 마찬가지였습니다. 저는 답변이 어떻게 나왔는지를 보기보다 그 답변을 만들어내는 '과정'에서 어떤 출처를 어떻게 추출했는지를 보는데요. 외부 인용도 좋지만, 특정 채널을 제외하면 '어떤 도메인이 특별히 더 좋다'고 단정하기는 어렵고, 자사 사이트가 인용이 되면 가시성이 높아질 확률은 올라간다고 봤습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 GPT에서는 인용이 된다고 해서 내 브랜드가 추천되지 않는 경우도 많았고, 오히려 다른 브랜드에 인용 효과만 주게 되는 케이스도 많았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/image6.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/image4.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 동탄 피부과 케이스를 모아봤는데요. ‘리베리 의원’을 보시면 추천이 되는 경우도 있고, 두 번째 화면처럼 인용 출처로만 표시되는 경우도 있었습니다. 하지만 아예 소스로 인용되지 않으면 노출될 확률이 낮다고 생각합니다. 그래서 인용률을 올리는 것 자체는 간접적인 신호가 된다, 충분히 의미가 있다고 봤습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;단, 인용률을 완벽한 KPI로 보기는 어렵다고 생각합니다. AI는 답변의 신뢰도를 높이기 위해 외부 데이터를 실시간으로 찾아오는 &lt;strong&gt;RAG(검색 증강 생성)&lt;/strong&gt; 방식을 사용하며, 이렇게 찾은 여러 근거 자료에 기반해 답변을 만들어내는 &lt;strong&gt;'그라운딩'&lt;/strong&gt; 과정을 거칩니다. 즉, 우리 사이트 하나만 보는 것이 아니라 여러 페이지의 정보를 조합하여 최종 답을 내놓기 때문에, 우리의 의도와 무관하게 다른 페이지의 정보가 인용 출처로 잡힐 확률을 통제하기 어렵습니다. 실제로 홈페이지 인용이 아무리 많이 됐다고 해도, 산업에 따라서는 AI가 홈페이지보다 구글 비즈니스 프로필 데이터를 더 선호할 수도 있고 혹은 머천다이즈 센터에 대한 데이터를 더 좋아할 수도 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;주 단위 인용률 트래킹&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;화면에 보이는 건 제가 사용하고 있는 체인시프트 GEO 툴인데요. '사이트가 실제로 인용이 많이 되면 가시성이 올라갈 확률이 높아지는가'를 주 단위로 체크해봤습니다. ‘리베리 의원’을 주목해서 봐주시고요. 구글 검색창에 시크릿 모드로 ‘동탄 울쎄라’ 가격이나 ‘동탄 리주란 가격’이라고 검색해보시면 AI로 작성한 수십 개의 페이지가 상위노출 되어 있는 것을 보실 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/image5.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;‘리베리의원’이라는 브랜드를 보시면, 4월 5일에서 4월 11일 기준으로는 가시성이 없었고, 4월 26일~5월 2일 데이터에서는 8.9%로 올랐습니다. 그리고 5월 3일~5월 9일에는 21% 가까이 올랐죠. 마지막으로 5월 10~5월 16일에는 18.1%로 다시 내려갔습니다. 그 말인즉 AI로 다량 작성한 콘텐츠가 단기간의 인용이나 가시성에 도움을 줄 수 있지만 장기적으로 구글이나 LLM이 적합하지 않다고 판단하면 인용이 높아도 AI 가시성은 낮아질 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/image3.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;한편 에미뜨 의원의 5월 3일~5월 9일, 5월 10일~5월 16일 인용횟수를 봤는데, 10위권에 있던 사이트가 일주일 기준으로 8위까지 올라갔죠. 그 기간 동안 콘텐츠를 통해 인용율을 높이는 작업을 한 건데요. 인용율이 올라갔을 때 가시성이 올라간다는 걸 알 수 있는 간접적인 신호로 볼 수 있지 않을까 생각했습니다. 다만 이건 GPT 기준이고, AIO나 AI 모드 에서는 어떤 작업을 우선순위로 잡을 것인가에 대한 판단이 또 필요하다고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여러분들도 아시겠지만, GPT는 영문 도메인의 인용이 높게 나오고, 구글 비즈니스 프로필 의존도가 상당히 높습니다. 반대로 AIO나 AI 모드는 비즈니스 프로필·유튜브, 머천다이즈 센터 데이터를 잘 가져오고 있으나 영문 도메인을 더 많이 가져온다란 느낌은 없죠. 그래서 어떤 LLM이냐, 어떤 산업 분야냐에 따라 테스트해야 할 것들이 달라지는데요. 저는 당장 어떤 LLM을 목표로 잡아 우선순위로 둘 것이냐를 판단하는 데 이런 툴을 사용하고 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI 크롤러의 유입주기를 KPI로 잡기&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;그럼에도 ‘외부 트래킹 툴을 항상 믿어도 될까’라는 고민이 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;GEO 이전에, SEO에도 여러 툴이 있었죠. 경험상 저는 SEO 에이전시 일하면서 Semrush 같은 SEO 툴을 다룰 때도 지표가 과장되는 것에 대한 불만이 많았습니다. 동일한 SEO 툴에서도 DA나 평균 트래픽 등이 다 달랐습니다. 결국 툴이란 건 방향을 잡기에는 도움이 되지만, 정확한 KPI를 설정하는 데는 내 사이트에 고객이 실제로 잘 들어오는지를 확인하는 게 필요하다고 생각했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/image2.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 실제로 AI 크롤러의 유입을 살펴본 건데요. 최근에 약 2~3주 가까이 트래킹을 해봤습니다. LLMs.txt도 넣지 않고, AI가 좋아하는 콘텐츠의 방향이란 것도 적용하지 않았습니다. 그럼에도 크롤러가 나쁘지 않은 수준으로 유입되고 있었습니다. 그래서 AI 크롤러의 유입을 전조증상 KPI로 보는 것도 의미 있다고 생각합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/image8.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 먼저 아무 작업도 하지 않았을 때를 기준으로 AI 크롤러가 얼마나 들어오는지를 파악해 지표로 쌓고, 그 이후에 GEO 작업을 하면 인용률, 가시성이 올라가는지 등을 확인하는 게 좋은 KPI가 되지 않을까 생각합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;Client ID / User ID 기반 전환 추적을 KPI로 잡기&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;GA, AA, 앰플리튜드 같은 분석 툴은 그 자체로 데이터를 세팅해 준다기보다, 우리가 수집한 데이터를 보기 좋게 띄워주는 '대시보드'에 가깝다고 생각합니다. 그렇다면 단순히 대시보드의 화면이나 세팅을 조작하는 데 그칠 것이 아니라, 애초에 그 안으로 밀어 넣는 '데이터의 품질' 자체를 높여야 한다고 판단했습니다. 그래서 웹사이트 상에 질 좋은 데이터를 어떤 식으로 쌓을 수 있을지부터 다시 고민했고, 우리 사이트에 맞는 독자적인 데이터 레이어를 구축해 보기로 했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;핵심 과제는 결국 'AI 검색을 통해 유입된 트래픽과 전환'을 이 데이터 레이어에 정확히 분리해서 담아내는 것이었습니다. 이를 추적하려면 기본적으로 Client ID(쿠키 기반)나 User ID(로그인 기반)를 활용해야 합니다. 그래서 본격적인 세팅에 앞서, 과연 AI 크롤러에게도 이 기존의 추적 방식이 동일하게 통할지 의문이 들었습니다. 그래서 이를 확인하기 위해 두 가지 사전 테스트를 진행했습니다. 먼저 AI 크롤러에게 쿠키값이 부여되는지를 봤을 때, 아닌 것으로 확인했습니다. 두 번째로 AI 크롤러가 직접 로그인을 할 수 있는지를 확인했을 때도 아닌 것으로 나타났습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;기존 방식(쿠키/로그인)으로는 AI 봇을 추적할 수 없다는 걸 알게 되니, '그렇다면 AI로 인한 실제 전환 기여도를 도대체 어떻게 증빙할 수 있을까?'라는 현실적인 고민에 부딪혔습니다. 그래서 우회하는 방식으로 접근하여, 가입 경로에 직접 체크를 하게 하거나 실제 상담 과정에서 AI로 인한 문의가 상승했는지를 정성적으로 확인하고자 했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 클라이언트 ID를 만들어서 GA4 맞춤 보고서로 테스트를 해보며 &lt;strong&gt;또 다른 문제&lt;/strong&gt;를 발견했습니다. 여러분도 개발자 도구 콘솔에서 'document.cookie'를 검색해 보시면 아시겠지만, &lt;strong&gt;실제 유저가 유입될 때도 쿠키가 파편화된다는 점&lt;/strong&gt;입니다. 사용자가 'Chat GPT 앱 내의 브라우저'를 통해 우리 사이트에 접속할 때와, 같은 기기에서 '크롬이나 사파리 앱'으로 접속할 때 찍히는 클라이언트 ID가 명확하게 달랐습니다. 각 앱마다 고유의 쿠키 저장소를 따로 쓰기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;데이터 모수(샘플)가 아주 방대해진다면 이를 엮어서 간접 전환을 유추해 볼 여지는 있겠지만, 데이터의 정확도와 신뢰성이 너무 떨어진다고 보았습니다. 결과적으로 봇이든 실제 유저든 '쿠키(Client ID) 기반의 추적'은 전반적으로 실패이자 한계가 명확하다는 결론을 내렸습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;산업군마다 차이는 있겠지만, 쿠키 추적이 불확실하다면 결국 &lt;strong&gt;'로그인 기반의 유저 ID(User ID)'가 현실적인 해답&lt;/strong&gt;이 됩니다. 예를 들어 이커머스라면, 사용자가 특정 행동을 했을 때 가입을 유도하는 배너(트리거)를 띄우는 등 최대한 CRM(고객 관계 관리) 관점의 장치를 마련해야 합니다. 이렇게 일단 로그인을 시켜두면, 유저가 처음에 GPT를 통해 둘러보고 나중에 네이버나 구글로 다시 유입되어 구매하더라도 GPT의 간접 전환 기여도를 정확히 파악할 수 있기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 여기에도 리스크는 존재합니다. GPT로 유입된 유저가 끝내 가입하지 않는다면 여전히 추적은 어렵습니다. 하지만 이 빈틈은 내부의 SXO(검색 경험 최적화)나 CRM 고도화를 통해 점진적으로 개선하며 테스트해 나갈 수 있는 영역입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결론적으로, 현시점에서 단순히 기존 툴만 믿고 'AI를 통한 전환율'을 완벽하게 측정하려는 것은 불가능에 가깝습니다. 데이터의 질을 높이기 위한 우리만의 체질 개선이 먼저 선행되어야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;브랜드 키워드 유입 KPI&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;구글의&lt;a href="https://developers.google.com/pay/api/universal-commerce-protocol/overview?hl=ko"&gt;&lt;u&gt;UCP(범용 상거래 프로토콜, Universal Commerce Protocol)&lt;/u&gt;&lt;/a&gt;가 발표되고 클릭과 노출보다는 가시성과 인용이 KPI로 바뀌는 시점입니다. 이때 "왜 굳이 브랜드 키워드 유입 증가를 봐야 하느냐?"는 의문이 들 수 있습니다. 기존 SEO 환경에서는 정보성 콘텐츠만 잘 작성해도 사이트 유입을 유도하거나 1st 파티 쿠키 기반의 타겟팅 광고가 가능했습니다. 하지만 AI 검색 환경에서는 다릅니다. 사용자가 AI의 답변을 통해 원하는 정보만 확인하고 사이트 유입 없이 이탈해 버리는 현상(Zero-click)이 산업군을 막론하고 발생하고 있기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 제가 모니터링해 온 업체들의 데이터에서도 단순 정보 제공형 콘텐츠의 AI 인용률이 더 높게 나타났습니다. 하지만 장기적으로 볼 때, 정보성 콘텐츠에만 의존하는 웹사이트는 결국 트래픽이 완전히 말라버릴 위험이 높습니다. 반대로 브랜드의 고유한 이야기, 소식, 실제 고객 후기 등 대체 불가능한 '비정형 콘텐츠'가 탄탄하다면 웹사이트로 직접 유입될 가능성이 훨씬 큽니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결국 우리가 시간과 노력을 들여 GEO를 한다면, 그것이 궁극적으로 '우리 브랜드'를 검색해서 찾아오게 만드는 데 영향을 주어야 합니다. 물론 큰 기업은 PR도 하고, 광고도 하고 이미 기존의 인지도도 높기 때문에, GEO 때문에 브랜드 유입이 증가한 것인지 명확히 측정하기 어렵습니다. 하지만 브랜드나 사이트가 처음 시작하는 단계이거나 작은 기업이라면 이 브랜드 키워드 유입 증가를 KPI로 잡고 테스트해볼 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;제가 맞춤 정규식 기준으로 브랜드 쿼리를 추출해 본 데이터가 있습니다. 왼쪽 첫 번째와 맨 아래에 있는 사이트는 광고를 전혀 집행하지 않고 자연 유입으로만 운영되는 곳이라 순수한 테스트 변화를 체크하기에 매우 유용했는데요. 보시다시피 브랜드 유입 수가 뚜렷하게 증가한 것을 확인할 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/image7.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이처럼 저는 가시성의 변화를 직접 테스트하며 다양한 인사이트를 발굴하는 편입니다. 이 과정에서 의문이 생기면 제가 애용하는 GEO 분석 툴을 제작하고 있는 '체인시프트'의 CTO님과 심도 있는 토론을 나누기도 합니다. 해당 툴을 보면 항목별 인용 및 적용 비율 같은 유용한 데이터가 제공됩니다. 하지만 툴에서 제공하는 수치는 어디까지나 '참조용 지표'입니다. 내 사이트가 실제 AI 환경에서 어떻게 인용되는지는, 툴에만 의존할 것이 아니라 직접 눈으로 확인하고 체감하는 정성적인 검증 과정이 반드시 동반되어야 한다고 생각합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3793/image1.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;가시성은 올랐는데 브랜드 쿼리가 떨어진다면&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;물론 브랜드 검색량이 늘어난 것을 100% GEO만의 성과라고 단정 지을 수는 없습니다. 하지만 반대로, 가시성은 상승했는데 정작 우리 브랜드 유입은 오히려 떨어지고 있다면 경각심을 가져야 하지않을까 생각합니다. 내가 짠 프롬프트가 정교하게 브랜드를 각인시키는 프롬프트인지, 아니면 그저 '좋은 정보만 퍼주고 끝나는' 프롬프트인지 점검해 봐야 할 시점이죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이상적인 그림은 명확합니다. AI 내 가시성을 높여 우리 브랜드의 언급량을 늘렸다면, 그에 비례해 브랜드 검색량도 올라가야 정상이라고 생각합니다. 이를 IMC(통합 마케팅 커뮤니케이션) 관점에서 본다면, GEO와 브랜드 쿼리는 당연히 하나의 궤적에서 함께 봐야 하는 지표입니다. IMC 개념이 당장 생소하시더라도 괜찮습니다. '내 브랜드의 메시지를 모든 접점에서 일관되게 전달하여 고객을 끌어당긴다'는 맥락만 파악하신다면, 충분히 이 관점을 GEO 실무에도 훌륭하게 접목하실 수 있을 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;성과를 과대 포장하지 말자&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;마지막으로 당부드리고 싶은 것은, &lt;strong&gt;'&lt;/strong&gt;GEO로 엄청난 성과와 매출을 만들었다'는 식의 무용담을 항상 경계해야 한다는 점입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI 검색 환경에서 가시성이 아무리 올라갔다 한들, 실제 전환이나 결제로 이어지는 길목은 여전히 네이버의 지배력이 압도적이기 때문입니다. 실제로 월 매출 3~4억 원을 기록하는 인지도 높은 국내 브랜드, 그 이상의 매출을 내고 있는 누구나 알법한 다국어 브랜드의 채널별 데이터를 뜯어보았을 때도, 네이버와 구글의 기존 오가닉 검색 매출이 압도적으로 높았습니다. 그렇다면 LLM(거대 언어 모델)을 통한 유입이 그에 비례하는 매출을 견인했을까요? 어느 정도의 일부 발생은 있었지만, ROI나 ROAS 관점에서 무작정 GEO에 예산을 쏟아붓는다고 해결될 수준은 결코 아니었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;현실적으로 말씀드리면, 현재 GEO는 국내외를 막론하고 그 누구도 완벽하게 성과를 측정할 수 없는 미지의 영역입니다. 그렇기에 기존 퍼포먼스 마케팅이나 SEO처럼 '클릭'과 '노출'과 같은 수준으로 AI가시성, 인용률과 같은 명확한 단일 지표를 KPI로 삼는 것은 아직까진 무의미하다 보고 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;오히려 다양한 '전조 증상'들을 KPI 대시보드에 띄워놓고, 지표 간의 상관관계를 비교해 가며 '우리의 콘텐츠 체질이 올바른 방향으로 개선되고 있는가'를 판단하는 것이 현재로서는 가장 타당한 접근이라고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;"어느 기업이 AI 최적화로 전환율을 몇 배 올랐다더라, 유입이 몇백 몇천프로 올랐다" 하는 과장된 PR 기사에 흔들리실 필요 없습니다. 남들이 한다고 조급해할 것이 아니라, 그 사례가 어떤 산업군이었고, 어떤 환경에서, 어떤 잣대로 측정된 것인지부터 냉정하게 따져보아야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;솔직히 말씀드리면, 적어도 국내 이커머스 환경에서 LLM을 통한 실질적 전환은 개인적으로 봤을 때 '처참한' 수준이었습니다. 누구나 알 만한 유명 브랜드조차 챗GPT 같은 AI 엔진에서 노출은 잘 되어도, 그것이 지갑을 여는 전환으로 이어지는 비율은 아직 미미합니다. (이 지표 또한 AIO나 AI Mode는 제외하고 본 형태죠)&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결론은 이렇습니다. 과장된 기사를 보고 조급함(FOMO)을 느끼셨다면, 아직은 한숨 돌리셔도 괜찮습니다. GEO를 통해 '당장의 결과(매출)'를 기대하는 프로젝트를 기획하신다면 십중팔구 실패할 것입니다. 하지만 다가올 검색 패러다임의 변화에 맞춰 우리의 자산을 정비하는 '준비의 자세'로 접근하신다면, 분명 올바른 궤도에 오르실 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 이 모든 이야기는 제가 직접 부딪히며 얻은 저의 경험에 의거해 드리는 말씀입니다. 그런 만큼, 최종적인 판단은 여러분의 몫이라고 생각합니다. 감사합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;질의 응답&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;&lt;span style="background-color:transparent;color:#000000;"&gt;&lt;strong&gt;Q.사이트에 접속한 AI Crawler의 종류는 user-agent 헤더값으로 판단하신 것인가요?&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&lt;span style="background-color:transparent;color:#000000;"&gt;&lt;strong&gt;양용준:&lt;/strong&gt;클라우드플레어를 통해 판단하고 있습니다. 제가 확인한 바에 의하면 user-agent 하나로만 판단하는 게 아니라, IP/ASN, Bot Score 등을 종합적으로 판단하는 것으로 알고 있습니다.&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="media"&gt;&lt;oembed url="https://youtu.be/rlDtt28OpJo"&gt;&lt;/oembed&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>나만의 세컨 브레인: 옵시디언 기반 LLM 위키 구축기</title><link>https://yozm.wishket.com/magazine/detail/3792</link><description>앞서 기고한 “오늘 뭐부터 하지?” AI 비서 에이전트 만들어봤습니다에서는 흩어진 프로젝트 정보를 한곳에 모아, AI 비서가 매일 아침 프로젝트 현황과 Todo 우선 순위를 브리핑해 주는 시스템을 공유했습니다. 이러한 시스템으로 제 업무에 대한 맥락을 정리했지만, 정작 그 일을 수행하는 '나 자신'에 대한 맥락은 어떻게 효율적으로 정리할지가 고민이었죠. 때마침 안드레 카파시(Andrej Karpathy)가 ‘LLM 위키’라는 아이디어를 제시했고, 그 개념을 저의 컨텍스트 정리에 적용해 보고자 했습니다. 그래서 옵시디언(Obsidian), 깃허브(GitHub), 클로드 코드(Claude Code)의 조합으로 나만의 세컨드 브레인인 LLM 위키를 구축했는데요. 이번 글에서는 그 과정과 LLM 위키 구축 경험에서 얻은 인사이트를 정리해 봤습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3792</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;최근 많은 사람들이 클로드(Claude), 챗지피티(ChatGPT), 제미나이(Gemini) 같은 다양한 AI 도구를 사용하는 것이 일상이 되었습니다. 하지만 사용하는 AI 도구가 늘어날수록 우리는 늘 컨텍스트를 새로 전달해야 하는 번거로움을 겪게 됩니다. 즉, 본인의 상황과 맥락을 &lt;strong&gt;AI에게 매번 설명&lt;/strong&gt;해야 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞서 기고한 &lt;a href="https://yozm.wishket.com/magazine/detail/3692/"&gt;“오늘 뭐부터 하지?” AI 비서 에이전트 만들어봤습니다&lt;/a&gt;에서는 흩어진 프로젝트 정보를 한곳에 모아, AI 비서가 매일 아침 프로젝트 현황과 Todo 우선 순위를 브리핑해 주는 시스템을 공유했습니다. 이러한 시스템으로 제 업무에 대한 맥락을 정리했지만, 정작 그 일을 수행하는 &lt;strong&gt;'나 자신'에 대한 맥락&lt;/strong&gt;은 어떻게 효율적으로 정리할지가 고민이었죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;당시 때마침 안드레 카파시(Andrej Karpathy)가 ‘LLM 위키’라는 아이디어를 제시했고, 그 개념을 저의 컨텍스트 정리에 적용해 보고자 했습니다. 그래서 옵시디언(Obsidian), 깃허브(GitHub), 클로드 코드(Claude Code)의 조합으로 나만의 세컨드 브레인인 &lt;strong&gt;LLM 위키를 구축&lt;/strong&gt;했는데요. 이번 글에서는 그 과정과 LLM 위키 구축 경험에서 얻은 인사이트를 정리해 봤습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;미리 요점만 콕 집어보면?&lt;/strong&gt;&lt;/h4&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;li&gt;여러 AI에게 매번 나의 상황과 맥락을 설명해야 하는 일은 결국 ‘흩어진 컨텍스트’와 '나 자신을 데이터로 다루는 시스템'이 없기 때문에 발생합니다.&lt;/li&gt;&lt;li&gt;옵시디언, 깃허브, 클로드 코드 CLI의 조합으로 안드레 카파시의 LLM 위키 아이디어를 제 자신만의 세컨드 브레인으로 적용해 구축해 보았습니다.&lt;/li&gt;&lt;li&gt;프로덕트 메이커(Product Maker)에게 개인 컨텍스트의 자산화는 단순히 일회성으로 컨텍스트를 정리하는 것에 그치지 않고, 장기적 관점에서 AI 활용의 생산성을 극대화하는 일에 가깝습니다.&lt;/li&gt;&lt;/ul&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;나만의 LLM 위키를 만든 이유&lt;/strong&gt;&lt;/h3&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1) 여러 곳에 흩어져 있는 컨텍스트&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;최근에는 다양한 AI 도구들이 저마다의 장단점을 가지고 있어, 사용자들이 &lt;strong&gt;여러 AI 도구를 이용&lt;/strong&gt;하는 경우가 많습니다. 저 역시 서비스 기획이나 비즈니스 아이디어 정리는 클로드 챗의 프로젝트 기능을 사용하고, 가벼운 검색이나 이미지 생성은 챗지피티를, 코드 작업은 클로드 코드, 디자인은 클로드 디자인, 유튜브 요약과 글쓰기 보조 도구로는 제미나이 챗을 사용하고 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/1__%EC%9D%BC%EA%B4%80%EB%90%9C_%EC%BB%A8%ED%85%8D%EC%8A%A4%ED%8A%B8_%EA%B4%80%EB%A6%AC%EC%9D%98_%EC%96%B4%EB%A0%A4%EC%9B%80.png"&gt;&lt;figcaption&gt;일관된 컨텍스트 관리의 어려움 &amp;lt;출처: ChatGPT 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이처럼 여러 AI 도구를 병행하다 보니 각 도구마다 저의 상황과 맥락을 반복해서 설명해야 했고, &lt;strong&gt;컨텍스트의 일관성&lt;/strong&gt;을 유지하기도 쉽지 않았습니다. 게다가 정보가 수집되고 정리되는 채널도 제각각이었습니다. 가벼운 메모는 구글 킵(Keep), 회의록은 노션(Notion), 업무 문서는 구글 워크스페이스(Google Workspace), 그리고 코드와 프로젝트 데이터는 깃허브(GitHub)에 흩어져 있는 식이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2) 분산된 정보의 통합&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;그래서 저는 이번 LLM 위키 구축을 통해 구글 킵, 노션, 구글 스페이스, 깃허브 등 여러 곳에 흩어져 있는 모든 정보를 &lt;strong&gt;하나의 일관된 시스템으로&lt;/strong&gt; 통합해 보기로 했습니다. 분산된 정보는 AI가 '나 자신'의 온전한 맥락을 파악하는 데 가장 큰 장애물이 되며, 이 상태로는 AI 에이전트의 생산성이 제한될 수밖에 없다고 생각했기 때문입니다. 따라서 모든 형태의 개인 데이터를 한곳에 모아 AI가 쉽게 접근하고 활용할 수 있는 세컨드 브레인 구축을 시작했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/2__%EC%98%B5%EC%8B%9C%EB%94%94%EC%96%B8%EC%9D%84_%EC%9D%B4%EC%9A%A9%ED%95%98%EC%97%AC_%EB%B6%84%EC%82%B0%EB%90%9C_%EC%A0%95%EB%B3%B4%EB%A5%BC_%ED%86%B5%ED%95%A9.png"&gt;&lt;figcaption&gt;옵시디언을 이용하여 분산된 정보를 통합 &amp;lt;출처: ChatGPT 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;분산된 정보를 통합하고, 나만의 LLM 위키를 만들기 위한 도구를 고를 때 가장 중요하게 본 기준은 세 가지였습니다. &lt;strong&gt;빠른 속도&lt;/strong&gt;, &lt;strong&gt;안정적인 동기화&lt;/strong&gt;, 그리고 &lt;strong&gt;저의 워크플로우에 적합한 도구&lt;/strong&gt;였습니다. 그렇게 여러 리서치와 테스트를 거쳐 결국 앞선 세 가지를 모두 만족하는 도구로 옵시디언을 선택하게 되었습니다. 사실 많은 이들이 옵시디언을 사용한다고 해서 같은 도구를 선택하고 싶진 않았습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 이런저런 도구를 테스트하며 꽤 많은 시간을 허비하고 나서, 결국 다른 사람들과 같은 선택을 하게 되었습니다. 결론적으로 &lt;strong&gt;옵시디언&lt;/strong&gt;을 중심으로 LLM 위키를 구축하고, 백업 및 동기화는 &lt;strong&gt;깃허브 Private Repo&lt;/strong&gt;, 위키 정리 작업은 &lt;strong&gt;클로드 코드&lt;/strong&gt;가 처리하는 것으로 결정했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;LLM 위키 구축 환경 세팅&lt;/strong&gt;&lt;/h3&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1) 옵시디언 세팅과 핵심 플러그인&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;옵시디언을 설치하고 가장 먼저 한 작업은 &lt;strong&gt;볼트(Vault) 생성&lt;/strong&gt;과 &lt;strong&gt;테마 설정&lt;/strong&gt;이었습니다. 옵시디언에서 볼트란 노트가 저장되는 폴더를 의미합니다. 테마로는 미니멀(Minimal) 테마를 선택했는데요. 옵시디언 커뮤니티에서 가장 인기 있는 테마이기도 하고, 깔끔하면서도 플러그인을 통해 카드뷰, 갤러리뷰 같은 다양한 세팅이 가능한 테마입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/3__%EB%AF%B8%EB%8B%88%EB%A9%80_%ED%85%8C%EB%A7%88%EB%A5%BC_%EC%A0%81%EC%9A%A9%ED%95%9C_%ED%99%94%EB%A9%B4.png"&gt;&lt;figcaption&gt;미니멀 테마를 적용한 옵시디언 화면 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이후에 제가 옵시디언에 &lt;strong&gt;설치한 플러그인&lt;/strong&gt;은 다음 표와 같습니다. 기본적으로 기기 간 동기화를 위한 깃(Git) 플러그인을 설치했고, 옵시디언 내에서 바로 클로드 코드를 사용하기 위한 터미널(Terminal) 플러그인도 설치했습니다. 추가로 템플릿 관리와 노트의 시각적 표현을 향상시키는 플러그인들도 설치했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/4__%EC%98%B5%EC%8B%9C%EB%94%94%EC%96%B8%EC%97%90_%EC%84%A4%EC%B9%98%ED%95%9C_%ED%95%B5%EC%8B%AC_%ED%94%8C%EB%9F%AC%EA%B7%B8%EC%9D%B8.png"&gt;&lt;figcaption&gt;옵시디언에 설치한 핵심 플러그인 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;아울러, &lt;strong&gt;자료를 수집하는 경로&lt;/strong&gt;도 옵시디언으로 일원화했습니다. &lt;strong&gt;데스크톱 PC&lt;/strong&gt;에서 웹 서핑하다 발견한 정보는 크롬 확장 프로그램인 ‘옵시디언 웹 클리퍼’를 통해 클릭 한 번으로 위키 볼트에 저장되도록 했습니다. 또한 &lt;strong&gt;모바일 기기&lt;/strong&gt;에서도 웹 서핑이나 유튜브, 스레드, 카카오톡, 페이스북 등을 보다가 유익한 콘텐츠를 발견하면 ‘공유’ 기능을 통해 바로 옵시디언으로 전송되도록 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/5__%EC%9E%90%EB%A3%8C_%EC%88%98%EC%A7%91%EC%9D%84_%EC%98%B5%EC%8B%9C%EB%94%94%EC%96%B8_%EB%B3%BC%ED%8A%B8%EB%A1%9C_%EC%9D%BC%EC%9B%90%ED%99%94.png"&gt;&lt;figcaption&gt;자료 수집을 옵시디언 볼트로 일원화 &amp;lt;출처: ChatGPT 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;만약 콘텐츠에 &lt;strong&gt;공유 버튼이 지원되지 않는 경우&lt;/strong&gt;에는 화면을 캡쳐하거나, 파일을 다운로드하여 옵시디언 볼트 내 임시 폴더에 저장했습니다. 그리고 파일명에 자료를 저장한 의도를 간단히 남기고, 추후 클로드 코드가 일괄적으로 자료를 정리하도록 구성했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2) 깃허브 연동(Private Repo)&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;앞서 살펴본 것처럼 여러 기기에서 자료를 수집하고, 노트를 사용하기 때문에 옵시디언 &lt;strong&gt;볼트의 동기화&lt;/strong&gt;가 필요합니다. 이를 위해 깃허브 Private Repo를 이용하면 레파지토리를 클라우드 백업 공간으로 활용하면서도 여러 기기에서 볼트를 동기화할 수 있습니다. 단, LLM 위키가 나의 거의 모든 데이터를 담고 있으므로 2단계 인증 등 &lt;strong&gt;보안을 엄격하게 관리해야&lt;/strong&gt; 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/6__%EA%B9%83%ED%97%88%EB%B8%8C_Private_Repo%EB%A5%BC_%ED%86%B5%ED%95%9C_%EB%8F%99%EA%B8%B0%ED%99%94_%EA%B5%AC%EC%A1%B0.png"&gt;&lt;figcaption&gt;깃허브 Private Repo를 통한 동기화 구조 &amp;lt;출처: ChatGPT 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;아이폰&lt;/strong&gt;같은 모바일 환경에서는 직접적으로 Git 저장소를 사용할 수 없기 때문에 옵시디언 싱크나 Working Copy라는 앱을 이용해야 합니다. 여기서 저는 &lt;strong&gt;Working Copy&lt;/strong&gt;를 사용하기로 했습니다. Working Copy는 클론(Clone) 기능은 무료이고 푸시(Push) 기능만 일회성 결제(약 $20)를 하면 되는데, 이는 옵시디언 싱크 구독을 1년 결제하는 것보다 장기적 비용 측면에서 저렴하다고 판단했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Working Copy 앱을 이용하려면 깃허브 개인 액세스 토큰(Personal Access Token)을 Fine-grained 권한으로 발급해 등록해야 합니다. 그러면 Working Copy로 클론한 폴더를 옵시디언 모바일에서 볼트로 열어 사용할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/7__Working_Copy_%EC%86%8C%EA%B0%9C.png"&gt;&lt;figcaption&gt;Working Copy 소개 &amp;lt;출처: https://workingcopy.app/&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3) 클로드 코드 CLI와 옵시디언 스킬 활용&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;옵시디언 볼트 안에서 클로드 코드, 코덱스 같은 AI 툴을 실행하면 위키의 작성과 수정, 삭제 등을 자동화할 수 있습니다. 이게 바로 LLM 위키의 핵심입니다. 즉, 사람이 직접 손으로 관리하던 이전의 위키와 달리 LLM 위키는 &lt;strong&gt;AI가 작성하고 관리하는 위키&lt;/strong&gt;인 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/8__%EC%98%B5%EC%8B%9C%EB%94%94%EC%96%B8__%ED%81%B4%EB%A1%9C%EB%93%9C_%EC%BD%94%EB%93%9C_CLI.png"&gt;&lt;figcaption&gt;옵시디언 + 클로드 코드 CLI &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 기존부터 사용하던 웨이브 터미널(&lt;a href="https://www.waveterm.dev/"&gt;&lt;u&gt;Wave Terminal&lt;/u&gt;&lt;/a&gt;)이라는&lt;strong&gt;CLI 툴로 클로드 코드&lt;/strong&gt;를 실행하여 LLM 위키를 구축했습니다. 클로드 코드로 여기저기 흩어져 있는 자료를 LLM 위키에 입력하고, 그렇게 구축된 위키를 바탕으로 질문하거나, 주기적으로 위키를 정리하는 일을 모두 이 CLI 환경 안에서 처리하고 있습니다. 참고로, CLI 사용이 익숙하지 않은 분들은 클로드 데스크톱 앱에 있는 &lt;strong&gt;클로드 코워크&lt;/strong&gt;(Claude Cowork)로도 동일한 작업을 할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/9__%ED%81%B4%EB%A1%9C%EB%93%9C_%EC%BD%94%EC%9B%8C%ED%81%AC%EB%A5%BC_%EC%9D%B4%EC%9A%A9%ED%95%9C_%EC%9C%84%ED%82%A4_%EA%B4%80%EB%A6%AC.png"&gt;&lt;figcaption&gt;클로드 코워크를 이용한 위키 관리 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;클로드 코드를 사용할 때의 핵심은 옵시디언 볼트의 루트 디렉터리에 CLAUDE.md라는 파일을 두고, 새 세션(대화창)을 열 때마다 &lt;strong&gt;시스템 컨텍스트로 자동 주입&lt;/strong&gt;되도록 만드는 것입니다. 이를 통해 CLAUDE.md가 사실상 위키 운영 매뉴얼로서 AI 작업의 일관성을 확보하는 역할을 하게 됩니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/10__%EC%84%B8%EC%85%98_%EC%8B%9C%EC%9E%91_%EC%8B%9C_Hook%EC%9D%84_%ED%86%B5%ED%95%B4_%EC%9C%84%ED%82%A4_%EC%9A%B4%EC%98%81_%EA%B7%9C%EC%B9%99%EA%B3%BC_index_%EC%A6%89%EC%8B%9C_%EC%B0%B8%EC%A1%B0.png"&gt;&lt;figcaption&gt;세션 시작 시 Hook을 통해 위키 운영 규칙과 index 즉시 참조 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만, 가끔 AI가 CLAUDE.md에 적힌 운영 규칙을 제대로 보지 않는 경우가 있습니다. 이런 경우에는 &lt;strong&gt;SessionStart Hook&lt;/strong&gt;을 걸어 세션 시작 시 강제로 운영 규칙을 주입하거나, 위키 index를 즉시 참조하도록 할 수 있습니다. 이를 통해 새로운 대화를 시작하는 경우에도 AI가 별도의 검색 없이 위키 운영 규칙과 나에 대한 질문에 즉답을 할 수 있게 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/11__%ED%81%B4%EB%A1%9C%EB%93%9C_%EC%BD%94%EB%93%9C%EC%9D%98_%EC%98%B5%EC%8B%9C%EB%94%94%EC%96%B8_%EC%8A%A4%ED%82%AC.png"&gt;&lt;figcaption&gt;클로드 코드의 옵시디언 스킬 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;또한 추가로 클로드 코드에 &lt;strong&gt;옵시디언 스킬&lt;/strong&gt;들을 설치했습니다. 옵시디언 볼트의 일괄 작업을 돕는 obsidian-cli와 콜아웃, 임베드, 프로퍼티 같은 옵시디언 특화 문법을 다루는 obsidian-markdown, 그리고 웹페이지에서 깔끔한 본문만 추출해주는 defuddle 같은 스킬들이 있습니다. 이러한 스킬들은 옵시디언 특화 문법이나 LLM 위키 운영에 최적화된 복잡한 작업이 필요할 때 유용합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;LLM 위키 설계와 활용하기&lt;/strong&gt;&lt;/h3&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1) 카테고리 설계&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이제 LLM 위키 환경 세팅이 끝났으니 구조를 설계할 단계입니다. 처음부터 나에 대한 모든 컨텍스트를 한 번에 만들려고 하면 어렵습니다. 그래서 저는 다음과 같은 프롬프트를 작성하여, 클로드 코드에게 &lt;strong&gt;위키 구조를 설계하도록&lt;/strong&gt; 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;내가 누구이고, 어떤 배경과 역사를 가졌으며, 어떤 사람들과 어떤 환경에 있는지, 어떤 생각과 철학을 가지고 있는지, 어떤 자산을 가지고 있는지, 어떤 것들을 메모했고, 어떤 지식과 정보를 가지고 있는지 등을 기록하고 연결할 수 있는 위키 구조가 필요하다. 안드레 카파시의 아이디어를 기반으로 나에 대한 핵심 정보들을 담을 수 있는 LLM 위키 구조를 설계해줘.&lt;/i&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이후 클로드가 제안해 준 카테고리를 기반으로 &lt;strong&gt;저에게 맞는 위키 구조&lt;/strong&gt;를 만들어 갔습니다. 현재는 나의 정체성(Identity), 생각(Thoughts), 목표(Goals), 역사(History), 사람(People), 자산(Assets), 일(Works)로 카테고리를 분류하여 사용하고 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2) 자료 인입(Ingest)&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;저는 안드레 카파시의 LLM 위키 개념을 클로드 코드에 넘겨, ingest, query, lint 스킬을 만들도록 했습니다. 그중에서 &lt;strong&gt;/ingest&lt;/strong&gt;는 새로 수집된 자료를 읽고, 적절한 위키 페이지로 합성하거나 연결하는 작업을 진행합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/12__%EA%B5%AC%EA%B8%80%ED%82%B5_ingest_%EA%B3%BC%EC%A0%95.png"&gt;&lt;figcaption&gt;구글킵 ingest 과정 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;자료 인입을 위해 저는 먼저 기존에 가지고 있던 노션과 구글 킵 노트를 ingest 했습니다. 즉, 노션과 구글 킵에서 백업한 파일을 raw 폴더에 넣고 /ingest 스킬을 사용했습니다. 여기에 &lt;strong&gt;민감 정보를 분리하는 과정&lt;/strong&gt;을 추가했는데요. 예를 들어, 비밀번호, 카드번호, 주민등록번호 같은 정보가 위키에 무분별하게 삽입되는 것을 방지하고자 했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/13_%EB%AF%BC%EA%B0%90_%EC%A0%95%EB%B3%B4_%EA%B0%90%EC%A7%80_%EB%B0%8F_%EB%A7%88%EC%8A%A4%ED%82%B9_%EC%B2%98%EB%A6%AC.png"&gt;&lt;figcaption&gt;민감 정보 감지 및 마스킹 처리 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이를 위해 클로드 코드가 민감 정보 패턴을 &lt;strong&gt;정규식&lt;/strong&gt;(Regex)으로 감지해 위키에 삽입 시 &lt;strong&gt;마스킹&lt;/strong&gt;(Masking) 처리를 하도록 했습니다. 다만, 이러한 정규식 감지는 완벽하지 않기 때문에(ex. 주민번호에 공백이 들어간 경우 등) 1차적인 안전장치로만 사용하고, 다음에 살펴볼 Lint 작업으로 재점검하거나, 본인이 직접 검토해야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3) 위키 점검 및 정리(Lint)&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;/lint&lt;/strong&gt;는 위키의 상태를 점검하는 작업입니다. 민감한 데이터나 모순된 정보, 어떤 노트에서도 연결되지 않은 고아(Orphan) 페이지, 다른 노트에서 언급만 되고 실제 파일이 없는 페이지 등을 잡아줍니다. 저는 &lt;strong&gt;클로드의 스케쥴 기능&lt;/strong&gt;을 활용해매일 자동으로 린트가 돌도록 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/14__%ED%81%B4%EB%A1%9C%EB%93%9C%EB%A5%BC_%EC%9D%B4%EC%9A%A9%ED%95%9C_Lint_%EC%9E%90%EB%8F%99%ED%99%94.png"&gt;&lt;figcaption&gt;클로드를 이용한 Lint 자동화 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;클로드의 스케쥴 기능을 사용하면, 따로 신경 쓰지 않아도 매일 위키의 깨진 링크나 정합성 문제를 &lt;strong&gt;자동으로 정리&lt;/strong&gt;할 수 있습니다. 비록 클로드가 중간에 Lint의 방향을 물어보는 경우가 있기도 하지만, 클로드의 스케쥴 기능으로 Lint 작업을 자동화하면 LLM 위키의 관리에 들어가는 비용을 줄일 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;4) LLM 위키의 활용&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;/query&lt;/strong&gt; 스킬은 위키 전체를 컨텍스트로 깔고 AI에게 질문하는 워크플로우입니다. 이를 통해 AI에게 질문을 던졌을 때 받는 '일반론적 답변'과는 &lt;strong&gt;결이 다른 답변&lt;/strong&gt;을 받을 수 있습니다. 이는 AI가 제 생각과 철학, 주어진 상황과 배경, 현재 운영 중인 비즈니스 환경, 진행 중인 프로젝트 목록과 우선순위까지 모두 알고 있기 때문입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/15__%EC%98%B5%EC%8B%9C%EB%94%94%EC%96%B8%EC%9D%98_%EA%B7%B8%EB%9E%98%ED%94%84_%EB%B7%B0_%EA%B8%B0%EB%8A%A5.png"&gt;&lt;figcaption&gt;옵시디언의 그래프 뷰 기능 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;또한 LLM 위키에 옵시디언을 활용하면 &lt;strong&gt;그래프 뷰&lt;/strong&gt;(Graph View) 기능을 사용할 수 있습니다. 그래프 뷰는 노트 간의 링크를 시각적으로 보여주는 기능인데요. 어떤 주제가 어떤 내용들과 연결되는지를 확인해 볼 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;실제 사용 후기와 한계는?&lt;/strong&gt;&lt;/h3&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1) 컨텍스트를 이해한 AI의 답변&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;요즘 저는 비즈니스를 위한 법인 설립과 다양한 프로젝트를 동시에 진행하고 있습니다. 그 과정에서 결정해야 할 일이 정말 많았는데요. "지금 법인을 설립하는 게 맞을까", "동시 진행 중인 프로젝트가 너무 많은데 어디서 힘을 빼야 할까", "이 사업 라인을 잠시 보류하는 게 맞을까"처럼 답이 하나로 떨어지지 않는 질문들이 있었습니다. 그리고 LLM 위키를 활용하여 저의 철학, 직전 1년 회고, 현재 진행 중인 프로젝트의 부담, 자녀 양육 사이클까지 고려한 &lt;strong&gt;맞춤형 답변&lt;/strong&gt;을 받을 수 있었습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이처럼 LLM 위키를 구축하고, AI에게 나의 컨텍스트 전부 전달함으로써 AI의 답변 품질이 '일반론적인 답변'에서 '&lt;strong&gt;나의 상황에 최적화된 답변&lt;/strong&gt;'으로 바뀐 것을 체감할 수 있었습니다. 아울러 &lt;a href="https://yozm.wishket.com/magazine/detail/3692/"&gt;&lt;u&gt;이전 글&lt;/u&gt;&lt;/a&gt;에서 만들었던 AI 비서 정대리도 LLM 위키를 활용하여 저의 의사결정 도우미로서 한 단계 진화시킬 수 있었습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2) LLM 위키의 한계점과 고려 사항&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;다만, 기대만큼 매끄럽지 않았던 부분도 있었습니다. 저의 경우에는 AI가 이미지에서 텍스트를 읽어 위키에 ingest할 때 부정확했던 사례가 많았습니다. 개인적으로 직접 손으로 쓰거나 다이어그램을 그린 메모지 사진과 노트 캡처 같은 이미지 기반 자료를 많이 가지고 있었는데요. 이런 자료를 Ingest 한 후 직접 위키를 검토해 봤을 때 &lt;strong&gt;사실관계가 어긋난 부분&lt;/strong&gt;이 상당히 많았습니다. 결국 제가 직접 관련된 항목을 하나하나 확인하며 다시 손으로 고쳐야 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;아울러 위키가 점점 커질수록 그 안에 담기는 &lt;strong&gt;민감 정보도 더 많아진다&lt;/strong&gt;는 문제가 있었습니다. 비록 마스킹 처리를 위한 목적이라도 비밀번호, 카드번호 같은 개인 정보를 AI에게 전부 넘겨야 하고, 민감 정보의 마스킹 처리가 제대로 됐는지도 일일이 확인하기 전까지 확신하기가 어려웠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;또한 동기화를 위해 깃허브의 비공개 Repository를 사용하지만, 그렇다고 모든 보안 위험이 사라지는 것도 아니었습니다. 만약 &lt;strong&gt;깃허브 계정이 해킹되면&lt;/strong&gt; 나의 모든 정보가 한꺼번에 털리는 문제가 생길 수도 있습니다. 따라서 기본적인 2단계 인증, 토큰(Token) 회전 같은 보호 장치를 반드시 설정해 두어야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;마지막으로 협업 시나리오에서도 또 다른 한계가 있었습니다. 나만의 LLM 위키에는 개인 정보가 많이 담겨 있기 때문에 팀과 공유하기가 어려웠습니다. 결국 팀과 공유할 컨텍스트는 &lt;strong&gt;팀 LLM 위키&lt;/strong&gt;를 다시 만들어야 하는 &lt;strong&gt;이중 작업&lt;/strong&gt;이 생기게 됩니다. LLM 위키에서는 단일 출처(Single source of truth, SSOT)를 원칙으로 표방하지만, 일부 정보는 결국 두 곳에 두게 되는 모순이 발생할 수밖에 없었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3792/16__LLM_%EC%9C%84%ED%82%A4_%EC%82%AC%EC%9A%A9_%ED%9B%84%EA%B8%B0%EC%99%80_%ED%95%9C%EA%B3%84.png"&gt;&lt;figcaption&gt;LLM 위키 사용 후기와 한계 &amp;lt;출처: ChatGPT 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;이상으로 안드레 카파시의 아이디어를 적용하여 나만의 세컨드 브레인인 LLM 위키를 만든 과정과 후기를 정리해 봤습니다. 처음에는 단순히 AI에게 매번 나의 컨텍스트를 설명하는 것이 답답해서 시작한 작업이었지만, 만들고 보니 &lt;strong&gt;컨텍스트 정리의 자동화&lt;/strong&gt;와 &lt;strong&gt;AI 답변 품질의 향상&lt;/strong&gt;이라는 효과를 체감할 수 있었습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;프로덕트 메이커의 입장에서 볼 때, LLM 위키의 구축은 단순한 일회성 프로젝트라기보다 장기적 관점에서 자신의 컨텍스트를 자산처럼 쌓아가는 과정이라고 생각합니다. 그리고 그렇게 쌓여진 나만의 컨텍스트를 통해서 &lt;strong&gt;AI 도구 활용의 생산성&lt;/strong&gt;을 극대화할 수 있을 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 이번에 제가 수행한 LLM 위키 구축 방식이 모두에게 정답은 아닐 것입니다. 특히 옵시디언이라는 도구는 손에 익기 전까지 학습 비용이 있고, 기기 간 동기화 방식도 다양하게 있기 때문입니다. 아울러 업무에 필요한 컨텍스트 정리의 수준도 개인마다 다르기 때문에 세컨드 브레인 구축에 있어 어떤 특정한 &lt;strong&gt;정답은 없다고 생각&lt;/strong&gt;합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;마지막으로 한 가지 강조하고 싶은 점은 세컨드 브레인 구축 시 처음부터 완벽한 구조를 만들겠다는 욕심을 내려놔야 한다는 것입니다. 위키의 카테고리나 자동화 워크플로우, 동기화 셋업을 한꺼번에 완벽하게 만들겠다고 하다 보면 중간에 포기하게 될 수도 있기 때문이죠. 따라서 &lt;strong&gt;점진적으로 개선&lt;/strong&gt;해 나간다는 느낌으로, 나만의 세컨드 브레인 구축을 시도해 보시길 바랍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>AI 챗봇을 도입했는데, 왜 업무는 그대로일까</title><link>https://yozm.wishket.com/magazine/detail/3791</link><description>월요일 아침, 밀린 접수 전화가 쏟아지는 7명의 팀에 챗봇 하나만 들이면 24시간 접수는 자동이 됩니다. 하지만 그 뒤의 보험 판별·서류 정리·보험사 전달은 그대로 남죠. 같은 챗봇을 도입해도 어떤 회사는 채널 하나가 느는 데 그치고, 어떤 회사는 일하는 방식 자체가 바뀌는 차이가 여기서 갈립니다. 보험 대행사 TPA KOREA가 7명으로 하루 200건의 접수를 처리하던 구조를 어떻게 바꿨는지, AX 도입 전 회사가 답해야 할 6가지 질문까지 같이 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3791</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;이 글은 위시켓과 함께 요즘IT 브랜디드 콘텐츠로 제작했습니다.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;월요일 아침, 밀린 접수 전화가 쏟아집니다. 전화를 받은 사람은 그 건의 담당자가 되고, 사고 내용을 듣고, 어떤 보험에 해당하는지 판단하고, 필요한 서류를 안내합니다. 그런데 통화가 끝나도 일은 끝나지 않습니다. 고객이 보낸 서류는 메일과 팩스로 들어오고, 담당자는 이를 공용 NAS(네트워크 저장소) 에 저장한 뒤 엑셀에 다시 옮깁니다. 그리고 보험사에 메일로 전달합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;챗봇이 해결할 수 있는 건 이 중 어디까지일까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞서 언급한 어려움에 처한 기업들이 AI 챗봇을 알아보기 시작합니다. 업체 몇 곳에서 견적을 받고, 데모를 보고, 도입하죠. 그런데 막상 구축하고 나면 수작업이 줄지 않는 경우가 있습니다. 문의를 받은 뒤 할 일은 그대로고, 문의 채널만 하나 더 생긴 셈이 되거든요. 같은 챗봇을 만들어도 어떤 회사는 채널 하나가 느는 데 그치고, 어떤 회사는 일하는 방식 자체가 바뀝니다. 챗봇이 잘못한 게 아니라, 도입으로 기대한 변화가 제대로 정의되지 않았을 뿐입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기서 '달라져야 하는 것'은 챗봇의 기능 목록이 아닙니다. AI가 받은 정보가 어디로 흐르는지, 그 흐름이 업무의 마지막 지점까지 이어지는지, 도입 후 회사가 그 흐름을 직접 운영하고 수정할 수 있는지입니다. 견적서를 비교하기 전에 이 질문들에 답할 수 있는지가 챗봇을 추가 채널로 기능하게 두느냐, 아니면 일하는 방식을 바꾸느냐를 가릅니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;보험 대행사 TPA KOREA가 7명으로 하루 200건의 접수를 처리하던 운영 구조를 바꾼 과정은 이 차이를 잘 보여줍니다. 앞의 두 질문(정보가 어디로 흐르는가, 끝까지 이어지는가)은 워크플로우를 다시 그렸는지를, 마지막 질문(회사가 직접 운영·수정할 수 있는가)은 그 시스템을 내재화했는지를 묻습니다. 이 글은 TPA KOREA 사례로 이 두 조건, 워크플로우 재설계와 내재화를 살펴봅니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;7명이 하루 200건을 받던 팀, 챗봇만으로 AX가 안 되는 이유&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;이 사례의 주인공은 보험 대행사지만, 구조 자체는 업종을 가리지 않습니다. 주문을 접수하든, 민원을 처리하든, 지원자를 응대하든, 입구의 문의 하나 뒤에는 늘 여러 단계로 쪼개진 수작업이 따라붙으니까요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 흐름이 반복되던 곳이 TPA KOREA 지자체 유닛입니다. 이 팀은 전국 약 150개 지자체의 보험 상품을 담당했고, 고객 문의 접수부터 서류 관리, 보험료 납입, 계약 갱신까지 이어지는 업무를 7명의 실무자가 대부분 수작업으로 처리해왔습니다. 지자체 유닛의 이현화 책임은 당시를 두고 “월요일은 주말간 밀린 접수 전화로 전쟁이었다”고 말합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3791/ChatGPT_Image_2026%EB%85%84_5%EC%9B%94_26%EC%9D%BC_%EC%98%A4%EC%A0%84_11_36_05.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 요즘IT, Gemini로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;7명이 하루에 소화할 수 있는 접수는 약 200건. 사업을 확장하려면 사람을 함께 늘려야 하는 구조였고, 수익이 느는 만큼 고정비도 따라왔습니다. 회사 안에서는 자연스레 "전화를 꼭 사람이 받아야 할까"라는 질문이 떠올랐죠. 이 질문에서 멈췄다면 답은 챗봇 도입에서 끝났을지도 모릅니다. 실제로 TPA KOREA가 처음 외부에 들고 간 기획서도 챗봇 도입에 가까웠습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;회사가 도움을 청한 곳은 위시켓의 AI 전환 전담 조직인 &lt;a href="https://ax.ai-delivery.work/?utm_source=yozmit&amp;amp;utm_medium=260609_aidp_case_tpa"&gt;&lt;u&gt;위시켓 AIDP&lt;/u&gt;&lt;/a&gt;였습니다. 이 글은 위시켓 블로그에 공개된 TPA KOREA &lt;a href="https://blog.wishket.com/blog/tpakorea-aidp-ai-chatbot-case"&gt;&lt;u&gt;고객 사례&lt;/u&gt;&lt;/a&gt;를 바탕으로 재구성했습니다. 챗봇 도입을 검토하는 기업이 놓치기 쉬운, 하지만 도입 효과를 높이기 위해서는 꼭 알아야 할 지점을 따로 살펴보기 위해서입니다. "전화를 꼭 사람이 받아야 할까?"라는 질문이 어떻게 바뀌었는지, 그리고 그 변화가 왜 결과를 갈랐는지를 들여다보겠습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;‘도입’이 아니라 업무 흐름을 바꾼다는 것&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;처음 요청은 챗봇 구축에 가까웠습니다. 7명이 하루 약 200건의 접수를 처리해야 하는 구조에서 TPA KOREA가 먼저 떠올린 질문은 “전화를 꼭 사람이 받아야 할까?”였습니다. 이 요청만 놓고 보면 해법은 24시간 접수 챗봇처럼 보입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 위시켓 AIDP는 이 요청을 곧바로 개발로 옮기지 않았습니다. 일주일간 사무실에 상주하며 실무자 인터뷰를 진행했고, 보험 접수 전화가 들어온 뒤 어떤 판단과 서류 처리, 전달 과정이 이어지는지를 실무자와 함께 짚어보았습니다. 그 과정에서 드러난 병목은 ‘전화 받기’ 자체가 아니라, 전화가 끝난 뒤에도 계속 이어지는 업무 흐름이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;전화를 자동화해도 보험 판별, 서류 수신, NAS 저장, 엑셀 정리, 보험사 전달, 갱신 관리는 그대로 남습니다. 어느 단계든 사람이 멈추면 일도 멈추는 구조였죠. 챗봇만 도입했다면 회사가 얻는 건 24시간 자동 접수 하나뿐, 그 뒤의 흐름은 여전히 사람 손에서 사람 손으로 넘어갔을 겁니다. AX(AI 전환)를 검토하는 회사들이 자주 빠지는 함정도 여기에 있습니다. 가장 눈에 띄는 수작업 한 단계를 자동화하려다, 그 앞뒤로 이어지는 흐름 전체를 놓치는 것이죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 이 프로젝트에서 바뀐 것은 답이 아니라 질문이었습니다. “챗봇이 접수를 받을 수 있을까?”에서 “접수 이후 정보는 어디까지 흘러야 할까?”, “그 흐름을 회사가 계속 바꾸고 운영할 수 있을까?”로 질문이 확장된 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 질문 전환 뒤 나온 결과물은 챗봇 프로토타입이 아니었습니다. 앞단의 접수 챗봇, 정보와 처리 상태가 쌓이는 어드민, 그리고 두 시스템을 회사가 직접 운영하고 확장하는 방식까지 묶은 워크플로우 청사진이었습니다. 위시켓 AIDP 배종연 팀장은 “챗봇 단품만 올리면 24시간 접수만 자동으로 받고 그다음 처리는 다시 사람 손으로 돌아간다”며, “한 건의 접수가 챗봇에서 어드민을 거쳐 보험사 전달까지 한 시스템 안에서 이어지도록 설계했다”고 설명합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3791/6a0bbe5509af0515305ed79f_%E1%84%8B%E1%85%B0%E1%86%B8%E1%84%91%E1%85%B3%E1%86%AF%E1%84%85%E1%85%A9%E1%84%8B%E1%85%AE%E1%84%8B%E1%85%AD%E1%86%BC_1.png"&gt;&lt;figcaption&gt;위시켓 AIDP 배종연 팀장 &amp;lt;출처: 위시켓 AIDP&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 방향은 최근 AI 도입 조사에서 강조하는 흐름과도 맞닿아 있습니다. 맥킨지의 「The State of AI in 2025」에 따르면, 조사 응답자의 약 88%는 조직에서 AI를 정기적으로 사용하고 있다고 답했지만, AI 사용으로 영업이익(EBIT) 5% 이상 기여를 보고한 ‘AI 고성과 기업’은 약 6%에 그쳤습니다. 보고서는 이 고성과 기업들이 다른 조직보다 워크플로우를 근본적으로 재설계하는 경향이 약 3배 높다고 설명합니다. AI를 쓰는 회사는 많아도, AI에 맞춰 일하는 방식을 다시 그린 회사는 훨씬 적다는 뜻입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;TPA KOREA의 업무 흐름은 세 단계가 끊김 없이 이어지도록 설계됐습니다. RAG 기반 챗봇이 24시간 접수를 받고, 받은 정보가 어드민에 자동으로 쌓이며 처리 상태가 단계별로 갱신되고, 그 결과가 보험사 전달까지 한 시스템 안에서 이어집니다. 메일로 받은 서류를 NAS에 옮기고 엑셀에 적고 다시 메일로 보내던 구간이 모두 시스템 내부로 흡수된 거죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3791/6a0bc6ae296054c183d293af_tpakorea_%E1%84%8B%E1%85%A2%E1%86%B8%E1%84%8B%E1%85%A8%E1%84%89%E1%85%B5.png"&gt;&lt;figcaption&gt;실제 고객이 24시간 접수할 수 있는 문의 화면 &amp;lt;출처: 위시켓 AIDP&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3791/6a0bc7bae71625c6842da474_%E1%84%8B%E1%85%A5%E1%84%83%E1%85%B3%E1%84%86%E1%85%B5%E1%86%AB_%E1%84%8B%E1%85%A8%E1%84%89%E1%85%B5.png"&gt;&lt;figcaption&gt;2‍4시간 접수 받은 내용을 자동으로 쌓는 어드민 시스템 &amp;nbsp;화면. &amp;nbsp;TPA KOREA가 직접 사용하는 시스템이다. &amp;lt;출처: 위시켓 AIDP&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기서 RAG는 자료를 참고해 답변을 생성하는 방식의 챗봇으로, 새 보험사 양식이나 새 응대 패턴이 생겼을 때 시나리오를 다시 짜는 대신, 자료만 추가하면 다음 응대부터 반영된다는 점이 핵심입니다. 다시 말해 RAG는 운영 단계에서 회사가 스스로 확장할 수 있는 구조를 위한 선택이었고, 이는 두 번째 조건인 내재화와 직접 연결됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#999999;"&gt;&lt;u&gt;➡️&lt;/u&gt;&lt;/span&gt;&lt;a href="https://yozm.wishket.com/magazine/detail/2828/"&gt;&lt;span style="color:#999999;"&gt;&lt;u&gt;10분 만에 RAG 이해하기&lt;/u&gt;&lt;/span&gt;&lt;/a&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;정리하면, AX는 수작업 한 단계를 자동화하는 일이 아니라 업무 흐름 전체를 다시 설계하는 일입니다. 입구에 자동문 하나를 다는 것과 건물 안 동선 전체를 다시 그리는 것은 다른 일이죠. 같은 AI 기술을 쓰더라도 어느 쪽을 택했느냐에 따라 결과가 완전히 달라지는 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;시스템을 직접 바꿀 수 있어야 내재화다&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;AX에서 또 한 가지 중요한 것은 시스템을 만들 때부터 내재화를 함께 설계하는 일입니다. 만들어진 시스템을 누가 운영하고 누가 수정할 수 있는가. 이 권한이 어디에 있느냐에 따라 같은 시스템도 회사의 자산이 되거나, 또 다른 외주 의존의 시작점이 됩니다. 시스템은 한 번 만들면 끝나는 물건이 아니니까요. 보험사가 양식을 바꾸고, 새로운 요소가 추가되고, 응대 패턴이 달라질 때마다 손볼 일이 생깁니다. 이때 사내에서 처리하는 회사와 외부 업체에 다시 견적을 받아야 하는 회사 사이에는 큰 격차가 벌어집니다. 후자라면 일정 협상과 계약, 개발, 검수가 끝날 때까지 실무자는 결국 다시 수작업을 해야 하죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;TPA KOREA 사례에서 내재화가 가능했던 이유는, 시스템 자체보다 그 시스템을 운영하는 권한을 함께 받았기 때문입니다. 위시켓 AIDP는 구축 기간 동안 상주하며 실무자에게 운영 방법을 직접 교육했습니다. 여기서 교육의 초점은 단순한 사용법 전달이 아니라, 새 보험사 양식이나 지자체별 절차가 생겼을 때 실무자가 직접 워크플로우를 수정해보는 데 있었습니다. 그 결과 챗봇 학습, 어드민의 워크플로우 수정, 새 보험사나 지자체를 언제 어떻게 반영할지에 대한 결정까지 모두 사내에서 할 수 있게 됐습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이는 단순히 개발사에서 사용 매뉴얼을 받는 것과는 달랐습니다. 내부 직원들이 직접 시스템을 설계하고 운영하며 손에 익히도록 하는 것이었죠. 지자체 유닛 이현화 책임은 이 시간을 이렇게 회상합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;"교육 초반에는 솔직히 어려웠습니다. 시스템을 직접 다룬다는 게 부담이었거든요. 그런데 보험사·지자체별로 미묘하게 다른 양식을 우리 팀이 그 자리에서 직접 반영해본 뒤로, 일하는 방식 자체가 바뀌었다는 게 실감 났습니다."&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3791/6a0bc8dd517b21a846d3d9b2_%E1%84%82%E1%85%A2%E1%84%87%E1%85%AE%E1%84%80%E1%85%AD%E1%84%8B%E1%85%B2%E1%86%A8_tpa.png"&gt;&lt;figcaption&gt;&lt;span style="background-color:rgb(255,255,255);color:rgb(97,97,97);"&gt;위시켓AIDP가 TPA KOREA 임직원 대상으로 워크플로우 설계 교육을 하는 모습 &amp;lt;출처: 위시켓 AIDP&amp;gt;&lt;/span&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;‍&lt;/p&gt;&lt;p style="text-align:justify;"&gt;주목할 표현은 '&lt;strong&gt;일하는 방식 자체가 바뀌었다&lt;/strong&gt;'입니다. 도구를 받은 회사에는 새 도구가 한 대 늘지만, 운영 방식까지 익힌 회사에서는 업무 처리 기준이 회사 안에 남습니다. 그리고 그 답은 외부 업체가 떠난 뒤에도 회사의 자산이 되죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3791/6a0bc704f2ac3841f1a2dbc2_%E1%84%80%E1%85%A1%E1%84%8B%E1%85%B5%E1%84%83%E1%85%B3%E1%84%86%E1%85%AE%E1%86%AB%E1%84%89%E1%85%A5_1.png"&gt;&lt;figcaption&gt;내부 답당자가 직접 AI 챗봇을 교육시킬 수 있는 어드민 페이지&amp;nbsp;&lt;span style="background-color:rgb(255,255,255);color:rgb(97,97,97);"&gt;&amp;lt;출처: 위시켓 AIDP&amp;gt;&lt;/span&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이현화 책임은 실무 효율이 약 2배 오를 것으로 예상합니다. 하지만 더 본질적인 변화는 처리 용량을 늘리려고 인력 증원에만 의존하지 않아도 되는 구조가 만들어졌다는 점입니다. 게다가 시스템 확장 속도를 외부 업체가 아니라 회사가 결정할 수 있다는 것이, 매년 경쟁 입찰로 운영 업체가 바뀌는 지자체 보험 시장에서 다른 후보와 구분되는 차별 요소가 됐습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3791/ChatGPT_Image_2026%EB%85%84_5%EC%9B%94_26%EC%9D%BC_%EC%98%A4%EC%A0%84_11_54_12.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 요즘IT, Gemini로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;정리하면, 내재화, 곧 시스템을 사내에서 직접 운영하고 확장할 수 있는 구조를 함께 들여놓아야 AX라고 할 수 있습니다. 외부 업체가 떠난 뒤에도 회사가 스스로 굴릴 수 있어야 내재화라고 할 수 있고, 그렇지 않으면 시스템 운영을 또 다른 외주에 의존하는 것으로 이어질 수 있습니다. TPA KOREA의 사례는 내재화의 유무가 AX를 한 번의 프로젝트로 끝낼지, 회사의 일하는 방식으로 정착시킬지를 가른다는 점을 보여줍니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;이 사례에서 확인되는 AIDP의 접근 방식&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;요청을 그대로 개발하지 않았습니다.&lt;/strong&gt;&lt;br&gt;처음 요청은 챗봇 구축에 가까웠지만, AIDP는 바로 개발에 착수하기보다 실무자 인터뷰로 접수 이후 업무 흐름을 먼저 확인했습니다.&lt;br&gt;&amp;nbsp;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;업무 흐름을 시스템 구조로 다시 그렸습니다.&lt;/strong&gt;&lt;br&gt;전화 접수 이후의 보험 판별, 서류 수신, 상태 관리, 보험사 전달이 끊기지 않도록 챗봇과 어드민을 한 묶음으로 설계했습니다.&lt;br&gt;&amp;nbsp;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;운영 권한을 회사 안에 남기는 방향으로 설계했습니다.&lt;/strong&gt;&lt;br&gt;챗봇 학습, 어드민 워크플로우 수정, 새 보험사·지자체 반영을 사내에서 할 수 있도록 교육과 운영 권한을 함께 넘겼습니다.&lt;/li&gt;&lt;/ul&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AX 성공 여부를 가늠하는 6가지 체크리스트&amp;nbsp;&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;지금까지의 두 조건은 거창한 컨설팅 방법론이 아니라, AX를 검토할 때 다시 들여다봐야 할 질문들입니다. 이 질문들은 특정 솔루션이나 벤더를 전제하지 않습니다. 어떤 업체의 제안서를 받아 들든, 그 제안이 회사의 일하는 방식을 실제로 바꾸는지 가늠하는 기준에 가깝습니다. 앞서 본 두 조건을 점검 가능한 형태로 풀면, 설계 단계 질문은 워크플로우를 다시 그렸는지를, 운영 단계 질문은 내재화됐는지를 확인하는 것입니다. 책상 위에 두고 볼 수 있도록 두 단계로 나눠 정리했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3791/ChatGPT_Image_2026%EB%85%84_5%EC%9B%94_26%EC%9D%BC_%EC%98%A4%ED%9B%84_01_40_20.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 요즘IT, Gemini로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;설계 단계에서 점검할 질문&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;첫째, AI가 받은 정보가 어디로 흐르는가?&lt;/strong&gt;챗봇이나 자동화 도구가 받은 데이터가 다음 단계에서 다시 사람 손으로 돌아오지 않는지 살펴보는 질문입니다. 입구만 자동화되고 출구가 막혀 있는 설계는 자동화의 효과를 절반 이상 잃습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;둘째, 받은 정보가 최종 목적지까지 한 시스템 안에서 이어지는가?&lt;/strong&gt;입구에서 받은 정보가 메일에서 엑셀로, 엑셀에서 다른 시스템으로, 그 시스템에서 다시 메일로 옮겨 다닌다면, 그건 자동화라기보다 부분적인 디지털화에 가깝습니다. 보험 접수라면 보험사 전달, 주문 응대라면 출고와 결제처럼&lt;span style="color:#292929;"&gt;업무가 도달해야 할 마지막 지점까지&lt;/span&gt;시스템 안에서 흐름이 끊기지 않아야 합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;셋째, 처리 상태가 팀 안에서 공유되는가?&lt;/strong&gt; 어떤 건이 어느 단계에 있는지 누구나 확인할 수 있는지, 담당자가 없어도 일이 이어지는지 점검하는 질문입니다. AI 시스템이 받은 정보가 한 사람의 머릿속이나 한 사람의 받은편지함에 머문다면, 그건 디지털화일 뿐 자동화는 아닙니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;운영 단계에서 점검할 질문&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;넷째, 새로운 양식이나 시나리오가 생겼을 때 사내에서 반영할 수 있는가?&lt;/strong&gt;거래처 양식이 바뀌거나, 새 제휴처가 추가되거나, 응대 패턴에 변화가 생겼을 때 외주를 다시 발주하지 않고 사내에서 처리할 수 있는지를 묻는 질문입니다. 답이 '아니오'라면, 그 시스템은 회사 자산이라기보다 외부 업체와의 장기 계약에 가깝습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;다섯째, 시스템 운영 권한이 우리 회사 인력에게 있는가?&lt;/strong&gt;어드민에서 워크플로우를 수정할 권한, 챗봇에 자료를 추가할 권한이 사내에 있는지 점검하는 질문입니다. 단순히 '읽기 권한'이 있는 것과 바꿀 수 있는 권한이 있는 것은 전혀 다릅니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;여섯째, 도입 후 교육과 인수인계가 계약 범위에 들어 있는가?&lt;/strong&gt;시스템 구축은 끝났지만 운영 방식은 외부 업체에만 남아 있다면, 앞의 조건들이 모두 충족되어도 실제로는 활용되지 못합니다. 계약을 검토할 때 교육과 운영 이식이 어떤 형태로 포함되는지 미리 확인해두는 편이 좋습니다. 더불어 처음부터 전체를 한 번에 구축하는 방식만 제시하는지, 일부 단계부터 도입해 검증할 선택지가 있는지도 함께 살펴볼 만합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;도구를 더할 것인가, 일하는 방식을 바꿀 것인가&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;앞의 여섯 질문은 챗봇에만 해당하는 게 아니라, 진행 중인 AX 도입이 진짜 변화로 이어지는지 비추는 거울입니다. 절대적인 기준은 아니지만, 두세 개에만 ‘예’라고 답할 수 있다면 자동화 도구가 한 대 추가된 단계에 머물 가능성이 큽니다. 반대로 다섯 개 이상이 충족된다면, 적어도 일하는 방식의 변화가 시작됐다고 볼 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AX의 진짜 질문은 ‘어떤 AI 도구를 도입할 것인가’가 아닙니다. 이 도입이 우리 회사의 일하는 방식을 지속적으로 바꾸는가, 아니면 외주 한 건이 더 늘어나는가의 문제입니다. TPA KOREA의 사례가 보여주는 결론은 분명합니다. 조직의 &lt;span style="color:#292929;"&gt;AX&lt;/span&gt;가 성공하려면, 워크플로우 전체를 다시 그리는 결정과 운영 방식을 사내로 이식하는 결정이 함께 이뤄져야 합니다. 어떤 도구를 도입할지보다 이 여섯 가지 질문에 회사가 어떻게 답할 수 있는지가, AX의 방향을 결정합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 여섯 질문은 지금 방향이 맞는지는 가늠하게 해줘도, '&lt;strong&gt;그래서 무엇부터, 어떻게 시작하나&lt;/strong&gt;'까지 정해주진 않습니다. 거기서부터는 자가 점검을 넘어서는 영역이죠. 그 첫걸음은 회사가 지금 어느 단계에 있느냐에 따라 달라집니다. 위시켓 AIDP는 비IT 기업의 AX 현주소를 아날로그 단계부터 AI 내재화까지 5단계로 나눠 보고, 단계에 맞는 방식을 권합니다. 여섯 질문 끝에 '그래서 우리는 어디서부터'가 남았다면, 그 첫걸음을 짚는 데 위시켓 AIDP의 무료 AX 진단이 도움이 될 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:60%;"&gt;&lt;a href="https://aidp.wishket.com/?utm_source=yozmit&amp;amp;utm_medium=260609_aidp_case_tpa#contact"&gt;&lt;img src="https://www.wishket.com/media/news/3791/CTA__1_.gif"&gt;&lt;/a&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;위시켓 AIDP는?&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;IT 전문가 매칭 플랫폼 위시켓이 기업의 AI 도입 전 과정을 지원하기 위해 만든 AI 전문 사업부입니다. 13년간 축적한 12만 4천 건의 IT 프로젝트 데이터를 기반으로 기업의 AI 도입을 전략 수립부터 시스템 구축, 운영 내재화까지 전 과정에 걸쳐 실행하는 것을 강점으로 내세웁니다. 위시켓 AIDP 배종연 팀장은 “위시켓 AIDP는 기업 AX를 전략 수립부터 시스템 구축, 운영 내재화까지 함께하는 파트너”라며 “단순 시스템 구축을 넘어 기업이 스스로 기술을 활용할 역량을 갖출 때까지 함께한다”고 말했습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>'토큰 맥싱'의 시대는 끝났다: 메타·아마존·우버의 선택</title><link>https://yozm.wishket.com/magazine/detail/3790</link><description>AI를 잘 쓴다는 걸 토큰 사용량으로 증명하던 시대가 있었습니다. 한도 창을 캡처해 자랑하고 사내 리더보드로 줄을 세우던 분위기가, 메타·아마존·우버에서 약속이라도 한 듯 사용량을 제한하기 시작하며 빠르게 무너졌습니다. 사용량은 폭발했는데 성과는 그 속도를 증명하지 못했고, 토큰 사용량을 내 성과로 끌어안는 건 공급자의 매출 지표를 내 것이라 착각하는 일과 다르지 않았죠. 토큰맥싱이 끝난 자리에서 무엇을 봐야 할지 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3790</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;지금 IT 업계에서 내 경쟁력은 무엇으로 증명하면 좋을까요? 답은 쉽습니다. "AI를 잘 쓴다"겠죠. 그럼 AI를 잘 쓴다는 건 또 무엇으로 증명할까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;2025년 들어 클로드 코드 같은 코딩 에이전트가 퍼지면서, 여기저기서 유행하기 시작한 것이 있습니다. 누가 토큰을 더 많이 태웠는지 줄 세우는 '토큰 사용량 리더보드'입니다. 곧 이 기업 저 기업에서 사내 리더보드 캡처본을 자랑삼아 올리기 시작했습니다. "오늘 사용 한도 다 채웠다"며 한도 창을 찍어 올리는 게시글도 흔했고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런데 이 분위기는 최근 빠르게 무너졌습니다. 메타는 직원이 만들어 운영하던 토큰 순위표를 닫았고, 아마존도 비슷한 사내 순위표를 접으며 "AI를 그냥 쓰려고 쓰지는 말라"고 직원들에게 당부했습니다. 우버는 직원 1인당 AI 도구 비용에 한도를 걸었습니다. 언제는 맘껏 쓰라던 회사들이 약속이라도 한 듯 사용량을 제한하기 시작한 것입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이제 토큰 사용량을 실력의 잣대로 삼던 문화는 끝났습니다. '토큰 맥싱' 시대의 종말이죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3790/image1.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가, Gemini로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;토큰을 많이 쓰면 AI를 잘 쓰는 걸까?&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;h4&gt;&lt;strong&gt;토큰 맥싱이란?&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;‘토큰 맥싱(tokenmaxxing)’이란 단어부터 짚어 봅시다. 외모를 극한까지 가꾸는 행위를 ‘룩스맥싱’이라 부르는 데서 온 말로, ‘-맥싱’은 무언가를 끝까지 밀어붙인다는 의미입니다. 그러니 토큰 맥싱은 AI에게 일을 잔뜩 시켜 토큰을 최대한 많이 쓰는 행위를 가리킵니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이러한 토큰 맥싱이 추구하는 건 결과물이 아니라 사용량 그 자체입니다. 토큰을 많이 썼다는 사실이 곧 'AI를 잘 쓴다'는 증거로 통했고, 그게 토큰맥싱의 출발점이었죠.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;토큰 리더보드는 어떻게 퍼졌나&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이 발상이 회사 제도로까지 번진 건 2025년 7월 즈음입니다. 당시 AI-first를 회사 기조로 삼아 이목을 끌었던 쇼피파이에서 ‘리더보드’를 운영한다고 말했습니다. 당연히 나쁜 의도는 아니었습니다. AI로 좋은 성과를 낸 사람을 알아봐 주자는 취지였고, 실제로 꽤 효과를 봤다고 했습니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;span style="color:#999999;"&gt;*참고:&lt;/span&gt; &lt;a href="https://www.youtube.com/watch?v=u-3IILWQPRM"&gt;&lt;span style="color:#999999;"&gt;&lt;u&gt;Farhan Thawar와 함께 Shopify의 소프트웨어 엔지니어링을 변화시키는 AI&lt;/u&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style="color:#999999;"&gt;(The Pragmatic Engineer)&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;문제는 이 형식이 빠르게 번지면서 변질됐다는 점입니다. 직원을 점수로 줄 세우는 비슷한 리더보드가 여러 회사에 생겼습니다. 메타에는 직원이 직접 만든 토큰 순위표가 있었는데, 사용량 상위 이용자에게 '토큰 레전드(Token Legend)'·'캐시의 마법사(Cache Wizard)' 같은 칭호까지 붙였습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:80%;"&gt;&lt;img src="https://www.wishket.com/media/news/3790/image2.png"&gt;&lt;figcaption&gt;더 인포메이션 메타 담당 기자의 ‘토큰맥싱 리더보드’ 글 &amp;lt;출처:&lt;a href="https://www.linkedin.com/in/jyoti-mann-873a4317b/recent-activity/all/"&gt;&lt;u&gt;Jyoti Mann 링크드인&lt;/u&gt;&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;마이크로소프트, 디즈니 등도 사내 ‘AI 도입 대시보드’에 사용량과 토큰 수를 띄웠고, 개발자 커뮤니티에도 토큰을 얼마나 썼는지 집계해주는 도구가 등장했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3790/image4.png"&gt;&lt;figcaption&gt;사용자의 토큰 사용량을 추적하는 리더보드 &amp;lt;출처:&lt;a href="https://tokscale.ai/leaderboard"&gt;&lt;u&gt;Tokscale&lt;/u&gt;&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;왜 토큰 리더보드는 무너졌나&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;애초에 토큰이 AI 활용도를 평가하는 지표 자리에 오른 이유는 단순합니다. 측정하기 쉬웠거든요. AI를 잘 도입했는지 따지는 건 원래 어렵고 눈에 잘 안 보이는데, 토큰은 숫자로 딱 떨어져 대시보드에 바로 뜹니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런데 그 시작이 쉬웠던 만큼 이런 믿음이 흔들리는 것도 금방이었습니다. 왜 그랬을까요?&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;토큰 ≠산출물의 양&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;단순합니다. 토큰을 몇 배 더 태워도 산출물이 그만큼 늘지는 않았던 겁니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이걸 가장 비싼 값을 치르며 확인한 곳이 우버입니다. 우버는 2026년 한 해 쓸 AI 코딩 도구 예산을 첫 4달 만에 전부 소진했습니다. 일부 엔지니어는 토큰 값으로 월 2,000달러까지 썼다고 합니다. 문제는 그렇게 쏟아붓고도 값을 했는지 아무도 자신 있게 답하지 못했다는 점입니다. 우버 COO도 AI 사용은 늘었지만 그 돈이 실제 성과로 이어졌다고 딱 잘라 말하긴 어렵다고 했죠. 사용량은 폭발했는데 성과는 그 속도를 증명하지 못한 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#999999;"&gt;*참고:&lt;/span&gt; &lt;a href="https://techcrunch.com/2026/06/02/uber-caps-employee-ai-spending-after-blowing-through-budget-in-four-months/"&gt;&lt;span style="color:#999999;"&gt;&lt;u&gt;Uber caps employee AI spending after blowing through budget in 4 months&lt;/u&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style="color:#999999;"&gt;(Techcrunch)&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 토큰을 많이 써서 코드를 쏟아내면 배포 건수는 늘지만, 그게 버그 없이 살아남는지는 별개의 이야기입니다. 그래서 우버는 직원 한 명당 도구별로 월 1,500달러 한도를 도입했습니다. 클로드 코드와 커서 같은 도구마다 따로 한도를 두고, 내부 대시보드로 사용량을 추적해 예외 승인이 있을 때만 초과를 허용하는 방식이죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;토큰 ≠ 정직도&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;아마존에서도 직원들이 사내 도구로 굳이 안 해도 될 작업을 AI에게 떠넘기며 토큰 소비를 늘렸다는 보도가 나왔습니다. 한 직원은 “매니저들이 지켜보고 있고, 사용량 추적이 비뚤어진 동기를 만든다”고 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#999999;"&gt;*참고:&lt;/span&gt; &lt;a href="https://arstechnica.com/ai/2026/05/amazon-employees-are-tokenmaxxing-due-to-pressure-to-use-ai-tools/"&gt;&lt;span style="color:#999999;"&gt;&lt;u&gt;Amazon employees are “tokenmaxxing” due to pressure to use AI tools&lt;/u&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style="color:#999999;"&gt;(ArsTechnica)&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;경제학자 찰스 굿하트의 말이 떠오릅니다. 측정하는 잣대가 목표가 되는 순간, 그건 더 이상 좋은 잣대가 아니라는 거죠. 사람은 평가받는 항목에 맞춰 행동을 비틉니다. 토큰 사용량이 평가 기준이 되자, 토큰을 일부러 부풀리는 일이 실제로 벌어진 겁니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;토큰 = 공급자의 매출&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;게다가 좀 더 구조적인 문제도 있습니다. 주요 모델을 만든 회사들의 매출은 최근 폭발적으로 늘었고, 그 배경에는 슬금슬금 오른 토큰 비용이 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:80%;"&gt;&lt;img src="https://www.wishket.com/media/news/3790/Gemini_Generated_Image_gkl9tygkl9tygkl9.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;표를 보면 최근 나온 신형 모델들이 한 세대 전보다 비싸졌습니다. GPT-5.5는 직전 세대의 두 배, 제미나이 3.5 Flash는 직전 플래시의 약 세 배로 올랐고, 클로드 Opus 4.7은 표시 가격은 그대로지만 새 토크나이저 탓에 같은 글이 토큰을 최대 35%까지 더 먹습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 성능이 좋아졌으니 값이 오르는 게 당연하다고 볼 수도 있습니다. 하지만, 단가만 오른 게 아닙니다. 토큰을 가장 많이 쓰는 코딩 에이전트들이 새 기능을 토큰을 더 소비하는 방향으로 진화시켜 왔거든요. 단가도, 한 작업에 드는 토큰 양도 함께 늘어난 셈입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:80%;"&gt;&lt;img src="https://www.wishket.com/media/news/3790/image5.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 공급자를 악당으로 몰 일은 아닙니다. 분명 모델이 토큰을 많이 쓴다는 것은 더 많은 일을 처리할 가능성을 높이며, 그 구조를 알아서 만들어 주는 기능은 일을 편하게 해줍니다. 게다가 모델을 한 번 돌릴 때마다 전력과 인프라 비용이 진짜로 들어가니, 가격이 오르는 데는 나름의 근거가 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 이걸 돈 내고 쓰는 사람들의 생각은 다를 겁니다. 돈을 쓰는 만큼 효과가 돌아와야 하는데, 그게 불분명한 구성이었으니까요. 이 구조에서 토큰 사용량을 내 성과라고 끌어안는 건, 남의 매출 지표를 내 성과라고 착각하는 일과 다르지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;토큰 대신 무엇을 봐야 하나&amp;nbsp;&lt;/strong&gt;&lt;/h3&gt;&lt;h4&gt;&lt;strong&gt;적게 쓰고 잘 쓰는 게 실력&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;앤트로픽이 &lt;a href="https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents"&gt;&lt;u&gt;공식 엔지니어링 블로그&lt;/u&gt;&lt;/a&gt;에서 권하는 원칙은 이렇습니다. 원하는 결과가 나올 가능성을 최대로 높이되, 신호가 분명한 정보만 가능한 한 적게 넣으라는 거죠.&amp;nbsp; 토큰을 많이 욱여넣지 말고, 필요한 것만 정확히 골라 넣으라는 뜻이죠. 뜻입니다. 컨텍스트를 가득 채운다고 결과가 좋아지지 않습니다. 오히려 잡음이 끼면 정확도만 떨어지죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;실제로 에이전트의 동작 환경을 제어하는 ‘하네스 엔지니어링’ 기술이 발전하며, 컨텍스트 주입과 성과 관리, 피드백에 대한 루프가 진화한 것도 '토큰을 많이 쓰면 좋다'는 믿음에 더 큰 의심을 키웠고요.&amp;nbsp; 한국에서도 ‘&lt;a href="https://www.khan.co.kr/article/202604290600081"&gt;&lt;u&gt;토성비&lt;/u&gt;&lt;/a&gt;’, 그러니까 토큰 가성비라는 말이 생겼을 정도입니다. 토큰을 얼마나 썼느냐가 아니라 그 돈으로 무엇을 얻었느냐를 따지기 시작했다는 뜻입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3790/image3.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가, Gemini로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;성과 측정은 새로운 숙제가 아니다&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;결국 다시 봐야 할 건 '토큰을 얼마나 썼나'가 아니라 '내가 풀려는 문제가 뭐고, AI가 내놓은 결과가 그 문제를 풀었나'입니다. 적은 토큰으로 목표를 이루도록 설계하는 능력, 그게 실력이라는 거죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그럼 ‘문제를 풀었나’를 어떻게 검증하냐고요? 결과와 목적 달성을 측정하는 일은 조직이 늘 해오던 일입니다. 코드를 몇 줄 썼는지로 개발자를 평가하면 쓸데없이 긴 코드만 양산된다는 걸 모두가 알고 있습니다. 그러니 AI가 왔다고 성과 측정을 바닥부터 새로 발명할 건 없습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하던 대로 하면 됩니다. ‘이 사람은(또는 나는) 고객이나 조직의 어떤 문제를 풀었고, 그래서 제품과 회사에 얼마나 보탬이 됐는가?’ 이걸 평가하면 충분합니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;마치며: 많이 쓰던 시대에서, 무엇을 풀었는지 묻는 시대로&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;토큰 맥싱의 시대가 그저 헛수고였던 것만은 아니라고 생각합니다. AI를 얼마나 쓰는지 줄 세우는 것만으로도, "AI는 무섭고 쓸모없다"던 사람들을 "안 쓰면 도태된다"는 쪽으로 밀어붙이는 역할은 했으니까요. 아직 아무도 AI를 안 쓰려는 회사라면, 이 리더보드가 여전히 제 역할을 할지도 모릅니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러나 토큰맥싱은 끝났습니다. 더 정확히는, 토큰을 지표로 삼던 시대가 끝났습니다. 토큰은 앞으로도 계속, 어쩌면 더 많이 쓰일 테지만, 이제 그게 자랑거리는 아닙니다. 그러니 혹시 "아, 오늘도 사용 한도 다 채웠으니 열일했다"고 만족하던 분들은, 한 번 더 스스로 물어보면 어떨까요? 그 한도로 무엇을 바꿨는지를요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>GEO 콘텐츠 전략: SEO 키워드 보다 AI '맥락' 설계하는 법</title><link>https://yozm.wishket.com/magazine/detail/3788</link><description>기존에 써둔 글을 다 버려야 하나, SEO만 잘하면 GEO는 자동으로 되는 거 아닌가. SEO 컨설턴트 빌더블 이소연 대표가 GEO 세미나에서 가장 많이 받는 질문들이라고 합니다. 그가 LG그램 발열 검색 사례로 푼 답은 이렇습니다. SEO는 키워드에서, GEO는 프롬프트에서 시작하고, 그 뒤엔 쿼리 팬아웃과 RAG가 돌아간다는 것. 그리고 AI는 느낌이 아니라 맥락을 믿기에, 브랜드를 문제·솔루션·증거·제3자 검증과 함께 반복해 설계해야 한다는 이야기까지 1인칭으로 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3788</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;이소연 빌더블 대표 | GEO 팩트체크 세미나 '실제 사례로 살펴보는 GEO 오해와 진실' 첫 번째 강연&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;이 글은 5월 21일 열린&lt;/i&gt; &lt;a href="https://youtu.be/5u3yjszUDW8?si=Xdm1LunftA-COUz_"&gt;&lt;i&gt;GEO 팩트체크 세미나&lt;/i&gt;&lt;/a&gt;&lt;i&gt;에서 이소연 빌더블 대표가 발표한 내용을 1인칭 시점으로 정리한 글입니다. 앞서 공개한 사전 가이드가 “&lt;/i&gt;&lt;a href="https://yozm.wishket.com/magazine/detail/3748/"&gt;&lt;i&gt;&lt;u&gt;GEO 콘텐츠는 SEO 글쓰기와 무엇이 같고 다른가&lt;/u&gt;&lt;/i&gt;&lt;/a&gt;&lt;i&gt;”를 설명했다면, 이 글은 세미나 현장에서 다룬 LG그램 검색 사례, 쿼리 팬아웃과 RAG, 브랜드를 문제·솔루션·증거·제3자 검증과 함께 설계하는 방법을 발표 흐름에 맞춰 정리했습니다.&lt;/i&gt;&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;p style="text-align:justify;"&gt;안녕하세요. 귀한 시간 내주셔서 감사합니다. 저는 현직 SEO 컨설턴트이자 SEO 교육 회사 &lt;a href="https://www.buildableseo.io/"&gt;빌더블&lt;/a&gt; 대표인 이소연이라고 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 오늘 세션에서 'GEO에 어떻게 콘텐츠를 써야 할까?'라는 의문에 조금이나마 해답을 드리고자 이 자리에 섰습니다. 앞으로 15분 정도 후에 이 세션이 끝나면, 저는 여러분이 이 세 가지를 가져가시길 바랍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;첫 번째는 SEO와 GEO의 차이점을 알아가시는 것이고요. 두 번째는 GEO 콘텐츠를 잘하려면 어떤 요소들이 들어가야 하는지 설명할 텐데, 그 부분을 이해하시는 것입니다. 그리고 세 번째는, 우리 브랜드 콘텐츠를 디벨롭하기 위해 내부에서 어떤 질문을 던져야 하는가입니다. 이 세 가지를 15분 후에 꼭 가져가시길 바랍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/8.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI가 바꿔놓은 검색, 우리는 어떻게 따라가야 할까&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;요즘 AI가 빠른 속도로 발전하면서 'AI가 화이트칼라를 대체할 것이다', 'SK하이닉스는 왜 사람을 안 뽑느냐' 같은 말이 나올 만큼 굉장히 혼란스러운 시대인 것 같아요. 일하는 방식이 흔들리는 것도 모자라, 소비자가 검색하는 패턴조차 바뀌고 있습니다. 그러니 '이 행동 변화의 속도를 우리가 어떻게 따라가야 하지?'라는 고민이 생길 수밖에 없죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 제가 가장 많이 듣는 질문이 "기존에 써놓은 글을 우리 다 버려야 할까요?", "SEO를 잘하면 GEO는 자동으로 되는 거 아닌가요?" 같은 것들입니다. 실제로 제게 들어오는 질문들이고요. 정말 혼란스럽다고 느낄 만큼 질문이 많습니다. 그래서 오늘은 이 혼란을 한 겹씩 걷어내 보려고 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image1.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;먼저 짚고 넘어가는 SEO&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;GEO를 이야기하려면, 우리가 익숙하게 알고 있는 SEO부터 한 번 짚고 넘어가는 게 순서입니다. SEO에서 가장 중요한 요소는 &lt;strong&gt;키워드&lt;/strong&gt;입니다. 모든 건 검색하는 사람이 어떤 순간에 키워드를 검색하면서 시작돼요. 우리는 그 사람들의 눈에 띄기 위해 키워드를 제목에 넣고, 그렇게 검색 결과 상위에 노출시켜 트래픽을 우리 쪽으로 가져옵니다. 이 일련의 작업이 바로 SEO죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;말로만 설명하면 와닿지 않으니, 제 실제 검색 기록을 가져왔습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;며칠 전 제가 직접 'LG 그램 발열 해결'이라고 검색한 화면입니다. 지난주에 유튜브 라이브가 하나 예정되어 있었는데, 라이브를 하려면 이 컴퓨터로 작업이 원활해야 했거든요. 그런데 부하가 조금만 걸려도 발열이 심해지는 거예요. '이 상태로 라이브를 하다가는 속된 말로 방송을 망칠 수도 있겠다' 싶어서, 급한 마음에 이렇게 검색을 해봤습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image3.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 LG전자 고객지원센터에도 들어가 보고, 밑에 있는 블로그, 그리고 AI 개요 섹션에서도 정보를 탐색했어요. 그런데 제가 원하는 답변이 빠르게 나오진 않더라고요. 단편적인 키워드 하나로는, 제 구체적인 상황에 딱 맞는 답을 찾기 어려웠던 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;같은 문제, 전혀 다른 검색 방식&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;그래서 이번엔 같은 문제를 들고 AI에게 가봤습니다. 저는 라이너에 똑같은 고민을 검색했어요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image7.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;방금 본 SEO 검색과 나란히 놓으면 차이가 단번에 드러납니다. 구글에서는 단편적인 키워드만 던졌지만, 라이너에서는 굉장히 디테일한 맥락을 적었거든요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;"지금 사용하고 있는 컴퓨터가 LG그램인데, 전원을 켜면 팬에서 소리가 크게 나고 바로 뜨거워져. 그리고 줌(zoom)을 켜면 더 발열이 심해지면서 중간에 멈추거나 화면이 꺼져. 어떻게 해결해야 해?"&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 제가 처한 문제 상황을 구체적으로 적고, 무엇을 바라는지까지 적은 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;아마 여기 계신 분들도 구글 창에서는 저와 같은 톤으로, 짧은 키워드로 검색하실 거예요. 반대로 라이너든 제미나이든 생성형 AI 검색에서는 이렇게 문장 형태로 묻게 되고요. 게다가 질문 하나로 끝나지도 않습니다. AI와 티키타카를 주고받으면서, 내 의도와 내가 왜 이걸 검색하는지 그 맥락을 점점 더 자세히 설명하게 되죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;바로 이 지점이 SEO와 GEO를 가르는 출발선입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI 검색이 작동하는 두 가지 원리, 쿼리 팬아웃과 RAG&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;우리가 AI에게 문장으로 질문을 던지면, 그 뒤에서 두 가지 기능이 작동합니다. 이걸 알아야 GEO가 왜 SEO와 다른지 이해할 수 있어요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. 쿼리 팬아웃(Query Fan-out)&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;첫 번째로는 쿼리 팬아웃이라는 기능이 작동합니다. 말 그대로 하나의 질문을 부채를 펼치듯 여러 갈래의 하위 질문으로 쪼개는 기능이에요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞서 보신 것처럼 제가 LG 그램과 관련해 문장으로 된 검색을 하면, AI는 이걸 'LG 그램 발열 문제 해결 방법'으로 한번 검색하고, 같은 의도의 하위 질문을 'LG 그램 팬 소음 해결' 같은 식으로 바꿔서 또 검색합니다. 한 번 물었는데 AI가 알아서 여러 번 나눠 검색하는 셈이죠. 이것을 쿼리 팬아웃이라고 부릅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image2.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. RAG(검색 증강 생성)&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;두 번째는 그 뒤에서 작동하는 RAG(검색 증강 생성, Retrieval-Augmented Generation)입니다. RAG는 사용자가 질문하면, AI가 곧장 답하지 않고 필요한 만큼 관련 자료를 더 검색한 뒤 그 근거 위에서 답을 만드는 방식이에요. 학습한 지식만으로 그럴듯하게 지어내는 '할루시네이션', 즉 AI가 사실이 아닌 내용을 자신 있게 말해버리는 현상을 줄이기 위한 장치입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image8.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이때 AI가 뒤지는 데이터의 범위가 상당히 넓습니다. PDF로 올라간 매뉴얼은 물론이고, 자사 웹사이트, 블로그, 상품 리뷰까지 읽어 가고요. 여기에 그치지 않고 남들이 올린 블로그, 유튜브, 인스타그램 캡션, 스레드(Thread) 같은 SNS까지 다 훑는다고 보시면 됩니다. 이렇게 사방에서 정보를 끌어모은 다음, '이 사람이 이걸 왜 검색했더라?' 하는 맥락에 맞춰 관련 문서를 종합해 답을 돌려주는 것, 그게 RAG입니다. 실제로 제가 라이너에 질문했을 때도, 라이너는 웹 문서 23개를 추가로 검색해서 답을 정리해 줬습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image4.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기서 한 번 정리하고 넘어가죠. GEO를 사용할 때 AI는 두 가지 일을 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;쿼리 팬아웃&lt;/strong&gt;: 우리가 한 가지 질문을 했을 때 더 잘 답하기 위해, n개의 하위 질문으로 확장해 병렬로 검색한다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;RAG&lt;/strong&gt;: 학습된 지식만으로 답하지 않고, 더 정확한 답을 위해 관련 자료를 검색한 뒤 그 자료를 맥락에 맞춰 하나의 답변으로 정리해 준다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 두 가지가 GEO를 이해하는 열쇠입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;SEO와 GEO, 무엇이 다른가&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;이 기능을 보면 SEO와 GEO의 차이점을 좀 더 명확하게 알 수 있어요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;SEO는 키워드로부터 시작고, GEO는 프롬프트로부터 시작합니다. 그리고 SEO에서는 한 번에 한 개의 키워드만 검색을 했죠. 그러나 GEO는 쿼리 팬아웃이라는 기능과 RAG라는 기술 덕분에, 우리가 한 번 프롬프트를 입력하더라도 N번의 검색, 그리고 N개의 출처를 보고 답변을 해주게 됩니다. 기존에 하던 SEO보다 훨씬 더 효율적으로 많은 정보를 습득할 수 있게 된 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 기존에 SEO를 할 때는, 우리가 자사 사이트를 많이 출현시킨다고 생각했어요. 백링크 같은 오프사이트 요소를 제외하면, 우리가 기본적으로 가장 신경 쓰는 게 뭐냐 하면 자사 웹사이트였거든요. 그렇게 됐을 때 우리의 성과는, 우리가 원하는 키워드에 노출을 올려서 클릭까지 일어나게 만드는 것이었습니다. 그래서 궁극적으로 구글 애널리틱스에서 '오가닉 트래픽이 이만큼 늘었네' 이런 것들을 주요 KPI로 삼았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러나 아까 RAG를 설명할 때, AI는 우리 웹사이트만 검색하는 게 아니라고 했잖아요. 유튜브도 보고, 인스타그램 캡션도 보고, 스레드도 보고, 블라인드 같은 커뮤니티 사이트도 봅니다. 그러다 보니 인터넷 전반에서 '우리 브랜드에 대해 어떻게 이야기하고 있지?' 이걸 최적화해야 합니다. 신경 써야 할 범위가 웹사이트보다 훨씬 넓어진 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 됐을 때 우리의 성과는 '인용'과 '추천'이 되어야 합니다. 사람들이 AI에게 "난 이런 제품 찾고 있어", "이런 서비스 찾고 있어", "이런 병원 찾고 있어"라고 궁극적으로 무언가를 요구할 때, 우리 브랜드가 추천되는 것. 이게 앞으로 우리가 가져야 할 가장 중요한 KPI라고 볼 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI는 느낌이 아니라 맥락을 믿는다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;그럼 추천이 잘 되려면 어떻게 해야 할까요? SEO 할 때는 키워드 분석부터 하고 '키워드를 어떻게 노출시켜야 하지?'를 생각했으니까, 반대로 'AI는 어떻게 검색을 할까?'를 생각하실 수 있잖아요. 그런데 저는 이것보다 더 중요하게 생각하는 포인트가 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;바로 &lt;strong&gt;'우리는 어떤 카테고리의 문제를, 어떤 방식으로 해결하는가'&lt;/strong&gt; 입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;우리가 브랜드를 떠올릴 때는 '느낌'이라는 게 오거든요. 저는 파타고니아라는 얘기를 들으면 좋은 이미지가 떠오르곤 합니다. 광활한 자연에서 사람들이 인간의 한계를 딛고 서핑을 하거나 백패킹을 하는, 이러한 느낌이나 이미지가 떠오릅니다. 그리고 '러닝' 하면 어떤 브랜드가 떠오르세요? 아마 머릿속에 각자 떠오르는 브랜드가 하나씩은 있으실 거예요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 AI는 우리처럼 '느낌'을 읽을 수 있나요? 머릿속에 이미지가 떠오르는 사람 같은 존재인가요? 아니죠. &lt;strong&gt;AI는 느낌이 아니라 맥락을 믿습니다.&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 우리는 이 맥락을 어떻게 설계해야 하느냐면, 브랜드가 어떤 문제 상황을 누구와 함께, 얼마나 자주, 얼마나 신뢰할 수 있는 출처에서 언급하는지를 AI가 답변의 근거로 삼기 때문에, '우리는 어떤 카테고리의 어떤 문제를 해결하는가'에 굉장히 집중해야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;같은 이야기가 반복될 때 AI는 학습한다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;예를 들어볼게요. 우리 회사 블로그나 의뢰한 블로그에 "잠을 못 자다가 베개를 바꾸고 나서 달라졌어요. 아침에 일어나면 목이 한결 편해요" 이런 언급이 하나 있고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;또 유튜브나 인스타그램 등에서 누군가가 리뷰를 해줍니다. "수면 전문가가 추천해서 썼는데, 높이가 딱 맞아서 그런가 잠이 솔솔 온다."&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리고 블라인드 같은 데서도 "이 베개가 불면증 심한 사람한테 효과가 있다고 하는데, 진짜야?"라고 누가 물으면, 댓글로 "높이 조절이 잘 돼서 그런지 나한테 높이만 맞추면 기절한다" 이런 식의 반응들이 있겠죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image5.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;보시면, 표현이 조금씩 다를 뿐 사실 같은 얘기를 여러 번 합니다. 의미상으로는 굉장히 비슷해요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;"잠을 못 잤는데", "수면 전문가가 추천", "불면증 심한 사람" → 딱 봐도 어떤 문제가 있는지 알 수 있죠.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;"잠이 솔솔 온다", "기절한다" → 이 얘기를 하고 나면 그 효과가 뭔지 딱 그려지죠.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;"목이 한결 편하다", "높이가 딱 맞아서", "높이만 맞추면" → 어떤 문제를 어떻게 해결했는지 그 솔루션을 보여줍니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇듯 이런 문장들이 신뢰도 있는 출처에서 반복될수록, AI는 그 패턴을 읽어가고 '이 카테고리에서 이 문제가 있으면 이 브랜드가 추천되어야 하는구나'라고 학습합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞서 보였던 것처럼 이런 식으로 자꾸 반복하다 보면, 목이 불편해서 잠을 못 잘 때 검색하는 사람들에게 AI가 높이 조절이 가능한 베개를 추천해주게 되는 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 저는 다시 한 번 이 질문을 강조하고 싶습니다. &lt;strong&gt;우리는 어떤 카테고리의 문제를, 우리만의 어떤 방식으로 해결하는가.&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;콘텐츠에 함께 담아야 할 네 가지 설계&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;'브랜드에서 카테고리 욕구까지는 알겠는데, 그럼 어떤 지점에서 우리 브랜드를 떠올리게 만들어야 하는가?' 이거에 대해 조금 더 팁을 드리자면, 이 네 가지 설계가 같이 들어가면 좋습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ol&gt;&lt;li style="text-align:justify;"&gt;브랜드를 &lt;strong&gt;문제&lt;/strong&gt;와 함께 언급한다&lt;/li&gt;&lt;li style="text-align:justify;"&gt;브랜드를 &lt;strong&gt;솔루션&lt;/strong&gt;과 함께 언급한다&lt;/li&gt;&lt;li style="text-align:justify;"&gt;브랜드를 &lt;strong&gt;증거&lt;/strong&gt;와 함께 언급한다&lt;/li&gt;&lt;li style="text-align:justify;"&gt;브랜드를 &lt;strong&gt;제3자 검증&lt;/strong&gt;과 함께 언급한다&lt;/li&gt;&lt;/ol&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image9.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;예를 들어보면, &lt;strong&gt;문제&lt;/strong&gt;는 "수면 자세가 불편한 사람", "목 통증으로 아침마다 뻐근한 사람" 이렇게 "이런 문제가 있을 때는 이 브랜드가 있다"라고 제시해줄 수 있고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;더 나아가 &lt;strong&gt;솔루션&lt;/strong&gt;으로는 "이런 문제가 있는 사람한테는 높이 조절이 가능하면서 통기성까지 좋은 베개가 좋은 선택이에요"라고 이야기해주는 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;증거&lt;/strong&gt;는, 이 솔루션이 사실이라고 계속 이야기해주는 겁니다. "우리 베개를 사용한 사람들의 후기가 이렇게나 많고요, 그분들 사이에서도 이런 언급이 계속 많이 나옵니다." 그리고 "우리가 이 베개를 잘 만들기 위해 굉장히 많은 실험을 했는데, 그 실험 데이터는 여기 있습니다. 저희는 몇 번의 실험을 거쳐 이렇게 편한 베개를 만들었습니다. 내부적으로 사용했을 때도 만족도가 좋습니다"라고 증거를 제시할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;마지막으로 &lt;strong&gt;제3자 검증&lt;/strong&gt;은 "저희만 그렇게 말하는 게 아닙니다. 수면 전문 유튜버들이 이야기하고요, 어떤 논문에서도 근거가 될 만큼 우리 분위기도 훌륭합니다. 이렇게 입증된 사례가 정말 많아요. 저희만의 목소리가 아닙니다"라고 이야기하는 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 이 모든 것이 합쳐졌을 때 AI가 브랜드를 조금 더 자연스럽게 인식할 수 있다고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;우리가 내부적으로 던져야 할 세 가지 질문&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;그러기 위해서는 우리가 내부적으로 이런 질문을 던져봐야 한다고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;첫 번째, 우리 고객은 어떤 계기로 이 문제를 해결해야겠다고 생각했는가?&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;제가 계속 예시로 든 게 수면 베개잖아요. 그럼 그 고객은 어떤 순간에, 좌우로 뒤척이다가 목이 너무 아파서 일상생활을 못한다든지, 이런 식으로 검색까지 해야 할 만큼의 계기가 있었을 거예요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;두 번째, 우리 고객이 우리 제품을 구매하기 직전 어떤 모먼트였는가?&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;내가 불편함을 느끼는 계기, 그래서 무언가 솔루션을 찾아야겠다는 계기가 하나 있을 거고요. 그렇게 솔루션을 찾던 와중에 우리 제품이 눈에 띄었고, 그래서 왜 구매했는지 그 순간의 계기가 된 경험이 또 있을 거예요. 이 시각적 계기가 분명히 있을 테니, 첫 번째와 두 번째 질문에 대한 고객의 목소리를 많이 보는 게 중요하고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;세 번째, 그래서 우리 고객은 수많은 제품 중에 왜 굳이 경쟁사 제품이 아니라 우리 제품을 구매했는가?&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그게 광고의 어떤 부분이었는지, 아니면 우리 오가닉한 콘텐츠의 어떤 부분이었는지, 어떤 지점이 고객의 마음을 옮겼는지. 그리고 "써보니까 왜 좋아하더라" 이런 부분까지 우리는 파악해야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3788/image6.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;다시 쓰지 말고, 이 질문으로 점검하라&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;그래서 마지막으로, 우리 브랜드 콘텐츠를 다시 쓰기보다는, 기존 콘텐츠가 있다면 이 세 가지 질문이 그 콘텐츠 안에서 답변이 되는가를 점검하고 리라이팅하는 게 훨씬 좋을 것 같고요. 만약 "우리 콘텐츠는 지금 여기서부터 시작이다"라는 상태라면, 무작정 검색부터 하는 것보다 이 세 가지 질문에 먼저 답을 내리고 들어가는 게 좋다고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;SEO를 잘하던 사람은 GEO에도 쉽게 적응했다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;그런데 제가 이 내용을 정리하면서, 그리고 요새 GEO 관련해서 많은 이야기를 하면서 드는 생각이 있어요. 사실 SEO를 잘하는 사람은 이미 이걸 그렇게 하고 있었어요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;SEO를 잘하는 분들을 보면, 콘텐츠를 하나 발행하기 전에 '이게 문제를 해결해주는가'부터 보고 시작하고요. '이건 검색해서 들어온 사람에게 충분히 만족스러운 답변인가?', '우리 고객이 이 키워드로 검색해서 우리 콘텐츠를 보고, 뒤로 가기를 눌러서 다른 콘텐츠로 가버리진 않았겠지. 이 안에서 모든 걸 해결하겠지'라고 생각합니다. 그리고 더 나아가 '다른 사람들한테 기꺼이 공유할 수 있을 만큼의 만족스러운 퀄리티인가'까지 생각하죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이런 걸 생각하면서 SEO 콘텐츠를 발행하시던 분들은 GEO에서도 쉽게 적응하고 계셨습니다. 그런 의미에서 저는 SEO와 GEO가 엄청나게 크게 다른 전략이라고 생각하지는 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며: 분석보다 맥락이 먼저다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;다시 처음에 "15분 후에는 이 세 가지를 꼭 가져가셨으면 좋겠다"라고 말씀드렸는데요. 이제 정리해보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;첫 번째, SEO와 GEO의 차이점. 한 번의 키워드, 그리고 N번의 검색. 두 번째, GEO 콘텐츠를 잘하려면 어떤 요소가 들어가야 하는가. 마지막으로, 그걸 잘하기 위해 우리 내부적으로 던져야 할 세 가지 질문. 이걸 다 얻어가셨을 거라고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;제가 발표를 마치기 전에, 너무 조용해서 같은 말을 한 번 더 강조하고 싶은데요. 분석하는 건 정말 중요합니다. 그러나 처음부터 분석보다 더 중요한 건, 고객이 이걸 왜 검색했는지, 그리고 이걸 검색하게 된 그 바탕이 무엇인지, 그 맥락을 파악하는 것입니다. 그게 더더욱 중요합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저는 여기서 발표를 마치도록 하겠습니다. 감사합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="media"&gt;&lt;oembed url="https://youtu.be/O5D4tDi72_g"&gt;&lt;/oembed&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>AI 시대의 시지프스: 멈추지 못하는 완벽주의자를 위한 안내서</title><link>https://yozm.wishket.com/magazine/detail/3787</link><description>AI 에이전트는 작업물을 검토해 단점을 심각도별로 분류하고 대안까지 내놓는다. 완벽주의 기질이 있는 사람에게 이건 독이 든 성배다. 완벽한 코드란 없는데도 '한 번 더'를 멈추지 못한다. 그런 와중에 모델은 매일 좋아진다. 시지프스의 바위가 멈추지 않는 건 신의 벌이지만, 우리 바위가 멈추지 않는 건 멈추지 않기로 한 선택이다. 마감일을 정하고, 여러 세션을 번갈아 돌리고, 작업을 기록하고, 오늘의 최선에서 손을 떼기까지. 번아웃을 지나며 찾은 멈추는 법을 정리했다.</description><guid>https://yozm.wishket.com/magazine/detail/3787</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3787/image1.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가, ChatGPT로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;저녁 6시, 퇴근 시간이다. 내일까지 제출해야 하는 작업물을 완성했지만, 불안한 마음에 한 번 더 살펴본다. 검토하다가 놓친 부분을 발견하고 말았다. 시간이 늦었는데, 지금 수정할 수 있는 범위일까? 제출 기한을 늘려 달라고 요청하는 게 좋을까? 무리해서라도 수정을 마치고 내일 제출을 하는 것과, 안전하게 기한을 늘리는 선택지 사이에서 깊은 고민에 빠진다. 그나마 수정 방향이 금방 생각나면 다행이지만, 좋은 방안이 떠오르지 않는 경우도 있다. 슬프지만 실력의 한계를 느끼며 퇴근하고, 그날의 일은 거기서 마무리된다. 이것은 AI 에이전트가 나타나기 전까지 나의 일상이었다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 최근에는 상황이 많이 달라졌다. AI 에이전트(나의 경우 클로드)는 나의 고민을 듣고 작업물을 검토한 후, 단점을 파악해 심각도에 따라 분류해주며 대안들을 제시해준다. 내가 수정 방향을 고르면, 몇 분 안에 변경이 완료된다. 완벽주의 기질이 심한 나 같은 사람에게 이것은 독이 든 성배다. 완벽한 코드란 존재하지 않는데도 끝없이 질문하고 검토하며 일을 손에서 놓지 못하는 상황에 놓이는 것이다. 나는 모든 문제를 고쳐야 한다는 강박감에 시달리다가 번아웃을 경험했고, 이를 극복하는 과정에서 AI를 대하는 슬기로운 태도에 대해 생각해 보게 되었다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 여러분에게도 질문하고 싶다. 우리는 어디서 멈춰야 할까?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3787/image3.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가, ChatGPT로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;한 번 더, 한 번 더, 완벽을 향한 강박&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;나는 오래전부터 불면증이 있었는데, 최근 몇 달간 평소보다 더 늦게 잠자리에 들었다. 클로드랑 대화하다 보면 시간 감각도 무뎌졌다. 바이브 코딩이 재미있는 이유는 피드백이 빠르기 때문이다. 끊임없이 떠오르는 개선 사항을 클로드는 금방금방 반영해 주었다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;최근에 나는 일기를 자동으로 써주는 프로그램을 만들었는데, 그 프로그램은 도무지 완성되지 않았다. 처음에는 그저 캘린더의 일정을 나열하고, 클로드가 코멘트를 달아주는 정도를 원했다. 하지만 이내 한계가 드러났다. 캘린더에는 내가 실제로 한 일과 해야 한다고 적은 일이 뒤섞여있었기 때문에, 일기가 정확하지 않았던 것이다. 그때부터 일기의 정확도를 높일 방법을 고민했고, 텔레그램을 통한 사용자 인터랙션이 추가되었다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;메인 시스템 프롬프트&lt;/strong&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;“&lt;/strong&gt;하루봇 메인 파이프라인&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;매일 오후 8시(KST) 실행되어:&lt;/p&gt;&lt;p style="text-align:justify;"&gt;1. Calendar / Notion / GitHub에서 오늘 활동 수집&lt;/p&gt;&lt;p style="text-align:justify;"&gt;2. Claude API로 [오늘의 일정] + [태스크] 두 섹션 생성&lt;/p&gt;&lt;p style="text-align:justify;"&gt;3. Notion 일기 페이지 생성(오늘의 일정은 본문으로, 태스크와 할 일은 체크박스 리스트로)&lt;/p&gt;&lt;p style="text-align:justify;"&gt;4. Telegram에 일정 요약 + 할 일 체크박스 리스트(미완료 항목 + 완료 버튼) 전송&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;5. 사용자가 완료 버튼을 누르면 하루 피드백 생성·저장&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;사용자 답장(코멘트/설정)은 실시간으로 Notion 일기에 반영한다.”&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;일기에는 나의 생각도 담기는 게 좋을 것 같아서 내 답장을 일기에 함께 저장하도록 했다. 또한 ‘설정’은 버그를 간단히 수정하고 싶을 때를 대비해 만든 기능이다. ‘/설정’이라고 시작하는 코멘트는 별도 페이지에 저장되어, 시스템 프롬프트에 추가된다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기서 끝이 아니었다. 노션에 있는 오늘의 할 일 목록도 수집하도록 기능을 추가했는데, 할 일이 중복되어 나왔다. 중복 제거를 넣었지만 문자열 비교만으로는 ‘회의 준비’와 ‘회의 준비하기’를 같은 항목으로 인식하지 못해서, 결국 클로드에게 의미가 비슷한 항목을 골라내도록 시켰다. 봇이 요약을 보내기 전에 내가 먼저 메시지를 보내면 일기가 아직 없어서 저장할 곳이 없는 문제도 있었다. 그래서 어느 날짜 일기에 넣을지 물어보는 대화 흐름을 추가했다. 오늘은 할 일 체크 상태가 두 페이지 사이에서 동기화되지 않는 걸 발견해서 또 고쳤다. 분명 내일이 되면 또 부족한 점이 보일 것이다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;만약 이 프로그램을 처음부터 전부 다 직접 코딩했다면 설계 단계에서부터 매우 고민이 많았을 것이다. 한번 구조를 결정하면 변경이 어렵기 때문이다. 하지만 AI와 함께라면 구조 변경이 순식간에 가능하기 때문에, 아이디어가 떠오를 때마다 부담 없이 바로 시도해 볼 수 있었다. 그동안의 코딩과는 차원이 다른 속도로 기능이 완성되는, 정말이지 도파민이 터지는 순간들이었다. 새로운 프로그래밍 방법은 나를 쉴 수 없게 만들었다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런데 이게 언제쯤 완성될지 잘 모르겠다. 사실 사이드 프로젝트라 굳이 완성 시점을 정해야 하는 것은 아니다. 하지만 만약 이걸 앱스토어에 출시하기로 마음먹었다면, ‘이것만 고치고, 이 기능까지만 넣고’ 하다가 결국 완성하지 못할 것 같다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;가만히 생각해보면 모순적인 상황이다. 분명 아주 빠른 속도로 개발하고 있는데, 완성은 되지 않는 상황이다. “더 나은 버전이 존재한다”라는 사실이 계속 나를 불안하게 만든다. 당장 일주일 만에 수많은 기능들을 개선하고 추가할 수 있고, 완전히 갈아엎고 새로 만들 수도 있다. 그래서 적당한 선에서 완성을 외치기란 더 쉽지 않다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;왜 멈추지 못하는가?&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;예전에는 실력의 한계가 곧 완성도의 한계였다. 그때는 내가 할 수 있는 데까지 했으면 “여기까지가 내 최선이다”라고 받아들였다. 또한 이미 만든 결과물이 있으면 되도록 그것을 살리고 약간의 개선을 통해 어떻게든 완성하는 것이 자연스러운 이치였다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;하지만 이제는 굳이 그 지점에서 멈춰야 할 이유가 사라졌다. AI와 협업하다 보면 우리 마음속에 슬그머니 이런 불안감이 자리 잡는다. “혹시 프롬프트를 변경하면 더 좋은 결과물이 나오는 것 아닐까?”, “내가 검토시키지 않은 다른 문제는 없을까?” 몇 번 더 작업을 시키는 데에는 약간의 토큰만 들 뿐 시간은 별로 들지 않기에, 계속 붙잡고 있게 된다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;게다가 모델은 매일 좋아지고, 커뮤니티에서는 더 좋은 프롬프트 방법론도 등장한다. 이런 상황에서는 오늘 만든 결과물이 내일도 최선이라고 결코 장담할 수가 없다. 내 작업물이 10년 후의 경쟁작보다 뒤처지는 것은 양보할 수 있는 일이다. 하지만, 당장 내일의 경쟁작에 뒤처지는 것은 쉽게 용납하기가 어렵다. 멈추는 것은 곧 게으른 것이고, 포기하는 것처럼 느껴진다. 그렇게 완성은 요원해진다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리스 신화의 시지프스는 산꼭대기에 올린 바위가 다시 굴러떨어지기 때문에 그것을 또 밀어 올려야 했다. 그러나 우리는 바위가 꼭대기에 올라갔는데도, 더 높은 산이 보이기 때문에 멈추지 못한다. 시지프스가 받은 것은 신의 벌이지만, 우리가 받은 것은 스스로 선택한 벌이다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러면 우리는 어디서 멈춰야 하는 걸까?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;강박을 멈추기 위한 나만의 방법&amp;nbsp;&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;마크 엘리슨은 《완벽에 관하여》에서 흠집이 없는 완벽한 상태를 추구하기보단, 그 과정에서 성장하는 게 중요하다고 말한다. 현명한 말이다. 다만 AI 시대의 문제는 그 방향을 따라가는 비용이 너무 저렴해졌다는 점이다. 예전에는 방향만 잡고 한 걸음씩 움직였다면, 지금은 방향만 설정하면 AI가 비행기에 태워서 데려다준다. 그러나 인간의 정신과 신체는 아직 이 속도에 완전히 적응하지 못했다. 너무 빠르게 날면 금방 지치고 만다. 그렇기 때문에 스스로 멈출 정거장과 종점을 정해두는 게 좋다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;① 마감일을 정한다&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;당연한 말이지만, 기한이 없으면 끝도 없다. 무한한 개선의 가능성을 유한한 시간 안에 가두는 것이다. 만약 내가 일기 앱을 출시하려고 마음먹는다면, 1차, 2차, 최종 마감일을 정해놓을 것이다. 마감일이 코앞이라면 새로운 개선 사항이 떠오르더라도 일단 백로그에 둔다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;회사 업무에는 정해진 기한이 있으니 그나마 낫지만, 사이드 프로젝트처럼 아무도 재촉하지 않는 작업은 기한을 정하는 게 어렵다. 그리고 바이브 코딩은 자연어로 작업을 하기 때문에 태스크에 소요되는 시간을 산정하는 게 쉬운 일이 아니다. 정확하지 않더라도 일단 적당한 날짜를 선택하고, 프로젝트를 진행하면서 날짜를 산정하는 감을 익히는 것이 좋다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;② 우선순위를 정해서 번갈아 가며 손을 댄다(멀티태스킹)&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;이건 아마 모든 사람에게 통용되지는 않을 수 있고, AI 성능이 향상될수록 효용이 떨어질 수 있는 방법론이다. 모델에 따라 차이가 있지만, 대체로 일을 시키면 그에 대한 응답이 돌아올 때까지 시간이 좀 걸린다. 그래서 나는 그 시간을 활용하기 위해 여러 작업창을 띄워두고 번갈아가면서 작업을 시킨다. 원래 멀티태스킹을 선호하는 편은 아니었는데, AI와 협업을 한 이후로는 좋아하게 되었다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;내가 정한 우선순위는 ① 버그 수정 ② 마감이 임박한 일 ③ 난이도 높은 일이다. 버그는 최대한 빨리 고쳐야 하기 때문에, 이 터미널 창을 가장 자주 들여다본다. 이 세션에서 작업을 지시해두고, 마감이 임박한 작업을 또 다른 세션에서 지시한다. 두 세션이 모두 일을 하고 있으면 새 에이전트를 띄워서 다음에 만들 기능에 대해 아이디어 회의를 한다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;참고로 최근에 클로드에서 ‘Agent View’라는 기능을 만들었다. 여러 세션을 한눈에 보는 일종의 대시보드인데, 이 대시보드를 활용하면 좀 더 편리하게 세션을 관리할 수 있다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3787/image2.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &lt;a href="https://claude.com/blog/agent-view-in-claude-code"&gt;Agent view in Claude Code&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이렇게 멀티태스킹을 하면 같은 시간에 더 많은 일을 끝낼 수 있다. 한 작업을 끝장내려고 매달리는 시간이 줄어든다. 다른 세션의 작업도 진행되고 있기 때문에, 이제는 퇴근 시간에 미련 없이 손을 뗄 수 있게 되었다. 그리고 일 하나에 너무 완벽을 기하다가 다른 일의 시작이 늦어지는 경우도 줄어들었다. 여러 문제에 골고루 시간을 씀으로써 전체 품질은 더 올라가게 되었다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;③ 하나의 작업 단위가 끝날 때마다 작업 내용을 docs에 기록해두도록 시킨다&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;일을 멈추지 못하는 이유 중 하나는 다음 날이 되면 컨텍스트를 잊어버리기 때문이다. 물론 클로드는 대화 기록을 빠르게 다시 불러올 수 있지만, 인간의 기억은 좀 더 로딩 시간이 걸린다. 그래서 작업 중간중간 나를 위한 요약본을 정리하게 시켰다. 대강 일이 마무리되었다 싶을 때마다 클로드가 이렇게 묻는다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;“지금까지 한 작업을 기록해 둘까요?”&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이제 나는 언제든 마음 놓고 그날의 일을 끝낼 수 있게 됐다. 다시 돌아왔을 때 이 md 문서를 살펴보면, 금방 기억이 되살아나기 때문이다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3787/image5.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;④ 유한함을 인정하는 마음가짐&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;AI의 작업 속도는 사실상 무한해 보이지만, 그걸 판단하는 나의 체력과 시간은 유한하다. ‘가능한 최선’이 아니라, ‘오늘의 최선’을 기준으로 삼으려고 노력한다. 번아웃을 겪기 전의 나는 이걸 몰랐다. 정신과 신체의 체력이 모두 고갈된 후에야 비로소 내 에너지가 무한하지 않다는 것을 인정하게 되었다. AI는 도구이고, 도구의 성능이 아무리 좋아도 그것을 쥐고 있는 손이 떨리면 소용이 없다. 이 비대칭을 받아들이고 나니 마음이 한결 편해졌다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;멈추는 것은 우리의 선택이다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;AI는 분명 우리를 더 나은 결과물에 가까이 데려다준다. 그것은 좋은 일이다. 하지만 더 나아질 수 있는 가능성을 전부 실현하려는 순간, 영원히 완성하지 못하는 사람이 된다. 시지프스의 바위가 멈추지 않는 이유는 신의 벌이지만, 우리의 바위가 멈추지 않는 이유는 멈추지 않기로 한 우리의 선택이다. 그래서 나는 마감일을 정하고, 여러 세션을 번갈아 돌리고, 중간중간 기록을 남기고, 오늘의 최선에서 손을 뗀다. 완벽주의가 나를 잡아먹지 않도록 노력한다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 이 네 가지 방법을 쓴다고 해서 바로 마인드셋이 달라지는 것은 아니다. 나는 여전히 마감 직전에 “하나만 더” 시키고 싶은 마음이 들고, 제출 버튼을 누르는 순간에도 마음 한구석이 불편하다. 하지만 분명히 달라진 것은 어쨌든 그 불편함을 느끼면서도 버튼을 누를 수 있게 되었다는 것이다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 글도 완벽하지 않지만 오늘 나의 최선이다. 내일의 나는 더 잘 쓸 수 있겠지만, 그건 내일의 일이다. 번아웃을 겪지 않는 인공지능에게 미래에 대체될 수도 있겠지만, 그것도 미래의 일이다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 글을 쓰면서 다른 사람들은 어떤지도 궁금해졌다. AI와 함께 일하면서 비슷한 강박을 느끼는 사람도 있을 것이고, 나보다 훨씬 가벼운 마음으로 멈추는 사람도 있을 것이다. 만약 여러분만의 방법이 있다면, 댓글로 공유해 주셔도 좋겠다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3787/image4.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가, ChatGPT로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>지금 진짜 쓸 만한 AI 에이전트 10가지 총정리(1) : 웹·코딩 에이전트</title><link>https://yozm.wishket.com/magazine/detail/3786</link><description>Claude Code를 받아놓고도 뭘 하는 물건인지 감이 안 오고, OpenClaw는 또 뭐가 다른지 모르겠다면, 그 혼란은 당연합니다. 지금 시장에선 AI와 자동화가 조금만 얹혀도 죄다 에이전트라고 부르거든요. 그래서 진짜 에이전트라 부를 만한 서비스를 무엇을 알고(컨텍스트) 무엇으로 일하고(도구) 어디까지 맡겨도 되고(권한) 언제 켜지는지(트리거)로 갈라봤습니다. 1편은 가볍게 맡기는 웹 에이전트 Manus·Genspark와, 컴퓨터를 통째로 맡기되 매번 허락을 구하는 코딩 에이전트 Claude Code·Codex·Antigravity·Cowork까지 다룹니다.</description><guid>https://yozm.wishket.com/magazine/detail/3786</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;지금 진짜 쓸 만한 AI 에이전트 10가지 총정리 시리즈&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;1편: 웹·코딩 에이전트 6가지 (현재 글)&lt;/strong&gt;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;a href="https://yozm.wishket.com/magazine/detail/3800/"&gt;&lt;strong&gt;2편: 자율 에이전트 4가지&lt;/strong&gt;&lt;/a&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;요즘은 에이전트 도구 정도는 다뤄야 일잘러 소리를 듣는다고 합니다. 그래서 일단 Claude Code부터 받아봅니다. 그런데 어떻게 쓰는지 도무지 모르겠습니다. 유튜브도 보고 아티클도 찾아봤지만 난도가 좀 있다는 말에 슬그머니 마음을 접습니다. 대신 주말에 '알아서 움직이는 비서'라고 소문난 OpenClaw를 개인 노트북에 깔아봅니다. 오픈카톡방에서 다들 핫하다고 하니까요. 그런데 정작 이게 뭘 하는 물건인지, 둘이 뭐가 다른지조차 감이 안 옵니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 풍경, 익숙하지 않으신가요? 사실 저부터가 그랬습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;현재 프로덕트 시장에서 '에이전트'는 만능 단어입니다. AI와 자동화가 조금만 얹혀도 죄다 '우리 서비스는 에이전트'라고 하니까요. 그러니 헷갈리는 게 당연합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 지금 주목받는, '진짜 에이전트'라고 부를 만한 서비스 10개를 모아 2편에 걸쳐 소개하려 합니다. 이번 1편에서 다루는 건 여섯 개입니다. 가볍게 한 번 맡겨보는 웹 에이전트로 마누스&lt;span style="color:#999999;"&gt;(Manus)&lt;/span&gt;와 젠스파크&lt;span style="color:#999999;"&gt;(Genspark)&lt;/span&gt;, 컴퓨터를 통째로 맡기는 코딩 에이전트로 클로드 코드&lt;span style="color:#999999;"&gt;(Claude Code)&lt;/span&gt;, 코덱스&lt;span style="color:#999999;"&gt;(Codex)&lt;/span&gt;, 안티그래비티&lt;span style="color:#999999;"&gt;(Antigravity)&lt;/span&gt;, 클로드 코워크&lt;span style="color:#999999;"&gt;(Claude Cowork)&lt;/span&gt;입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 이들을 똑같이 '에이전트' 한 단어로 묶으면 혼란은 그대로입니다. 무엇을 알고 시작하는지&lt;span style="color:#999999;"&gt;(컨텍스트)&lt;/span&gt;, 무엇으로 일하는지&lt;span style="color:#999999;"&gt;(도구)&lt;/span&gt;, 어디까지 손대도 되는지&lt;span style="color:#999999;"&gt;(권한)&lt;/span&gt;, 언제 켜지는지&lt;span style="color:#999999;"&gt;(트리거)&lt;/span&gt; 서비스마다 제각각이거든요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 글은 그 혼란을 정리해보려 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:80%;"&gt;&lt;img src="https://www.wishket.com/media/news/3786/image5.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가, Gemini로 제작&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;에이전트가 대체 뭔데요&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;우선, “에이전트”가 무엇인지 짚어보고 넘어가겠습니다. 마치 AGI처럼, 다들 자기 기억에 남은 대로 제각각 정의해 버린 게 이 모든 혼란의 시작이니까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;자세히 들어가면 물론 복잡한 정의가 필요하지만, 이 글을 이해하는 데 필요한 정의는 이렇습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;“LLM이 도구를 루프&lt;/i&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;(loop)&lt;/i&gt;&lt;/span&gt;&lt;i&gt;로 돌려 목표를 달성한다.”&lt;/i&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;목표 하나만 던져주면, AI가 손에 쥔 도구를 골라 써가며 끝날 때까지 알아서 굴리는 겁니다. 한 번 답하고 끝나는 것도 아니고, 다음에 뭘 할지 스스로 정하면서 계속 돌죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;비서한테 “이번 분기 매출 정리해서 보고서로 만들어줘” 하면, 엑셀 열고, 데이터 정리하고, 차트 그리고, 문서로 저장할 거라고 기대할 수 있잖아요. 누가 일일이 안 알려줘도 도구를 골라가며 적당한 보고서가 나올 때까지 할 겁니다. 그 비서가 사람이 아니라 AI면, 그게 에이전트예요. 챗봇하고는 일하는 방식이 다릅니다. 챗봇은 답을 말해주고, 에이전트는 답을 만들어내요. 이를 위해 파일을 직접 열고, 코드를 직접 쓰고, 메일을 직접 보냅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;정의는 한 줄이지만, 그 한 줄을 실제로 어떻게 구현하느냐는 만드는 곳마다 다릅니다. 그래서 서비스마다 생김새가 제각각이고요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;에이전트를 가르는 4가지: 컨텍스트·도구·권한·트리거&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;그 많은 방식을 하나하나 좇다 보면 금세 헷갈립니다. 그래서 여기서는 에이전트가 일을 시작하는 구조 하나로 기준을 좁혀보려 합니다. 명령을 받으면 에이전트가 가장 먼저 하는 일은, 계획을 세우는 겁니다. 무엇을 해야 하는지 파악하고, 어떤 순서로 도구를 쓸지 정하는 거죠. 그런데 이 계획을 세우려면 그 전에 네 가지가 먼저 정해져 있어야 합니다. &lt;strong&gt;무엇을 알고&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(컨텍스트)&lt;/span&gt;, &lt;strong&gt;무엇으로 하고&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(도구)&lt;/span&gt;, &lt;strong&gt;어디까지 해도 되고&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(권한)&lt;/span&gt;, &lt;strong&gt;언제 시작하느냐&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(트리거)&lt;/span&gt;.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 네 가지를 어떻게 받느냐에 따라 서비스가 갈립니다. 그리고 그중에서도 에이전트의 종류를 결정적으로 가르는 축은 &lt;strong&gt;권한&lt;/strong&gt;입니다. 웹이냐 터미널&lt;span style="color:#999999;"&gt;(개발자들이 쓰는 검은 명령어 창)&lt;/span&gt;이냐 같은 겉모습으로 나누는 게 분류는 더 쉽겠지만, 본질은 여기 있죠. 이 기준으로 보면 서비스가 크게 셋으로 묶입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;에이전트 서비스 구분표&lt;/strong&gt;&lt;/h4&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3786/image7.png"&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;핵심은 권한, 곧 '어디까지 알아서 하게 둘 것인가'입니다. 한 칸씩 올라갈수록 에이전트한테 더 많은 걸 맡기게 되죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;웹 에이전트&lt;/strong&gt;는 서비스가 미리 정해둔 도구 안에서, 내가 던진 일 하나를 처리합니다. 내가 손볼 것도, 따로 허락할 것도 거의 없어 가장 가볍죠. 대신 복잡하고 어려운 일에서는 한계가 분명합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;코딩 에이전트&lt;/strong&gt;&lt;span style="color:#999999;"&gt;(컴퓨터 유즈)&lt;/span&gt;와 &lt;strong&gt;자율 에이전트&lt;/strong&gt;는 자유도 측면에서 한 단계 위입니다. 둘 다 무엇을 알려주고&lt;span style="color:#999999;"&gt;(컨텍스트)&lt;/span&gt; 무엇을 쓰게 할지&lt;span style="color:#999999;"&gt;(도구)&lt;/span&gt;를 내가 직접 붙여, 내 일에 맞춥니다. 손은 더 가지만 그만큼 할 수 있는 일이 넓어지죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 둘을 가르는 게 바로 권한입니다. 코딩 에이전트는 파일 하나를 고치기 전에도 "이거 해도 될까요?" 하고 매번 물어봅니다. 반면 자율 에이전트는 한 번 "여기까지는 알아서 해"라고 정해두면, 그 안에서는 묻지 않고 24시간 혼자 굴러갑니다. 내가 자는 동안에도요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;‘코딩 에이전트’라는 이름의 함정&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;여기서 가장 널리 알려진 것은 Claude Code, Codex와 같은 “코딩 에이전트”입니다. 그런데 그 ‘코딩 에이전트’라는 이름 때문에, 그걸 쓸 수 있는 사람들도 ‘난 코드는 모르는데’ 하며 진입장벽을 느끼게 되기도 합니다. 하지만 이 에이전트들은 처음엔 코드만 만졌지만, 지금은 파일·앱·데스크톱·문서까지 컴퓨터에서 하는 거의 모든 일을 다룹니다. 이걸 컴퓨터 유즈&lt;span style="color:#999999;"&gt;(computer use)&lt;/span&gt;라고 불러요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러니 이 글에서 코딩 에이전트=컴퓨터 유즈 에이전트라고 생각해도 좋습니다. “코딩 에이전트는 개발자만 쓰는 거 아냐?” 하고 지레 겁먹을 필요 없다는 뜻입니다. &lt;span style="color:#757575;"&gt;(물론 이들이 제일 잘 하는 일은 여전히 프로그래밍 작업입니다. 하지만 우리가 쓰는 모든 업무용 프로그램도 사실 코드로 돌아간다는 걸 잊지 마세요.)&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;웹 에이전트: 가볍게 한 번 맡겨보기&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;웹 에이전트는 사람이 준 프롬프트를 받아 서비스가 정해둔 도구를 써 문제를 해결합니다. 코드베이스&lt;span style="color:#999999;"&gt;(프로젝트의 코드 전체)&lt;/span&gt;를 붙이거나 도구를 손볼 일이 없죠. 그래서 자료 조사나 PPT 같은 작업을 하나 맡겨보면, 에이전트가 어떻게 도는지 가장 가볍게 익힐 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/manus/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;Manus&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 에이전트 작업 미리보기&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Manus는 ‘자율 작업 에이전트’라는 컨셉으로 어쩌면 가장 먼저 화제를 모은 프로덕트입니다. 2025년 3월 6일 초대 전용 베타로 론칭했으니까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3786/image11.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/manus/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Manus&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="background-color:transparent;color:#000000;"&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;중국에서 출발해 지금은 싱가포르에 본사를 둔 스타트업 버터플라이 이펙트&lt;span style="color:#999999;"&gt;(Butterfly Effect)&lt;/span&gt;가 만든 웹 기반 에이전트예요. 설치 없이 브라우저에서 돌고, 무료 토큰으로 부담 없이 시작할 수 있습니다. &lt;span style="color:#757575;"&gt;(다만 2025년 말 메타가 인수를 추진했다가 2026년 4월 중국 당국이 제동을 걸면서, 회사의 향방은 아직 불투명합니다.)&amp;nbsp;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;웹에서 작업을 맡기면 가상 환경 안에서 브라우저·터미널·파일을 자율로 굴립니다. 단계마다 붙어 있을 필요 없이 끝날 때까지 맡겨두고 결과만 받는 식이라, 긴 호흡으로 웹을 훑는 리서치에 잘 맞습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;AI가 스스로 계획을 세우는 구조, 도구를 선택하고 활용하는 과정, 결과물이 발전하는 순간들을 우측 모니터로 함께 보여주는 것도 특징입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;성능은?&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;리서치 계열이나 보고서를 만드는 일이라면, 무료 토큰으로도 충분히 써볼 만합니다. 다만, 이를 내 상황에 완전히 맞춘다거나 세밀한 수정에 들어가려 하면 여러 제약이 느껴집니다. 토큰도 빠르게 소모되기 시작하고요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;프롬프트 한 줄만 입력해도, 작업 설계와 결과물 생성 과정을 한눈에 볼 수 있습니다. “아, 에이전트는 이렇게 움직이는구나” 하는 걸 이해하기에 정말 좋습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/genspark/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;Genspark&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 가벼운 세팅에 괜찮은 퀄리티&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Genspark는 프롬프트 하나로 긴 단위 작업을 가장 빨리 맡겨볼 수 있는 제품입니다. 특히 PPT를 비롯한 콘텐츠 작업에서 강점을 보이던 Super Agent에 이어 2026년 3월 자율 에이전트인 Claw를 도입하며 ‘AI 직원’ 쪽으로 방향을 틀었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3786/image10.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/genspark/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Genspark&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="background-color:transparent;color:#000000;"&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;바이두 출신 에릭 징·케이 주가 2023년 창업한 MainFunc가 만든 웹 에이전트예요. 가입하면 무료 토큰으로 바로 써볼 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;작업을 입력하면 LLM 9개, 통합 도구 80개를 알아서 고릅니다. 이어 웹을 자율로 브라우징하며 결과를 한곳에 모아줘요. 그래서 이런 일에 잘 맞습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;자료 조사·다중 사이트 비교&lt;/li&gt;&lt;li style="text-align:justify;"&gt;가격·기능을 여러 사이트에서 긁어와 요약&lt;/li&gt;&lt;li style="text-align:justify;"&gt;신규 조사를 접목한 PPT 제작&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;성능은?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;PPT 쪽에서는 전용 도구만큼이나 뛰어난 성능을 보여줬습니다. 요즘은 이력서나 보고서 쪽으로도 스텝을 많이 확장하고요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;시각적으로 꽤 괜찮은 결과물을 얻고자 하면 써보기 좋습니다. 무엇보다 무거운 세팅이 없으니 쉽게 시작할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;코딩 에이전트: 지켜보며 컴퓨터를 통째로 맡기기&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;웹 에이전트와 달리, 코딩 에이전트부터는 컨텍스트·도구를 다 내가 직접 정합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;컨텍스트는 에이전트가 일을 처리하기 위해 알아야 할 맥락입니다. 프롬프트를 비롯해 기존 코드, 혹은 문서에 담긴 텍스트 등이죠.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;도구는 에이전트가 쓸 수 있는 ‘무언가’입니다. 코드를 읽거나 쓸 수 있고, 파일을 만들고 지우기도 하며, 웹에 접근해 필요한 것들을 찾거나 받아오기도 합니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;무엇보다 매력적인 것은 이러한 컨텍스트와 도구를 완전히 내 일에 맞춘 구조로 직접 세팅할 수 있다는 점입니다. 다만 그 권한, 그러니까 '어디까지 알아서 하게 둘 것인가'는 여전히 사람이 쥡니다. 그렇게 되면 좋을 것 같지만, 때로는 귀찮기도 하죠. 물론 자동 모드&lt;span style="color:#999999;"&gt;(Auto mode)&lt;/span&gt; 등을 적용하거나 미리 권한을 적극 넘겨, 자율성을 꽤 높일 수도 있습니다. 그래도 결국 “내가 호출할 때” 움직인다는 점, 즉 사람의 시작이 ‘트리거’라는 점에서, 묻지 않고 24시간 도는 자율 에이전트와는 분명히 거리가 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/claude-code/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;Claude Code&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 기준점이 된 도구&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;터미널·IDE·슬랙 어디서든 코드 기반으로 Claude를 불러와 움직일 수 있는 도구입니다. 매일 쓸 수 있는 수준까지 올라온 첫 에이전트입니다. 가장 먼저 나와 오래 다듬어진 도구라 안정적이고, 참고할 자료와 생태계도 방대합니다. 그래서 처음이라면 기준점으로 삼기 좋죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3786/image13.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/claude-code/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Claude Code&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="background-color:transparent;color:#000000;"&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앤트로픽이 2025년부터 운영해요. 모델은 Sonnet 4.6과 Opus 4.8&lt;span style="color:#999999;"&gt;(2026년 5월 28일 출시)&lt;/span&gt;, 터미널·IDE·데스크톱 앱·모바일 모두 지원하고, Pro·Max 플랜을 구독한다면 누구나 쓸 수 있습니다. 한도는 차이가 있지만요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;채팅으로 일을 시키면 코드베이스를 읽거나 파일을 수정·생성하고, 테스트까지 돌린 다음 보고합니다. Claude 모델을 두뇌로 삼아, 내 컴퓨터에 있는 자료에 ‘권한’을 받았다면 접근할 수 있습니다. 그리고 내장된 도구와 사용자가 직접 만드는 도구들로 일합니다. 다만, 명시적 승인 없이는 파일을 수정하지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;이런 일에 강해요&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;큰 코드베이스 기반 작업과 리팩터링&lt;span style="color:#757575;"&gt;(1M 컨텍스트)&lt;/span&gt;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;바닥부터 바이브 코딩 시작하기&lt;/li&gt;&lt;li style="text-align:justify;"&gt;터미널, 데스크톱, 모바일 등 멀티채널로 작업 이어가기&lt;/li&gt;&lt;li style="text-align:justify;"&gt;파일·문서 자동화를 비롯한 컴퓨터에 일 시키기&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;코드를 만질 수 있는 사람이라면 일단 켜보세요. 사실 그렇지 않은 사람들에게도 저는 추천하고 싶습니다. 원하는 것을 잘 말하고, 모르는 것을 제대로 물어볼 수만 있다면, 아주 못 할 일이 없다고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;4.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/codex/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;Codex&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 최고 성능 도구로 어깨를 나란히&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;OpenAI가 만든 코딩 에이전트입니다. 가벼운 데다, 오픈소스라 부담이 덜 합니다. 무엇보다 지금 최고 수준으로 평가받는 GPT-5.5를 쓸 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3786/image6.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/codex/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Codex&lt;/u&gt;&lt;/a&gt;&amp;nbsp;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="background-color:transparent;color:#000000;"&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;오픈소스 CLI고, ChatGPT 플랜&lt;span style="color:#999999;"&gt;(Plus·Pro·Business·Edu·Enterprise)&lt;/span&gt;을 쓰면 정해진 한도 내에서 자유롭게 쓸 수 있습니다. 업데이트 주기가 정말 빠르기도 하고요. 앱 형태로 받아 쓸 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;명령을 주면 코드 작업을 해줍니다. 사실 Claude Code와 거의 유사합니다. 다만, 그 두뇌가 GPT 계열 모델이라는 것이 가장 큰 차이겠죠. 마찬가지로 컴퓨터를 활용한 작업이라면 그 무엇이든 충분히 해줍니다. 조금 더 목적 지향적으로 ‘권한’에 대한 질문을 덜한다는 것이 특징입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;이럴 때 좋아요&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;일상 작업을 토큰 알뜰하게 돌리고 싶을 때&lt;/li&gt;&lt;li style="text-align:justify;"&gt;이미 ChatGPT 구독 중이라 추가 결제 없이 켜보고 싶을 때&lt;/li&gt;&lt;li style="text-align:justify;"&gt;회사 정책이 빡빡해 코드를 직접 검토·사내 운영해야 할 때&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;조금 더 알아서 돌아가는 에이전트를 찾거나, ChatGPT 환경에 익숙하다면 추천합니다. 코딩 작업에서 Claude Code와 어깨를 나란히 하고, 영역에 따라서는 더 낫다는 평가도 나옵니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;5.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/google-antigravity/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;Antigravity&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 구글 생태계를 그대로&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;구글은 코딩 에이전트를 비교적 산발적으로 출시했습니다. 코드 편집 프로그램인 IDE에 얹은 Antigravity 1.0으로도 나오고, 검은 명령어 창에서 쓰는 CLI 형태인 Gemini CLI로도 나왔죠. 최근 행사에서 이를 모두 묶어 '에이전트 우선' 개발 플랫폼으로 통합했습니다. 전용 데스크톱 앱에서 한층 에이전트답게 움직이고요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3786/image3.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/google-antigravity/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Antigravity&lt;/u&gt;&lt;/a&gt;&amp;nbsp;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="background-color:transparent;color:#000000;"&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;일종의 통합판인 Antigravity 2.0은 2026년 5월 Google I/O에서 공개됐고, 가장 최근 나온 핵심 모델은 Gemini 3.5 Flash입니다. 전용 데스크톱 앱과 CLI에서 에이전트 채팅으로 일을 시키는데, 코드 편집기 대신 위임형 채팅 인터페이스&lt;span style="color:#999999;"&gt;(채팅으로 일을 맡기는 구조)&lt;/span&gt;를 중심으로 둔 구조입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;기본 골격은 앞서 본 코딩 에이전트들과 같습니다. 채팅으로 일을 맡기면 코드를 읽고, 파일을 고치고, 결과를 보고하죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;이럴 때 좋아요&lt;/strong&gt;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;구글 워크스페이스를 구독하며 그 도구들을 무척 잘 쓰고 있을 때&lt;/li&gt;&lt;li style="text-align:justify;"&gt;약간 아쉬워도, 빠르게 움직이는 에이전트를 경험하고 싶을 때&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Google 생태계 안에서 일하면 켜볼 만해요. 또 Gemini 3.5는 현재 가벼운 Flash 모델만 정식 출시됐고, 상위 모델인 Pro는 2026년 6월 출시 예정입니다. Pro가 합류하면 성능이 어떻게 달라질지 지켜봐야 합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;6.&lt;/strong&gt; &lt;a href="https://yozm.wishket.com/magazine/product-valley/products/claude-cowork/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;strong&gt;&lt;u&gt;Claude Cowork&lt;/u&gt;&lt;/strong&gt;&lt;/a&gt;&lt;strong&gt;: 비개발자를 위한 변형&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;코딩 에이전트와 같은 카테고리인데, 비개발자에게 친화적인 GUI로 움직이는 에이전트입니다. 앤트로픽이 ‘Claude Code의 지식 노동자 버전’이라며 만든 서비스죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3786/image8.png"&gt;&lt;figcaption&gt;&lt;a href="https://yozm.wishket.com/magazine/product-valley/products/claude-cowork/?utm_source=yozmit&amp;amp;utm_medium=content&amp;amp;utm_campaign=base"&gt;&lt;u&gt;Claude Cowork&lt;/u&gt;&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="background-color:transparent;color:#000000;"&gt;&lt;strong&gt;누가·언제·뭘로&lt;/strong&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;2026년 1월 12일 연구 프리뷰로 공개&lt;span style="color:#999999;"&gt;(Max 먼저, 1월 16일 Pro 확장)&lt;/span&gt;했고, 이제 Claude Pro·Max 플랜이라면 써볼 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;어떻게 동작할까?&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;데스크톱 앱에서 폴더와 Connector&lt;span style="color:#999999;"&gt;(Google Drive·Gmail·DocuSign·FactSet 등)&lt;/span&gt;를 지정하면 Claude가 파일·앱을 직접 읽고 편집해요. 여러 작업을 병행해서 밀고 가되, 실행 전에 계획을 보여주고 승인을 기다리는 ‘Ask before acting’ 방식입니다. 파일 정리·보고서 제작·메일 처리에 잘 맞습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;한 줄 추천&lt;/strong&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;코드는 안 만지지만 코딩 에이전트의 힘을 느껴 보고 싶을 때 추천합니다. 웬만한 커스터마이징이 충분히 가능한 데다가 코드를 안 다루면 큰 차이도 없다고 보입니다. 다만, 토큰은 조금 더 많이 먹는 느낌입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;코딩 에이전트는 왜 지금&amp;nbsp;이렇게 인기일까?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;2026년 들어 코딩 에이전트가 '시장에 제대로 자리 잡았다'고 보는 시각이 늘었습니다. 토큰을 어마어마하게 태우는 비싼 도구인데도, 전문가들이 매일 쓰는 도구 수준으로 올라왔다는 거죠. 웹·자율 에이전트가 아직 “신기하다”와 “매일 쓴다”의 중간이라면, 코딩 에이전트는 그 선을 이미 넘었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이들의 이름은 ‘코딩’이지만 이제 코드만 만지지 않아요. 파일 정리·문서 자동화·앱 실행까지, 컴퓨터에서 하는 거의 모든 일로 넓어졌거든요. 대신 파일 하나 건드릴 때마다 사람한테 묻고, 시작 버튼도 사람이 누릅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며 : 그래서 무엇부터 시작할까&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;여기까지가 1편입니다. 두 종류를 봤죠. 웹 에이전트는 프롬프트 한 줄만 던지면 되니, 에이전트가 대체 어떻게 일하는지 가장 가볍게 구경하기 좋습니다. 리서치나 PPT처럼 평소 시간 잡아먹던 작업을 통째로 한번 맡겨보세요. Manus와 Genspark면 충분합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;코딩 에이전트는 한 걸음 더 들어가, 무엇을 알려주고&lt;span style="color:#999999;"&gt;(컨텍스트)&lt;/span&gt; 무엇을 쓰게 할지&lt;span style="color:#999999;"&gt;(도구)&lt;/span&gt;를 내가 직접 정합니다. 대신 파일 하나 건드릴 때마다 허락을 구하니 통제권은 그대로 쥐고 가죠. 코드를 만진다면 Claude Code·Codex·Antigravity 중 내 생태계에 맞는 걸로, 코드를 안 만진다면 같은 힘을 GUI로 쓰는 Cowork로 시작하면 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;핵심은 외워서 아는 게 아니라 한 번 직접 돌려보는 겁니다. 글로 읽은 것과 손으로 굴려보며 깨닫는 건 전혀 다르거든요. "이런 것도 되나?" 싶은 일부터 일단 시켜보세요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리고 마지막 한 칸이 남았습니다. 지금까지의 에이전트는 무언가 할 때마다 사람에게 물었지만, 한 번 "여기까지는 알아서 해"라고 허락하면 그다음부터는 묻지 않는 에이전트 서비스가 있습니다. 내가 자는 동안에도 24시간 혼자 일하죠. 가장 강력한데 그래서 가장 위험하기도 한 자율 에이전트, 즉 OpenClaw·Hermes 같은 프로덕트 소개는 2편에서 이어집니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>누구나 만드는 시대, 정말 중요한 건 무엇일까 (Figma CPO)</title><link>https://yozm.wishket.com/magazine/detail/3785</link><description>AI한테 큰 작업을 시키면 늘 중간에 흐지부지되셨다면. 여러 보조 AI를 동시에 굴려 일을 끝내는 Claude Code 다이나믹 워크플로, 프롬프트만으로 웹앱을 만들어 URL로 공유하는 오픈AI Codex Sites, 그리고 누구나 빠르게 만들 수 있는 시대에 진짜 차이를 만드는 게 무엇인지 짚은 Figma CPO의 글까지. 이번 주 프로덕트 메이커가 주목할 세 가지를 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3785</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;안녕하세요, 요즘 프로덕트 메이커입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;프로덕트 소식은 넘쳐나지만 대부분 이런 게 나왔대에서 끝납니다. 그래서 뭘 어떻게 하라고? 내 작업에 어떻게 써먹지? 거기까진 연결이 잘 안 되죠. 따라서 요즘 프로덕트 메이커는 바로 쓸 수 있는 것, 그 중에서도 주목해볼 만한 것을 엄선해서 매주 금요일에 전달드리려 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;요즘 프로덕트 메이커는 매주 세 가지를 골라 전합니다:&lt;/p&gt;&lt;ol&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;써볼 것&lt;/strong&gt;: 다이나믹 워크플로 - 작업에 맞는 작업 틀을 그때그때 직접 짜는 Claude Code 기능&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;참고할 것&lt;/strong&gt;: 오픈AI Codex Sites - 프롬프트만으로 웹앱을 만들어 URL로 공유하는 기능&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;적용해볼 것&lt;/strong&gt;: 누구나 만들 수 있게 됐을 때 진짜 차이를 만드는 것 - Figma CPO의 관점&lt;/li&gt;&lt;/ol&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3785/11.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Claude&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;1. 써볼 것:&lt;/strong&gt; &lt;a href="https://claude.com/blog/introducing-dynamic-workflows-in-claude-code"&gt;&lt;strong&gt;작업에 맞는 작업 틀을 그때그때 직접 짜는 Claude Code 기능&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;다이나믹 워크플로(dynamic workflows)는 Claude Code가 맡은 작업에 맞춰 처리 방식을 직접 설계하고, 여러 개의 보조 AI를 동시에 굴려 일을 처리하는 기능입니다. 5월 28일 리서치 프리뷰로 공개됐고요. 이후 Claude Code를 개발하는 Anthropic(앤트로픽)의 Thariq Shihipar가 &lt;a href="https://x.com/trq212/article/2061907337154367865"&gt;직접 써본 경험과 활용법을 정리해 공유&lt;/a&gt;했습니다. 이는 조회수 230만, 좋아요 8천을 넘기며 개발자들 사이에서 화제가 됐습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3785/111.png"&gt;&lt;figcaption&gt;&amp;nbsp;&amp;lt;출처: Thariq Shihipar X(@trq212)&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;원래 이런 일은, 그러니까 여러 AI를 나눠서 부리고 서로 검증시키는 작업은 개발자들이 직접 코드를 짜서 흉내 내고 있었습니다. 여러 Claude를 스크립트로 엮어 돌리는 식이었죠. 그렇게 손수 만들던 걸 이제 Claude Code가 알아서 짜준다는 점에서 반응이 좋았습니다. (&lt;a href="https://www.infoq.com/news/2026/06/dynamic-workflows-claude-code/"&gt;InfoQ&lt;/a&gt; 등이 정리한 내용입니다)&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;왜 이런 기능이 필요할까요. AI에게 큰 작업을 한 번에 통째로 시키면, 계획을 세우는 일과 실제로 처리하는 일을 같은 대화 안에서 다 하게 됩니다. 짧은 작업은 이걸로 충분한데, 작업이 길고 복잡해지면 AI가 몇 가지 함정에 빠지거든요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;무슨 문제를 해결해 주나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;앤트로픽이 짚은 함정은 세 가지입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;첫째&lt;/strong&gt;는 중간에 멈추는 겁니다. 50개를 점검해야 하는 보안 검토에서 20개만 보고 다 했다고 선언해 버리는 식이에요. 작업이 복잡할수록 이런 일이 잦아집니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;둘째&lt;/strong&gt;는 자기 결과를 후하게 보는 겁니다. AI에게 자기가 낸 결과를 기준에 맞춰 검증하라고 하면, 자기 답을 더 좋게 평가하는 쪽으로 기웁니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;셋째&lt;/strong&gt;는 목표가 흐려지는 겁니다. 대화가 길어지고 중간 요약을 거치면서, 처음에 못 박았던 이건 하지 마 같은 조건이 조금씩 사라집니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다이나믹 워크플로는 이걸 구조로 막습니다. 하나의 AI에게 다 시키는 대신, 각자 자기 맥락과 좁은 목표만 가진 여러 AI로 일을 쪼개서 돌립니다. 서로 결과를 검증하게 만들 수도 있고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떻게 쓰나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;쓰는 법은 어렵지 않습니다. 프롬프트에 작업을 설명하면서 워크플로로 처리해 달라고 하거나, /effort 메뉴에서 ultracode를 켜면 됩니다. ultracode를 켜면 AI가 작업마다 알아서 워크플로를 짤지 판단합니다. 처음 실행될 때는 무엇이 돌아갈지 먼저 보여주고 확인을 받으니, 모르고 큰 작업이 돌아갈 걱정은 없습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Thariq가 든 예시를 보면 쓰임새가 그려집니다.&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;내 사업계획서를 투자자, 고객, 경쟁사 입장에서 각각 물어뜯게 해줘. → 서로 다른 관점의 AI들이 동시에 약점을 파고듭니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;이력서 80장을 백엔드 포지션 기준으로 순위 매기고, 상위 10명은 한 번 더 확인해줘.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;지난 50개 세션을 훑어서, 내가 반복해서 고치는 지적들을 찾아 규칙으로 정리해줘.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;블로그 초안의 기술적 주장을 코드베이스랑 하나하나 대조해서 틀린 게 없는지 확인해줘.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;코드 작업에만 해당하는 얘기가 아닙니다. Thariq 본인도 오히려 비개발 업무에서 더 유용할 때가 많다고 했고요. 매출이 3월에 왜 떨어졌는지 원인을 여러 갈래로 나눠 파보는 것처럼요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;내부적으로는 여러 패턴을 조합해 작업 틀을 짭니다. 작업을 잘게 나눠 각각 처리한 뒤 합치거나, 같은 작업을 여러 방식으로 시도한 다음 둘씩 비교해 가장 나은 걸 고르거나, 멈춤 조건이 충족될 때까지 반복하는 식입니다. 한 번 실행에 보조 AI를 최대 1,000개까지, 동시에는 16개까지 띄울 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만 &lt;strong&gt;토큰을 훨씬 많이 씁니다.&lt;/strong&gt; 앤트로픽도 작은 작업부터 시작하라고 권하고요. 일반적인 코딩 작업 대부분은 굳이 이렇게까지 할 필요가 없습니다. 검토자 다섯 명을 붙일 만한 작업인지 한 번 따져보고 쓰는 게 좋습니다. /goal로 완료 조건을 박아두거나 /loop로 주기적으로 돌리는 것과 묶어 쓰면 더 잘 맞습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;누구에게 좋을까요?&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;한 번에 끝내기엔 너무 크고 여러 갈래로 검증이 필요한 작업을 자주 다루는 분 (대규모 리팩터링, 보안 점검, 대량 분류 등)&lt;/li&gt;&lt;li style="text-align:justify;"&gt;AI에게 큰 작업을 시키면 늘 중간에 흐지부지된다고 느꼈던 분&lt;/li&gt;&lt;li style="text-align:justify;"&gt;코드뿐 아니라 사업, 분석, 기획 쪽에서 여러 관점으로 검증하고 싶은 분&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;유료 Claude Code 플랜(Pro, Max, Team, Enterprise)에서 쓸 수 있습니다. Max와 Team은 기본으로 켜져 있고, Pro는 /config에서 직접 켜야 하며, Enterprise는 관리자 승인이 필요합니다. Claude Code 버전이 2.1.154 이상이어야 하니, 안 보이면 업데이트를 해보시길 권장합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;공식 안내: &lt;a href="https://claude.com/blog/introducing-dynamic-workflows-in-claude-code"&gt;claude.com/blog/introducing-dynamic-workflows-in-claude-code&lt;/a&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Thariq Shihipar가 공유한 활용법: &lt;a href="https://x.com/trq212/article/2061907337154367865"&gt;A harness for every task: dynamic workflows in Claude Code&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3785/222.png"&gt;&lt;figcaption&gt;&amp;lt;출처: openai.com&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;2. 참고할 것:&lt;/strong&gt; &lt;a href="https://openai.com/ko-KR/index/codex-for-every-role-tool-workflow/"&gt;&lt;strong&gt;프롬프트만으로 웹앱을 만들어 URL로 공유하는 기능&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;사내에서 간단한 대시보드 하나, 신청 받는 페이지 하나 만들려고 해도 보통은 일이 커집니다. 기획을 정리하고, 개발자에게 요청하고, 서버에 올리고, 주소를 받기까지 며칠이 걸리죠. 비개발자라면 시작할 엄두조차 안 나고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;OpenAI(오픈AI)가 이 과정을 통째로 줄이겠다고 나섰습니다. 6월 2일 'Intelligence at Work' 행사에서 코딩 도구 Codex의 대규모 업데이트를 공개했습니다. 그중 가장 주목받은 건 Sites라는 기능입니다. 프롬프트로 설명만 하면 인터랙티브 웹사이트나 웹앱을 만들어줍니다. 오픈AI가 호스팅까지 맡아서, URL 하나로 바로 공유할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;오픈AI가 이렇게 움직인 데는 이유가 있습니다. Codex 주간 사용자는 500만 명을 넘었고, 이 중 분석가, 마케터, 운영, 디자이너, 투자자 같은 비개발자가 약 20%를 차지합니다. 게다가 이 비개발자 사용자가 개발자보다 3배 빠르게 늘고 있고요. 코딩 도구를 업무 전반으로 넓히려는 흐름이 이번 발표의 배경입니다. (Sites 외에도 직군별 플러그인 6종, 결과물의 특정 부분만 골라 수정하는 주석 기능이 함께 나왔습니다)&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;기존 방식과 무엇이 다른가요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;지금까지 노코드 도구로 웹페이지를 만들 수는 있었습니다. 하지만 보통은 그 도구 안에서만 동작하거나, 만든 다음 어딘가에 따로 올려야 했죠. Sites는 만드는 것부터 호스팅, 공유까지를 한 흐름으로 묶었습니다. 별도의 배포 설정 없이 대화 안에서 만들고 바로 주소를 받는 구조입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:80%;"&gt;&lt;img src="https://www.wishket.com/media/news/3785/22.png"&gt;&lt;figcaption&gt;&amp;lt;출처: openai.com&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;만들 수 있는 것도 정적인 페이지에 그치지 않습니다. 대시보드, 플래너, 검토용 작업 공간, 프로젝트 보드, 갤러리, 가벼운 사내 도구, 게임까지 가능합니다. 한 번 만들고 끝이 아니라, 내용이 바뀔 때마다 Codex에게 최신 상태로 유지해 달라고 할 수도 있고요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떻게 작동하나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;쓰는 흐름은 간단합니다. Codex 대화창에서 @Sites를 부르고 만들고 싶은 걸 설명하면 됩니다. 오픈AI가 든 예를 보면 쉽게 이해됩니다. 곧 있을 고객 미팅용 페이지를 만들어 달라고 하면, 그 고객과 관련된 제품 업데이트, 미해결 질문, 사용 추세, 다음 단계를 담은 페이지가 나옵니다. 재무 모델로 시나리오 플래너를 만들어 달라고 하면, 탭을 일일이 넘기지 않고도 여러 가정을 나란히 비교할 수 있는 도구가 나옵니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;게시는 두 단계로 나뉩니다. 먼저 검토용으로 버전을 저장하고, 확인이 끝나면 그 버전만 실제로 배포합니다. 잘못된 걸 그대로 내보내는 일을 막는 장치예요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;데이터를 다루는 방식도 정리돼 있습니다. 신청 기록이나 게임 점수처럼 계속 저장해둬야 하는 정보는 관계형 데이터베이스(D1)에, 이미지나 문서, 영상 같은 파일은 따로 마련된 저장소(R2)에 보관합니다. 로그인도 붙일 수 있어서, 워크스페이스 사용자만 들어오게 하거나 외부 로그인을 연결할 수 있습니다. 누가 사이트에 접근할 수 있는지는 소유자와 관리자만, 워크스페이스 전체, 직접 지정한 사람만, 이렇게 세 가지로 정합니다. 비밀번호 같은 민감한 값은 소스 코드에 같이 올리지 말고 Sites 패널에서 따로 관리하라고 안내합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;지금은 프리뷰 단계라, ChatGPT Business 워크스페이스에서는 기본으로 켜져 있고 Enterprise에서는 관리자가 권한을 열어줘야 씁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;이 발표가 왜 술렁였나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Sites가 나오자 노코드 AI 웹 빌더 쪽이 긴장했습니다. Lovable, Bolt.new, v0처럼 프롬프트로 웹앱을 만들어주던 서비스들이 하던 일을, 오픈AI가 자기 제품 안에 그대로 넣어버린 모양새거든요. 큰 플랫폼이 작은 서비스의 기능을 자기 제품으로 흡수하면, 사람들이 그 서비스를 따로 쓸 이유가 줄어듭니다. 일부 외신은 이번 발표를 두고 여러 분야의 기존 업무용 소프트웨어를 정면으로 겨냥한 움직임이라고 보기도 했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;그런데 이번 건은 그렇게 단순하게 보기 어렵습니다. 오픈AI가 Sites 파트너로 Wix, Base44, Replit, Lovable, Figma, Webflow, Emergent를 명시했거든요. 위협받는다고 거론되는 회사 중 일부가 오히려 파트너로 들어가 있는 겁니다. 그래서 지금은 흡수냐 협업이냐의 경계가 흐릿하다고 보는 게 정확합니다. 모델을 만드는 회사가 그 위에 얹히던 앱 영역까지 끌어안으면서, 어떤 곳은 품고 어떤 곳은 밀어내는 구도가 만들어지고 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;무엇을 얻어가야 하나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Sites는 아직 프리뷰라 대부분의 독자가 당장 써보긴 어렵습니다. 그래서 이건 지금 당장 써볼 것이라기보다 흐름을 읽어둘 소식에 가깝습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;읽어둘 포인트는 두 가지입니다. 하나는 소프트웨어를 만드는 사람의 경계가 넓어지고 있다는 점입니다. 코드를 못 짜도 프롬프트로 사내 도구를 만들어 배포까지 끝내는 일이 큰 회사의 기본 기능으로 들어오고 있습니다.앤트로픽의 Claude Cowork도 비슷한 방향입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다른 하나는 도구를 만들어주던 회사들의 위치가 흔들린다는 점입니다. 특정 기능 하나만 잘하는 제품은, 그 기능이 큰 플랫폼에 흡수되는 순간 설 자리가 좁아집니다. 내가 만들고 있는 게 어느 쪽인지 가끔 점검해보면 좋겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;공식 발표: &lt;a href="https://openai.com/ko-KR/index/codex-for-every-role-tool-workflow/"&gt;openai.com/index/codex-for-every-role-tool-workflow&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3785/333.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Figma, Yuhki Yamashita&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;3. 적용해볼 것:&lt;/strong&gt; &lt;a href="https://www.figma.com/blog/what-matters-when-anyone-can-build/"&gt;&lt;strong&gt;누구나 만들 수 있게 됐을 때 진짜 차이를 만드는 것&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;앞의 두 소식이 보여주는 건 만드는 일이 점점 쉬워진다는 흐름입니다. 그러면 질문이 하나 따라오죠. 누구나 빠르게 만들 수 있게 되면, 무엇으로 차이를 만들까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Figma의 최고제품책임자(CPO) Yuhki Yamashita가 이 질문을 정면으로 다룬 글을 Figma 블로그에 올렸습니다. 그는 우버에서 4년 넘게 라이더, 드라이버 앱 개편을 이끌었고, 그 전에는 구글에서 iOS용 YouTube 앱을 맡았던 사람입니다. 글의 요지는 분명합니다. 속도는 이제 기본 조건이 됐고, 진짜 차이는 방향과 완성도에서 나온다는 거죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;무슨 문제를 해결하려 하나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;상상과 현실 사이의 거리가 거의 사라졌습니다. 떠올린 걸 바로 만들어볼 수 있으니, 빠른 건 당연한 게 됐죠. 문제는 빠른 속도가 착각을 만든다는 데 있습니다. 방향이 틀렸는데 빠르게 가고 있다면, 그건 진전이 아니니까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;누구나 빠르게 만들면 결과물이 점점 비슷해집니다. AI는 통계적으로 그럴듯한 기본값을 내놓는데, 보기엔 멀쩡하지만 깊이 고민한 결과는 아니거든요. 그 기본값을 의심 없이 받아들이면 그게 그대로 내 제품이 됩니다. 그렇게 다 거기서 거기인 제품이 쌓입니다. Yamashita는 진짜 실패하는 이유가 능력 부족이 아니라 수동성이라고 봅니다. &lt;strong&gt;첫 제안에 그냥 수긍하고, 그럭저럭 괜찮아 보이니 멈추는 태도&lt;/strong&gt;요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떻게 접근하나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Yamashita가 제시하는 건 속도, 방향, 완성도 세 가지입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;방향을 잡는 방법부터 보겠습니다. 초보 빌더가 자주 빠지는 함정은 첫 아이디어에 매달려 그 주변만 계속 다듬는 겁니다. 출발점을 의심하지 않은 채로요. 반대로 경험 많은 빌더는 선택지를 넓게 펼쳐보라고 하는데, 이건 너무 추상적인 단계에 머물기 쉽습니다. 2x2 표나 와이어프레임만으로는 이게 진짜 되는 아이디어인지 확신이 안 서거든요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그가 권하는 방법은 넓게 펼치면서 동시에 깊게 파보는 겁니다. 하나만 고르는 대신 서로 다른 방향 여러 개를 띄워놓고, 각각을 실제로 써볼 수 있는 수준까지 만들어보는 거예요. Figma에서는 같은 문제에 대한 인터랙티브 프로토타입을 여러 개 만들어 나란히 놓고, 팀원과 함께 추상적인 안이 아니라 실제 경험을 비교한다고 합니다. 혼자 순서대로가 아니라 여럿이 동시에 일하는 방식이죠. 1번에서 본 다이나믹 워크플로가 여러 AI로 한 문제를 동시에 파고드는 것과 닮은 데가 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;완성도는 그다음입니다. Yamashita의 표현으로는, 완성도란 받아들이는 게 아니라 고르는 것이고, 기억에 남는 제품과 그냥 굴러가는 제품을 가르는 지점입니다. 각 결정을 다시 들여다보고, 덜어내고 조이고, 이게 정말 맞나 물으면서 관점이 생길 때까지 밀어붙이는 일이에요. 타고난 안목의 문제가 아니라 반복하면서 안목을 길러내는 과정이라는 게 그의 설명입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 Yamashita는 디자인 협업 도구를 만드는 회사의 CPO입니다. 완성도를 강조하는 게 Figma의 사업과 맞아떨어지는 면도 있고요. 그 점을 감안하더라도, 누구나 비슷하게 만드는 환경에서 무엇으로 구별될지를 묻는 질문 자체는 곱씹어볼 만합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;적용해볼 질문&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;지금 파고 있는 이 아이디어는, 여러 방향을 비교해보고 고른 건가요, 아니면 처음 떠오른 걸 그냥 붙들고 있는 건가요?&lt;/li&gt;&lt;li style="text-align:justify;"&gt;AI가 내놓은 기본값 중에, 내가 의심 없이 그대로 받아들인 건 어떤 게 있나요?&lt;/li&gt;&lt;li style="text-align:justify;"&gt;내 제품에서 사람들이 정성을 알아챌 만한 부분은 어디인가요? 있긴 한가요?&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;실행해볼 수 있는 것&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;다음에 새 기능이나 화면을 만들 때, 하나만 만들지 말고 방향이 다른 안을 두세 개 만들어 나란히 놓고 비교해보세요. AI를 쓰면 부담이 크지 않습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;AI가 처음 내놓은 결과를 그대로 쓰기 전에, 다른 방식은 없을까를 한 번 더 물어보세요. 첫 답에서 멈추지 않는 습관 하나가 결과를 바꿉니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;이번 주에 만든 결과물 하나를 골라, 덜어낼 수 있는 부분을 세 군데만 찾아 지워보세요. 더하는 것보다 빼는 게 완성도를 만들 때가 많습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;원문: &lt;a href="https://www.figma.com/blog/what-matters-when-anyone-can-build/"&gt;figma.com/blog/what-matters-when-anyone-can-build&lt;/a&gt; (Yuhki Yamashita, Figma)&lt;/p&gt;&lt;/blockquote&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;p style="text-align:justify;"&gt;다음 주에도 여러분이 놓치지 말아야 할 프로덕트 메이커 소식을 정리해서 찾아뵙겠습니다. 요즘 프로덕트 메이커 콘텐츠가 도움이 되셨다면, 꼭 작가 알림 설정을 부탁드립니다. 콘텐츠 내용 중 잘못된 정보나 정정이 필요한 부분이 있다면 댓글로 알려주세요. 빠르게 수정하겠습니다. 다음 주에 또 만나요!&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;a href="https://yozm.wishket.com/magazine/@FinalCatti/"&gt;&lt;img src="https://www.wishket.com/media/news/3785/image7.gif"&gt;&lt;/a&gt;&lt;figcaption&gt;콘텐츠가 마음에 드셨다면, 꼭꼭 작가 알림 설정과 좋아요를 부탁드립니다!&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>PM은 LLM을 어디까지 이해해야 할까?</title><link>https://yozm.wishket.com/magazine/detail/3784</link><description>LLM은 신비로운 마법 상자가 아니라 '다음 단어를 확률로 예측하는' 기계입니다. 이러한 특징은 제품의 설계와 운영에 다양한 영향을 끼칩니다. 그래서 엔지니어만큼 깊이 알 필요는 없지만, PM이라면 의사결정을 위한 최소한의 지식은 알아야 합니다. &lt;AI 프로덕트 매니지먼트&gt; 시리즈 두 번째 글은 토큰·컨텍스트·추론·RAG·에이전트, 다섯 개의 단어로 그 직관을 줄 지식을 정리했습니다. 한국어 서비스의 비용이 더 나오는 이유, 챗봇이 자신만만하게 틀리는 이유, '우리 회사 문서를 아는 AI'에 RAG가 필요한 이유 등을 짚었습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3784</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;lt;&lt;i&gt;&lt;strong&gt;AI 프로덕트 매니지먼트&lt;/strong&gt;&lt;/i&gt; 시리즈&amp;gt; ②&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;새로운 시대의 AI 프로덕트가 기존의 프로덕트와 무엇이 다른지를 다룹니다. PM의 관점에서 말하지만, AI 프로덕트를 다루는 모두 참고할 만한 이야기를 묶었습니다. 필자가 출간할 예정인 &amp;nbsp;&amp;lt;AI Product Management(가제)&amp;gt; 책의 일부를 요즘IT 독자의 시선에 맞춰 재가공했습니다.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;① &lt;a href="https://yozm.wishket.com/magazine/detail/3775/"&gt;AI는 왜 자꾸 틀리는가&lt;/a&gt;&lt;br&gt;&lt;strong&gt;② PM은 LLM을 어디까지 이해해야 할까?&lt;/strong&gt;&lt;br&gt;③ &lt;a href="https://yozm.wishket.com/magazine/detail/3797/"&gt;AI 기능은 프롬프트가 아니라 시스템으로 만든다&lt;/a&gt;&lt;/p&gt;&lt;hr&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;엔지니어는 아니지만, PM도 가져야 할 직관&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;1950년 어느 저녁, 벨연구소의 수학자 클로드 섀넌(Claude Shannon)이 부인 메리에게 게임 하나를 제안했습니다. 먼저 책 한 권을 펼쳐놓고, 클로드가 아무렇게나 펼친 페이지에서 한 글자를 가립니다. 이제 메리는 가려진 글자가 무엇일지 맞혀야 합니다. 첫 글자를 맞히면 다음 글자로 넘어가고, 틀리면 정답을 알려준 뒤 다음 글자로 넘어갑니다. 그렇게 한 문장을 끝까지 따라가는 게임입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결과는 놀라웠습니다. 메리는 보통 가려진 글자 4개 중 3개 가까이 맞혔습니다. ‘T’ 다음에 ‘H’가, ‘TH’ 다음에 ‘E’가 올 가능성이 높다는 사실을 무의식적으로 알고 있었기 때문입니다. 이는 메리처럼 영어를 모국어로 쓰는 사람의 머릿속에는 어떤 글자 다음에 어떤 글자가 올 확률이 통계적으로 자리 잡혀 있다는 뜻이기도 했습니다. 섀넌은 이 실험에서 출발해 “언어에는 예측 가능한 구조가 있다”는 사실을 수학적으로 증명했고, 이 발견이 훗날 LLM의 토대가 되었습니다. 앤트로픽의 클로드도, 바로 이 수학자의 이름에서 따왔다고 알려져 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;참조: &amp;nbsp;Claude E. Shannon, “&lt;/span&gt;&lt;a href="https://www.princeton.edu/~wbialek/rome/refs/shannon_51.pdf"&gt;Prediction and Entropy of Printed English&lt;/a&gt;&lt;span style="color:#757575;"&gt;”, Sep 15, 1950&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;75년이 지난 지금, 우리가 쓰는 LLM은 매일 이 게임을 합니다. 챗GPT나 클로드는 메리가 가려진 글자를 추론한 것과 같은 원리로 논문을 쓰고, 코드를 짜고, 시를 만들어냅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이제 알아볼 모든 지식에 앞서는 핵심은 이것입니다. &lt;strong&gt;LLM이 하는 일을 한 줄로 요약하면, “다음에 올 단어를 확률적으로 예측하는 것”이라는 점입니다.&lt;/strong&gt; 섀넌이 1950년에 메리와 했던 게임을 거대한 규모로 키운 확장판입니다. 다만 “다음 한 글자”가 아니라 “다음 한 단어”이고, 메리 한 사람의 직관이 아니라 인터넷 전체의 텍스트로 학습한 통계 모델을 쓸 뿐입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3784/image4.jpg"&gt;&lt;figcaption&gt;LLM은 다음 오는 단어를 확률로 예측한다. &amp;nbsp;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런데 PM이 이걸 알아야 하는 이유가 뭘까요? 엔지니어가 아닌데 굳이 LLM의 동작 원리까지 들여다볼 필요가 있을까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결론부터 말하면, 있습니다. 다만 엔지니어처럼 깊이 알 필요는 없습니다. “이 정도는 알아야 의사결정을 할 수 있다”는 최소한의 직관이 필요한 이유와 함께, 그 직관을 만들어 줄 지식 다섯 가지를 짚어보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;1. 토큰: LLM은 글자를 우리와 다르게 본다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;우리는 글을 단어 단위로 읽습니다. “나는 오늘 점심을 먹었다”는 네 단어죠. 그런데 LLM은 다르게 봅니다. 토큰&lt;span style="color:#757575;"&gt;(token)&lt;/span&gt;이라는 단위로 잘라서 처리하는 것입니다. 이 토큰은 단어보다 작을 수도 있고 클 수도 있는, 모델이 학습 과정에서 만들어낸 일종의 “기본 조각”입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;예를 들어 “unhappiness”라는 단어는 영어 LLM에서 보통 “un”, “happi”, “ness” 세 토큰으로 잘립니다. 한국어 “먹었습니다”는 “먹”, “었”, “습니다” 식으로 쪼개지죠.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;게다가 한국어는 같은 의미를 표현하는 데 영어보다 토큰을 더 많이 씁니다. 같은 말을 하는데 영어보다 약 1.5~2배의 토큰이 필요한 경우가 많습니다. 영어로 “Thank you very much”가 4~5토큰이라면, 한국어 “정말 감사합니다”는 7~8토큰이 들 수도 있다는 뜻입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이게 왜 PM에게 중요할까요? LLM의 비용은 토큰 단위로 계산되기 때문입니다. 같은 길이의 문장을 다룬다 해도, 한국어 서비스는 영어 서비스보다 비용이 더 나옵니다. 또 모델마다 “한 번에 처리할 수 있는 최대 토큰 수”가 정해져 있는데, 한국어로 작업하면 그 한도에 더 빨리 도달합니다. 이걸 모르고 시스템을 설계하면, 출시 후 비용 청구서에서 놀라거나, 긴 문서를 처리할 때 갑자기 답이 잘려 나오는 일을 만나게 됩니다. 한국어 기반 AI 서비스를 만드는 PM이 글로벌 사례를 그대로 가져다 쓰면 안 되는 이유가 여기에 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;2. 컨텍스트: LLM에게는 단기 기억밖에 없다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;챗GPT나 클로드와 길게 대화하다 보면 어느 순간 모델이 앞에서 한 이야기를 잊어버리는 걸 경험해 보셨을 겁니다. 처음에 “제 이름은 홍길동이에요”라고 말해놓고 50번쯤 메시지를 주고받은 뒤 “제 이름이 뭐였죠?”라고 물어보면, 홍길동이라는 이름 대신 이상한 답이 돌아오기도 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이건 버그가 아니라 구조적 한계입니다. LLM은 컨텍스트 윈도우라는 한정된 “단기 기억 공간”만 가지고 있습니다. 모델마다 다르지만 보통 수만에서 수십만 토큰 정도입니다. 그 안에 들어 있는 정보로만 답을 만들고, 그걸 벗어난 내용은 “존재하지 않는 것처럼” 처리됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;더 중요한 사실은, LLM에는 우리가 흔히 생각하는 “장기 기억”이 없다는 점입니다. 어제 제미나이와 나눈 대화를 모델이 “기억”하고 있는 것처럼 보여도, 실은 대부분의 경우 어제 나눈 그 대화 내용을 매번 새로 컨텍스트에 끼워 넣어주는 방식으로 동작합니다. 모델 자체는 우리를 알지 못합니다. 그저 매번 “이 대화의 앞부분은 이랬다”는 메모를 새로 받아서 읽고 답할 뿐입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 사실이 PM에게 의미하는 것은 우리가 만드는 AI 기능에서 “사용자를 기억하는 듯한 경험”을 주려면, 이를 위한 시스템을 따로 설계해야 한다는 것입니다. 사용자 정보를 데이터베이스에 저장해두고, 모델에게 매번 “이 사용자는 이런 사람입니다”라고 알려주는 시스템을 만들어야 합니다. 모델이 알아서 기억해 줄 거라고 가정하면 안 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3784/image2.png"&gt;&lt;figcaption&gt;컨텍스트 윈도우에는 시스템 프롬프트, 사용자 메시지, 주고받는 내용이 모두 계속 누적된다. &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;3. 추론: 같은 질문에 왜 답이 매번 다른가&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;&lt;a href="https://yozm.wishket.com/magazine/detail/3775/"&gt;지난 글&lt;/a&gt;에서 우리는 “챗GPT에 같은 질문을 100번 던지면 100번 다 다른 답이 돌아온다”는 이야기를 했습니다. 이건 단순히 “AI는 확률적이다”라는 문장 하나로 끝맺을 사실은 아닙니다. 왜 그렇게 되는지, 그 안에서 무슨 일이 일어나는지를 알아야 AI 프로덕트를 만들 때 보이는 풍경이 달라집니다. 이를 위해 알아야 할 핵심 지식, 추론&lt;span style="color:#757575;"&gt;(inference)&lt;/span&gt;은 학습이 끝난 모델이 실제로 답을 “만들어내는” 과정을 가리키는 말입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;답은 “계산”되는 게 아니라 “뽑힌다”&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;사용자가 “파리는 어느 나라의 수도인가요?”라고 물었다고 합시다. 모델은 이 질문에 대해 어휘집에 있는 모든 토큰 각각에 확률값을 매깁니다. 문장의 시작부터 답이 나와야 한다고 했을 때, “프랑스”가 42%, “프”가 11%, “유럽”이 8%, 나머지 토큰들이 나머지 확률을 나눠 갖는 식입니다. 그러고 나서 이 확률 분포를 참조해 토큰 하나를 “뽑습니다”. 뽑힌 토큰을 답의 첫 글자로 삼고, 그다음 토큰의 확률 분포를 다시 계산해서 또 뽑습니다. 이 과정을 문장이 끝날 때까지 반복합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;핵심은 “뽑는다”는 동사에 있습니다. 모델에 매번 확률이 가장 높은 토큰만 무조건 고르라고 하면&lt;span style="color:#757575;"&gt;(이를 그리디 디코딩이라고 합니다)&lt;/span&gt; 결과는 단조롭고 반복적으로 나옵니다. 그래서 실제로는 확률 분포에서 무작위로 샘플링하는 방식을 씁니다. 확률이 높은 토큰이 선택될 가능성이 높지만, 낮은 토큰도 가끔 선택됩니다. 이 작은 무작위성 때문에 같은 질문에도 매번 조금씩 다른 답이 나오는 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;Temperature, PM이 실제로 만지는 손잡이&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;그 무작위성의 강도를 조절하는 파라미터가 Temperature&lt;span style="color:#757575;"&gt;(온도)&lt;/span&gt;입니다. 보통 0에서 2 사이 값을 가지는데, 낮을수록 확률 분포가 “날카로워져서” 가장 그럴듯한 토큰이 거의 항상 선택됩니다. 그러면 결과가 일관성을 지니며 예측 가능합니다. 반대로 값이 높을수록 분포가 “평평해져서” 낮은 확률의 토큰도 자주 선택됩니다. 다양하고 창의적인 결과가 나오지만, 때로 엉뚱하거나 부정확합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런 만큼 Temperature는 사용자 경험을 직접 좌우합니다. 팩트를 답해야 하는 고객 지원 챗봇은 Temperature를 낮게&lt;span style="color:#757575;"&gt;(0.1~0.3)&lt;/span&gt; 잡아야 합니다. 같은 질문에 다른 답이 나오면 신뢰가 무너지니까요. 반대로 마케팅 문구를 만드는 도구나 브레인스토밍 도우미는 Temperature를 높게&lt;span style="color:#757575;"&gt;(0.7~1.2)&lt;/span&gt; 잡아야 다양한 아이디어가 나옵니다. “기본값으로 두면 알아서 잘 되겠지”라는 생각은 PM이 빠지기 쉬운 흔한 함정입니다. 태스크마다 적절한 Temperature를 의식적으로 설계해야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;환각의 진짜 원인, 자신만만하게 틀리는 이유&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;1편에서 본 에어캐나다 챗봇 사건, 기억하시나요? 챗봇이 회사의 실제 정책과 다른 답을 자신만만하게 내놓아서 회사가 소송에 휘말렸던 일 말입니다. 그 챗봇은 왜 그렇게 자신만만했을까요? 추론 메커니즘을 알면 답이 보입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;LLM은 답을 생성할 때 “이것이 사실인가?”를 검증하지 않습니다. “이 문맥에서 이 토큰이 얼마나 그럴듯한가?”만 계산합니다. 그러니까 “가족 장례로 인한 할인이 있나요?”라는 질문을 받으면, 항공사 챗봇은 으레 할 법한 “네, ~한 절차로 신청하실 수 있습니다” 같은 답변 패턴이 가장 그럴듯하다고 판단합니다. 곧이어 그에 맞춘 적당한 구성으로 답을 뽑아냅니다. 그 답이 실제 회사 정책과 맞는지는 모델의 관심 밖입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;더 까다로운 건, 모델이 환각을 일으킬 때도 어조에 망설임이 없다는 점입니다. 사람은 확신이 없을 때 “잘 모르겠는데요”라고 말하거나 목소리가 흔들리는 등 전조를 보입니다. 반면 LLM은 불확실한 상황에서도 가장 그럴듯한 토큰을 자신 있게 뽑아 유창하게 이어 붙입니다. 이것이야말로 환각을 위험하게 만드는 결정적 특성입니다. 틀린 내용을 자신 있게 말한다면, 사용자가 그게 틀렸다는 걸 알아채기가 거의 불가능합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;아첨(Sycophancy), 사용자에게 맞춰 비틀어지는 답&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;최근 몇 년 사이 LLM에서 새롭게 주목받는 현상이 하나 더 있습니다. 아첨&lt;span style="color:#757575;"&gt;(sycophancy)&lt;/span&gt;이라고 부르는데, 사용자가 어떤 답을 기대하는 것처럼 보이면 모델이 그 기대에 맞춰 답을 비트는 경향입니다. “제 사업 아이디어 어떻게 생각하세요?”라고 물으면 대부분 칭찬이 돌아옵니다. “이거 문제 있죠?”라고 물으면 정말 문제가 없는 경우에도 문제를 찾아 답해줍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이건 모델이 “착해서”가 아닙니다. 학습 과정에서 사용자가 만족스러워한 답변에 더 높은 점수가 매겨졌고, 그 패턴이 모델의 확률 분포에 새겨졌기 때문입니다. PM 입장에서 이건 진지하게 다뤄야 할 문제입니다. AI 어시스턴트가 의견에 항상 동의하고 칭찬만 남발한다면, 사용자는 그 피드백을 점점 덜 신뢰하게 됩니다. 비판적인 피드백이나 다양한 관점이 필요한 기능을 만들 때는, 모델이 “반대 의견이나 약점을 명시적으로 제시하도록” 프롬프트 수준에서 의도적으로 설계해 줘야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;4. RAG: LLM에 참고서를 들려주는 법&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;이제 우리는 환각과 아첨이 왜 일어나는지 알게 됐습니다. 모델이 “학습 때 본 패턴”으로만 답하기 때문이죠. 그렇다면 모델이 학습할 때 보지 못한 정보 — 회사 내부 매뉴얼, 최근 뉴스, 우리 서비스의 정책 같은 것들 — 에 대해 정확히 답하려면 어떻게 해야 할까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 문제를 풀기 위해 등장한 접근법이 RAG&lt;span style="color:#757575;"&gt;(Retrieval-Augmented Generation, 검색 증강 생성)&lt;/span&gt;입니다. 이름은 어렵지만 구조는 단순합니다. 사용자가 질문하면, 시스템이 일단 회사의 자료 창고&lt;span style="color:#757575;"&gt;(매뉴얼, 위키, 정책 문서 등)&lt;/span&gt;에서 관련 내용을 검색합니다. 그 검색 결과를 모델의 컨텍스트에 함께 넣어주고, "이 자료를 참고해서 답해줘"라고 요청합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;쉽게 말하면, LLM에 “참고서”를 펼쳐주고 답하게 하는 방식입니다. 이렇게 하면 모델은 자기 머릿속의 기억에 의존하는 게 아니라, 그 자리에서 펼쳐 본 자료를 근거로 답합니다. 이 방식이 도입되면서 기업용 AI 기능이 비로소 “우리 회사 문서를 아는 챗봇”이 될 수 있었습니다. 환각도 상당 부분 줄어듭니다. 답할 근거가 손에 쥐어져 있으니까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;PM 입장에서 RAG가 중요한 이유는, AI 기능을 기획할 때 “이건 LLM 혼자 잘 못 한다, 자료를 함께 줘야 한다”는 판단이 필요하기 때문입니다. “우리 회사 정책에 대해 답해주는 챗봇”을 만든다고 했을 때, 그게 LLM만으로 되는 일인지, RAG가 필요한 일인지를 구분할 줄 알아야 합니다. 거의 모든 기업용 AI 기능은 후자입니다. 에어캐나다 챗봇이 환각을 일으킨 것도, 회사의 실제 정책 문서가 모델 곁에 없었기 때문이라고 볼 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3784/image5.png"&gt;&lt;figcaption&gt;LLM과 RAG 비교 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;5. 에이전트: LLM에게 손과 발을 주는 법&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;여기까지 본 LLM은 결국 “질문을 받으면 답을 내놓는” 기계입니다. 그런데 최근 1~2년 사이, AI 업계의 가장 뜨거운 주제는 “AI가 직접 일을 하게 만드는 법”이 되었습니다. 이걸 가능케 하는 무언가를 에이전트&lt;span style="color:#757575;"&gt;(Agent)&lt;/span&gt;라고 부릅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;에이전트의 개념은 비유로 풀면 쉽습니다. LLM이 “두뇌”라면, 에이전트는 그 두뇌에 “손과 발”을 붙여준 것입니다. 사용자가 “다음 주 파리행 항공편 중에 가장 싼 거 예약해 &lt;span style="background-color:rgb(255,255,255);color:rgb(49,49,49);"&gt;줘”&lt;/span&gt;라고 하면, 단순히 답만 내놓는 게 아니라 실제로 검색 사이트를 열어보고, 가격을 비교하고, 예약 시스템에 정보를 입력하는 일까지 하게 만드는 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;기술적으로는 LLM이 “도구&lt;span style="color:#757575;"&gt;(tool)&lt;/span&gt;”를 쓸 수 있게 만든 구조가 핵심입니다. 모델이 “지금은 검색이 필요하다”고 판단하면 검색 API를 호출하고, “이메일을 보내야 한다”고 판단하면 메일 발송 함수를 부릅니다. 모델은 매 단계에서 “다음에 무엇을 해야 하는가”를 판단하고, 그 판단대로 행동합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;PM 관점에서 에이전트가 흥미로운 지점은, AI 기능의 영역이 “대화”에서 “작업”으로 넓어진다는 것입니다.&lt;/strong&gt;예전에는 “이메일 초안을 써줘”가한계였다면, 이제는 “이메일을 검토하고, 답장을 쓰고, 회의 일정을 잡아서 캘린더에 넣어줘”까지 가능해졌습니다. 물론 그에 따른 책임의 범위도 훨씬 커집니다. AI가 행동을 하면, 그 행동의 결과에 대해 누가 책임지는가의 문제가 따라옵니다. 에이전트 시대의 PM은 이 책임 설계까지 함께 고민해야 합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;이 정도면 충분하다&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;정리하면 이렇습니다. LLM은 다음 단어를 확률적으로 예측하는 기계이고, 그 일은 토큰 단위로 처리하며, 컨텍스트 윈도우라는 단기 기억만 가지고 있고, 부족한 지식은 RAG로 채운 다음,&amp;nbsp; 행동이 필요한 일은 에이전트로 확장합니다. 이게 PM이 알아야 할 “최소한의 직관”을 주는 LLM 지식입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 다섯 가지를 알고 있으면, 엔지니어와의 회의가 달라집니다. 이를테면 “이거 LLM으로 가능합니까?”라고 묻는 대신 “이 기능에는 RAG가 필요할 것 같은데, 자료 출처는 어디로 잡을까요?”라고 물을 수 있게 됩니다. “왜 답이 자꾸 잘리죠?”라고 묻는 대신 “컨텍스트 한도에 걸린 것 같은데, 입력을 어떻게 줄일까요?”라고 말할 수도 있게 됩니다. PM이 기술적 디테일을 다 알 필요는 없지만, 적어도 엔지니어와 같은 언어로 대화할 수 있어야 좋은 의사결정이 나옵니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리고 한 가지 더, 이 직관이 있으면 사용자에게 줄 수 있는 경험의 범위가 보입니다. “우리 사용자에게 진짜 가치 있는 AI 기능는 단순 대화일까, 자료를 참고하는 답변일까, 아니면 직접 일을 처리하는 에이전트일까?” 이 질문에 답할 수 있어야 좋은 AI 프로덕트가 나옵니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞서 “AI는 확률 시스템이다”라는 큰 그림을 봤다면, 오늘은 그 확률 시스템이 구체적으로 어떻게 동작하는지를 들여다본 셈입니다. 이 두 가지가 결합할 때, 비로소 우리는 AI 프로덕트를 “감으로 만드는 것”이 아니라 “이해하고 만드는 것”으로 옮겨 갈 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;LLM은 신비로운 마법 상자가 아닙니다. 다음 단어를 잘 예측하는, 거대하지만 제약이 분명한 기계입니다. 그 제약이 어디인지를 아는 순간, AI 기능을 만드는 일이 “어떻게든 되겠지” 영역에서 “이렇게 만들면 된다”의 영역으로 옮겨옵니다. 그리고 그러한 이동은 지식에서 나옵니다. 오늘 우리가 함께 짚어본 다섯 개의 단어 — 토큰, 컨텍스트, 추론, RAG, 에이전트만 이해해도 그 첫걸음을 내딛기에 충분할 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>이제 AI에게 매번 설명하지 않아도 됩니다: Kanwas</title><link>https://yozm.wishket.com/magazine/detail/3783</link><description>AI 도구가 넘쳐나는 시대, 정작 팀의 지식은 Claude 채팅창, 노션 문서, 로컬 폴더 사이를 떠돌고 있습니다. 회의에서 내린 결정은 이틀 뒤면 아무도 기억하지 못하고, 고객 인터뷰에서 나온 인사이트는 누군가의 노트 앱 깊숙이 사라지는 경우도 생깁니다. AI를 열심히 쓰는데도 아웃풋이 항상 ‘뭔가 우리 팀 이야기가 아닌 것 같은’ 느낌이 드는 이유가 바로 여기에 있습니다. 오늘 소개할 ‘Kanwas’는 이 구조적 문제를 정면으로 겨냥한 서비스입니다. 몇 주간 직접 써보면서 느낀 점을 솔직하게 정리해 봤습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3783</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;AI 도구가 넘쳐나는 시대, 정작 팀의 지식은 Claude 채팅창, 노션 문서, 로컬 폴더 사이를 떠돌고 있습니다. 회의에서 내린 결정은 이틀 뒤면 아무도 기억하지 못하고, 고객 인터뷰에서 나온 인사이트는 누군가의 노트 앱 깊숙이 사라지는 경우도 생깁니다. AI를 열심히 쓰는데도 아웃풋이 항상 ‘뭔가 우리 팀 이야기가 아닌 것 같은’ 느낌이 드는 이유가 바로 여기에 있습니다. 오늘 소개할 ‘&lt;a href="https://kanwas.ai"&gt;&lt;u&gt;Kanwas&lt;/u&gt;&lt;/a&gt;’는 이 구조적 문제를 정면으로 겨냥한 서비스입니다. 몇 주간 직접 써보면서 느낀 점을 솔직하게 정리해 봤습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas1.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;팀에서 AI를 쓰다 보면 반복되는 패턴이 있습니다. 새 채팅창을 열 때마다 ‘우리 제품은 이런 서비스고, 타깃은 이런 사람들이고, 지난번에 이런 결정을 내렸는데’와 같은 맥락과 배경 설명을 반복해야 한다는 점입니다. 물론 이를 해결할 수 있는 여러 방법이 있지만, 서비스나 상황에 따라 이를 피해 갈 수 없는 경우가 여전히 존재합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;더 근본적인 문제는 '문서를 만드는 것'과 '지식이 살아있는 것' 사이의 간극입니다. 노션에 PRD를 써두지만 3개월 뒤엔 아무도 업데이트하지 않고, 화이트보드 내용은 회의가 끝나면 사진 한 장으로만 남는 것과 같은 상황입니다. 사진을 어떤 채널에 올렸는지, 언제 누가 어떤 방법으로 공유했는지 검색에 의존해야 하거나 아예 포기하는 경우도 발생합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;Kanwas&lt;/strong&gt;는 이 구조적 문제를 해결하려고 만들어진 서비스입니다. ‘팀의 컨텍스트 브레인(Your team's context brain)’이라는 슬로건처럼, 팀의 지식과 결정 맥락을 한 곳에 모아두고 사람과 AI 에이전트 모두가 동일한 맥락 위에서 함께 일할 수 있는 공간을 만드는 게 핵심 목표입니다. 쓰다 보면 잊혀지는 문서도, 세션이 끝나면 사라지는 채팅도 아닌, 팀이 그 안에서 실제로 생각하고 협업할 수 있는 '살아있는 맥락'을 지향합니다. 단순히 ‘모든 걸 한 곳에 저장하자’는 접근이 아니라, 저장된 맥락이 실제로 AI 작업에 활용되는 구조를 만드는 것이 핵심 차별점입니다.&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3&gt;&lt;strong&gt;Kanwas는 어떤 서비스인가?&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas2.jpg"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;한 줄로 요약하면, 컨텍스트 중심의 AI 워크스페이스입니다. 노션처럼 문서를 쓰는 곳이기도 하고, Figma처럼 캔버스 위에서 작업하는 곳이기도 하고, AI 에이전트와 함께 전략을 짜고 PRD를 작성하는 곳이기도 합니다. 처음 접속했을 때 '또 다른 올인원 툴인가?' 싶었는데, 실제로 써보면서 기존 도구들과 결이 다르다는 걸 느꼈습니다. 노션이나 Confluence는 정보를 저장하는 데 최적화되어 있지만, Kanwas는 저장된 정보가 AI와 함께 실제로 작동하는 데 최적화되어 있습니다. 이 차이가 생각보다 큽니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Kanwas가 집중하는 건 쌓일수록 깊어지는 맥락인데, AI가 일반적인 결과물을 내는 건 지능이 부족해서가 아닙니다. 범용 모델에 대략적인 맥락을 제공하면 일반적인 결과가 나올 수밖에 없기 때문입니다. 그런데 ‘우리 팀만의 특정 맥락’이 더해지면 같은 모델이라 하더라도 결과는 달라질 수밖에 없습니다. 때문에 오늘 내린 결정, 지난 분기에 논의한 트레이드오프, 고객 인터뷰에서 나온 인사이트가 단순히 저장되는 게 아니라 연결되고 쌓이는 것이 중요합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Kanwas를 활용해 이번 분기 로드맵을 검토하게 될 경우, 에이전트가 지난달 고객 인터뷰 요약, 이전 스프린트 회고 내용, 경쟁사 분석 결과를 함께 참조해서 ‘이 기능을 우선순위에 올리면 Q2에 결정한 타깃 세그먼트 전략과 충돌합니다’라고 짚어줍니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;주요 기능 살펴보기&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas3.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;캔버스 기반 작업 공간:&lt;/strong&gt; 코드, 문서, 태스크, 임베드, iframe을 하나의 공간에서 다룰 수 있습니다. 대부분의 AI 툴이 채팅 형식을 고집하는 반면, Kanwas는 경쟁사 분석 보드, 사용자 페르소나 문서, PRD 초안, 에이전트 실행 결과를 캔버스 위에 공간적으로 배치하면 전체 흐름이 한눈에 파악할 수 있도록 도와줍니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;팀원과 같은 캔버스를 보면서 실시간으로 작업하는 경험은, 슬랙과 노션을 번갈아 가며 맥락을 전달하던 방식과 확실히 달랐습니다. 한 가지 짚고 넘어갈 점은, Miro나 Excalidraw처럼 포스트잇을 붙이거나 자유롭게 드로잉하는 시각적 화이트보드를 기대한다면 안된다는 점입니다. Kanwas의 캔버스는 구조화된 문서와 의사결정이 중심이고, 아이디어와 근거가 하나의 맥락 위에 연결되는 '구조 있는 작업 공간'에 가깝습니다. Figma 경험이 있다면 바로 적응할 수 있고, 그렇지 않더라도 대부분 금방 익숙해집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas4.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;컨텍스트 그래프&lt;/strong&gt;: 노트, 보드, 태스크, 의사결정 내용이 모여 공유 지식 베이스를 형성합니다. 내부 구조를 들여다보면, Kanwas는 brain이라는 공유 메모리 폴더를 워크스페이스의 중심에 둡니다. 회사 정보와 제품 맥락(product), 팀 구성과 작업 규범(team), 중요한 의사결정 기록(decisions)이 각각 분리된 문서로 쌓이고, 에이전트는 매 세션 시작 시 이를 자동으로 불러와 항상 최신 맥락 위에서 일을 시작합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;중요한 건 이게 수동으로 태깅하거나 별도로 정리해야 하는 구조가 아니라는 점입니다. 일하는 과정 자체가 컨텍스트가 됩니다. 새로운 작업 영역이 생기면 에이전트가 해당 폴더에 자동으로 instructions 파일을 만들고, 시스템 전체가 저절로 정리되는 구조입니다. ‘쓸수록 똑똑해진다’는 말이 처음엔 마케팅 문구처럼 들렸는데, 직접 경험해보니 구조적으로 설계된 결과라는 게 납득이 됐습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas5.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;다양한 모델로 활용하는 AI 에이전트&lt;/strong&gt;: Claude, GPT, Gemini 등 원하는 모델을 자유롭게 연결해서 쓸 수 있습니다. 특징적인 점은 에이전트가 도구를 호출하고 작업을 처리하는 전 과정이 팀원 모두에게 공유 타임라인으로 실시간 공개된다는 것입니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;에이전트 모드는 두 가지입니다. 코딩 에이전트처럼 직접 태스크를 실행하는 Direct 모드와 사용자에게 질문을 던지며, 사고를 자극하는 ‘Get my brain going’ 모드입니다. 위 이미지는 후자에 해당하는 에이전트와 초기 맥락을 쌓아가는 과정인데요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;전략 문서를 쓸 때 이 모드를 켜면 에이전트가 ‘이 기능을 추가하면 기존 타깃과 충돌하는 부분은 어떻게 정리할 건가요?’ ‘Q1에 내렸던 아키텍처 결정이 이 스펙에 영향을 주지 않나요?’ 같은 날카로운 질문을 먼저 던집니다. 단순히 아웃풋을 뽑아내는 게 아니라, 제 판단과 맥락이 결과물에 녹아드는 경험이 기존 AI 툴과 확실히 달랐습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas6.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 신규 프로젝트의 경우, 아직 마땅한 자료나 가이드가 없을 가능성이 있기에 ‘Get my brain going’ 모드를 활용하면 서비스와 관련된 다양한 내용을 질문 - 답변 형태로 주고받으며 내용을 채워 넣을 수 있습니다. 또한 이렇게 완성된 내용들을 앞서 말씀드린 워크스페이스의 두뇌 역할을 하는 ‘Brain’에 틈틈이 저장하는 기능도 지원합니다. 이런 식으로 계속해서 참고할 맥락과 배경을 쌓고, 저장 여부를 에이전트와 함께 확인하며 작업할 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas7.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;실시간 협업 및 1,000개+ 연동&lt;/strong&gt;: 팀원들이 동시에 보드 위에서 작업할 수 있고, Slack, Linear, Notion, 코드베이스 등 기존 툴과 연동해서 컨텍스트를 끌어올 수 있습니다. CLI 도구도 제공되어 있어서, Cursor나 Claude Code 같은 코딩 에이전트가 Kanwas의 컨텍스트를 직접 참조하며 작업하도록 연결할 수 있습니다. 개발팀과 프로덕트 팀이 같은 컨텍스트 위에서 움직이는 환경을 만들 수 있다는 점이 실용적이고, 기존 워크플로우를 통째로 갈아엎지 않아도 된다는 점에서 특히 유용한 기능이라고 생각합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas9.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Kanwas가 가장 유용한 순간은 깊은 판단이 필요한 작업을 할 때입니다. 전략 메모 작성, PRD 초안, 투자자 피치덱, 경쟁사 분석, 포지셔닝 정의 같은 작업들이 대표적입니다. 저는 신규 기능 PRD 작업에 처음 Kanwas를 본격적으로 활용해 봤는데, 기존 방식과의 차이가 분명했습니다. 기존에는 노션에 빈 PRD 템플릿을 열고, 슬랙에서 관련 대화를 복붙하고, 지난 회의 녹취록을 뒤지고, Claude에 맥락을 입력해서 초안을 받는 순서였습니다. 그렇게 나온 초안은 항상 ‘맞는 말인데 우리 상황하고는 좀 다른’ 느낌이었습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Kanwas에서는 흐름이 달랐습니다. 이전에 작성해 둔 사용자 인터뷰 노트, 경쟁사 분석 보드, 팀 회의 결정 내용이 이미 같은 공간에 연결되어 있었고, AI 에이전트에게 ‘이 맥락을 바탕으로 PRD 초안을 잡아줘’라고 했을 때 나온 결과물이 생각보다 만족스러웠기 때문입니다. 우리 팀이 지난 분기에 결정한 타깃 세그먼트가 반영되어 있었고, 이전에 논의했던 기술적 제약도 함께 고려되어 있었습니다. ChatGPT에 같은 요청을 넣었을 때와 비교하면 결과물의 구체성과 맥락이 눈에 띄게 달랐습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;위 이미지는 제가 운영 중인 팁스터 뉴스레터의 맥락을 바탕으로, 신규 클럽에 대한 기획안을 작성하는 모습인데요. 명확하고 구체적인 맥락 정보가 이미 쌓여있고, 이를 바탕으로 제안이 진행되기 때문에 비현실적인 내용은 최소화하고 바로 실행 가능한 수준의 내용을 바로 확인할 수 있습니다. 대화하고, 이를 캔버스에 문서(.md 형식)로 남기기 때문에 맥락이 계속 쌓이게 되고 Kanwas 안에서는 물론, 앞서 말씀드린 것과 같이 커서 등과 연계해서 실제 기능 구현까지도 이어지는 흐름을 만들 수 있다는 점이 특히 매력적이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;한 번은 꼭 써봐야 하는 이유&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;실제 사례로, Schematik의 창업자 Samuel Beek은 Kanwas에 고객 콜 내용, 투자자 대화, 포지셔닝을 모두 가져와서 피치덱을 만들고 피드백 받고 수정하기를 반복한 뒤 일주일 만에 460만 유로 규모의 프리시드 투자를 유치했다고 밝혔습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;결과도 인상적이지만, 그 과정이 Kanwas가 설계된 방식과 정확히 맞아떨어집니다. 투자자와 나눈 대화, 고객으로부터 들은 피드백, 포지셔닝 결정이 하나의 공간에 쌓이고, 그 위에서 AI와 함께 반복적으로 피치를 다듬는 흐름을 보여주기 때문입니다. 피치덱 하나를 만들기 위해 여러 툴을 오가며 맥락을 끊임없이 확인해야 했던 기존의 방식과 다른 접근이기도 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;아래와 같은 상황에 해당된다면, 그리고 지금까지 제가 소개한 맥락에 맞는 팀이라면 한 번쯤 써봐야 할 이유가 충분하다고 생각합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li&gt;&lt;strong&gt;AI를 열심히 쓰는데 결과물이 항상 맥락 없이 느껴지는 팀&lt;/strong&gt;: 좋은 AI 툴을 갖고 있어도 팀의 히스토리와 맥락을 모르면 결과물은 늘 일반적인 수준에서 벗어나지 못합니다. ‘GPT가 써준 것 같은 느낌’이 든다면, 문제는 프롬프트가 아니라 컨텍스트의 부재일 가능성이 큽니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;문서가 쌓이지만 실제로 아무도 찾아보지 않는 팀&lt;/strong&gt;: 노션 페이지가 수백 개인데 정작 AI에게 우리 팀 맥락을 설명할 때 아무것도 활용하지 못하고 있다면, 저장 방식이 아니라 활용 구조를 바꿔야 합니다. Kanwas는 이 구조를 처음부터 고려해 설계되어 있습니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;소수 인원으로 여러 AI 에이전트를 운용하는 스타트업&lt;/strong&gt;: 개발 에이전트, 마케팅 에이전트, 전략 에이전트 모두에게 ‘우리 제품은 이런 서비스입니다’를 매번 설명하는 대신, Kanwas에 한 번 정리해 두면 모든 에이전트가 같은 맥락을 공유합니다. 특히 솔로 파운더나 소규모 팀에게 시간 절약 효과가 큽니다.&lt;/li&gt;&lt;li&gt;&lt;strong&gt;PM, 프로덕트 리드, 팀 리더&lt;/strong&gt;: PRD, 로드맵, 의사결정 로그, 고객 인사이트를 한 공간에서 AI와 함께 관리하고 싶은 분에게 적합합니다. 특히 ‘우리가 특정 순간에 왜 그 결정을 내렸는지’를 팀원이나 에이전트에게 쉽게 설명할 수 있는 구조가 필요한 PM이라면 무엇보다 활용도가 좋은 서비스라 생각합니다.&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3783/kanwas10.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Kanwas, 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:center;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;게다가 Knawas에서는 기본적으로 50개의 스킬을 제공하며 커스텀 스킬을 생성해 활용하는 것도 가능합니다. 스킬에는 리서치, 유저 스토리 생성, 글쓰기, OKR 리뷰, 슬랙 스레드 요약 등 다양한 업무 목적과 상황에 따라 활용할 수 있습니다. &amp;nbsp;Kanwas의 코어 코드베이스는 GitHub에 Apache 2.0 라이선스로 오픈소스 공개되어 있습니다. 포크, 수정, 내부 배포, 상업적 활용 모두 자유롭게 가능한 진짜 오픈소스라는 점이 Hacker News 등 기술 커뮤니티에서 특히 높은 평가를 받았습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 이제 막 시작된 서비스인만큼 부족하거나 아쉽게 느껴지는 부분도 존재합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;첫째, &lt;strong&gt;행동 변화가 필요&lt;/strong&gt;합니다. Kanwas가 진가를 발휘하려면 실제로 그 공간에서 일해야 합니다. 노션과 노션 에이전트를 활용하고 있거나, 클로드 코드나 오픈클로 등을 활용해 에이전트를 구축해 둔 상태라면, 기존 방식을 일부 변경하고 적응하는 시간을 개인 또는 팀 단위로 가져야 할 수 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;둘째, &lt;strong&gt;컨텍스트 품질 관리가 필요&lt;/strong&gt;합니다. 팀원들이 자유롭게 작업하다 보면 오래된 정보, 충돌하는 내용, 관련 없는 문서가 쌓이기 시작합니다. Kanwas 팀은 이를 위한 ‘가드너(Gardener)’ 기능을 개발 중이라고 밝혔습니다. 에이전트가 주기적으로 컨텍스트를 순회하며 중복되거나 오래된 내용을 찾아 알려주는 기능인데, 이 기능이 잘 작동하면 컨텍스트 관리 부담이 크게 줄어들 것 같습니다. 개인적으로도 빨리 출시됐으면 하는 기능 중 하나입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;셋째, &lt;strong&gt;비개발자 팀의 온보딩 경험&lt;/strong&gt;입니다. 캔버스 인터페이스 자체는 직관적이지만, 처음에 어디서부터 시작해야 할지 막막할 수 있습니다. ‘일단 뭔가를 채워야 의미가 생기는 도구’라는 특성상, 빈 공간에서 시작하는 첫 경험이 다소 어색합니다. 저도 처음 며칠은 ‘이걸 어떻게 구성해야 하지?’라는 고민이 있었습니다. Kanwas 팀에서도 이를 인지하고 교육 콘텐츠를 준비 중이라고 했는데, 온보딩 경험이 개선되면 진입 장벽이 크게 낮아질 것 같습니다.&lt;/p&gt;&lt;hr&gt;&lt;p style="text-align:justify;"&gt;&amp;lt;참고&amp;gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;a href="https://kanwas.ai"&gt;&lt;u&gt;https://kanwas.ai&lt;/u&gt;&lt;/a&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>AI 오피스: 픽셀 아트로 살아난 2D 월드 제작기</title><link>https://yozm.wishket.com/magazine/detail/3782</link><description>지난 2회차에선 API 비용 폭탄을 맞고, 아키텍처를 통째로 갈아엎었던 눈물겨운 사투를 다뤘는데요.  API 비용 문제를 간신히 수습하고 나니, 곧바로 다른 벽에 부딪혔습니다. 야심 차게 만든 텍스트 로그 화면을 본 지인들의 반응이 생각보다 차가웠거든요. "그래서 이게 끝이야? 그냥 채팅창 보는 느낌인데?" 정곡을 찔렸습니다. 제 눈에는 에이전트들의 심오한 상호작용이 보였지만, 처음 보는 사람에겐 그저 '글자가 올라오는 까만 화면'일 뿐이었죠. 에이전트들이 출근하고, 커피를 마시러 이동하고, 동료와 마주치는 '진짜 공간'이 필요해진 시점이었습니다. 그 순간부터 2D 픽셀 오피스 개발이 시작되었습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3782</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;blockquote&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;[Office AI Town 제작기 3회] 픽셀 아트로 살아난 AI 오피스&lt;/strong&gt;&lt;/h4&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;시리즈 소개&lt;/strong&gt;&lt;span style="color:rgb(49,49,49);"&gt;:&lt;/span&gt; Flutter, Supabase, Gemini LLM을 활용해 1인 개발로 'AI 오피스 시뮬레이션'을 구축한 과정을 총 4회에 걸쳐 공유합니다. 지난 &lt;a href="https://yozm.wishket.com/magazine/detail/3766/"&gt;&lt;u&gt;2회차&lt;/u&gt;&lt;/a&gt;에선 API 비용 폭탄을 맞고, 아키텍처를 통째로 갈아엎었던 눈물겨운 사투를 다뤘는데요. 이번 편에서는 그 딱딱한 텍스트 데이터들에 숨을 불어넣어, 눈에 보이는 2D 픽셀 세계로 옮겨 담았던 과정을 풀어보려 합니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;2회차에서 API 비용 문제를 간신히 수습하고 나니, 곧바로 다른 벽에 부딪혔습니다. 야심 차게 만든 텍스트 로그 화면을 본 지인들의 반응이 생각보다 차가웠거든요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;"음... 그래서 이게 끝이야? 그냥 채팅창 보는 느낌인데?"&lt;/i&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;정곡을 찔렸습니다. 제 눈에는 에이전트들의 심오한 상호작용이 보였지만, 처음 보는 사람에겐 그저 '글자가 올라오는 까만 화면'일 뿐이었죠. 에이전트들이 출근하고, 커피를 마시러 이동하고, 동료와 마주치는 '진짜 공간'이 필요해진 시점이었습니다. 그 순간부터 2D 픽셀 오피스 개발이 시작되었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;미리 요점만 콕 집어보기&lt;/strong&gt;&lt;/h4&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;Bonfire 엔진으로 일군 2D 월드&lt;/strong&gt;: 1인 개발의 구세주, Bonfire 플러그인 덕분에 타일맵부터 길 찾기 로직까지 꽤 그럴싸한 사무실 공간을 만들 수 있었습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;데이터를 '픽셀'로 번역하기&lt;/strong&gt;: 텍스트로만 돌던 에이전트들의 감정을 이모티콘과 조명으로 시각화하니, 비로소 시뮬레이션에 몰입감이 생기더라고요.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;관전자를 넘어선 '신의 손'&lt;/strong&gt;: 지켜보기만 하면 심심하죠. 사용자가 에이전트에게 직접 커피를 건네며 대화 흐름을 비트는 인터랙션 요소를 넣어봤습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3782/1__12_.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;a href="https://office-town.vercel.app/"&gt;&lt;u&gt;데모 사이트&lt;/u&gt;&lt;/a&gt;&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;(*해당 서비스 특성상 PC 환경에서 확인 부탁드립니다. 모바일에서는 기능이 제한되어 있습니다.)&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;오피스에 공간을 만들다: Bonfire와 타일맵 설계&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;Flutter로 2D 게임을 만든다고 하면 대부분 Flame 엔진을 먼저 떠올립니다. 맞습니다, Flame이 기반입니다. 그런데 Flame 단독으로는 타일맵 기반 오피스를 구현하기가 생각보다 번거롭습니다. 타일맵을 로드하고, 장애물 레이어를 분리하고, 캐릭터가 장애물을 피해 목적지까지 이동하는 패스파인딩(Pathfinding)까지 직접 구현하려면 1인 개발 기준으로는 너무 많은 코드를 써야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 선택한 것이 &lt;strong&gt;Bonfire&lt;/strong&gt;입니다. Bonfire는 Flame 위에서 동작하는 RPG 특화 플러그인으로, 타일맵(Tilemap) 로딩·레이어 분리 기반 패스파인딩·충돌 감지를 모두 내장하고 있습니다. 덕분에 저는 "어떻게 길을 찾을 것인가"를 고민하는 대신, "직원(에이전트)이 어디로 이동해야 하는가"에만 집중할 수 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;오피스 맵은 단순한 이미지가 아닙니다. 내부적으로 두 개의 레이어로 구성됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3782/0601-1.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;타일드(Tiled) 맵 에디터로 오피스 레이아웃을 그리고, 각 타일에 &lt;code&gt;walkable&lt;/code&gt; 또는 &lt;code&gt;obstacle&lt;/code&gt; 속성을 지정합니다. Bonfire는 이 데이터를 읽어 A* 알고리즘을 실행합니다. 배치 파이프라인에서 "민준이가 회의실로 이동한다"는 이벤트가 오면, Bonfire가 현재 좌표에서 회의실 의자 좌표까지 최단 경로를 계산하고, 캐릭터는 장애물을 피해 뽈뽈거리며 걷기 시작합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;참고로 A* 알고리즘은 게임 개발에서 가장 흔하게 쓰이는 길 찾기 알고리즘입니다. 목적지에 도착하면 다음 동작으로 자연스럽게 전환됩니다. 캐릭터가 벽에 끼는 예외 상황에는 텔레포트(Teleport) 폴백(Fallback) 로직이 동작해서 시뮬레이션이 멈추지 않게 안전망을 마련했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;픽셀 좌표로 오피스 공간 설계하기&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;오피스 안의 모든 위치는 픽셀 좌표로 관리됩니다. 타일 하나의 크기는 16×16픽셀이고, 각 시설물(책상, 정수기, 휴게실 소파, 출구 등)은 고유한 좌표 값을 가집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이벤트가 발생하면 캐릭터는 지정된 좌표로 뽈뽈거리며 움직입니다. 가령 '이서연이 팀장에게 말을 건다'는 이벤트가 오면, 서연이 캐릭터가 먼저 팀장님 책상 앞으로 이동하는 식이죠. 좌표 기반으로 움직이니 캐릭터끼리 겹치는 일도 없고, "팀장님이 왜 책상 위로 걸어 다니지?" 같은 버그들도 레이어 설정만 잘해주면 금방 잡히더라고요. 2D 화면은 그 자체로 훌륭한 디버깅 툴이 되어줬습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기까지 보시고 "아니, 이 사람 게임 개발 전문가 아냐?"라고 오해하실지도 모르겠습니다. 하지만 전 게임 개발의 'ㄱ' 자도 모르는 평범한 비개발자입니다. 앞에서 아는 척하며 설명했던 A* 알고리즘이니, Bonfire 플러그인이니 하는 것들도 사실 AI(Claude)와 씨름하며 그때그때 배운 것들입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이게 바로 AI와 작업하며 느끼는 묘미 아닐까 싶습니다. 전혀 모르는 미지의 영역이라도 AI에게 맥락만 잘 설명해 주면, 함께 문제를 풀어나가면서 저절로 공부가 되더라고요. "난 개발을 모르니까 못 해"라는 장벽이 AI라는 파트너 덕분에 슥 허물어지는 경험, 이건 정말 직접 해보지 않으면 모를 희열입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;혹시 저처럼 게임 개발 경험은 없지만 나만의 시뮬레이션 월드를 만들어보고 싶은 분들을 위해, 제가 실제 맵 디자인과 좌표 설계를 요청할 때 유용했던 프롬프트 예시를 공유합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;"나는 비개발자고 Flutter Bonfire로 2D 시뮬레이션을 만들고 있어. 지금 가장 큰 고민은 에이전트들이 장애물을 자연스럽게 피해서 특정 좌표로 이동하게 만드는 거야. 무작정 코드를 짜주지 말고, 아래 순서대로 답변해 줘."&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;1. 레이어 설계: Tiled 에디터에서 '충돌 레이어'를 어떻게 설정해야 Bonfire가 벽으로 인식하는지 가장 확실한 가이드를 줘.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;2. 이동 로직: 캐릭터가 대각선으로 이동하거나 벽에 끼지 않게 하고 싶어.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;3. 코드 구현: 16x16 타일 기반에서 특정 좌표(예: x:160, y:112)로 부드럽게 이동(moveTo)시키는 Dart 코드를 작성해 줘. 이때 목적지에 도착했는지 감지하는 콜백 함수도 포함해야 해.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;예외 처리: 만약 경로가 막혀서 이동에 실패하면 다시 시도하거나 텔레포트 하는 '안전망' 코드도 같이 짜줘.&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;오피스의 타일 스타일과 색, 원하는 가구의 느낌과 배치 구도를 설명해주면 됩니다. 꽤 상세하게 설명해야 합니다. 그러면 그에 맞춰서 타일맵을 만들어줍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그리고 나서는 2D 캐릭터 이미지를 준비해야 하는데요. 무료 에셋을 제공하는 사이트도 있고 Gemini를 활용해서 만들어 달라고 하면 적당한 퀄리티로 만들어줍니다. AI가 할 수 있는 것들이 점점 더 많아짐에 따라 이미지도 손쉽게 만들어주기 때문에 생산성 향상이 극대화되고 있는 것 같습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;AI 감정을 픽셀에 담다: 감정 시각화와 시간대별 오피스&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;배치 파이프라인에서 이벤트 데이터가 화면에 도달하면, 텍스트만 표시되는 게 아닙니다. 직원(에이전트)의 상태가 실시간으로 픽셀에 반영됩니다. 2D 월드가 '현장감'을 준다면, 직원(에이전트) 대시보드는 에이전트들의 스탯 상태를 직관적으로 보여주는 역할을 합니다.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3782/2__5_.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;캐릭터 머리 위의 감정 게이지&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;각 직원(에이전트) 캐릭터 위에는 세 가지 정보가 실시간으로 표시됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3782/0601-2.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;스트레스 수치가 높을 때 캐릭터 표현이 달라집니다. 60% 이상부터 이모티콘이 나타나고, 80%를 초과하면 빨간 게이지와 함께 이모티콘이 표시됩니다. 생산성이 낮아지는 것도 스탯 패널에 수치로 반영됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;로맨스 이벤트가 발생하면 해당 직원(에이전트) 주변에 하트 이펙트가 잠깐 등장합니다. 귓속말(WS) 이벤트는 특별합니다. 타겟 직원(에이전트) 근처로 이동해서 귓속말 이모티콘을 띄우고, 대시보드에는 내용이 표시되지만 2D 화면에서는 작은 아이콘만 나옵니다. "저 둘이 뭔가 수군거리는데..." 하는 느낌을 의도한 연출이었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;시간이 흐르면 오피스가 달라진다&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;하루 시간(오전·점심·오후·저녁·밤)이 흐르면서 오피스의 시각적 분위기도 함께 바뀝니다. 단순히 시간 표시가 바뀌는 게 아닙니다. 오피스 조명 자체가 달라집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3782/0601-3.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 조명 변화는 Flame의 컬러 필터(Color Filter)를 오버레이(Overlay)로 덮어씌워 구현했습니다. 교시가 전환될 때 약 2초에 걸쳐 부드럽게 페이드(Fade) 전환됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;퇴근: 오피스가 비워지는 시간&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;저녁 시간이 끝나면 직원(에이전트)들은 퇴근 루틴을 시작합니다. 하나씩 exit 좌표를 향해 이동하고, 출구 타일에 닿는 순간 캐릭터가 화면에서 사라집니다. 단, 스트레스가 85% 이상이거나 생산성이 기준치에 미달인 직원(에이전트)에게는 팀장 캐릭터가 가까이 이동한 뒤, 야근 통보 이벤트가 트리거될 수 있습니다. 그러면 그 직원(에이전트)은 퇴근하지 못하고 다시 자기 자리로 돌아갑니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;퇴근 후 야근 중인 직원(에이전트)만 남으면 조명은 야근 모드로 전환됩니다. 텅 빈 오피스에 한두 명만 남아 책상 램프 아래서 일하는 그 장면이 꽤 쓸쓸하게 연출됩니다. 그 순간 사용자는 자연스럽게 이런 생각을 하게 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;i&gt;"저 사람한테 뭔가 해줄 수 없을까."&lt;/i&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이게 바로 다음 기능으로 확장을 생각하게 된 계기가 되었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;신의 손: 사용자가 세계에 개입하는 순간&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;Office AI Town의 핵심 재미 중 하나는 사용자가 시뮬레이션을 구경만 하는 게 아니라는 점입니다. 직접 개입할 수 있습니다. 2D 화면에서 직원(에이전트) 캐릭터를 탭하면 &lt;strong&gt;개입 모드(Intervention Mode)&lt;/strong&gt;가 열립니다. 이 화면에서 사용자는 세 가지 행동을 선택할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3782/0601-4.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이 수치 변화는 즉시 2D 화면에 반영됩니다. 커피를 받은 직원(에이전트) 캐릭터는 잠깐 커피 이모티콘을 머리 위에 띄우고, 스트레스 게이지가 눈에 띄게 줄어드는 것을 사용자가 직접 확인할 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기서 그치지 않습니다. 다음 배치 호출 시 이 변경된 스탯이 LLM에 전달됩니다. 스트레스가 낮아진 직원(에이전트)는 이전보다 더 밝은 말투로 대화하게 됩니다. 사용자의 행동이 실제로 이 세계의 서사에 영향력을 행사하게 되는 것이죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;개입은 왜 재미있을까?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;시뮬레이션을 만들면서 가장 크게 배운 것이 있습니다. 사람들은 구경보다 적절히 개입했을 때 훨씬 더 강한 몰입감을 느낀다는 것입니다. 심즈(The Sims)가 20년 넘게 사랑받는 이유, 타이쿤(Tycoon) 류 게임이 식지 않는 이유가 바로 이것입니다. "저 캐릭터에게 내가 무언가를 했더니 세상이 바뀌었다"는 경험. 이것이 단순 관찰 앱과 시뮬레이션 게임을 가르는 경계선입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Office AI Town에서 사용자가 커피를 건네는 행위는 게임 점수를 올리는 것이 아닙니다. "저 직원(에이전트)이 오늘 너무 힘들어 보여서"라는 감정적 동기에서 나오는 행동입니다. 그 결과가 실제로 오피스의 분위기를 바꾼다는 것을 사용자가 눈으로 확인하는 순간, 이 세계는 단순한 앱이 아닌 내가 책임져야 할 공간이 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;픽셀 하나가 만드는 차이&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;텍스트 로그와 2D 픽셀 오피스는 같은 데이터를 보여주지만, 사용자가 받는 느낌은 완전히 다릅니다. 텍스트만 있었다면 이 프로젝트는 절반의 완성이었을 것입니다. 직원(에이전트) 캐릭터가 "팀장님, 오늘도 야근인가요"라는 텍스트를 출력하는 것과, 그 캐릭터가 스트레스 게이지를 머리 위에 달고 야근 조명이 켜진 오피스 안에서 팀장 책상 앞까지 걸어가서 말풍선을 띄우는 건 전혀 다른 경험이죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;2D 픽셀이 AI 시뮬레이션에 생명력을 불어넣습니다. 그리고 그 생명력 위에 사용자가 개입할 수 있는 손(Hand of God)을 얹었을 때, 비로소 이 오피스는 살아있는 공간이 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이제 이 오피스를 세상에 공개할 차례입니다. 4회차에서는 수익화 고민, 타인의 오피스를 구경하는 공유 시스템, 그리고 개발의 솔직한 회고들을 이야기해 보겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;4회에서 계속됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>AX의 어려움은 전 직원이 AI를 쓴 이후부터 시작된다</title><link>https://yozm.wishket.com/magazine/detail/3781</link><description>요즘 어딜 가나 AI와 AX 이야기를 합니다. 그런데 막상 "전사가 AI를 잘 쓰게 만든다"는 건, 들여다볼수록 쉽지 않은 일이었습니다. 저는 AI 전문가는 아니지만, 기술자였다가 조직문화와 일하는 법을 담당하게 된 사람으로서 최근에는 전사 AX라는, 정해진 답이 없는 영역을 맡게 되었습니다. 이 글에서는 AI라는 바다를 향해 수많은 구성원들이 배를 띄우고 잘 나아가게 만드는 여정을 정리해 봤습니다. 멋있는 프레임이 아니라, 실제로 우리에게 일어난 일과 일어날 일을 4개 페이즈로 알아보겠습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3781</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;국내 유명 IT 기업은 한국을 넘어 세계를 무대로 할 정도로 뛰어난 기술과 아이디어를 자랑합니다. 이들은 기업 블로그를 통해 이러한 정보를 공개하고 있습니다. 요즘IT는 각 기업의 특색 있고 유익한 콘텐츠를 소개하는 시리즈를 준비했습니다. 이들은 어떻게 사고하고, 어떤 방식으로 일하는 걸까요? 이번 글에서는 성형수술 및 피부 시술 정보 제공 플랫폼 ‘강남언니’가 조직 내 AX를 어떻게 적용해 나가고 있는지, 그 과정과 고민을 소개합니다.&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;blockquote&gt;&lt;h4 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;아무도 가보지 않은 바다를 항해하기 위한 AX PHASE 별 주요 질문들&lt;/strong&gt;&lt;/h4&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3781/11687_png-1080w.webp"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;요즘 어딜 가나 AI와 AX 이야기를 합니다. 그런데 막상 "&lt;strong&gt;전사가 AI를 잘 쓰게 만든다&lt;/strong&gt;"는 건, 들여다볼수록 쉽지 않은 일이었습니다. 저는 AI 전문가는 아니지만, 기술자였다가 조직문화와 일하는 법을 담당하게 된 사람으로서 최근에는 &lt;strong&gt;전사 AX&lt;/strong&gt;라는, 정해진 답이 없는 영역을 맡게 되었습니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이 글에서는 AI라는 바다를 향해 수많은 구성원들이 배를 띄우고 잘 나아가게 만드는 여정을 정리해 봤습니다. 멋있는 프레임이 아니라, 실제로 우리에게 일어난 일과 일어날 일을 4개 페이즈로 알아보겠습니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;Phase 0. 항구 - 경영진의 인식과 인프라&lt;/strong&gt;&lt;/h3&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이 단계가 왜 0번이냐 하면, &lt;strong&gt;여기서 막히면 시작조차 안 되기 때문&lt;/strong&gt;입니다. AX는 결국 비용과 권한을 고민하고 결정하고, 결과적으로 문화를 바꿔 가는 일입니다. 누군가는 "이 도구를 회삿돈으로 결제해도 된다"라고 말해줘야 하고, 누군가는 "이 데이터에 AI를 붙여도 된다"라고 결정해 줘야 합니다. &lt;strong&gt;이게 안 풀린 회사에서 실무자가 아무리 똑똑해도 AX는 돌아가지 않습니다.&lt;/strong&gt;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;우리가 Phase 0에서 한 건 거창하지 않았습니다.&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;경영진이 "AI는 비용이 아니라 투자"라고 공식적으로 인정해주기&lt;/li&gt;&lt;li style="text-align:justify;"&gt;직군 가리지 않고 &lt;strong&gt;AI 도구 사용 비용을 회사가 지원&lt;/strong&gt;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;AI 안전성과 비용을 모니터링하는 &lt;strong&gt;최소한의 플랫폼&lt;/strong&gt;을 깔고 운영할 책임자 지정/모시기&lt;/li&gt;&lt;/ul&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이 세 가지가 깔리면, 그 다음부터는 사람이 알아서 움직입니다. 요점은 "&lt;strong&gt;완벽한 인프라&lt;/strong&gt;"가 아니라 "&lt;strong&gt;움직여도 된다는 신호&lt;/strong&gt;"예요.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;Phase 1. “바다로 가보시죠!” - 동경을 만드는 단계&lt;/strong&gt;&lt;/h3&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;사람들에게 배 만드는 법을 가르치고 싶으면, 배 만드는 매뉴얼을 들이밀지 말고 &lt;strong&gt;바다를 동경하게 하라&lt;/strong&gt;.&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;저희는 이 유명한 문구를 기반으로 움직였습니다. AI 나 LLM 지식 설명이 아니라, 우리가 왜 움직여야 하며 그 바다 너머에는 어떤 멋진 세상(?)이 있는지 보여드린 거죠.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3781/8da277b1-6ac1-4799-9c0c-0e8e6c0d5767_png-1200w.jpg"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;LLM이 뭔지 설명하는 대신, &lt;strong&gt;"이 도구로 내 일이 이렇게 바뀌었다"&lt;/strong&gt;를 보여줬습니다. 예를 들면, 제가 스케줄정리, 인터뷰 스크립트 기반 면접 결론 정리 등을 어떤 지침을 가지고 하는지 결과물을 보여드렸습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;AI 해커톤도 열었습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;그 다음에 가장 효과가 컸던 건 "&lt;strong&gt;저 사람도 하고 있다&lt;/strong&gt;" 시리즈입니다. 일부러 제가 (개발 지식도 있고 이런 도구가 어려워도 혼자 공부해서 잘 쓸 것 같은 사람) 아닌, 비개발 직군 동료가 AI를 가지고 만든 결과물을 끌어 올려 공유했습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;대표적인 두 사례를 소개합니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;사례 1. HR 동료의 인터뷰 스케줄링 자동화 서비스&lt;/strong&gt;&lt;/h4&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;컴퓨터를 전공했지만 "코딩하기 싫어서" HR로 온 동료가 있습니다. 그분이 어느 날 &lt;strong&gt;AI 코딩 도구로 사내 캘린더와 연동되는 면접 스케줄링 도구&lt;/strong&gt;를 직접 만들었습니다. 면접관 3명이 모두 비는 시간 + 그때 비어 있는 회의실을 알아서 찾아주는 도구입니다. 원래 1시간씩 걸리던 일정 잡기가 5분 안에 끝나기 시작했습니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;사례 2. 디자이너가 만든 제품 스크린샷 크롬 익스텐션&lt;/strong&gt;&lt;/h4&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;사용자 매뉴얼을 만들 때 임시 텍스트와 버튼을 일일이 보정하는 일이 너무 귀찮았던 디자이너가 &lt;strong&gt;웹페이지의 임시 요소를 깔끔하게 정리해서 스크린샷을 만드는 크롬 익스텐션&lt;/strong&gt;을 직접 만들었습니다. 본인 편하려고 만든 건데, 공유하자마자 사내 여러 팀들이 해당 익스텐션을 가져갔습니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이런 사례들이 켜켜이 쌓이면서 분위기가 확실히 바뀌었습니다. &lt;strong&gt;"쟤도 했다 = 나도 할 수 있겠다"&lt;/strong&gt;의 문법은 어떤 교육보다 강력합니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;Phase 2. "가는 건 좋은데 조금만 살살.." - 가두리(Harness)의 단계&lt;/strong&gt;&lt;/h3&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이 단계가 진짜로 시작되는 건, 이상하게도 &lt;strong&gt;Phase 1이 '너무 잘 되기 시작한 직후'&lt;/strong&gt;입니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;사람들이 하나둘 직접 만들기 시작하면 다음 풍경이 펼쳐집니다.&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;어디선가 "저 이거 만들고 싶은데 admin 권한 좀…, api key 좀..."이라는 요청이 쏟아지기 시작합니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;또 어떤 분은 "&lt;strong&gt;작은 스크립트면 충분한 일&lt;/strong&gt;"인데 "&lt;strong&gt;웹서비스 호스팅이 필요해요&lt;/strong&gt;"라고 옵니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;그리고 어디선가 &lt;strong&gt;AI 비용&lt;/strong&gt;이 야금야금 튀기 시작합니다.&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3781/401925e2-b456-4972-9edf-32afc97ddf90_png-1200w.jpg"&gt;&lt;figcaption&gt;혼란스러운 항해&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이 단계에서 우리가 배운 건 명확합니다. &lt;strong&gt;자유는 가드레일이 있을 때만 가속됩니다.&lt;/strong&gt;회사 문화 설명할 때도 자주 설명하는 “적절한 조율 속에서의 극도의 자율” 같은 개념인 거죠. 이것도 결국 큰 차원에서 요즘 이야기하는 “&lt;strong&gt;하네스(Harness)&lt;/strong&gt;”의 일종이라고 생각했습니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;(참고로 저희는 가두리라는 표현을 자주 씁니다. 적절한 가두리를 만들고 그 안에서 마음껏 날뛰게 하자!)&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3781/11687_png-1080w.webp"&gt;&lt;figcaption&gt;가두리가 잘 쳐진 항로&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;그래서 우리는 ‘AI Foundation’이라는 조직도 만들고, 여러 운영 장치를 붙이기 시작했습니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ol&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;권한/보안 가드레일:&lt;/strong&gt; "정말 필요한가? 어디까지 필요한가?"를 묻는 절차. 최소권한 원칙 위에서 실험을 허용.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;AI 비용 가시화:&lt;/strong&gt; 누가 얼마나 쓰는지 보이게 만들고, 통제가 아니라 &lt;strong&gt;자기 인식&lt;/strong&gt;의 도구로 사용.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;프로덕티파이(Productify) 스킬 가이드:&lt;/strong&gt; 동료들의 문제를 듣고, 호스팅·인프라까지 갈 일인지, 사실 "스크립트 한 개"면 끝나는 일인지 함께 판단해 주는 claude/notion 용 스킬. 가장 가벼운 &lt;strong&gt;MVP를 찾아주는 작업&lt;/strong&gt;입니다. (혹시 관심 있을 분들을 위해 퍼블릭 &lt;a href="https://github.com/kimyoon21/brown-claude-marketplace"&gt;깃헙 링크&lt;/a&gt;로 올려봅니다)&lt;/li&gt;&lt;/ol&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;그리고 또 한 가지, 전사에 이러한 것들이 잘 퍼지게 만들기 위한 키 액션이 따로 있습니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;한 사람이 전사 AI를 가르칠 수 없다 - 준전문가 양성&lt;/strong&gt;&lt;/h4&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;AI Foundation 라는 팀은 AX 영역에서 많은 기준과 BP들을 만들고, 직접 AI를 활용하는 제품을 만들어서 제공하기도 하고, 전사 교육 등도 하고 있습니다. 하지만 단순히 한 사람, 한 팀이 모든 일하는 방법의 변화를 뿌리내리긴 어렵죠.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;예를 들자면, “엑셀 잘 쓰는 법”을 한 회사에서 한 사람이 강의하지 않습니다. 팀 곳곳에 엑셀 숙련자들이 존재해서 팀의 여러 가지 문제를 해결해주곤 하죠. &lt;strong&gt;제가 보기에 AI는 이미 엑셀과 비슷한 위치로 가고 있습니다.&lt;/strong&gt; 한 명의 전문가가 모두를 가르치는 모델은 곧 작동하지 않게 됩니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;그래서 우리는 각 팀에 &lt;strong&gt;에이블러(A.I.bler)&lt;/strong&gt;라고 부르는 '준전문가'를 만듭니다. ("AI로 일이 되게 한다"라는 의미를 담은) 그 팀에서 가장 호기심 많고 새 도구를 빨리 받아들이는 사람을 골라, &lt;strong&gt;그 팀의 문제를 함께 풀어주는 파트너로 일정 기간 함께 일합니다.&lt;/strong&gt;목표는 &lt;strong&gt;그 사람을 키우는 것이 아니라, 그 사람이 자기 팀에 다시 돌아갔을 때 "이거 AI로 어떻게 해?"라는 질문에 답할 수 있는 사람이 되는 것&lt;/strong&gt;입니다. 이게 반복되면 어느 시점부터 중앙팀(AI Foundation)이 &lt;strong&gt;하지 않아도&lt;/strong&gt; 자생적으로 굴러가기 시작합니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;Phase 3. “우리만의 위대한 항로를 찾아” - 표준을 정하고 문화를 만들기&lt;/strong&gt;&lt;/h3&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3781/5f86c967-4700-4cef-b085-54e3a5d84536_png-1200w.jpg"&gt;&lt;figcaption&gt;항해하며 지도 그리기&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;여기서부터는 "도구"가 아니라 &lt;strong&gt;"일하는 방식", 즉 문화의 문제&lt;/strong&gt;입니다. 솔직히 저희도 이제 막 고민이 시작된 미래의 영역입니다. 그래서 답보다 질문이 더 많습니다. 다만 이 질문을 &lt;strong&gt;회피하지 않는 회사가 결국 살아남는다&lt;/strong&gt;고 보고 있습니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;1) 100점짜리 표준은 없다, 그러니 빠르게 자율 실행하면서도 적절한 탑다운 의사결정이 필요하다&lt;/strong&gt;&lt;/h4&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;AI 시대는 인류 역사에 없는 변화의 속도를 맞이하고 있습니다. 어제 100점이던 표준이 오늘 80점이 됩니다. 모델이 바뀌고, OpenAI나 Anthropic 업데이트 한방에 궤도가 달라집니다. 그래서 우리는 지나치게 &lt;strong&gt;고정된 표준&lt;/strong&gt;을 만들지 않으려고 합니다. 대신 &lt;strong&gt;빠르게 합의하고, 빠르게 갈아엎는 합의 운영 체계&lt;/strong&gt;를 만듭니다. 이건 "정답이 없는 환경에서 어떻게 여러 사람이 실험적 시도를 빠르게 해보고, 그 안에서 조직 내 최적화된 방식을 어떻게 결정하지?"의 문제입니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;예를 들어볼까요? 요즘 LLM Wiki 등, 조직 지식체계 구축이 ai agent 잘 쓰는 기반 중 하나로 화두입니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;에이전트가 자동으로 코드/문서를 만드는 시대&lt;/strong&gt;가 오면서, 회사 내부의 맥락: &lt;strong&gt;위키·용어집·서비스 정의서&lt;/strong&gt; 같은 '조직 코어 자산'이 진짜로 중요해집니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이를 어떤 식으로 수집/가공할지, 또 어떻게 활용할지 등은 모든 회사의 고민이고, 모든 팀의 고민입니다. 시작할 때는 대항해시대 마냥 자율적이고 바텀업으로 여러 시도를 장려하지만, 시간이 갈수록 팀 간의 합의와 전사적 방향성이 있어야 더 유의미해짐을 깨닫고 있습니다. 그래서 바텀업의 빠른 실행 &amp;amp; 탑다운의 적정 레이어까지 의사결정과 합의 도출이 더 핵심이 될 듯합니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;지난 시간 동안 한번도 이 정도 수준으로 기술이 빠르게 발전하면서, 일하는 방법론까지 분기, 반기 단위로 고민하게 한 적은 없다고 생각합니다. 결국 여러 팀, 여러 개발 조직, 여러 사업 내에서 어떻게 AI를 가지고 함께 일하지?라는 &lt;strong&gt;조직 다이내믹스의 문제&lt;/strong&gt;입니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;2) 각자의 전문 영역의 선을 어디까지 넘을 것인가?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;“오늘도 개발자가 안 된다고 말했다” 같은 제목의 책도 있었습니다. 이제는 반대가 되었습니다. “오늘도 디자이너가 ‘이거 AI로 하니까 되던데요.’라고 말했다”&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이건 직무 전문성의 위협이라기보다는 &lt;strong&gt;새로운 협업 문법&lt;/strong&gt;의 시작입니다. 기존 애자일이 "전문가들이 모여 각자의 영역을 존중하며, &lt;strong&gt;함께 만든다&lt;/strong&gt;"였다면, 다음 시대의 협업은 &lt;strong&gt;"각자 영역을 슬쩍 넘나들면서 책임은 분명히 나누는 것"&lt;/strong&gt;에 가깝달까요.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;개발자는 안 된다 했는데 AI는 된다고 하는 경우, 프론트 개발자가 빠트린 것을 백엔드 개발자가 쉽게 코딩으로 커버하는 경우 등이 비일비재하게 생기기도 합니다. 그리고 어떤 영역은 점점 사람이 하지 않게 되는 경우들도 생기죠. “각자가 어떤 수준으로 선을 넘으면서도 존중하고, 어떤 타입의 책임을 나눠 가지며, 어떤 대화를 나누면서 협업 가치를 높여야 할지” 등을 고민하며, 문화적 가이드를 제시해야 할 겁니다. (디자이너분이 AI로 인해 빠른 해결과 부가가치의 제한에 대한 고민을 쓴 &lt;a href="https://blog.gangnamunni.com/post/ai-discovery-collaboration"&gt;글&lt;/a&gt;도 있었어요.)&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;물론 이 과정에서 팀의 구성 자체도 달라질 거란 이야기는 이미 많이들 하고 있고요.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;3) 그래서 우리는 누구를 영입해야 할까?&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;자기 영역의 전문성&lt;/strong&gt;은 여전히 필요합니다. 다만, &lt;strong&gt;자기 영역에 갇히지 않는 사람&lt;/strong&gt;의 가치가 빠르게 올라가고 있습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;"AI를 다룰 줄 안다"는 점점 자격증이 아니게 됩니다. 진짜 차이는 &lt;strong&gt;자기 문제를 정의하는 능력과&lt;/strong&gt; &lt;strong&gt;틀려도 빠르게 다시 시도하는 태도&lt;/strong&gt;에서 나옵니다. AI도 처음엔 맥락 모르는 천재 바보였다가 끊임없는 피드백으로 자가발전 하듯이요.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;저는 요즘 지식이 아닌 지혜를 가진 사람이라고도 표현하는데, 결국 철학과 논리를 코어로 가지고, 쉽게 지식을 습득가능한 세상에서 다채로운 문제를 본질부터 풀어나가는 사람 = 지혜로운 사람들이 필요하다고 생각합니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;여러분의 회사는 앞으로의 시대에 어떤 사람들, 어떤 기준이 인재를 영입하는 데 있어 중요하다고 생각하시나요?&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;마치며: 왜 우리는 이 바다로 가야 하지?&lt;/strong&gt;&lt;/h3&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;우리도 아직 항해 중입니다. 다만 분명한 건, &lt;strong&gt;이 바다는 잠잠해지지 않는다는 사실&lt;/strong&gt;입니다. 그래서 우리는 가능한 한 빨리, 그러나 가능한 한 다 같이 나가보려 합니다. 이런 과정을 통해서, AI에게 많은 영역을 위임하고 싶습니다. 그렇게 얻은 시간을 각자가 더 깊은 문제, 본질적으로 고민해서 더 큰 임팩트, 더 위대한 여정에 집중한다면, 똑같은 구성원 규모로도 빠르게 미션을 향해 나아갈 수 있을거라 생각합니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&lt;i&gt;배는 항구에 정박해 있을 때 가장 안전하지만, 그것이 배의 목적은 아니다&lt;/i&gt;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;이 말처럼 한 치 앞도 모르는 하지만 반드시 뛰어들어서 적응하고 넘어가야 하는, 이 파도치는 바다로 함께 항해하다 보면 지금보다 조금씩은 답을 향해 나아갈 거라 믿습니다. 이 글이 비슷한 항해를 시작하려는 누군가에게 작은 해도(海圖)가 되었으면 좋겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3781/70d4bcac-35b1-49db-bb7d-f409f16c1b6b_png-1200w.jpg"&gt;&lt;/figure&gt;&lt;hr&gt;&lt;p style="margin-left:0px;"&gt;&amp;lt;원문&amp;gt;&lt;/p&gt;&lt;p&gt;&lt;a href="https://blog.gangnamunni.com/post/ax-voyage-2026"&gt;AX의 어려움은 전직원이 AI를 쓰고난 이후부터 진짜 시작된다&lt;/a&gt;&lt;br&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>Opus 4.8 등장: 클로드는 빼앗긴 주도권을 찾아올까?</title><link>https://yozm.wishket.com/magazine/detail/3780</link><description>Opus 4.8이 나왔습니다. 4.7이 나온지 42일만이죠. 전에 없던 빠른 업그레이드입니다. GPT-5.5와 Codex에 주도권을 내준 한 달, 클로드의 반격 턴이죠. 가격은 그대로 둔 채 코딩·장기 에이전트 벤치마크를 끌어올렸고, 핵심으로 내세운 건 '정직성'입니다. 같은 날 클로드 코드는 스스로 수십~수백 개 에이전트를 지휘하는 workflow를 공개했고요. 공식 문서와 커뮤니티 반응을 따라가며, 마지막으로 미토스(Mythos) 현황까지 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3780</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p&gt;Opus 4.8이 나왔습니다. 4.7이 나온지 42일만이죠. 전에 없던 빠른 업그레이드입니다. 그 한 달 사이, GPT-5.5와 코덱스는 시장의 평가를 모조리 바꿔버렸지만요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이제 클로드의 반격 턴입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3780/www-cdn_anthropic__1_.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Anthropic&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;[핵심 관전 포인트]&lt;/strong&gt;&lt;/p&gt;&lt;ol&gt;&lt;li&gt;Opus 4.8 출시: 클로드의 프론티어 모델이 42일 만에 바뀌었습니다&lt;/li&gt;&lt;li&gt;핵심 특징은 “정직성”. 쉽게 말하면 전보다 더 근거 없이 주장하지 않고, 성급하게 결론 내리지 않는데다, 모르는 걸 모른다고 말합니다.&lt;/li&gt;&lt;li&gt;코딩 능력과 장기 에이전트 벤치마크에서 GPT 5.5보다 앞서가죠. 비용은 4.7과 같습니다. 프로, 비즈니스, 엔터프라이즈 플랜에서 바로 쓸 수 있습니다.&lt;/li&gt;&lt;li&gt;같은 날, 클로드 코드는 “목표를 달성하기 위해 스스로 에이전트를 설계하고 지휘하는” workflow 기능까지 업데이트합니다.&lt;/li&gt;&lt;/ol&gt;&lt;hr&gt;&lt;h3&gt;&lt;strong&gt;Opus 4.8&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;우선 공식 문서 &lt;a href="https://www.anthropic.com/news/claude-opus-4-8"&gt;&lt;u&gt;Introducing Claude Opus 4.8&lt;/u&gt;&lt;/a&gt; 기반으로 차근차근 변화를 보겠습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&lt;i&gt;“Anthropic's most capable general-access model to date”&lt;/i&gt;, 즉 &lt;strong&gt;지금까지 앤트로픽이 일반에 공개한 모델 중 가장 유능한 모델&lt;/strong&gt;이라고 소개됩니다. &lt;span style="color:#999999;"&gt;(아직 공개하지 않았지만, 최고로 좋다고 알려진 미토스(mythos)가 있어 ‘일반에 공개된’이라는 부연 설명이 붙었네요.)&lt;/span&gt;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;모델 스펙 표&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;알아두면 좋을 주요 스펙, 컨텍스트와 가격, 출력과 채널 등은 아래 표로 정리했습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3780/opus48-spec-landscape.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;일단 프로+, 비즈니스, 엔터프라이즈 플랜을 쓰는 사용자 대상입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;적응형 사고와 Effort 5단계&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;스펙 표에 들어가지 않는 변화들도 있습니다. 가장 큰 건 클로드에게 “어느 정도 깊이 생각할 지” 시키는 방법이 조금 바뀌었습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이제 사람이 그 깊이의 “단계”를 골라줄 effort 설정에서 이를 결정합니다. low, medium, high, xhigh, max까지 다섯 단계가 있으며 기본값은 high입니다. 코딩이나 에이전트처럼 길게 파고드는 작업이라면 한 칸 위인 ‘xhigh’부터 시작하라고 공식 문서가 권합니다. 기존에는 ‘쓰는 토큰 예산’을 직접 잡아주는 방식이었는데, 이제는 이렇게 단계로만 통제할 수 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그와 함께 claude.ai 앱에도 모델 선택 옆에 응답을 얼마나 깊이 고민할지 고르는 버튼이 새로 생겼으니, 이를 자주 쓰는 분들은 그 설정을 반드시 써보면 좋겠습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3780/%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA_2026-05-29_%E1%84%8B%E1%85%A9%E1%84%8C%E1%85%A5%E1%86%AB_11_39_09.png"&gt;&lt;figcaption&gt;클로드 데스크톱 앱 &amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;한편 적응형 사고&lt;span style="color:#757575;"&gt;(adaptive thinking)&lt;/span&gt;도 도입됩니다. 쉬운 질문이면 곧장 답하고 어려운 문제면 더 오래 고민하는 식으로, 생각의 양을 모델이 알아서 정하는 방식이죠. 마찬가지로 On/off 할 수 있습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;Opus 4.8 관전 포인트 3가지&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;1. 역대 가장 빠른 업그레이드에 가격은 그대로?&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;4.7에서 4.8이 나오기까지 걸린 시간이 42일입니다. 이례적입니다. 대략 70일 정도 걸리던 모델 업데이트 기간을 무려 30일 가량이나 앞당겼죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3780/cadence-landscape.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;아무래도 GPT-5.5가 Opus 4.7보다 훨씬 좋다, 라는 말이 시장에 퍼졌기 때문일 겁니다. 이처럼 빠른 업데이트를 위해 ‘4.7을 기반으로’ 전반에 걸친 개선사항을 적용했다고 합니다. 반면 가격은 똑같으니까요. 일종의 ‘마이너 업데이트’에 가깝습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;물론 구독제를 쓸 때, 토큰 속도가 얼마나 빨리 다는지는 더 지켜봐야 합니다. 사이먼 윌리슨&lt;span style="color:#757575;"&gt;(Simon Willison)&lt;/span&gt;이 effort 5단계&lt;span style="color:#757575;"&gt;(low부터 max까지)&lt;/span&gt;를 돌려보니, 최고 단계인 ‘max’가 품질은 가장 좋았는데, SVG 한 장 만드는 데 43센트가 들었다고 합니다. 비용 표는 그대로여도, ultracode나 max effort를 상시 켜두면 실제 토큰 속도는 빠르게 달 수도 있습니다.&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;2. 벤치마크 대결&lt;/strong&gt;&lt;/h4&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3780/www-cdn_anthropic.png"&gt;&lt;figcaption&gt;&amp;lt;출처: Anthropic&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;모델 성능을 평가하는 벤치마크에서는 모든 범위에서 Opus 4.7보다 앞서고 있습니다. 그 와중에도 가장 크게 개선한 건 Terminal Bench 2.1입니다. 무려 8.5%를 끌어올렸죠. 이 벤치마크는 “터미널(셸/CLI) 환경에서 AI 에이전트가 실제 작업을 끝까지 해내는지 보는 벤치마크”로, GPT가 크게 앞서던 분야입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;여전히 GPT-5.5가 1위를 지키고 있지만, 그 수준을 정말 많이 끌어올렸습니다. 그 외 소폭 뒤지고 있던 지식 작업&lt;span style="color:#757575;"&gt;(GDPval-AA)&lt;/span&gt;, 재무 분석&lt;span style="color:#757575;"&gt;(Finance Agent v2)&lt;/span&gt; 벤치마크도 모두 뛰어넘었습니다. 한편 원래는 훨씬 길었던 벤치마크 리스트를 “에이전트 작업”에 최적화된 것들로만 남긴 것도 눈에 띄네요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;3. ‘정직성’이라는 무게중심&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;이번 모델에서 앤트로픽이 전면에 내세운 가장 핵심은 정직성&lt;span style="color:#757575;"&gt;(Honesty)&lt;/span&gt;입니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p&gt;자신이 작성한 코드의 결함을 지적 없이 통과시킬 가능성이 직전 모델보다 약 4배 낮다&lt;/p&gt;&lt;p&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;Opus 4.8 is around four times less likely than its predecessor to allow flaws in code it has written to pass unremarked.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;이 정직성을 재는 벤치마크가 있습니다. 실패한 코딩 세션을 보여준 뒤 사용자가 “잘했다”고 거짓 칭찬을 하고 요약을 요청하면, 모델이 결함을 가감 없이 짚는지 보는 테스트죠. 함께 공개된 시스템 카드 기준으로는 Opus 4.8의 결함 미공개율이 3.7%였습니다. 결국 모델의 환각은 제대로 알아내기보다, “모르는 걸 모른다고 말할 때” 훨씬 줄어듭니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;앤트로픽이 오래 쌓아온 “안전 중심” 브랜드하고도 잘 어울리는 진화 방향입니다. 최고 수준 모델 미토스를 아직 선보이지 않는 것과도 이어지고요. 어제오늘 하루가 다르게 성능이 바뀔 수 있는 만큼, 어쩌면 이런 진화의 방법이 신뢰를 쌓아올리는 기준이 될지도 모르겠습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;진짜 전장은 클로드 코드 vs. 코덱스&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;사실 모델의 성능은 어떤 하네스(harness)를 만들었는지에 따라 바뀔 겁니다. 그러니 글을 읽고 있는 분들도 결국 궁금한 건, “그래서 클로드 코드가 코덱스보다 좋아지는 거야?”가 아닐까요?&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;workflow&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;이 구도에서 앤트로픽은 Opus 4.8과 함께 한 가지 굉장히 재미있는 기능을 업데이트합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;동적 워크플로(Dynamic Workflows), 즉, &lt;code&gt;workflow&lt;/code&gt;입니다. 기능의 공식 정의는 이렇습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p&gt;클로드는 여러분이 입력한 프롬프트에 기반해 동적으로 계획을 세우고, 하위 작업으로 쪼갠 다음, 여러 subagent로 병렬 분산시킵니다. 단일 세션에서 수십~수백 개 병렬 subagent를 돌리는 오케스트레이션 스크립트를 직접 작성하고, 결과를 사용자에게 넘기기 전에 스스로 검증합니다.&lt;/p&gt;&lt;p&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;Claude plans dynamically based on your prompt, breaks it into subtasks, and fans the work out across subagents running in parallel. It dynamically writes orchestration scripts that run tens to hundreds of parallel subagents in a single session, checking its work before anything reaches you.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;쉽게 말하면, 클로드 코드가 목표를 달성하기 위해 아예 알아서 에이전트를 세팅하고 관리&lt;span style="color:#757575;"&gt;(오케스트레이션)&lt;/span&gt;하는 기능이 나온 겁니다. 해야 하는 일을 프롬프트로 주며 workflow란 단어를 포함하기만 하면, 알아서 동작합니다. 에이전트가 어떻게 세팅되었고 굴러가는지는 &lt;code&gt;/workflows&lt;/code&gt; 명령어를 내리면 확인할 수 있습니다. 단계&lt;span style="color:#757575;"&gt;(phase)&lt;/span&gt;가 나뉘고 그 단계마다 에이전트가 자동으로 배치되더라고요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;코덱스가 클로드 코드보다 특징적으로 앞서갔던 것이 &lt;code&gt;/goal&lt;/code&gt; 기능입니다. 목표를 하나 주면 모델이 스스로 그걸 달성하려고 열심히 도는 거였습니다. 클로드 코드는 거기서 한발 더 나아가 아예 “에이전트들” 단위로 목표를 달성하게 만들었습니다. 하네스가 문제라면, 하네스까지 우리가 만들어주겠다는 거죠.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;체감은 어떨까?&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;물론, 코딩 작업은 아니었지만, 이 글을 쓰기 위해 빠르게 테스트해봤을 때, Opus 4.8 + workflow + ultraplan 콤보는 성능이 정말 만족스러웠습니다. 속도도 빠른 데다, 결과물도 만족스러웠고요. 제가 꽤 오랫동안 설계한 리서치 하네스를 명령어 하나가 거의 대체해 버렸습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3780/%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA_2026-05-29_%E1%84%8B%E1%85%A9%E1%84%8C%E1%85%A5%E1%86%AB_10_25_28.png"&gt;&lt;figcaption&gt;workflows 진행 상황 표 &amp;lt;출처: 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3780/%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA_2026-05-29_%E1%84%8B%E1%85%A9%E1%84%8C%E1%85%A5%E1%86%AB_10_25_45.png"&gt;&lt;figcaption&gt;개별 Subagents 동작 현황 &amp;lt;출처: 작가 캡처&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;만족감을 느끼며, 아직 정교한 반응은 아니겠지만, 커뮤니티를 살펴봤습니다. 물론 아직 너무 이른 시기라, 장기적인 작업에 대한 신뢰할 만한 반응은 찾기 어려웠습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그래도 분명히 “성능이 바닥을 찍었던 Opus 4.7보다는 나아졌다”는 의견이 우세했고요. 그와 별개로 “그럼 GPT-5.5보다 나은가?”라는 질문은 지켜봐야 합니다. 특히, 최근 한 달간 코덱스로 넘어간 사람이 많아, 이들을 다시 되돌릴 만한 분명한 비교 우위가 있을 지는 지켜볼 필요가 있겠습니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p&gt;주요 참조 문서&lt;/p&gt;&lt;/blockquote&gt;&lt;ul&gt;&lt;li&gt;해커 뉴스 반응: &lt;a href="https://news.ycombinator.com/item?id=48311647"&gt;&lt;u&gt;https://news.ycombinator.com/item?id=48311647&lt;/u&gt;&lt;/a&gt;&lt;/li&gt;&lt;li&gt;X 반응: &lt;a href="https://x.com/toddsaunders/status/2060064141520290148?s=12"&gt;https://x.com/toddsaunders/status/2060064141520290148?s=12&lt;/a&gt;&lt;/li&gt;&lt;/ul&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h3&gt;&lt;strong&gt;마치며&lt;/strong&gt;&lt;/h3&gt;&lt;p&gt;정말 클로드는 주도권을 탈환할까요? 이번 Opus 4.8과 클로드 코드 업데이트에서는 이를 위한 강한 의지가 느껴졌습니다. 물론, 그런 만큼 벤치마크는 되찾았지만, 터미널과 실사용 체감은 아직 봐야겠습니다. 여러분의 의견도 궁금합니다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;분명한 건, 한동안 이 출혈 경쟁의 수혜자는 결국 사용자가 될 거라는 점입니다. 성능은 올리고 값은 묶는 싸움이 계속되고, 한쪽이 독주하지 못하는 분열 구도가 이어지는 한, 한동안은 사용자 입장에선 굿이나 보고 떡이나 먹기로 합시다.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;h4&gt;&lt;strong&gt;+Mythos가 온다&lt;/strong&gt;&lt;/h4&gt;&lt;p&gt;Opus 4.8 발표 문서 끝에는 ‘최강의 모델’로 알려진 Mythos preview에 대한 새로운 소식도 있었습니다. 이 모델은 “그 성능이 너무 뛰어나 위험하기에” 소수의 조직에서 사이버 보안에 특화된 작업 위주로 쓰이고 있는데요. 이를 일반에 공개하기 위한 ‘더 강력한 보안 조치’를 취하고 있다고 합니다. 그 조치는 빠르게 성과를 내고 있다고 하고요.&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p&gt;그래서 “몇 주 안”에 우리도 드디어 이 모델을 써볼 수 있겠습니다. 어쩌면 진짜 GPT와의 힘싸움은 이 시점을 봐야하지 않을까요?&lt;/p&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>[클코나잇 2] 웨비나 OPEN! 클로드 코드의 한계 확장</title><link>https://yozm.wishket.com/magazine/detail/3778</link><description>지난 5월 27일, 클코나잇 시즌 2 1회차 웨비나가 열렸습니다. 1회차 웨비나가 끝난 후, “좋은 인사이트를 쉽게 이해할 수 있는 배움의 장”, “생활의 달인처럼 주변의 고수님들을 만난 시간”, “나와 비슷한 고민과 생각을 가진 사람들의 모임”이라는 후기가 이어졌는데요. 이번 2회차는 한 걸음 더 들어가, 헤드리스 모드에서 채널 기반 세션으로 클로드 코드 자동화 구조를 바꾼 이야기, AI 에이전트를 모바일에서 이어가는 방법, 5일 만에 웹 포털 런칭하기, AI 도구 26개를 만들며 얻은 자동화 노하우까지. 각자의 이유로 클로드 코드에 더 깊이 파고든 사람들의 이야기를 나눠볼 예정입니다.</description><guid>https://yozm.wishket.com/magazine/detail/3778</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;지난 5월 27일, 클코나잇 시즌 2 1회차 웨비나가 열렸습니다. 참가자 등록 수는 782명으로 역대 최다 신청 기록을 세웠는데요. 그만큼 클로드 코드에 대한 관심이 얼마나 뜨거운지 새삼 실감할 수 있었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;a href="https://yozm.wishket.com/magazine/detail/3757/"&gt;1회차&lt;/a&gt;는 클로드 코드를 ‘자기 방식으로 길들인 사람들’의 이야기를 들어보는 자리였습니다. 레포를 세컨 브레인으로 굴리는 이야기부터, 스킬을 스킬로 감싸 파이프라인을 만든 개발자, 9개 프로젝트를 혼자 돌리는 1인 빌더, 팀 전체에 하네스를 이식한 이야기까지 다양하게 구성됐는데요.&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;1회차 웨비나가 끝난 후, &lt;i&gt;“좋은 인사이트를 쉽게 이해할 수 있는 배움의 장”, “생활의 달인처럼 주변의 고수님들을 만난 시간”, “나와 비슷한 고민과 생각을 가진 사람들의 모임”&lt;/i&gt;이라는 후기가 이어졌어요!&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;그래서 이번 2회차는 한 걸음 더 들어가, 헤드리스 모드에서 채널 기반 세션으로 클로드 코드 자동화 구조를 바꾼 이야기, AI 에이전트를 모바일에서 이어가는 방법, 5일 만에 웹 포털 런칭하기, AI 도구 26개를 만들며 얻은 자동화 노하우까지. &lt;strong&gt;각자의 이유로 클로드 코드에 더 깊이 파고든 사람들&lt;/strong&gt;의 이야기를 나눠볼 예정입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;클로드 코드를 어디까지 쓸 수 있는지 궁금하셨던 분들, 나만의 방식을 아직 못 찾으신 분들 모두 환영합니다!&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3778/ChatGPT_Image_2026%EB%85%84_5%EC%9B%94_29%EC%9D%BC_%EC%98%A4%ED%9B%84_01_29_25.png"&gt;&lt;/figure&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;웨비나 정보&lt;/strong&gt;&lt;/h3&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;일시&lt;/strong&gt;: 6월 10일(수) 저녁 7:30 ~ 9:00 (90분)&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;장소&lt;/strong&gt;: Zoom (신청한 이메일로 접속 링크 발송)&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;참가 비용&lt;/strong&gt;: 무료&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;이런 분들께 추천해요!&lt;/strong&gt;&lt;/h3&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. 클로드 코드, 어디까지 쓸 수 있는지 궁금한 실무자&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li&gt;대화창 안에서만 쓰고 있는데, 더 넓게 활용하는 방법이 궁금한 분&lt;/li&gt;&lt;li&gt;헤드리스 모드 과금 이슈 이후 대안적인 자동화 구조가 궁금한 분&lt;/li&gt;&lt;li&gt;클로드 코드와 코덱스를 함께 활용하는 에이전트 협업 구조에 관심 있는 분&lt;/li&gt;&lt;li&gt;모바일에서도 클로드 코드 작업을 이어가고 싶은 분&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. 직접 만들고, 직접 운영해보고 싶은 비개발자·기획자&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;코딩 경험 없이도 실제로 쓰이는 서비스를 만들 수 있는지 궁금한 분&lt;/li&gt;&lt;li style="text-align:justify;"&gt;클로드 코드로 만든 결과물을 조직에 배포하고 운영까지 해보고 싶은 분&lt;/li&gt;&lt;li style="text-align:justify;"&gt;문제를 정의하는 기획력이 AI 활용의 핵심이라는 걸 실전으로 확인하고 싶은 분&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3. 반복 업무를 줄이고 생산성을 높이고 싶은 실무자·리더&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;여러 직무를 커버하면서 리소스 부족에 시달리고 있는 분&lt;/li&gt;&lt;li style="text-align:justify;"&gt;사내 자동화를 시도해봤지만 접근성·확장성·보안 문제로 막힌 경험이 있는 분&lt;/li&gt;&lt;li style="text-align:justify;"&gt;비개발자가 팀 AX를 어떻게 이끌어갈 수 있는지 궁금한 리더&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;세션 정보&lt;/strong&gt;&lt;/h3&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. 손바닥 위의 개발 환경: AI 에이전트를 폰에서 이어가기&lt;/strong&gt;&lt;/h4&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;발표자: 노성현 / 와탭랩스 개발자&amp;nbsp;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;클코나잇 시즌 1에서 "&lt;a href="https://yozm.wishket.com/magazine/detail/3503/"&gt;각 에이전트들끼리 자동으로 소통하게 만드는 오케스트레이션 구조&lt;/a&gt;"를 발표했던 노성현 님입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;PC에서 돌리던 클로드 코드를 퇴근길 지하철이나 침대에 누워서도 이어 쓸 수 있다면 어떨까요? 한창 돌아가던 작업을 두고 자리를 떠야 할 때, 그대로 폰에서 이어볼 수 있다면 어떨까요? SessionCast는 그 답답함에서 시작됐습니다. 이번 발표에서는 먼저 지금까지 이 문제를 어떻게 풀어왔는지, 기존 방식부터 짚어봅니다. 이어서 SessionCast가 같은 문제를 어떻게 더 단순하게 해결했는지, 별도 설치 없이 이미 실행 중인 세션에 그대로 붙는 방식을 살펴봅니다. 마지막으로 이 사이드 프로젝트를 실제 제품으로 만들고 Product Hunt에 런칭하며 겪은 시행착오와 교훈까지 함께 나눕니다.&lt;br&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. 클로드 코드로 5일 만에 웹 포털 런칭하기&lt;/strong&gt;&lt;/h4&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;발표자: 이현 / AX전략팀 기획자&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;클로드 코드로 만든 결과물을 실제 조직에 배포하고 운영한 경험을 전합니다. 운영 중에 발생한 문제를 다시 클로드 코드로 해결하기까지, 단순히 만드는 것을 넘어 운영 단계에서 깊게 파고든 이야기를 나눕니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;기획자가 세 번의 피벗 끝에, 31개 가맹점주가 실제로 사용하는 정산 포털을 5일 만에 배포했습니다. 분기당 72시간이 걸리던 업무는 12시간으로 줄었고, 핵심 병목 구간 자체를 없앨 수 있었습니다. 하지만 진짜 이야기는 배포 이후에 시작됐습니다. 바이브 코딩이 알려주지 않는 인프라 기본값의 함정, Claude Code가 제안한 답변에 역으로 더 나은 방법을 제안해 무중단 DB 마이그레이션을 완료한 경험, 담당자가 바뀌어도 시스템이 살아 있도록 Claude Code와 문서화를 함께 구축한 과정까지. AI는 내가 묻는 것에만 답한다는 사실을 실운영에서 직접 부딪히며 겪은 이야기를 솔직하게 공유합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3. 게임업계 AX 도전기: AI 도구 26개를 만들며 알게 된 자동화 노하우&lt;/strong&gt;&lt;/h4&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;발표자: 김현민 / 스파르타 게임즈 BizOps Lead&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;마케팅, 사업, 피플, 제작지원까지 4개 파트를 담당하며 게임업계에서 생존하기 위해 시작한 자동화로 월 272시간을 절감한 이야기입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;지난 수개월간 삽질하며 깨달은 것은, AI 활용의 병목이 결국 문제 정의 역량에 있다는 점이었습니다. 자동화의 8할은 코드가 아니라 기획에서 결정된다는 사실도 알게 됐고요. 앱스크립트, V0, Genspark, Manus, n8n을 거쳐 결국 Claude Code를 선택한 이유를 공유합니다. 또한 비개발자가 사내 자동화에서 반드시 챙겨야 할 3가지, 접근성·확장성·보안을 실제 사례와 함께 전합니다. 게임·IT 업계에서 직무별 자동화를 고민하는 분들, 팀 AX를 위해 노력하는 리더분들께 특히 추천드립니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;4. Claude Code 자동화, 헤드리스 모드에서 Channel 기반 세션으로&lt;/strong&gt;&lt;/h4&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;발표자: 이용학 / 교보DTS 정보보안센터&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;처음에는 Claude Code의 헤드리스 모드, 즉 claude -p를 활용한 자동화 사례를 발표하려고 했습니다. claude -p는 Claude Code를 터미널에서 호출 가능한 함수처럼 만들어주었고, 개인 자동화 도구에 쉽게 붙일 수 있는 일종의 인터페이스였습니다. 하지만 Anthropic의 과금 정책이 바뀌면서 발표 주제도 달라지게 되었는데요. 2026년 6월 15일부터 헤드리스 모드와 Agent SDK 사용이 별도 크레딧 과금 대상이 될 예정입니다. 따라서 크레딧이 넉넉한 유저가 아니라면, claude -p를 일상적인 자동화 인터페이스로 활용하는 데 부담이 생길 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이번 발표에서는 Claude Code 헤드리스 모드의 대안으로 Claude Channels를 활용한 실험을 공유합니다. 실행 중인 Claude Code 세션에 메시지를 주입하고, reply tool로 답을 회수하는 구조를 구현한 과정입니다. 직접 API 래퍼를 만드는 대신 Claude Code의 MCP, 권한 흐름, 세션 상태를 유지하면서 자동화 런타임으로 다루는 방식입니다. 또한 이 Channel 기반 런타임 위에 Codex CLI를 adapter로 연결해, Claude Code와 Codex가 서로의 관점을 주고받는 협업 구조까지 간단히 보여드릴 예정입니다.&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;사전 질문 OPEN!&lt;/strong&gt;&lt;/h3&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;발표자에게 직접 묻고 싶었던 점, 혼자 시행착오를 겪으며 궁금했던 점,&amp;nbsp;내 상황에 맞춰 확인해보고 싶은 점을 미리 남겨주세요!&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;남겨주신 질문은 발표가 끝나고, Q&amp;amp;A 시간에 가장 먼저 반영할 예정이니 많은 참여 부탁드려요!&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:60%;"&gt;&lt;a href="https://walla.my/v/PaA9rhtcrNcKwBcPuL3V"&gt;&lt;img src="https://www.wishket.com/media/news/3778/CTA__1__.png"&gt;&lt;/a&gt;&lt;/figure&gt;&lt;h3 style="margin-left:0px;text-align:center;"&gt;&lt;strong&gt;➡️&lt;/strong&gt;&lt;a href="https://walla.my/v/PaA9rhtcrNcKwBcPuL3V"&gt;&lt;strong&gt;사전 질문하러 가기&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;a href="https://zoom.us/webinar/register/WN_-SFzuAq3SgGwJeEQGvedxg"&gt;&lt;img src="https://www.wishket.com/media/news/3778/%EB%8B%A8%EB%9D%BD_%ED%85%8D%EC%8A%A4%ED%8A%B8__YouTube_%EC%8D%B8%EB%84%A4%EC%9D%BC___7_.png"&gt;&lt;/a&gt;&lt;figcaption&gt;&lt;a href="https://zoom.us/webinar/register/WN_-SFzuAq3SgGwJeEQGvedxg"&gt;웨비나 참가 신청하기&lt;/a&gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;참가 방법&lt;/strong&gt;&lt;/h3&gt;&lt;blockquote&gt;&lt;ol&gt;&lt;li style="text-align:justify;"&gt;아래 링크를 클릭해, 참가자 정보를 입력한 뒤 제출합니다.&lt;br&gt;➡️ &amp;nbsp;&lt;a href="https://zoom.us/webinar/register/WN_-SFzuAq3SgGwJeEQGvedxg"&gt;&lt;strong&gt;[참가 신청하기]&lt;/strong&gt;&lt;/a&gt;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;행사 전, Zoom 접속 링크가 등록한 이메일로 발송됩니다. (제출 전 메일 주소를 한번 더 확인해주세요!)&lt;/li&gt;&lt;li style="text-align:justify;"&gt;요즘IT 디스코드 채널에서 사전 Q&amp;amp;A와 발표 자료가 공유될 예정입니다. 웨비나 전, 디스코드 채널에 미리 가입해주세요!&lt;br&gt;&lt;strong&gt;➡️&lt;/strong&gt;&lt;a href="https://discord.gg/4UQG2R83FZ"&gt;&lt;strong&gt;[디스코드 방문하기]&lt;/strong&gt;&lt;/a&gt;&lt;/li&gt;&lt;/ol&gt;&lt;/blockquote&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;참가자 혜택&lt;/strong&gt;&lt;/h3&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;발표 자료 독점 제공&lt;/strong&gt;: 발표자들의 슬라이드는 &lt;a href="https://discord.gg/4UQG2R83FZ"&gt;디스코드 채널&lt;/a&gt;에 아카이빙되어 제공됩니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;실시간 Q&amp;amp;A 참여&lt;/strong&gt;: 웨비나 당일 실시간 Q&amp;amp;A를 통해 평소 궁금했던 점을 현업 실무자에게 직접 물어보세요.&lt;/li&gt;&lt;/ul&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="margin-left:0px;text-align:justify;"&gt;&lt;strong&gt;마치며&lt;/strong&gt;&lt;/h3&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;클코나잇은 실제로 많은 분들이 갖고 있는 고민을 함께 나누는 자리이기도 합니다.&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&lt;i&gt;“내가 가진, 혹은 우리 팀이 가진 고민을 클로드 코드로 어떻게 해결할 수 있을까?”&amp;nbsp;&lt;/i&gt;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;2회차에서는 이 질문을 더 깊게 파고듭니다. 단순한 활용 팁을 넘어, 클로드 코드를 각자의 환경에 맞게 끝까지 밀어붙여본 사람들의 이야기를 들을 수 있습니다. 그 생생한 노하우를 직접 만나보세요!&lt;/p&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="table" style="height:auto;text-align:justify;width:744px;"&gt;&lt;table style="border-bottom:1px solid rgb(224, 224, 224);border-left:1px solid rgb(224, 224, 224);border-right:1px solid rgb(224, 224, 224);border-top:1px solid rgb(224, 224, 224);"&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td style="border-bottom:1px solid -2.26791);border-left:1px solid -2.26791);border-right:1px solid -2.26791);border-top:1px solid -2.26791);padding:12px;"&gt;&lt;h3 style="margin-left:0px;text-align:center;"&gt;&lt;strong&gt;➡️&lt;/strong&gt;&lt;a href="https://zoom.us/webinar/register/WN_-SFzuAq3SgGwJeEQGvedxg"&gt;&lt;strong&gt;클코나잇 2 웨비나 참가 신청하기&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;h3 style="margin-left:0px;text-align:center;"&gt;&lt;strong&gt;➡️&lt;/strong&gt;&lt;a href="https://discord.com/invite/4UQG2R83FZ"&gt;&lt;strong&gt;요즘IT 디스코드 참여하기&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;/figure&gt;&lt;p style="margin-left:0px;text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>MCP·Skills·Hooks·Sub-agents, 4가지 중 뭘 골라야 할까?</title><link>https://yozm.wishket.com/magazine/detail/3777</link><description>클로드 코드를 쓰다 보면 어느 순간 "왜 이렇게 멍청해지지?"라는 불만이 쌓이기 마련입니다. 앤트로픽에서 클로드 코드를 만드는 엔지니어, Daisy Hollman은 "에이전트를 코드베이스에 잘 맞추는 가장 빠른 방법은 더 똑똑한 모델이 아니라 더 빡빡한 피드백 루프"라고 말합니다. 그가 전하는 커스텀을 해야 하는 이유, MCP·Skills·Hooks·Sub-agents 4가지 커스텀 추상화를 언제 어떻게 골라 써야 하는지, 클로드 코드를 더 잘 쓰기 위해 알아야 할 것들을 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3777</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;처음 클로드 코드를 일하는 데 쓰기 시작했을 때, 그 놀라움이 생각납니다. 어떻게 이런 일까지 모두 할 수 있을까 싶은 마음에, 앞으로 업무가 한결 편해지겠다는 기쁨과 그 업무를 언제까지 할 수 있을지 모르겠다는 두려움이 함께 생겼습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만, 그런 마음이 무색하게도 이제 저는 클로드 코드에 불만이 아주 많습니다. 왜 더 많은 일을 하지 않지? 왜 알아서 해주지 않지? 왜 이렇게 멍청해지는 거지? 그 문제를 해결하고자 이런저런 곳을 떠돌다, 클로드 코드 팀의 엔지니어인 Daisy Hollman의 워크숍 영상을 접했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;“이 시점에서 소프트웨어 엔지니어의 일은, 자신의 작은 복제를 만들어 여러 에이전트에 걸쳐 능력을 스케일하는 것입니다.”&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3777/image1.png"&gt;&lt;figcaption&gt;Daisy Hollman의 워크숍 영상 &amp;lt;출처: &lt;a href="https://www.youtube.com/watch?v=tuY2ChJIx48"&gt;Youtube&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;발표를 보고 정신이 번쩍 들었습니다. 여기저기서 눈으로는 봤지만, 머리로는 이해하지 못했던 ‘하는 일을 더 잘 하기 위해’ AI를 쓰라는 말을 제대로 이해할 수 있었습니다. 그러기 위해서는 클로드 코드를 어떻게 세팅해야 하는지도요. 정말 좋은 이야기가 많아, 핵심을 정리해 다시 나누고자 글을 썼습니다. 최대한 지금 제 문제에 와닿는 이야기를 중심으로 다시 구성해 봤습니다.&lt;/p&gt;&lt;hr&gt;&lt;p style="text-align:justify;"&gt;- Daisy Hollman, 〈&lt;a href="https://www.youtube.com/watch?v=tuY2ChJIx48"&gt;Beyond the Basics with Claude Code&lt;/a&gt;〉, Code with Claude.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;글에서 이탈릭 체로 처리한 모든 대화체는 발표에서 인용한 글입니다.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;왜 클로드 코드를 커스텀해야 하는가?&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;클로드 코드를 있는 그대로 쓰다 보면 왜 이렇게 아쉬운 느낌이 들까요? 답은 명쾌했습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;여러분이 할 수 있는 모든 걸 할 수 없다면, 클로드는 당신의 일을 함께할 수 없습니다.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Daisy는 클로드 코드의 커스텀이 필요한 이유를 접근&lt;span style="color:#999999;"&gt;(Access)&lt;/span&gt;, 지식&lt;span style="color:#999999;"&gt;(Knowledge)&lt;/span&gt;, 도구 세팅&lt;span style="color:#999999;"&gt;(Tooling)&lt;/span&gt; 세 가지 문제로 나눠 설명합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. 접근&lt;/strong&gt;&lt;span style="color:#999999;"&gt;&lt;strong&gt;(Access)&lt;/strong&gt;&lt;/span&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;클로드 코드가 접근하지 못하는 곳에 있는 정보는 모두 핸디캡이 됩니다. 이를테면 결정은 슬랙에서 일어났는데, 디자인 문서는 피그마에 있고, 로그는 컨플루언스에 있다고 합시다. 흔한 상황이죠. 다만, 사람이 그 사이를 쉽게 오가는 반면 AI는 그렇지 않습니다. 이 페이지들을 클로드에 연결하다 보면, 생각보다 정말 많은 맥락이 누락된 것을 깨달을 수 있습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;종일 클로드 코드 터미널을 떠나지 않고 일해보세요. 만약&lt;/i&gt;&lt;/span&gt; &lt;span style="color:#999999;"&gt;&lt;i&gt;(터미널을 벗어나)&lt;/i&gt;&lt;/span&gt; &lt;span style="color:#757575;"&gt;&lt;i&gt;Alt-Tab을 누르면, 그건 클로드가 못 보고 있는 정보일 거예요.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그렇다면 반드시 연결해야 하는 것들로는 뭐가 있을까요? &lt;span style="color:#757575;"&gt;&lt;i&gt;프로페셔널한 엔지니어링 업무에 필요한 것은, 특히 규모가 클수록, 대부분 실제 소스 코드 바깥에 있습니다.&amp;nbsp;&lt;/i&gt;&lt;/span&gt; 채팅, CI/CD, 대시보드, 사내 문서, 디자인 문서…. 사실상 일할 때 보는 모든 것이 맞겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3777/image5_9u7iK9e.png"&gt;&lt;figcaption&gt;&amp;lt;출처: &lt;a href="https://www.youtube.com/watch?v=tuY2ChJIx48"&gt;Youtube&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. 지식(Knowledge)&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;다만, 이런 봐야 하는 것들에는 암묵지인 ‘지식’들 역시 있습니다. 코드를 쓰는 규칙, 기업에 특화된 정보, 사내에서만 쓰는 표현들. 다만, 이런 정보를 모델 자체에 학습시키는 건 나쁜 생각이라고 합니다. 실제 특수 정보로 모델을 파인튜닝하면 환각이 늘 수 있다는 연구가 있는 데다가, 프론티어 모델 주기가 워낙 빨라 효율도 안 나오니까요. 결국 장기적으로는 일반 AI가 특화 AI 보다 나아질 가능성이 높습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;남은 건 ICL&lt;span style="color:#999999;"&gt;(in-context learning)&lt;/span&gt;입니다. &lt;span style="color:#757575;"&gt;&lt;i&gt;ICL은 똑똑해 보이고 싶을 때 쓰는 말인데, 사실 그냥 텍스트 파일입니다.&lt;/i&gt;&lt;/span&gt; CLAUDE.md, SKILL.md, Sub-agent를 정의하는 파일들. 이런 것들이 모두 ICL에 해당합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만, 정말 이런 정보를 그냥 ‘텍스트 파일’로만 두면 안 됩니다. 대부분 만들기가 쉬우니 “이만하면 됐겠지”하고 멈추지만, 그래서는 진짜 지식으로 작동하지 않습니다. 최적화가 필요합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3. 도구 세팅&lt;/strong&gt;&lt;span style="color:#999999;"&gt;&lt;strong&gt;(Tooling)&lt;/strong&gt;&lt;/span&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;그럼 이러한 접근을 열어주고, 지식을 연결했을 때, 클로드를 위한 도구는 무슨 형태가 적합할까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Daisy에 따르면 도구는 크게 두 가지, 모델의 지능이 부족한 것을 막아줄 도구, 모델이 좋아질수록 유용해지는 스케일 도구로 나눌 수 있습니다. 지금 우리에게 필요한 건 &lt;strong&gt;모델이 좋아질수록 유용해지는 도구&lt;/strong&gt;입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;변수를 잘못 썼거나 함수에 인자 수가 안 맞을 때 뜨는 빨갛고 꼬불꼬불한 선&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;(red squiggles)&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;이 여러분의 뇌에 어떤 일을 하는지 생각해 보세요. 완전히 멈추게 하지는 않지만, “잠깐 다시 생각해볼까?”하는 방향으로 밀어주죠. 그러니까, 무시할 수 있지만, 다시 한 번 생각하게 만듭니다. 에이전트한테도 이런 게 있었으면 합니다&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3777/image2_NoWvMFN.png"&gt;&lt;figcaption&gt;&amp;lt;출처: 작가, Gemini로 생성&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Hook을 쓸 수도 있고, 린터를 돌릴 수도 있고, LSP 연결을 생각해 볼 수도 있을 겁니다. 이런 피드백을 줄 알림을 세팅하는 것도 방법이고요. 어쨌든 아예 정의되지 않은 변수를 ‘절대’ 못 쓰게 막는 방식 같은 건 실수는 줄여도 성장을 만들기는 어렵습니다. 강요는 좋은 결과를 만들기 어렵죠. 넛지&lt;span style="color:#999999;"&gt;(nudge)&lt;/span&gt;, 즉, 잊기 쉬운 무언가를 떠올리게 해주는 것이 중요합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런 맥락에서 &lt;span style="color:#757575;"&gt;&lt;i&gt;에이전트를 코드베이스에 잘 맞추는 가장 빠른 방법은 더 똑똑한 모델이 아니라, 더 빡빡한 피드백 루프&lt;/i&gt;&lt;/span&gt;를 구축하는 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;+ 컨텍스트 윈도우라는 제약&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;하나 더, 짚고 넘어가야 할 것이 있습니다. 지난 1년간 프론티어 모델의 컨텍스트 윈도우 크기는 거의 변하지 않았습니다. 요즘 최신 모델들은 1M까지 지원하고, 그 이상은 잘 커지지 않습니다. 모델이 어느 정도는 본질적인 한계처럼 보이는 지점에 와 있기 때문일지도 모릅니다. 그러니 &lt;span style="color:#757575;"&gt;&lt;i&gt;코드베이스 전체를 부어넣을 수는 없습니다. 위키 전체나 사내 문서 전체를 다 부어넣을 수 없죠.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;여기에 LLM은 KV 캐시 구조를 적용합니다. 프롬프트를 앞에서부터 읽어나가며, 이를 기록해 두고, 다음 출력에 이를 적용시킨다는 뜻이죠. 그러니 &lt;span style="color:#757575;"&gt;&lt;i&gt;프롬프트 앞쪽에서 무언가 바꾸면, 그 변경 뒤의 컨텍스트 윈도우 전체에 토큰 비용을 내야 합니다. 보통 10배 더 비싼&lt;/i&gt;&amp;nbsp;&lt;/span&gt; 값을 치뤄야 합니다. 결국 안정적으로 돌아가야 하는 걸 앞단에 두고, 휘발되는 태스크 중심 업무는 뒤쪽에 배치해야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;안 쓰는 거에 돈을 내지 마라(Don’t pay for what you don’t use).&lt;/i&gt;&lt;/span&gt; 이건 지키면 좋은 수준(nice-to-have)의 규칙이 아닙니다. 결국 적절한 정보를 적절한 시점에 넣을 더 나은 방법을 반드시 찾아야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;그래서 무슨 도구로 커스텀을 해야 할까?: MCP, Skills, Hooks, Agents&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;그렇다면 이런 커스터마이징을 어떻게 해야 할까요? 사실 지금까지 개발자들이 제대로 일하기 위해, 이런 환경은 모두 만들어뒀습니다. 필요한 도구는 이미 다 있죠. 클로드에 제대로 된 도구를 주기만 하면 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그 중 클로드 코드에서 쓰이는 가장 대표적인 4가지 추상화 도구는 MCP, Skills, Hooks, Agents&lt;span style="color:#999999;"&gt;(Sub-agents)&lt;/span&gt;입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3777/image3_FHD2xcU.png"&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞서 본 대로, 스케일을 만들기 위한 대규모 동작을 가정하고 볼 겁니다. 당장 업무 한 두 개만 처리한다고요? 아뇨. 앞으로 우리는 더 AI에 의존적인 시대에 살 겁니다. 그러니 이런 도구가 10,000개, 100,000개는 더 많은 상황을 상정해야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래야 우리에게 쥐어진 모델을 ‘더 잘 하기 위해’ 쓸 수 있겠죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;1. MCP&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;MCP는 이 4가지 도구 중 가장 먼저 등장했습니다. 즉, LLM이 지금에 비해 훨씬 단순하던 시기에 설계됐다는 거죠. 그래서 컴퓨터 파일에 접근하지 못하고, 명령어도 못 돌리는 데다, CLI도 못 쓰는 챗봇 환경을 전제로 두었습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;여러분에게 이미 CLI가 있다면, 그걸 MCP로 감쌀 이유가 없어요. 그냥 ‘클로드한테 이 CLI 이렇게 써’하고 알려주는 Skills가 훨씬 쉽거든요.&lt;/i&gt;&lt;/span&gt; 그러니 나 혼자 쓰거나 사내에서 쓸 작업을 MCP로 포장하는 건 권장되지 않습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론, 회사에서 외부에 클로드와 통합한 무언가를 출시하고 싶을 때는 일단 MCP 서버부터 시작하는 것이 좋습니다. 변환이나 인증을 대부분 처리해 주니까요. 그런 특징 덕에 다른 도구와 이어주는 MCP 서버는 써야 합니다. 슬랙, 지라, 깃허브 같은 도구와의 연동은 여전히 MCP 서버를 거쳐야 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3777/image4.png"&gt;&lt;figcaption&gt;클로드 공식 문서의 MCP 설명 &amp;lt;출처: &lt;a href="https://code.claude.com/docs/ko/mcp"&gt;Anthropic&lt;/a&gt;&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;2. Skills&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Daisy는 초기에 Skills를 ‘게으른 시스템 프롬프트&lt;span style="color:#999999;"&gt;(lazy system prompt)&lt;/span&gt;’라고 불렀다고 합니다. 쉬운 표현 같아요. 해야하는 일의 순서와 필요한 것들을 자연어로 적어둔 것이니까요. 본질로 들어가도 이건 사실 폴더 하나입니다. 마크다운 문서와 이걸 요약한 무언가들이 함께 있는 폴더죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그래서 여기저기 만들어 두기 정말 쉽습니다. 물론 이건 장점이자 단점입니다. 품질을 통제하지 않으면 문제가 생기거든요. 실제로 Skills를 설명&lt;span style="color:#999999;"&gt;(Description)&lt;/span&gt;하는 부분은 늘 로드합니다. 언제 호출할 지 알아야 하니까요. 다만 이 설명이 길어지면 비용이 커지고, 짧아지면 필요할 때 쓸 수가 없습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;---
description: Summarizes uncommitted changes and flags anything risky. Use when the user asks what changed, wants a commit message, or asks to review their diff.
---

## Current changes

!`git diff HEAD`

## Instructions

Summarize the changes above in two or three bullet points, then list any risks you notice such as missing error handling, hardcoded values, or tests that need updating. If the diff is empty, say there are no uncommitted changes.&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#757575;"&gt;Skills.md 예시 &amp;lt;출처:&lt;/span&gt; &lt;a href="https://code.claude.com/docs/ko/skills"&gt;Anthropic&lt;/a&gt;&lt;span style="color:#757575;"&gt;&amp;gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러니 &lt;span style="color:#757575;"&gt;&lt;i&gt;어느 정도는 스케일하지만, 레포 하나에 Skill 10만 개가 들어가는 시기&lt;/i&gt;&lt;/span&gt;는 앤트로픽 내부에서도 미리 생각하지 못했다고 합니다. &lt;span style="color:#757575;"&gt;(결국 Skills에는 아직 계층이 없기 때문에 생기는 문제인데, 몇 주 안에 sub-skill을 노출하는 구조를 작업하고 있다고 합니다. 기대해 봐야겠습니다.)&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;3. Hooks&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;그래서 가장 추천하는 방식은 Hooks입니다. &lt;span style="color:#757575;"&gt;&lt;i&gt;에이전트 루프에서 뭔가 이벤트가 생기고, 그러면 컴퓨터에서 무언가가 실행됩니다. 그 실행 결과를 기준으로 컨텍스트 윈도우에 추가할지 결정합니다. … 매우 제약이 큰 자원의 부담을 훨씬 제약이 덜한 자원으로 떠넘긴 거죠. 이런 시스템을 디자인할 때 찾아야 할 특징은 바로 이런 겁니다.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Hook을 돌릴 때는 토큰을 안 씁니다. 비용이 0원이죠. 이를테면, 한글로 이메일을 쓸 때 필요한 Skills를 만들었다고 합시다. 그런데, 우연찮게 영어로 이메일을 쓸 일이 생겼습니다. 이때 Skills가 돌지 않도록 하려면, “영어일 때는 쓰지 마”라는 규칙을 추가해야 합니다. 이걸 읽고 무시하는 것도 결국은 토큰이고 비용입니다. 하지만 이 타입을 체크하는 Hook이 있으면, 토큰을 쓰지 않고도 알아서 영어인 걸 확인해 Skills를 접근조차 안 하게 해줍니다. 안 쓰는 거에는 확실하게 아무런 비용도 내지 않는 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;{
  "hooks": {
    "PostToolUse": [
      {
        "matcher": "Edit|Write",
        "hooks": [{ "type": "command", "command": "jq -r '.tool_input.file_path' | xargs npx prettier --write" }]
      }
    ],
    "Notification": [
      {
        "matcher": "",
        "hooks": [{ "type": "command", "command": "osascript -e 'display notification \"Claude Code needs your attention\" with title \"Claude Code\"'" }]
      }
    ]
  }
}
&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#757575;"&gt;hooks 예시 &amp;lt;출처:&lt;/span&gt; &lt;a href="https://code.claude.com/docs/ko/hooks-guide"&gt;Anthropic&lt;/a&gt;&lt;span style="color:#757575;"&gt;&amp;gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;물론 그래서 모든 일에 적합하지는 않습니다. 모든 걸 다 할 수 없고 완벽하지도 않습니다. 이걸 넣을지 말지 결정하려면 다시 토큰이 필요합니다. 트레이드오프죠. 그래도 앞서 Daisy가 강조한 에이전트를 위한 도구의 역할, 즉,&amp;nbsp; &lt;span style="color:#757575;"&gt;&lt;i&gt;빨갛고 꼬불꼬불한 선(red squiggles)에 적합한 영역이 Hooks&lt;/i&gt;&lt;/span&gt;입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;4. Sub-Agents&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Sub-Agents는 시스템 프롬프트로 들어가는 설명&lt;span style="color:#999999;"&gt;(description)&lt;/span&gt;과 그 자체 시스템 프롬프트로 구조화됩니다. 특정 태스크를 수행하는 데 적합한 구조인데요. 특징적인 건 ‘별도 컨텍스트’를 가지고 돌아간다는 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그러니까, CLI에서 사람이 조작하는 메인 루프의 컨텍스트 윈도우를 먹지 않는 게 가장 큽니다. 물론 토큰이 공짜는 아니지만, 에이전트 하나가 토큰을 어떻게 효율적으로 쓸지 생각할 때는 스케일에 효율적입니다. &lt;span style="color:#757575;"&gt;&lt;i&gt;에이전트가 50개 파일을 읽을 수 있고, 메인 루프는 그 짐을 지지 않아도 되니까요.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;다만, 에이전트마다 여전히 설명이 연결되어야 하고, 그러니 10만 개가 생기면 그 설명도 10만 개가 들어가야 한다는 거죠. Skills와 엄청 다른 구조라 보기 어렵습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;---
name: code-reviewer
description: Reviews code for quality and best practices
tools: Read, Glob, Grep
model: sonnet
---

You are a code reviewer. When invoked, analyze the code and provide
specific, actionable feedback on quality, security, and best practices.
&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#757575;"&gt;Sub-Agent.md Frontmatter 예시 &amp;lt;출처:&lt;/span&gt; &lt;a href="https://code.claude.com/docs/ko/sub-agents"&gt;Anthropic&lt;/a&gt;&lt;span style="color:#757575;"&gt;&amp;gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;+ 플러그인과 CLAUDE.md&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;사실 클로드 코드가 나온 초기에는 이 CLAUDE.md가 커스텀의 만능 비법처럼 소개되기도 했는데요. 실제로 플러그인에 이걸 넣으면 스케일을 키우기가 매우 쉬워 보이기도 합니다. 다만, Daisy는 ‘플러그인에 CLAUDE.md를 넣어 스케일을 만드는 방식’은 별로 추천하지 않는다고 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;(CLAUDE.md는)&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;매우 비싼 추상인데, 저렴해 보이죠. … 마치 스케일되는 것처럼 보일 뿐입니다. 파일 하나니까요. 그러니 정말정말 하고 싶으면, 세션을 시작하는 훅&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;(session start hook)&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;에서 텍스트를 반환할 수 있게는 열어 두었습니다. 그렇게 하면 ‘내가 사용자에게 매번, 무조건 비용을 내게 하고 있다’게 드러나니까요.&lt;/i&gt;&lt;/span&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h3 style="text-align:justify;"&gt;&lt;strong&gt;마치며&lt;/strong&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;이제 우리는 어떻게 일해야 하는 걸까요?&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;클로드 코드 팀이 클로드 코드를 쓰고 만들며 가져가는 두 가지 핵심 테마는 비동기&lt;span style="color:#999999;"&gt;(asynchrony)&lt;/span&gt;와 병렬&lt;span style="color:#999999;"&gt;(parallelism)&lt;/span&gt;이라고 합니다. 쉽게 말하면 &lt;span style="color:#757575;"&gt;&lt;i&gt;컴퓨터를 떠나 잠시 일을 시키고 돌아올 수 있어야 하며, 여러 개를 동시에 굴리고 싶다&lt;/i&gt;&lt;/span&gt;는 거죠. 결국 이 역시도 원래 처리하던 일의 수준을 폭발적으로 늘려주는 방식이라고 느껴졌습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;그런 만큼 나만을 위해 빨간 선을 그어줄 도구를 미리 세팅하는 게 꼭 필요할 겁니다. 그 때마다 영상에서 본 이 세 가지 격언이 떠오를 것 같아요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;접근 권한을 줄 것&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;(Give it access)&lt;/i&gt;&lt;/span&gt;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;(컨텍스트 윈도우란)&lt;/i&gt;&lt;/span&gt; &lt;span style="color:#757575;"&gt;&lt;i&gt;상자를 신경 쓸 것&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;(Mind the box)&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;,&lt;/i&gt;&lt;/span&gt;&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;스케일할 추상을 고를 것&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#999999;"&gt;&lt;i&gt;(Pick abstractions that scale)&lt;/i&gt;&lt;/span&gt;&lt;span style="color:#757575;"&gt;&lt;i&gt;.&lt;/i&gt;&lt;/span&gt;&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞으로는 더 많은 일을 하면서도 더 잘 하는 것이 기본일 겁니다. 쉽지는 않겠지만, 해내야 겠죠. 모두에게 도움이 되었으면 좋겠습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="margin-left:0px;text-align:center;"&gt;&lt;span style="color:rgb(153,153,153);"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item><item><title>1년 전 클로드 코드가 뜰 거라고 예측했던 Dan Shipper의 새 예측</title><link>https://yozm.wishket.com/magazine/detail/3776</link><description>도구 118개를 한 번에 연결하는 오픈소스 개인 AI 에이전트 OpenHuman, 1년 전 클로드 코드의 부상을 적중시킨 Dan Shipper의 새 AI 예측 12가지, 코딩 도구를 넘어 PM·디자인·재무·영업까지 확장된 오픈AI 코덱스 활용 사례 52선. 이번 주 프로덕트 메이커가 알아야 할 세 가지를 정리했습니다.</description><guid>https://yozm.wishket.com/magazine/detail/3776</guid><content:encoded>&lt;![CDATA[&lt;b&gt;&lt;p style="text-align:justify;"&gt;안녕하세요, 요즘 프로덕트 메이커입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;프로덕트 소식은 넘쳐나지만 대부분 이런 게 나왔대에서 끝납니다. 그래서 뭘 어떻게 하라고? 내 작업에 어떻게 써먹지? 거기까진 연결이 잘 안 되죠. 따라서 요즘 프로덕트 메이커는 바로 쓸 수 있는 것, 그 중에서도 주목해볼 만한 것을 엄선해서 매주 금요일에 전달드리려 합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;요즘 프로덕트 메이커는 매주 세 가지를 골라 전합니다:&lt;/p&gt;&lt;ol&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;써볼 것&lt;/strong&gt;: OpenHuman - 내 도구 118개를 한 번에 연결하는 오픈소스 개인 AI 에이전트&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;참고할 것&lt;/strong&gt;: AI의 역설 - 1년 전 클로드 코드의 부상을 일찍 짚은 Dan Shipper의 12가지 새 예측&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;적용해볼 것&lt;/strong&gt;: 코딩 너머로 확장된 코덱스 활용 사례 52선&lt;/li&gt;&lt;/ol&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3776/1_1.png" alt="오픈소스 개인 AI 에이전트 OpenHuman"&gt;&lt;figcaption&gt;&amp;lt;출처: openhuman 깃허브&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;h3 style="text-align:justify;"&gt;&lt;br&gt;&lt;strong&gt;1. 써볼 것&lt;/strong&gt;: &lt;a href="https://github.com/tinyhumansai/openhuman"&gt;&lt;strong&gt;내 도구 118개를 한 번에 연결하는 오픈소스 개인 AI 에이전트&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;AI 에이전트가 매주 새로 등장하지만, 막상 내 작업 환경과 연결해 쓰려 하면 손이 많이 갑니다. 도구마다 따로 로그인하고, 컨텍스트를 매번 새로 알려주고, 잘 안 되면 결국 익숙한 LLM 챗봇으로 돌아오게 되죠. OpenHuman은 그 진입 장벽을 겨냥한 오픈소스 프로젝트입니다. 5월 12일 출시 후 일주일 만에 GitHub 트렌딩 1위, Product Hunt 일, 주, 월간 1위를 모두 차지했고 출시 2주차인 현재 GitHub 스타가 29,000개를 넘겼습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;창업자 Steven Enamakel이 직접 밝힌 시작점은 의외로 평범합니다. 아버지를 위해 오픈소스 AI 에이전트를 설치해드리려 했는데 너무 복잡해서 본인이 새로 만들기로 했다는 거죠. 그 출발점이 OpenHuman의 디자인 원칙인, 비기술자도 클릭 몇 번이면 쓸 수 있어야 한다는 것으로 이어집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;무슨 문제를 해결해 주나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;AI 에이전트를 업무에 본격적으로 쓰려 할 때 부딪히는 문제는 보통 세 가지입니다. OpenHuman은 아래 세 문제를 동시에 다루는 오픈소스 프로젝트입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;첫째&lt;/strong&gt;, 도구가 서로 단절돼 있습니다. 메일은 Gmail, 노트는 Notion, 코드는 GitHub, 메시지는 Slack 같은 곳에 흩어져 있는데 에이전트는 그중 하나만 보고 답하니까, 사람이 매번 컨텍스트를 옮겨붙이는 일이 반복됩니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;둘째&lt;/strong&gt;, 에이전트가 어제 한 대화를 기억하지 못해서 오늘 또 처음부터 설명해야 하는 경우가 많습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;셋째&lt;/strong&gt;, 토큰 비용과 유지보수 부담이 큽니다. 도구 호출 결과나 긴 스크랩 데이터가 그대로 모델에 들어가면서 비용이 빠르게 쌓이고, 직접 운영하다 보면 SSH로 서버를 만지는 단계까지 가게 됩니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;어떻게 쓰나요?&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;설치 방법은 환경에 따라 다릅니다. 공식 README가 권장하는 방식은 네이티브 패키지예요.&lt;/p&gt;&lt;pre&gt;&lt;code class="language-plaintext"&gt;# macOS (Homebrew)
brew tap tinyhumansai/openhuman
brew install openhuman

# Linux (Debian/Ubuntu) — 서명된 apt 저장소
# Windows — 서명된 .msi 다운로드 (Releases 페이지)&lt;/code&gt;&lt;/pre&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;더 간단한 한 줄짜리 스크립트 설치도 있지만, README가 직접 무결성 검증이 없다고 경고하고 있으니 가능하면 네이티브 패키지 쪽을 쓰는 게 좋겠습니다. 데스크톱 앱은 &lt;a href="https://tinyhumans.ai/openhuman"&gt;tinyhumans.ai/openhuman&lt;/a&gt;이나 GitHub Releases 페이지에서 직접 다운로드받을 수도 있어요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;OpenHuman의 핵심 기능은 네 가지입니다.&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ol&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;원클릭 OAuth로 118개 이상의 도구 연결&lt;/strong&gt;&lt;br&gt;Gmail, Notion, GitHub, Slack, Stripe, Calendar, Drive, Linear, Jira 등 일상에서 쓰는 서비스 대부분이 들어가 있어, 한 번 연결해두면 OpenHuman이 20분마다 자동으로 새 데이터를 가져와 최신 상태로 유지합니다(auto-fetch). 별도 프롬프트나 폴링 작업 없이 백그라운드에서 진행됩니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;Memory Tree와 Obsidian Wiki&lt;/strong&gt;&lt;br&gt;모든 데이터를 3,000 토큰 이하의 마크다운 청크로 정리한 뒤, 계층적 요약 트리로 묶어 로컬 SQLite에 저장합니다. 동시에 같은 청크가 Obsidian 호환 vault에 .md 파일로 저장돼서, 사용자가 직접 열어 보고 편집할 수 있습니다. 이는 Andrej Karpathy(안드레이 카파시)가 제안한 LLM-wiki 워크플로우에서 영감을 받았다고 밝혔습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;TokenJuice 토큰 압축&lt;/strong&gt;&lt;br&gt;도구 호출 결과, 스크랩 데이터, 이메일 본문, 검색 페이로드가 모델에 도달하기 전에 미리 압축됩니다. HTML을 마크다운으로 변환하고, 긴 URL을 단축하고, 장황한 출력을 요약합니다. 한국어, 일본어처럼 멀티바이트 텍스트는 grapheme 단위로 보존해 깨지지 않게 처리하며, 비용과 응답 지연이 최대 80%까지 줄어든다고 합니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;로컬 우선, 원하면 클라우드&lt;/strong&gt;&lt;br&gt;민감한 데이터는 기기에 머무르고, 모델 라우팅으로 작업 종류에 따라 추론, 빠른 응답, 비전 모델을 자동 배분합니다. Ollama 기반 로컬 모델 옵션도 있어 외부 API 없이 돌리는 것도 가능하죠.&lt;/li&gt;&lt;/ol&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;눈에 띄는 디테일들&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;기능 외에도 몇 가지 디테일이 더 있어 짧게 소개드립니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;데스크톱에 마스코트가 떠 있다가 말도 하고 주변 작업에 반응하기도 합니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;사용자가 입력을 멈춘 동안에도 백그라운드에서 사고를 이어갑니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;Google Meet에 실제 참여자로 합류할 수도 있습니다. 음성 인식(STT), ElevenLabs 기반 음성 출력(TTS), 마스코트 립싱크가 결합된 형태로요. 회의 노트 정리나 후속 작업 위임에 활용할 수 있는 구조입니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;agentmemory 백엔드 옵션을 켜면 클로드 코드, 커서, 코덱스, OpenCode 같은 다른 에이전트와 동일한 메모리 저장소를 공유할 수 있어요. 한 곳에 정리된 컨텍스트를 여러 도구에서 같이 쓸 수 있습니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;개인적으로는 마스코트나 회의 참여 같은 부분이 호불호 갈릴 수 있다 싶었는데, OpenHuman이 향하는 방향은 일관되어 보입니다. AI 에이전트를 옆에 있는 동료처럼 느끼게 만들겠다는 디자인 의도가 기능 곳곳에 깔려 있습니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;누구에게 좋을까요?&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;AI 에이전트를 작업에 끼워넣어 본 적은 있지만 도구 간 단절 때문에 손을 놓은 사람&lt;/li&gt;&lt;li style="text-align:justify;"&gt;ChatGPT나 클로드에 매번 컨텍스트를 붙여넣는 게 답답한 사람&lt;/li&gt;&lt;li style="text-align:justify;"&gt;내 데이터는 가능하면 내 기기에 두고 싶은 사람&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;알아두면 좋을 점&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;OpenHuman은 출시 2주차의 초기 단계 프로젝트입니다. 80% 토큰 절감 같은 수치는 자기 보고된 값이고, 일부 외부 리뷰에서 install 스크립트 검토를 권장하고 있어요. 메인 기기에 바로 도입하기보다 보조 작업 환경에서 며칠 써본 뒤 판단하는 정도가 적당합니다. 118개 OAuth를 한꺼번에 연결하는 구조 자체가, 굉장히 많은 권한을 한 도구에 모아주는 일이라는 점도 인지하고 시도하는 게 좋습니다. 보안 관점에서 부담을 느끼는 분은 Linear나 GitHub처럼 업무 도구부터 시작하는 것도 한 방법입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;OpenHuman: &lt;a href="https://github.com/tinyhumansai/openhuman"&gt;https://github.com/tinyhumansai/openhuman&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3776/2_2.jpg" alt="Lenny's Podcast Dan Shipper"&gt;&lt;figcaption&gt;&amp;lt;출처: Lenny's Podcast 유튜브&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;h3 style="text-align:justify;"&gt;&lt;br&gt;&lt;strong&gt;2. 참고할 것:&lt;/strong&gt; &lt;a href="https://www.youtube.com/watch?v=4D3hDmGhFhA"&gt;&lt;strong&gt;1년 전 클로드 코드의 부상을 일찍 짚은 Dan Shipper의 12가지 새 예측&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;Lenny Rachitsky의 팟캐스트에 다시 출연한 Dan Shipper(댄 쉬퍼)의 12가지 예측이 5월 24일 공개됐습니다. Dan은 Every(에브리)의 공동창업자 겸 CEO로, Every는 30명 규모의 미디어·소프트웨어 회사입니다. 또 그는, 1년 전 같은 팟캐스트에서 "클로드 코드는 비개발자에게도 강력한 도구인데 사람들이 그걸 놓치고 있다"고 짚은 적이 있죠. 지금 보면 그의 예측은 얼추 들어맞은 것처럼 보입니다. (&lt;a href="https://www.lennysnewsletter.com/p/inside-every-dan-shipper"&gt;1년 전 출연 영상&lt;/a&gt;) 그래서 이번 새로운 12가지 예측 중, 프로덕트 메이커에게 의미 있어보이는 5가지를 추려보았습니다. 전체 내용이 궁금하신 분들은, 유튜브 영상을 참고 부탁드립니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;예측 1. 일의 미래는 코덱스 또는 클로드 코워크 안에서&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;일상 업무 자체가 코덱스나 클로드 코워크 같은 환경 안에서 이뤄지게 된다는 겁니다. 이메일도, 문서도, 리서치도 모두 그 안에서. Dan의 표현대로 작업의 새 "운영체제"가 되는 셈입니다. 기존엔 AI를 SaaS 안에 끼워 넣는 그림이었다면, 이제는 SaaS가 코덱스나 클로드 코워크 안의 브라우저로 열리는 그림으로 바뀐다는 게 핵심입니다. Dan 본인도 원래 클로드 코드를 가장 적극적으로 추천했던 사람인데, 지금은 코덱스를 주력으로 쓴다고 합니다. 다만 더 좋은 게 나오면 또 옮길 거라고 덧붙였죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;예측 2. 자동화는 거짓말이다&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;"Automation is a lie. Every agent needs a human." 자동화할 때마다 그 자동화가 잘 돌아가는지 확인하는 사람이 그 위에 필요하다는 의미입니다. Dan이 직접 vibe 코딩으로 만든 Proof라는 마크다운 에디터가 출시 다음 날부터 10분마다 다운됐고, 잠을 못 자고 코딩하다 팔꿈치에 활액낭염까지 왔다고 합니다(본인이 "vibe coder elbow"라고 부름). 거기서 영감을 받아 시니어 엔지니어 벤치마크를 만들었는데, 결과는 이렇습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;GPT 5.5와 Opus 4.7 plan 조합: 100점 만점에 약 60점&lt;/li&gt;&lt;li style="text-align:justify;"&gt;인간 시니어 엔지니어: 100점 만점에 80~90점&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Dan의 결론은 이렇습니다. 벤치마크는 글로 정리할 수 있는 문제에서만 점수를 매길 수 있는데, 어떤 문제를 풀어야 할지 정의하는 일 자체는 사람이 해야 한다는 겁니다. 그래서 AI가 자동화를 더 잘하게 돼도 그는 여전히 사람을 채용한다고 말합니다. Every 직원 규모도 1년 만에 15명에서 30명으로 두 배 커졌죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;예측 3. PM이 번성한다&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Every의 작문 앱 Spiral 책임자 Marcus(마커스)는 본업이 PM입니다. 그는 Axios에서 작문 제품 PM으로 큰 팀을 이끌며 연매출 수천만 달러까지 키운 뒤, 1년 정도 일을 쉬면서 AI에 푹 빠져 커서와 클로드 코드를 익혔다고 합니다. Dan은 그를 "lightly technical"이라고 표현하죠. 이는 직접 코딩하지는 않지만 데이터베이스 마이그레이션 같은 용어를 알고 코드를 보면 이해할 수 있는 수준이라는 뜻입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;지금 Marcus는 팀 누구보다 빠르게 제품을 출시하고, 사용자 한 명 한 명의 대화를 직접 보면서 다음 방향을 정합니다. Dan은 강한 프로덕트 감각과 가벼운 기술 이해에 AI 도구가 결합된 이런 사람을 "위험할 정도로 무서운 조합"이라고 표현합니다. 이젠 PM이 다른 사람의 손을 거치지 않고 직접 제품을 만들 수 있게 됐고, Dan은 AI에 푹 빠진 PM이라면 누구에게나 같은 길이 열려 있다고 봅니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;예측 4. 풀스택 디자이너가 슈퍼히어로가 된다&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이전엔 디자이너가 디자인을 넘기면 엔지니어가 "이대로 구현하긴 좀 힘들 것 같은데요" 같은 반응을 보이면서 갭이 생겼는데, 이제는 디자이너가 PR을 직접 만든다는 겁니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;Dan이 강조하는 건 차별화입니다. AI로 만든 페이지가 다 비슷해지는 시점이 되면, 결국 디자이너의 안목과 인터랙션 감각이 차이를 만들거든요. "AI로 짠 디자인은 보면 바로 AI 디자인 같다"는 게 그의 표현이죠. 이 예측이 맞는지는 미국 채용 시장 데이터로 확인할 수 있는데, 아직 디자이너 채용은 늘지 않고 있다는 게 Lenny의 관찰입니다. 1년쯤 더 지켜봐야 알 수 있을 것 같아요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;예측 5. Forward Deployed Engineer가 새 필수 역할&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;FDE(Forward Deployed Engineer)는 원래 컨설팅·B2B 솔루션 회사에서 고객 현장에 파견돼 기술·비즈니스 문제를 해결하는 엔지니어를 가리키는 용어입니다. Dan은 이 개념을 빌려와서, 회사 안의 AI 에이전트가 잘 돌아가게 책임지는 엔지니어를 같은 이름으로 부르고 있어요. AI 에이전트를 "고객 현장"처럼 다루면서 문제를 풀어주는 사람이라는 의미죠.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Every의 AI 엔지니어 Nitesh(니테시)가 그 역할인데, 대부분의 시간을 Slack에서 내부 에이전트 Claudy(클로디)와 대화하며 보낸다고 합니다. Claudy는 Every의 컨설팅 업무 전반을 운영하는 에이전트인데, "왜 이런 멍청한 짓을 했어, 이거 고치자" 같은 대화를 계속 주고받는 게 Nitesh의 일이죠. 코드도 짜지만, 본질은 에이전트를 봐주는 일에 가깝습니다. 큰 모델 회사들도 내부에 이런 팀을 두고 운영합니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;프로덕트 메이커가 가져갈 만한 것&lt;/strong&gt;&lt;/h4&gt;&lt;p style="text-align:justify;"&gt;Dan은 "어떻게 살아남느냐"는 질문에 단 하나로 답했어요. "Ride the models." 새 모델이 나올 때마다 내 작업에 직접 시도해 보는 것. 작년에 안 됐던 일이 올해는 될 수도 있으니 계속 "돌을 뒤집어 보는" 자세가 필요하다는 의미입니다. AI를 만드는 사람들도 어떻게 써야 잘 쓰는지 다 알지 못합니다. 진짜 사용자가 새 모델을 자기 일에 적용하면서 발견하는 영역이 따로 있고, 한국에서 일하는 프로덕트 메이커가 모델을 자기 맥락에 끼워 넣는 시도 자체가 일종의 발견이 됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;Lenny's Podcast 유튜브: T&lt;a href="https://www.youtube.com/watch?v=4D3hDmGhFhA"&gt;he AI paradox: More automation, more humans, more work | Dan Shipper&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;img src="https://www.wishket.com/media/news/3776/55550.png" alt="코덱스 활용 사례 52선"&gt;&lt;figcaption&gt;&amp;lt;출처: OpenAI Codex 활용 사례 페이지&amp;gt;&lt;/figcaption&gt;&lt;/figure&gt;&lt;h3 style="text-align:justify;"&gt;&lt;br&gt;&lt;strong&gt;3. 적용해볼 것:&lt;/strong&gt; &lt;a href="https://developers.openai.com/codex/use-cases"&gt;&lt;strong&gt;코딩 너머로 확장된 코덱스 활용 사례 52선&lt;/strong&gt;&lt;/a&gt;&lt;/h3&gt;&lt;p style="text-align:justify;"&gt;오픈AI 개발자 문서에는 코덱스로 어떤 작업을 할 수 있는지 보여주는 활용 사례 페이지가 있습니다. 최근 이 페이지가 12개에서 52개로 대폭 늘었어요. PRD 초안 작성, 현금흐름 예측, 회의 후속 작업까지 추가되면서, 코덱스를 전사 협업 도구로 넓히려는 오픈AI의 의도가 읽힙니다. 52개를 다 보긴 부담스러우니, 이 소식 역시 프로덕트 메이커에게 의미 있는 5개를 골라보았습니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;사례 1. PRD 초안 작성하기 (PM)&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;PRD(제품 요구사항 문서)를 쓸 때 PM은 보통 자료가 여기저기 흩어져 있는 상황을 마주합니다. Linear 프로젝트 정보, Slack 채널의 논의, Notion 문서, 회의 노트, 리서치 자료 같은 것들이죠. 이 자료들의 위치를 코덱스에 알려주고 PRD 초안을 요청하면, 흩어진 정보를 모아 검토 가능한 PRD로 정리해줍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;이를 위해선 먼저 PRD에 어떤 항목이 들어갈지 코덱스에 알려줘야 합니다. 문제 정의, 사용자, 요구사항, UX, 기술 고려사항, 출시 계획, 일정, 결정사항, 미해결 질문처럼 항목을 미리 정해주면 코덱스가 그 형식에 맞춰 채워줍니다. 권장 작업 순서는, 코덱스가 어떤 자료에서 무엇을 가져왔는지 보여주는 출처 정리표를 먼저 확인하는 것입니다. 그다음 요구사항과 미해결 질문을 다듬어가면 됩니다. 신뢰할 수 있는 PRD를 만들려면 출처 추적이 필수니까요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;사례 2. Figma 디자인을 코드로 전환하기 (디자인)&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Figma의 MCP 서버를 코덱스에 연결하면, 코덱스가 특정 디자인 노드의 컨텍스트, 변수, 에셋, 디자인 변형을 가져옵니다. 그다음 기존 코드베이스의 디자인 시스템에 맞춰 코드로 옮겨줍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;권장 순서는 디자인 컨텍스트 가져오기, 메타데이터 확인, 스크린샷 확보입니다. 구조와 참고 자료를 먼저 확보하고 구현에 들어가는 방식이에요. Playwright(브라우저 자동화 도구)로 결과 화면을 Figma 디자인과 비교하면서 반응형 동작과 인터랙션 차이를 반복해서 맞춰갑니다. 이 작업의 핵심은 이미 만들어진 디자인 시스템에 맞춰 번역하는 것입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;사례 3. 현금흐름 예측하기 (재무)&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;코덱스가 수식이 들어간 엑셀 파일(.xlsx)을 직접 만들어줍니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;코덱스에 입력할 데이터는 기초 현금, 예상 수입, 인건비, 외주 지급금, 부채, 세금, 자본 지출, 운전자본, 그리고 각 항목의 발생 시점입니다. 결과로 받는 건 편집 가능한 현금흐름 예측 엑셀이죠. 요약 탭에는 현금이 부족해지는 시점이 언제인지, 그리고 어떤 입력값 때문에 그 시점이 생기는지가 정리돼 표시됩니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;br&gt;생성된 엑셀을 코덱스 안에서 그대로 열어 수식, 시나리오, 가정을 검토하고 수정할 수도 있습니다. 같은 대화창에서 가정을 바꿔가며 시나리오를 비교해볼 수도 있고요. 코덱스가 코딩 도구를 넘어 재무 업무까지 다룬다는 오픈AI의 메시지가 가장 잘 드러나는 사례입니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;사례 4. 회의를 후속 작업으로 전환하기 (영업, CS)&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;Zoom 회의 녹취록과 자동 요약을 코덱스에 넣으면, 고객 미팅 후 후속 작업을 만들어줍니다. 코덱스가 핵심 내용, 리스크, 기회, 결정사항, 액션 아이템을 정리한 뒤 후속 이메일, 어카운트 플랜, CRM 업데이트, Slack 알림 초안까지 만들어주는 거죠. 물론 실제 전송은 사용자가 검토한 뒤에 합니다. 코덱스는 자동 발송하지 않고 초안 단계에서 멈추고요. 영업이나 CS 팀이 미팅 직후 20분쯤 들여 정리하던 작업을 검토 단계로 줄여줍니다. Zoom, Gmail, Slack, Google Docs, CRM을 함께 연결하면 효과가 더 커집니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&lt;strong&gt;사례 5. 목표 따라가기 - /goal (장기 자율 실행)&lt;/strong&gt;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;앞 네 가지가 코덱스와 사람이 주고받으면서 진행하는 작업이라면, 이건 코덱스가 종료 조건까지 자율적으로 작업하는 방식입니다. /goal 명령어를 쓰면 코덱스가 한 번 응답하고 멈추는 대신, 미리 정해둔 종료 조건이 충족될 때까지 작업을 계속 이어갑니다.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;코덱스에 명확하게 알려줘야 할 건 네 가지입니다.&lt;/p&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;목표&lt;/strong&gt;: 무엇을 달성할 것인가&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;종료 조건&lt;/strong&gt;: 어떤 조건이 충족되면 끝나는가&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;출발 자료&lt;/strong&gt;: 먼저 읽어야 할 파일, 문서, 로그, 계획&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;진행 확인 방법&lt;/strong&gt;: 매 체크포인트에서 진척을 증명할 명령어나 산출물&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:justify;"&gt;데이터베이스 마이그레이션, 큰 코드 리팩토링, 배포 재시도 루프, 실험, 프로토타입처럼 체크포인트 단위로 독립적으로 진행할 수 있는 작업에 적합합니다. 몇 시간 동안 코덱스가 알아서 돌아가는 동안 사람은 다른 일을 할 수 있어요.&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;h4 style="text-align:justify;"&gt;&lt;strong&gt;다섯 사례의 공통점&lt;/strong&gt;&lt;/h4&gt;&lt;ul&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;첫째&lt;/strong&gt;, 여러 출처에서 자료를 모읍니다. PRD는 Linear와 Slack과 Notion에서, 회의 후속은 Zoom과 Gmail과 CRM에서, 디자인은 Figma에서. 코덱스가 일종의 허브 역할을 하면서 흩어진 출처를 묶어주는 셈이에요.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;둘째&lt;/strong&gt;, 산출물이 항상 사람이 검토할 수 있는 형태로 나옵니다. PRD 문서, 엑셀, 코드 PR, 이메일 초안. 코덱스는 결과를 만들어내고 멈추고, 최종 결정은 사람이 합니다.&lt;/li&gt;&lt;li style="text-align:justify;"&gt;&lt;strong&gt;셋째&lt;/strong&gt;, 같은 대화창에서 후속 작업을 이어갈 수 있습니다. 한 번 만든 PRD에 새 자료를 더해 다듬거나, 현금흐름 모델의 가정을 바꿔 시나리오를 추가하는 식이에요. 한 번의 응답으로 끝나지 않고 같은 맥락에서 계속 협업이 이어집니다.&lt;/li&gt;&lt;/ul&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;blockquote&gt;&lt;p style="text-align:justify;"&gt;Codex 활용 사례 52선 전체 보기: &lt;a href="https://developers.openai.com/codex/use-cases"&gt;https://developers.openai.com/codex/use-cases&lt;/a&gt;&lt;/p&gt;&lt;/blockquote&gt;&lt;div class="page-break" style="page-break-after:always;"&gt;&lt;span style="display:none;"&gt;&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;p style="text-align:justify;"&gt;다음 주에도 여러분이 놓치지 말아야 할 프로덕트 메이커 소식을 정리해서 찾아뵙겠습니다. 요즘 프로덕트 메이커 콘텐츠가 도움이 되셨다면, 꼭 작가 알림 설정과 좋아요를 부탁드립니다. 콘텐츠 내용 중 잘못된 정보나 정정이 필요한 부분이 있다면 댓글로 알려주세요. 빠르게 수정하겠습니다. 다음 주에 또 만나요!&lt;/p&gt;&lt;p style="text-align:justify;"&gt;&amp;nbsp;&lt;/p&gt;&lt;figure class="image image_resized" style="width:100%;"&gt;&lt;a href="https://yozm.wishket.com/magazine/@FinalCatti/"&gt;&lt;img src="https://www.wishket.com/media/news/3776/image7.gif"&gt;&lt;/a&gt;&lt;figcaption&gt;콘텐츠가 마음에 드셨다면, 꼭꼭 작가 알림 설정과 좋아요를 부탁드립니다!&lt;/figcaption&gt;&lt;/figure&gt;&lt;p&gt;&amp;nbsp;&lt;/p&gt;&lt;p style="text-align:center;"&gt;&lt;span style="color:#999999;"&gt;©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.&lt;/span&gt;&lt;/p&gt;&lt;/b&gt;]]&gt;</content:encoded></item></channel></rss>