에이전틱 서치: '추론 모델'이 쏘아 올린 검색 시장의 변화(2)
*에이전틱 서치: ‘추론 모델’이 쏘아 올린 검색 시장의 변화(1)에서 이어지는 글입니다. 1화에서는 AI 검색 스타트업 ‘라이너’의 허훈 테크리드가 검색 시장에서 가장 핫한 키워드 중 하나인 ‘에이전틱 서치’가 주목받게 된 배경을 소개하며, ‘추론(reasoning) 모델’의 등장이 핵심적인 변화를 만들어냈음을 이야기했습니다. 이번 글인 2화에서 허 테크리드는 추론 모델의 등장으로 촉발된 비즈니스 모델 변화와 고객 경험의 변화에 대해 이야기합니다.
에이전틱 서치의 대표적 예시: 오픈AI의 딥 리서치
딥 리서치가 나온 지 3개월 정도밖에 안 된 거 아시나요? 테크 분야, 특히 AI 분야 트렌드는 굉장히 빠르게 변화하고 매일, 매주 새로운 것이 등장하기 때문에 이 빠른 변화가 매우 놀랍습니다.
오픈AI가 올해(2025년) 2월에 출시한딥 리서치(Deep Research)는 에이전틱 서치의 대표적인 예시입니다. 딥 리서치는 광범위한 온라인 정보를 수집하고 요약하는 리서치 작업을 위해 설계된 기능입니다. 사용자의 질의에 대해 수많은 추론 과정을 거치면서 검색, 문서 읽기 등의 행동(action)을 수행하고 최종적으로 리포트 형태의 답변을 작성해 줍니다.
딥 리서치는 오픈AI의 O1 모델과 같은 강화학습(Reinforcement Learning)으로 학습된 추론 모델 기법을 사용했다고 명시했습니다. 이는 추론 모델을 통해 Lv 4 수준의 에이전트 자율성을 달성하려는 시도로 이해될 수 있습니다. 딥 리서치 출시 이후 비슷한 제품들이 우후죽순 등장했습니다. 퍼플렉시티(perplexity), 그록(Grok), 제미나이(Gemini), 그리고 저희 라이너(Liner)도 딥 리서치를 출시했습니다.
흥미롭게도, 추론 과정(모델이 생각하는 과정)을 사용자에게 보여주는 것이 답변에 대한 신뢰도를 높이는 부수적인 효과를 가져온다는 관측도 있습니다. 사용자가 AI의 사고 과정을 보면서 결과를 더 납득하게 되는 것이지요.
대표적으로 Y 콤비네이터의 개리 탠(Garry Tan)은 추론 과정을 성실히 보여주는 것이 “사용자 신뢰를 크게 높여”준다고 하기도 했습니다. 답변의 신뢰성을 가장 중요한 가치로 보는 라이너 입장에서는 추론 모델을 활용하는 것이 서비스의 가치를 높이는 데 효과적 역할을 할 수 있다는 신호를 얻었다고도 볼 수 있습니다.

추론 모델이 쏘아 올린 가격 패러다임의 변화
이러한 흐름은 비즈니스 모델에도 변화를 가져왔습니다.
기존에는 소프트웨어를 서비스로서 제공한다는 개념의 ‘SaaS(Software as a Service)’가 각광을 받았습니다. 여러분들이 자주 사용하는 슬랙, 노션 등이 기존의 대표적인 SaaS 제품입니다. 이러한 기존 사스 제품에서는 보통 사용자 규모 당(per seat) 비용을 부과했습니다. 거기에 사용할 수 있는 기능이 추가되면 비용이 더 높아졌습니다.
그런데 추론 모델을 활용한 제품에 기존 SaaS 같은 가격 모델을 적용하는 것에 대한 의문과 미래지향적 고민들이 시장에 등장하기 시작했습니다.
이해하기 쉽게 설명하자면 이렇습니다. 예를 들어 딥 리서치 구독 금액이 월 10달러라고 해보겠습니다. 어떤 사람은 딥 리서치를 매일 수 천 번 쓰면서 엄청나게 복잡한 문제를 해결하려 합니다. 이 사람이 얻어 가는 부가가치는 매우 크겠지만, 딥 리서치를 제공하는 회사는 손해입니다. 딥 리서치는 결론을 내릴 수 있을 때까지 반복적으로 수행하는 구조이기 때문에, 아주 복잡한 질의를 한다면 그걸 완수하기 위해 컴퓨팅 자원을 계속 사용할 테니까요.
그렇다면 기존처럼 시트 당 비용을 부과하는 방식에서는 ROI(Return On Investment)를 충분히 내기 어려워집니다.
오픈AI의 답은 높은 요금제를 만드는 것이었습니다. 그들은 2024년 12월 o1 추론 모델을 내놓으며, 200달러짜리 프로(Pro) 요금제를 내놓습니다. 연구자, 엔지니어, 전문가 등 업무에서 AI를 적극 활용하려는 고급 사용자나 기업형 파워유저를 주 타깃으로 한 요금제입니다. 정말로 잘 쓸 사람들은 높은 비용을 내고 부가가치를 내라는 겁니다.
부가가치를 충분히 낼 수 있는 많은 이들은 이렇게 비싼 요금제에도 불구하고 챗GPT 프로(ChatGPT Pro)를 사용했습니다. 특히 지식 노동자들에게 큰 효용을 준다는 점이 빠르게 입증되어 지식 노동자들 사이에서 활발히 사용되기 시작했습니다. 그리고 1등 기업이 가격 체계에서 이런 패러다임을 가져가다 보니, 후발주자들은 이 여정을 오히려 더 쉽게 따라갈 수 있게 되었습니다.
사실 몇 년 전부터 기존의 ‘소프트웨어 애즈 어 서비스 Software as a Service’가 아닌 ‘서비스 애즈 어 소프트웨어 Service as a Software’가 등장한다는 전망이 있어왔습니다. 소프트웨어 애즈 어 서비스라는 개념은, 소프트웨어 자체를 하나의 서비스로 판매하는 개념입니다. ‘노션’이라는 소프트웨어를 판매하는 것이지요. 하지만 서비스 애즈 어 소프트웨어는 딥 리서치와 같이 ‘리서치’라는 서비스를 소프트웨어로 판매한다는 것입니다.

실리콘밸리의 유명한 VC 사라 타벨(Sarah Tavel)은 2023년에 “AI 스타트업: 소프트웨어 말고 워크를 팔아라(AI startups: Sell work, not software)”라는 글을 썼습니다. 서비스 애즈어 소프트웨어와 같은 맥락에 있는 이야기지요. 딥 리서치 그리고 챗GPT 프로는 이러한 변화하는 비즈니스 패러다임을 증명하는 제품이었다고도 할 수 있습니다.
추론모델이 쏘아 올린 고객 경험의 변화
또 한 가지 눈에 띄는 변화가 있습니다.
딥 리서치는 태생적으로 느립니다. 수많은 추론과 분석을 거친 이후에 답변을 내기 때문입니다. 그런데 우리는 인터넷 세상을 마주한 뒤부터 결과가 느리게 나오는 것을 좋아해 본 적이 단 한 번도 없었습니다. 페이스북, 구글, 네이버와 같은 서비스에서 느리다는 것은 죄악이나 다름 없었습니다.
하지만 최근에는 속도의 효용에 대한 가치 판단이 조금씩 달라지고 있습니다.LLM이나 추론 모델이 활발히 활용되고 있는 현 세대에서는 ‘Delayed Gratification’, 즉 ‘지연된 만족’이라는 개념이 중요해지고 있는데요. 쉽게 말하면, 당장 빠르지만 틀리게 대답하는 것보다 조금 느리더라도 더 정확하고 신뢰할 수 있는 답을 주는 걸 목표로 한다는 것입니다. 마치 우리가 시험 문제를 급하게 풀기보다, 한 번 더 생각하고 푸는 게 더 좋은 결과를 낳는 것처럼 말입니다. 사용자들도 이제는 이 느림을 감내할 가치가 있다고 느끼기 시작한것입니다.
사실 챗GPT가 처음 나왔을 때의 경험도 전에 없던 것입니다. 답변을 한번에 다 보여주면 오래 걸리니, 토큰 단위로 차례로 답변을 보여주는 ‘스트리밍 리스폰스’ 방식도 전에 없던 경험인데요. 결국 이러한 ‘지연된 만족*’의 추구는 사용자 경험뿐 아니라, 인공지능이 생각하고 판단하는 방식 자체가 한 단계 진화하고 있다는 뜻입니다.
*지연된 만족: 즉각적으로 얻을 수 있는 보상을 참아내고 더 크고 나은 보상을 미래에 얻기 위해 현재의 욕구를 조절하는 능력을 뜻하는 심리학 용어.
이런 방향은 AI를 설계하는 방식에도 영향을 주고 있습니다. 예전에는 단순히 빠르게 답을 잘 뽑아내는 모델이 좋다고 여겨졌다면, 이제는 AI가 ‘이게 정말 맞는 답일까?’ 하고 스스로 고민하고 판단하는 구조가 더 주목받고 있는데요. 이건 인간의 두뇌처럼 장기적인 보상을 위해 인내하고 조절하는 능력을 AI에 구현하려는 시도라고 볼 수 있습니다. 그래서 딥 리서치처럼 시간이 좀 걸리더라도, 결국 더 믿을 수 있는 결과를 주는 AI가 앞으로 더 많은 사람들에게 선택받게 될 수 있습니다.
라이너의 에이전틱 서치
저희도 현재 추론 모델을 적용한 ‘딥 리서치’ 기능이 있습니다. 검색 단계에서 AI 모델을 적용할 수 있는데 거기서 ‘라이너 프로 리즈닝’ 모델도 이용할 수 있는데요. 라이너 프로 리즈닝은 정확성을 측정하는 벤치마크 SimpleQA에서는 세계 최고 수준으로, 95.3점을 기록했습니다. 현재는 1화에서 전한 에이전틱 서치 흐름에 따라 저희도 Lv 4의 에이전틱 시스템을 개발하고 있습니다.
저희가 활용하는 에이전트 도식을 간단히 소개해보겠습니다. 왼쪽은 ‘검색엔진’, 오른쪽은 ‘에이전트’입니다. 에이전트 시대에도 검색 엔진을 레버리지하고 있는 셈입니다.

맨 처음 사용자의 질의가 들어오면, 난이도를 판단하는 과정을 거칩니다(Decide Task Decomposability). 한두 번의 검색으로 풀리지 않는 문제가 있을 텐데요. 예를 들어 ‘지난 10년간의 재생 가능 에너지 동향과 미래 발전 방향’이라는 질의는 굉장히 많은 검색이 필요할 겁니다. 한 번 검색한 결과를 재활용하면서 다음에 어떤 결과를 생성할 것인지 등 복합적인 판단이 필요하지요. 이렇듯 사용자의 질의가 한 번의 검색으로 풀릴 수 있는 것일지, 복합적인 판단이 필요한 것일지 그 ‘난이도’를 파악합니다.
복합적인 검색이 필요한 경우에는, 이를 수행하기 위해 거쳐야 하는 작업을 에이전트가 생성하고(Decompose Task), 각각의 문제를 풀기 위해 어떤 검색어를 생성해야 할지도 에이전트가 직접 설정합니다. 즉, 한 번에 해결하기 어려운 질의인 경우에는 에이전트가 보다 작은 단위로 질의를 분할합니다.
그다음에는 질의를 해결하기 위해 가장 적합한 검색어를 생성합니다(Task Parer). 이렇게 얻은 결과물을 통해 사용자에게 답변을 전달합니다.
저희가 집중하는 것은 단순한 답변만이 아니라, 답변 내용의 출처를 정확히 보여주는 것입니다. 그래서 저희는 문장의 출처를 바로 알 수 있도록 하는 기술과 UI를 만드는 데 집중하고 있습니다.

또 챗GPT와 같은 서비스들은 종결적인 경험(거기서 모든 것이 끝나는)을 지향하는 반면, 라이너는 다음 여정으로 나아갈 수 있도록 탐색(exploration)을 장려하는 제품을 만들고 있기 때문에 이러한 영역에 집중하는 것입니다. 챗GPT 같은 서비스는 답변을 받고 다른 곳을 탐색할 수 있도록 연결하지는 않지만, 저희가 제공하는 출처는 20~30% 정도가 클릭하는 경향이 있습니다.
이를 구현하기 위해서는 HTML 문서를 기계가 이해하기 쉬운 형태로 변환(파싱)하고 세부 단위로 나누는(청킹, chunking) 기술이 필요합니다. 웹사이트 HTML은 통일된 규칙이 없어 파싱 규칙이 제각각인 경우가 많아 기술적으로 어렵고 비용이 많이 듭니다. 하지만 저희는 이 경험이 매우 중요하다고 판단하여 기술 투자를 하고 있습니다. 이러한 투자가 해자(moat)가 된다고 단정할 수는 없지만, 에이전트 시스템이 나아가야 할 방향성에 대한 베팅이라고 생각합니다.
저희의 목표는 '제로 할루시네이션(Zero Hallucination)'입니다. 답변의 정확성을 높이겠다는 것입니다. 라이너는 현재도 신뢰할 수 있는 출처를 보여주는 알고리즘을 강점으로 가지고 있습니다. 하지만 에이전틱 서치 시대에는 모델 자체가 이런 역할을 수행해야 합니다. 그래서 모델 수준에서 신뢰성을 확보하고 이를 사용자에게 효과적으로 전달하는 방법을 지속적으로 모색하고 있습니다.
마치며
1편과 2편을 통틀어 정리하자면 이렇습니다.
- LLM의 성능이 좋아지며 ‘에이전틱’한 액션에 대한 사람들의 기대치가 높아졌습니다.
- 이에 따라 검색 시장에서는 ‘에이전틱 서치’라는 용어가 업계에 널리 활용되기 시작했습니다.
- 추론(resoning) 모델은 이러한 현상을 가속화하는 데에 핵심적인 기여를 하고 있는 모델 패러다임입니다.
- 추론 모델 패러다임은 모델 수준에서 그치지 않고 제품 수준으로 빠르게 확장 적용되고 있습니다.
- 추론 모델은 필연적으로 긴 구동 시간을 필요로 하기에, 새로운 비즈니스 모델이 제안될 것입니다.
- 이는 새로운 관측은 아니며, 계속해서 예측되어 온 미래이지만 엄청나게 빠르게 다가오게 되었습니다.
- 그리고 이러한 발전은 기존과 다른 비즈니스 모델 설계에 대한 고민으로 이어지게 되었습니다.
- 라이너(Liner) 역시 이러한 Market Competition에서 제로 할루시네이션을 목표로 치열하게 싸우는 중입니다.
결국 지금의 변화는 단순히 기술의 발전만이 아니라, 우리가 '검색'이라는 행위를 어떻게 받아들이고 기대하는지가 근본적으로 달라졌다는 뜻입니다. 검색이 단순한 정보 조회에서, ‘생각하고 판단하는 에이전트’를 기대하는 방향으로 이동하고 있는 것입니다. 이 흐름의 중심에는 추론 모델이 있고, 그 위에서 에이전틱 서치와 딥 리서치 같은 새로운 검색 경험이 만들어지고 있습니다. 빠르고 간편한 답보다, 복잡하고 믿을 수 있는 결과를 선택하는 사람들도 점점 많아지고 있고요.
라이너도 이 변화에 발맞춰 ‘제로 할루시네이션(Zero Hallucination)’이라는 목표 아래, 신뢰할 수 있는 검색 경험을 만들기 위해 기술적·제품적 도전을 이어가고 있습니다. 사용자가 무엇을 찾는지를 넘어, 왜 그 정보를 믿을 수 있는지까지 설계하는 시대. 그 시작점에 에이전틱 서치가 있습니다. 앞으로의 검색은, 단순히 질문에 답하는 것이 아니라, ‘생각을 함께 나누는 동료’를 만드는 일일지도 모릅니다.
감사합니다.

©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.