지난 3년간 AI 기반 UX 디자인 효율화를 주제로 연구를 진행하며, AI로 가상의 사용자를 생성해 부족한 사용자 데이터를 보완하는 방식을 소개해 왔다. 다만 지금까지 늘 ChatGPT나 클로드 등 해외 AI 모델만으로 실험을 진행하며, 국내 사용자 데이터와 한글 활용에 대한 의구심이 있었다.
그러다 마침 한국어에 최적화된 국내 AI 모델인 솔라 프로 2(Solar Pro 2) 출시를 접하면서, 이 모델을 활용하면 국내 사용자를 보다 정교하게 묘사할 수 있지 않을까 하는 생각이 들었다.
그래서 이번 글에서는 국내 AI 모델로 사용자를 시뮬레이션한 과정과 그 결과를 정리했다.

국내 AI 스타트업 업스테이지(Upstage)는 올해 5월, 솔라 프로 2 모델을 새롭게 공개했다. 이 모델은 소형 언어모델(sLLM)로 작고 빠르지만, 대형 모델 못지않은 똑똑한 AI라고 한다.
특히 추론 능력을 강점으로 꼽았다. 추론 능력이 뛰어나다는 것은 단순히 정보를 기억하거나 단어를 예측하는 수준을 넘어, 주어진 정보를 분석하고 종합해 새로운 지식을 도출하는 데 뛰어나다는 뜻이다.
본격적인 실험에 들어가기 전, 업스테이지의 LLM 모델을 체험할 수 있는 ‘플레이그라운드(Playground)’에서 모델에게 질문을 던졌다. 설정에서 모델을 솔라 프로 2로 선택한 다음, 플레이그라운드의 쓰임새를 물었다. 그러자 약 4초 동안 추론 과정을 거쳐 아래와 같은 답변을 생성했다.


솔라 프로 2는 한국어 처리 측면에서도 우수한 성능을 가지고 있다고 한다. 물론 한국어 외에도 영어, 일본어 등 다국어를 지원하지만, 한국어 처리에서는 그 어떤 모델보다 뛰어난 점수를 기록했다. 더 구체적으로 이야기하면, 다른 LLM 대비 한국어 임베딩 정확도가 높다고 한다.
임베딩(Embedding)은 입력한 텍스트를 AI가 이해할 수 있도록 숫자로 변환하는 기술을 의미한다. 이를 활용하면 텍스트의 문맥을 함께 반영하므로, 단순히 단어 철자의 유사성만을 기준으로 변환하던 이전 기술과 차이를 보인다.
[예시]
1. 문맥을 반영하지 않는 이전 방식
- 철자가 비슷한 소리와 소비를 유사한 단어로 처리
- 철자가 비슷하지 않은 소비와 지출을 연관 없는 단어로 분류
2. 문맥을 반영하는 임베딩 방식
- 철자가 비슷해도 문맥을 반영해 소리와 소비를 연관 없는 단어로 분류
- 소비와 지출은 의미상 가까운 단어로 인식
이처럼 AI 모델이 단순 철자를 비교하는 대신 의미를 이해하게 하려면 임베딩 기술이 중요한 역할을 한다. 따라서 이는 LLM 모델의 전반적인 성능을 좌우하는 핵심 기술이라 할 수 있다.
이렇게 한국어로 사고하고 판단하는 능력이 뛰어난 솔라 프로 2의 강점을 활용해, 행동 패턴을 예측하는 간단한 실험을 진행했다.
앞서 AI로 가상의 퍼소나를 생성하거나 실제 사용자의 내면적 특성 데이터를 기반으로 클론 에이전트를 생성한 다음, 인터뷰 시뮬레이션을 수행하는 방법을 소개했다. 이 방법들 모두 실제 사용자와 대면해 리서치를 진행하기가 어렵다는 현실적 제약을 극복하기 위한 솔루션 중 하나였다.
이번에 수행할 행동 패턴 예측도 기본적인 목적과 작동 방식은 비슷하지만, 결과물에서 차이가 있다.
예를 들어 인터뷰 시뮬레이션에서는 특정 성향을 지닌 가상의 퍼소나나 클론 에이전트가 인터뷰 질문에 대해 자신의 이야기, 생각, 가치관, 경험 등을 말로 표현한다. 그럼 우리는 만들어진 질적 데이터를 취합하여 분석하는 방식으로 최종 인사이트를 도출하게 된다. 실제 사용자 인터뷰를 할 때와 동일한 프로세스다.
반면 행동 패턴 예측은 특정 상황에 대한 시나리오를 제시하고, 그 상황에서 ‘사용자’가 어떤 행동을 보일지를 예측하는 방식이다. 여기서 ‘사용자’는 인터뷰 시뮬레이션과 마찬가지로 AI를 활용해 미리 성향이 정의된 퍼소나로 만들거나, 실제 인간의 내면적 특성 데이터를 제공해 성향을 설정할 수 있다.
이번 실험에서는 한국어 임베딩 정확도가 높고 장문의 문서를 처리할 수 있는 솔라 프로 2를 최대한 활용하기 위해, 내면 특성을 제공하는 클론 에이전트 생성 방식을 선택했다. 미리 확보한 클론 에이전트의 내면적 특성 데이터는 약 14,000자(20,474 토큰, A4 기준 약 13쪽, 공백 제외) 분량이며, 한국어로 이루어져 있다.
이러한 데이터를 기반으로 솔라 프로 2가 복잡한 내면적 특성을 구조화하고 행동 패턴을 더 정교하게 예측할 것으로 기대하고 실험을 진행했다.
다만 솔라 프로 2는 RAG를 지원하지 않는다. 즉, 데이터를 RAG 방식으로 처리하지는 않지만, 임베딩 기술로 문맥을 이해할 수 있기에 충분히 시뮬레이션이 가능하다고 판단했다.
행동 패턴을 예측하는 목적은 UX 전략 수립과 디자인 의사결정을 지원하기 위함이다. 가상 퍼소나나 클론 에이전트로 사용자를 모방하는 다른 방법들처럼, 타깃 사용자의 내면·심리적 특성을 구조화해 프로덕트 디자인이나 마케팅 전략에 직접 적용할 인사이트를 도출하는 것이 목표다.
먼저 어떤 사용자의 행동 패턴을 시뮬레이션할지를 정한 다음, 해당 사용자의 데이터를 확보해야 한다. 본 실험에서는 앞서 클론 에이전트를 생성할 때 수집했던 데이터를 그대로 활용했다. 이 데이터는 가치관, 성격, 라이프스타일, 취향, 미래 전망, 관심사, 의사결정 방식, 감정적 경험까지 총 8개 카테고리로 구성된 52개 질문에 대한 응답으로, 약 14,000자(20,474 토큰) 분량이다.
AI가 데이터를 효율적으로 해석할 수 있도록 전처리 과정을 거쳤다. 이 단계에서는 오타를 수정하고 응답을 카테고리별로 정리했다. 예를 들어 메인 질문은 52개였지만, 더 풍부한 데이터를 얻기 위해 던진 후속 질문까지 포함하면 약 150개의 응답이 섞여 있었다. 이를 52개 메인 질문 기준으로 다시 분류해, AI가 방대한 데이터를 빠르게 이해하고 내면의 패턴을 파악할 수 있도록 했다.
업스테이지의 플레이그라운드에서는 별도 문서를 첨부해 데이터를 제공할 수는 없었다. 따라서 52개 질문에 대한 응답을 프롬프트 입력창을 통해 순차적으로 전달했다. 이번 행동 패턴 예측을 위한 시나리오는 금융 앱에 ‘자동 저축 기능’이 새롭게 업데이트된 상황으로 설정했고, 이 기능에 대한 사용자의 반응과 행동을 예측하도록 했다.

플레이그라운드 우측 화면에는 시스템 프롬프트를 입력할 수 있는 공간이 따로 있다. 여기에 AI가 수행할 역할을 넣어주면 되는데, 이번 테스트에서는 다음과 같은 프롬프트를 입력했다.
너는 인간 사용자의 대행자 역할을 하는 모방 전문가야. 내가 제공한 인간 사용자의 내면 탐구 인터뷰 응답에서의 3가지 측면(가치관, 의사결정 패턴, 감정 반응)을 기반으로 ‘자동 저축 기능’에 대한 예상 반응 및 최적화 방안을 제시해 줘.
그 아래 위치한 Max Tokens과 Temperature는 각각 생성될 텍스트의 최대 길이와 결과물의 다양성을 설정할 수 있는 변수인데, 이번 실험에서는 기본 설정값을 그대로 유지했다.
솔라 프로 2와 함께 사용자의 내면 탐구 인터뷰 응답을 바탕으로, 그의 가치관, 의사결정 패턴, 감정 반응까지 3가지 축을 분석했다.
P1의 내면 탐구 응답 분석 결과
- 가치관: 가족 안정(1.00), 성평등(1.00), 자기 보호(0.95) → 금융 안정성 선호
- 의사 결정 패턴: 분석적 직관(0.99), 회피적 갈등 해결(1.00) → 리스크 회피형 금융 행동 선호
- 감정 반응: 불평등 분노(0.95), 후회 불안(1.00) → 사회적 영향력에 민감, 감정적 트리거에 취약
P1은 가족 안정과 자기 보호를 중시하는 동시에 감정적 트리거에 민감한 사용자입니다. 자동 저축 기능은 유연성, 감정 연계, 사회적 영향력을 강조할 때 높은 효과를 발휘하며, P1의 회피적 성향을 보완하기 위한 비공개형 동기 부여 전략이 필수적입니다.
분석 결과, AI는 해당 사용자가 리스크를 회피하고 금융적 안정성을 중시하는 성향을 보인다고 판단했다. 또한, 가족의 안정을 중요하게 여기고 사회적 영향력에 민감하게 반응하는 특성도 드러났다.
이러한 특성을 지닌 사용자가 자동 저축 기능에 어떻게 반응할지 예측한 결과는 다음과 같다.
1. 시나리오: 월급의 10% 자동 저축 기능 활성화 시, P1의 반응 예측
2. 예측 행동: "장기적 가족 안정" 메시지에 공감해 기능 사용
3. 잠재적 페인 포인트: 긴급 지출 시 인출 제한 상황에 스트레스 발생 → 회피적 대응(기능 일시 중지)
4. 개선 및 최적화 전략:
- 탄력적 저축 플랜: 목표 금액 조정 가능 + "긴급 인출 시 페널티 없음" 명시.
- 감정 연계 알림: "이번 달 저축액이 가족의 주말여행 예산에 근접했습니다!"
5. 추후 계획: "가족 연계 저축" 기능 MVP 개발 → P1 스타일 사용자 그룹 테스트
솔라 프로 2는 월급의 10%를 자동으로 저축하는 기능이 추가되었을 때, 사용자는 가족의 장기적 안정을 위해 해당 기능을 적극 활용할 가능성이 높다고 분석했다. 그러나 긴급 지출이 필요할 때 인출이 제한되는 상황은 사용자의 유연성과 회피적 성향을 고려할 때 치명적인 페인 포인트로 작용할 수 있다. 이를 보완하기 위해 목표 금액 조정이나 긴급 인출 허용 기능을 추가하는 등 유연성을 높이는 전략이 효과적일 것이라고 제안했다.
또한, 지속적인 저축을 유도하기 위해서는 ‘가족’이라는 감정적 키워드를 활용해 정서적 공감을 자극하는 접근이 유용하다는 결과를 도출했다. 이러한 인사이트를 기반으로, 저축의 탄력성과 감정적 연결을 동시에 강화하는 ‘가족 연계 저축’ 기능을 새롭게 설계하는 방향이 향후 전략으로 나왔다.
이번 실험에서는 솔라 프로 2를 활용해 행동 패턴 시뮬레이션을 진행했다.
솔라 프로 2는 다른 LLM 모델보다 한국어 처리 능력이 뛰어나고 고도화된 추론 능력을 갖춘 모델로 소개되었는데, 실제로 대형 LLM 모델 없이도 예측이 동작했다. 특정 성향을 가진 국내 사용자가 왜 일정 기능을 사용하는지, 또 어떤 상황에서 사용을 중단할 가능성이 있는지를 예측하고, 이를 바탕으로 기능 개선 아이디어도 도출할 수 있었다.
다만 이번 실험에서 사용한 플레이그라운드는 테스트용 인터페이스이므로, 솔라 프로 2 모델을 제대로 활용하려면 API를 써야 한다. 즉, 이번 샘플 테스트 결과를 참고하며 API로 전환해 실제 서비스와 연동하는 방식으로 적용할 수 있다.
한편, 이러한 행동 패턴 예측 결과를 활용해 새로운 인사이트를 얻으려면, 아래와 같은 방법을 시도해도 좋다.
1. 사용자 여정맵(User Journey Map) 시각화
자동 저축 기능을 사용하는 P1 사용자의 이용 동기와 페인 포인트 발생 지점을 텍스트로만 분석하는 데서 나아가, 이를 사용자 여정맵 형태로 시각화할 수 있다. 이렇게 하면, 터치포인트별 잠재적 불편 요소와 개선 기회를 더욱 구체적으로 파악할 수 있다.
2. 인터뷰 시뮬레이션
행동 패턴 예측 결과를 정성적 인터뷰 시뮬레이션과 함께 활용할 수 있다. 예를 들어 “긴급 지출이 필요할 때 인출이 제한된 상황”에서 사용자가 느끼는 감정과 사고 과정을 더 깊이 이해하고자, 해당 퍼소나를 대상으로 가상 인터뷰를 진행하는 방식이다. 이 방법으로는 행동의 심리적 배경과 의사결정 근거를 보다 명확히 파악할 수 있다.
3. A/B 테스트 시뮬레이션
이번 실험은 한 명의 사용자를 대상으로 진행했지만, 이를 확장해 여러 유형의 사용자 그룹을 생성한 뒤 A/B 테스트 시뮬레이션을 수행할 수 있다. 예를 들어 ‘시간 절약형 사용자 그룹’과 ‘기능 탐색형 사용자 그룹’으로 나누어 특정 상황에서의 행동 패턴을 비교하면, 어떤 그룹이 어떤 기능을 더 선호하는지 파악할 수 있다. 이를 통해 실제 제품 개발 단계에서 UX/UI를 개선하거나 기능 최적화 전략을 세울 수 있다.
무엇보다 솔라 프로 2와 진행한 이번 시뮬레이션은 단일 사용자를 대상으로 한 초기 실험에 불과하다. 앞으로 이 모델에 더해 다양한 데이터셋과 시나리오를 적용한다면, 사용자 이해의 폭을 넓히며 제품 설계 단계에서 더욱 정밀한 의사결정을 지원하는 도구로 발전할 수 있을 것이다.
©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.