어피니티 다이어그램(Affinity Diagram)은 리서치로 얻은 데이터를 유사한 주제별로 묶어, 핵심 인사이트를 도출하는 UX 모델링 기법이다. 크게 네 가지 단계로 진행된다. 먼저, 리서치 과정에서 수집한 사용자 의견 데이터를 전부 나열한다. 그런 다음 유사한 의견끼리 모아 그룹을 형성하는 ‘그룹화’ 작업을 한다. 그룹화 이후에는 각 그룹이 가진 의미를 한눈에 확인할 수 있도록 적합한 제목을 붙이는 ‘라벨링’을 수행한다. 마지막 단계에서는 데이터를 다시 한번 검토하면서 가장 중요한 그룹을 선정하고, 내부 이해관계자들이 투표를 통해 우선순위를 매긴다. 이러한 과정을 거치면 복잡하게 나열된 정성 데이터에서 패턴을 발견하고 인사이트를 도출할 수 있다. 또한, 데이터를 어떤 기준으로 묶느냐에 따라 다양한 관점의 인사이트가 나올 수 있다. 따라서 미리 특정 라벨을 정해놓고 데이터를 분류하기보다는, 패턴을 발견한 후 라벨링하는 것이 중요하다. 그러나 수집한 정성 데이터의 양이 많아질수록 어피니티 다이어그램을 만드는 데 들어가는 시간도 늘어난다. 특히 사용자 인터뷰는 30분~1시간만 진행해도 A4 용지 여러 장 분량의 데이터가 쌓인다. 그런 만큼 여러 명의 의견을 수집할 경우 투입해야 하는 리소스도 늘어난다. 이러한 작업일수록 AI를 활용하면 더욱 효율적이다. 이제 AI를 활용해 어피니티 다이어그램을 만들 3가지 방법을 살펴보자. 사전 준비: 가상 사용자 인터뷰 준비하기어피니티 다이어그램을 정리하려면, 우선 분석할 정성 데이터를 모아야 한다. 이번 글을 위해 리서치 단계에서 GPTs와 Synthetic Users를 활용하여, 가상의 맥도날드 키오스크 사용자 인터뷰 5건을 진행했다. 이 인터뷰 내용들은 각각 워드 파일로 저장했다.참고 글: 4가지 GPTs로 ‘사용자 인터뷰’ 시뮬레이션하기, AI로 맥도날드 키오스크 사용자 인터뷰하기 (w. Synthetic Users) GPTs 결과 저장 화면 <출처: 작가> 1. 챗GPT로 어피니티 다이어그램 정리하기우선, GPT-4o로 어피니티 다이어그램을 정리해 보았다. GPT 스토어에서 “affinity diagram(어피니티 다이어그램)”을 검색하면 두 가지 AI 도구(GPTs)가 나온다. 첫 번째 도구(Affinity Diagramming - UX Toolkit)는 한국어 데이터를 첨부했을 때 실제 인터뷰에 없던 사용자 이름과 정보가 추가로 생성되는 등 할루시네이션 현상이 발생하여 활용하기 어렵다. 두 번째 도구(UX Research Assistant)는 분석 결과를 제공하지만, 원본 파일의 출처를 표시하지 않는다. 반면, 기존 챗GPT, 그중 GPT-4o 모델을 활용하면 보다 정확한 답변과 함께 출처 파일의 이름을 표시한다. 사용 방법은 간단하다. 앞서 저장한 인터뷰 워드 파일을 모두 첨부한 뒤, “어피니티 다이어그램으로 정리해 줘.”라는 프롬프트를 입력하면 된다. <출처: 작가 캡처> 이 예시는 총 5개의 인터뷰 기록 파일을 첨부해 나온 결과다. 답변을 보면 키오스크 사용 시 발생하는 UI/UX 문제, 사용자의 심리적 압박감과 같은 페인 포인트, 인터뷰 대상자들의 기술 숙련도, 문제 개선 아이디어가 그룹별로 정리되어 있다. 5개의 인터뷰 파일은 A4 용지로 약 30장, 글자 수로는 약 3만 자 분량이다. 이 많은 데이터를 클릭 한 번으로 AI가 단 몇 초 만에 요약하고 정리해 주니, 데이터 분석 과정의 소요 시간을 크게 줄일 수 있다. 주의! 할루시네이션 현상하지만, 인터뷰 기록 파일을 직접 첨부했다고 해서 AI가 분석한 결과를 그대로 신뢰해서는 안 된다. 할루시네이션 현상 때문이다. 특히, 원본 파일을 참고하더라도 GPT 모델은 기존에 학습된 데이터를 결과에 혼합하여 잘못된 답을 생성할 수 있다. 따라서 분석 결과에 대한 검증 작업은 필수다. GPT-4o는 분석 결과에서 출처 파일을 표시하기 때문에, 이를 활용하여 원본 파일의 내용과 비교하며 일치 여부를 확인해야 한다. GPT-4o의 출처 확인 <출처: 작가 캡처> 예를 들어, 키오스크 사용 중 어려움을 분석한 결과에 "메뉴 구성이 복잡하고 화면 전환이 많아 혼란스럽다"는 의견이 포함되어 있는데, 그 출처로 '인터뷰 1' 파일이 표시되어 있다. 이때 ‘인터뷰 1’ 원본 파일을 열어 '메뉴 구성'이라는 키워드를 검색해 확인해 보는 것이다. (검색 단축키로 윈도우는 Ctrl+f, 맥은 Command+f를 쓴다.) 키워드 검색 화면 <출처: 작가 캡처> 실제로 비교해 보니, GPT-4o 분석 결과와 달리 첫 번째 인터뷰 참여자는 “메뉴 구성은 괜찮은데”라고 말하며 다른 어려움을 언급하고 있었다. 이처럼 AI의 분석 결과는 원본 파일과 다른 맥락으로 정리되거나, 원본에 없던 의견이 포함될 수 있다. 따라서 AI가 생성한 분석 결과와 실제 사용자 발언 사이의 일치 여부를 반드시 크로스체크해야 한다. 2. 노트북 LM(Notebook LM)으로 어피니티 다이어그램 정리하기또 다른 방법은 노트북 LM(Notebook LM)을 활용하는 것이다. 노트북 LM은 구글의 제미나이(Gemini) 모델을 기반으로 한 AI 도구로, RAG(Retrieval Augmented Generation, 검색 증강 생성) 방식을 사용해 데이터를 요약·정리해 준다. GPT-4o와 동일한 프롬프트를 입력해 결과를 비교해 보자. 단, 노트북 LM은 워드 파일을 첨부할 수 없으므로 PDF로 변환한 후 업로드했다. 노트북 LM 소스 업로드 <출처: 작가 캡처> 노트북 LM이 생성한 답변의 내용 자체는 GPT-4o와 크게 다르지 않다. 다만, 노트북 LM이 훨씬 상세한 정보를 제공한다. 또 다른 차이는 출처를 제공하는 방식이다. 결과 화면을 보면 각 사용자 의견 오른쪽에 숫자가 적혀 있다. 이 숫자를 클릭하면 원본 문서의 해당 부분으로 이동해 내용을 바로 확인할 수 있다. 노트북 LM 분석 결과와 출처 확인 <출처: 작가 캡처> 예를 들어, “이중 결제 우려: 잘못 눌러서 결제가 두 번 될까 봐 걱정”이라는 의견 옆에 적힌 ‘숫자 17’을 클릭하면 왼쪽 사이드 창의 원본 문서에서 해당 의견 위치가 강조되어 나타난다. 이 기능으로 GPT-4o에서 별도로 진행했던 검증 작업을 더 빠르고 쉽게 할 수 있다. 또한 노트북 LM은 챗GPT와 달리, 웹 데이터를 참고하지 않고 사용자가 첨부한 문서만으로 결과를 생성한다. 따라서 GPT-4o보다 문서 기반의 분석 작업에 적합하다고 할 수 있다. 추가로 프롬프트 입력창 하단에는 첨부한 문서를 기반으로 한 다양한 질문 프롬프트가 추천된다. 이 프롬프트를 이용해 추가 질문을 하면, 다양한 관점에서 데이터를 그룹화할 수 있다. 3. 릴리즈 AI(Lilys AI)로 주요 테마 도출하기정성적 데이터를 분석하는 방법에는 어피니티 다이어그램 외에 ‘주제별 분석 기법(Thematic Analysis)’이 있다.* 이 방식에서는 인터뷰 기록을 살펴보며 의미를 해석하고, 그에 맞게 텍스트 데이터에서 핵심 의미를 찾아 태그를 부여하는 코딩(Coding) 작업을 수행한다. 이후 각 코드(주제, 테마)를 비교하고 패턴을 분석하면 데이터를 심층 분석할 수 있다.*주제별 분석 기법은 사용자의 행동과 경험을 분석하고 체계적으로 시각화하는 ‘UX 모델링’에는 포함되지 않지만 리서치 데이터를 분석하여 인사이트를 도출하는 Define(정의) 단계에서 진행하는 것은 동일하다. 어피니티 다이어그램이 데이터를 나열하고 그룹화하는 과정이라면, 주제별 분석 기법은 의미 분석과 해석까지 포함한다. 연구자가 직접 태그를 부여하며 데이터를 해석하므로, 사용자 행동과 패턴을 보다 깊이 이해할 수 있다. 이때는 궁극적으로 전체 데이터에서 주요 테마를 도출하고 관련 패턴을 발견하는 것이 목적이다. 이 작업에는 요약 AI인 릴리즈 AI(Lilys AI)를 활용할 수 있다. 릴리즈 AI에 접속하면 프롬프트 입력 없이 바로 파일이나 링크를 첨부할 수 있다. 별도의 프롬프트 대신 ‘업로드’ 버튼을 눌러, 미리 준비한 인터뷰 기록 파일을 첨부하면 된다. 첨부할 수 있는 파일 형식은 비디오, 오디오, 텍스트, PDF, 워드, PPT 등이다. 여기서 주의할 점은 여러 파일을 동시에 첨부할 수 없다는 것이다. 따라서 인터뷰 기록은 하나의 파일로 취합한 뒤 업로드해야 한다. 예를 들어 5명의 사용자를 대상으로 인터뷰를 진행했다면, 각 인터뷰 파일을 하나로 합쳐야 한다. 또한 AI가 각 인터뷰를 독립적인 내용으로 인식하게 하려면, 새로운 인터뷰가 시작되는 부분마다 소제목과 목차 번호를 추가하는 것이 좋다. 이렇게 하면 AI가 소제목별로 요약하여 결과를 더욱 체계적으로 정리할 수 있다. 요약 결과는 다음과 같다. 에디터 주; 이미지 가독성을 위해 결과 하단 부분은 제외했습니다 <출처: 작가 캡처> 요약 결과에는 주제별 분석 기법에 필요한 핵심 키워드와 반복적으로 등장한 내용이 담겨 있다. 추가로 태그 부여를 원한다면 프롬프트를 입력해 코딩 작업을 진행할 수도 있다. 추가 프롬프트는 릴리즈 AI가 추천하는 샘플 질문 메뉴를 클릭해 입력하거나, 하단 프롬프트 입력창에 직접 입력하면 된다. 프롬프트 기반 추가 작업 <출처: 작가 캡처> 이 예시에서는 반복적으로 등장하는 내용에 태그를 부여해 달라는 프롬프트를 입력했다. 좀 더 구체적인 응답을 원한다면, “최소 3회 이상 반복되는 개념, 아이디어, 감정을 추출해 태그를 부여해 줘.”와 같이 요청할 수도 있다. 프롬프트 초반부 “5개의 목차”라는 표현은 다섯 명의 인터뷰 기록을 하나로 통합하면서 총 5개의 소제목으로 구분되었음을 의미한다. 생성 결과를 보면, 키오스크 사용의 어려움에 “화면 복잡성”, “결제 혼란”, “압박감”, “기술 문제” 등 태그가 부여됐다. 개선안과 관련해서는 “글씨 크기 확대”, “단순화된 인터페이스”, “음성 안내”, “직원 도움” 등 태그가 붙었다. 여기서 태그 부여 기준을 세분화하거나 대표 인용문을 요청하는 추가 프롬프트를 입력하면 더 상세한 분석이 가능하다. 신규 태그 결과 <출처: 작가 캡처> 추가 프롬프트를 입력하면 첫 번째 프롬프트에서는 확인하지 못했던 태그별 대표 인용문과 출처까지 확인할 수 있다. 동시에 기존 태그 중 “사용자 경험”, “성취감”, “심리적 요인”처럼 모호한 태그는 제거된다. 대신 “화면 복잡성”, “결제 혼란”, “자신감 부족” 등 구체적인 태그만 남아있다. 답변 하단에는 추가 질문 샘플이 제시된다. 이를 활용해 태그 부여 작업을 이어가거나 다양한 주제를 더 깊이 분석할 수 있다. 추가 질문 샘플 <출처: 작가 캡처> 마치며이번 글에서는 GPT-4o, 노트북 LM, 릴리즈 AI까지, 3가지 AI 도구로 사용자 인터뷰 데이터를 분석하는 방법을 정리했다. 세 도구 모두 방대한 정성적 데이터를 짧은 시간 안에 요약하고 분석하는 데 효과적이었다. GPT-4o는 분석 속도가 빠르고 유연한 답변을 제공한다. 하지만 원본 데이터 외 정보가 포함되는 할루시네이션(Hallucination) 현상이 있다. 이에 따라 분석 결과를 인터뷰 원본과 하나하나 대조해야 하는 번거로움이 있었다. 반면 노트북 LM은 사이드 창에서 원본 파일의 어느 부분을 거쳐 답변이 나왔는지 바로 확인할 수 있어, 검증 작업이 훨씬 편리했다. 또한 사용자가 첨부한 데이터만을 바탕으로 답변을 생성하므로 결과의 신뢰도를 높이기에 유리했다. 릴리즈 AI는 첨부한 파일을 자동으로 요약해 가독성 높은 보고서를 생성하는 기능이 강점이었다. 이 기능을 활용하면 텍스트에서 빠르게 패턴을 발견하고 구체적인 인사이트를 도출할 수 있다. 이처럼 사용자가 제공한 데이터를 AI가 분석하고 요약하는 방식이 발전하면서, 정성적 데이터 분석에 걸리는 시간이 크게 줄어들고 있다. 하지만 어떤 AI를 사용하더라도 생성된 결과를 무조건 신뢰하기보다 검증 과정을 함께하는 것이 중요하다. AI를 활용한 연구와 실무 적용의 범위는 더욱 확장될 것으로 보이는 만큼, 인간의 해석 능력과 AI의 효율성을 조화롭게 활용하는 전략이 필요하다. ©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.