사람은 언어라는 고유한 매개체를 통해 생각하고 소통합니다. 사용자는 이러한 언어를 이용해 말이나 글로 우리 서비스에 대한 그들의 생각과 느낌을 표현하는데요. 우리는 인터뷰나 온라인에 남겨진 고객의 소리(VOC)를 수집해, 사용자가 우리 서비스의 어떤 부분이 불편하고 무엇을 원하는지 알아내곤 합니다.

이렇듯 주로 텍스트로 이루어진 정성 데이터(Qualitative Data)는 새로운 서비스를 기획할 때 사용자의 니즈를 탐색하는 것뿐만 아니라, 현재의 서비스를 개선하는 과정에 활용되는 것과 같이 디자인 프로세스 전반에 폭넓게 활용됩니다.

특히 정성 데이터는 수치적 정보를 제공해 주는 정량 데이터에 비해, 사용자와 그들을 둘러싼 환경에 대한 풍부한 맥락적 정보를 제공해 주는데요. 이러한 정성 데이터 분석을 통해 우리는 사용자를 깊이 이해하고 공감할 수 있으며, 이를 통해 더 나은 서비스를 만들 수 있게 됩니다. 이번 글에는 텍스트로 이루어진 정성 데이터를 어떻게 분석하고 시각화할 수 있는지에 대해 살펴보겠습니다.

정성적 경험 데이터 분석하기

정성적 경험 데이터는 주로 인터뷰 및 FGD에서 사용자가 말한 내용이나 에스노그라피 및 섀도잉과 같이 사용자 행동을 관찰하여 기록된 내용과 같이 주로 텍스트 형태의 데이터로 수집되는데요. 최근에는 온라인에 남긴 상품 리뷰와 같이 비정형 빅데이터의 형태로도 수집됩니다.

이러한 정성 데이터의 분석은 풍부한 맥락적 정보를 내포하는 리얼 보이스와 같이 가공되지 않은 원래의 형태로도 분석에 활용되는 것뿐만 아니라, 유사한 의미를 지닌 정보들을 범주화(Categorization)하고 이를 빈도와 같은 정량화(quantification)하는 분석을 통해 표나 그래프로 시각화할 수 있는데요. 더 나아가 워드 클라우드(Word cloud)와 같은 직관적으로 형태로 시각화하기도 합니다.

먼저 정성적 경험 데이터를 분석하는 이론과 방법론에 대해 알아보고, 사례를 통해 정성 데이터를 분석하고 시각화 방법을 살펴보겠습니다.

1) 근거 이론

정성 데이터를 분석하는 대표적인 이론으로 ‘근거 이론’을 들 수 있는데요. 근거 이론(Grounded Theory)은 현장에서 수집된 정성 데이터를 분석하여, 특정한 현상에 대한 사용자의 경험과 느낌 및 생각에 대해 설명할 수 있는 이론을 만드는 데 주로 활용됩니다. 근거 이론에서 가장 널리 사용되는 분석 과정으로 개방 코딩을 들 수 있는데요. 개방 코딩(Open coding)은 정보의 범주(category)를 개발하기 위한 단계로, 수집된 정성 데이터의 의미를 분석하여 주요한 개념들을 추출한 후, 유사하거나 관련성이 높은 개념들을 범주화하고 적합한 이름을 부여합니다.

이러한 분석 과정에서의 유연성에 대한 연구자들의 상반된 견해가 있는데요. Glaser(1978)는 매우 엄격하고 형식화된 방법으로 데이터를 분석하는 과정에서의 분석가의 유연성을 제한한 반면, Corbin & Strauss(1990)는 데이터를 분석하는 과정에서 연구자의 경험적 지식과 창의력을 발휘할 것으로 주장했습니다. Corbin & Strauss(1990)이 제한한 근거 이론의 분석 과정은 빠르게 변화하는 기술 및 사용자의 니즈를 분석해야 하는 UX 도메인에서 활용하는데 효과적인 방법입니다.

2) 어피니티 다이어그램

현업에서 정성 데이터를 분석하는 데 가장 흔히 활용하는 방법은 ‘어피니티 다이어그램’일 텐데요. 어피니티 다이어그램(Affinity Diagram)은 사용자로부터 얻어진 흩어져 있는 데이터들에서 의미 있는 인사이트를 도출해 내는 효과적인 그룹핑 방법으로, 그 분석 방식은 근거 이론의 개방 코딩과 비슷합니다. 특히 어피니티 다이어그램은 팀 단위의 협업 도구로 효과적인데요. 여러 도메인의 지식과 경험을 가진 팀원들의 집단지성을 이용해 균형 잡힌 분석 결과를 도출할 수 있습니다.

아래 그림과 같이 어피니티 다이어그램은 하나의 포스트잇에 하나의 사용자 보이스를 적어 나열한 뒤 유사성이 높은 포스트잇끼리 그룹핑하고 그에 적합한 제목을 부여하는데요. 팀원들 간의 반복적인 논의를 통해 각 그룹핑과 그룹 간의 적합성에 대해 검토하여, 최종적인 범주 리스트를 도출하고 적합한 이름을 정의합니다.

포스트잇을 활용하는 것은 단지 형식일 뿐, 엑셀이나 다른 온라인 툴을 활용해서도 효율적으로 그룹핑하는 과정을 진행할 수 있는데요. 이 기법에서는 파편화되어 있는 데이터들 사이에서 규칙을 읽어내고 이를 유형화하는 것이 가장 중요하게 요구되는 분석 스킬입니다.

사례 분석: 10대들이 애플을 좋아하는 이유

다음은 분석 사례입니다. 앞으로 소비 중축이 될 미래 고객은 현재의 10대들인데요. 미래 사업을 위한 우리 브랜드의 충성 고객으로 선점할 필요가 있습니다. 그렇다면 10대들을 위해 우리는 무엇을 준비해야 할까요? 그 방법 중 하나는 10대에게 사랑받는 브랜드를 벤치마킹하는 것입니다.

10대 청소년들이 가장 선호하는 브랜드 중 하나로 애플을 들 수 있는데요. 미국 투자은행 파이퍼 샌들러가 발표한 2021년 ‘10대 브랜드 선호도 조사’ 결과에 따르면, 미국 10대의 아이폰 점유율은 87%로 나타났으며, 이 중 88%는 향후에도 아이폰을 선택할 것이라는 의향을 보였습니다.

이러한 10대들의 애플 사랑은 우리나라에서도 동일하게 확인할 수 있습니다. 2022년 이커머스 플랫폼 다나와가 오픈서베이에 의뢰한 노트북 선호도 결과로, 10대의 절반(48%)이 애플의 맥북을 선호하는 것으로 나타났는데요. 이는 삼성전자(23%)와 LG전자(20%)를 훨씬 앞서는 결과입니다.

그렇지만 10대 청소년들의 애플 선호에 대한 정량적 조사 결과만으로는, 고객 경험(CX) 전략을 구축하는 데 한계가 있습니다. 이를 위해서는 10대들이 왜 애플을 선호하는지에 대한 이유가 필요합니다. 따라서 사용자 정성 데이터를 수집하고 분석해 인사이트를 발굴해야 하죠.

이를 위해 10대가 애플을 선호 이유에 대한 내용의 블로그, 커뮤니티 및 유튜브, 댓글 등을 읽어보고, 그중 유효한 총 53개의 고객의 소리(VOC)를 수집하여 엑셀에 정리했습니다. 수집된 정성 데이터를 주의 깊게 읽고 그 의미를 해석하여 유사하거나 관련성이 높은 VOC들을 범주화하고, 아래 표와 같이 이에 적합한 이름을 정의했습니다.

이러한 범주화 과정을 통해 53개의 고객의 소리는 총 9개의 범주로 구분할 수 있었는데요. 아래 그림과 같이 각 범주 별로 빈도를 분석해, 막대그래프로 시각화했습니다. 결과를 살펴보면 10대들이 애플을 선호하는 중요한 이유로 또래와의 소속감, 브랜드 파워, 프리미엄 이미지 그리고 과시/유행의 순서로 나타났는데요. 그 외에 예쁜 디자인, 세련된 감성, 성능, 혁신성/새로움, 인플루언서에 의한 영향이 10대가 애플을 선호 이유로 분류되었습니다.

이러한 정성 데이터 분석 결과를 좀 더 직관적으로 확인하려면, 워드 클라우드(Word cloud)로 시각화하는 것도 검토해 볼 수 있습니다. 아래 그림과 같이 분류된 각 범주의 언급 빈도에 따라 글자 크기로 차이를 주어 배치해 주되, 각 범주의 상위 속성으로 한 번 더 분류해 볼 수 있습니다.

이번 사례에서는 상위 속성으로 사회적 속성, 심리적 속성 그리고 제품/서비스 속성으로 분류하여 컬러 코딩하여 의미를 부여했습니다. 이러한 분석 결과를 통해 미래 고객인 10대를 충성 고객으로 끌어오기 위해서는 단순히 제품 및 서비스 개발 관점뿐만 아니라, 10대의 사회 및 심리적 속성을 고려해 마케팅 관점에서 복합적으로 타겟팅하는 것이 필요합니다.

현업에서 활용하기

이처럼 사용자 정성 데이터는 정량 데이터가 알려주지 않는 사용자 니즈와 행동의 이유에 대해 말해주는데요. 이를 통해 현재 서비스의 개선에 대한 방향성 도출뿐만 아니라, 새로운 서비스를 발굴하는 데에도 인사이트를 제공해 줍니다.그러나 정형화된 통계 분석과 같은 정량 데이터 분석 방법과는 달리, 정성 데이터를 비정형적인 고객의 소리 데이터들을 구조화하고 그 개념에 대해 분석가의 주관적에 의해 정의해야 하는 분석 과정을 거칩니다.

이에 따라 분석가의 숙련성 뿐만 아니라 주관성이 분석 결과에 영향을 미칠 수밖에 없는데요. 이러한 한계점을 보완하기 위해, 해당 도메인에 충분한 지식과 경험을 지닌 3인 이상의 분석가들이 오픈 코딩 과정에 참여하고, 반복적인 논의와 합의 과정을 거쳐 객관성을 확보하는 것이 필요합니다.

대부분의 정성 조사는 소수의 참가자를 대상으로 인터뷰와 같은 사용자 조사를 통해 소규모의 정성 데이터를 수집하는데요. 간혹 방대한 양의 정성 데이터를 분석해야 하는 경우, 데이터를 하나하나 해석하고 그룹핑하는 과정이 어려울 뿐만 아니라, 많은 시간이 소요됩니다.

특히 최근에는 사용자들이 온라인을 통해 적극적으로 서비스에 대한 의견을 주고받습니다. SNS, 온라인 버즈와 같은 비정형 빅데이터 분석을 위해 사람이 직접 분석하는 것엔 한계가 있고요. 따라서 텍스트 마이닝(Text mining)과 같은 빅데이터 분석 기술을 활용해, 자동화된 분석 방법을 적용하는 것도 좋은 방법입니다.

이번 글에서는 주로 텍스트 정보로 이루어진 정성적 데이터를 어떻게 분석하고, 시각화할 수 있는지에 대해 살펴보았는데요. 이를 통해 사용자를 더 깊이 이해하고 공감하며 더 나은 서비스를 만드는 데 도움이 되길 바랍니다.

<참고 문헌>

Glaser, B.(1978), Theoretical sensitivity. Advances in the methodology of grounded theory, Sociology Press, Mill Valley.
Corbin, J. M., & Strauss, A.(1990), “Grounded theory research: Procedures, canons, and evaluative criteria,” Qualitative sociology, Vo. 13(1), pp.3-21.