회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
AWS 이용 중이라면 월 최대 15% 할인받으세요
우리는 디지털 세상 안에서 많은 시간을 보내며 흔적을 남깁니다. 일상을 거리낌 없이 SNS에 포스팅하거나, 온라인으로 상품을 구매하고 후기를 작성하기도 합니다. 또한 오프라인 보다 온라인에서 더 솔직하게 생각을 공유하기도 하죠. 이렇게 다양한 형태로 축적된 디지털 흔적을 빅데이터를 통해 분석해 보면, 사용자의 숨겨진 니즈와 그들을 이해할 수 있는 중요한 단서를 찾을 수 있습니다.
회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
회원가입을 하면
성장에 도움이 되는 콘텐츠를
스크랩할 수 있어요!
확인
우리는 디지털 세상 안에서 많은 시간을 보내며 흔적을 남깁니다. 일상을 거리낌 없이 SNS에 포스팅하거나, 온라인으로 상품을 구매하고 후기를 작성하기도 합니다. 또한 오프라인 보다 온라인에서 더 솔직하게 생각을 공유하기도 하죠. 이렇게 다양한 형태로 축적된 디지털 흔적을 빅데이터를 통해 분석해 보면, 사용자의 숨겨진 니즈와 그들을 이해할 수 있는 중요한 단서를 찾을 수 있습니다.
이번 글에서는 사용자가 디지털에 남긴 흔적을 분석해, 다양한 인사이트를 도출하는 디지털 에스노그라피(Digital Ethnography)에 대해 살펴보겠습니다.
디지털 대전환(Digital Transformation)이 가속화되면서, 우리 생활의 더 많은 모습들이 디지털 형태로 기록되고 쌓여지고 있는데요. 이러한 디지털 데이터 속의 사용자 행동을 분석하여, 숨겨진 니즈를 발굴하는 기법을 디지털 에스노그라피(Digital ethnography)라고 합니다. 또는 온라인 에스노그라피, 데이터 에스노그라피 그리고 소셜 빅데이터 분석이라고도 불립니다.
에스노그라피(Ethnography)란 인류학자들이 잘 밝혀지지 않은 미지의 환경에 들어가, 원주민들을 관찰하고 기록해 그 문화를 연구하는 방법인데요. 제품이나 서비스를 사용하는 실제 환경에서 사용자의 꾸밈없는 자연스러운 행동을 주의 깊게 관찰하여, 인터뷰나 설문조사로 잘 밝혀지지 않는 숨겨진 니즈를 발굴하는 데에도 활용되기도 합니다. 그래서 디지털 에스노그라피는 디지털 환경에서의 사용자의 행동이 담긴 빅데이터를 에스노그라피 관점에서 분석하는 기법이라고 볼 수 있습니다.
인터뷰나 서베이와 같은 사용자 조사 기법과 디지털 에스노그라피의 가장 큰 차이는 데이터를 획득하는 방법인데요. 사용자 조사는 참가자에게 과제를 수행하게 하거나 질문을 하는 것과 같이, 연구자가 사전에 정의한 연구 질문에 대한 데이터를 수집할 수 있습니다.
반면에 디지털 에스노그라피는 사람들이 디지털에 남긴 빅데이터들을 수집한 후, 연구자가 탐색을 통해 연구 질문에 대한 데이터를 찾아야 합니다. 따라서 데이터를 수집하기 위해 별도의 조사가 필요하지 않는데요. 언제 어디서든 디지털 빅데이터에 접근할 수 있어 데이터를 수집을 위한 조사 비용이나 시간이 요구되지 않습니다.
디지털에 남겨진 어떤 형태의 데이터든지 디지털 에스노그라피의 분석 대상이 될 수 있는데요. 특히 디지털에 남긴 글이나, 이미지 및 영상과 같이 생각과 느낌을 직접 표현한 비정형적인 데이터는 그들의 관심사나 니즈를 파악하는 데에 효과적일 수 있습니다.
예를 들면 구글에서 사용한 검색어, 트위터에 남긴 글, 커머스 서비스나 블로그에 남긴 상품 리뷰, 커뮤니티 댓글과 같은 텍스트뿐만 아니라, 인스타그램이나 페이스북에 포스팅한 이미지, 그리고 유튜브에 업로드한 영상과 같은 데이터들이 디지털 에스노그라피의 분석에 활용될 수 있습니다.
사용자가 디지털에 남긴 데이터는 이미지나 영상, 그리고 텍스트의 형태로 구분할 수 있는데요. 이러한 데이터 형태에 따라 분석하는 방법이 달라질 수 있습니다.
이미지나 영상 데이터는 키워드 등을 통해 원하는 데이터를 탐색하여, 그중 특이한 사용 패턴을 보이는 소수의 사용자 데이터를 분석해 인사이트를 발굴할 수 있습니다. 반면 텍스트 데이터는 빅데이터 분석 방법을 활용해 상대적으로 큰 용량의 데이터를 자동적으로 수집 및 분석하여, 그 속에 숨겨진 특정한 특성과 패턴을 파악할 수 있습니다.
우리는 종종 인스타그램이나 페이스북과 같은 SNS, 그리고 유튜브와 같은 영상 플랫폼에 소소한 일상들을 이미지나 영상 콘텐츠로 만들어 업로드하곤 하는데요. 특정 주제에 대해 사용자들이 업로드한 이미지 및 영상의 행동 분석을 통해, 인터뷰나 서베이에서는 파악하기 어려웠던 사용자의 니즈를 발굴할 수 있습니다. 특히 이미지와 영상 데이터에는 텍스트 분석에서 파악할 수 없었던 비언어적 정보나 맥락적 정보들이 포함되어 있기 때문에 더욱 다양한 분석과 풍부한 해석이 가능합니다.
다음의 영상 분석 사례는 AI 스피커를 사용하는 아동 사용자들이 유튜브에 업로드한 영상을 디지털 에스노그라피 방식으로 분석해, 아동과 AI 스피커 사이의 자연스러운 인터랙션을 파악한 연구 (정주희 & 전수진, 2020)인데요. 아이의 행동 분석 결과에 따르면, 아이들이 AI 스피커의 움직이지 않는 이목구비도 얼굴로 인식해 눈을 맞추며 소통하거나, 몸을 포옹하고 쓰다듬는 행동이 빈번히 발견되었다고 합니다.
이러한 분석 결과는 어떤 사용자 인사이트를 제공해 줄까요?
첫째, 아이를 대상으로 서비스하는 AI 스피커는 아이들에게 친숙한 캐릭터를 활용한 외형 디자인이 아이와의 긍정적인 상호작용을 촉진하는 데 효과적이라는 사실을 확인할 수 있습니다.
둘째, 아이들이 AI 스피커와 눈을 맞추거나 포옹했을 때 특화된 인터랙션 효과(예: 라이팅 반짝임, 애니메이션으로 얼굴 표정 변화, 감탄사 등)를 제공한다면, 더욱 긍정적인 상호작용을 높일 수 있을 것이라는 새로운 UX 디자인 방향성을 제시할 수도 있습니다.
우리는 디지털 서비스를 이용하면서 다양한 목적으로 텍스트를 입력하곤 하는데요. 정보를 탐색하기 위해 검색어를 입력하며, 상품 구매 후기를 남기거나, SNS나 커뮤니티에 일상과 생각을 글로 기록하고 댓글을 남기기도 합니다.
이렇게 디지털에 쌓인 텍스트 데이터들은 자연어 처리(Natural Language Processing) 기술과 텍스트 마이닝(Text Mining) 기술을 통해 자동적으로 분석할 수 있는데요. 예를 들면, 트위터에 최근 가장 빈번하게 확산되는 키워드를 파악한다거나, 최근 출시된 상품에 대한 상품 후기를 분석하는 것과 같이 사용자의 생생한 반응 정보를 비즈니스에 활용하기도 합니다.
이러한 텍스트 데이터를 분석하기 위해서는 웹에서 정보를 추출해 수집하는 과정인 웹 크롤링(Web Crawling)과 불용어 처리 및 가중치 도출과 같은 텍스트 전처리(Text preprocessing) 과정이 필요한데요. 이렇게 컴퓨터가 분석 가능한 형태로 변환한 후에는 키워드 분석, 감성 분석, 트렌드 분석 그리고 네트워크 분석과 같은 다양한 정량적인 분석이 가능합니다.
1) 키워드 분석
키워드 분석(Keyword analysis)은 수집된 데이터 내에서 키워드의 출현 빈도를 분석해 핵심 주제를 추론하는 기법입니다. 대표적인 분석 방법으로 워드 클라우드(Word Cloud)가 있습니다. 워드 클라우드로 시각화된 결과를 통해 화제 키워드를 빠르고 직관적으로 파악할 수 있습니다.
아래 예시는 디자인 수업에 대한 학생들의 피드백을 워드 클라우드로 표현한 연구 결과(Nguyen et al., 2020)인데요. 학생들이 디자인 수업에서 어떤 영역에 관심을 가지고 있는지 한눈에 파악할 수 있습니다. 글자 크기가 클수록 더 많이 언급된 키워드인데요. 그 결과 전체적으로 UI와 관련된 키워드에 학생들의 관심이 높은 것을 볼 수 있습니다.
2) 감성 분석
감성 분석(Sentiment analysis)은 감성 어휘의 사전적 정의를 바탕으로 수집된 특정 키워드에 대한 주관적 감성 반응을 분석하는 기법인데요. 특정 키워드에 대한 얼마나 많은 긍정과 부정 반응을 보이는지 파악할 수 있기 때문에, 사용자들의 제품에 대한 반응 탐지, 브랜드 이미지에 대한 모니터링, 상품이나 서비스의 판매 예측 등에 활용될 수 있습니다.
다음의 사례는 8개 색상에 대한 트위터의 18.000개 멘션의 감성 반응을 분석해 시각화한 연구 결과(Guo et al., 2023)인데요. 각 색상에 대한 긍정 및 부정 언급 빈도를 계산해, 긍정 반응은 양수로 부정 반응은 음수로 표현했습니다. 그 결과 2020년과 2021년 모두 보라색이 가장 긍정적인 반응을 보인 반면, 주황색이 가장 부정적인 반응을 보였습니다. 이러한 결과는 마케팅이나 디자인 시 색상 선택에 참고할 수 있습니다.
3) 트렌드 분석
트렌드 분석(Trend analysis)은 특정 키워드의 출현 빈도를 시계열로 분석해, 시간에 따른 관심도와 같이 변화하는 추이를 파악할 수 있는 기법인데요. 특정 시점에서의 감성 분석을 함께 진행해 사용자의 태도의 변화도 함께 알아낼 수 있습니다. 예를 들면, 서비스 기능 업데이트와 같은 특정 이벤트로 인해 사용자가 얼마나 더 많은 관심을 가지는지, 그 반응이 긍정적으로 변화하는지에 대해 분석할 수 있습니다.
가장 대표적인 사례는 누구나 손쉽게 활용할 수 있는 검색 엔진에서 검색어 사용 추이를 확인하는 것인데요. 아래 그림은 Google Trend에서 지난 5년간 Amazon Alexa의 검색어 사용에 대한 시계열 분석한 결과입니다. 그래프에 따르면 Amazon Alexa에 대한 관심이 2018년 말을 기점으로 2019년 초까지 폭발적인 관심이 일어나는 것을 알 수 있으며, 반면 최근에는 상대적으로 그 관심이 감소하는 경향을 확인할 수 있습니다.
4) 네트워크 분석
앞선 분석 기법들에서는 단일 키워드의 사용 빈도, 그리고 감성 반응, 시간에 따른 변화를 분석할 수 있었는데요. 이러한 단일 키워드에 분석만으로는 사용자들이 남긴 VOC(고객의 소리)에 대한 의미를 분석하는 데에는 한계가 있습니다. 네트워크 분석(Network analysis)은 키워드 간의 연계성을 분석하여 그 의미를 추론할 수 있도록 해 주는 분석 기법인데요. 수학적인 모델을 기반으로 각 키워드 간의 연결 구조와 강도를 분석해 키워드 간의 관계를 시각화해 줍니다.
다음 사례는 아마존 에코 플러스와 에코 쇼에 대한 아마존닷컴의 약 3천 건의 리뷰를 네트워크 분석으로 시각화해 준 결과(이정명 외, 2019)인데요. 그 결과를 방과 부엌을 중심으로 해석해 보면, 부엌에서는 disappointed(실망한), requirable(필요한), irresponsive(무책임한)과 같은 형용사와 연관되는 반면, 방에서는 fantastic(환상적인), wonderful(멋진), great(훌륭한)과 같은 긍정적 형용사와 연결되는 것을 볼 수 있습니다.
각 장소와 리뷰에서 공통 출현하는 키워드를 살펴보면, 방에서는 music, sound와 같은 음성 인터페이스를 통한 청취 경험 키워드가 근접하게 연결된 것을 볼 수 있습니다. 반면에 부엌에서는 video, display와 같은 시각 인터페이스에 대한 키워드와 근접해 있습니다.
이러한 분석 결과는 어떤 사용자 인사이트를 제공해 줄까요?
첫째, 사용자들은 방에서는 주로 음악을 듣는 형태를 보이며 이때 에코(Echo)의 기능이 이를 충족시켜줍니다. 다만 부엌에서는 레시피를 확인하거나 식료품을 주문하는 것과 같이 디스플레이에서 제공되는 시각 정보를 확인해야 하는데, 에코(Echo)의 기능이 이를 충족시켜주지 못해 부정적인 경험이 발생하고 있습니다.
둘째, 이러한 사용 장소에 따른 사용자의 불편사항을 배려해, 차기 모델에서는 시각적 인터페이스 측면을 강화하고, 부엌에서 일어나는 다양한 활동과 관련 높은 콘텐츠를 연결하는 등 확장성이 필요하다는 것을 알 수 있습니다.
이처럼 디지털 에스노그라피 기법으로 온라인 빅데이터에 접근해, 사용자 행동 패턴을 분석하고, 잠재된 니즈를 발굴할 수 있는데요. 이를 통해 새로운 서비스나 신규 컨셉을 정의하는 것에서부터, 출시된 제품과 서비스의 사용자 반응을 확인하고 개선점을 파악할 수 있습니다.
텍스트 데이터는 분석 툴을 이용할 수도 있는데요. 대표적으로 파이썬, R과 같은 명령어 기반의 프로그램을 활용해, 정량적 분석 기법으로 사용자 인사이트를 발굴할 수 있습니다. 이를 위해 기본적으로 프로그래밍 언어를 이해하고 활용할 수 있는 역량이 필요합니다.
또 최근에는 SAS 비주얼 텍스트 애널리틱스처럼 그래픽 인터페이스 기반 비정형 데이터 분석 솔루션도 구독을 통해 이용할 수 있어, 데이터 사이언티스트가 아닌 기획자, 디자이너도 비정형 빅데이터 분석 활용의 문턱이 낮아지고 있습니다. 이러한 빅데이터 분석 플랫폼이 아니더라도, 워드 클라우드, 구글 트렌드 등 간단한 분석은 무료로 활용이 가능합니다.
더불어 디지털 에스노그라피가 가진 한계점을 이해하고 활용하는 것도 필요한데요.
첫째, 데이터 수집 과정에서 많은 부분을 연구자가 직접 수작업으로 진행해야 합니다. 특히 텍스트 데이터와는 달리 이미지와 영상 데이터를 자동으로 크롤링 해주는 기술은 없기 때문에, 원하는 이미지 및 영상 데이터를 수집하기 위해서는 검색어와 함께 직접 확인하는 과정을 통해 수집해야 하는 번거로움이 있습니다.
둘째, 웹 크롤링으로 텍스트 데이터를 수집했다 해도 불필요한 데이터가 많을 수도 있습니다. 그러므로 연구에 필요한 데이터를 분류하기 위해, 직접 데이터를 선별하고 정제하는 과정이 발생하게 됩니다.
셋째, 텍스트 데이터를 분석하는 과정에서 컴퓨터가 사람이 생성한 텍스트를 완벽하게 이해하지 못해, 그 결과물의 정확도가 낮을 수 있습니다. 예를 들어 역설이나 풍자와 같이 우리가 흔히 표현하는 문장의 의미를 파악하는 데는 한계가 있을 수 있습니다.
마지막으로 디지털 에스노그라피는 사용자가 디지털 상에 남긴 데이터만 의존해야 하기 때문에, 연구 질문을 검증하기 위한 데이터가 없는 경우도 생깁니다. 그래서 연구 질문에 따라 사용자 조사 방법을 병행하여 진행해야 합니다.
지금까지 다양한 형태의 디지털 흔적을 분석해 사용자를 이해할 수 있는 디지털 에스노그라피의 분석 방법과 사례를 살펴봤습니다. 이를 통해 여러분이 운영하는 서비스와 관련된 사용자 반응을 파악하고, 문제를 개선하는 데 도움이 되길 바랍니다.
글 오의택
편집 조혜진 객원 에디터
<참고 문헌>
요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.