회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
AWS 이용 중이라면 최대 700만 원 지원받으세요
최근 저희 조직에 학부생 인턴으로 지원한 분들과 면접을 진행했습니다. 인터뷰를 통해 대학생들의 다양한 가치관과 생각, 그리고 앞으로의 목표 등을 배울 수 있는 기회였는데요. 면접에서 지원한 이유를 물어봤을 때 공통으로 언급되는 문장이 있었습니다. 바로 “실무 경험을 통해 데이터에 대한 이해를 더 단단히 하고 싶어서 지원했다”라는 이야기였습니다.
회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
회원가입을 하면
성장에 도움이 되는 콘텐츠를
스크랩할 수 있어요!
확인
최근 저희 조직에 학부생 인턴으로 지원한 분들과 면접을 진행했습니다. 인터뷰를 통해 대학생들의 다양한 가치관과 생각, 그리고 앞으로의 목표 등을 배울 수 있는 기회였는데요. 면접에서 지원한 이유를 물어봤을 때 공통으로 언급되는 문장이 있었습니다. 바로 “실무 경험을 통해 데이터에 대한 이해를 더 단단히 하고 싶어서 지원했다”라는 이야기였습니다.
조금 더 자세히 설명하면, 데이터를 잘 활용하는 것은 전공과 관계없이 여러 직군에 지원하는 사람들의 ‘필수 스킬’이 되어버렸기 때문이었습니다. 저 역시 어느 정도 동의하는 내용입니다. 그래서 면접 이후에 ‘데이터에 관한 이해도’를 늘리는 방법에 관해 많이 고민하게 됐는데요. 이번 글에서는 그 고민의 결과를 바탕으로 데이터 이해도를 높이는 방법에 관해 설명해 보겠습니다.
만약 운 좋게 조직에 속해 있으면 실무를 통해 조직에 있는 문제와 데이터를 정의하고 이를 해결해 나갈 겁니다. 이 과정에서 책이나 유튜브에 없는 데이터 분석 프로젝트에 기여하고, 데이터에 대한 이해도가 늘어날 수 있습니다. 그러나 취업준비생(이하 취준생)은 이러기 힘들기 때문에 데이터 분석 경험을 쌓기 위해 보통 ‘사이드 프로젝트’에 도전하게 되며, 약간은 비슷한 프로젝트를 진행합니다.
그러다 보니 취업을 처음 준비하는 분들의 이력서 혹은 포트폴리오에서 자주 보이는 데이터 분석 프로젝트들은 아래와 같습니다. 분석을 통해 풀고자 하는 문제는 사람마다 다를 수 있기 때문에, 데이터셋 이름만 표기했지만 몇몇 분들은 어떤 프로젝트인지 충분히 예상할 수 있을 것 같습니다.
이처럼 ‘조직의 것이 아닌 프로젝트’에 관해 면접에서 할 수 있는 이야기는 대체로 비슷합니다. 그래서 면접 때 크게 3가지 질문을 통해 지원자의 역량을 확인하고자 했습니다.
① 데이터 분석 프로젝트의 목적을 인지하고 있으며, 다른 사람을 설득할 수 있는가?
② 문제를 풀기 위해 제한된 상황에서 적용할 수 있는 여러 방법의 장단점을 인지하고 있으며, 각각 최적의 방법으로 활용할 수 있는가?
③ 데이터 분석을 통해 현 상황 해석뿐만 아니라 이후 액션을 통해 상황을 바꾸는 것까지 연결할 수 있는가?
이러한 질문에 관해 자주 들은 답변은 이러했습니다.
① 어떤 프로젝트였나요?
“예전에 교육받으면서 연습했던 프로젝트로, ~~에서 데이터를 구해서 ~ 를 확인하는 프로젝트였습니다.”
② 프로젝트 과정에서 왜 이런 방법으로 분석했나요?
“여러 방법을 써봤는데 이 방법이 점수(데이터)가 제일 잘 나왔기 때문에 사용했습니다.”
③ 그래서 어떤 결론이 났나요?
“데이터에서 이런 추세가 있다는 것을 확인할 수 있었습니다.”
아쉽게도 자주 나오는 답변으로 데이터 분석가의 ‘기술’은 확인할 수 있었지만, ‘역량’을 확인하는 건 어려웠습니다. 특히 이런 프로젝트에서 경험할 수 있는 내용을 알고 있기 때문에 정작 면접에서 데이터 분석에 대해 할 수 있는 이야기가 많이 줄어들기도 했습니다. 그래서 인터뷰를 진행할수록 계속 아쉬움이 쌓였습니다.
‘무엇이 이렇게 아쉬운 걸까?’라는 고민을 계속하다 보니 크게 3가지로 정리되었습니다. 바로 ‘데이터’, ‘목표’, ‘액션’입니다.
위 프로젝트에서 쓰이는 데이터들은 구하기 쉽고, 잘 정리되어 있습니다. 그래서 초반에 데이터 분석 경험을 쌓기 위해 자주 선택됩니다. 그러나 데이터 분석 프로젝트는 ‘데이터를 수집하는 것’에서부터 시작합니다. 당연하게도 수집하려는 데이터는 수십 가지 내용으로 구성되어 어마어마한 ‘전처리 작업’을 필요로 합니다. 그래서 이를 가공하는 기술이 중요한데, 잘 가공된 데이터를 사용하면 이러한 능력을 보여줄 수 없습니다.
물론 데이터 문화가 아주 성숙한 조직은 데이터가 다 준비되어 있어 분석만 해도 되는 경우가 종종 있습니다. 그렇지만 그러한 조직은 많지도 않고, 구직자에게 데이터 분석 외의 추가 역량을 기대하기도 합니다.
최근 현장에서 일하는 많은 데이터 분석가들 사이에서 “분석 기술만큼이나 데이터 인프라, 활용력, 의사결정 문화, 거버넌스가 중요하다’라는 이야기가 나오는 것도 비슷한 맥락입니다. 이러한 이유로 법과 저작권의 문제를 넘지 않는 선에서 직접 데이터를 수집(크롤링)해 보는 것도 괜찮다고 생각합니다.
데이터 분석가에게 기대하는 역량은 기술적인 부분도 있지만, ‘문제를 정의하고, 왜 그것이 문제가 되는지’, ‘데이터 분석으로 나온 내용을 다른 구성원에게 효과적으로 전달할 수 있는지’ 등도 있습니다.
데이터 분석 결과를 효과적으로 전달할 방법 중 하나는 ‘숫자’입니다. 해당 프로젝트의 대략적인 개요만 알고 있는 상황에서 분석 내용을 면접관에게 충분히 설명할 수 있으면 조직에 합류했을 때의 업무 성과를 기대하게 됩니다.
이는 앞서 말한 ‘데이터’와도 연결이 됩니다. 구하기 쉽고 잘 정리된 데이터는 ‘문제를 해결하기 위해’ 데이터를 수집한 것이 아닌 ‘데이터를 위해’ 만들었기 때문에 목표에 관한 명확한 방향성을 설정하기 어렵습니다. 예를 들어 아래 스타벅스 데이터의 경우, ‘스타벅스 데이터를 분석했더니 직장인이 많은 곳에 매장이 많아지는 경향이 있었다’라는 결론을 많이 내게 됩니다. 하지만 이는 데이터 분석을 통해 달성하려는 조직의 목표가 없기 때문에 좋은 데이터 분석이라고 볼 수 없습니다.
반대로 새로운 매장을 낼 때 어느 지역에 내야하고, 기존 매장의 고객 수나 직원 배치, 임대 가격 등을 고려해 어느 정도의 손익이 날지 근거와 수치를 기반으로 얘기하면 어떨까요? 비록 수치가 엉성하고 근거가 조금 부족하더라도 목표를 잘 설정했기 때문에 쉽게 공감할 수 있을 겁니다.
데이터 분석가의 존재 의의는 어떻게 보면 진부한 표현이지만 ‘조직의 문제를 데이터와 분석을 통해서 해결하는 것’입니다. 즉, 데이터 분석가는 조직의 프로덕트나 서비스 분석을 통해 얻은 인사이트를 반영하는 액션을 만들어내야 합니다.
데이터 분석가가 분석 프로젝트를 잘 완성하기 위해서는 ‘문제를 정의하는 것’, ‘데이터를 수집하는 것’, 그리고 ‘분석을 통해 인사이트를 뽑는 것’ 등을 활용해야 합니다. 모두 어렵지만 꼭 필요한 사항입니다. 그러나 아직 넘어야 할 산이 하나 더 있는데요. 바로 이론과 현실을 연결하는 것입니다.
합리적인, 때로는 합리적이지 않은 여러 가지 이유로 데이터 분석 결과를 서비스에 적용하는 것이 어려울 수 있습니다. 그렇기 때문에 제한된 조건에서 최대한의 효용을 만들어 낼 수 있는 ‘최선’의 액션을 만들어 내는 것 역시 데이터 분석가의 역량을 드러내는 부분이라고 생각합니다.
예를 들어 따릉이 데이터 분석을 통해 ‘주말 오전에(아마도 나들이로 인한) 특정 지점의 수요가 많을 것 같으니 추가 배치해야 한다’라는 결론을 냈다고 가정해 보겠습니다.
그러나 실제로는 금요일 저녁에 자전거를 배치할 수 있는 인원수의 제한으로 이를 다 감당하지 못하거나 자전거의 전체 개수가 적어서 문제를 해결할 수 없는 ‘운영’ 문제가 생길 수 있습니다. 그 때문에 데이터 분석가는 이를 공감하고 풀어가는 대안을 고민해야 합니다.
물론 분석 결과와 액션을 이론상으로 연결하는 건 매우 어렵습니다. 이럴 때는 데이터 분석가 커뮤니티 등을 통해 현업에서 근무하는 분들의 피드백을 들어보는 것도 좋습니다.
조직이 흔히 말하는 중고 신입을 선호하는 이유는 ‘실무에 바로 투입할 수 있어서’가 가장 큰 이유입니다. 그래서 취준생은 경쟁에 밀릴 수밖에 없는데요. 그렇다면 데이터 분석가 면접에서 좋은 점수를 받기 위해 어떤 걸 어필하면 좋을까요? 물론 조직의 관점에서 인재를 뽑기 위한 다양한 조건이 있겠지만, 저는 데이터 분석가의 역량을 확인하는 ‘기술면접’의 관점으로 설명해 보겠습니다.
데이터 분석가를 필요로 하는 조직은 대체로 팀을 만드는 과정에서 신입이나 낮은 연차를 채용합니다. 이때 새롭게 합류하는 구성원에게 가장 기대하는 건 문제를 ‘잘’ 정의하는 것입니다. 다만 단어의 맥락이 살짝 다를 수 있어 추가 설명하면, 데이터를 통해서 어떤 ‘새로운’ 문제를 정의하는 것은 보통 팀이나 경영진 차원에서 전달될 때가 많아서 신입이나 낮은 연차에게 이를 기대하지는 않습니다. 따라서 이 ‘정해진’ 문제를 풀기 위해서는 어떤 것들이 필요한지 구체적으로 ‘잘’ 정의하는 것에 가깝습니다.
그래서 면접 때 데이터 분석 프로젝트에 관해 설명하면서 다음과 같이 얘기했으면 자신을 잘 어필할 셈입니다.
① 데이터 분석으로 이 문제를 해결하고 싶었고,
② 이를 위해 구체적으로 이러한 가설을 세워 데이터를 수집했고,
③ 이러한 방법으로 해결했다.
면접에서 자신의 데이터 분석 프로젝트를 설명할 때 단순히 ‘결과가 이랬습니다’라고 끝나는 것이 아니라 ‘결과가 이렇게 나와서 이런 액션을 했고, 이렇게 바뀌었습니다’라는 식으로 설명할 수 있으면 좋습니다.
단, 성공적인 결과를 만든 액션만을 어필해야 하는 건 아닙니다. 분석 이후 실패한 액션이라도 ‘이를 통해서 어떤 것을 배울 수 있었는지’, ‘왜 실패한 것 같은지’ 등의 내용이 있으면 괜찮습니다. 실제 업무에서 사후 분석이 적지 않은 만큼 이에 대한 면접관의 피드백을 주고받는 과정에서 오히려 좋은 어필이 될 수도 있습니다.
이러한 경험을 쌓기 위해 할 수 있는 건 사소하더라도 내 삶에서 겪은 문제를 데이터 분석으로 해결해 보는 것입니다. 최근 데이터 분석에 관한 기업의 관심도가 높아지면서 데이터야놀자처럼 데이터와 연관한 많은 세미나와 컨퍼런스가 많이 열리고 있는데, 이러한 곳을 자주 살펴보면서 영감을 받고, 실제 자신의 프로젝트를 진행해보는 걸 추천합니다.
학창 시절의 시험과 다르게 업무는 정답이 있는 경우보다 없는 경우가 더 많고, 데이터 분석 또한 크게 다르지 않습니다. 제한된 상황에서 각자의 장단점이 있는 여러 가지 선택지 중에서 최선의 결과를 만들어 내는 의사 결정의 과정을 가능하면 많이 연습해보고, 면접에서 이를 잘 어필하는 것이 필요합니다.
예를 들면 데이터 그룹을 나누어 분석하는 과정에서 쓰이는 분류(Classification)에는 다양한 방법이 있습니다. 내가 했던 데이터 분석 프로젝트에서 이 데이터가 A 그룹인지, B 그룹인지를 나누기 위해 ‘정확성을 중요하게 여길 것인지’, ‘빠른 실행을 중요하게 할 것인지’ 혹은 ‘가지고 있는 데이터에서 쓰일 방법을 선택할 것인지’ 등 데이터를 활용하는 이유를 설명할 수 있어야 합니다.
꼭 분석 방법론이 아니더라도 프로그래밍 언어나 시각화∙리포트 방법, 혹은 사용한 메트릭의 예시를 생각해도 좋습니다. 예를 들어 “태블로가 아닌 Powerbi를 쓴 이유가 있나요?”와 같은 정답이 없는 질문에 자기 생각을 잘 표현하는 것이 중요합니다.
지금까지 데이터 분석 프로젝트에 자주 언급되는 것은 어떤 것이 있고, 어떤 문제점이 있으며, 어떤 것을 어필할 수 있는지 등을 이야기했습니다.
물론 자주 쓰이는 데이터를 통해서도 할 수 있지만 ‘내가 공감할 수 있는 문제를 해결하는 것’과 그렇지 않은 것을 해결하는 것은 흥미와 몰입도에서 많은 차이가 날 수 있습니다. 그렇기 때문에 만약, 머신러닝 엔지니어 혹은 리서치 계열 직군을 희망하는 것이 아니라면 캐글과 데이콘은 잠시 쉬는 걸 추천합니다. 이쪽은 ‘점수가 잘 나오는 것’이 정말 중요하기 때문에 이런 프로젝트를 연습하는 것이 훨씬 더 도움이 됩니다. 대신 우리만의 문제를 푸는 프로젝트를 3가지 소개해보려고 합니다.
최근에 나를 고민하게 했던 문제를 정의하고, 이를 데이터를 통해서 해결하는 프로젝트입니다.
예를 들어 저는 게임을 많이 하는데, 여기서는 얼마나 게임을 잘하는지를 ‘랭크 시스템’을 통해 관리하고 있습니다. 이기면 점수가 올라가기 때문에, 점수가 높을수록 기분이 좋습니다.
제가 만약 프로게이머처럼 게임에 어마어마한 재능이 있었다면 상대적으로 쉽게 점수를 올릴 수 있었겠지만, 저는 그러지 못했습니다. 그래서 ‘어떤 전략을 취해야 점수를 더 쉽게 올릴 수 있을까?’라는 고민을 데이터로 풀었습니다. 그리고 게임사 API 데이터 수집, 데이터 분석, 그리고 실제 해당 전략을 활용해 점수를 올린 것까지의 과정을 정리하여 데이터 분석 프로젝트로 공유했습니다.
문제를 공감할 수 있게 전달하는지, 그리고 이를 통해서 유의미한 결과가 나왔는지 같은 부분을 잘 어필했기 때문에 게임 연관 회사가 아니었음에도 불구하고 면접에서 좋은 평가를 받을 수 있었습니다.
만약 다이어트를 하고 있으면 ‘내 식단의 재료와 칼로리, 운동, 수면시간 등의 데이터를 수집하고 어떤 패턴이 있었기에 어떻게 바꿨고, 그 결과는 이렇다’라는 스토리를 완성해 보면 어떨까요? 데이터에 대한 고민이 잔뜩 있기 때문에 흥미진진한 면접과 내 개인의 문제 해결이라는 두 마리 토끼를 잡을 수 있을 것입니다.
이름을 보면 다소 복잡해 보이지만, 정작 이 프로젝트를 경험하는 건 쉽습니다. 제일 먼저 해야 하는 것은 간단합니다. 휴대폰을 열고, 내가 최근에 사용했던 서비스 중 아무거나 하나 선택하는 것입니다.
이후 ‘내가 이 서비스를 만드는 조직의 데이터 분석가다’라는 마음가짐으로 서비스에서 이익을 내는 과정(BM)이 어떠한지, 그리고 서비스에서 수집되는 데이터는 어떤 것이 있는지, 매출을 더 극대화하기 위해 혹은 더 많은 사람이 서비스를 사용하게 하기 위해 추가로 수집해야 하는 데이터는 어떤 것이 있는지 등을 설계하면 됩니다.
당연히 이 과정에서 해당 조직의 데이터를 알 수 없기 때문에 많은 가정이 필요합니다. 실제와 내 가상의 데이터가 다를 수도 있습니다. 그러나 이 프로젝트를 통해서 면접에서 보여줄 수 있는 것은 문제를 정의하고, 이를 풀어가는 과정입니다.
만약 구직하려는 조직 혹은 경쟁사의 서비스를 선택한다면 면접 과정에서 조직의 실제 데이터를 피드백 받으며 서비스를 데이터로 해석하는 전략적인 역량이 늘어날 수 있습니다. 동시에 면접관의 입장에서도 우리 서비스에 관심을 두는 사람에게 더 좋은 경험을 주고 싶은 마음은 덤입니다.
예를 들어 요즘IT라면, 사람들이 어떤 채널을 통해 들어오는지, 그리고 각 유저는 어떤 글을 얼마만큼 읽었고, ‘좋아요, 댓글, 구독하기’와 같은 리액션이 있는지 등이 주요 데이터가 됩니다. 글에서는 어떠한 데이터적인 특징(길이, 주제, 저자 등)이 있어서 독자의 반응이 좋았고, 이를 통해 채널별로 어떤 것을 해볼 수 있을지 가상의 데이터 분석 프로젝트 겸 제안서를 만들어 볼 수 있습니다.
데이터 분석가의 업무 중 큰 비중을 차지하는 것으로 ‘쿼리 + 대시보드 만들기’가 있습니다.
여기에서 한가지 팁은 엄청나게 큰 데이터를 멋진 BI 툴을 이용해서 보여주기보다 (특히 유료툴을 사용할 필요까진 없습니다) 작은 데이터라도 지속해서 쉽게 추적할 수 있는 걸 보여주는 것이 중요합니다. 특히 적절한 시각화 방법과 유의미한 인사이트가 있다면 더욱 좋습니다.
이러한 프로젝트를 진행하면서 너무 대시보드 구현에만 기술적으로 몰입하는 것 보단 적절한 지표를 고민해 보는 것도 필요합니다. 실제로 MAU / DAU가 왜 중요한지, 혹은 다른 지표는 어떠했고, 이를 올리기 위해서 어떤 분석과 액션을 했는지 개인의 프로젝트 경험을 통해 이야기할 수 있으면 충분히 좋은 면접입니다.
이 글처럼 개인의 재테크 목적으로 태블로를 활용하여 주가 데이터를 추적 및 기록하는 페이지를 만들어 보는 것도 좋고, 아니면 이 글처럼 블로그 방문 데이터를 데이터 스튜디오와 같은 툴을 사용해서 만들어보는 것도 좋습니다.
해외 커뮤니티에서는 이러한 기록물이 많은데, 대표적으로 tableau public의 오늘의 비주얼리제이션 등을 구독하여 시각화에 대한 트렌드를 유지하는 것도 추천합니다.
다른 직군들과 마찬가지로 데이터 분석가는 취업을 준비하는 단계부터 많은 노력과 고민을 필요로 합니다. 면접에서 그러한 노력과 고민을 잘 표현할 수 있는 프로젝트를 선보이기 위한 전략을 짜는 것도 성공 취업을 위한 준비라고 생각합니다. 이번 글을 통해 면접에서 단순히 보여주는 프로젝트가 아닌, 실제 회사에서 좋아하는 프로젝트와 이를 면접관에서 어필하는 방법에 관해 소개했습니다. 당연하게도 이것 또한 정해진 답은 아닐 것입니다. 그렇지만 이 글이 데이터 분석가가 되기 위해 열심히 데이터를 분석하는 취준생들에게 조금이나마 도움이 되었기를 바랍니다.
요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.