<blockquote><p style="text-align:justify;"><strong>누구나 데이터를 활용하는 시대</strong></p></blockquote><p style="text-align:justify;"> </p><p style="text-align:justify;">바야흐로 데이터의 시대입니다. 예전에는 데이터가 없어서 고민이라는 이야기가 많았던 것 같은데, 이제는 데이터를 어떻게 잘 사용할 수 있는지가 중요해졌습니다. 더 나아가 데이터 관련 직군이 아니더라도 누구나 데이터를 활용하며, 업무 효율을 높일 수 있는 방법을 고민합니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">일례로 리서치, 기획자, 마케터, 운영 등 비개발, 비데이터 직군을 뽑는 채용공고에서도 ‘SQL을 활용한 데이터 조회 및 추출’ 등의 내용을 발견할 수 있는데요. 그 연장선에서 ‘시티즌 데이터 사이언티스트’, ‘데이터 거버넌스’ 등의 키워드도 자주 보입니다. 그러니 첫 문장을 다시 정정하면 바야흐로 ‘누구나 데이터를 활용하는 시대’라고 해야 할 것 같네요.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">그렇다면 데이터 엔지니어나 분석가가 아닌 직군은 데이터를 다루기 위해 무엇을 공부해야 할까요? 데이터를 어떤 관점으로 바라보고, 어느 수준까지 활용하면 좋을까요?</p><p style="text-align:justify;"> </p><p style="text-align:justify;">오늘은 개발 또는 데이터 관련 직군은 아니지만, 업무에 데이터를 활용해야 하거나 조금 더 잘 활용하고 싶은 분들을 위해 도서 추천 글을 준비했습니다. 저 역시 데이터 분석가가 아님에도 업무 시 직접 데이터를 활용할 때가 많아 여러 고충이 있었는데요. 제가 공부하며 도움을 받았던 데이터 분야 책들을 여러분에게 소개하고자 합니다.</p><div class="page-break" style="page-break-after:always;"><span style="display:none;"> </span></div><h3 style="text-align:justify;"><strong>1. 데이터 읽기의 기술(저자 차현나)</strong></h3><p style="text-align:justify;"><strong>난이도: ★☆☆☆☆</strong></p><p style="text-align:justify;"><strong>카테고리: 리터러시</strong></p><figure class="image image_resized" style="width:50%;"><img src="https://yozm.wishket.com/media/news/2446/image2.png"><figcaption><출처 : 교보문고></figcaption></figure><p style="text-align:justify;"> </p><p style="text-align:justify;"><데이터 읽기의 기술>은 데이터 사이언스, 빅데이터 등에 관한 도서가 한참 출간되기 시작하던 때에 제가 가장 먼저 접한 도서입니다. 저자는 소비자심리학을 전공한 후 오랜 기간 데이터 사이언티스트로 근무했지만, 본 책에서는 데이터를 다루는 구체적인 기술에 관해서 이야기하지 않습니다. 그보다는 데이터란 애초에 소비자(혹은 사용자)를 이해하기 위함이며, 그렇다면 우리는 데이터를 통해 어떤 질문에 답을 구하려 하는지 등 문자 그대로, ‘데이터를 읽기 위한 기술’ 혹은 마음가짐을 설명합니다. 제가 이 책을 가장 먼저 추천하는 이유이기도 합니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">생각해 보면 비개발, 비데이터 직군으로서 우리에게 가장 필요한 건 SQL, Python 등의 하드스킬이 아닐 겁니다. 엑셀을 예시로 들어볼까요? 아무리 어려운 엑셀 함수를 능숙하게 다루더라도, 애초에 그렇게 해서 구해낸 숫자를 통해 우리가 무엇을 하고 싶은 건지 명확하지 않다면, 그 숫자가 무슨 소용일까요? “그래서 뭐 어떻다는 거죠? 이걸 왜 분석한 거죠?”라는 질문만 돌아올 겁니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">그래서 이 책은 막연한 궁금증으로 ‘데이터를 공부해 보고 싶다’라는 생각은 있지만, 내 업무에서 데이터가 어떤 의미인지, 왜 데이터가 필요한지 명확하지 않은 분들에게 추천합니다. 그리고 아직 데이터를 통해 답을 구하고 싶은 구체적인 질문이나 해결하고 싶은 문제가 없는 분들이 읽어보시면 좋습니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;"> </p><h3 style="text-align:justify;"><strong>2. 데이터 리터러시(저자 강양석)</strong></h3><p style="text-align:justify;"><strong>난이도 ★★☆☆☆</strong></p><p style="text-align:justify;"><strong>카테고리 : 리터러시</strong></p><figure class="image image_resized" style="width:50%;"><img src="https://yozm.wishket.com/media/news/2446/image1.png"><figcaption><출처 : 교보문고></figcaption></figure><p style="text-align:justify;"> </p><p style="text-align:justify;">두 번째로 추천하는 책은 <데이터 리터러시>입니다. 이 책은 저자의 이력이 다소 특이합니다. ‘데이터’라고 하면 요즘은 으레 ‘데이터 분석가’, ‘데이터 엔지니어’, ‘데이터 사이언티스트’를 떠올리기 쉬운데요, 도서에 소개된 저자의 이력은 컨설턴트입니다. 통계학과 파이썬, 머신러닝 등을 전공한 분이 아니라는 거죠. 그럼에도 불구하고 데이터에 관해 이야기할 수 있는 이유는 데이터란 애초에 빅데이터, 머신러닝, SQL이나 파이썬에 국한된 게 아니기 때문입니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">1980~1990년대에는 데이터가 없었을까요? 그 시절의 직장인들은 모두 감이나 상사의 명령에만 의존해서 의사결정을 했을까요? 종이에 적든, 엑셀에 기록하든 그때도 데이터는 있었고, 사람들은 이미 데이터를 분석하고 데이터로 의사결정을 하고 있었습니다. 다만 ‘빅’데이터가 아니었을 뿐이죠.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">그래서 이 책은 구태여 특정 기술에 대해 설명하지 않습니다. 다만 조직 차원의 데이터 사용 역량 증진 등 비즈니스 환경에서의 데이터 사용을 위한 여러 조언을 건넨 뒤, 데이터를 해석하고 사용하는 구체적인 사례 혹은 예제를 제공합니다. 주어진 자료를 왜곡 없이 가능한 한 올바르게 해석해 그 안에서 나름의 의미를 찾아냅니다. 이를 토대로 다른 사람들에게 설명하고 설득하는 과정 전반의 노하우를 설명하죠. 말 그대로 ‘데이터 리터러시’입니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">대신 책이 두껍고 글자가 빽빽한 편이라, 처음 데이터 공부를 시작한 분들에겐 다소 난이도가 있을 수 있습니다. 그러나 ‘저는 문과라서 몰라요’, ‘저는 개발을 몰라요’와 같은 걱정보다는, 시간을 들여 천천히 읽다 보면 분명 도움이 될 거라고 생각합니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;"> </p><h3 style="text-align:justify;"><strong>3. 세상에서 가장 쉬운 통계학입문(저자 고지마 히로유키)</strong></h3><p style="text-align:justify;"><strong>난이도 ★★★☆☆</strong></p><p style="text-align:justify;"><strong>카테고리 : 통계</strong></p><figure class="image image_resized" style="width:50%;"><img src="https://yozm.wishket.com/media/news/2446/image3.png"><figcaption><출처 : 교보문고></figcaption></figure><p style="text-align:justify;"> </p><p style="text-align:justify;">드디어 올 것이 오고야 말았습니다. 세 번째로 추천하는 책은 <세상에서 가장 쉬운 통계학입문> 입니다. 보통 ‘누구나 이해할 수 있는’, ‘N일이면 독파하는’, ‘가장 쉬운’ 등의 수식어가 붙은 책에는 함정이 있습니다. 막상 펼쳐보면 그리 쉽지 않다는 점이죠. 그럼에도 통계학 책을 추천하는 이유는 비전공자, 비개발 또는 비데이터 직군에게도 숫자를 올바르게 해석하고, 숫자로 세상을 이해하는 통계학이 도움이 되기 때문입니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">예컨대 IT 서비스에서 기획자, 마케터 혹은 디자이너가 자주 마주하는 통계학 관련 업무에는 A/B 테스트가 있습니다. 우리 눈에 A/B 테스트란 ‘2~3개의 옵션을 만들어 적당히 비교해서 더 나은 것을 적용하는’ 정도로 비춰지지만, A/B 테스트의 뒤에는 가설검정, 모집단과 표본, 유의수준과 유의 확률 등 통계와 확률의 이야기가 잔뜩 숨어 있습니다. 규모가 큰 조직에선 이 모든 설계와 해석을 데이터 분석가 혹은 이에 준하는 누군가가 담당하겠지만, 그렇지 않은 곳에선 이런 일이 모두 비개발, 비데이터 직군인 우리의 몫이 됩니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">이 책을 통해 우리가 어떤 공식이나 수식을 직접 검증하고, 그 수식을 외워 활용할 필요는 없습니다. 다만 핵심적인 개념 혹은 맥락을 이해하면, 통계의 개념을 전혀 모르던 때와는 분명 다른 세상이 펼쳐질 겁니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;"> </p><h3 style="text-align:justify;"><strong>4. 확률적 사고의 힘(저자 다부치 나오야)</strong></h3><p style="text-align:justify;"><strong>난이도 ★☆☆☆☆</strong></p><p style="text-align:justify;"><strong>카테고리 : 리터러시</strong></p><figure class="image image_resized" style="width:50%;"><img src="https://yozm.wishket.com/media/news/2446/image4.png"><figcaption><출처 : 교보문고></figcaption></figure><p style="text-align:justify;"> </p><p style="text-align:justify;">이어서 추천하는 책은 표면상으로는 데이터와 거리가 멀어 보일 수도 있습니다. 그러나 개인적으로는 비개발, 비데이터 직군으로서 데이터를 바라보는 데 가장 도움이 되는 관점, 사고방식을 짚어주는 책이라고 생각해 소개하고자 합니다. 바로 <확률적 사고의 힘>입니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">앞서 소개한 세 권의 책에는 공통적으로는 데이터란 정보, 숫자 그 자체라는 전제가 깔려 있습니다. 지금까지 쌓인 정보를 어떻게 바라보고, 활용하고, 해석할지를 이야기하며, 리터러시 혹은 학문으로서 ‘통계학’이 필요한 것이죠.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">그런데 아무리 이러한 역량과 학문을 활용하더라도, 데이터를 통해 바라보는 세상은 어디까지나 ‘확률’로서 존재합니다. 쉽게 말해 100%란 없습니다. 제법 있어 보이는 인사이트는 100%를 보장할 수 없고, 100% 보장할 수 있는 정보는 굳이 말할 필요도 없는 뻔한 정보입니다. 우리는 그 양극단에서 ‘틀릴 수 있는 확률’ 혹은 불확실성을 감안하고 의사결정을 내립니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;"><확률적 사고의 힘>은 세상을 흑과 백, 0%와 100%라는 양극단으로 해석하고, 판단하길 원하는 우리의 일반적인 시선에 반론을 제기합니다. 역사, 주식, 과학의 에피소드를 통해 세상은 불확실성을 내포하고 있고, 우리가 할 수 있는 일은 어떻게든 100%를 만들어내거나 추구하는 게 아니라, 이 불확실성에 적절히 대응하는 일임을 강조합니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">데이터를 통해 주식 투자나 도박을 할 것도 아닌데 이 책은 왜 도움이 될까요? 기술을 처음 다루다 보면 가장 먼저 빠지는 함정이 바로 ‘완벽함을 추구’하는 일입니다. 숫자가 100% 정확해야 할 것 같고, 이 결과를 100% 보장할 수 있어야 할 것 같은 압박감 또는 욕심이 생겨나는 거죠. 저 역시 데이터를 처음 다룰 때 그런 욕심을 버리지 못해 ‘우리 지금 과학 연구하는 거 아니다’라는 피드백을 받기도 했습니다. 기획자, 마케터, 디자이너, 운영자에게 필요한 정보는 ‘100% 확실한’ 정보가 아니고, 그럴 수도 없습니다. 그저 내가 의사결정을 내리기에 제법 충분한 정도면 됩니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">아무리 그래도 그렇지, 더 정확해야 하지 않냐고요? 뭔가 찝찝하지 않냐고요? 애초에 우리는 전처리를 하며 불확실한 데이터를 일부 제거하거나, 인터뷰 내용을 임의로 받아 적거나 수정하고, A/B 테스트를 설계하며 유의수준 95% 등의 이야기를 하는 시점부터 ‘100%란 없다’라는 전제로 일하고 있습니다. 그러니 너무 걱정하지 말고, 불확실성에 적절히 대응한다는 마음가짐을 갖는 것이 중요합니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;"> </p><h3 style="text-align:justify;"><strong>5. 데이터를 부탁해(저자 전익진)</strong></h3><p style="text-align:justify;"><strong>난이도 ★★★★☆</strong></p><p style="text-align:justify;"><strong>카테고리 : 통계, 빅데이터</strong></p><figure class="image image_resized" style="width:50%;"><img src="https://yozm.wishket.com/media/news/2446/image5.png"><figcaption><출처 : 교보문고></figcaption></figure><p style="text-align:justify;"> </p><p style="text-align:justify;">마지막으로 추천하는 책은 <데이터를 부탁해>입니다. 귀여운 표지와 제목에 비해 책은 기술과 이론을 제법 많이 설명합니다. 앞선 네 권의 책을 통해서 계속해서 관점이나 맥락, 사고방식 등을 강조하더니, 왜 마지막엔 기술과 이론을 담은 책을 추천했을까요? 그 이유는 기술이나 이론의 대략적인 개념만 이해해도 더 많은 것들을 이해할 수 있기 때문입니다. 가장 마지막으로 이 책을 추천한 이유이기도 하죠.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">앞서 밝혔듯이 저는 데이터 분석가가 아닙니다. 작은 스타트업에서 분석을 겸하는 PM으로 일하고 있습니다. 그렇지만 공부 삼아 ADsP, 빅데이터 분석 기사, SQLD 등을 취득하기도 했습니다. 항간에 “자격증은 실무에 아무런 도움도 되지 않는다”라는 이야기가 지배적이지만, 저는 동의하지 않습니다. 기술을 직접 활용하는 능력을 자격증으로 증명할 순 없지만, 정형화된 커리큘럼을 밀도 있게 공부하는 시간을 통해 그 기술과 이론이 어떤 맥락에서 언제 어떻게 사용되어야 하는지, 어떤 문제를 해결할 수 있는지 이해하는 데는 분명 도움이 됩니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">이 책은 이러한 연장선에서 여러분이 업무에서 맞닥뜨리게 될 문제나 궁금증을 어떤 방식으로 접근할 수 있을지, 단서를 이해하는 데 도움이 될 수 있습니다. ‘내가 가진 데이터를 내가 일일이 직접 분류하는 대신, 머신러닝의 분류나 군집으로 적당히 그룹핑해볼 수 있지 않을까?’, ‘이거는 사실 시계열 분석 같은 걸로 접근해 볼 수 있는 거 아닐까?’, ‘내가 지금 궁금한 게 여태까지의 내역이 아니라, 이걸 바탕으로 앞으로가 어떨지 예측하려는 거 아닌가? 그럼 어떻게 해야 하지?’ 같은 질문이나 아이디어를 떠올리려면, 애초에 그런 개념이 세상에 존재한다는 사실 자체를 알아야 합니다. 물론 구체적으로 그런 분석을 설계하고 수행하는 일을 하지 않더라도 말이죠.</p><p style="text-align:justify;"> </p><p style="text-align:justify;"> </p><h3 style="text-align:justify;"><strong>결국 기술보다 ‘관점’</strong></h3><p style="text-align:justify;">작년은 ChatGPT의 등장과 발전으로 업계 전반이 시끌벅적한 한 해였습니다. 기술자는 기술자대로, 기획자는 기획자대로 업무에서의 쓰임을 연구하기도 하고, 또 다가올 가까운 미래에 각자의 일이 대체되진 않을까 불안한 미래를 점쳐보기도 했던 것 같습니다. 코드를 작성하거나 리뷰하고, 파일을 업로드하면 분석도 척척 해주는 모습을 보며, 이른바 화이트칼라 또는 숙련된 기술자는 대체되지 않을 거라는 믿음마저 흔들리는 해였습니다. </p><p style="text-align:justify;"> </p><p style="text-align:justify;">미래가 어떻게 될지는 잘 모르겠습니다. 이미 인간을 넘어서는 지능을 가진 슈퍼 인공지능(ASI)이 개발되고 있다는 소식도 있고요. 무엇이 되었든 이것 하나만은 확실한 것 같습니다. 어느 자리에서 어느 일을 하든지 간에, 결국 가장 중요한 건 기술보단 관점이라는 것이죠. 생성형 AI가 코드도 짜주고 검수도 해주는 시대에도 아직 우리에게는 본질과 맥락을 이해하고, 관점을 토대로 판을 설계하는 무기가 남아있으니까요. 어쩌면 비개발, 비데이터 직군으로서 우리에게 중요한 건 결국 기술보다는 관점이 아닌가 싶습니다.</p><p style="text-align:justify;"> </p><p style="text-align:justify;">그런 의미에서 '요새는 분석가가 아니더라도 데이터 공부를 해야 한다고 하던데 뭘 공부하면 되나요?' 같은 고민을 한다면, SQL이나 파이썬 등을 배우기 전, 오늘 소개한 다섯 권의 책을 한 번 읽어보는 것도 도움이 되리라 생각합니다.</p><p style="text-align:justify;"> </p><p style="text-align:center;"><span style="color:#999999;">요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.</span></p>