데이터는 흐릅니다. 다시 말해 그 흐름 중 어느 한 곳이라도 품질이 제대로 관리되지 않으면 다운스트림에서 문제가 생길 수 있다는 이야기입니다. 그래서 요즘에는 ‘데이터가 없는 것보다 잘못된 데이터에 기반한 의사 결정이 더 무섭다’는 말도 자주 보입니다. 하지만 저품질 데이터, 불량 데이터의 발생을 완전히 틀어막기는 거의 불가능합니다. 그러면 우리가 할 수 있는 일은 한 가지, 문제가 발생했을 때 적절하게 대처하는 것입니다. 그리고 그 대처의 첫걸음은 ‘무엇을 체크하면 되는지 인식’하는 일입니다.
<데이터 품질의 비밀(Data Qualtiy Fundamentals)> 원저자들의 책 출간 기념 인터뷰를 요약했어요. 책을 기반으로 데이터 품질의 정의부터 데이터 신뢰성, 옵저버빌리티 등 관련 내용을 응축한 질문과 답변이 담겨 있어서 이 글을 읽으면 미리 <데이터 품질의 비밀: 데이터 신뢰를 쌓는 데이터옵스의 핵심과 엔드 투 엔드 단계별 가이드>을 맛볼 수 있어요. 더 심화된 내용 또는 다양한 사례를 책으로 읽기 전에 이 글을 워밍업으로 읽으면 좋아요.