우리가 사는 현실을 데이터로 변환할 수 있다면, 컴퓨터의 힘으로 많은 일을 해낼 수 있습니다. 이렇게 변환된 데이터를 활용하기 위한 방법 중 하나가 바로 머신러닝입니다. 복잡한 현실을 데이터화한다면 머신러닝을 통해 쉽게 처리할 수 있는 것이죠.
그렇다면 현실을 데이터화하는 작업은 어떻게 이루어질까요? 데이터 산업은 현실을 데이터로 변환하는 분야로, 크게 데이터 과학과 공학으로 나뉩니다. 데이터 과학은 활용 가능한 데이터들을 만들고 이용하는 일을 하며, 데이터 공학은 이러한 데이터들을 다루는 방법과 도구를 개발합니다.
따라서 데이터 산업은 데이터 과학과 데이터 공학이 함께 가는 구조로 한쪽이 없으면 다른 한쪽도 존재할 수 없게 됩니다. 마치 사람의 정신과 육체처럼 말이죠. 또한 데이터 산업에 종사하는 데이터 과학자들은 데이터를 모으고 가공하며, 결과를 도출해 내는 역할을 합니다. 빅데이터 시대에서 이들의 역할은 앞으로 더욱 중요해질 것으로 보입니다.