회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
AWS 이용 중이라면 최대 700만 원 지원받으세요
국내 IT 기업은 한국을 넘어 세계를 무대로 할 정도로 뛰어난 기술과 아이디어를 자랑합니다. 이들은 기업 블로그를 통해 이러한 정보를 공개하고 있습니다. 요즘IT는 각 기업의 특색 있고 유익한 콘텐츠를 소개하는 시리즈를 준비했습니다. 이들은 어떻게 사고하고, 어떤 방식으로 일하고 있을까요?
회원가입을 하면 원하는 문장을
저장할 수 있어요!
다음
회원가입을 하면
성장에 도움이 되는 콘텐츠를
스크랩할 수 있어요!
확인
국내 IT 기업은 한국을 넘어 세계를 무대로 할 정도로 뛰어난 기술과 아이디어를 자랑합니다. 이들은 기업 블로그를 통해 이러한 정보를 공개하고 있습니다. 요즘IT는 각 기업의 특색 있고 유익한 콘텐츠를 소개하는 시리즈를 준비했습니다. 이들은 어떻게 사고하고, 어떤 방식으로 일하고 있을까요?
이번 글은 데이터 분석 도구 하트카운트(HEARTCOUT)를 개발하는 하트카운트 팀이 ‘데이터 아키텍처’라는 개념을 소개하는 글입니다.
안녕하세요! 'Everyone is an analyst, 하트카운트'의 Jaden입니다.
오늘은 데이터 아키텍처에 대한 이야기를 나누려고 합니다. 처음 접하면 낯설고 복잡할 수 있지만, 함께 차근차근 알아보면 더 이해하기 쉬울 거예요.
먼저 '데이터 아키텍처'가 무엇을 의미하는지부터 알아봅시다. 비개발자들에게는 '아키텍처'라는 용어가 낯설게 느껴질 수 있습니다. 이 용어는 직역하면 '건축학'이라는 단어이며, 시스템 및 소프트웨어 산업에서는 '시스템이 어떻게 구성되며 동작하는지 원리를 나타내는 원칙'을 의미합니다.
데이터 아키텍처(Data Architecture)는 조직이 데이터를 수집, 저장, 처리 및 관리하는 방법을 설계하고 구현하는 일련의 과정 또는 체계를 나타냅니다. 본 글에서는 ETL, 데이터 마트, 데이터 웨어하우스 등 데이터 아키텍처를 구성하는 개별 요소에 대해서 자세히 알아보고자 합니다.
데이터는 우리의 일상에서도, 비즈니스에서도 끊임없이 생성됩니다. 그런데 이 데이터는 어디서 오는 걸까요?
데이터는 위와 같이 여러 원천에서 옵니다. 여러 원천의 데이터를 가져와, 쓸만한 부분을 추출하고, 형태를 가공하여 사용해야 합니다. 마치 정유사에서, 원유를 뽑아내어 정제를 하여 사용하는 것과 마찬가지죠. 그렇기에 데이터가 4차 산업에서 원유와 같다고 하는 것은 전혀 과장이 아니죠.
앞서 말씀드렸듯이, 데이터는 생성되는 그 자체로는 종종 원하는 형태나 구조가 아닙니다. 이 상태를 우리는 원시 데이터, Raw Data라고 부릅니다. 따라서 우리는 이 데이터를 용도에 맞게 변형시켜야 합니다. 이렇게 데이터를 추출, 변환, 그리고 로드하는 과정을 ETL(추출, 변환, 적재)이라고 부릅니다.
데이터를 안전하고 효율적으로 저장하는 곳이 필요합니다. 이러한 공간을 데이터 웨어하우스(Data Warehouse)와 데이터 레이크(Data Lake)라고 부릅니다.
이곳은 주로 구조화된 데이터(Stuctured Data), 즉 테이블 형태의 데이터를 저장하는 곳입니다. 데이터 웨어하우스는 긴 시간 동안 안정적으로 큰 규모의 데이터를 저장하고, 필요할 때 빠르게 조회할 수 있도록 설계되어 있습니다. 여러 비즈니스 질의나 보고를 위해 주로 사용됩니다.
최근 많은 관심을 받고 있는 데이터 저장소로, 정형뿐만 아니라 반정형, 비정형 데이터도 저장할 수 있습니다. 예를 들면, 로그 파일이나 소셜 미디어 데이터, 이미지 등 다양한 형태의 데이터를 포함할 수 있습니다. 데이터 레이크는 큰 규모의 원시 데이터를 저장하고, 필요에 따라 이를 처리하여 사용할 수 있게 합니다.
기업에서는 데이터 웨어하우스의 데이터 전체를 항상 사용하는 것이 아니라, 특정 부서나 목적에 맞는 일부 데이터만 필요한 경우가 많습니다. 이럴 때 사용되는 것이 데이터 마트(Data Mart)입니다.
데이터 웨어하우스의 특정 주제나 부서에 특화된 부분집합을 의미합니다. 예를 들어 마케팅팀은 고객 데이터나 광고 데이터에만 관심이 있을 수 있으므로, 이런 데이터만 따로 모아놓은 것이 마케팅 데이터 마트가 될 수 있습니다.
데이터는 그 자체로 중요하지만, 그것을 어떻게 활용하느냐에 따라 진정한 가치가 발휘됩니다. 여러 분야에서의 데이터 활용은 기업의 성장과 혁신에 기여하며, 더 나은 의사결정을 위한 기반이 됩니다.
<원문>
데이터 아키텍처(Data Architecture)? 쉽게 배워봅시다!
요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.