개발
[쉽게 배우는 AI] 4. 표와 데이터 셋
2분
2023.05.12.6.8K








무작위로 흩어져있는 데이터를 정리할 때 어떤 방법을 사용하면 좋을까요? 보통 표와 그래프를 가장 많이 사용합니다. 정리된 데이터 상태를 보고 싶을 때는 표를, 변화의 흐름이나 정도 등을 확인할 때는 그래프를 사용합니다. 아무리 복잡한 데이터라도 표라는 시각화 도구를 잘 사용하면 깔끔하게 정리할 수 있습니다. 표를 기반으로 하는 도구인 ‘엑셀’, ‘데이터베이스‘에 데이터를 넣어주면, 강력한 컴퓨팅 파워를 사용할 수 있게 됩니다.
여기에 머신러닝까지 합친다면 단순히 계산만 하던 컴퓨터가 인간이 가진 통찰력을 흉내 낼 수 있습니다. 그래서 데이터 산업에서 표를 이해하는 것은 매우 중요하며, 이를 ‘데이터 셋’이라고 합니다. 이때 우리가 아는 열(column)은 특성, 속성, 변수, 행(row)은 개체, 관측치, 기록, 사례 등으로 부릅니다.
또한 열과 행에서 사용하는 용어들은 각각 비슷한 성격을 가지고 있는데, 적용되는 분야에 따라 같은 성격의 다른 표현들을 섞어서 사용할 때도 있습니다.
[쉽게 배우는 AI] 시리즈 보러 가기
<원문>
©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.
로그인하고 자유롭게 의견을 남겨주세요.