무작위로 흩어져있는 데이터를 정리할 때 어떤 방법을 사용하면 좋을까요? 보통 표와 그래프를 가장 많이 사용합니다. 정리된 데이터 상태를 보고 싶을 때는 표를, 변화의 흐름이나 정도 등을 확인할 때는 그래프를 사용합니다. 아무리 복잡한 데이터라도 표라는 시각화 도구를 잘 사용하면 깔끔하게 정리할 수 있습니다. 표를 기반으로 하는 도구인 ‘엑셀’, ‘데이터베이스‘에 데이터를 넣어주면, 강력한 컴퓨팅 파워를 사용할 수 있게 됩니다. 여기에 머신러닝까지 합친다면 단순히 계산만 하던 컴퓨터가 인간이 가진 통찰력을 흉내 낼 수 있습니다. 그래서 데이터 산업에서 표를 이해하는 것은 매우 중요하며, 이를 ‘데이터 셋’이라고 합니다. 이때 우리가 아는 열(column)은 특성, 속성, 변수, 행(row)은 개체, 관측치, 기록, 사례 등으로 부릅니다. 또한 열과 행에서 사용하는 용어들은 각각 비슷한 성격을 가지고 있는데, 적용되는 분야에 따라 같은 성격의 다른 표현들을 섞어서 사용할 때도 있습니다. [쉽게 배우는 AI] 시리즈 보러 가기1. 머신러닝이란?2. 머신러닝 모델이란?3. 데이터 산업과 직업4. 표와 데이터 셋5. 독립변수와 종속변수란?6. 상관관계와 인과관계7. 머신러닝의 분류8. 지도학습이란?9. 회귀 vs 분류10. 비지도 학습의 군집화11. 연관 규칙 학습이란?12. 비지도 학습의 목적13. 강화학습이란?14. 머신러닝 수업을 마치며 <원문>비전공자를 위한 AI 클래스 4화. 표와 데이터 셋 ©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.