개발
[쉽게 배우는 AI] 9. 회귀 vs 분류
2분
2023.06.16.14.7K

















지도학습은 크게 회귀(regression)와 분류(classification) 두 가지로 나뉩니다. 회귀의 경우 예측하고 싶은 결괏값이 숫자일 때 사용하며, 온실가스 변화에 따른 지구 기온의 변화나 공기 중 평균 습도 변화에 따른 개화 시기 같은 것을 예로 들 수 있습니다. 마치 인과관계를 증명하는 것처럼 보이지만, 그보다는 ‘인과관계가 상정된 모델을 구현한다‘로 보는 것이 맞습니다.
분류는 말 그대로 데이터들을 그룹화하여 나누는 것입니다. 이는 예측하고 싶은 결과가 어떤 종류에 가까운지를 알고 싶을 때 사용합니다. 예를 들어, 이메일의 문자열을 보고 어떤 메일이 스팸 메일인지 판별하는 모델을 만들 때나, X-RAY, MRI 등의 결과를 보고 종양이 양성인지 음성인지를 파악하는 모델을 만들 때에도 사용할 수 있습니다.
한편 데이터 산업에서는 '숫자'라는 표현보다는 '양적'이라는 표현을 더 많이 사용합니다. 얼마나 크고 많은지를 의미하는 데이터라는 뜻입니다. 또한 '이름'보다는 '범주(카테고리)'라는 표현을 사용합니다.
다시 개념을 간단히 정리해 보면 데이터에는 독립변수와 종속변수가 있으며, 이때 예측하고 싶은 종속변수가 숫자(양적 데이터)라면 회귀를 사용하고, 어떤 종류(범주)라면 분류를 사용하게 됩니다.
[쉽게 배우는 AI] 시리즈 보러 가기
<원문>
©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.
로그인하고 자유롭게 의견을 남겨주세요.