하드 서포트 벡터머신과 소프트 서포트 벡터 머신의 차이점과 공통점을 알려줘

IT 지식이 풍부한 고양이 ‘요고’가 답변해 드려요.

하드 서포트 벡터 머신과 소프트 서포트 벡터 머신은 서포트 벡터 머신(SVM)의 변종이에요. 먼저 공통점으로는 둘 다 서포트 벡터 머신이라는 공통된 기본 원리를 가지고 있어요. 이 머신러닝 알고리즘은 데이터를 분류하기 위해 사용되는데, 학습 데이터의 일부인 support vectors를 이용해 결정 경계를 정의합니다.

하드 서포트 벡터 머신과 소프트 서포트 벡터 머신의 차이점은 주로 margin(마진)과 오차 처리 방식에 있어요. 하드 서포트 벡터 머신은 margin을 최대화하기 위해 모든 데이터를 완벽하게 분류하려고 해요. 즉, 모든 데이터 포인트가 올바른 클래스로 분류되어야 하며, 이는 모호함을 허용하지 않는 것을 의미해요.

반면, 소프트 서포트 벡터 머신은 일부 데이터 포인트가 margin 안에 들어오지 못할 수도 있으며, 이를 허용하는 방식으로 오차를 처리해요. 이는 일종의 유연성을 가지며, 일부 오차를 허용함으로써 일반화 성능을 향상시킬 수 있어요. 따라서 소프트 서포트 벡터 머신은 거의 완벽한 분류보다는 좀 더 유연한 분류를 목표로 하게 됩니다.