Table of Contents

서포트백터머신(SVM)

개념

SVM 목표는 두 데이터 그룹을 나누는 마진~ 찾는 것.
단순 데이터 나누는 선을 찾는것이 아닌 최적의 경계선을 찾는것이 핵심.

주요용어

결정 경계선(Decision Boundary) : 두 데이터 그룹 나누는 경계선으로, 2차원은 선, 3차원은 평면, 그 이상은 초평면(Hyperplane) 이라 함.

서포트 벡터 (Support Vector) : 결정 경계와 가장 가까이있는 데이터 포인트들

마진 (Margin) : 결정경계와 서포트 백터 사의 거리.
(SVM 의 목표가 마진폭을 최대로 만드는것)

비용 : (Cost , C-parameter) : 마진을 위반한 잘못된 포인트에 대해 얼마나 관대할지.
C 높으면 용납않함, C낮으면 관대함.

커널트릭(Kernel Trick) : 데이터를 현재 차원에서 직언으로 나눌 수 없을떄 데이터를 더 높은 차원으로 보내 초평면으로 나누는것
간단하게 생각하면 f(x,y)=z 인것을 f(x,y,z)=k 이런식으로 차원늘려서 어떻게든 나눠보겠다는것.