This is an old revision of the document!
좌표계 위에 데이터들을 뿌리고, 새로운 데이터가 들어왔을 때 그 주변에 있는 k개의 데이터들이 무엇인지에 따라 새로운 데이터의 정체를 파악(분류)하는 방법.
KNN 동작 방식 (이미지 예시)
- 데이터 점 찍기: 기존의 데이터들을 정답(레이블)과 함께 좌표 공간에 모두 점으로 찍음. (위 그림의 빨간 삼각형, 파란 사각형)
- 새로운 점 등장: 정답을 모르는 새로운 데이터 점이 하나 등장. (초록색 원)
- 이웃 찾기: 새로운 점에서 가장 가까운 순서대로 k개의 이웃 데이터 점을 찾음.
- 투표하기: 찾은 k개의 이웃들이 어떤 그룹에 속해있는지 보고, 가장 많은 그룹으로 새로운 점을 분류. (이를 다수결(Majority Vote) 이라함.)