This is an old revision of the document!
상위개념 : 베이즈 정리
나이브베이즈(Naive Bayes)
개념
핵심가정
- 조건부 독립 (Conditional Independence): 어떤 클래스(결과)가 주어졌을 때, 해당 클래스를 예측하는 데 사용되는 모든 특징(원인)들은 서로 아무런 관련이 없다는 가정한다
- 예시: 메일이 '스팸'일 때, 메일에 '광고'라는 단어가 포함될 확률과 '대출'이라는 단어가 포함될 확률은 서로 영향을 주지 않고 독립적이라고 가정한다
예시에 대한 동작방식
개념
1. 훈련 :
각 단어가 스펨메일일때 나타날 확률과 정상 메일일떄 나타날 확률을 계산하여 저장.
스펨메일일 사전확률과 정상메일일 사전확룰도 저장
2. 예측 :
새로운 메일 도착하면 그 메일에 포함된 모든 단어 분석
베이즈 정리를 이용해 메일이 스팸일 사후확률과 정상일 사후확률 각각 계산.(이떄 각 단어가 서로 독립적이라는 가정을 사용)
두 확률 중 더 높은 쪽으로 메일을 분려