This is an old revision of the document!


상위개념 : 베이즈 정리

나이브 베이즈 정리는베이즈 정리를 기반으로하여, 모든 특징들이 클래스가 주어졌을 때 서로 독립이라는 순진한(Naive) 가정을 통해 데이터 분류하는 확률적 분류 모델

  • 조건부 독립 (Conditional Independence): 어떤 클래스(결과)가 주어졌을 때, 해당 클래스를 예측하는 데 사용되는 모든 특징(원인)들은 서로 아무런 관련이 없다는 가정한다
    • 예시: 메일이 '스팸'일 때, 메일에 '광고'라는 단어가 포함될 확률과 '대출'이라는 단어가 포함될 확률은 서로 영향을 주지 않고 독립적이라고 가정한다


개념

1. 훈련 :
각 단어가 스펨메일일때 나타날 확률과 정상 메일일떄 나타날 확률을 계산하여 저장.
스펨메일일 사전확률과 정상메일일 사전확룰도 저장

2. 예측 :
새로운 메일 도착하면 그 메일에 포함된 모든 단어 분석
베이즈 정리를 이용해 메일이 스팸일 사후확률과 정상일 사후확률 각각 계산.(이떄 각 단어가 서로 독립적이라는 가정을 사용)
두 확률 중 더 높은 쪽으로 메일을 분려

실제 계산 예시

  • 머신러닝/나이브베이즈.1759576928.txt.gz
  • Last modified: 2025/10/04 11:22
  • by masteraccount