Differences
This shows you the differences between two versions of the page.
| Next revision | Previous revision | ||
| 머신러닝:나이브베이즈 [2025/10/04 11:22] – created masteraccount | 머신러닝:나이브베이즈 [2025/10/04 11:31] (current) – [예시에 대한 동작방식] masteraccount | ||
|---|---|---|---|
| Line 21: | Line 21: | ||
| 베이즈 정리를 이용해 메일이 스팸일 사후확률과 정상일 사후확률 각각 계산.(이떄 각 단어가 서로 독립적이라는 가정을 사용)\\ | 베이즈 정리를 이용해 메일이 스팸일 사후확률과 정상일 사후확률 각각 계산.(이떄 각 단어가 서로 독립적이라는 가정을 사용)\\ | ||
| 두 확률 중 더 높은 쪽으로 메일을 분려 \\ | 두 확률 중 더 높은 쪽으로 메일을 분려 \\ | ||
| + | \\ | ||
| \\ | \\ | ||
| ===실제 계산 예시=== | ===실제 계산 예시=== | ||
| + | \\ | ||
| + | 총 5개의 메일이 있고, ' | ||
| + | 스팸 메일 (3개) : " | ||
| + | 정상 메일 (2개) : "now meeting", | ||
| + | \\ | ||
| + | \\ | ||
| + | == 2. 훈련 (Training): 확률 계산하기 == | ||
| + | 2-1. 사전 확률 계산\\ | ||
| + | \\ | ||
| + | \\ | ||
| + | $ P(\text{스팸}) = \frac{\text{스팸 메일 수}}{\text{전체 메일 수}} = \frac{3}{5} = 0.6 $ \\ | ||
| + | \\ | ||
| + | $ P(\text{정상}) = \frac{\text{정상 메일 수}}{\text{전체 메일 수}} = \frac{2}{5} = 0.4 $ \\ | ||
| + | \\ | ||
| + | \\ | ||
| + | 2-2. 단어별 가능도 계산\\ | ||
| + | \\ | ||
| + | 스팸 메일 속 단어**: " | ||
| + | (전체 단어 종류: " | ||
| + | \\ | ||
| + | \\ | ||
| + | $ P(\text{" | ||
| + | \\ | ||
| + | $ P(\text{" | ||
| + | \\ | ||
| + | $ P(\text{" | ||
| + | \\ | ||
| + | $ P(\text{" | ||
| + | \\ | ||
| + | \\ | ||
| + | 정상 메일 속 단어 : " | ||
| + | $ P(\text{" | ||
| + | \\ | ||
| + | $ P(\text{" | ||
| + | \\ | ||
| + | $ P(\text{" | ||
| + | \\ | ||
| + | $ P(\text{" | ||
| + | \\ | ||
| + | \\ | ||
| + | ---- | ||
| + | |||
| + | 3. 예측 (Prediction): | ||
| + | \\ | ||
| + | "buy meeting" | ||
| + | \\ | ||
| + | |||
| + | 3-1. ' | ||
| + | \\ | ||
| + | $ P(\text{스팸} | \text{" | ||
| + | \\ | ||
| + | $ = \frac{3}{9} \times \frac{1}{9} \times 0.6 $ \\ | ||
| + | \\ | ||
| + | $ = \frac{3}{81} \times 0.6 $ \\ | ||
| + | \\ | ||
| + | $ \approx 0.037 \times 0.6 = 0.0222 $ \\ | ||
| + | \\ | ||
| + | |||
| + | 3-2. ' | ||
| + | \\ | ||
| + | $ P(\text{정상} | \text{" | ||
| + | \\ | ||
| + | $ = \frac{1}{7} \times \frac{3}{7} \times 0.4 $ \\ | ||
| + | \\ | ||
| + | $ = \frac{3}{49} \times 0.4 $ \\ | ||
| + | \\ | ||
| + | $ \approx 0.061 \times 0.4 = 0.0244 $ \\ | ||
| + | \\ | ||
| + | \\ | ||
| + | ---- | ||
| + | |||
| + | 4. 최종 결정 \\ | ||
| + | \\ | ||
| + | * ' | ||
| + | * ' | ||
| + | |||
| + | **' | ||