Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision | |||
| 머신러닝:나이브베이즈 [2025/10/04 11:28] – [예시에 대한 동작방식] masteraccount | 머신러닝:나이브베이즈 [2025/10/04 11:31] (current) – [예시에 대한 동작방식] masteraccount | ||
|---|---|---|---|
| Line 22: | Line 22: | ||
| 두 확률 중 더 높은 쪽으로 메일을 분려 \\ | 두 확률 중 더 높은 쪽으로 메일을 분려 \\ | ||
| \\ | \\ | ||
| + | \\ | ||
| ===실제 계산 예시=== | ===실제 계산 예시=== | ||
| + | \\ | ||
| 총 5개의 메일이 있고, ' | 총 5개의 메일이 있고, ' | ||
| 스팸 메일 (3개) : " | 스팸 메일 (3개) : " | ||
| 정상 메일 (2개) : "now meeting", | 정상 메일 (2개) : "now meeting", | ||
| - | + | \\ | |
| - | ---- | + | \\ |
| == 2. 훈련 (Training): 확률 계산하기 == | == 2. 훈련 (Training): 확률 계산하기 == | ||
| - | = 2-1. 사전 확률 계산 | + | 2-1. 사전 확률 계산\\ |
| + | \\ | ||
| + | \\ | ||
| $ P(\text{스팸}) = \frac{\text{스팸 메일 수}}{\text{전체 메일 수}} = \frac{3}{5} = 0.6 $ \\ | $ P(\text{스팸}) = \frac{\text{스팸 메일 수}}{\text{전체 메일 수}} = \frac{3}{5} = 0.6 $ \\ | ||
| + | \\ | ||
| $ P(\text{정상}) = \frac{\text{정상 메일 수}}{\text{전체 메일 수}} = \frac{2}{5} = 0.4 $ \\ | $ P(\text{정상}) = \frac{\text{정상 메일 수}}{\text{전체 메일 수}} = \frac{2}{5} = 0.4 $ \\ | ||
| + | \\ | ||
| + | \\ | ||
| - | == 2-2. 단어별 가능도 계산 | + | 2-2. 단어별 가능도 계산\\ |
| + | \\ | ||
| 스팸 메일 속 단어**: " | 스팸 메일 속 단어**: " | ||
| (전체 단어 종류: " | (전체 단어 종류: " | ||
| + | \\ | ||
| \\ | \\ | ||
| $ P(\text{" | $ P(\text{" | ||
| + | \\ | ||
| $ P(\text{" | $ P(\text{" | ||
| + | \\ | ||
| $ P(\text{" | $ P(\text{" | ||
| + | \\ | ||
| $ P(\text{" | $ P(\text{" | ||
| + | \\ | ||
| + | \\ | ||
| 정상 메일 속 단어 : " | 정상 메일 속 단어 : " | ||
| $ P(\text{" | $ P(\text{" | ||
| + | \\ | ||
| $ P(\text{" | $ P(\text{" | ||
| + | \\ | ||
| $ P(\text{" | $ P(\text{" | ||
| + | \\ | ||
| $ P(\text{" | $ P(\text{" | ||
| + | \\ | ||
| + | \\ | ||
| ---- | ---- | ||
| - | == 3. 예측 (Prediction): | + | 3. 예측 (Prediction): |
| - | "buy meeting" | + | \\ |
| + | "buy meeting" | ||
| + | \\ | ||
| - | = 3-1. ' | + | 3-1. ' |
| + | \\ | ||
| $ P(\text{스팸} | \text{" | $ P(\text{스팸} | \text{" | ||
| + | \\ | ||
| $ = \frac{3}{9} \times \frac{1}{9} \times 0.6 $ \\ | $ = \frac{3}{9} \times \frac{1}{9} \times 0.6 $ \\ | ||
| + | \\ | ||
| $ = \frac{3}{81} \times 0.6 $ \\ | $ = \frac{3}{81} \times 0.6 $ \\ | ||
| + | \\ | ||
| $ \approx 0.037 \times 0.6 = 0.0222 $ \\ | $ \approx 0.037 \times 0.6 = 0.0222 $ \\ | ||
| + | \\ | ||
| - | = 3-2. ' | + | 3-2. ' |
| + | \\ | ||
| $ P(\text{정상} | \text{" | $ P(\text{정상} | \text{" | ||
| + | \\ | ||
| $ = \frac{1}{7} \times \frac{3}{7} \times 0.4 $ \\ | $ = \frac{1}{7} \times \frac{3}{7} \times 0.4 $ \\ | ||
| + | \\ | ||
| $ = \frac{3}{49} \times 0.4 $ \\ | $ = \frac{3}{49} \times 0.4 $ \\ | ||
| + | \\ | ||
| $ \approx 0.061 \times 0.4 = 0.0244 $ \\ | $ \approx 0.061 \times 0.4 = 0.0244 $ \\ | ||
| + | \\ | ||
| + | \\ | ||
| ---- | ---- | ||
| - | == 4. 최종 결정 | + | 4. 최종 결정 |
| + | \\ | ||
| * ' | * ' | ||
| * ' | * ' | ||
| **' | **' | ||