Table of Contents

분산

개념

기대값의 개념을 확장하여 데이터가 얼마나 흩어져있는지 측정한 값.
분산이 크다는 정보가 많다. (SUV는 연비 값이 낮고, 소형차는 연비 값이 높으므로, 이 축을 따라 데이터가 넓게 퍼져잇음)
분산이 적다는 정보가 적다. (바퀴 4개는 분산이 적음 고로 바퀴4개로는 SUV 인지 뭔지 알수없는 논리)

공식

$$ \sigma^2 = Var(X) = E(X-\mu)^2 = \left\{ \begin{array}{ll} \sum_{x} (x-\mu)^2 p(x), & \text{(이산형의 경우)} \\ \\ \int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx, & \text{(연속형의 경우)} \end{array} \right. $$

공식 이해

공식은 모표준편차(σ)에다가 제곱해서 루트를 날린것이다.