기대값의 개념을 확장하여 데이터가 얼마나 흩어져있는지 측정한 값.
분산이 크다는 정보가 많다. (SUV는 연비 값이 낮고, 소형차는 연비 값이 높으므로, 이 축을 따라 데이터가 넓게 퍼져잇음)
분산이 적다는 정보가 적다. (바퀴 4개는 분산이 적음 고로 바퀴4개로는 SUV 인지 뭔지 알수없는 논리)
$$
\sigma^2 = Var(X) = E(X-\mu)^2 = \left\{
\begin{array}{ll}
\sum_{x} (x-\mu)^2 p(x), & \text{(이산형의 경우)} \\
\\
\int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx, & \text{(연속형의 경우)}
\end{array}
\right.
$$
공식은 모표준편차(σ)에다가 제곱해서 루트를 날린것이다.