선형결합을 응용한다.
선형결합의 각 $v_n$ 이 선형회귀에서는 특징이 되고, 선형결합의 $a_n$이 선형회귀에서는 가중치(=회귀계수)가 된다.
선형 회귀는 흩어져 있는 데이터 점들 사이를 가장 잘 가로지르는 최적의 직선 하나를 찾는 과정
모든 점들로부터의 평균적인 거리가 가장 가까운 직선을 그리는 것이 목표이다.
집값예측을 할때
$ \hat{y} $ = 가격
$ x_1 $ = 면적(특징)
$ \beta_0 $ = 기본적인 집값(이건 가중치가 아닌 절편)
$ \beta_1 $ = 면적의 가중치
$ \hat{y} = \beta_0 + \beta_1 x_1 $
데이터를 사용하여 최적의 가중치(=회귀계수)를 찾는다.(여기서 특이한게… 머신러닝에서는 가중치를 모수라고하는데… 개념적으로는 가중치가 맞아서 가중치라고했다.)
해당 함수로 평균제곱오차를 출력한다.
그 평균제곱오차가 가장 낮은게 좋은 회귀함수다.
여러가지 방법이있지만 경사하강법을 많이 쓴다.