よんログ

回帰分析

前提知識

最小二乗法

最小二乗法 (least squares method) は、測定で得られたデータセットを一次関数 (直線) で近似するときに、二乗誤差の和が最小になるように一次関数の係数を決定する方法である。

nn 個のデータ (X,Y)={(x1,y1),(x2,y2),,(xi,yi)(X,Y)=\{(x_1,y_1),(x_2,y_2),\dots,(x_i,y_i) を最小二乗法で一次関数 y=ax+by=ax+b の形に近似すると、一次関数の係数 a,ba,b

a=Cov[X,Y]V[X]b=aE[X]+E[Y]\begin{aligned} a&=\dfrac{\text{Cov}[X,Y]}{\Bbb{V}[X]}\\ b&=-a\Bbb{E}[X]+\Bbb{E}[Y] \end{aligned}

となる。

導出

一次関数 y=ax+by=ax+b の形で近似したときの二条誤差の和 ϵ(a,b)\epsilon(a,b)

ϵ(a,b)=i(yiaxib)2\epsilon(a,b)=\sum_i(y_i-ax_i-b)^2

となる。

aa を定数とみなすと、ϵ(a,b)\epsilon(a,b) は下に凸な二次関数であるため

ϵ(a,b)b=02i(yiaxib)=0aixi+bn=iyiaE[X]+bn=E[Y]\begin{aligned} \dfrac{\partial\epsilon(a,b)}{\partial b}&=0\\ -2\sum_i(y_i-ax_i-b)&=0\\ a\sum_i{x_i}+bn&=\sum_i{y_i}\\ a\Bbb{E}[X]+bn&=\Bbb{E}[Y] \end{aligned}

同様に bb を定数とみなすと、ϵ(a,b)\epsilon(a,b) は下に凸な二次関数であるため

ϵ(a,b)a=02ixi(yiaxib)=0aixi2+bixi=ixiyi\begin{aligned} \dfrac{\partial\epsilon(a,b)}{\partial a}&=0\\ -2\sum_ix_i(y_i-ax_i-b)&=0\\ a\sum_i{x_i^2}+b\sum_i{x_i}&=\sum_i{x_iy_i} \end{aligned}

ここで b=aE[X]+E[Y]nb=\dfrac{-a\Bbb{E}[X]+\Bbb{E}[Y]}n を代入して

aixi2+(aE[X]+E[Y]n)ixi=ixiyia\sum_i{x_i^2}+\left(\dfrac{-a\Bbb{E}[X]+\Bbb{E}[Y]}n\right)\sum_i{x_i}=\sum_i{x_iy_i}

両辺を nn で割ると

aE[X2]+(aE[X]+E[Y])E[X]=E[XY]a=E[XY]E[X]E[Y]E[X2]E[X]2\begin{aligned} a\Bbb{E}[X^2]+(-a\Bbb{E}[X]+\Bbb{E}[Y])\Bbb{E}[X]&=\Bbb{E}[XY]\\ a&=\dfrac{\Bbb{E}[XY]-\Bbb{E}[X]\Bbb{E}[Y]}{\Bbb{E}[X^2]-\Bbb{E}[X]^2} \end{aligned}

ここで E[XY]E[X]E[Y]=Cov[X,Y],E[X2]E[X]2=V[X]\Bbb{E}[XY]-\Bbb{E}[X]\Bbb{E}[Y]=\text{Cov}[X,Y],\Bbb{E}[X^2]-\Bbb{E}[X]^2=\Bbb{V}[X] より

a=Cov[X,Y]V[X]b=aE[X]+E[Y]\begin{aligned} a&=\dfrac{\text{Cov}[X,Y]}{\Bbb{V}[X]}\\ b&=-a\Bbb{E}[X]+\Bbb{E}[Y] \end{aligned}

TODO

  • 語句の定義
  • 最小二乗法の幾何学的な導出
  • 分類問題
  • 混同行列と分類問題の評価
  • ロジスティック回帰
  • 相関と因果
  • 分析結果の解釈

参考

  • ヨビノリたくみ, 確率統計 - YouTube
  • 杉山 聡, 本質を捉えたデータ分析のための分析モデル入門, 2022