不偏分散はなぜn-1で割るのか

不偏分散の導出

$x_i$の標本平均$\bar{x}$は以下のように定義されます: \begin{equation} \bar{x}=\frac{1}{n}\Sigma_{i=1}^{n}{x_i} \label{eq0} \end{equation} そして、標本分散$\hat{s}^2$は次の式から求めることができます: \begin{equation} \hat{s}^2=\frac{1}{n}\Sigma_{i=1}^{n}(x_i-\bar{x})^2 \label{eq1} \end{equation} ここで、$(x_i-\bar{x})$の部分は次のように展開できます。$x_i$と$\bar{x}$をそれぞれ$\mu$で引くという巧妙な手法を使います: \begin{align} \Sigma_{i=1}^{n}(x_i-\bar{x})^2 & =\Sigma_{i=1}^{n}\left((x_i-\mu)-(\bar{x}-\mu)\right)^2 \nonumber\\ & =\Sigma_{i=1}^{n}\left((x_i-\mu)^2-2(x_i-\mu)(\bar{x}-\mu)+(\bar{x}-\mu)^2\right) \nonumber\\ & =\Sigma_{i=1}^{n}(x_i-\mu)^2-2(\bar{x}-\mu)\Sigma_{i=1}^{n}(x_i-\mu)+n(\bar{x}-\mu)^2 \label{eq2} \end{align} 式\eqref{eq0}を変形すると$\Sigma_{i=1}^{n}{x_i}=n\bar{x}$が得られるため、式\eqref{eq2}中の$\Sigma_{i=1}^{n}(x_i-\mu)$部分は次のように変形できます: \[ \Sigma_{i=1}^{n}(x_i-\mu)=\Sigma_{i=1}^{n}{x_i}-\Sigma_{i=1}^{n}\mu=n\bar{x}-n\mu \] したがって、式\eqref{eq2}は次のようになります: \begin{align} \Sigma_{i=1}^{n}(x_i-\bar{x})^2 & =\Sigma_{i=1}^{n}(x_i-\mu)^2-2n(\bar{x}-\mu)^2+n(\bar{x}-\mu)^2 \nonumber\\ & =\Sigma_{i=1}^{n}(x_i-\mu)^2-n(\bar{x}-\mu)^2 \label{eq3} \end{align} そして、標本分散の期待値$E\left[\hat{s}^2\right]$は次のように展開できます: \begin{align} E\left[\hat{s}^2\right] & =\frac{1}{n}E\left[\Sigma_{i=1}^{n}(x_i-\bar{x})^2\right] \nonumber\\ & =\frac{1}{n}\left(E\left[\Sigma_{i=1}^{n}(x_i-\mu)^2\right]-nE\left[(\bar{x}-\mu)^2\right]\right) \nonumber\\ & =\frac{1}{n}\Sigma_{i=1}^{n}E\left[(x_i-\mu)^2\right]-E\left[(\bar{x}-\mu)^2\right] \label{eq4} \end{align} 母分散$\sigma^2$の定義から、$E\left[(x_i-\mu)^2\right]=\sigma^2$です。したがって、式\eqref{eq4}の第一項は$\sigma^2$となります。また、式\eqref{eq4}の第二項は標本平均の分散であり、各$x_i$は独立なので分散が和に分解できます: \begin{align*} E\left[(\bar{x}-\mu)^2\right] &=V\left[\frac{1}{n}\Sigma_{i=1}^{n}{x_i}\right] \\ &=\frac{1}{n^2}V\left[\Sigma_{i=1}^{n}{x_i}\right] \\ &=\frac{1}{n^2}\cdot n\sigma^2 \\ &=\frac{\sigma^2}{n} \end{align*} したがって、標本分散の期待値は次のようになります: \begin{equation} E\left[\hat{s}^2\right]=\sigma^2-\frac{\sigma^2}{n} \label{eq5} \end{equation} これらの結果から、$n$が有限の場合、標本分散は母分散を過小評価します。そのため、不偏分散$s^2$はサンプルサイズ$n$ではなく、$n-1$で割ることで調整されます: \begin{equation} s^2=\frac{1}{n-1}\Sigma_{i=1}^{n}(x_i-\bar{x})^2 \end{equation} これにより、不偏分散の期待値が母分散に一致します: \begin{equation} E\left[s^2\right]=E\left[\frac{n}{n-1}\hat{s}^2\right]=\sigma^2 \end{equation}