分散の分散を計算したい

 化学材料の評価だと、「ばらつき」が性能の一部になることがある。塗布膜の均一性であったり、ロット差の安定性なんかも重要だ。そこで分散や標準偏差を出すのだが、この分散や標準偏差にも当然の測定ばらつきがある。

 

 じゃあどうやって「ばらつきのばらつき」を表せばいいのかを調べてみた。まず正規分布に従ってばらつくデータを考える。母平均 \mu=10、母分散 \sigma^2=4の母集団があるとする。

 

f:id:Chemstat:20200731022010j:plain

 

 で、ここからランダムに何点か取り出したものを標本とする。ここでは標本数 n=2 n=100を例にする。標本を取り出す操作を何回も繰り返して、不偏分散 s^2がどのくらいばらつくかを考える。

 実際の実験をイメージするなら、2点測定した場合と100点測定した場合で、そこから計算された平均や分散の結果がどれくらいばらつくかということになる。

 

f:id:Chemstat:20200731022006j:plain

  

  まず平均値\bar{x}の分布を見てみる。

 

f:id:Chemstat:20200801020920j:plain

 

 これはどちらもきれいな正規分布で、標本数nを増やすほうが分布が狭くなる。この時の分散がいわゆる評価誤差SEの二乗に相当し、下記式で表される。

 \begin{eqnarray*} SE^2=\frac{s^2}{n} \end{eqnarray*}

 この辺は実際にデータを取り扱っている感覚と合う。どこかで記事にしたいが、一旦置いておく。とにかく平均値の場合は nによって正規分布の幅が変わるということだ。

 

 では分散s^2の分布を見てみる。

 

f:id:Chemstat:20200801020925j:plain

 

 こちらは nによって大きく違う形になる。n=2は0の時に頻度が最大で減衰していく分布になる。一方でn=100正規分布っぽく見える。

 この分散の平均\bar{s^2}をとると、どちらも4になる。n=2の分布で平均が4なのは違和感はあるが、実際計算するとそうなる。

 では分散の分散s_s^2を計算するとn=2だと32、n=100だと約0.32になる。これはどう導かれるのだろう。

 

 母分散\sigma^2正規分布の母集団からn個のデータを取り出し、不偏分散 s^2を求めた時、 \small\begin{eqnarray*}(n-1)\frac{s_s^2}{\sigma^2}\end{eqnarray*}が自由度 n-1カイ二乗分布に従うことが知られている。上のグラフもそれぞれ自由度1、自由度99のカイ二乗分布から導かれる。

  \small\begin{eqnarray*}(n-1)\frac{s_s^2}{\sigma^2}\end{eqnarray*}の分散 Vは以下の式で与えられることが分かっている。

 

  \begin{eqnarray*}V\left((n-1)\frac{s^2}{\sigma^2}\right) = 2(n-1)\end{eqnarray*}

 

 \sigmanは定数で得られる値なので、式を展開していくと

   \begin{eqnarray*}\frac{(n-1)^2}{(\sigma^2)^2}V\left(s^2\right) = 2(n-1)\end{eqnarray*}

    \begin{eqnarray*}V\left(s^2\right) = s_s^2 = \frac{2(\sigma^2)^2}{(n-1)}\end{eqnarray*}

 となる。実際にn=2n=100の場合を計算してみると、

 \begin{eqnarray*} s_{s_2}^2 = \frac{2(\sigma^2)^2}{(n-1)} = \frac{2\times(4)^2}{(2-1)} = 32 \end{eqnarray*}

 \begin{eqnarray*}s_{s_{100}}^2 = \frac{2(\sigma^2)^2}{(n-1)} = \frac{2\times(4)^2}{(100-1)} = 0.3232...\end{eqnarray*}

となり無事先ほど計算した値と一致した。\sigma^2は分からないことのほうが多いので、不偏分散 s^2や分散の平均\bar{s^2}で代替する。あくまで母集団が正規分布の時しか成立しないので注意してほしい。

 

 ということでやっと分散の分散を計算することが出来たが、nが小さいときはその分散を出したところで、そのばらつきが大きすぎて何の参考にもならない事がよくわかる。

 

 参考:カイ二乗分布の分散 https://yu-otake.net/wp-content/uploads/2018/12/29e0cf2a40f71e168b7d789390197bc6.pdf