二元配置分散分析(two-way ANOVA)を自力でやってみる①:各種統計量編

 二つの要素を持つ群が等しいかどうかを調べる二元配置分散分析(two-way ANOVA)。

エクセルで行うとこんな感じの表で出力される。

今回はこの計算を自力でやっていこうと思う。

 

f:id:Chemstat:20210425220204p:plain



 

データの準備

今回は繰り返しのある二元配置分散分析を行う。

要素1:a, b, c

要素2:A, B

という組み合わせで、各群2個ずつのデータを準備した。

ちなみにデータの個数が等しくないと適用できないので注意が必要である。

グラフにするとこんな感じ。

f:id:Chemstat:20210402225823j:plain

各群の統計量

今回は表の上部の各群のデータをサクサク計算していく。 

f:id:Chemstat:20210402223618p:plain

群A

標本数(データ数)

n_{Aa}=n_{Ab}=n_{Ac}=2

n_{A}=n_{Aa}+n_{Ab}+n_{Ac}=6

合計

 \begin{align*}  T_{Aa}= \sum_{i=1}^n{x_{Aai}}= 1+1=2\end{align*}

 \begin{align*}  T_{Ab}= \sum_{i=1}^n{x_{Abi}}= 1+2=3\end{align*}

 \begin{align*}  T_{Ac}= \sum_{i=1}^n{x_{Aci}}= 2+3=5\end{align*}

 \begin{align*}  T_{A}= T_{Aa}+ T_{Ab}+ T_{Ac}= 2+3+5=10\end{align*}

平均

 \begin{align*} \bar{x}_{Aa} = \frac{T_{Aa}}{n_{Aa}} = \frac{2} {2} =1\end{align*}

 \begin{align*} \bar{x}_{Ab} = \frac{T_{Ab}}{n_{Ab}} = \frac{3} {2} =1.5\end{align*}

 \begin{align*} \bar{x}_{Ac} = \frac{T_{Ac}}{n_{Ac}} = \frac{5} {2} =2.5\end{align*}

 \begin{align*}  \bar{x}_{A}= \frac{T_{A}}{n_{A}}= \frac{10}{6}=1.666...\end{align*}

分散(不偏分散)

 \begin{align*} s_{Aa}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{Aai}-\bar{x}_{Aa})^2}}{n_{Aa}-1} \scriptsize= \frac{(1-1)^2+(1-1)^2} {(2-1)} \normalsize=0 \end{align*}

 \begin{align*} s_{Ab}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{Abi}-\bar{x}_{Ab})^2}}{n_{Ab}-1} \scriptsize= \frac{(1-1.5)^2+(2-1.5)^2} {(2-1)} \normalsize=0.5 \end{align*}

 \begin{align*} s_{Ac}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{Aci}-\bar{x}_{Ac})^2}}{n_{Ac}-1} \scriptsize= \frac{(2-2.5)^2+(3-2.5)^2} {(2-1)} \normalsize=0.5 \end{align*}

 \begin{align*} s_{A}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{Ai}-\bar{x}_{A})^2}}{n_{A}-1} \scriptsize= \frac{(1-1.66)^2+(1-1.66)^2+(1-1.66)^2+(2-1.66)^2+(2-1.66)^2+(3-1.66)^2} {(6-1)} \normalsize=0.666... \end{align*}

 

群B

標本数(データ数)

n_{Ba}=n_{Bb}=n_{Bc}=2

n_{B}=n_{Ba}+n_{Bb}+n_{Bc}=6

合計

 \begin{align*}  T_{Ba}= \sum_{i=1}^n{x_{Bai}}= 2+3=5\end{align*}

 \begin{align*}  T_{Bb}= \sum_{i=1}^n{x_{Bbi}}= 3+4=7\end{align*}

 \begin{align*}  T_{Bc}= \sum_{i=1}^n{x_{Bci}}= 4+4=8\end{align*}

 \begin{align*}  T_{B}= T_{Ba}+ T_{Bb}+ T_{Bc}= 5+7+8=20\end{align*}

 平均

 \begin{align*} \bar{x}_{Ba} = \frac{T_{Ba}}{n_{Ba}} = \frac{5} {2} =2.5\end{align*}

 \begin{align*} \bar{x}_{Bb} = \frac{T_{Bb}}{n_{Bb}} = \frac{7} {2} =3.5\end{align*}

 \begin{align*} \bar{x}_{Bc} = \frac{T_{Bc}}{n_{Bc}} = \frac{8} {2} =4\end{align*}

 \begin{align*}  \bar{x}_{B}= \frac{T_{B}}{n_{B}}= \frac{20}{6}=3.333...\end{align*}

分散(不偏分散)

 \begin{align*} s_{Ba}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{Bai}-\bar{x}_{Ba})^2}}{n_{Ba}-1} \scriptsize= \frac{(2-2.5)^2+(3-2.5)^2} {(2-1)} \normalsize=0.5 \end{align*}

 \begin{align*} s_{Bb}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{Bbi}-\bar{x}_{Bb})^2}}{n_{Bb}-1} \scriptsize= \frac{(3-3.5)^2+(4-3.5)^2} {(2-1)} \normalsize=0.5 \end{align*}

 \begin{align*} s_{Bc}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{Bci}-\bar{x}_{Bc})^2}}{n_{Bc}-1} \scriptsize= \frac{(4-4)^2+(4-4)^2} {(2-1)} \normalsize=0 \end{align*}

  \begin{align*} s_{B}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{Bi}-\bar{x}_{B})^2}}{n_{B}-1} \scriptsize= \frac{(2-3.33)^2+(3-3.33)^2+(3-3.33)^2+(4-3.33)^2+(4-3.33)^2+(4-3.33)^2} {(6-1)} \normalsize=0.666... \end{align*}

 

合計(群A+群B)

標本数(データ数)

n_a=n_b=n_c=4

合計

 \begin{align*}  T_{a}= T_{Aa}+T_{Ba}= 2+5=7\end{align*}

 \begin{align*}  T_{b}= T_{Ab}+T_{Bb}= 3+7=10\end{align*}

 \begin{align*}  T_{c}= T_{Ac}+T_{Bc}= 5+8=13\end{align*}

平均

 \begin{align*} \bar{x}_{a} = \frac{T_{a}}{n_{a}} = \frac{7} {4} =1.75\end{align*}

 \begin{align*} \bar{x}_{b} = \frac{T_{b}}{n_{b}} = \frac{10} {4} =2.5\end{align*}

 \begin{align*} \bar{x}_{c} = \frac{T_{c}}{n_{c}} = \frac{13} {4} =3.25\end{align*}

分散(不偏分散)

 \begin{align*} s_{a}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{ai}-\bar{x}_{a})^2}}{n_{a}-1} \scriptsize= \frac{(1-1.75)^2+(1-1.75)^2+(2-1.75)^2+(3-1.75)^2} {(4-1)} \normalsize=0.9166... \end{align*}

 \begin{align*} s_{b}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{bi}-\bar{x}_{b})^2}}{n_{b}-1} \scriptsize= \frac{(1-2.5)^2+(2-2.5)^2+(3-2.5)^2+(4-2.5)^2} {(4-1)} \normalsize=1.666... \end{align*}

 \begin{align*} s_{c}^2 = \frac{\displaystyle\sum_{i=1}^n{(x_{ci}-\bar{x}_{c})^2}}{n_{c}-1} \scriptsize= \frac{(2-3.25)^2+(3-3.25)^2+(4-3.25)^2+(4-3.25)^2} {(4-1)} \normalsize=1.666... \end{align*}

 

今回は基本的な統計量にとどめて、次回の記事でそれぞれを計算した意味と検定の方法を解説する。