前回に続き二元配置分散分析(two-way ANOVA)。
データの準備
繰り返しのある二元配置分散分析としてこちらのデータを使用する。
要素1:a, b, c
要素2:A, B
分散分析(標本・列)
今回は標本と列の効果をF検定進めていく。
下記式でいうところの、を求めていくことになる。
標本(A・B)の分散
まず標本A・Bの効果について分散を求める。
この二つの効果を計算するには、全データの平均と標本A・Bのデータの平均、の差を計算する事で求めることが出来る。
以前の記事のデータを使っているので、必要であれば参照ください。
分散分析を行うには、このの分散を求める必要がある。
エクセルではそれぞれの効果の二乗和を「変動」と呼び、それを自由度で割ったものを「分散」と呼んでいる。
変動
自由度
分散
列(a・b・c)の分散
つづいて、列a・b・cの効果について分散を求める。
標本の時と同様に、効果を計算するには、全データの平均と列a・b・cのデータの平均、、の差を計算する事で求めることが出来る。
標本と同様に分散を求める。
変動
自由度
分散
誤差の分散
交互作用はいったん飛ばして、F検定に必要な誤差の分散を求めていく。
誤差は各群の平均と、実際のデータの差で計算できる。
、、、、、
変動
自由度
分散
交互作用の分散も後程計算するのでご容赦ください。
さて、ここまで来たら、必要な分散が出そろったので、F検定を行うことが出来る。
標本(A・B)のF検定
観測された分散比
これがF値に相当する。
p値
自由度のF分布においての上側の累積確率に相当するので、0.0024になる。Excelやpythonで計算してもらえばよい。
F境界値
自由度のF分布において上側の累積確率が5%となるF値なので、5.987...となる。こちらもExcelやpythonで計算してもらえれば。
この分散分析で最終的に得られるF値、p値によってグループ間の差が統計的に有意かを調べることが出来る。ちなみに帰無仮説は「標本(A・B)ごとの平均値の差に差がない」である。今回のF=25ではp値は0.0024なので、棄却域を0.05で取る場合帰無仮説は棄却され、「標本(A・B)間に差がある」ことになる。
それぞれの関係を下図に示した。
列(a・b・c)のF検定
標本の時と同様に計算していく。
観測された分散比
p値
自由度のF分布においての上側の累積確率に相当するので、0.029になる。
F境界値
自由度のF分布において上側の累積確率が5%となるF値なので、5.143...となる。こちらもExcelやpythonで計算してもらえれば。
帰無仮説は「列(a・b・c)ごとの平均値の差に差がない」である。今回のF=6.75ではp値は0.029なので、棄却域を0.05で取る場合帰無仮説は棄却され、「列(a・b・c)間に差がある」ことになる。
ずいぶん長くなったが、とりあえず今回はここで区切る。
次回は交互作用の効果について計算をしていく。