前回の記事では傾きが共通であることを確認できた。傾きが共通であれば切片の比較を行うことが出来る。傾きが平行でなければ、xの点によって変わってくるので、単純な比較ができなくなる。
まず切片に差がない場合を考える。真に切片が等しければ、それぞれのデータグループごとに導いた傾き共通の回帰式は等しくなる。下図では、の二つについてとなる。
二つの回帰式に差がないということは、要するにすべてのデータをまとめて回帰しても同じ回帰式が得られるということである。
二つの回帰直線の差を検定するときは、いつものように残差を比較することになる。残差が等しければデータグループ間で切片に差がないということになる。
ただし比較する残差はちょっとだけややこしくて、
①「傾き共通の回帰の残差」
②「まとめて回帰することにより増えた残差」
を比較することになる。これは「データグループという情報を除いた時の変化が、誤差に対して十分大きいか」を検定していることになる。
ということで早速実際のデータで計算していく。
データは以下である。
データ1
1 | 2 | 3 | 4 | 5 | |
2 | 6 | 6 | 9 | 6 |
データ2
2 | 3 | 4 | 5 | 6 | |
0 | 4 | 4 | 3 | 6 |
データ3
0 | 1 | 2 | 3 | 4 | |
3 | 5 | 7 | 9 | 7 |
残差平方和の計算
傾き共通の回帰式は前回導いた式を使用する。全データの回帰式は下のほうに記載しておく。
今回も実際の計算はデータ1のみ計算している。
前回同様、それぞれの回帰式を用いてを求め、実際のデータとの残差を各データ点について計算する。
データ1の傾き共通式の残差平方和:
全データの回帰式の残差平方和:
これをすべてのデータについて行って、残差の合計を計算する。
傾き共通式
これは前回の計算と同様である。
残差平方和:
残差の自由度:データの総数-回帰式の自由度
全データの回帰式
残差平方和:
残差の自由度:データの総数-回帰式の自由度
こちらはの回帰式から予想値を求めているので、切片と傾きが自由度2を引いた13が残差の自由度になる。
切片の差のF検定
これらを踏まえてF検定に必要な平方平均を求める。最初に説明したように、
「傾き共通回帰式の残差」の平方平均:
「全データの回帰式による残差の増加」の平方平均:
そしてこの平方平均を用いて「切片に差がない」ことを帰無仮説としたF検定を行う。
細かく言えば、「傾き共通の回帰式でグループの差を考慮した場合」と「まとめて回帰しグループの差を考慮しない場合」で差がないかを検定していることになる。
自由度、のF値3.98に対して大きいので、「切片に差がない」という帰無仮説は棄却され、「切片に差がある」と言える。
定義上、分子が分母より大きいときに棄却が否定されるという、片側検定なので注意が必要である。
ちなみこのデータは3つのグループがあるが、切片がすべて等しい()ことを帰無仮説としており、どれか一つでも異なっていれば帰無仮説は棄却される。
ということで無事切片の差を検定することが出来た。次回は傾きの有意性を検定したいと思う。
全データの回帰式
の平均値:
の平均値:
との偏差積和:
の偏差平方和:
切片:
傾き:
参考
共分散分析の解説:http://www.snap-tck.com/room04/c01/stat/stat13/stat1302.html