回帰分析を自力でやる計算するときに偏差積和を求める必要がある。
エクセルでSUMPRODUCT関数を使って計算しようと思ったのだが、地味に苦戦したので解説記事を書く。
実際のエクセルが気になる方ははこちらのGoogleスプレッドシートをご参照ください。
そもそもSUMPRODUCT関数とは
例えばこんな感じの計算をしたいとする。
エクセルでやるならば①B列×C列をD列に表示②SUM(D列)とすればよい。
この一連の操作をまとめてやるのがSUMPRODUCT関数で
SUMPRODUCT(C列,D列)
とすると一発で計算してくれる。
偏差平方和を求めるには少し工夫がいる
では続いて下記の式の偏差平方和をSUMPRODUCT関数を使って求めたいとする。
SUMPRODUCT(C列 - 平均値, C列 - 平均値)と入力すればいい気がするのだが、空白セルがあると少し話がややこしくなる。
D列のように空白セルが0 - 平均値として処理されてしまい、加算されてしまう。
解決策
じゃあどうすればよいかというと
SUMPRODUCT(G列<>"". G列-平均値, G列-平均値)
とするとよい。
「G列<>""」という数式は、G列が空白でなければTRUE(=1)、空白であればFALSE(=0)が出力される。
結果下記のように正しく偏差平方和を計算することが出来た。