【実験計画Tips】外挿は難しい

エクセルでslope関数とintercept関数を使うと内挿・外挿が簡単に出来る、という話をした。

ただこの外挿は結構難しい。

近似直線はデータの端に行くほど精度が低くなる傾向がある。下図は近似曲線の信頼区間を示したものだが、データの重心が最も範囲が狭く、端に行くほどどんどん広がっていることが分かる。

 f:id:Chemstat:20200812020750p:plain

例えば下表のような例を考える。20日のデータを少しだけ小さくすると、30日、50日の予測値も変わってくる。30日では差が2だったのに対し、50日では4と差が広がっていく。

 

 

グラフにするとこんな感じ。データ1点の微妙な変化で近似直線に影響があり、取得したデータから遠くを予想するほど予測値のばらつきが大きくなっていくことが分かる。

外挿は今まで評価していない領域を予測する便利な方法だが、ばらつきの影響が大きいので信頼性は落ちるという事を覚えておいて欲しい。