統計

データ数とばらつきの関係を直感的に理解したい

実験データは必ずばらつきを含む。ばらつきに対してサンプル間の差が十分ないと有意差かどうかを判定することが出来ない。じゃあばらつきとサンプル間の差はどの程度必要なのかを簡単にシミュレーションしてみた。 まずサンプル間差(difference)と標準偏差…

尤度について、たくさん図を使って解説する

ベイズ推定や最尤法を勉強していると「尤度」という概念が登場してくる。 すると大体こんな感じの数式が出てきて、数学が苦手な人間としてはそれだけできつい。 そこでこれをひたすら図を使って表現することを試みたい。 ①データを集める 今回は 「あるポリ…

行列を使って重回帰分析してみる

この記事では行列をつかって単回帰分析を実施した。この手法でほぼそのまま重回帰分析も出来るようなので、ついでに計算してみよう。 データの準備 データは下記のものを使用する。 x(説明変数) 1 2 3 4 5 y(説明変数) 2 6 6 9 6 z(被説明変数) 1 3 4 7 9 過…

行列を使って回帰分析してみる

統計や機械学習について調べると、行列を使った解説が多数出てくる。何かの役に立つことを期待して行列を使った計算方法も調べておく。ちなみに線形代数がすこぶる苦手なので、計算はpythonに頼りっぱなしである。 データの準備 データはいつものように下記…

エクセルの回帰分析を自力でやってみる(5)回帰直線の信頼区間

エクセルの回帰分析で出てくる数字の計算は、前回までですべて終わったのだが、ついでなので、単回帰分析の信頼区間も計算したいと思う。重回帰の際の信頼区間もあるようなのだが、今の私の能力では解説できないので、もうちょっと勉強してから記事にしたい…

エクセルの回帰分析を自力でやってみる(4)t検定

エクセルの回帰分析、今回は係数のt検定について計算する。 これまでは、以下のデータを用いて回帰直線の傾きと切片、回帰統計の値、分散分析表を計算してきた。今回の計算でも、平均値や偏差平方和等で今まで計算した値を用いているので、必要であれば参照…

エクセルの回帰分析を自力でやってみる(3)分散分析表

エクセルの回帰分析、今回は分散分析表の値を計算する。 これまでは、以下のデータを用いて回帰直線の傾きと切片、回帰統計の値を求めた。今回の計算でも、平均値や偏差平方和は前回の値を用いているので必要であれば参照してほしい。 (説明変数) 1 2 3 4 5 …

エクセルの回帰分析を自力でやってみる(2)回帰統計

エクセルの回帰分析、今回は回帰統計の値を計算する。 前回は以下のデータを用いて回帰直線の傾きと切片を求めた。今回の計算でも、平均値や偏差平方和は前回の値を用いているので必要であれば参照してほしい。 (説明変数) 1 2 3 4 5 (被説明変数) 2 6 6 9…

エクセルの回帰分析を自力でやってみる(1)傾きと切片

エクセルには重回帰分析のツールがあり、解析を行うと下記の表が得られる。 何回も見た表だが、実際これが何を表しているのかよくわからなかったので、調べてみた。一つずつ解説していこうと思う。 データの準備 とりあえず適当にXとYを定めた以下のデータを…

分散の分散を計算したい

化学材料の評価だと、「ばらつき」が性能の一部になることがある。塗布膜の均一性であったり、ロット差の安定性なんかも重要だ。そこで分散や標準偏差を出すのだが、この分散や標準偏差にも当然の測定ばらつきがある。 じゃあどうやって「ばらつきのばらつき…

単回帰分析の信頼区間

みんな大好き回帰分析。自分の組んだ実験で相関が見れると、賭けに勝ったような気になって幸せな気持ちになる。とはいえ実際は判断が難しかったり外れ点にひきずられたりで解釈に悩む場合が多い。 よく見る回帰直線は下のような形だろう。エクセルで数クリッ…

母集団と標本2

母集団と標本では、似たようなパラメーターを扱っているはずなのに、それを表す単語や記号が違う。この違いが腑に落ちてからその後の数式の理解が深まったので、ここにまとめておきたい。 教科書によっても表記が違うので、これが標準と言えないのだけれど、…

母集団と標本

母集団と標本 母集団と標本の関係は、統計では一番基本的な部分だ。教科書を見れば一番最初に出てくるし、これを理解していなければ、統計の「と」の字もわかっていないと言って差し支えないと思う。 母集団は興味のある集団、標本はそこから一部取り出した…