母集団と標本


母集団と標本

 母集団と標本の関係は、統計では一番基本的な部分だ。教科書を見れば一番最初に出てくるし、これを理解していなければ、統計の「と」の字もわかっていないと言って差し支えないと思う。

 母集団は興味のある集団、標本はそこから一部取り出したもの、である。

 そしてこの標本データから母集団を推測するのが統計的手法だ。

 

f:id:Chemstat:20200715184952j:plain

母集団と標本

 選挙の出口調査1000人が標本なら、想定している母集団は投票した有権者全員

 製品から10ロット取り出して評価したら、製造している製品の全ロット

 膜の強度を10か所で測った標本データなら、母集団は膜のあらゆる場所での強度

 光学性能をn2で測ったら、何回も同じ性能測定を繰り返した結果が母集団になる。

 

 私のように不勉強な研究者なら、とりあえず2回測定して誤差と標準偏差を出す、という行為を一回はやっていると思う。実際にはその誤差や標準偏差は何らかの母集団の推定値なのだ。

 ある一つのサンプルについて2か所で測定したら、測定値の誤差と標準偏差が示すのは「そのサンプル」の「あらゆる測定箇所」での評価結果を推測したものであって、異なるサンプルについては議論すべきではない。採用した標本サンプルによって推定できる母集団が変わる、という点は常に意識すべきだ。

 実際には気にしなくてもなんとかなる場合が多いが。

 

f:id:Chemstat:20200722053641j:plain

標本サンプルの取り方で推定できる母集団も変わる

 なぜ長々とこの話をしたかと言えば、自分がその違いを意識していなかったからだ。おかげで、統計の教科書では違うものとして取り扱うことにしばらくなじめなかった。似たような分散を語っているのに言葉も違うし、割り当てられる文字も違うので大いに混乱した。そしてまだしている。その辺は次回。