GR&Rを自力でやってみる:④データ解析編(平均値-範囲法)

前回まででやっとデータの準備までしたが、4回目にしてようやくGR&Rのデータ解析方法を解説する。

今回は平均値-範囲法でやってみる。

 

使用するデータ

今回はGR&Rを行うデータとして、下記のデータを使用する

f:id:Chemstat:20211021102927j:plain

測定者:二人(Aさん、Bさん)

部品数:3個

繰り返し数:3回

 

本当は部品数は10個以上、測定者も3人以上とかある程度数がないとまともなばらつきの評価ができているか怪しいのだが、今回は計算過程を全部書いていくため、簡便なデータで勘弁いただきたい。

 

EV:繰り返しばらつき

まずEV(繰り返しばらつき)を求めていく。EVは同じ部品を同じ人が図ったときのばらつきだが、下記で表される。

\begin{align*}EV=\overline{\overline{R}}{\times}K_1=\frac{\overline{\overline{R}}}{d_{2EV}}\end{align*}

このK_1だのd_2だのを使ったEVの導出がピンとこない第一ポイントだと思うので、とりあえず計算の意味から説明する。

 

まず\overline{\overline{R}}とは何かというところから。

Rというと同じ測定者が同じ部品を図ったときの、測定値の最大値-最小値の値で、\overline{\overline{R}}はそのRの平均をとった値である。一般的には測定者ごとに\overline{R}を出して、その平均を出すので二重線の\overline{\overline{R}}になっている。

f:id:Chemstat:20211021143634j:plain

で、これはあくまで最大値-最小値の「範囲」であって、中心値からの「ばらつき(\sigma)」ではない。この\overline{\overline{R}}を近似によって\sigmaに変換するための係数がK_1d_2になる。

f:id:Chemstat:20211021221626j:plain

d_2の値は使うべき数字がまとまっていて、EVの場合は下記のようになっている。

f:id:Chemstat:20211022103633p:plain

 

解説はここまでにしてようやくここからが計算パート。サクサク行こう。

\begin{align*}\overline{R_A}=\frac{1+2+1}{3}=1.33\end{align*}

\begin{align*}\overline{R_B}=\frac{1+3+1}{3}=1.67\end{align*}

\begin{align*}\overline{\overline{R}}=\frac{1.33+1.67}{2}=1.5\end{align*}
\begin{align*}EV=\frac{\overline{\overline{R}}}{d_{2EV}}=\frac{1.5}{1.73}=0.867\end{align*}

これで繰り返しばらつき(EV)の計算は終わり。

 

AV:測定者ばらつき

続いてAV(測定者ばらつき)を求めていく。EVは同じ部品を同じ人が図ったときのばらつきだが、下記で表される。

\begin{align*}AV=\sqrt{\left(\overline{X}_{diff}\times{K_2}\right)^2-\frac{EV^2}{nr}}=\sqrt{\left(\frac{\overline{X}_{diff}}{d_{2AV}}\right)^2-\frac{EV^2}{nr}}\end{align*}

(nは部品数、rは繰り返し数)

急にややこしい式になったのでこれもちょっと説明しよう。

最初は初めて登場した\overline{X}_{diff}から。

まず測定者ごとのデータを繰り返し・部品を無視して平均をとり\overline{X}を出す。この\overline{X}の最大値と最小値の差を取ったのが\overline{X}_{diff}である。(今回のデータは測定者が二人しかいないので問答無用で二つの差を取ることになる。)

f:id:Chemstat:20211022135418j:plain

 

で、これも先ほどと同様最大値-最小値の「範囲」であって、中心値からの「ばらつき(\sigma)」ではないのでK_2d_2を使って近似値を出す。

しかし今回の式はさっきよりなんかややこしくなっている。ちょっと式変形して下記みたいな形にしてみた。

f:id:Chemstat:20211022012443p:plain

近似で得られる式は繰り返しばらつきの項を含んでいるので、それを除いてAVを出すのだ。(ところでnrで割る理由があんまりわかってないでわかる人いたら教えてください)

で、近似に使うd_2の値がこんな感じ。これよく見ると上に出てきた表の一番上の行と同じです。

f:id:Chemstat:20211022103834p:plain

ようやくここから計算パート。

\begin{align*}\overline{X}_A=\frac{10+11+10+15+14+16+13+12+12}{9}=12.56\end{align*}

\begin{align*}\overline{X}_B=\frac{10+9+10+16+15+13+12+12+11}{9}=12\end{align*}

\begin{align*}\overline{X}_{diff}=\overline{X}_{max}-\overline{X}_{min}=12.56-12=0.56\end{align*}

\begin{align*}AV=\sqrt{\left(\frac{\overline{X}_{diff}}{d_{2AV}}\right)^2-\frac{EV^2}{nr}}=\sqrt{\left(\frac{0.56}{1.41}\right)^2-\frac{0.867^2}{3\times{3}}}=0.272\end{align*}

このAVの値、計算式上ルートの中身がマイナスになりえる。測定者のばらつきが繰り返しばらつきより極端に小さいとそうなるのだが、そんな時はAV=0で進めればよい。

 

PV:部品ばらつき

最後にPV(部品ばらつき)を求めていきたいと思う。

\begin{align*}PV=\overline{\overline{R}_p}{\times}K_3=\frac{K_1}{d_{2PV}}\end{align*}

やることは大体同じで、部品ごとの平均値をとり、最大値のと最小値の差R_pK3d_{2PV}を使ってばらつきの値を近似で得る。

f:id:Chemstat:20211022135802j:plain

ここで使うd_2の値がこんな感じ。部品数に対して変わるので、一応20まで書いている。数字を調べたいときは拡大してください。

f:id:Chemstat:20211022140417p:plain

これも実は最初のd_{2EV}の一行目と同じである。

余談だが、縦方向は計算に使用した「範囲」の数で、横方向は「繰り返し」の数になっている。AVやPVは一つしか範囲を使わないので1行しかないのだ。

ではここから計算パート

\begin{align*}\bar{y}_{1}=\frac{10+11+10+10+9+10}{6}=10\end{align*}

\begin{align*}\bar{y}_{2}=\frac{15+14+16+16+15+13}{6}=14.83\end{align*}

\begin{align*}\bar{y}_{3}=\frac{13+12+12+12+12+11}{6}=12\end{align*}

\begin{align*}R_{p}=\bar{y}_{max}-\bar{y}_{min}=14.83-10=4.83\end{align*}

\begin{align*}PV=R_p\times{K3}=\frac{R_p}{d_{2PV}}=\frac{4.83}{1.91}=2.528\end{align*}

 

TV:全変動

ここまでで求めたEV,AV,PVはそれぞれ標準偏差\sigmaなので、全変動を求める時は二乗して分散\sigma^2として足し合わせる必要がある。

TV=\sqrt{EV^2+AV^2+PV^2}=\sqrt{(0.867)^2+(0.272)^2+(2.528)^2}=2.686

 

GRR:評価系のばらつき

GRRは評価系のばらつきなので、部品のばらつきを除いたAVとEVを二乗して足し合わせる。

GRR=\sqrt{EV^2+PV^2}=\sqrt{(0.867)^2+(0.272)^2}=0.908

 

%GRR:判定

 

\%GRR=\frac{GRR}{TV}=\frac{0.908}{2.686}=33.8%

 

下記の目安に当てはめると、今回の系はNGとなり、精度の改善の余地がある。

測定者よりも繰り返しのばらつきが大きいので、装置だったり測定環境を見直すのがよさそうだ。

<10%:OK

10%~30%:場合によっては許容

>30%:NG

 

ようやく終わった。次回は同じデータをANOVA法でも解析したい。結構疲れたのでしばし休憩してからになると思うけれど。

 

補足:K1,K2,K3について

一般的にはAV,EV,PVを出すのにK_1,K_2,K_3を使う。これは基本的にはd_2の逆数と思えばよい。d_2の値は実験水準の数によって変わるので、調べるのが面倒くさい。部品数×測定者数が15以上ならほとんど変わらないとみなし、定数としてK_1,K_2,K_3を使っている。逆に言えば部品数×測定者数が小さいのにK_1の値を使うのは正確ではないのだと思う。GRRやるならある程度部品数や測定者数は増やしましょうね、という意味でもある。

 

参考サイト

GRR Study | Gauge R&R | Explained with Excel Template

https://www.rubymetrology.com/add_help_doc/MSA_Reference_Manual_4th_Edition.pdf