以前の記事で、二つの母不適合品率の差の検定と推定について基本的な考え方と進め方を解説しました。
二つの母不適合品率の差に関する検定と推定二つの母不適合数(欠点数)に関しても、母不適合品率と同様に検定統計量が正規分布に近似的に従うことを利用して検定や推定が可能です。
今回は、二つの母不適合数が異なるかどうかを検定する方法と母不適合数の差を推定する方法について解説します。
1. 適用できる場面
以下の事例を使って、二つの母不適合数の差の検定と推定を解説します。
ある会社では、A工場とB工場の2工場体制で事業を運営しています。
労働災害を未然に防止するため、現状調査として両工場のヒヤリハット(一歩間違えると事故につながりかねない事象)の件数を調べました。
A工場では、直近5ヶ月のヒヤリハット件数は、1か月ごとに8,5,6,10,8件でした。
B工場では、最初の1か月のデータを取りそこない、直近4か月のヒヤリハット件数が5,4,7,7件でした。
両工場で、ヒヤリハット件数に違いがあると言えるでしょうか。
この事例では、A工場(第1母集団)の1か月あたりのヒヤリハット件数(母不適合数)を\(\lambda_1\)とします。
同様に、B工場(第2母集団)の1か月あたりのヒヤリハット件数を\(\lambda_2\)とします。
このとき、A工場から得られた\(n_1=5\)ヵ月のヒヤリハット件数と、B工場から得られた\(n_2=4\)ヵ月のヒヤリハット件数から、二つの工場の1ヵ月あたりのヒヤリハット件数(母不適合数)\(\lambda_1\)と\(\lambda_2\)が同じかどうかの検定と、母不適合数の差の推定を行うことが目的です。
2. 検定に適用する基本事項
一つの母不適合数に関する検定では、正規分布を使いましたが、二つの母不適合数の差の検定でも、正規分布を使用します。
検定方法の説明の前に、検定に必要な基本事項を確認しておきます。
第1母集団から得られた\(n_1\)単位における1単位ごとの不適合数\(x_{11},x_{12},\cdots,x_{1n_1}\)はポアソン分布\(Po(\lambda_1)\)に従い、第2母集団から得られた\(n_2\)単位における1単位ごとの不適合数\(x_{21},x_{22},\cdots,x_{2n_2}\)はポアソン分布\(Po(\lambda_2)\)に従います。
それぞれの不適合数の合計\(T_1\)と\(T_2\)を以下のように求めます。
\(T_1=x_{11}+x_{12}+\cdots+x_{1n_1}\)
\(T_2=x_{21}+x_{22}+\cdots+x_{2n_2}\)
以前の記事の基本事項1から、\(T_1\)はポアソン分布\(Po(n_1\lambda_1)\)に、\(T_2\)はポアソン分布\(Po(n_2\lambda_2)\)に従います。
このとき、1単位当たりの母不適合数\(\lambda_1\)と\(\lambda_2\)は以下のように推定できます。
\(\hat{\lambda}_1=\displaystyle \frac{T_1}{n_1}\)
\(\hat{\lambda}_2=\displaystyle \frac{T_2}{n_2}\)
以前の記事の基本事項3で解説したように、\(\hat{\lambda}_1\)と\(\hat{\lambda}_2\)はそれぞれ正規分布\(N(\lambda_1,\lambda_1/n_1)\)と\(N(\lambda_2,\lambda_2/n_2)\)に近似的に従います。
二つの母不適合数\(\hat{\lambda}_1\)と\(\hat{\lambda}_2\)を比較するには、\(\hat{\lambda}_1-\hat{\lambda}_2\)を考えればよく、以下の基本事項を用います。
\(\hat{\lambda}_1-\hat{\lambda}_2\)は近似的に正規分布\( N\left( \lambda_1-\lambda_2,\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2} \right )\)に従う。(分散の加法性)
\(\hat{\lambda_1}-\hat{\lambda_2}\)を標準化すると、
\(u=\displaystyle \frac{\hat{\lambda}_1-\hat{\lambda}_2-(\lambda_1-\lambda_2)}{\sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}} \qquad (1)\)
は近似的に標準正規分布\(N(0,1^2)\)に従う。
3. 二つの母不適合数の差に関する検定
二つの母不適合数の差の検定では、帰無仮説\(H_0:\lambda_1=\lambda_2\)を設定します。
帰無仮説\(H_0\)が成り立つと仮定するとき、\(\lambda_1=\lambda_2=\lambda\)とすると、(1)式は以下のようになります。
\(u=\displaystyle \frac{\hat{\lambda}_1-\hat{\lambda}_2}{\sqrt{\lambda \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}} \qquad (2)\)
このとき、\(u\)は\(H_0\)が成り立つ下では近似的に標準正規分布\(N(0,1^2)\)に従います。
\(\lambda\)は未知なので、以下のような推定量を用います。
\(\lambda_1=\lambda_2=\lambda\)のとき、第1母集団と第2母集団は母不適合数について同じ母集団と考えられます。
すると、両者を合わせた母集団から\(n_1+n_2\)個のサンプルを採取して、\(T_1+T_2\)個の不適合数が見つかったとみなせます。
よって、\(\lambda\)の推定量\(\hat{\lambda}\)は、
\(\hat{\lambda}=\displaystyle \frac{T_1+T_2}{n_1+n_2}\)
と表せます。
\(\lambda\)の同時推定量\(\hat{\lambda}\)を(2)式に代入することで、検定統計量
\(u_0=\displaystyle \frac{\hat{\lambda}_1-\hat{\lambda}_2}{\sqrt{\hat{\lambda} \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}}\)
を得られ、\(u_0\)は標準正規分布\(N(0,1^2)\)に近似的に従います。
以上の性質を使って、二つの母不適合数の差の検定を行います。
3-1. 二つの母不適合数の差に関する検定手順
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
検定の目的に応じて、(1)~(3)のいずれかを選択します。
(1) \(H_0:\lambda_1=\lambda_2\)
\(H_1:\lambda_1 \neq \lambda_2\) (両側検定)
(2) \(H_0:\lambda_1=\lambda_2\)
\(H_1:\lambda_1 > \lambda_2\) (右片側検定)
(3) \(H_0:\lambda_1=\lambda_2\)
\(H_1:\lambda_1 < \lambda_2\) (左片側検定)
手順2. 有意水準\(\alpha\)を決める。
通常は、\(\alpha=0.05\)とします。
手順3. 手順1(仮説)と手順2(有意水準)に対応した棄却域を決める。
(1)棄却域:\(|u_0|\ge K_{\alpha/2}\) (両側検定)
(2)棄却域:\(u_0 \ge K_{\alpha}\) (右片側検定)
(3)棄却域:\(u_0 \le -K_{\alpha}\) (左片側検定)
手順4. 採取した第1母集団の不適合数のデータ\(x_{11},x_{12},\cdots,x_{1n_1}\)と、第2母集団のデータ\(x_{21},x_{22},\cdots,x_{2n_2}\)から検定統計量\(u_0\)を計算する。
\(\hat{\lambda}=\displaystyle \frac{T_1+T_2}{n_1+n_2}\)
\(u_0=\displaystyle \frac{\hat{\lambda}_1-\hat{\lambda}_2}{\sqrt{\hat{\lambda} \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}}\)
手順5. 判定する。
\(u_0\)が棄却域に入れば、有意水準\(\alpha\)で有意と判定し、帰無仮説\(H_0\)を棄却して対立仮説\(H_1\)を採択します。
\(u_0\)が棄却域に入らなければ、有意水準\(\alpha\)で有意でないと判定し、帰無仮説\(H_0\)を棄却しません。
3-2. 二つの母不適合数の差に関する検定の実施例
事例1について、検定手順に従って検定してみましょう。
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
A工場とB工場で母不適合数(ヒヤリハット件数)が異なるかを知りたいので、両側検定で帰無仮説と対立仮説を設定します。
\(H_0:\lambda_1=\lambda_2\)
\(H_1:\lambda_1 \neq \lambda_2\)
手順2. 有意水準\(\alpha\)を決める。
\(\alpha=0.05\)
手順3. 棄却域を決める。
棄却域:\(|u_0|\ge K_{0.025}=1.96\)
手順4. 検定統計量\(u_0\)の値を計算する。
得られたデータより、以下のように検定統計量を求めます。
\(T_1=8+5+6+10+8=37\)
\(T_2=5+4+7+7=23\)
\(\hat{\lambda}_1=\displaystyle \frac{T_1}{n_1}= \frac{37}{5}=7.40\)
\(\hat{\lambda}_2=\displaystyle \frac{T_2}{n_2}= \frac{23}{4}=5.75\)
\(\hat{\lambda}=\displaystyle \frac{T_1+T_2}{n_1+n_2}=\frac{37+23}{5+4}=6.67\)
\(u_0=\displaystyle \frac{\hat{\lambda}_1-\hat{\lambda}_2}{\sqrt{\hat{\lambda} \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}} \)
\( =\displaystyle \frac{7.40-5.75}{\sqrt{6.67 \left (\displaystyle \frac{1}{5}+\frac{1}{4} \right )}}\)
\(=0.952\)
手順5. 判定する。
\(u_0=0.952 \lt K_{0.025}=1.96\)で検定統計量\(u_0\)は採択域に入るので有意ではありません。
よって帰無仮説\(H_0\)を棄却できず、A工場とB工場で母不適合数\(\lambda_1\)と\(\lambda_2\)は異なるとは言えないと判断できます。
4. 二つの母不適合数の差の推定
母不適合数の差\(\lambda_1-\lambda_2\)について、点推定と区間推定ができます。
4-1. 二つの母不適合数の差の推定手順
\(\lambda_1-\lambda_2\)の点推定は、データの不適合品率の差\(\hat{\lambda}_1-\hat{\lambda}_2=\displaystyle \frac{T_1}{n_1}-\frac{T_2}{n_2}\)を使えばよいです。
\(\lambda_1-\lambda_2\)の区間推定については基本事項2から、
\(u=\displaystyle \frac{\hat{\lambda}_1-\hat{\lambda}_2-(\lambda_1-\lambda_2)}{\sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}}\)
は近似的に標準正規分布\(N(0,1^2)\)に従うので、以下が成立します。
\(Pr \left(-K_{\alpha/2} <\displaystyle \frac{\hat{\lambda}_1-\hat{\lambda}_2-(\lambda_1-\lambda_2)}{\sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}}<K_{\alpha/2} \right)\)
\(=1-\alpha \)
かっこの中を変形すると、以下のようになります。
\(Pr \left ( \hat{\lambda}_1-\hat{\lambda}_2-K_{\alpha/2} \sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}} <\lambda_1-\lambda_2 \right.\)
\(\left . <\hat{\lambda}_1-\hat{\lambda}_2+K_{\alpha/2} \sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}} \right )\)
\(=1-\alpha \)
ここで、平方根の中の\(\lambda_1\)と\(\lambda_2\)をそれぞれの推定量\(\hat{\lambda}_1\)と\(\hat{\lambda}_2\)に置き換えたときの、かっこの中が信頼区間です。
二つの母不適合品数の差の推定手順をまとめると、以下のようになります。
点推定:
\(\widehat{\lambda_1-\lambda_2}=\hat{\lambda}_1-\hat{\lambda}_2=\displaystyle \frac{T_1}{n_1}-\frac{T_2}{n_2}\)
区間推定:信頼率\(1-\alpha\)の信頼区間
\(\left ( \hat{\lambda}_1-\hat{\lambda}_2-K_{\alpha/2} \sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}, \right .\)
\( \left . \hat{\lambda}_1-\hat{\lambda}_2+K_{\alpha/2} \sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}} \right )\)
4-2. 二つの母不適合数の差の推定の実施例
事例1について、点推定と区間推定を行ってみましょう。
点推定:
\(\widehat{\lambda_1-\lambda_2}=\hat{\lambda}_1-\hat{\lambda}_2=\displaystyle \frac{T_1}{n_1}-\frac{T_2}{n_2}\)
\(=\displaystyle \frac{37}{5}-\frac{23}{4}=7.40-5.75=1.65\)
区間推定:信頼率95%の信頼区間を求めます。
\(\left ( \hat{\lambda}_1-\hat{\lambda}-K_{0.025} \sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}, \right .\)
\( \left . \hat{\lambda}_1-\hat{\lambda}+K_{0.025} \sqrt{\displaystyle \frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}} \right )\)
\( = \left ( 7.40-5.75-1.96 \sqrt{\displaystyle \frac{7.40}{5}+\frac{5.75}{4}}, \right .\)
\( \left . 7.40-5.75+1.96 \sqrt{\displaystyle \frac{7.40}{5}+\frac{5.75}{4}} \right )\)
\(=(-1.70, 5.00)\)
5. 実践のためのアドバイス
母不適合数の検定や推定では、ポアソン分布を使うのが基本です。
統計量が正規分布に近似的に従うとみなせるため、実際にポアソン分布の性質を使って計算することはありませんが、基本はポアソン分布であることを理解しておいてください。
6. おわりに
今回は、二つの母不適合数の差に関する検定と推定について解説しました。
二つの母不適合品率の差の検定では二項分布の性質を用いましたが、今回はポアソン分布を用いており、適用する分布が異なることに注意が必要です。
検定の対象が母不適合品率か母不適合数かを間違えないようにして、検定や推定を行ってください。