以前の記事では計数値の検定と推定として、母不適合品率について解説しました。
一つの母不適合品率に関する検定と推定不良品の個数の割合など、二項分布に従う特性を対象とした検定と推定でしたね。
一方、母不適合数は一つの製品に存在するキズの数など、ポアソン分布に従うデータのため、母不適合品率の検定や推定の方法をそのまま適用できません。
今回は、一つの母不適合数(=欠点数)に関する検定と推定について解説します。
1. 適用できる場面
以下の事例を使って、一つの母不適合品率に関する検定と推定を解説します。
ある樹脂製品において、製品1個あたり1.5個のキズが慢性的に発生し困っています。
そこで、キズ防止対策を行い対策の効果があるかを確認するため、10個の製品をランダムに取り出して各製品に存在するキズの数を調べたところ、以下の結果が得られました。
1, 2, 0, 0, 1, 1, 0, 0, 1, 0
この事例では、対策実施後の製品の母集団を考えて、製品1個あたりの母不適合数を\(\lambda\)と表すと、母集団から得られた\(n\)個の製品について、各製品で観察されたキズの数\(x_1,x_2,\cdots,x_n\)を基に、対策前に比べて対策後の母不適合数\(\lambda\)が小さくなったかを検定し、対策後の母不適合数を推定することが目的です。
2. ポアソン分布に関する基本事項
以前の記事で、母不適合数\(\lambda\)の母集団から1個のサンプルを取り出すとき、その中に含まれる不適合数\(x\)はポアソン分布\(Po(\lambda)\)に従うことを解説しました。
計数値の代表的な分布~二項分布とポアソン分布~母集団から\(n\)個のサンプルを取り出したとき、各サンプルに含まれる不適合数を\(x_1,x_2,\cdots,x_n\)とするとき、不適合数の合計\(T\)は以下のように表せます。
\(T=x_1+x_2+\cdots+x_n\)
母不適合数の検定や推定では、ここで求めた\(T\)を使います。
すると、サンプル1個あたりの不適合数は、以下のように表せます。
\(\hat{\lambda}=\displaystyle \frac{T}{n}\)
この記事で使うポアソン分布については、以下の基本事項が成り立つことが知られています。
\(x_1,x_2,\cdots,x_n\)がポアソン分布\(Po(\lambda)\)に従うとき、\(T\)はポアソン分布\(Po(n\lambda)\)に従う。
\(x_1,x_2,\cdots,x_n\)がポアソン分布\(Po(\lambda)\)に従うとき、\(n\lambda\)が5程度以上ならば、\(T\)は近似的に正規分布\(N(n\lambda,n\lambda)\)に従う。
\(x_1,x_2,\cdots,x_n\)がポアソン分布\(Po(\lambda)\)に従うとき、\(n\lambda\)が5程度以上ならば、\(\hat{\lambda}=\displaystyle \frac{T}{n}\)は近似的に正規分布\(N(\lambda,\lambda/n)\)に従う。
\(\hat{\lambda}\)を標準化すると、
\(u=\displaystyle \frac{\hat{\lambda}-\lambda}{\sqrt{\lambda/n}}\)
は近似的に標準正規分布\(N(0,1^2)\)に従う。
3. 一つの母不適合数に関する検定
それでは、母不適合数の検定手順を見ていきます。
一つの母不適合数\(\lambda\)に関する検定では、帰無仮説\(H_0:\lambda=\lambda_0\) (\(\lambda_0\)は指定された値)を設定するので、検定統計量は
\(u_0=\displaystyle \frac{\hat{\lambda}-\lambda_0}{\sqrt{\lambda_0/n}}\)
となり、基本事項4から\(u_0\)は帰無仮説が成り立つ下で標準正規分布\(N(0,1^2)\)に従うことを利用します。
3-1. 一つの母不適合数に関する検定手順
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
検定の目的に応じて、(1)~(3)のいずれかを選択します。
(1) \(H_0:\lambda=\lambda_0\) (\(\lambda_0\)は指定された値)
\(H_1:\lambda \neq \lambda_0\) (両側検定)
(2) \(H_0:\lambda=\lambda_0\) (\(\lambda_0\)は指定された値)
\(H_1:\lambda > \lambda_0\) (右片側検定)
(3) \(H_0:\lambda=\lambda_0\) (\(\lambda_0\)は指定された値)
\(H_1:\lambda < \lambda_0\) (左片側検定)
手順2. 有意水準\(\alpha\)を決める。
通常は、\(\alpha=0.05\)とします。
手順3. 手順1(仮説)と手順2(有意水準)に対応した棄却域を決める。
(1)棄却域:\(|u_0|\ge K_{\alpha/2}\) (両側検定)
(2)棄却域:\(u_0 \ge K_{\alpha}\) (右片側検定)
(3)棄却域:\(u_0 \le -K_{\alpha}\) (左片側検定)
手順4. 採取した不適合数のデータ\(x_1,x_2,\cdots,x_n\)から、検定統計量\(u_0\)の値を計算する。
\(u_0=\displaystyle \frac{\hat{\lambda}-\lambda_0}{\sqrt{\lambda_0/n}}\)
手順5. 判定する。
\(u_0\)が棄却域に入れば、有意水準\(\alpha\)で有意と判定し、帰無仮説\(H_0\)を棄却して対立仮説\(H_1\)を採択します。
\(u_0\)が棄却域に入らなければ、有意水準\(\alpha\)で有意でないと判定し、帰無仮説\(H_0\)を棄却しません。
3-2. 一つの母不適合数に関する検定の実施例
事例1について、検定手順に従って検定してみましょう。
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
母不適合数が対策によって減少したかどうかを知りたいので、左片側検定で帰無仮説と対立仮説を設定します。
\(H_0:\lambda=\lambda_0 (\lambda_0=1.5)\)
\(H_1:\lambda< \lambda_0\)
手順2. 有意水準\(\alpha\)を決める。
\(\alpha=0.05\)
手順3. 棄却域を決める。
棄却域:\(u_0 \le -K_{0.05}=-1.645\)
手順4. 検定統計量\(u_0\)の値を計算する。
得られたデータより、以下のように検定統計量を求めます。
なお、\(n\lambda_0=10 \times 1.5=15>5\)なので、正規分布に近似できます。
\(T=x_1+x_2+\cdots+x_n=6\)
\(\hat{\lambda}=\displaystyle \frac{T}{n}=\frac{6}{10}=0.6\)
\(u_0=\displaystyle \frac{\hat{\lambda}-\lambda_0}{\sqrt{\lambda_0/n}}\)
\(=\displaystyle \frac{0.6-1.5}{\sqrt{1.5/10}}\)
\(=-2.324\)
手順5. 判定する。
\(u_0=-2.324 \le -K_{0.05}=-1.645\)で検定統計量\(u_0\)は棄却域に入るので有意です。
よって帰無仮説\(H_0\)を棄却して、キズ対策により樹脂製品1個あたりのキズの母不適合品率\(\lambda\)は、対策前の母不適合数1.5より小さくなったと判断できます。
4. 一つの母不適合数に関する推定
母不適合数\(\lambda\)の推定には、点推定と区間推定の2種類があります。
4-1. 一つの母不適合数に関する推定手順
\(\lambda\)の点推定は標本不適合数\(\hat{\lambda}=\displaystyle \frac{T}{n}\)を使えばよいです。
\(\lambda\)の区間推定については、基本事項4から\(u=\displaystyle \frac{\hat{\lambda}-\lambda}{\sqrt{\lambda/n}}\)は近似的に標準正規分布\(N(0,1^2)\)に従うことから、以下が成立します。
\(Pr \left(-K_{\alpha/2}<\displaystyle \frac{\hat{\lambda}-\lambda}{\sqrt{\lambda/n}}<K_{\alpha/2} \right)\)
\(=1-\alpha \)
かっこの中を変形すると、以下のようになります。
\(Pr \left ( \hat{\lambda}-K_{\alpha/2}\sqrt{\displaystyle \frac{\lambda}{n}}<\lambda<\hat{\lambda}+K_{\alpha/2}\sqrt{\displaystyle \frac{\lambda}{n}} \right )\)
\(=1-\alpha \)
母不適合品率の推定と同じく、母不適合数の推定でも推定したい母数\(\lambda\)が式の中に入ってしまうため、推定量\(\hat{\lambda}\)による置き換えが必要になります。
一つの母不適合数の推定手順をまとめると、以下のようになります。
点推定:
\(\hat{\lambda}=\displaystyle \frac{T}{n}\)
区間推定:信頼率\(1-\alpha\)の信頼区間
\( \left ( \hat{\lambda}-K_{\alpha/2}\sqrt{\displaystyle \frac{\lambda}{n}},\hat{\lambda}+K_{\alpha/2}\sqrt{\displaystyle \frac{\lambda}{n}} \right )\)
4-2. 一つの母不適合品率の推定の実施例
事例1について、点推定と区間推定を行ってみましょう。
点推定:
\(\hat{\lambda}=\displaystyle \frac{T}{n}=\frac{6}{100}=0.6\)
区間推定:信頼率95%の信頼区間を求めます。
\( \left ( \hat{\lambda}-K_{0.025}\sqrt{\displaystyle \frac{\lambda}{n}},\hat{\lambda}+K_{0.025}\sqrt{\displaystyle \frac{\lambda}{n}} \right )\)
\(= \left ( 0.6-1.96\sqrt{\displaystyle \frac{0.6}{10}},0.6+1.96\sqrt{\displaystyle \frac{0.6}{10}} \right )\)
\( =(0.12,1.08)\)
5. 実践のためのアドバイス
母不適合数の検定や推定で使う分布は、ポアソン分布です。
最終的には正規分布に近似して計算しますが、ポアソン分布の存在を忘れないようにしましょう。
6. おわりに
今回は、一つの母不適合数の検定と推定について解説しました。
不適合品率と不適合数で適用する分布が「二項分布」と「ポアソン分布」で異なるため、不適合品率と不適合数のどちらを検定・推定したいのかを事前によく確認してください。
最終的には、どちらも正規分布に近似することになりますが、検定統計量の計算方法が異なるので注意しましょう。