これまでは計量値の検定と推定について、さまざまな方法を解説してきました。
ここからは、計数値の検定と推定を詳しく見ていきます。
計量値の検定と推定では、母集団が正規分布に従うことを前提に解析しましたが、計数値は一般的には正規分布には従わず、二項分布かポアソン分布に従います。
着目する母数が従う分布を決められれば、サンプルから計算できる統計量が確率的に起こり得るかどうかを計算でき、計量値と同様に検定と推定をできます。
今回は、一つの母不適合品率(=不良率)に関する検定と推定について解説します。
1. 適用できる場面
以下の事例を使って、一つの母不適合品率に関する検定と推定を解説します。
ある機械部品の製造ラインにおいて、製品Aの母不適合品率は4%と目標が未達で問題となっていたため、不良低減プロジェクトで改善に取り組みラインを改造しました。
改造後のラインで不適合品率が減少したか確認するため、500個の製品をサンプリングして検査したところ、10個が不適合品でした。
この事例では、改造後のラインで製造した製品Aの母集団を考えて、その母不適合品率を\(P\)とするとき、母集団からサンプリングした\(n\)個の製品に含まれる\(x\)個の不適合品数に基づいて、改造前と比べて母不適合品率が小さくなったかどうかを検定し、改造後の母不適合品率を推定することが目的です。
2. 二項分布に関する基本事項
以前の記事で、母不良率\(P\)の母集団から\(n\)個のサンプルを取るとき、\(n\)個の中に含まれる不適合品数\(x\)は二項分布\(B(n,P)\)に従うことを解説しました。
計数値の代表的な分布~二項分布とポアソン分布~二項分布については、以下の基本事項が成り立つことが知られています。
母不適合品率の検定では、二項分布の性質を利用するので基本事項を理解しておいてください。
\(x\)が二項分布\(B(n,P)\)に従うとき、\(nP\)と\(n(1-P)\)が5程度以上ならば、\(x\)は近似的に正規分布\(N(nP,nP(1-P))\)に従う。
\(x\)が二項分布\(B(n,P)\)に従うとき、\(nP\)と\(n(1-P)\)が5程度以上ならば、標本不適合品率\(p=\displaystyle \frac{x}{n}\)は近似的に正規分布\(N(nP,P(1-P)/n)\)に従う。
\(p\)を標準化した統計量
\(u=\displaystyle \frac{p-P}{\sqrt{P(1-P)/n}}\)
は近似的に標準正規分布\(N(0,1^2)\)に従う。
3. 一つの母不適合品率に関する検定
それでは、母不適合品率の検定手順を見ていきます。
基本的な進め方は、以前の記事で解説した計量値の検定と同じですので、異なる点を詳しく説明します。
なお、一つの母不適合品率\(P\)に関する検定では、帰無仮説\(H_0:P=P_0\) (\(P_0\)は指定された値)を設定するので、検定統計量は
\(u_0=\displaystyle \frac{p-P_0}{\sqrt{P_0(1-P_0)/n}}\)
となり、基本事項3から\(u_0\)は帰無仮説が成り立つ下で標準正規分布\(N(0,1^2)\)に従うことを利用します。
3-1. 一つの母不適合品率に関する検定手順
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
検定の目的に応じて、(1)~(3)のいずれかを選択します。
(1) \(H_0:P=P_0\) (\(P_0\)は指定された値)
\(H_1:P \neq P_0\) (両側検定)
(2) \(H_0:P=P_0\) (\(P_0\)は指定された値)
\(H_1:P > P_0\) (右片側検定)
(3) \(H_0:P=P_0\) (\(P_0\)は指定された値)
\(H_1:P < P_0\) (左片側検定)
手順2. 有意水準\(\alpha\)を決める。
通常は、\(\alpha=0.05\)とします。
手順3. 手順1(仮説)と手順2(有意水準)に対応した棄却域を決める。
(1)棄却域:\(|u_0|\ge K_{\alpha/2}\) (両側検定)
(2)棄却域:\(u_0 \ge K_{\alpha}\) (右片側検定)
(3)棄却域:\(u_0 \le -K_{\alpha}\) (左片側検定)
手順4. 採取したデータ\((n,x)=\)(サンプルサイズ, 不適合品数)から、検定統計量\(u_0\)の値を計算する。
\(u_0=\displaystyle \frac{p-P_0}{\sqrt{P_0(1-P_0)/n}}\)
手順5. 判定する。
\(u_0\)が棄却域に入れば、有意水準\(\alpha\)で有意と判定し、帰無仮説\(H_0\)を棄却して対立仮説\(H_1\)を採択します。
\(u_0\)が棄却域に入らなければ、有意水準\(\alpha\)で有意でないと判定し、帰無仮説\(H_0\)を棄却しません。
3-2. 一つの母不適合品率に関する検定の実施例
事例1について、検定手順に従って検定してみましょう。
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
母不適合品率がライン改造前に比べて減少したかどうかを知りたいので、左片側検定で帰無仮説と対立仮説を設定します。
\(H_0:P=P_0 (P_0=0.04)\)
\(H_1:P < P_0\)
手順2. 有意水準\(\alpha\)を決める。
\(\alpha=0.05\)
手順3. 棄却域を決める。
棄却域:\(u_0 \le -K_{0.05}=-1.645\)
手順4. 検定統計量\(u_0\)の値を計算する。
得られたデータより、以下のように検定統計量を求めます。
なお、\(nP_0=500 \times 0.04=20>5\)なので、正規分布に近似できます。
\(p=\displaystyle \frac{x}{n}=\frac{10}{500}=0.020\)
\(u_0=\displaystyle \frac{p-P_0}{\sqrt{P_0(1-P_0)/n}}\)
\(=\displaystyle \frac{0.020-0.04}{\sqrt{0.04(1-0.04)/500}}\)
\(=-2.282\)
手順5. 判定する。
\(u_0=-2.282 \le -K_{0.05}=-1.645\)で検定統計量\(u_0\)は棄却域に入るので有意です。
よって帰無仮説\(H_0\)を棄却して、ラインの改造により製品Aの母不適合品率\(P\)は、改造前の母不適合品率0.04より小さくなったと判断できます。
4. 一つの母不適合品率に関する推定
以前の記事で解説した通り、母不適合品率\(P\)の推定には点推定と区間推定の2種類があります。
4-1. 一つの母不適合品率に関する推定手順
\(P\)点推定は標本不適合品率\(p=\displaystyle \frac{x}{n}\)を使えばよいです。
\(P\)の区間推定については、基本事項3から\(u=\displaystyle \frac{p-P}{\sqrt{P(1-P)/n}}\)は近似的に標準正規分布\(N(0,1^2)\)に従うことから、以下が成立します。
\(Pr \left(-K_{\alpha/2}<\displaystyle \frac{p-P}{\sqrt{P(1-P)/n}}<K_{\alpha/2} \right)\)
\(=1-\alpha \)
かっこの中を変形すると、以下のようになります。
\(Pr \left ( p-K_{\alpha/2}\sqrt{\displaystyle \frac{P(1-P)}{n}}<P<p+K_{\alpha/2}\sqrt{\displaystyle \frac{P(1-P)}{n}} \right )\)
\(=1-\alpha \)
ここで、平方根の中の\(P\)をその推定量\(p\)に置き換えることで、信頼区間が求まります。
これまで解説してきた母平均や母分散の推定では、推定したい母数が平方根に入ってきませんでしたが、母不適合品率の推定では推定したい母数が入ってしまうため、推定量による置き換えが必要になります。
ここに違和感を感じるかと思いますが、大数の法則から推定量\(p\)は母不適合品率\(P\)に近づくと考えて理解いただければと思います。
なお、推定量\(p\)に置き換えずに2次不等式を解いても母不適合品率\(P\)の信頼区間は求まりますが、推定量\(p\)に置き換えた場合とほとんど変わらないことが分かっています。
一つの母不適合品率の推定手順をまとめると、以下のようになります。
点推定:
\(\hat{P}=p=\displaystyle \frac{x}{n}\)
区間推定:信頼率\(1-\alpha\)の信頼区間
\(\left ( p-K_{\alpha/2}\sqrt{\displaystyle \frac{p(1-p)}{n}},p+K_{\alpha/2}\sqrt{\displaystyle \frac{p(1-p)}{n}} \right )\)
4-2. 一つの母不適合品率の推定の実施例
事例1について、点推定と区間推定を行ってみましょう。
点推定:
\(\hat{P}=p=\displaystyle \frac{x}{n}=\frac{10}{500}=0.02\)
区間推定:信頼率95%の信頼区間を求めます。
\( \left ( p-K_{0.025}\sqrt{\displaystyle \frac{p(1-p)}{n}},p+K_{0.025}\sqrt{\displaystyle \frac{p(1-p)}{n}} \right )\)
\(=\left ( 0.02-1.960\sqrt{\displaystyle \frac{0.02(1-0.02)}{500}},0.02+1.960\sqrt{\displaystyle \frac{0.02(1-0.02)}{500}} \right )\)
\(=(0.008,0.032)\)
5. 実践のためのアドバイス
最終的には正規分布に近似できますが、母不適合品率の検定における統計量は二項分布に従うことをよく理解しておく必要があります。
計数値が従う主要な分布は二項分布とポアソン分布があるので、どちらの分布に従うかをしっかり認識した上で検定や推定を行いましょう。
6. おわりに
今回は、一つの母不適合品率の検定と推定について解説しました。
ある施策の後で、不良率が変化したかどうかを統計的に判断したいときに有効な方法ではないでしょうか。
正規分布に近似できるのは一定の条件を満たすときだけなので、検定の前に正規分布に近似できるかをしっかり確認してください。