以前の記事で、母分散が既知のときの母平均の検定と推定の例を使って、検定と推定の基本的な考え方と進め方を解説しました。
母集団に関する仮説を統計的に検証する~検定の基礎 母集団の母数を推定する方法~推定の基礎ここからは、母集団の分布として正規分布を想定し、さまざまな検定と推定を見ていきます。
正規分布であれば、分布の中心を表す母平均と、分布のばらつきを表す母分散の、2つの母数が存在します。
よって、母平均と母分散についてそれぞれ、検定と推定の方法が存在します。
また、1つの母集団を設定して基準値と比較する場合(一標本問題)と、2つの母集団を設定して両者を比較する場合(二標本問題)の2通りがあります。
今回は、一つの母平均に関する検定と推定について解説します。
1. 適用できる場面
以下の事例を使って、母分散が未知の場合の母平均の検定と推定を解説します。
ある薬品の1kg中の有効成分の量は、母平均が50gの正規分布に従っています。
最近、新ラインを立ち上げたことから、新ラインで製造した薬品の1kg中の有効成分の母平均が、従来のラインと変わったかどうかを検討することになりました。
新ラインからランダムに12個のサンプルを抜き取り、有効成分の量を測定した結果は、以下の通りでした。(単位:g)
78, 41, 73, 64, 77, 44, 57, 53, 65, 41, 80
この事例では、新ライン製造品の有効成分の量が正規分布\(N(\mu, \sigma^2)\) (母平均\(\mu\)と母分散\(\sigma^2\)はともに未知)に従うと考えて、この母集団から抜き取られた12個のサンプルのデータに基づいて、一つの母平均\(\mu\)の検定や推定を行うことが目的です。
以前の記事で母平均の検定と推定を解説したときは、母分散は既知としていましたが、今回は母分散は未知としており現実的な条件が設定と言えます。
2. \(t\)分布について
以前の記事の基本事項1で解説した通り、\(n\)個のサンプルから計算した平均\(\bar{x}\)は正規分布\(N(\mu,\sigma^2)\)に従います。
そして、基本事項2より、
\(u=\displaystyle \frac{\bar{x}-\mu}{\sqrt{\sigma^2/n}}~~~(1)\)
は標準正規分布\(N(0,1^2)\)に従います。
しかし、今回の事例では母分散\(\sigma^2\)は未知のため、式(1)をそのまま使えません。
そこで、式(1)の\(\sigma^2\)に、点推定量\(\hat{\sigma}^2=V\)を代入します。
ここで、以下の基本事項が知られています。
\(n\)個のデータ\(x_1,x_2,\cdots,x_n\)が互いに独立に正規分布\(N(\mu,\sigma^2)\)に従うとき、\(t=\displaystyle \frac{\bar{x}-\mu}{\sqrt{V/n}}\)は自由度\(\phi=n-1\)の\(t\)分布に従う。
\(t\)分布という新しい分布が出てきました。
母分散が未知の場合の一つの母平均の検定と推定は、\(t\)分布を基礎にして進めます。
\(t\)分布はゼロを中心に、正規分布と同じく左右対称の形状をしていますが、下図のように自由度により形状が変化する特徴を持っています。
自由度\(\phi\)が大きくなるにつれて裾が短くなり、中心の確率が集まってきます。
そして、\(\phi\)が無限大のときに\(t\)分布は標準正規分布\(N(0,1^2)\)に一致します。
検定統計量が\(t\)分布に従うことが分かれば、あとは棄却域を設定して検定統計量が棄却域に入るかどうかを調べることで検定できます。
3. 一つの母平均に関する検定
それでは、母平均の検定手順を見ていきます。
基本的な流れは、以前の記事で解説した流れと同じですので、異なる点を特に詳しく説明します。
3-1. 一つの母平均の検定手順
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
検定の目的に応じて、(1)~(3)のいずれかを選択します。
(1) \(H_0:\mu=\mu_0\) (\(\mu_0\)は指定された値)
\(H_1:\mu \neq \mu_0\) (両側検定)
(2) \(H_0:\mu=\mu_0\) (\(\mu_0\)は指定された値)
\(H_1:\mu > \mu_0\) (右片側検定)
(3) \(H_0:\mu=\mu_0\) (\(\mu_0\)は指定された値)
\(H_1:\mu < \mu_0\) (左片側検定)
手順2. 有意水準\(\alpha\)を決める。
通常は、\(\alpha=0.05\)とします。
手順3. 手順1(仮説)と手順2(有意水準)に対応した棄却域を決める。
(1)棄却域:\(|t_0|\ge t(\phi,\alpha)\) (両側検定)
(2)棄却域:\(t_0 \ge t(\phi,2\alpha)\) (右片側検定)
(3)棄却域:\(t_0 \le -t(\phi,2\alpha)\) (左片側検定)
手順4. 採取したデータ\(x_1,x_2.\cdots,x_n\)から、検定統計量\(t_0\)の値を計算する。
\(~~~t_0=\displaystyle \frac{\bar{x}-\mu_0}{\sqrt{V/n}}\)
\(~~~\phi=n-1\)
手順5. 判定する。
\(t_0\)が棄却域に入れば、有意水準\(\alpha\)で有意と判定し、帰無仮説\(H_0\)を棄却して対立仮説\(H_1\)を採択します。
\(t_0\)が棄却域に入らなければ、有意水準\(\alpha\)で有意でないと判定し、帰無仮説\(H_0\)を棄却しません。
3-2. 一つの母平均の検定における棄却域の求め方
母分散が既知の場合、正規分布を使って検定しました。
有意水準\(\alpha=0.05\)で両側検定を行うときは、\(\alpha\)を2等分して2.5%を上下に配分するので、棄却域と採択域の境界値である棄却限界値をExcelで求めるときは、セルに「=NORM.S.INV(0.025)」と入力して得られた値を使いました。
両側検定の場合は、確率を片方に集めるので、「=NORM.S.INV(0.05)」と入力しましたね。
一方、\(t\)分布の棄却限界値をExcelで求める場合、セルには以下のように入力する必要があります。(有意水準\(\alpha=0.05\)の場合)
【両側検定】
「=T.INV.2T(0.05,\(\phi\))」と入力して得られる値を採用します。(\(\phi\)は自由度\(n-1\))
有意水準を2等分しないでそのまま確率を入力する必要があるので注意してください。
【片側検定】
「=T.INV.2T(0.1,\(\phi\))」または「=T.INV(0.05,\(\phi\))」と入力して得られる値の絶対値に対し、右側片側検定は+の符号、左側片側検定はーの符号を付けた値を採用します。
3-3. 一つの母平均の検定の実施例
事例1について、検定手順に従って検定してみましょう。
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
母平均が従来と変わったかどうかを知りたいので、両側検定で帰無仮説と対立仮説を設定します。
\(H_0:\mu=\mu_0\) (\(\mu_0=50\))
\(H_1:\mu \neq \mu_0\)
手順2. 有意水準\(\alpha\)を決める。
\(\alpha=0.05\)
手順3. 棄却域を決める。
棄却域:\(|t_0|\ge t(11,0.05)=2.201\)
手順4. 検定統計量\(t_0\)の値を計算する。
得られたデータより、
\(\bar{x}=62.1\)
\(V=213.72\) (Excelの「VAR.S」関数で簡単に求められる)
\(t_0=\displaystyle \frac{\bar{x}-\mu_0}{\sqrt{V/n}}=\frac{62.1-50}{\sqrt{213.72/12}}=2.867\)
手順5. 判定する。
\(|t_0|=2.867 \ge t(11,0.05)=2.201\)で検定統計量\(t_0\)は棄却域に入るので有意です。
よって帰無仮説\(H_0\)を棄却して、新ライン製造品の有効成分の量の母平均\(\mu\)は、従来ライン製造品の母平均50gから変化したと判断できます。
4. 一つの母平均に関する推定
以前の記事で解説した通り、母平均\(\mu\)の推定には点推定と区間推定の2種類があります。
4-1. 一つの母平均の推定手順
点推定はデータの平均\(\bar{x}\)を使えばよいです。
区間推定については、先ほどの基本事項から\(t=\displaystyle \frac{\bar{x}-\mu}{\sqrt{V/n}}\)は自由度\(\phi=n-1\)の\(t\)分布に従うことから、以下が成立します。
\(Pr \left(-t(\phi,\alpha)<\displaystyle \frac{\bar{x}-\mu}{\sqrt{V/n}}<t(\phi,\alpha) \right)=1-\alpha\)
これを変形すると、以下のようになります。
\(~~Pr \left ( \bar{x}-t(\phi,\alpha)\sqrt{\displaystyle \frac{V}{n}}<\mu<\bar{x}+t(\phi,\alpha)\sqrt{\displaystyle \frac{V}{n}} \right )\)
\(~~=1-\alpha \)
左項の括弧内の\(\mu\)の範囲が、信頼率\(1-\alpha \)の信頼区間です。
一つの母平均の推定手順をまとめると、以下のようになります。
点推定:
\(\hat{\mu}=\bar{x}\)
区間推定:信頼率\(1-\alpha\)の信頼区間
\(~~ \left ( \bar{x}-t(\phi,\alpha)\sqrt{\displaystyle \frac{V}{n}},\bar{x}+t(\phi,\alpha)\sqrt{\displaystyle \frac{V}{n}} \right )\)
4-2. 一つの母平均の推定の実施例
事例1について、点推定と区間推定を行ってみましょう。
点推定:
\(\hat{\mu}=\bar{x}=62.1\)
区間推定:信頼率95%の信頼区間を求めます。
\(\left ( \bar{x}-t(11,0.05)\sqrt{\displaystyle \frac{V}{n}},\bar{x}+t(11,0.05)\sqrt{\displaystyle \frac{V}{n}} \right )\)
\(=\left ( 62.1-2.201\sqrt{\displaystyle \frac{213.72}{12}},62.1+2.201\sqrt{\displaystyle \frac{213.72}{12}} \right )\)
\(=(52.8,71.4)\)
5. 実践のためのアドバイス
文中で述べましたが、実務では母分散が既知ということは考えにくいため、実務では今回紹介した\(t\)分布を使った母平均の検定を使うことが多いです。
母平均が狙い値通りかどうかを見たいときは、今回の検定を使いましょう。
6. おわりに
今回は、母分散が未知の場合の一つの母平均の検定と推定について解説しました。
母分散が未知の場合の母平均の検定と推定では、\(t\)分布を使うのが特徴的ですが、基本的な考え方と手順は変わりません。
実務では、母分散は未知の場合がほとんどなので、今回の記事の内容をマスターして実戦で活用してみてください。