以前の記事で、一つの母平均の検定と推定について基本的な考え方と進め方を解説しました。
基準値となる母平均に対して、着目する母集団の母平均について検定または推定する方法でしたね。
今回は、二つの母集団について両者の母平均が異なるかどうかを検定する方法と母平均の差を推定する方法について解説します。
一つの母平均に関する検定と推定(母分散が未知の場合)
1. 適用できる場面
以下の事例を使って、二つの母平均の差の検定と推定を解説します。
ある薬品の生産性を上げるため、製造条件を見直すこととしました。
製造条件の変更前後で試作を行い、1kg中の有効成分の量を測定したところ以下のようになりました。(単位:g)
製造条件の変更前後で、母平均に違いがあると言えるでしょうか。
変更前:10.52, 10.49, 10.47, 10.39, 10.47, 10.49, 10.49, 10.42, 10.42, 10.40
変更後:10.35, 10.37, 10.41, 10.37, 10.28, 10.45, 10.37, 10.43, 10.39
この事例では、条件変更前の有効成分量の母集団を正規分布\(N(\mu_1,\sigma_1^2)\)、条件変更後の母集団を正規分布\(N(\mu_2,\sigma_2^2)\)と考えて、それぞれの母集団から得られたサンプルのデータに基づいて、二つの母平均\(\mu_1\)と\(\mu_2\)が異なるかどうかの検定と、\(\mu_1\)と\(\mu_2\)の差を推定することが目的です。
なぜ、母平均「差」を考えるのかはこの後で解説します。
2. 検定に適用する基本事項
一つの母平均に関する検定では\(t\)分布を使いましたが、二つの母平均の差の検定でも\(t\)分布を使用します。
2つの母集団の母平均について検定するためには、いくつかの基本事項を押さえておく必要があります。
その基本事項を順番に解説します。
第1母集団\(N(\mu_1,\sigma_1^2)\)から得られた\(n_1\)個のサンプル\(x_1,x_2,\cdots,x_{1n_1}\)で、サンプルの平均\(\bar{x}_1\)、平方和\(S_1\)、分散\(V_1\)と自由度\(\phi_1=n_1-1\)を計算します。
同じように、第2母集団\(N(\mu_2,\sigma_2^2)\)から得られた\(n_2\)個のサンプル\(x_1,x_2,\cdots,x_{2n_2}\)で、サンプルの平均\(\bar{x}_2\)、平方和\(S_2\)、分散\(V_2\)と自由度\(\phi_2=n_2-1\)を計算します。
\(n_1\)個のデータ\(x_{11},x_{12},\cdots,x_{1n_1}\)が互いに独立に正規分布\(N(\mu_1,\sigma_1^2)\)に従い、また\(n_2\)個のデータ\(x_{21},x_{22},\cdots,x_{2n_2}\)が互いに独立に正規分布\(N(\mu_2,\sigma_2^2)\)に従うとき、以下の3つの基本事項が成立することが知られています。
\(\bar{x}_1\)は正規分布\(N(\mu_1,\sigma_1^2/n_1)\)に従い、\(\bar{x}_2\)は正規分布\(N(\mu_2,\sigma_2^2/n_2)\)に従う。
また、\(\bar{x}_1\)と\(\bar{x}_2\)は互いに独立である。
\(\bar{x}_1-\bar{x}_2\)は正規分布\(N\left (\mu_1-\mu_2,\displaystyle \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2} \right )\)に従う。(分散の加法性)
\(\bar{x}_1-\bar{x}_2\)を標準化すると、
\(~u=\displaystyle \frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\displaystyle \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \qquad (1)\)
は標準正規分布\((0,1^2)\)に従う。
標準化と分散の加法性の詳細については、こちらも記事を参照してください。
さて、ここで母分散\(\sigma_1^2\)と\(\sigma_2^2\)が既知であれば、(1)式をそのまま検定統計量の算出に使えますが、通常は母分散は未知ですので、母分散をサンプルから求めた分散で置き換えます。(一つの母平均の検定を参照)
このとき、母分散\(\sigma_1^2\)と\(\sigma_2^2\)について、2つのパターンが考えられますので、それぞれを見ていきます。
2-1. \(\sigma_1^2=\sigma_2^2\)と推定できる場合
\(\sigma_1^2=\sigma_2^2=\sigma^2\)とすると、(1)式は以下のようになります。
\(u=\displaystyle \frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\sigma^2 \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}} \qquad (2)\)
\(\sigma^2\)は未知なので、以下のような推定量を用います。
\(\sigma^2\)の同時推定
第1母集団と第2母集団のデータ(\(n_1\)個、\(n_2\)個)から求めた平方和\(S_1\)と\(S_2\)から、推定量\(\hat{\sigma}^2\)を以下のように求める。
\(\hat{\sigma}^2=V=\displaystyle \frac{S_1+S_2}{(n_1-1)+(n_2-1)} \qquad(3)\)
このとき、\(V\)を\(\sigma^2\)の同時推定量と言う。
(3)式の分母は両データの自由度の和、分子は両データの平方和の和になっていることが分かります。
(3)式で求めた\(V\)を(2)式に代入すると、以下の基本事項4が成立します。
\(t=\displaystyle \frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}} \qquad (4)\)
で求められる\(t\)は、自由度\(\phi_1+\phi_2=(n_1-1)+(n_2-1)=n_1+n_2-2\)の\(t\)分布に従う。
ここで、2つの母平均の差の検定では帰無仮説を\(H_0:\mu_1=\mu_2\)と設定します。
すると、(4)式の分子の後ろの括弧の部分が0になるので、
\(t_0=\displaystyle \frac{\bar{x}_1-\bar{x}_2}{\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}}\)
となり、未知である\(\mu_1\)と\(\mu_2\)を消すことができ、この\(t_0\)を検定統計量として使用できるようになります。
未知の項を消すために、2つの母平均の検定では\(\bar{x}_1\)と\(\bar{x}_2\)の差を考えて検定統計量を求めるので、「二つの母平均の『差』に関する検定」と言います。
2-2. \(\sigma_1^2=\sigma_2^2\)と推定できない場合
基本事項3の(1)式において、\(\sigma_1^2\)と\(\sigma_2^2\)に、それぞれの推定量である\(V_1\)と\(V_2\)を代入します。
すると、基本事項5が成立します。
\(t=\displaystyle \frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{\displaystyle \frac{V_1}{n_1}+\frac{V_2}{n_2}}} \qquad (5)\)
は、自由度\(\phi^*\)の\(t\)分布に従う。
ただし、
\(\phi^*=\displaystyle \frac{\left (\displaystyle \frac{V_1}{n_1}+\frac{V_2}{n_2} \right )^2}{\left (\displaystyle \frac{V_1}{n_1} \right )^2/\phi_1+\left (\displaystyle \frac{V_2}{n_2} \right )^2/\phi_2}\)
とする。
\(\phi^*\)は等価自由度と言い、この等価自由度の計算式はサタースウェイトの式と呼ばれる。
検定では、帰無仮説を\(H_0:\mu_1=\mu_2\)と設定しますので、先ほどと同じような考えで、(5)式は以下のように書けます。
\(t_0=\displaystyle \frac{\bar{x}_1-\bar{x}_2}{\sqrt{\displaystyle \frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
ここで求めた\(t_0\)を検定統計量として用います。
3. 二つの母平均の差に関する検定
それでは、二つの母平均の差の検定手順を見ていきます。
基本的な流れは、以前の記事で解説した一つの母平均および母分散の検定の流れと同じです。
ただし、前項で述べたように、各母集団の母分散\(\sigma_1^2\)と\(\sigma_2^2\)が同じと考えられるかどうかで検定統計量が異なるので、それぞれで検定手順を見ていきます。
3-1. 二つの母平均の差の検定手順(\(\sigma_1^2=\sigma_2^2\)と推定できる場合:\(t\)検定)
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
検定の目的に応じて、(1)~(3)のいずれかを選択します。
(1) \(H_0:\mu_1=\mu_2\)
\(H_1:\mu_1 \neq \mu_2\) (両側検定)
(2) \(H_0:\mu_1=\mu_2\) (\(\mu_0\)は指定された値)
\(H_1:\mu_1 > \mu_2\) (右片側検定)
(3) \(H_0:\mu_1=\mu_2\) (\(\mu_0\)は指定された値)
\(H_1:\mu_1 < \mu_2\) (左片側検定)
手順2. 有意水準\(\alpha\)を決める。
通常は、\(\alpha=0.05\)とします。
手順3. 手順1(仮説)と手順2(有意水準)に対応した棄却域を決める。
(1)棄却域: \(|t_0|\ge t(\phi_1+\phi_2,\alpha)\) (両側検定)
(2)棄却域:\(t_0 \ge t(\phi_1+\phi_2,2\alpha)\) (右片側検定)
(3)棄却域:\(t_0 \le -t(\phi_1+\phi_2,2\alpha)\) (左片側検定)
手順4. 採取した第1母集団のデータ\(x_{11},x_{12}.\cdots,x_{1n_1}\)と、第2母集団のデータ\(x_{21},x_{22}.\cdots,x_{2n_2}\)から検定統計量\(t_0\)を求める。
\(t_0=\displaystyle \frac{\bar{x}_1-\bar{x}_2}{\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}}, \quad V=\frac{S_1+S_2}{n_1+n_2-2}\)
手順5. 判定する。
\(t_0\)が棄却域に入れば、有意水準\(\alpha\)で有意と判定し、帰無仮説\(H_0\)を棄却して対立仮説\(H_1\)を採択します。
\(t_0\)が棄却域に入らなければ、有意水準\(\alpha\)で有意でないと判定し、帰無仮説\(H_0\)を棄却しません。
3-2. 二つの母平均の差の検定手順(\(\sigma_1^2=\sigma_2^2\)と推定できない場合:ウェルチの検定)
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
検定の目的に応じて、(1)~(3)のいずれかを選択します。
(1) \(H_0:\mu_1=\mu_2\)
\(H_1:\mu_1 \neq \mu_2\) (両側検定)
(2) \(H_0:\mu_1=\mu_2\) (\(\mu_0\)は指定された値)
\(H_1:\mu_1 > \mu_2\) (右片側検定)
(3) \(H_0:\mu_1=\mu_2\) (\(\mu_0\)は指定された値)
\(H_1:\mu_1 < \mu_2\) (左片側検定)
手順2. 有意水準\(\alpha\)を決める。
通常は、\(\alpha=0.05\)とします。
手順3. 手順1(仮説)と手順2(有意水準)に対応した棄却域を決める。
(1)棄却域:\(|t_0|\ge t(\phi^*,\alpha)\) (両側検定)
(2)棄却域:\(t_0 \ge t(\phi^*,2\alpha)\) (右片側検定)
(3)棄却域:\(t_0 \le -t(\phi^*,2\alpha)\) (左片側検定)
\(\phi^*\)の計算方法は、基本事項5を参照してください。
手順4. 採取した第1母集団のデータ\(x_{11},x_{12}.\cdots,x_{1n_1}\)と、第2母集団のデータ\(x_{21},x_{22}.\cdots,x_{2n_2}\)から検定統計量\(t_0\)を求める。
\(t_0=\displaystyle \frac{\bar{x}_1-\bar{x}_2}{\sqrt{\displaystyle \frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
\(\phi^*=\displaystyle \frac{\left (\displaystyle \frac{V_1}{n_1}+\frac{V_2}{n_2} \right )^2}{\left (\displaystyle \frac{V_1}{n_1} \right )^2/\phi_1+\left (\displaystyle \frac{V_2}{n_2} \right )^2/\phi_2}\)
\(\phi_1=n_1-1,~\phi_2=n_2-1\)
手順5. 判定する。
\(t_0\)が棄却域に入れば、有意水準\(\alpha\)で有意と判定し、帰無仮説\(H_0\)を棄却して対立仮説\(H_1\)を採択します。
\(t_0\)が棄却域に入らなければ、有意水準\(\alpha\)で有意でないと判定し、帰無仮説\(H_0\)を棄却しません。
3-3. \(\sigma_1^2=\sigma_2^2\)かどうかの判断方法
\(\sigma_1^2=\sigma_2^2\)と推定できるかどうかで検定統計量の求め方が異なることを説明してきました。
では、どのように\(\sigma_1^2=\sigma_2^2\)と推定できるかどうかを判断すればよいでしょうか。
ここで思いつく方法が、以前の記事で解説した「二つの母分散の比の検定」(等分散性の検定)で確認することでしょう。
等分散性の検定を行い、帰無仮説が棄却されなければ\(\sigma_1^2=\sigma_2^2\)とみなすという考え方です。
等分散性の検定を行うことは客観的に説明できるので最善ではありますが、有意水準は通常の検定で用いる\(\alpha=0.05\)より大きい値に設定し、\(V_1\)と\(V_2\)の比が2以下であれば\(t\)検定、2を上回るようであればウェルチの検定で行うことが多いです。
分散比が2を基準とすることは有意水準\(\alpha\)は20%程度に相当します。
分散比が2以上という基準は、多変量解析法における変数選択や実験計画法におけるプーリング操作など、他の手法でもよく用いられる基準値ですので、ここではこの判断方法を採用することとします。
3-4. 二つの母平均の差の検定の実施例
事例1について、検定手順に従って検定してみましょう。
手順1. 帰無仮説\(H_0\)と対立仮説\(H_1\)を設定する。
製造条件の変更前後で母平均が異なるかどうかを知りたいので、両側検定で帰無仮説と対立仮説を設定します。
\(H_0:\mu_1=\mu_2\)
\(H_1:\mu_1 \neq \mu_2\)
手順2. 有意水準\(\alpha\)を決める。
\(\alpha=0.05\)
手順3. 棄却域を決める。
棄却域:\(|t_0|\ge t(17,0.05)=2.110\)
\((\phi_1+\phi_2=9+8=17)\)
手順4. 検定統計量\(t_0\)の値を計算する。
まずは、得られたデータの等分散性を確認します。
\(V_1=0.002004,~V_2=0.002486\)
(分散\(V\)は、Excelの「VAR.S」関数で求められる)
\(V_1 \lt V_2\)なので、
\(\displaystyle \frac{V_2}{V_1}=\frac{0.002486}{0.002004}=1.24\)
\(V_1\)と\(V_2\)の比は2以下なので、等分散性が成り立つとみなして、\(t\)検定を採用します。
\(\bar{x}_1=10.456,~\bar{x}_2=10.379\)
\(V=\displaystyle \frac{S_1+S_2}{n_1+n_2-2}=\frac{0.01804+0.01989}{10+9-2}=0.002231\)
(平方和\(S\)はExcelの「DEVSQ」関数で求められる)
\(t_0=\displaystyle \frac{\bar{x}_1-\bar{x}_2}{\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}}\)
\(=\displaystyle \frac{10.456-10.379}{\sqrt{0.002231 \left (\displaystyle \frac{1}{10}+\frac{1}{9} \right )}}=3.548\)
手順5. 判定する。
\(t_0=3.548 \ge t(17,0.05)=2.110\)で検定統計量\(t_0\)は棄却域に入るので有意です。
よって帰無仮説\(H_0\)を棄却して、製造条件変更前後で母平均は異なると判断できます。
4. 二つの母平均の差の推定
母平均の差\(\mu_1-\mu_2\)について、点推定と区間推定ができます。
4-1. 二つの母平均の差の推定手順
\(\mu_1-\mu_2\)の点推定はデータの平均の差\(\bar{x}_1-\bar{x}_2\)を使えばよいです。
区間推定については、母分散が等しい場合の求め方を見ていきますが、母分散が異なる場合も考え方は同じです。
基本事項4から、
\(Pr \left(-t(\phi_1+\phi_2,\alpha) <\displaystyle \frac{\bar{x}_1-\bar{x}_2-(\mu_1-\mu_2)}{\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}}<t(\phi_1+\phi_2,\alpha)\right)=1-\alpha\)
これを変形すると、以下のようになります。
\(Pr ( \bar{x}_1-\bar{x}_2-t(\phi_1+\phi_2,\alpha)\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )}<\mu_1-\mu_2\)
\(<\bar{x}_1-\bar{x}_2+t(\phi_1+\phi_2,\alpha)\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )} )\)
\(=1-\alpha \)
二つの母平均の差の推定手順をまとめると、以下のようになります。
(1)\(\sigma^2_1\)と\(\sigma^2_2\)は未知だが、\(\sigma_1^2=\sigma_2^2\)と推定できる場合
点推定:
\(\widehat{\mu_1-\mu_2}=\bar{x}_1-\bar{x}_2\)
区間推定:信頼率\(1-\alpha\)の信頼区間
\( ( \bar{x}_1-\bar{x}_2-t(\phi_1+\phi_2,\alpha)\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )},\)
\(\bar{x}_1-\bar{x}_2+t(\phi_1+\phi_2,\alpha)\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )} )\)
(2)\(\sigma^2_1\)と\(\sigma^2_2\)は未知で、\(\sigma_1^2=\sigma_2^2\)と推定できない場合
点推定:
\(\widehat{\mu_1-\mu_2}=\bar{x}_1-\bar{x}_2\)
区間推定:信頼率\(1-\alpha\)の信頼区間
\( ( \bar{x}_1-\bar{x}_2-t(\phi_1+\phi_2,\alpha)\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )},\)
\(\bar{x}_1-\bar{x}_2+t(\phi_1+\phi_2,\alpha)\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )} )\)
4-2. 二つの母平均の差の推定の実施例
事例1について、点推定と区間推定を行ってみましょう。
点推定:
\(\widehat{\mu_1-\mu_2}=\bar{x}_1-\bar{x}_2=10.456-10.379=0.077\)
区間推定:信頼率95%の信頼区間を求めます。
\( ( \bar{x}_1-\bar{x}_2-t(17,0.05)\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )},\)
\(\bar{x}_1-\bar{x}_2+t(17,0.05)\sqrt{V \left (\displaystyle \frac{1}{n_1}+\frac{1}{n_2} \right )} )\)
\( ( 10.456-10.379-2.110\sqrt{0.002231 \left (\displaystyle \frac{1}{10}+\frac{1}{9} \right )},\)
\(10.456-10.379+2.110\sqrt{V \left (\displaystyle \frac{1}{10}+\frac{1}{9} \right )} )=(0.0031,0.123)\)
5. 実践のためのアドバイス
今回紹介した方法は、実務の中で頻繁に使われる検定と推定です。
分散の加法性を使うことで、一つの\(t\)分布で判断できるようになる特性を使っていることを意識すれば、比較的理解しやすいと思います。
6. おわりに
今回は、二つの母平均の差に関する検定と推定について解説しました。
分散の加法性を活用することで、2つのグループの平均の差を1つの分布で考えて検定や推定をできます。
また、母分散を等しいと考えられるかどうかで、\(t\)検定とウェルチの検定を使い分けるので、検定を行う前に等分散性を必ず確認してください。