これまで、計量値や計数値について、サンプルの統計量を基に、母集団の平均や分散などの母数を検定する方法を紹介してきました。
検定で判断しようとするにあたり実務でよく問題となるのは、検定で判断するためにサンプルはいくつ準備すればよいか、です。
そこで、今回はサンプルサイズをいくつにすべきかを決める方法を解説します。
1. 検定における2種類の誤り
サンプルサイズを決めるには、まず検定における2種類の誤りを理解する必要があります。
検定をする際は、はじめに帰無仮説\(H_0\)と対立仮説\(H_1\)を設定しましたね。
本当はどちらの仮説が成り立つのか、そして検定結果はどちらの仮説を採択したかで、2種類の誤りが発生する可能性があるます。
本当は帰無仮説\(H_0\)が成り立つのに、帰無仮説を棄却してしまう誤りを第1種の誤りと言います。
第1種の誤りを犯す確率は検定時に設定する有意水準\(\alpha\)に等しく、別名、「あわてものの誤り」とも呼ばれます。
これは、帰無仮説が成り立っていて従来と変わっていないのにもかかわらず、変わったと早とちりして処置してしまう誤りだからです。
そして、本当は帰無仮説\(H_0\)が成り立たないのに、帰無仮説を棄却しない誤りを第2種の誤りと言います。
第2種の誤りを犯す確率を\(\beta\)と表し、またの名を「ぼんやりものの誤り」と言います。
これは、本当は帰無仮説\(H_0\)が成り立たず、帰無仮説を棄却して処置しなければならないのにもかかわらず、何も処置しない誤りだからです。
ここで、対立仮説\(H_1\)が成り立っているときに、それを正しく判断できる確率、つまり帰無仮説\(H_0\)を正しく棄却する確率を検出力と言い\(1-\beta\)で表せます。
第1種の誤りと第2種の誤りをまとめると、以下のようになります。
本当に成り立っている仮説 | |||
\(H_0\) | \(H_1\) | ||
検定結果 | \(H_0\) 有意でない |
正しい (確率:\(1-\alpha)\) |
第2種の誤り (確率:\(\beta\)) |
\(H_1\) 有意である |
第1種の誤り (確率:\(\alpha\)) |
正しい (確率:\(1-\beta=\)検出力) |
2. 検定における検出力の考え方
サンプルサイズを決めるためには、検出力の考え方がとても重要になります。
そこで、まずは検出力の考え方を詳しく解説します。
2-1. 検出力とは
母分散が既知の場合の母平均の検定を例に、検出力を求めてみましょう。
両側検定では、
帰無仮説\(H_0:\mu=\mu_0\)、対立仮説\(H_1:\mu \neq \mu_0\)
を設定します。
有意水準は\(\alpha=0.05\)とします。
このとき、棄却域は以下のようになります。
棄却域:\(|u_0|=\displaystyle \frac{|\bar{x}-\mu_0|}{\sqrt{\sigma^2/n}} \ge K_{0.025}=1.96\)
対立仮説\(H_1\)が成立しているとすると、母平均\(\mu\)は基準値\(\mu_0\)と異なっていることになります。
このとき、\(u=\displaystyle \frac{\bar{x}-\mu}{\sqrt{\sigma^2/n}}\)は標準正規分布\(N(0,1^2)\)に従い、検定統計量\(u_0\)は以下のように変形できます。
\(u_0=\displaystyle \frac{\bar{x}-\mu_0}{\sqrt{\sigma^2/n}}\)
\(=\displaystyle \frac{\bar{x}-\mu}{\sqrt{\sigma^2/n}}+\frac{\mu-\mu_0}{\sqrt{\sigma^2/n}}\)
\(=u+\sqrt{n} \cdot \displaystyle \frac{(\mu-\mu_0)}{\sigma} \qquad(1)\)
ここで、\(d=\displaystyle \frac{\mu-\mu_0}{\sigma}\)と定義すると、\(u_0\)は標準正規分布\(N(0,1^2)\)から左右のいずれかに\(\sqrt{n}d\)だけずれた正規分布\(N(\sqrt{n}d,1^2)\)に従います。
\(\mu>\mu_0\)のとき、\(\mu\)と\(\mu_0\)の差が小さい場合と大きい場合の検出力\((1-\beta)\)の違いを図示すると、以下のようになります。
①\(\mu\)と\(\mu_0\)の差が小さい場合
②\(\mu\)と\(\mu_0\)の差が大きい場合
赤色の分布が、対立仮説が正しい場合の\(u_0\)の分布で、この分布に従って\(u_0\)が棄却域に入る確率を求めれば、それが検出力\(1-\beta\)に該当します。
図の着色部分が検出力で、\(\mu\)と\(\mu_0\)の差が大きいほど検出力が大きくなることが分かります。
これは、直感的に考えても理解しやすい考え方でしょう。
\(u_0\)の式(1)を使って検出力\(1-\beta\)は、
\(1-\beta = Pr(|u_0|) \ge 1.96\)
\(=Pr(u_0 \le -1.96)+Pr(u_0) \ge 1.96\)
\(=Pr(u+\sqrt{n}d \le -1.96)+Pr(u+\sqrt{n}d \ge 1.96)\)
\(=Pr(u \le -1.96-\sqrt{n}d)+Pr(u \ge 1.96-\sqrt{n}d) \qquad(2)\)
と表せます。
2-2. サンプルサイズと検出力の関係
次に、サンプルサイズと検出力の関係を見ていきます。
常識的に考えれば、サンプルサイズが大きいほど検出力が上ることは理解できると思いますが、それを数字で確認しましょう。
\(n=9\)のときと\(n=25\)のときで、\(d\)の値を-1から1まで変化させたときの検出力の推移は以下のようになります(両側検定の場合)。
\(d=(\mu-\mu_0/\sigma)\) | n=9 | n=25 |
---|---|---|
-1 | 0.851 | 0.999 |
-0.8 | 0.670 | 0.979 |
-0.6 | 0.437 | 0.851 |
-0.4 | 0.224 | 0.516 |
-0.2 | 0.092 | 0.170 |
-0.1 | 0.060 | 0.079 |
0 | 0.050 | 0.050 |
0.1 | 0.060 | 0.079 |
0.2 | 0.092 | 0.170 |
0.4 | 0.224 | 0.516 |
0.6 | 0.437 | 0.851 |
0.8 | 0.670 | 0.979 |
1 | 0.851 | 0.999 |
上記のデータをグラフにした検出力曲線は、以下のようになります。
\(d\)の値の絶対値が大きいほど、また、サンプルサイズ\(n\)が大きいほど検出力が高くなることが分かります。
つまり、\(d\)の値が大きければ少ないサンプルで母平均の違いを検出でき、\(d\)の値が小さいとたくさんのサンプルがないと母平均の違いを検出できないということになります。
実際は\(d\)の値は未知なので、検出力を高くするためには\(n\)を大きくすればよいということです。
しかし、検出力を上げるためにサンプルサイズ\(n\)をあまりに大きくしすぎると、検出力曲線がさらに立ってきて、\(d\)がわずかに変化しただけでそれを検出する確率が大きくなります。
そうすると、技術的には無視できるような違いであっても、検定結果は有意になってしまうことになります。
サンプルサイズ\(n\)が小さいと、\(d\)の値が大きくならないと有意になりにくくなります。
技術的には有意になると思っていても、検定結果が有意にならなかったときは、サンプルサイズ\(n\)が小さすぎた可能性があります。
このように、サンプルサイズ\(n\)、\(d\)の値、検出力\(1-\beta\)は密接に関係しており、サンプルサイズを決めるにはこれらの関係を使うことになります。
3. サンプルサイズの決め方
それでは、サンプルサイズ\(n\)、\(d\)の値、検出力\(1-\beta\)を考慮してサンプルサイズの決め方を解説します。
帰無仮説を\(H_0:\mu=\mu_0\)、対立仮説を\(H_1:\mu \neq \mu_0\)と両側検定で設定し、有意水準\(\alpha=0.05\)とします。
このとき、\(d=(\mu-\mu_0)\)について、\(|d| \ge d_0\)のとき、高い検出力\(1-\beta\)で帰無仮説\(H_0\)を棄却して対立仮説\(H_1\)を採択したいとしましょう。
もう少しイメージしやすいよう具体的に、\(d_0=1.0\)、\(1-\beta=0.90\)とします。
すると解決したい問題は、「\(d \ge 1.0\)のとき、検出力が\(1-\beta=0.90\)となるためには、サンプルサイズ\(n\)をいくつにすればよいか」と設定できます。
つまり、サンプルサイズ\(n\)を決めるためには、まずは\(d_0\)と\(1-\beta\)を解析者が自分で決める必要があるということです。
2-1項の(2)式に\(\beta=0.10,~d=1.0\)を代入すると、以下のようになります。
\(0.90=Pr(u \le -1.96-\sqrt{n})+Pr(u \ge 1.96-\sqrt{n})\)
ここで、右辺の第1項は非常に小さく無視できるので、
\(0.90=Pr(u \ge 1.96-\sqrt{n})\)
を満足する\(n\)を求めればよいことになります。
正規分布表を使うと、
\(1.96-\sqrt{n}=-1.282\)
が得られます。
これを\(n\)について解くと、
\(n=10.51~\rightarrow ~11\)
となります。
これを一般化すると、
\(d\)の差があるときに有意水準\(\alpha\)の両側検定で検出力\(1-\beta\)で対立仮説\(H_1\)を採択するために必要なサンプルサイズ\(n\)は、
\(n=\left ( \displaystyle \frac{K_{\alpha/2}+K_\beta}{d} \right )\)
で求められます。
以上、母分散が既知の場合の母平均の検定の例で、サンプルサイズの決め方を解説しました。
しかし、検定には1つの母分散の検定、2つの母平均の差の検定など、さまざまな種類が存在します。
それぞれの検定方式についてサンプルサイズの求め方を解説すると膨大な量となるため、ここでは詳細な解説は割愛します。
各検定方式におけるサンプルサイズの決め方は、以下の書籍に詳しく書かれていますのでこちらを参照してください。
4. おわりに
今回は、母分散が既知のときの母平均の検定を例にして、対立仮説を採択するためのサンプルサイズの決め方を解説しました。
サンプルサイズをいくつにしたらよいかを理論的に説明したいときは、今回解説した考え方を使ってサンプルサイズを求めてください。