サンプルサイズの決め方

これまで、計量値や計数値について、サンプルの統計量を基に、母集団の平均や分散などの母数を検定する方法を紹介してきました。

検定で判断しようとするにあたり実務でよく問題となるのは、検定で判断するためにサンプルはいくつ準備すればよいか、です。
そこで、今回はサンプルサイズをいくつにすべきかを決める方法を解説します。

この記事で分かること
  • 検定における2種類の誤り
  • 検定における検出力の考え方
  • サンプルサイズの決め方


1. 検定における2種類の誤り

サンプルサイズを決めるには、まず検定における2種類の誤りを理解する必要があります。
検定をする際は、はじめに帰無仮説H0と対立仮説H1を設定しましたね。
本当はどちらの仮説が成り立つのか、そして検定結果はどちらの仮説を採択したかで、2種類の誤りが発生する可能性があるます。

本当は帰無仮説H0が成り立つのに、帰無仮説を棄却してしまう誤りを第1種の誤りと言います。
第1種の誤りを犯す確率は検定時に設定する有意水準αに等しく、別名、「あわてものの誤り」とも呼ばれます。
これは、帰無仮説が成り立っていて従来と変わっていないのにもかかわらず、変わったと早とちりして処置してしまう誤りだからです。

そして、本当は帰無仮説H0が成り立たないのに、帰無仮説を棄却しない誤りを第2種の誤りと言います。
第2種の誤りを犯す確率をβと表し、またの名を「ぼんやりものの誤り」と言います。
これは、本当は帰無仮説H0が成り立たず、帰無仮説を棄却して処置しなければならないのにもかかわらず、何も処置しない誤りだからです。

ここで、対立仮説H1が成り立っているときに、それを正しく判断できる確率、つまり帰無仮説H0を正しく棄却する確率を検出力と言い1βで表せます。

第1種の誤りと第2種の誤りをまとめると、以下のようになります。

本当に成り立っている仮説
H0 H1
検定結果 H0
有意でない
正しい
(確率:1α)
第2種の誤り
(確率:β)
H1
有意である
第1種の誤り
(確率:α)
正しい
(確率:1β=検出力)

2. 検定における検出力の考え方

サンプルサイズを決めるためには、検出力の考え方がとても重要になります。
そこで、まずは検出力の考え方を詳しく解説します。

2-1. 検出力とは

母分散が既知の場合の母平均の検定を例に、検出力を求めてみましょう。

両側検定では、

帰無仮説H0:μ=μ0、対立仮説H1:μμ0

を設定します。
有意水準はα=0.05とします。
このとき、棄却域は以下のようになります。

棄却域:|u0|=|x¯μ0|σ2/nK0.025=1.96

対立仮説H1が成立しているとすると、母平均μは基準値μ0と異なっていることになります。
このとき、u=x¯μσ2/nは標準正規分布N(0,12)に従い、検定統計量u0は以下のように変形できます。

u0=x¯μ0σ2/n

=x¯μσ2/n+μμ0σ2/n

=u+n(μμ0)σ(1)

ここで、d=μμ0σと定義すると、u0は標準正規分布N(0,12)から左右のいずれかにndだけずれた正規分布N(nd,12)に従います。
μ>μ0のとき、μμ0の差が小さい場合と大きい場合の検出力(1β)の違いを図示すると、以下のようになります。

μμ0の差が小さい場合

μμ0の差が大きい場合

赤色の分布が、対立仮説が正しい場合のu0の分布で、この分布に従ってu0が棄却域に入る確率を求めれば、それが検出力1βに該当します。
図の着色部分が検出力で、μμ0の差が大きいほど検出力が大きくなることが分かります。
これは、直感的に考えても理解しやすい考え方でしょう。

u0の式(1)を使って検出力1βは、

1β=Pr(|u0|)1.96

=Pr(u01.96)+Pr(u0)1.96

=Pr(u+nd1.96)+Pr(u+nd1.96)

=Pr(u1.96nd)+Pr(u1.96nd)(2)

と表せます。

2-2. サンプルサイズと検出力の関係

次に、サンプルサイズと検出力の関係を見ていきます。
常識的に考えれば、サンプルサイズが大きいほど検出力が上ることは理解できると思いますが、それを数字で確認しましょう。

n=9のときとn=25のときで、dの値を-1から1まで変化させたときの検出力の推移は以下のようになります(両側検定の場合)。

d=(μμ0/σ)n=9n=25
-10.8510.999
-0.80.6700.979
-0.60.4370.851
-0.40.2240.516
-0.20.0920.170
-0.10.0600.079
00.0500.050
0.10.0600.079
0.20.0920.170
0.40.2240.516
0.60.4370.851
0.80.6700.979
10.8510.999

上記のデータをグラフにした検出力曲線は、以下のようになります。

dの値の絶対値が大きいほど、また、サンプルサイズnが大きいほど検出力が高くなることが分かります。
つまり、dの値が大きければ少ないサンプルで母平均の違いを検出でき、dの値が小さいとたくさんのサンプルがないと母平均の違いを検出できないということになります。
実際はdの値は未知なので、検出力を高くするためにはnを大きくすればよいということです。

しかし、検出力を上げるためにサンプルサイズnをあまりに大きくしすぎると、検出力曲線がさらに立ってきて、dがわずかに変化しただけでそれを検出する確率が大きくなります。

そうすると、技術的には無視できるような違いであっても、検定結果は有意になってしまうことになります。

サンプルサイズnが小さいと、dの値が大きくならないと有意になりにくくなります。

技術的には有意になると思っていても、検定結果が有意にならなかったときは、サンプルサイズnが小さすぎた可能性があります。

このように、サンプルサイズndの値、検出力1βは密接に関係しており、サンプルサイズを決めるにはこれらの関係を使うことになります。

3. サンプルサイズの決め方

それでは、サンプルサイズndの値、検出力1βを考慮してサンプルサイズの決め方を解説します。

帰無仮説をH0:μ=μ0、対立仮説をH1:μμ0と両側検定で設定し、有意水準α=0.05とします。
このとき、d=(μμ0)について、|d|d0のとき、高い検出力1βで帰無仮説H0を棄却して対立仮説H1を採択したいとしましょう。

もう少しイメージしやすいよう具体的に、d0=1.01β=0.90とします。
すると解決したい問題は、「\(d \ge 1.0\)のとき、検出力が1β=0.90となるためには、サンプルサイズnをいくつにすればよいか」と設定できます。

つまり、サンプルサイズnを決めるためには、まずはd01βを解析者が自分で決める必要があるということです。

2-1項の(2)式にβ=0.10, d=1.0を代入すると、以下のようになります。

0.90=Pr(u1.96n)+Pr(u1.96n)

ここで、右辺の第1項は非常に小さく無視できるので、

0.90=Pr(u1.96n)

を満足するnを求めればよいことになります。
正規分布表を使うと、

1.96n=1.282

が得られます。
これをnについて解くと、

n=10.51  11

となります。
これを一般化すると、
dの差があるときに有意水準αの両側検定で検出力1βで対立仮説H1を採択するために必要なサンプルサイズnは、

n=(Kα/2+Kβd)

で求められます。

以上、母分散が既知の場合の母平均の検定の例で、サンプルサイズの決め方を解説しました。
しかし、検定には1つの母分散の検定、2つの母平均の差の検定など、さまざまな種類が存在します。
それぞれの検定方式についてサンプルサイズの求め方を解説すると膨大な量となるため、ここでは詳細な解説は割愛します。

各検定方式におけるサンプルサイズの決め方は、以下の書籍に詳しく書かれていますのでこちらを参照してください。

4. おわりに

今回は、母分散が既知のときの母平均の検定を例にして、対立仮説を採択するためのサンプルサイズの決め方を解説しました。
サンプルサイズをいくつにしたらよいかを理論的に説明したいときは、今回解説した考え方を使ってサンプルサイズを求めてください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です