母相関係数の検定と推定

以前の記事で、相関係数について解説しました。

2変数の関係を定量化する方法~相関分析①~

相関係数とは、2つのデータの関係の強さを数値で表す指標でしたね。
算出した相関係数は、あくまで母集団の一部であるサンプルから算出した相関係数であり、母集団の相関については判断できません。

これまでの記事で、母平均と母分散などについて検定や推定できることを述べてきましたが、母集団の相関係数である母相関係数についても検定や推定を適用できます。
今回は、母相関係数に関する検定と推定について解説します。

この記事で分かること
  • 2次元正規分布とは
  • 無相関の検定の進め方
  • 母相関係数の推定方法


1. 2次元正規分布について

2つの変数xyがあるとしましょう。

おのおのが正規分布に従い、かつxyの間に相関があるとき、2つの変数(x,y)は2次元正規分布に従います。

xが1次元正規分布N(μx,σx2)に、yN(μy,σy2)に従い、xyの母集団相関係数(母相関係数)がρのとき、2次元正規分布の確率密度関数は、以下の式で与えられます。

f(x,y)=12π1ρ2σxσy

×exp[12(1ρ2){(xμx)2σx22ρ(xμx)(yμy)σxσy+(yμy)2σy2}]

簡単にするために、xyはともに標準正規分布に従うとすると、μx=μx=0,σx=σx=1なので上の式を簡単にできます。
このとき、xyの母相関係数がρ=0(無相関)の場合と、ρ=0.9(強い正の相関)の場合で、2次元正規分布の形状を比較してみましょう。

相関係数角度090°回転
ρ=0
ρ=0.9
母相関係数による2次元正規分布の形状の違い

ρ=0のときは90°回転させても分布の形状は変わりませんが、ρ=0.9になると、相関の影響で細長い形状の分布になっていることが分かります。
散布図は、2次元正規分布からサンプリングしたサンプルをxy平面にプロットしたもので、母相関係数ρの推定量が標本相関係数rです。

2. 無相関の検定

対になった2つのデータx,yが与えられているとき、xyの関係を分析することを相関分析と言いましたね。
2つの変数の関係の強さを数値で表す指標が、相関係数rでした。
しかし、われわれが知りたいのは、サンプルの関係の強さではなく、2つの変数の母集団における関係の強さです。
このとき、サンプルから得られた相関係数rをもとに、母相関係数ρについて検定で判断することが可能です。
検定する場合、帰無仮説H0ρ=0とするため、無相関の検定と呼ばれます。

2-1. 無相関の検定手順

手順1. 帰無仮説H0と対立仮説H1を設定する。

無相関の検定は、通常両側検定で行うので、以下のように設定します。

H0:ρ=0 

H1:μ0

手順2. 有意水準αを決める。

通常は、α=0.05とします。

手順3. 採取したn個の2次元データから相関係数rを求め、検定統計量t0の値を計算する。

検定統計量t0は、以下のように求めます。

t0=rn21r2

手順4. 検定統計量t0の自由度ϕを求める。

2次元データの個数をnとすると、自由度ϕは、

ϕ=n2

で求められます。

手順5. 棄却域を決める。

棄却域:|t0|t(ϕ,α)

手順6. 判定する。

t0が棄却域に入れば、有意水準αで有意と判定し、帰無仮説H0を棄却して対立仮説H1を採択します。
t0が棄却域に入らなければ、有意水準αで有意でないと判定し、帰無仮説H0を棄却しません。

2-2. 無相関の検定の実施例

25個の2次元データの相関係数r=0.92のとき、無相関の検定手順に従ってρ0と言えるかどうか、検定してみましょう。

手順1. 帰無仮説H0と対立仮説H1を設定する。

無相関の検定は、通常両側検定で行うので、以下のように設定します。

H0:ρ=0

H1:μ0

手順2. 有意水準αを決める。

α=0.05

手順3. 採取したn個の2次元データから相関係数rを求め、以下の検定統計量t0の値を計算する。

t0=0.92×25210.922=11.26

手順4. 検定統計量t0の自由度ϕを求める。

ϕ=252=23

手順5. 棄却域を決める。

棄却域:|t0|t(23,0.05)=2.069

手順6. 判定する。

|t0|=11.26t(23,0.05)=2.069で検定統計量t0は棄却域に入るので有意です。

よって帰無仮説H0を棄却して、2つの変数間に相関関係があると判断できます。

3. 母相関係数の推定

以前の記事で解説した通り、母平均μの推定には点推定区間推定の2種類があります。

母相関係数ρを区間推定するにあたり、変換が必要なので具体的な変換方法を見ていきます。
まず、n個の2次元データの相関係数rが与えられたとき、

z=12ln(1+r1r)

と変換します。(z変換)

ここで、lnは自然対数を表します。

このとき、zは近似的に平均12ln(1+ρ1ρ)、分散1n3の正規分布に従います。

3-1. 母相関係数の推定手順

点推定はデータの相関係数rを使えばよいです。

区間推定については、zが近似的に正規分布に従う性質を利用することで、ρの信頼区間を求められます。

ρの信頼率1α信頼区間

exp(2A)1exp(2A)+1ρexp(2B)1exp(2B)+1

ただし、A=zKα/2n3, B=z+Kα/2n3です。

また、exp(x)=exeは自然対数の底であり、Kpは標準正規分布における上側100p%点です。

4-2. 母相関係数の推定の実施例

無相関の検定で使ったデータ(n=25,r=0.92)で、点推定と区間推定を行ってみましょう。

点推定

ρ^=r=0.92

区間推定:信頼率95%の信頼区間を求めます。

3-1.で求めた各式の値を求めます。

z=12ln(1+0.9210.92)=1.589

A=1.5891.9622=1.171

B=1.589+1.9622=2.007

exp(2×1.171)1exp(2×1.171)+1=0.825

exp(2×2.007)1exp(2×2.007)+1=0.965

したがって、母相関係数ρの95%信頼区間は、

0.825ρ0.965

と求められます。

4. おわりに

今回は、母相関係数に関する検定と推定について解説しました。
検定統計量が近似的に正規分布に従うことを利用して、検定や推定が可能です。
2次元データで相関係数を求めたときは、合わせて母相関係数の検定と推定も実施してみてください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です