9 標本分散と χ 分布

(1)

Revised at 01:35, May 23, 2014 統計学第9回 http://my.reset.jp/˜gok/math/statistics/ 1

9 ^{標本分散と}χ²^分布

9.1 標本分散と不偏分散

サンプルの平均値を実現値とする確率変数（標本平均）を考えた様に、サンプルの分散を実現値とする確率変数を考えます：

定義9.1.1 母集団Xからとった大きさnの標本X1, . . . , Xnと標本平均X¯に対して次で定まる確率変数V¯ を、大きさnの標本分散と言います。

V¯ = 1 n

Xn j=1

(Xj−X¯)².

定義式を展開すれば V¯ = 1

n Xn j=1

(X_j²−2XjX¯ + ¯X²) = 1 n

Xn j=1

X_j²− 2 n

Xn j=1

XjX¯ + ¯X²= 1 n

Xn j=1

X_j²−X¯²

と書けますので標本分散の平均値は E[ ¯V] = 1

n Xn j=1

E[X_j²]−E[ ¯X²]

= 1 n

Xn j=1

°V ar[Xj] +E[Xj]²¢

−V ar[ ¯X]−E[ ¯X]²

=v+m²−v n−m²

=n−1 n v

となり母集団の分散より小さくなります。つまり、サンプルを採取してその分散を計算してもそれが母集団の分散を『表している』とは言えないと言う事です。

もちろんサンプルは単にサンプルであって、その平均や分散が母集団の平均や分散と完全にイコールになる事など最初から期待などしていません。しかし標本平均の平均は母平均に一致していましたから、採取の度にランダムに変わるサンプルも、『平均として考えれば』母平均を表していたわけです。それに対して今回の標本分散は、サンプルの取り方によるランダムネス以前の話として、そもそも母分散から『ずれて分布している』わけですから注意が必要です。

しかしここで両辺に ⁿ

n−1を掛ければEh

n n−1V¯i

=vですから、

V˜ = n

n−1V¯ = 1 n−1

Xn j=1

(Xj−X)¯ ²

と定義すればV˜ の平均は母分散に一致します。丁度分散の計算において平均との差の自乗の和をデータの大きさnで割る所をどういうわけかnで割るのではなくn−1で割った方が上手くいくと云う事です。V˜ は不偏分散と呼ばれます。

ただし、あくまで不偏分散の平均値が元データの分散に等しいと云うだけであって、不偏分散の実現値はランダムであっていつも母分散に等しいわけではありません。不偏分散の分散を計算してサンプルサイズを大きくした場合に分散が小さくなって行く事を確かめて初めて不偏分散の実現値と元データの分散の関係に言及出来るだけです。そう云う意味では結局サンプルサイズを大きくするわけですから ⁿ⁻¹_n はほぼ１になり、だったら標本分散でも大して変わらないと言う意見もあるでしょう。

9.2 正規母集団からの標本分散

母集団が正規分布に従う場合には標本分散の分布を求める事が出来ます。

しかし標本のサイズが一般のnでは計算が難しいので、大きさ3の標本X1, X2, X3

で試しに計算してみる事にします。母平均はm、母分散はvとします。

まず次の直交行列Uによる変換：

U =







√1 3

√1

2 −^√¹₂ 0

√1 6

√1

6 −^√²₆





,



 Y1

Y2

Y3



=U



 X1

X2

X3



=







X1+X√2+X3

3 X1√−X2

2 X1+X√2−2X3

6







を考えると共分散はすべてCov[Y1, Y2] =Cov[Y2, Y3] =Cov[Y3, Y1] = 0となります。

例えば次のような具合です：

Cov[Y2, Y3] =E[Y2Y3]−E[Y2]E[Y3]

= 1 2√

3E[(X1−X2)(X1+X2−2X3)]

= 1 2√ 3

°E[X₁²] +E[X1X2]−2E[X1X3]−E[X1X2]−E[X₂²] + 2E[X2X3]¢

= 0

この事から察せられる通り（あくまで察するだけですよ、証明にはなっていません）、

Y1, Y2, Y3は独立であることが知られています。

(2)

Revised at 01:35, May 23, 2014 統計学第9回 http://my.reset.jp/˜gok/math/statistics/ 2 次に個々に見て行きましょう。まず明らかにY1は標本平均X¯に関連しています（定

数倍になっていますY1=√ 3 ¯X）。

また、Y2= ^√¹₂(X1−X2)、Y3 = ^√¹₆(X1+X2−2X3)共に正規分布N(0, v)に従っていますので、標準化すれば √^Y²v,√^Y³v は共に標準正規分布に従います。

更に行列Uの直交性からY₁²+Y₂²+Y₃²=X₁²+X₂²+X₃²であり、Y1=√

3 ¯Xである事からX からとった大きさ３の標本分散V¯：

V¯ = (X1−X¯)²+ (X2−X)¯ ²+ (X3−X¯)²

3 = X₁²+X₂²+X₃² 3 −X¯² は、

V¯ = 1

3(Y₁²+Y₂²+Y₃²)− µY1

√3

∂2

=1

3(Y₂²+Y₃²) = v 3

(µY2

√v

∂2

+ µY3

√v

∂2)

3 vV¯ =

µY2

√v

∂2

+ µY3

√v

∂2

となっている事が分かるので、結局標本分散の定数倍³

vV¯ は２つの独立な標準正規分布の２乗和になっていることが分かります（更に言えば、標本分散Y₂²+Y₃²は標本平均 Y1と独立です）。

そこで標準正規分布の（独立な）自乗和がどんな分布に従うか見るために、まずは単一の標準正規分布の自乗から見て行きましょう。

9.3 標準正規分布の自乗とχ²分布

Xが標準正規分布N(0,1)の時X²はどんな分布に従うでしょうか？密度関数は簡単に計算出来ますのでやってみましょう。

a≥0の時、偶関数の積分に注意すれば P[X²≤a] =P[−√

a≤X ≤√ a] =

Z ^√a

−√ a

√1 2πe⁻^x

2 2 dx= 2

Z ^√a 0

√1 2πe⁻^x

2 2 dx となりますが、ここでx²=yと云う変数変換によれば

P[X²≤a] = Z a

0

√1

2πe⁻^y²y⁻¹²dy ですので、関数χ1(x)を（χはギリシア文字のchi、カイ）、

χ1(x) =





√1

2πx⁻¹²e⁻^x² 0≤x 0 x <0

と定めればこの関数χ1(x)が求める分布密度関数である事が分かります。

この分布は（自由度１の）χ²分布（カイ自乗分布、Chi-squared distribution with degree

1 of freedom）と言って良く知られています。

9.4 一般の自由度のχ²分布とΓ 関数

一般の自由度nのχ²分布の密度関数χn(x) は、

χn(x) =









°₁

2

¢ⁿ₂ Γ°_n

2

¢xⁿ²⁻¹e⁻^x² 0≤x

0 x <0

で与えられますが、ここでΓ(∗)はΓ（ガンマ）関数（あるいは第２種Euler積分）で、

Γ(t) = Z ₁

0

x^t⁻¹e⁻^xdx で定義され、特に

Γ(1) = Z ₁

0

e⁻^xdx= 1 であり、また部分積分法により容易に分かる通り

Γ(t+ 1) = Z ₁

0

x^te⁻^xdx=£

−x^te⁻^x§₁

0 + Z ₁

0

tx^t⁻¹e⁻^xdx=tΓ(t) と云った性質をもつ関数です。特にtが正の整数の場合に計算すると

Γ(n+ 1) =nΓ(n) =n(n−1)Γ(n−1) =· · ·=n(n−1)· · ·2·1·Γ(1) =n!

と云う著しい性質を持っており、しかも定義式に於いてはtは整数である必要はありませんから階乗と云う概念を非整数へ拡張することが出来ます。例えばΓ°₁

2+ 1¢

= ¹₂!などと解釈するわけです（その値は幾らになるでしょうか？課題としてやってみましょう）。

また、Γ 関数の積を計算すると、

Γ(v)Γ(w) = Z ₁

0

x^v−1e^−xdx Z ₁

0

y^w−1e^−ydy

= Z ₁

0

ΩZ ₁

0

x^v−1y^w−1e^−(x+y)dx æ

dy

(3)

Revised at 01:35, May 23, 2014 統計学第9回 http://my.reset.jp/˜gok/math/statistics/ 3 ですが、これは第１象限を床とし、屋根の高さがx^v⁻¹y^w⁻¹e⁻^(x+y)である様な立体の

体積と考えられます。そこでこの立体を ^π

4 だけ原点中心に回転してみます。

回転後の点(x, y)での屋根の高さは、回転前の点≥

x+y√

2,⁻^√^x+y₂ ¥

での屋根の高さ µx+y

√2

∂v−1µ

−x+y

√2

∂w−1

e⁻^√^2y

に等しいので、床が不等式：−y ≤x≤y, 0≤y <1で表される領域に変わる事に注意すれば、『体積は回転しても変わらない』ので

Γ(v)Γ(w) = Z ₁

0

(Z y

−y

µx+y

√2

∂v−1µ

−x+y

√2

∂w−1

e⁻

√2y

dx )

dy

= Z ₁

0

y^v+w−2e⁻

√2y(Zy

−y

µ1 +^x_y

√2

∂v−1µ1−^x_y

√2

∂w−1

dx )

dy

であり、中のxに関する積分において^x

y =tと置換すれば

= Z ₁

0

y^v+w−2e⁻^√^2y (Z1

−1

µ1 +t

√2

∂_v−1µ 1−t

√2

∂_w−1 ydt

) dy

= ΩZ ₁

0

y^v+w−1e⁻^√^2ydy æ (Z 1

−1

µ1 +t

√2

∂_v−1µ 1−t

√2

∂_w−1 dt

)

となって２つの積分の積になっています。第１の積分で√

2y=sと置換すれば

= (Z ₁

0

µ 1

√2

∂_v+w−1

s^v+w−1e^−s 1

√2ds ) (Z 1

−1

µ1 +t

√2

∂_v−1µ 1−t

√2

∂_w−1 dt

)

= ΩZ 1

0

s^v+w−1e^−sds æ

·1 2

(Z 1

−1

µ1 +t 2

∂v−1µ 1−t

2

∂w−1

dt )

ですから、第１の積分はガンマ関数、第２の積分は¹⁻₂^t=pと置換して

=Γ(v+w)1 2

ΩZ 0 1

(1−p)^v−1p^w−1(−2)dp æ

=Γ(v+w) Z ₁

0

(1−p)^v−1p^w−1dp

となっていることが示されます。この最後の積分項はやはりL.EulerによってB（ベータ）関数（あるいは第１種Euler積分）と呼ばれています：

B(v, w) = Z 1

0

(1−z)^v⁻¹z^w⁻¹dz, v, w >0.

9.5 独立な標準正規分布の自乗和

確率変数の独立和は、分布密度関数で言えばたたみ込みに相当しますので（異なる自由度の）χ²分布同士のたたみこみを計算してみましょう：

(χm∗χn)(x) = Z x

0

°₁

2

¢^m₂ Γ°_m

2

¢(x−y)^m²⁻¹e⁻^x⁻²^y

°₁

2

¢ⁿ₂ Γ°_n

2

¢yⁿ²⁻¹e⁻^y²dy

=

°₁

2

¢^m+n₂ Γ°_m

2

¢Γ°_n

2

¢e⁻^x² Z x

0

(x−y)^m²⁻¹yⁿ²⁻¹dy

=

°₁

2

¢^m+n₂ Γ°_m

2

¢Γ°_n

2

¢e⁻^x²x^m+n² ⁻² Z x

0

≥1−y x

¥^m₂−1≥y x

¥ⁿ₂−1

dy ですが、ここで^y

x=zと云う変数変換をすると次の様になります：

=

°₁

2

¢^m+n₂ Γ°_m

2

¢Γ°_n

2

¢e⁻^x²x^m+n² ⁻¹ Z 1

0

(1−z)^m²⁻¹zⁿ²⁻¹dz.

ここで右辺の積分はさっきガンマ関数の積を計算したときに出て来たB（ベータ）関数であり、既に見たようにΓ 関数と親密な関係にありました：

Γ(v)Γ(w) Γ(v+w) =

Z 1 0

(1−z)^v⁻¹z^w⁻¹dz 従って

(χm∗χn)(x) =

°₁

2

¢^m+n₂

e⁻^x²x^m+n² ⁻¹^Γ(^m2)^Γ(ⁿ2)

Γ(^m2+ⁿ₂) Γ°_m

2

¢Γ°_n

2

¢ =

°₁

2

¢^m+n₂ Γ°_m+n

2

¢x^m+n² ⁻¹e⁻^x² =χm+n(x) となって、たたみこみの結果はまたχ²分布になっており、自由度が和になって出てくる事が分かります。

従ってこの結果は、確率変数の言葉で言えば、独立な２つのχ²分布の和はまたχ²分布になる（自由度の和になる）と云う事を示しています。

更に，標準正規分布の自乗が自由度１のχ²分布だった事を考えれば、それぞれ標準正規分布に従う２つの独立な確率変数X, Y の自乗の和X²+Y²は自由度２のχ²分布に従う事になります。

以上から、正規母集団から取った大きさ３の標本分散の ³

v 倍は、自由度２のχ²分布に従っている事が分かります。一般には、同様の計算により次の事が知られています：

(4)

Revised at 01:35, May 23, 2014 統計学第9回 http://my.reset.jp/˜gok/math/statistics/ 4

事実9.5.1 平均m、分散vの正規母集団から取った大きさnの標本分散V¯ は標本平均X¯ とは独立であって、ⁿ^V^¯

v は自由度n−1のχ²分布に従います。

この様に大きさnの標本分散の(χ²分布としての)『自由度』はn−1になります。

元々独立なn回の復元抽出X1, . . . , Xnでn個の自由度があったのですが、これを分散計算のためにX1−X, . . . , X¯ n−X¯ の組と考えた場合は実は関係式：

(X1−X) +¯ · · ·+ (Xn−X) =¯ X1+· · ·+Xn−nX¯ = 0

が１つ成り立ってしまっていますから、n個の確率変数X1−X, . . . , X¯ n−X¯ は全部が自由に動く事は出来ず、関係式の分だけ自由度が下がって自由度n−1となるわけです。

これがnで割るのではなくn−1で割った不偏分散の方が『上手くいく』理由です。

自由度nのχ²分布に従う確率変数Xの平均値はn、分散は2nとなります（Γ関数を含む計算ですので省略します）ので母集団が正規分布N(m, v)に従う場合には、大きさnの標本分散V¯ は、

E[ ¯V] = v nEhn

vV¯i

=n−1 n v V ar[ ¯V] =V arhv

n· n vV¯i

= v² n²V arhn

vV¯i

= 2(n−1) n² v²

となっており、やはりサンプルサイズがある程度大きければ標本分散の分散はかなり小さくなり、従って標本分散の具体値をもって母分散の代用として良い事が分かります。

ただしこの場合は２つの種類の異なる近似が絡んでいます。１つは分散の小さな確率変数の実現値と平均値との近似であり、もう１つは平均値ⁿ⁻¹

n vと母分散vとの近似です。

同様の計算は不偏分散でも行われ、こちらの場合は前者の近似しか使いませんから正確な近似であると期待されます。

9.6 問題演習

基本演習9.1 標本分散よりも不偏分散の方が母分散を『より良く』表していると考える理由は何ですか。

基本演習9.2 母集団が正規分布N(m, v)に従うときに大きさnの不偏分散の分散を計算して下さい。講義ノートにある大きさnの標本分散の分散を求めた結果式は使って下さい。

基本演習 9.3 講義ノートにある共分散Cov[Y1, Y2], Cov[Y3, Y1]の計算を実行し、

共に０である事を確認して下さい。

基本演習9.4 Gauß積分：

Z ₁

0

e⁻^x²dx=

√π 2 を使ってΓ°₁

2

¢の値を計算し、¹

2!を求めて下さい。

発展演習 9.5 Γ 関数の性質を使って、自由度nのχ²分布に従う確率変数X の平均値がn、分散が2nとなることを示して下さい。

発展演習9.6 講義ノートにあるΓ 関数の積の計算とχ²分布の密度関数のたたみ込みの計算を、自分の手で確かめながら計算して下さい。