Revised at 01:35, May 23, 2014 統計学 第9回 http://my.reset.jp/˜gok/math/statistics/ 1
9 標本分散とχ2分布
9.1 標本分散と不偏分散
サンプルの平均値を実現値とする確率変数(標本平均)を考えた様に、サンプルの分 散を実現値とする確率変数を考えます:
定義9.1.1 母集団Xからとった大きさnの標本X1, . . . , Xnと標本平均X¯に対し て次で定まる確率変数V¯ を、大きさnの標本分散と言います。
V¯ = 1 n
Xn j=1
(Xj−X¯)2.
定義式を展開すれば V¯ = 1
n Xn j=1
(Xj2−2XjX¯ + ¯X2) = 1 n
Xn j=1
Xj2− 2 n
Xn j=1
XjX¯ + ¯X2= 1 n
Xn j=1
Xj2−X¯2
と書けますので標本分散の平均値は E[ ¯V] = 1
n Xn j=1
E[Xj2]−E[ ¯X2]
= 1 n
Xn j=1
°V ar[Xj] +E[Xj]2¢
−V ar[ ¯X]−E[ ¯X]2
=v+m2−v n−m2
=n−1 n v
となり母集団の分散より小さくなります。つまり、サンプルを採取してその分散を計算 してもそれが母集団の分散を『表している』とは言えないと言う事です。
もちろんサンプルは単にサンプルであって、その平均や分散が母集団の平均や分散と 完全にイコールになる事など最初から期待などしていません。しかし標本平均の平均は 母平均に一致していましたから、採取の度にランダムに変わるサンプルも、『平均とし て考えれば』母平均を表していたわけです。それに対して今回の標本分散は、サンプル の取り方によるランダムネス以前の話として、そもそも母分散から『ずれて分布してい る』わけですから注意が必要です。
しかしここで両辺に n
n−1を掛ければEh
n n−1V¯i
=vですから、
V˜ = n
n−1V¯ = 1 n−1
Xn j=1
(Xj−X)¯ 2
と定義すればV˜ の平均は母分散に一致します。丁度分散の計算において平均との差の 自乗の和をデータの大きさnで割る所をどういうわけかnで割るのではなくn−1で 割った方が上手くいくと云う事です。V˜ は不偏分散と呼ばれます。
ただし、あくまで不偏分散の平均値が元データの分散に等しいと云うだけであって、不偏分散 の実現値はランダムであっていつも母分散に等しいわけではありません。不偏分散の分散を計算 してサンプルサイズを大きくした場合に分散が小さくなって行く事を確かめて初めて不偏分散の 実現値と元データの分散の関係に言及出来るだけです。そう云う意味では結局サンプルサイズを 大きくするわけですから n−1n はほぼ1になり、だったら標本分散でも大して変わらないと言う 意見もあるでしょう。
9.2 正規母集団からの標本分散
母集団が正規分布に従う場合には標本分散の分布を求める事が出来ます。
しかし標本のサイズが一般のnでは計算が難しいので、大きさ3の標本X1, X2, X3
で試しに計算してみる事にします。母平均はm、母分散はvとします。
まず次の直交行列Uによる変換:
U =
√1 3
√1 3
√1 3
√1
2 −√12 0
√1 6
√1
6 −√26
,
Y1
Y2
Y3
=U
X1
X2
X3
=
X1+X√2+X3
3 X1√−X2
2 X1+X√2−2X3
6
を考えると共分散はすべてCov[Y1, Y2] =Cov[Y2, Y3] =Cov[Y3, Y1] = 0となります。
例えば次のような具合です:
Cov[Y2, Y3] =E[Y2Y3]−E[Y2]E[Y3]
= 1 2√
3E[(X1−X2)(X1+X2−2X3)]
= 1 2√ 3
°E[X12] +E[X1X2]−2E[X1X3]−E[X1X2]−E[X22] + 2E[X2X3]¢
= 0
この事から察せられる通り(あくまで察するだけですよ、証明にはなっていません)、
Y1, Y2, Y3は独立であることが知られています。
Revised at 01:35, May 23, 2014 統計学 第9回 http://my.reset.jp/˜gok/math/statistics/ 2 次に個々に見て行きましょう。まず明らかにY1は標本平均X¯に関連しています(定
数倍になっていますY1=√ 3 ¯X)。
また、Y2= √12(X1−X2)、Y3 = √16(X1+X2−2X3)共に正規分布N(0, v)に従っ ていますので、標準化すれば √Y2v,√Y3v は共に標準正規分布に従います。
更に行列Uの直交性からY12+Y22+Y32=X12+X22+X32であり、Y1=√
3 ¯Xであ る事からX からとった大きさ3の標本分散V¯:
V¯ = (X1−X¯)2+ (X2−X)¯ 2+ (X3−X¯)2
3 = X12+X22+X32 3 −X¯2 は、
V¯ = 1
3(Y12+Y22+Y32)− µY1
√3
∂2
=1
3(Y22+Y32) = v 3
(µY2
√v
∂2
+ µY3
√v
∂2)
3 vV¯ =
µY2
√v
∂2
+ µY3
√v
∂2
となっている事が分かるので、結局標本分散の定数倍3
vV¯ は2つの独立な標準正規分布 の2乗和になっていることが分かります(更に言えば、標本分散Y22+Y32は標本平均 Y1と独立です)。
そこで標準正規分布の(独立な)自乗和がどんな分布に従うか見るために、まずは単 一の標準正規分布の自乗から見て行きましょう。
9.3 標準正規分布の自乗とχ2分布
Xが標準正規分布N(0,1)の時X2はどんな分布に従うでしょうか?密度関数は簡単 に計算出来ますのでやってみましょう。
a≥0の時、偶関数の積分に注意すれば P[X2≤a] =P[−√
a≤X ≤√ a] =
Z √a
−√ a
√1 2πe−x
2 2 dx= 2
Z √a 0
√1 2πe−x
2 2 dx となりますが、ここでx2=yと云う変数変換によれば
P[X2≤a] = Z a
0
√1
2πe−y2y−12dy ですので、関数χ1(x)を(χはギリシア文字のchi、カイ)、
χ1(x) =
√1
2πx−12e−x2 0≤x 0 x <0
と定めればこの関数χ1(x)が求める分布密度関数である事が分かります。
この分布は(自由度1の)χ2分布(カイ自乗分布、Chi-squared distribution with degree
1 of freedom)と言って良く知られています。
9.4 一般の自由度のχ2分布とΓ 関数
一般の自由度nのχ2分布の密度関数χn(x) は、
χn(x) =
°1
2
¢n2 Γ°n
2
¢xn2−1e−x2 0≤x
0 x <0
で与えられますが、ここでΓ(∗)はΓ(ガンマ)関数(あるいは第2種Euler積分)で、
Γ(t) = Z 1
0
xt−1e−xdx で定義され、特に
Γ(1) = Z 1
0
e−xdx= 1 であり、また部分積分法により容易に分かる通り
Γ(t+ 1) = Z 1
0
xte−xdx=£
−xte−x§1
0 + Z 1
0
txt−1e−xdx=tΓ(t) と云った性質をもつ関数です。特にtが正の整数の場合に計算すると
Γ(n+ 1) =nΓ(n) =n(n−1)Γ(n−1) =· · ·=n(n−1)· · ·2·1·Γ(1) =n!
と云う著しい性質を持っており、しかも定義式に於いてはtは整数である必要はありま せんから階乗と云う概念を非整数へ拡張することが出来ます。例えばΓ°1
2+ 1¢
= 12!な どと解釈するわけです(その値は幾らになるでしょうか?課題としてやってみましょう)。
また、Γ 関数の積を計算すると、
Γ(v)Γ(w) = Z 1
0
xv−1e−xdx Z 1
0
yw−1e−ydy
= Z 1
0
ΩZ 1
0
xv−1yw−1e−(x+y)dx æ
dy
Revised at 01:35, May 23, 2014 統計学 第9回 http://my.reset.jp/˜gok/math/statistics/ 3 ですが、これは第1象限を床とし、屋根の高さがxv−1yw−1e−(x+y)である様な立体の
体積と考えられます。そこでこの立体を π
4 だけ原点中心に回転してみます。
回転後の点(x, y)での屋根の高さは、回転前の点≥
x+y√
2,−√x+y2 ¥
での屋根の高さ µx+y
√2
∂v−1µ
−x+y
√2
∂w−1
e−√2y
に等しいので、床が不等式:−y ≤x≤y, 0≤y <1で表される領域に変わる事に注 意すれば、『体積は回転しても変わらない』ので
Γ(v)Γ(w) = Z 1
0
(Z y
−y
µx+y
√2
∂v−1µ
−x+y
√2
∂w−1
e−
√2y
dx )
dy
= Z 1
0
yv+w−2e−
√2y(Zy
−y
µ1 +xy
√2
∂v−1µ1−xy
√2
∂w−1
dx )
dy
であり、中のxに関する積分においてx
y =tと置換すれば
= Z 1
0
yv+w−2e−√2y (Z1
−1
µ1 +t
√2
∂v−1µ 1−t
√2
∂w−1 ydt
) dy
= ΩZ 1
0
yv+w−1e−√2ydy æ (Z 1
−1
µ1 +t
√2
∂v−1µ 1−t
√2
∂w−1 dt
)
となって2つの積分の積になっています。第1の積分で√
2y=sと置換すれば
= (Z 1
0
µ 1
√2
∂v+w−1
sv+w−1e−s 1
√2ds ) (Z 1
−1
µ1 +t
√2
∂v−1µ 1−t
√2
∂w−1 dt
)
= ΩZ 1
0
sv+w−1e−sds æ
·1 2
(Z 1
−1
µ1 +t 2
∂v−1µ 1−t
2
∂w−1
dt )
ですから、第1の積分はガンマ関数、第2の積分は1−2t=pと置換して
=Γ(v+w)1 2
ΩZ 0 1
(1−p)v−1pw−1(−2)dp æ
=Γ(v+w) Z 1
0
(1−p)v−1pw−1dp
となっていることが示されます。この最後の積分項はやはりL.EulerによってB(ベー タ)関数(あるいは第1種Euler積分)と呼ばれています:
B(v, w) = Z 1
0
(1−z)v−1zw−1dz, v, w >0.
9.5 独立な標準正規分布の自乗和
確率変数の独立和は、分布密度関数で言えばたたみ込みに相当しますので(異なる自 由度の)χ2分布同士のたたみこみを計算してみましょう:
(χm∗χn)(x) = Z x
0
°1
2
¢m2 Γ°m
2
¢(x−y)m2−1e−x−2y
°1
2
¢n2 Γ°n
2
¢yn2−1e−y2dy
=
°1
2
¢m+n2 Γ°m
2
¢Γ°n
2
¢e−x2 Z x
0
(x−y)m2−1yn2−1dy
=
°1
2
¢m+n2 Γ°m
2
¢Γ°n
2
¢e−x2xm+n2 −2 Z x
0
≥1−y x
¥m2−1≥y x
¥n2−1
dy ですが、ここでy
x=zと云う変数変換をすると次の様になります:
=
°1
2
¢m+n2 Γ°m
2
¢Γ°n
2
¢e−x2xm+n2 −1 Z 1
0
(1−z)m2−1zn2−1dz.
ここで右辺の積分はさっきガンマ関数の積を計算したときに出て来たB(ベータ)関 数であり、既に見たようにΓ 関数と親密な関係にありました:
Γ(v)Γ(w) Γ(v+w) =
Z 1 0
(1−z)v−1zw−1dz 従って
(χm∗χn)(x) =
°1
2
¢m+n2
e−x2xm+n2 −1Γ(m2)Γ(n2)
Γ(m2+n2) Γ°m
2
¢Γ°n
2
¢ =
°1
2
¢m+n2 Γ°m+n
2
¢xm+n2 −1e−x2 =χm+n(x) となって、たたみこみの結果はまたχ2分布になっており、自由度が和になって出てく る事が分かります。
従ってこの結果は、確率変数の言葉で言えば、独立な2つのχ2分布の和はまたχ2分 布になる(自由度の和になる)と云う事を示しています。
更に,標準正規分布の自乗が自由度1のχ2分布だった事を考えれば、それぞれ標準 正規分布に従う2つの独立な確率変数X, Y の自乗の和X2+Y2は自由度2のχ2分布 に従う事になります。
以上から、正規母集団から取った大きさ3の標本分散の 3
v 倍は、自由度2のχ2分布 に従っている事が分かります。一般には、同様の計算により次の事が知られています:
Revised at 01:35, May 23, 2014 統計学 第9回 http://my.reset.jp/˜gok/math/statistics/ 4
事実9.5.1 平均m、分散vの正規母集団から取った大きさnの標本分散V¯ は標本 平均X¯ とは独立であって、nV¯
v は自由度n−1のχ2分布に従います。
この様に大きさnの標本分散の(χ2分布としての)『自由度』はn−1になります。
元々独立なn回の復元抽出X1, . . . , Xnでn個の自由度があったのですが、これを分 散計算のためにX1−X, . . . , X¯ n−X¯ の組と考えた場合は実は関係式:
(X1−X) +¯ · · ·+ (Xn−X) =¯ X1+· · ·+Xn−nX¯ = 0
が1つ成り立ってしまっていますから、n個の確率変数X1−X, . . . , X¯ n−X¯ は全部が 自由に動く事は出来ず、関係式の分だけ自由度が下がって自由度n−1となるわけです。
これがnで割るのではなくn−1で割った不偏分散の方が『上手くいく』理由です。
自由度nのχ2分布に従う確率変数Xの平均値はn、分散は2nとなります(Γ関数 を含む計算ですので省略します)ので母集団が正規分布N(m, v)に従う場合には、大 きさnの標本分散V¯ は、
E[ ¯V] = v nEhn
vV¯i
=n−1 n v V ar[ ¯V] =V arhv
n· n vV¯i
= v2 n2V arhn
vV¯i
= 2(n−1) n2 v2
となっており、やはりサンプルサイズがある程度大きければ標本分散の分散はかなり小 さくなり、従って標本分散の具体値をもって母分散の代用として良い事が分かります。
ただしこの場合は2つの種類の異なる近似が絡んでいます。1つは分散の小さな確率変 数の実現値と平均値との近似であり、もう1つは平均値n−1
n vと母分散vとの近似です。
同様の計算は不偏分散でも行われ、こちらの場合は前者の近似しか使いませんから正 確な近似であると期待されます。
9.6 問題演習
基本演習9.1 標本分散よりも不偏分散の方が母分散を『より良く』表していると 考える理由は何ですか。
基本演習9.2 母集団が正規分布N(m, v)に従うときに大きさnの不偏分散の分散 を計算して下さい。講義ノートにある大きさnの標本分散の分散を求めた結果式 は使って下さい。
基本演習 9.3 講義ノートにある共分散Cov[Y1, Y2], Cov[Y3, Y1]の計算を実行し、
共に0である事を確認して下さい。
基本演習9.4 Gauß積分:
Z 1
0
e−x2dx=
√π 2 を使ってΓ°1
2
¢の値を計算し、1
2!を求めて下さい。
発展演習 9.5 Γ 関数の性質を使って、自由度nのχ2分布に従う確率変数X の平 均値がn、分散が2nとなることを示して下さい。
発展演習9.6 講義ノートにあるΓ 関数の積の計算とχ2分布の密度関数のたたみ 込みの計算を、自分の手で確かめながら計算して下さい。