Revised at 00:34, November 28, 2014
統計学 第
8回
http://my.reset.jp/˜gok/math/statistics/ 18
標本平均と極限定理
8.1
標本平均
統計処理/分析の対象となるデータ(あるいはくじ引きの結果としての確率変数)を 母集団と呼びます。
母集団としては現実に目の前にある数値の集まりだけでなく、実際に採集されたわけ ではない(不可能な場合もあるでしょう)けれども、想像上の話として考える事が出来 るようなデータも扱います。
例えばある工場である日1日のうちに生産される全ての製品の重量など、こんなもの をいちいち全て量るわけにはいきませんが、仮に量ったとすればそう云うデータを空想 する事は出来ます。このような場合、母集団は想像上のデータですから色んな意味で未 知のデータと言えるでしょう。
そして未知の母集団の様子を窺うために、この母集団から
n個の数値を独立に、そ して無作為にサンプルとして取り出して調査する事を考えます。
具体的には
n回復元抽出をするわけですが、どんな
n個の数値の組が出て来るかは 復元抽出をする度にランダムに変わるわけで、その全体を考えればこれは
n個の(ある いは
n次元の)確率変数であると考えられます。そうして得られた
n個の確率変数は独 立であり、1つ1つは同じくじ引きの結果ですから全て母集団と同じ分布に従います。
この様に独立で同じ分布に従う確率変数のファミリーは今後略して
i.i.d.(
independent and identically distributed)であると言います。
定義
8.1.1母集団と同じ分布に従う
i.i.d.な
n個の確率変数のファミリーを、この
母集団からとった大きさ
nの標本と呼びます。
この講義では、一貫して復元抽出の結果の総体を表す確率変数を『標本』と呼び、実 際の抽出によって得られる具体的な数値の事を『サンプル』と呼んで区別する事にしま す。具体的なサンプルは標本と云う確率変数の1つの実現値です。
定義
8.1.2母集団
Xからとった大きさ
nの標本
X1, . . . , Xnに対して、
X¯ = X1+· · ·+Xn
n
で定まる確率変数
X¯を、この母集団からとった大きさ
nの標本平均と言います。
確率変数である標本平均の1つの実現値は、具体的な
n個のサンプルの平均値になっ ています。逆に言えば、実際に
n個の数値をサンプルとして取り出した時にどんな数 値が出るかはランダムでしたからその平均値もランダムであって、その可能性の総体を 確率変数として考えたものがこの標本平均であると言えます。
母集団が平均
m・分散
vをもつ場合、多次元確率変数の成分の和についての知識から
E[ ¯X] =m, V ar[ ¯X] = vn
である事を既に知っています。従って標本の大きさが非常に大きければ
X¯の分散は非常 に小さい事になり、平均値である母平均のまわりに密集している事が分かります。つま り、非常に大きなサンプルをとれば、その平均値は母平均からそう離れた値にはならな いだろうと云う事になります。次節でこの辺りをもう少し正確に表現してみましょう。
8.2 Chebyshev
の不等式と
Weak Law of large numbers確率変数
Zは密度関数
h(z)をもち、平均値は
m、分散は
v >0であるとします。こ のとき分散の計算式は
V ar[Z] = Z 1
−1
(z−m)2h(z)dz
でしたが、ある正の実数
wを固定しておいて積分範囲を
|z−m|< wである範囲、す なわち区間
(m−w, m+w)とそれ以外の
|z−m| ≥wである範囲に分けます:
= Z m+w
m−w
(z−m)2h(z)dz+ Z
それ以外
(z−m)2h(z)dz
すると2つの積分はどちらも非負値ですから第1項の方をなくせば小さくなります:
≥ Z
それ以外
(z−m)2h(z)dz
この積分範囲は
|z−m| ≥wでしたから被積分関数を下から定数で評価出来て
≥w2 Z
{|z−m|≥w}
h(z)dz
=w2P[|Z−m| ≥w]
となって、結局、任意の正数
wに対して
P[|Z−m| ≥w]≤ V ar[Z]
w2
が成立する事が分かりました。これを
Chebyshevの不等式と言います。
Revised at 00:34, November 28, 2014
統計学 第
8回
http://my.reset.jp/˜gok/math/statistics/ 2この不等式を
Zが
X¯の場合に当てはめると、
P∑ØØØØX1+· · ·+Xn
n −m
ØØ ØØ≥w
∏
≤ v
nw2
ですから極限をとれば、任意の正数
wに対して
nlim→1P∑ØØØØ
X1+· · ·+Xn
n −m
ØØ ØØ≥w
∏
= 0
となります。これを大数の弱法則(
weak law of large numbers)と言います。
もう少し精密な議論を重ねれば次のような結果も示す事が出来ます:
P
∑
nlim→1
X1+· · ·+Xn
n =m
∏
= 1
こちらは大数の強法則(
strong law of large numbers)と呼ばれています。
8.3
モーメントとその
generating function確率変数
Xの分散は
X2の平均値に関連していましたが、一般に3次以上の
Xnの 平均値も扱う場合があり、これらは存在するならばモーメント(積率)と呼ばれます。
例えば区間
(−1,1)上の一様分布の平均値は
0、分散は
13
ですから、1・2次のモー メントは正規分布
N°0,13¢
と同じですが、これらは全く別の分布をしています。しか し、これが3次、4次と続いた場合、つまり、任意の次数のモーメントが等しいような 場合には実は2つの確率変数は同じ分布に従うことが知られています。
指数関数
exの
Taylor展開を使えば
E[etX] =E∑
1 +tX+ 1
2!t2X2+· · ·
∏
= 1 +tE[X] + 1
2!t2E[X2] +· · · (8.1)
ですから、展開式の係数が丁度モーメントになっている(階乗は除く)事が分かりま す。ただしモーメントは存在しない事もありますし、期待値
E[etX]が存在しない事も あります。
この
E£ etX§の事を(もちろん存在する場合に限りますが)
Xの積率母関数(
moment generating function)と呼び、この講義では多くの場合記号
MX(t)で表します。
2つの確率変数があって
moment generating functionが等しければ全てのモーメント も等しい事が分かりますから、その場合は確率変数同士が同じ分布に従う事が言えます。
独立な確率変数
X, Yの和の
moment generating functionを計算してみると、
etXと
etYも独立ですから
MX+Y(t) =Eh
et(X+Y)i
=E£ etXetY§
=E£ etX§
E£ etY§
=MX(t)MY(t)
となってそれぞれの
moment generating functionの積になります。
また、
Wの
moment generating functionが
MW(t)であるとき、その定数倍
aWの
moment generating functionMaW(t)は
MaW(t) =E[et(aW)] =E[e(at)W] =MW(at)
となる事も注意しておきます。
例えば標準正規分布に従う確率変数
Xの
moment generating functionは、簡単な計 算により
MX(t) =E[etX]
= Z 1
−1
etx 1
√2πe−12x2dx
= Z 1
−1
√1
2πe−12x2+txdx
= Z 1
−1
√1
2πe−12{(x−t)2−t2}dx
= e12t2 Z 1
−1
√1
2πe−12(x−t)2dx
= e12t2 Z 1
−1
√1
2πe−12y2dy
= e12t2
となる事が分かります。
もちろん各次数のモーメントを計算して展開式を求める事によって計算する事も出来
ます。
Revised at 00:34, November 28, 2014
統計学 第
8回
http://my.reset.jp/˜gok/math/statistics/ 38.4 the central limit theorem
平均
m・分散
v >0である母集団
Xからとった大きさ
nの標本
X1, . . . , Xnを考え ます。このとき標本平均
X¯は
nを大きくすれば母平均
m付近に密集する事を先に見ま したが、このときの誤差、つまり
X¯−mの分布はどうなっているでしょうか。
X¯ −m= X1+· · ·+Xn−nm
n = (X1−m) +· · ·+ (Xn−m) n
は平均値
0、分散
vn
をもちますから、これを標準化した(つまり標準偏差
pvn
で割っ た)ものである
Zn= (X1−m)+√···nv+(Xn−m)について調べてみましょう。
まず
Zn=
X√1−m
v +· · ·+Xn√−vm
√n
である事に注意します。すると分子の
Yj = Xj√−vmは
Xjを標準化したものであって、
それぞれ平均値
0、分散
1ですからその
moment generating functionMYj(t)のべき級数 展開は
MYj(t) = 1 +1
2t2+
(3次以上の項)
です。従ってそれらの独立和である分子
Y1+· · ·+Yn= X1√−vm+· · ·+Xn√−vmの
moment generating functionM(t)は
M(t) = Ω
1 +1
2t2+
(3次以上の項)
æn
になりますから、標準化された確率変数
Znの
moment generating functionMZn(t)は、
先に見た定数倍と
moment generating functionの関係から、
MZn(t) = Ω
M µ t
√n
∂æn
= Ω
1 + 1 2nt2+
µ t
√n
の3次以上の項
∂æn
と書ける事が分かります。
ここで定数項以外の部分を
Rと書くことにして対数をとれば、
nが十分大きいとき
nを分母に含む
Rの部分は
|R|<1ですから
log(1 +R)の
Taylor展開式から
logMZn(t) =nlog(1 +R)
=n µ
R−1 2R2+1
3R3− · · ·
∂
=nR−1
2nR2+1
3nR3− · · ·
となります。
するとまず
nR=nΩ 1 2nt2+
µ t
√n
の3次以上の項
∂æ
=1 2t2+
µ 1
√n
の1次以上の項
∂
ですからここで
n→ 1の極限をとれば
limnR= 12t2
となります。また、
nR2=n Ω 1
2nt2+ µ t
√n
の3次以上の項
∂æ2
= µ1
n
の1次以上の項
∂
なのでこちらは極限をとると0である事が分かります。
nR3等、これ以上のべきは全 て同様に0に収束しますから、結局のところ
nlim→1logMZn(t) = 1 2t2
であり、従って
nlim→1MZn(t) = e12t2
が得られることになります。これは標準正規分布の
moment generating functionに一致 しており、従って
Znは
nが大きい時には標準正規分布で近似される事が分かります。
これは
X¯ −mを標準化したものでしたから、
pvn
倍すれば元に戻って
rvn
X1+· · ·+Xn−nm
√nv = X1+· · ·+Xn
n −m= ¯X−m X¯−m
は平均
0、分散
vn
の正規分布で近似されます。
この様に、母集団がどんな分布に従っていようとも(ただしモーメントは存在しなけ ればなりませんが)十分大きな標本サイズをとれば標本平均と母平均の差はほぼ正規分 布になっていると云う事が分かりました。
これに
mを加えれば標本平均自身の分布と考えられますので今後はこの形で運用し て行く事が多いでしょう(中心極限定理と呼ばれています)。
今日はモーメントを使って証明しましたが、平均値と分散さえ存在すれば(つまり2
次までのモーメントさえ存在すれば)同様の事実が成り立つ事が知られています。
Revised at 00:34, November 28, 2014
統計学 第
8回
http://my.reset.jp/˜gok/math/statistics/ 4定理
8.4.1 (the central limit theorem)平均
m、分散
v 6= 0である母集団
Xか らとった大きさ
nの標本平均
X¯は
nが十分大きい時には正規分布
N°m,vn¢
で近 似されます。
この結果と、前回見た
i.i.d.な正規分布のファミリーに関する結果を標本平均と云う 言葉を使って表現したもの:
定理
8.4.2 N(m, v)に従う母集団
Xからとった大きさ
nの標本平均
X¯は正規分 布
N°m,vn¢
に従います。
を比べてみればよく分かりますが、標本平均と云うものは標本数が十分大きければ、母 集団がどんな分布であったとしても母集団が正規分布であった場合と(ほぼ)同じ分布 をしていることになります。統計学では正規分布が重要である、あるいは、至る所に正 規分布が現れると言われる所以です。
確かに中心極限定理の結果が示しているものは近似値であるわけですが、実際に計算 する時はその近似値を使って計算するわけですから、計算上は全く同じ計算になってし まうと云う事なのです。
多くの場合標本のサイズが50以上であればこの中心極限定理を適用して差し支えな いとされています。
8.5
問題演習
基本演習
8.1標準正規分布に従う確率変数
Xのモーメントを、定義に従った計算:
E[Xn] = Z 1
−1
xn 1
√2πe−x22dx
によって計算して下さい。まず奇数次のモーメントが0である事を示し、偶数次に ついては漸化式を求めると良いでしょう。
基本演習
8.2関数:
f(x) =
e−x 0≤x 0 otherwise
を密度関数とする確率変数
Xのモーメントを計算して下さい。
基本演習
8.3区間
[−1,1]上の一様分布のモーメントを求めて下さい。
発展演習
8.4可算無限個の事象の列
E1, E2, . . .があって、級数
PnP(En)
が収束 しているとき、無限個の
En(全部ではなく、飛び飛びの無限個でも構いません)
が同時に起る確率は0である事を示して下さい。
発展演習
8.5密度関数が
h(x) = 12e−|x|であるような確率変数
Xに対して
moment generating functionを求めて下さい。
発展演習
8.6 (再掲
)有限データに対して
Chebyshevの不等式が成り立つ事を示し
て下さい。
発展演習
8.7 (再掲
)任意の正の整数
kと任意の正数
αに対して
P[|X| ≥α]≤ 1αkE[|X|k]