7 標本平均と中心極限定理

(1)

Revised at 12:02, November 16, 2016 統計学第7回 http://my.reset.jp/˜gok/math/statistics/ 1

7 標本平均と中心極限定理

7.1 標本平均

統計処理／分析の対象となるデータ（あるいはくじ引きの結果としての確率変数）を母集団と呼びます。

母集団としては現実に目の前にある数値の集まりだけでなく、実際に採集されたわけではない（不可能な場合もあるでしょう）けれども、想像上の話として考える事が出来るようなデータも扱います。

例えばある工場である日１日のうちに生産される全ての製品の重量など、こんなものをいちいち全て量るわけにはいきませんが、仮に量ったとすればそう云うデータを空想する事は出来ます。このような場合、母集団は想像上のデータですから色んな意味で未知のデータと言えるでしょう。

そして未知の母集団の様子を窺うために、この母集団からn個の数値を独立に、そして無作為にサンプルとして取り出して調査する事を考えます。

具体的にはn回復元抽出をするわけですが、どんなn個の数値の組が出て来るかは復元抽出をする度にランダムに変わるわけで、その全体を考えればこれはn個の（あるいはn次元の）確率変数であると考えられます。そうして得られたn個の確率変数は独立であり、１つ１つは同じくじ引きの結果ですから全て母集団と同じ分布に従います。

この様に独立で同じ分布に従う確率変数のファミリーは今後略してi.i.d. （independent and identically distributed）であると言います。

定義7.1.1 母集団と同じ分布に従うi.i.d.なn個の確率変数のファミリーを、この

母集団からとった大きさnの標本と呼びます。

この講義では、一貫して復元抽出の結果の総体を表す確率変数を『標本』と呼び、実際の抽出によって得られる具体的な数値の事を『サンプル』と呼んで区別する事にします。具体的なサンプルは標本と云う確率変数の１つの実現値です。

定義 7.1.2 母集団Xからとった大きさnの標本X1, . . . , Xnに対して、

X¯ = X1+· · ·+Xn

n

で定まる確率変数X¯ を、この母集団からとった大きさnの標本平均と言います。

確率変数である標本平均の１つの実現値は、具体的なn個のサンプルの平均値になっています。逆に言えば、実際にn個の数値をサンプルとして取り出した時にどんな数値が出るかはランダムでしたからその平均値もランダムであって、その可能性の総体を確率変数として考えたものがこの標本平均であると言えます。

母集団が平均m・分散vをもつ場合、多次元確率変数の成分の和についての知識から E[ ¯X] =m, V ar[ ¯X] = v

n

である事を既に知っています。従って標本の大きさが非常に大きければX¯ の分散は非常に小さい事になり、平均値である母平均のまわりに密集している事が分かります。つまり、非常に大きなサンプルをとれば、その平均値は母平均からそう離れた値にはならないだろうと云う事になります。

7.2 モーメントとそのgenerating function

確率変数Xの分散はX²の平均値に関連していましたが、一般に３次以上のXⁿの平均値も扱う場合があり、これらは存在するならばモーメント（積率）と呼ばれます。

例えば区間(−1,1)上の一様分布の平均値は0、分散は¹₃ ですから、１・２次のモーメントは正規分布N°

0,¹₃¢

と同じですが、これらは全く別の分布をしています。しかし、これが３次、４次と続いた場合、つまり、任意の次数のモーメントが等しいような場合には実は２つの確率変数は同じ分布に従うことが知られています。

指数関数e^xのTaylor展開を使えば E[e^tX] =E

∑

1 +tX+ 1

2!t²X²+· · ·

∏

= 1 +tE[X] + 1

2!t²E[X²] +· · · (7.1) ですから、展開式の係数が丁度モーメントになっている（階乗は除く）事が分かります。ただしモーメントは存在しない事もありますし、期待値E[e^tX]が存在しない事もあります。

このE£ e^tX§

の事を（もちろん存在する場合に限りますが）Xの積率母関数（moment generating function）と呼び、この講義では多くの場合記号MX(t)で表します。

２つの確率変数があってmoment generating functionが等しければ全てのモーメントも等しい事が分かりますから、その場合は確率変数同士が同じ分布に従う事が言えます。

(2)

Revised at 12:02, November 16, 2016 統計学第7回 http://my.reset.jp/˜gok/math/statistics/ 2 独立な確率変数X, Y の和のmoment generating functionを計算してみると、e^tX と

e^tY も独立ですから MX+Y(t) =Eh

e^t(X+Y⁾i

=E£ e^tXe^tY§

=E£ e^tX§

E£ e^tY§

=MX(t)MY(t) となってそれぞれのmoment generating functionの積になります。

また、W のmoment generating functionがMW(t)であるとき、その定数倍aW の moment generating functionMaW(t)は

MaW(t) =E[e^t(aW)] =E[e^(at)W] =MW(at) となる事も注意しておきます。

例えば標準正規分布に従う確率変数Xのmoment generating functionは、簡単な計算により

MX(t) =E[e^tX]

= Z ₁

−1

e^tx 1

√2πe⁻¹²^x²dx

= Z ₁

−1

√1

2πe⁻¹²^x²^+txdx

= Z ₁

−1

√1

2πe⁻¹²^{^(x⁻^t)²⁻^t²^}dx

= e¹²^t² Z ₁

−1

√1

2πe⁻¹²^(x⁻^t)²dx

= e¹²^t² Z ₁

−1

√1

2πe⁻¹²^y²dy

= e¹²^t² となる事が分かります。

もちろん各次数のモーメントを計算して展開式を求める事によって計算する事も出来ます。

7.3 the central limit theorem

平均m・分散v >0である母集団Xからとった大きさnの標本X1, . . . , Xnを考えます。このとき標本平均X¯はnを大きくすれば母平均m付近に密集する事を先に見ましたが、このときの誤差、つまりX¯ −mの分布はどうなっているでしょうか。

X¯−m= X1+· · ·+Xn−nm

n =(X1−m) +· · ·+ (Xn−m) n

は平均値0、分散 ^v

n をもちますから、これを標準化した（つまり標準偏差p_v

n で割った）ものであるZn= ^(X¹⁻^m)+√^···nv^+(Xⁿ⁻^m)について調べてみましょう。

まず

Zn =

X1√−m

v +· · ·+^Xⁿ^√⁻_v^m

√n

である事に注意します。すると分子のYj = ^X^j√⁻v^m はXj を標準化したものであって、

それぞれ平均値0、分散1ですからそのmoment generating functionMYj(t)のべき級数展開は

MYj(t) = 1 + 1

2t²+（３次以上の項）

です。従ってそれらの独立和である分子Y1+· · ·+Yn =^X¹√⁻v^m+· · ·+^Xⁿ√⁻v^mのmoment generating functionM(t)は

M(t) = Ω

1 + 1

2t²+（３次以上の項）

æn

になりますから、標準化された確率変数Znのmoment generating functionMZn(t)は、

先に見た定数倍とmoment generating functionの関係から、

MZn(t) = Ω

M µ t

√n

∂æn

= Ω

1 + 1 2nt²+

µ t

√n の３次以上の項

∂æn

と書ける事が分かります。

ここで定数項以外の部分をRと書くことにして対数をとれば、nが十分大きいとき nを分母に含むRの部分は|R|<1ですからlog(1 +R)のTaylor展開式から

logMZn(t) =nlog(1 +R)

=n µ

R−1 2R²+1

3R³− · · ·

∂

=nR−1

2nR²+1

3nR³− · · ·

(3)

Revised at 12:02, November 16, 2016 統計学第7回 http://my.reset.jp/˜gok/math/statistics/ 3 となります。

するとまず nR=n

Ω 1 2nt²+

µ t

√nの３次以上の項

∂æ

= 1 2t²+

µ 1

√nの１次以上の項

∂

ですからここでn→ 1の極限をとれば limnR= 1

2t² となります。また、

nR²=n Ω 1

2nt²+ µ t

√nの３次以上の項

∂æ2

= µ1

nの１次以上の項

∂

なのでこちらは極限をとると０である事が分かります。nR³等、これ以上のべきは全て同様に０に収束しますから、結局のところ

nlim→1logMZn(t) = 1 2t² であり、従って

nlim→1MZn(t) = e¹²^t²

が得られることになります。これは標準正規分布のmoment generating functionに一致しており、従ってZnはnが大きい時には標準正規分布で近似される事が分かります。

これはX¯−mを標準化したものでしたから、p_v

n 倍すれば元に戻って rv

n

X1+· · ·+Xn−nm

√nv =X1+· · ·+Xn

n −m= ¯X−m X¯−mは平均0、分散 ^v

nの正規分布で近似されます。

この様に、母集団がどんな分布に従っていようとも（ただしモーメントは存在しなければなりませんが）十分大きな標本サイズをとれば標本平均と母平均の差はほぼ正規分布になっていると云う事が分かりました。

これにmを加えれば標本平均自身の分布と考えられますので今後はこの形で運用して行く事が多いでしょう（中心極限定理と呼ばれています）。

今日はモーメントを使って証明しましたが、平均値と分散さえ存在すれば（つまり２次までのモーメントさえ存在すれば）同様の事実が成り立つ事が知られています。

定理 7.3.1 (the central limit theorem) 平均m、分散v 6= 0である母集団X からとった大きさnの標本平均X¯ はnが十分大きい時には正規分布N°

m,^v_n¢ で近似されます。

7.4 母集団が正規分布であった場合

前回見たように、独立な２つの標準正規分布の和はまた正規分布N(0,2)に従いました。同様に計算すると、独立な正規分布N(0, t)がn個あった場合、その和は正規分布 N(0, nt)に従う事になります。

また、平均が０でないn個の独立な正規分布N(m, t)の和については X1+· · ·+Xn= (X1−m) +· · ·+ (Xn−m) +nm

から平均nm、分散ntの正規分布に従う事が分かり、次の結果が得られます：

定理7.4.1 独立な確率変数X1, . . . , Xnは全て平均値m、分散t >0の正規分布に従うものと仮定します。

このとき^X¹⁺^···^+Xⁿ

n は正規分布N° m,_n^t¢

に従います。

袋の中に正規分布N(m, t)が入っているとし、この袋からn回復元抽出した結果を X1, . . . , Xnとしましょう。このとき各Xjは全て同じ分布N(m, t)に従い、独立です。

つまりX1, . . . , Xnは上の定理の仮定を満たしていますからその主張が成り立ち、n が十分大きければn回の復元抽出の結果の平均値はmのごく近くに密集する事になります。

この結果を標本平均と云う言葉を使って表現すると

定理7.4.2 N(m, v)に従う母集団X からとった大きさnの標本平均X¯ は正規分布N°

m,_n^v¢に従います。

(4)

Revised at 12:02, November 16, 2016 統計学第7回 http://my.reset.jp/˜gok/math/statistics/ 4 となりますが、これを中心極限定理と比べてみましょう。

すると標本平均と云うものは標本数が十分大きければ、母集団がどんな分布であったとしても母集団が正規分布であった場合と（ほぼ）同じ分布をしていることが分かるはずです。統計学では正規分布が重要である、あるいは、至る所に正規分布が現れると言われる所以です。

確かに中心極限定理の結果が示しているものは近似値であるわけですが、実際に計算する時はその近似値を使って計算するわけですから、計算上は全く同じ計算になってしまうと云う事なのです。

多くの場合標本のサイズが５０以上であればこの中心極限定理を適用して差し支えないとされています。

7.5 問題演習

基本演習7.1 標準正規分布に従う確率変数Xのモーメントを、定義に従った計算：

E[Xⁿ] = Z ₁

−1

xⁿ 1

√2πe⁻^x²²dx

によって計算して下さい。まず奇数次のモーメントが０である事を示し、偶数次については漸化式を求めると良いでしょう。

基本演習7.2 関数：

f(x) =





e⁻^x 0≤x 0 otherwise

を密度関数とする確率変数Xのモーメントを計算して下さい。

基本演習7.3 区間[−1,1]上の一様分布のモーメントを求めて下さい。

発展演習7.4 密度関数がh(x) = ¹₂e^−|^x^|であるような確率変数Xに対してmoment generating functionを求めて下さい。