正規分布 (normal distribution) - 数理統計学Iノート

98 A ^{代表的な確率分布}

p(x) = 1

√2πσ²e⁻^(x−µ)2^2σ²

x p(x)

µ +1 +2 +3

−1

−2

−3

σ= 1 σ= 2

σ= 0.5

Φ(z) =

∫ z

−∞

√1 2πe⁻^x

2 2 dx

1−Φ(z) = Φ(−z)

z p(x)

0 z

図15:（左）正規分布の密度関数． x軸とy軸のスケール比は1 : 3.（右）標準正規分布の分布関数のイメージ．灰色部分の面積がΦ(z)で斜線部分の面積が Φ(−z).

中心極限定理から，任意の i.i.d. {Xk} ^に対して Xn はn が十分大きければほぼ正規分布に従う．

X_n = 1

n(X₁+X₂+· · ·+X_n)なので，nが大きいとき個々の X_k の影響は小さいが，代わりに多数加算されていることになる．従って，独立で小さな確率的要因が多数足し合わされた結果として現れる ような量は正規分布に従うと考えられる．生物の身長・体重，実験の誤差などはその典型である．試験 の成績なども均一な集団であれば正規分布に従うとされることもあるが，人的要素の加わるものは正規 分布に従わないことも多いので状況次第である^*46．

定義 A.13 (正規分布). σ >0とµを定数とする．確率変数X の密度関数が p(x) = 1

√2πσ²e⁻^(x−µ)2^2σ²

で与えられるとき，X は平均µ,分散σ²の正規分布 (normal distribution) あるいはガウス 分布(Gaussian distribution) に従うといい，X ∼N(µ, σ²)などと書く．特にN(0,1)のことを標準正規分布 (standard normal distribution) という．値域は全実数(−∞,+∞)で上限も下限もない．

密度関数の式は一見すると複雑だが，グラフの概形は図15のようになっていて， x=µで対称な釣鐘状の「the確率分布」という形をしているので，正規分布を知らなくても馴染はあるだろう．

定義に書いてある通り次の命題が成り立つ．

命題A.14 (正規分布の期待値と分散). X ∼N(µ, σ²)ならばE[X] =µ, V[X] =σ².

証明はともかく，結果については期待値と分散が直接パラメータ化されているのだから間違えるはずが ない．

証明.（ただの計算なので最初は飛ばして次の命題に行ってもよい．）次の等式（Gauss積分などと呼ば れる）は非常に有名なので既知とする^*47．

∫ _∞

−∞

e⁻^t²dt=√ π

両辺を√

πで割った式でt= z

√2 と変数変換（置換積分）すると t²=z²

2 ,dt= dz

√2 ^なので

1 = 1

√π

∫ _∞

−∞

e⁻^t²dt=

∫ _∞

−∞

√1 2πe⁻^z

2 2 dz.

(A.3)

*46少なくとも私は数学の試験の結果がきれいな正規分布に従っているところを見たことがない（注8.9参照）．

*47重積分を用いた導出が有名で大抵の微積の教科書には書いてあるだろう．

A.3 ^正規分布(normal distribution) 99

これはµ= 0, σ = 1のとき，つまり標準正規分布が確かに確率密度関数になっていることを示してお

り計算の基礎になる．

正規分布に関する計算では z= x−µ

σ という変数変換（これは標準化に対応している）がポイントである．x=µ+σz, dx=σdzであり，xが−∞^から∞^{に変化するとき}zも−∞^から∞^に変化する．

E[X] =

∫ _∞

−∞

√ x

2πσ²e⁻^(x−µ)2^2σ² dx=

∫ _∞

−∞

µ+σz

√2πσ²e⁻^z

2 2 σdz

=µ

∫ _∞

−∞

√1 2πe⁻^z

2 2 dz+σ

∫ _∞

−∞

√z 2πe⁻^z

2 2 dz

ここで第2項は奇関数を対称な区間で積分しているので 0 であり，第1項は式(A.3)からµ なので E[X] =µ.

分散の計算も同じ変数変換により V[X] =

∫ _∞

−∞

(x−µ)²

√2πσ² e⁻^(x−µ)2^2σ² dx=σ²

∫ _∞

−∞

z²

√2πe⁻^z

2 2 dz なので，最後の積分が1 になることを示せば V[X] =σ² の確認が終わるが， (e⁻^z

2 )^′ =−ze⁻^z

2 を

使って部分積分すると

∫ _∞

−∞

z²

√2πe⁻^z

2 2 dz=

∫ _∞

−∞

−z

√2π(−ze⁻^z

2 2)dz

= [ −z

√2πe⁻^z

2 2

]_∞

−∞

∫ _∞

−∞

√1 2πe⁻^z

2 2 dz

= 0 + 1 = 1. \(^o^)/

次の性質は正規分布に関する計算をする際の基礎になる．

補題 A.15 (正規分布の一次変換). a, bは定数とする．X ∼N(µ, σ²)ならば，Y =aX+b の分布は Y ∼N(aµ+b, a²σ²)である．従って特に，標準化した Z= X−µ

σ ^はN(0,1)に従う．

証明.（これは証明も大事．分布関数や密度関数の意味が解っているか？置換積分は正しくできるか？）

a= 0の場合は明らかなのでa >0の場合を示す．（a <0の場合も同様．）定義から P(Y ≤y) =P(aX+b≤y) =P

(

X≤ y−b a

)

∫ ^y−b_a

−∞

√ 1

2πσ²e⁻^(s−µ)2^2σ² ds=

∫ y

−∞

√ 1

2πa²σ²e⁻^{(t−aµ−b)2}^2a²^σ² dt

がわかる．ただし最後の等式ではt=as+b と変数変換（置換積分）した．これは Y の密度関数が p^Y(y) = 1

√2πa²σ²e⁻^{(y−aµ−b)2}^2a²^σ² であることに他ならず，p^Y(y)は N(aµ+b, a²σ²) の密度関数であ

る． \(^o^)/

この補題から，任意の X ∼N(µ, σ²)に対して，P(a≤X ≤b) の計算は次のようにZ ∼N(0,1) の計算に帰着できる: α= a−µ

σ , β= b−µ

σ ^とおくと

P(a≤X ≤b) =P(α≤Z≤β) =

∫ β α

√1 2πe⁻^x

2 2 dx これは，Z∼N(0,1)の分布関数を

Φ(z) =

∫ z

−∞

√1 2πe⁻^x

2 2 dx (A.4)

100 A ^{代表的な確率分布}

とすればP(a≤X≤b) = Φ(β)−Φ(α)と書ける．従ってΦ(z)の値が計算できればいいのだが，さらに，N(0,1)の密度関数は偶関数なので実際にはz≥0に対するΦ(z)さえわかればz <0での値は

Φ(z) = 1−Φ(−z) で求めればよい（図15参照）．

Φ(z)の値を手計算するのは現実的でないが，ほぼ全ての統計の教科書には正規分布表という，色々な zに対してΦ(z)の値を表にしたものが付属しているので，それを使えばよい．このノートでは121ページにある．ただし，本によって Φ(z) を表にしていたり1−Φ(z) を表にしていたり

∫ z 0

√1 2πe⁻^x

2 2 dx を表にしていたりするので確認する必要がある．以上をまとめると次のようになる．

命題 A.16 (正規分布の確率の計算). X ∼ N(µ, σ) の累積分布関数は Φ

(x−µ σ

)

であり，

P(a≤X ≤b)の値は

P(a≤X ≤b) = Φ (b−µ

σ )

−Φ

(a−µ σ

) (A.5)

で求めることができる．

注 A.17. 正規分布表の話も今は昔で，統計処理ソフトなら一般の X ∼ N(µ, σ) に対して

P(a≤X ≤b)を直接計算する命令か，あるいは少なくとも分布関数の計算命令は付属しているので，ここで書いた処理を全て手作業でやることはまずない．（検定・資格試験などでは未だに手計算のようだが．）ただ，そうは言っても，ここに書いてあることを理解しないで統計ソフトを適切に使えるとは思えない．（2・3桁の足し算や掛け算もできない人に「電卓で計算しました」と言われても信用できないだろう．）

他にも例えば，誤差関数（下記）の計算機能ならあるが正規分布はないとか，そもそも計算機を使えないときは正規分布表の見方も知らないでは話にならないとか，色々と考えればやはりここで解説している程度の手計算はできないといけないだろう．

補足 A.18 (誤差関数). erf(x) = 1

√π

∫ x

−x

e⁻^t²dt = 2

√π

∫ x 0

e⁻^t²dt で定義される関数を誤 差関数 (error function) といい，erfc(x) = 1−erf(x) = 2

√π

∫ x

∞

e⁻^t²dt を相補誤差関数 (complementary error function) という．

標準正規分布の累積分布関数Φ(x)との間には Φ(x) = 1

2 (

1 + erf ( x

√2 ))

, erf(x) = 2Φ(√ 2x)−1

という関係があり本質的には同じものだが，分野によっては誤差関数が使われることもあるので知っておいて損はない．

問題A.19 ([6]から引用). Z∼N(0,1)のとき，次の値を求めよ．

(a)P(Z <1) (b)P(Z <1.24) (c)P(Z <−0.5) (d)P(−1< Z <0.5) (e)P(1.51< Z <2.16) (f)P(−1.64< Z <−0.8)

【解説】正規分布表を使う（関数電卓やPCでもいいけど）． (a)P(Z <1) = Φ(1) = 0.8413.

(b)P(Z <1.24) = Φ(1.24) = 0.8925.

A.3 ^正規分布(normal distribution) 101 (c)P(Z <−0.5) = Φ(−0.5) = 1−Φ(0.5) = 1−0.6915 = 0.3085.

(d)P(−1< Z <0.5) = Φ(0.5)−Φ(−1) = Φ(0.5)−(1−Φ(1)) = 0.6915−(1−0.8413) = 0.5328.

(e)P(1.51< Z <2.16)Φ(2.16)−Φ(1.51) = 0.9846−0.9345 = 0.0501.

(f)P(−1.64< Z <−0.8) = Φ(−0.8)−Φ(−1.64) = (1−Φ(0.8))−(1−Φ(1.64)) = Φ(1.64)− Φ(0.8) = 0.9495−0.7881 = 0.1614.（分布の対称性からP(−1.64< Z <−0.8) =P(0.8< Z <

1.64) =· · · ^{としてもよい．}^） \(^o^)/

問題A.20 ([6]から引用). X ∼N(10,2²)のとき，次の値を求めよ．

(a)P(X <13) (b)P(X >11) (c)P(X >8) (d)P(X <7) (e)P(9< X <12) (f)P(7.8< X <9.6)

【解説】標準化して正規分布表．Z =X−10

2 ∼N(0,1)である．

(a)P(X <13) =P (

Z < 13−10 2

)

=P(Z <1.5) = Φ(1.5) = 0.9332.

(b) P(X > 11) = P (

Z > 11−10 2

)

= P(Z > 0.5) = 1−P(Z < 0.5) = 1−Φ(0.5) = 1−0.6915 = 0.3085.

(c)P(X >8) =P (

Z > 8−10 2

)

=P(Z >−1) = 1−P(Z <−1) = 1−(1−Φ(1)) = 0.8413.

(d) P(X <7) = P (

Z < 7−10 2

)

=P(Z <−1.5) = Φ(−1.5) = 1−Φ(1.5) = 1−0.9332 = 0.0668.

(e) P(9 < X < 12) = P

(9−10

2 Z < 12−10 2

)

= P(−0.5 < Z < 1) = Φ(1)−Φ(−0.5) = 0.8413−(1−0.6915) = 0.5328.

(f)P(7.8< X < 9.6) =P

(7.8−10

2 Z < 9.6−10 2

)

=P(−1.1< Z <−0.2) =P(0.2< Z <

1.1) = Φ(1.1)−Φ(0.2) = 0.8643−0.5793 = 0.2850. \(^o^)/

二項分布の定義に現れた(A.1) Sn=

∑n k=1

Xk∼B(n, θ)と試行平均にはXn = 1

nSn という関係があるので，中心極限定理（定理5.17）に代入すれば

lim

n→∞P (

a≤ S_n−nθ

√nθ(1−θ) ≤b )

∫ b a

√1 2πe⁻^x

2 2 dx となり，次のことがわかる．

命題A.21 (二項分布の正規近似). S∼B(n, θ)でnが十分大きいとき

P(k≤S ≤k^′)≈Φ (

k^′−nθ

√nθ(1−θ) )

−Φ (

k−nθ

√nθ(1−θ) )

この事実はしばしば，次のようにも表現される．B(n, θ) は n が十分大きいとき，同じ平均と分散を 持つ正規分布N(nθ, nθ(1−θ)) で近似できる．（だからこそ(A.5)と全く同様の式で確率を計算できる．）nがどれくらい大きければよいかの目安としてよく言われるのは nθ >5 かつn(1−θ)>5 だが^*48，どうしても手計算が必要なとき以外にこの近似が必要になることはないだろう．

例 A.22. 問題 A.10では，n= 400, θ= 1/2 なので正規近似の要件を満たすと考えられる．そ

*48自分で検証したことはないので一回やらないといけないなぁと思ってはいる．

102 A ^{代表的な確率分布}

こで実際に正規近似で計算してみると，nθ= 200, nθ(1−θ) = 100 なので P(180≤X ≤220)≈Φ

(220−200

√100 )

−Φ

(180−200

√100 )

= Φ(2)−Φ(−2)≈0.954 となり，二項分布で計算した結果0.9598とほぼ一致する．

二項分布は再生性を持つので，その極限でもある正規分布が再生性を持っても不思議はない．

定理 A.23 (正規分布の再生性). X, Y が独立で X ∼ N(µ1, σ²₁), Y ∼ N(µ2, σ₂²) のとき，

X+Y ∼N(µ1+µ2, σ1+σ2)が成り立つ．（証明略）

これから，正規母集団からの標本平均について次のことが成り立つ．

系 A.24. i.i.d. X_k ∼N(µ, σ²)の標本平均はX_n ∼N(µ, σ²/n).

次の性質は，他の箇所で使うのでここで証明しておく．一般に確率変数 X に対してE[Xⁿ]をn 次モーメントといい，以下はN(0,1)のモーメントを求めていることになる．

命題A.25. Z∼N(0,1) に対して

E[Zⁿ] = {

0 nが奇数のとき (n−1)!! nが偶数のとき

ただし(n−1)!! = (n−1)(n−3)× · · · ×3×1. 特に，E[Z²] = 1, E[Z⁴] = 3である．

証明. p(x)をN(0,1) の密度関数，つまりp(x) = 1

√2πe⁻^x

2 とすれば，p(x)は偶関数で d dxp(x) =

−xp(x)である．

nが奇数のとき，E[Zⁿ] =

∫ _∞

−∞

xⁿp(x)dxは奇関数の原点対称区間における積分なのでE[Zⁿ] = 0.

nが偶数のとき，部分積分により E[Zⁿ] =

∫ _∞

−∞

xⁿ⁻¹·xp(x)dx

xⁿ⁻¹·(−p(x))]_∞

−∞+ (n−1)

∫ _∞

−∞

xⁿ⁻²p(x)dx

= (n−1)E[Zⁿ⁻²] = (n−1)(n−3)E[Zⁿ⁻⁴]

=· · ·= (n−1)(n−3)× · · · ×3×1×E[Z⁰] = (n−1)!!

\(^o^)/

ドキュメント内数理統計学Iノート (ページ 97-102)