担当:鹿野(大阪府立大学)
2014 年度前期
はじめに
前回の復習
一様分布。
指数分布:ポアソン分布との関係。
今回学ぶこと
正規分布。
標準正規分布。
テキスト該当箇所:6.6章。
1 正規分布
1.1
正規分布:最も重要な確率分布
正規分布:実数をとる連続型確率変数Xの密度関数が
f (x) = √1 2πσe
−(x−µ)2
2σ2 , −∞ ≤ x ≤ ∞ (−∞ ≤ µ ≤ ∞, σ >0) (1)
のとき、f (x)を (normal distribution)と呼び、 と略記。
⊲ µ(ミュー)、σ(シグマ)はパラメータ。e = 2.718...は自然対数の底。
⊲ 注意:eのべき乗eaで、aの部分が複雑な場合、ea= exp(a)と表記。例えば上式は f (x) = √1
2πσexp
−(x − µ)2 2σ2
. (2)
正規分布N(µ, σ2)の期待値・分散:X ∼ N(µ, σ2)ならば、期待値・分散は
E(X) = , Var(X) = . (3)
∴二つのパラメータµ、σ2がそのまま期待値・分散に。
⊲ 証明:岩田暁一『経済分析のための統計的方法(第2版)』のp105∼107参照。
1
−10 −5 0 5 10 15 20
0.00.10.20.30.4
x
f(x)
N(−3, 1.52)
N(5, 22)
N(15, 12)
図1:正規分布N(−3, 1.52)、N(5, 22)、N(15, 12)
Remark:正規分布N(µ, σ2)のパラメータµ、σ2と、分布の形状(図1)
⊲ 期待値E(X) = µを軸に左右対称で、つりがね型。全く左右の が無い。
⊲ E(X) = µが大きい⇔分布の重心が に。
⊲ Var(X) = σ2が大きい⇔分布が左右に 。
N(µ, σ2)の具体例:正規分布で近似できる現象は、非常に多い。(特に や
。)∴統計的推測(この講義の後半)では、母集団の分布として正規分布を仮定。
⊲ 生物計測:人間の身長や昆虫の体長など。
⊲ 誤差・ノイズ:製品重量の規格からの誤差など。
⊲ データに適当な変換を施すと、正規分布になるケースも多い。(例:家計所得や消費 支出額のデータを →近似的に正規分布。)
例:日経平均株価の日次上昇率、2010年4月01日∼9月30日(X)、2011年4月01日
∼9月30日(Y)。「Yahooファイナンス」より。各年123日分。
⊲ 分布をX ∼ N(µX, σ2X)、Y ∼ N(µY, σ2Y)でモデル化。
⊲ 2010年データ:平均X = −0.064¯ (→ ˆµX)、分散s2X = 0.420(→ ˆσ2X)。
⊲ 2011年データ:平均Y = −0.039¯ (→ ˆµY)、分散s2Y = 0.267(→ ˆσ2Y)。
⊲ 図2:X ∼ N(−0.064, 0.420)、Y ∼ N(−0.039, 0.267)を図示し、それぞれデータのヒス トグラムと比較。⇒両年とも、正規分布がデータの分布をうまく近似。
1.2
正規分布の重要な性質
確率の対称性:N(µ, σ2)は、期待値E(X) = µを中心に左右対称。⇒定数cについて、
= . (4)
∴左辺or右辺どちらかの確率で、もう一方が分かる。左右対称な確率分布に共通する性質。
⊲ 特にPr(X < µ) = Pr(X > µ) = 。
−2 −1 0 1 2
0.00.20.40.60.8
−2 −1 0 1 2
0.00.20.40.60.8
A: 1 Apr − 30 Oct, 2010
stock growth rate (%)
f(x)
−2 −1 0 1 2
0.00.20.40.60.8
−2 −1 0 1 2
0.00.20.40.60.8
B: 1 Apr − 30 Oct, 2011
stock growth rate (%)
f(y)
図2:日経平均株価の上昇率(%、縦棒はヒストグラム)
正規分布の一次変換の分布:X ∼ N(µ, σ2)ならば、その一次式Y = a + bXの分布は、 X ∼ N(µ, σ2) −−−−−−−−−−−−→変換Y = a + bX Y ∼ . (5)
∴Yの分布型は、正規分布(左右対称・つりがね型)のまま。ただし
⊲ 期待値E(X) = µ → E(Y) = に置換。
⊲ 分散Var(X) = σ2→ Var(Y) = に置換。
⊲ 証明:岩田(前述)のp105∼107と同様の方法で確認できる。
Remark:一次式の期待値・分散の公式(講義ノート#08)より、一次変換の期待値・分
散は一般にE(Y) = a + bE(X)、Var(Y) = b2Var(X)。... X ∼ N(µ, σ2)に限らず成立。
⊲ 一方、一次変換後のYの分布が、常に元のXの分布と同じである保障はない。∴(5) 式(分布型の保持)は、一部の確率分布だけで成立する特殊な性質。
⊲ 例:X ∼ Bin(n, p)のとき、Xの一次式Y = 3 − 2Xは二項分布に 。Y ∼ ?
2 標準正規分布
2.1
標準正規分布:正規分布の標準化
標準正規分布:µ= 0、σ2= 1の特殊な正規分布N(0, 1)を、 と呼ぶ。
⊲ 任意の正規分布X ∼ N(µ, σ2)を標準化(講義ノート#08)し、変形すると Z = X − E(X)√
Var(X) = X − µ
σ = −
µ σ +
1
σX. (6)
a = −σµ、b = 1
σ と置けば、(5)式の性質からZは正規分布に。
Z ∼ N
−µ σ +
1 σµ,
1 σ2σ
2
整理
−−−→ Z ∼ N(0, 1). (7)
−3 −2 −1 0 1 2 3
0.00.10.20.30.4
z
φ(z)
A: Z ~ N(0,1)
0.00.10.20.30.4
z
φ(z)
0 z=1 Pr(Z>1) 1−Φ=0.159 Pr(Z<1)
Φ=0.841
B: Pr(Z>1)=1−Φ(1)=0.159
図3:標準正規分布Z ∼ N(0, 1)と確率Pr(Z > z) = 1 − Φ(z)
⊲ ∴Z ∼ N(0, 1)は、元のX ∼ N(µ, σ2)の標準化で得られる。
Z ∼ N(0, 1)の密度関数と累積分布:µ= 1、σ2= 1を(1)式に代入→ Zの密度関数は
= √1 2πe
−z2
2 = 1
√2πexp
−z2 2
. (8)
Z ∼ N(0, 1)の密度関数に限り、fではなくφ(小文字のファイ)で表す伝統。
⊲ Zがある値z以下になる確率Pr(Z ≤ z)は、累積分布関数(講義ノート#10)
= Pr(Z ≤ z) =
z
∞
φ(w)dw (9)
から得る。(Φ =大文字のファイ。)∴記号φ、Φを見たら、Z ∼ N(0, 1)。
⊲ この積分は手計算ではムリ!⇒後述の正規分布表(orパソコン)で計算。
正規分布表:標準正規分布Z ∼ N(0, 1)の、さまざまなzに対する次の確率
Pr(Z > z) = 1 − Pr(Z ≤ z) = (10)
をまとめた表を、正規分布表と呼ぶ。今回配布の表(簡略版)参照。
⊲ 図3Bの右端斜線部の面積。この例ではz = 1、Pr(Z > 1) = 0.159。
⊲ より細かい確率→テキストp280参照。
Remark:Pr(a < Z < b)の確率をグラフの面積(図4)で考えると Pr(a < Z < b) = Φ(b) − Φ(a) = Pr(Z < b)
斜線部R
− Pr(Z < a)
斜線部Q
(11)
で得られる。⇒ Zの確率計算で、覚えておくと便利。
⊲ 確率の計算で混乱したら、図4のような略図を描いて面積の確認すると良い。
⊲ 正規分布以外の確率にも使える!
0.00.10.20.30.4
z
φ(z)
a 0
Q
0.00.10.20.30.4
z
φ(z)
0 b
R
0.00.10.20.30.4
z
φ(z)
a 0 b
R−Q
図4: Pr(a < Z < b) = Pr(Z < b) − Pr(Z < a) = Φ(b) − Φ(a)
例:Pr(0 < Z < 1)はいくら?
⊲ 分布表を使うとPr(Z < 1) = = 1 − 0.159 = 0.841、Pr(Z < 0) = 0.5。 (11)式より
Pr(0 < Z < 1) = Pr(Z < 1) − Pr(Z < 0) = 0.841 − 0.5 = . (12)
Remark:Z ∼ N(0, 1)が2を超える、−2を下回る確率は、分布表から
Pr(Z > 2) = Pr(Z < −2) = . (13)
... 2.5%にも満たない。∴「Zのスケール」で考える→ ±2より外れた実現値は、めったに
出ることのない な値。
⊲ 図3Aを再度確認⇒ Zの密度関数φ(z)は、 ぐらいの区間をカバー。
∴±2を超える両端の面積(確率)は、無視できるほど小さい。
⊲ 一方、標準化しない正規分布X ∼ N(µ, σ2)は、スケール感が不明。 2.2
正規分布の確率
Xの確率とZの確率の対応関係:Z = X−µ
σ 、σ >0に注意すると、
Pr(a < X < b) = Pr a − µ σ <
X − µ σ <
b − µ σ
全部標準化!
= , (14)
ここで
a′ = a − µ σ ,
下限a の標準化
Z = X − µ σ ,
X ∼ N(µ, σ2) の標準化
b′= b − µ
σ
上限b の標準化
. (15)
∴Z ∼ N(0, 1)の確率から、一般的な正規分布X ∼ N(µ, σ2)の確率が得られる。
⊲ Xの標準化に合わせて、範囲 も に標準化するのがポイント。
⊲ Xの確率をZのスケールで表現したのが、(14)式右辺。
Remark:正規分布表によるZの確率計算と、上の対応関係をうまく使えば、一般的な正 規分布X ∼ N(µ, σ2)の確率計算が可能。
⊲ ただし 、 の値が分からないとムリ。(コレが無いと標準化できない。)
例:X ∼ N(4, 22)のとき、確率Pr(X > 1)、Pr(2 < X < 5)はいくら?
⊲ Pr(X > 1) → Z = X−42 のスケールに換算(標準化)。 Pr(X > 1) = Pr X − 4
2 > 1 − 4
2
= . (16)
分布表からPr(Z ≤ −1.5) = Pr(Z > 1.5) = 0.067なので
Pr(X > 1) = Pr(Z > −1.5) = = 0.933. (17)
⊲ Pr(2 < X < 5) → Z = X−42 のスケールに換算(標準化)。 Pr(2 < X < 5) = Pr 2 − 4
2 < X − 4
2 < 5 − 4
2
= . (18)
⊲ 分布表からPr(Z < −1) = Pr(Z > 1) = 0.159、Pr(Z < 0.5) = 1 − Pr(Z > 0.5) = 1 − 0.309 = 0.691 ⇒ (11)式より
Pr(2 < X < 5) = Pr(−1 < Z < 0.5)
=
= 0.691 − 0.159 = 0.532. (19)
まとめと復習問題
今回のまとめ
正規分布X ∼ N(µ, σ2)。
標準正規分布Z ∼ N(0, 1):X ∼ N(µ, σ2)の確率計算に利用。
復習問題
出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。 1. X ∼ N(−5, 32)ならば、Pr(X > −5) =__。(積分不要。分布表不要。)
2. 次の確率を、今回配布した正規分布表を利用して求めよ。(計算結果のみ解答。) (a) Pr(Z > −1.2) =__。
(b) Pr(−1.2 < Z < 1.5) =__。
3. X ∼ N(2, 12)とする。次の確率を求めよ。(計算結果のみ解答。)
(a) Pr(X < 4.3) =__。 (b) Pr(1 < X < 3) =__。