• 検索結果がありません。

正規分布 経済統計 鹿野研究室

N/A
N/A
Protected

Academic year: 2018

シェア "正規分布 経済統計 鹿野研究室"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

担当:鹿野(大阪府立大学)

2014 年度前期

はじめに

前回の復習

 一様分布。

 指数分布:ポアソン分布との関係。

今回学ぶこと

 正規分布。

 標準正規分布。

 テキスト該当箇所:6.6章。

1 正規分布

1.1

正規分布:最も重要な確率分布

 正規分布:実数をとる連続型確率変数Xの密度関数が

f (x) = 1 2πσe

−(x−µ)2

2σ2 , −∞ ≤ x ≤ ∞ (−∞ ≤ µ ≤ ∞, σ >0) (1)

のとき、f (x)を (normal distribution)と呼び、 と略記。

⊲ µ(ミュー)σ(シグマ)はパラメータ。e = 2.718...は自然対数の底。

注意:eのべき乗eaで、aの部分が複雑な場合、ea= exp(a)と表記。例えば上式は f (x) = 1

2πσexp

−(x − µ)22



. (2)

 正規分布N(µ, σ2)の期待値・分散:X ∼ N(µ, σ2)ならば、期待値・分散は

E(X) = , Var(X) = . (3)

∴二つのパラメータµσ2がそのまま期待値・分散に。

⊲ 証明:岩田暁一『経済分析のための統計的方法(第2版)』のp105∼107参照。

1

(2)

−10 −5 0 5 10 15 20

0.00.10.20.30.4

x

f(x)

N(−3, 1.52)

N(5, 22)

N(15, 12)

1:正規分布N(−3, 1.52)N(5, 22)N(15, 12)

 Remark:正規分布N(µ, σ2)のパラメータµσ2と、分布の形状(図1

期待値E(X) = µを軸に左右対称で、つりがね型。全く左右の が無い。

E(X) = µが大きい分布の重心が に。

Var(X) = σ2が大きい分布が左右に

 N(µ, σ2)の具体例:正規分布で近似できる現象は、非常に多い。(特に や

。)∴統計的推測(この講義の後半)では、母集団の分布として正規分布を仮定。

⊲ 生物計測:人間の身長や昆虫の体長など。

⊲ 誤差・ノイズ:製品重量の規格からの誤差など。

⊲ データに適当な変換を施すと、正規分布になるケースも多い。(例:家計所得や消費 支出額のデータを 近似的に正規分布。)

 例:日経平均株価の日次上昇率、2010401∼930日(X)、2011401

∼930日(YYahooファイナンス」より。各年123日分。

分布をX ∼ N(µX, σ2X)Y ∼ N(µY, σ2Y)でモデル化。

⊲ 2010年データ:平均X = −0.064¯ → ˆµX)、分散s2X = 0.420→ ˆσ2X)

⊲ 2011年データ:平均Y = −0.039¯ → ˆµY)、分散s2Y = 0.267→ ˆσ2Y)

2X ∼ N(−0.064, 0.420)Y ∼ N(−0.039, 0.267)を図示し、それぞれデータのヒス トグラムと比較。両年とも、正規分布がデータの分布をうまく近似。

1.2

正規分布の重要な性質

 確率の対称性:N(µ, σ2)は、期待値E(X) = µを中心に左右対称。定数cについて、

= . (4)

∴左辺or右辺どちらかの確率で、もう一方が分かる。左右対称な確率分布に共通する性質。

特にPr(X < µ) = Pr(X > µ) =

(3)

−2 −1 0 1 2

0.00.20.40.60.8

−2 −1 0 1 2

0.00.20.40.60.8

A: 1 Apr − 30 Oct, 2010

stock growth rate (%)

f(x)

−2 −1 0 1 2

0.00.20.40.60.8

−2 −1 0 1 2

0.00.20.40.60.8

B: 1 Apr − 30 Oct, 2011

stock growth rate (%)

f(y)

2:日経平均株価の上昇率(%、縦棒はヒストグラム)

 正規分布の一次変換の分布:X ∼ N(µ, σ2)ならば、その一次式Y = a + bXの分布は、 X ∼ N(µ, σ2) −−−−−−−−−−−−→変換Y = a + bX Y ∼ . (5)

Yの分布型は、正規分布(左右対称・つりがね型)のまま。ただし

期待値E(X) = µ → E(Y) = に置換。

分散Var(X) = σ2→ Var(Y) = に置換。

証明:岩田(前述)のp105∼107と同様の方法で確認できる。

 Remark:一次式の期待値・分散の公式(講義ノート#08)より、一次変換の期待値・分

散は一般にE(Y) = a + bE(X)Var(Y) = b2Var(X)... X ∼ N(µ, σ2)に限らず成立。

一方、一次変換後のYの分布が、常に元のXの分布と同じである保障はない。∴(5) 式(分布型の保持)は、一部の確率分布だけで成立する特殊な性質。

例:X ∼ Bin(n, p)のとき、Xの一次式Y = 3 − 2Xは二項分布に Y ∼ ?

2 標準正規分布

2.1

標準正規分布:正規分布の標準化

 標準正規分布:µ= 0σ2= 1の特殊な正規分布N(0, 1)を、 と呼ぶ。

任意の正規分布X ∼ N(µ, σ2)を標準化(講義ノート#08)し、変形すると Z = X − E(X)

Var(X) = X − µ

σ = −

µ σ +

1

σX. (6)

a = −σµb = 1

σ と置けば、(5)式の性質からZは正規分布に。

Z ∼ N



µ σ +

1 σµ,

1 σ2σ

2



整理

−−−→ Z ∼ N(0, 1). (7)

(4)

−3 −2 −1 0 1 2 3

0.00.10.20.30.4

z

φ(z)

A: Z ~ N(0,1)

0.00.10.20.30.4

z

φ(z)

0 z=1 Pr(Z>1) 1−Φ=0.159 Pr(Z<1)

Φ=0.841

B: Pr(Z>1)=1−Φ(1)=0.159

3:標準正規分布Z ∼ N(0, 1)と確率Pr(Z > z) = 1 − Φ(z)

⊲ ∴Z ∼ N(0, 1)は、元のX ∼ N(µ, σ2)の標準化で得られる。

 Z ∼ N(0, 1)の密度関数と累積分布:µ= 1σ2= 1(1)式に代入→ Zの密度関数は

= 1e

−z2

2 = 1

√2πexp

−z2 2



. (8)

Z ∼ N(0, 1)の密度関数に限り、fではなくφ(小文字のファイ)で表す伝統。

Zがある値z以下になる確率Pr(Z ≤ z)は、累積分布関数(講義ノート#10

= Pr(Z ≤ z) =

 z

φ(w)dw (9)

から得る。(Φ =大文字のファイ。)∴記号φΦを見たら、Z ∼ N(0, 1)

⊲ この積分は手計算ではムリ!後述の正規分布表(orパソコン)で計算。

 正規分布表:標準正規分布Z ∼ N(0, 1)の、さまざまなzに対する次の確率

Pr(Z > z) = 1 − Pr(Z ≤ z) = (10)

をまとめた表を、正規分布表と呼ぶ。今回配布の表(簡略版)参照。

3Bの右端斜線部の面積。この例ではz = 1Pr(Z > 1) = 0.159

より細かい確率テキストp280参照。

 RemarkPr(a < Z < b)の確率をグラフの面積(図4)で考えると Pr(a < Z < b) = Φ(b) − Φ(a) = Pr(Z < b)

 

斜線部R

− Pr(Z < a)

 

斜線部Q

(11)

で得られる。⇒ Zの確率計算で、覚えておくと便利。

⊲ 確率の計算で混乱したら、図4のような略図を描いて面積の確認すると良い。

⊲ 正規分布以外の確率にも使える!

(5)

0.00.10.20.30.4

z

φ(z)

a 0

Q

0.00.10.20.30.4

z

φ(z)

0 b

R

0.00.10.20.30.4

z

φ(z)

a 0 b

R−Q

4: Pr(a < Z < b) = Pr(Z < b) − Pr(Z < a) = Φ(b) − Φ(a)

 例:Pr(0 < Z < 1)はいくら?

分布表を使うとPr(Z < 1) = = 1 − 0.159 = 0.841Pr(Z < 0) = 0.5 (11)式より

Pr(0 < Z < 1) = Pr(Z < 1) − Pr(Z < 0) = 0.841 − 0.5 = . (12)

 RemarkZ ∼ N(0, 1)2を超える、−2を下回る確率は、分布表から

Pr(Z > 2) = Pr(Z < −2) = . (13)

... 2.5%にも満たない。Zのスケール」で考える→ ±2より外れた実現値は、めったに

出ることのない な値。

3Aを再度確認⇒ Zの密度関数φ(z)は、 ぐらいの区間をカバー。

±2を超える両端の面積(確率)は、無視できるほど小さい。

⊲ 一方、標準化しない正規分布X ∼ N(µ, σ2)は、スケール感が不明。 2.2

正規分布の確率

 Xの確率とZの確率の対応関係:Z = X−µ

σ σ >0に注意すると、

Pr(a < X < b) = Pr a − µ σ <

X − µ σ <

b − µ σ



 

全部標準化!

= , (14)

ここで

a = a − µ σ ,

 

下限a の標準化

Z = X − µ σ ,

 

X ∼ N(µ, σ2) の標準化

b= b − µ

 σ

上限b の標準化

. (15)

Z ∼ N(0, 1)の確率から、一般的な正規分布X ∼ N(µ, σ2)の確率が得られる。

Xの標準化に合わせて、範囲 も に標準化するのがポイント。

Xの確率をZのスケールで表現したのが、(14)式右辺。

(6)

 Remark:正規分布表によるZの確率計算と、上の対応関係をうまく使えば、一般的な正 規分布X ∼ N(µ, σ2)の確率計算が可能。

ただし の値が分からないとムリ。(コレが無いと標準化できない。)

 例:X ∼ N(4, 22)のとき、確率Pr(X > 1)Pr(2 < X < 5)はいくら?

Pr(X > 1) → Z = X−42 のスケールに換算(標準化)。 Pr(X > 1) = Pr X − 4

2 > 1 − 4

2



= . (16)

分布表からPr(Z ≤ −1.5) = Pr(Z > 1.5) = 0.067なので

Pr(X > 1) = Pr(Z > −1.5) = = 0.933. (17)

Pr(2 < X < 5) → Z = X−42 のスケールに換算(標準化)。 Pr(2 < X < 5) = Pr 2 − 4

2 < X − 4

2 < 5 − 4

2



= . (18)

分布表からPr(Z < −1) = Pr(Z > 1) = 0.159Pr(Z < 0.5) = 1 − Pr(Z > 0.5) = 1 − 0.309 = 0.691 ⇒ (11)式より

Pr(2 < X < 5) = Pr(−1 < Z < 0.5)

=

= 0.691 − 0.159 = 0.532. (19)

まとめと復習問題

今回のまとめ

 正規分布X ∼ N(µ, σ2)

 標準正規分布Z ∼ N(0, 1)X ∼ N(µ, σ2)の確率計算に利用。

復習問題

出席確認用紙に解答し(用紙裏面を用いても良い)、退出時に提出せよ。 1. X ∼ N(−5, 32)ならば、Pr(X > −5) =__。(積分不要。分布表不要。)

2. 次の確率を、今回配布した正規分布表を利用して求めよ。(計算結果のみ解答。) (a) Pr(Z > −1.2) =__。

(b) Pr(−1.2 < Z < 1.5) =__。

3. X ∼ N(2, 12)とする。次の確率を求めよ。(計算結果のみ解答。)

(a) Pr(X < 4.3) =__。 (b) Pr(1 < X < 3) =__。

参照

関連したドキュメント

1880 年代から 1970 年代にかけて、アメリカの

1880 年代から 1970 年代にかけて、アメリカの

中国の農地賃貸市場の形成とその課題 (特集 中国 の都市と産業集積 ‑‑ 長江デルタで何が起きている か).

 ティモール戦士協会‑ティモール人民党 Kota/PPT 1974 保守・伝統主義  2  ティモール抵抗民主民族統一党 Undertim 2005 中道右派  2.

2006 年 6 月号から台湾以外のデータ源をIMF のInternational Financial Statistics に統一しました。ADB のKey Indicators of Developing Asian and Pacific

著者 研究支援部研究情報システム課.

[r]

著者 研究支援部研究情報システム課.