代表的な確率分布（離散型）経済統計鹿野研究室

(1)

担当：鹿野（大阪府立大学）

2014 年度前期

はじめに

前回の復習

確率変数の期待値（位置の尺度）。

確率変数の分散・標準偏差（散らばりの尺度）、期待値と標準偏差で標準化。

今回学ぶこと

二項分布（特殊ケース→ベルヌーイ分布）。

ポアソン分布。

テキスト該当箇所：_6.2、_6.3章。

1 ^二項分布

1.1

代表的な離散型・連続型確率分布

世の中に溢れる、ランダムな社会現象・自然現象。

⊲ 例：大阪府堺市の明日の最高気温、サッカー選手の₁試合のゴール数、就職活動開始から内定をもらうまでの日数、_etc。

⊲ に左右され変動する一方、もある。

_Remark：統計学の視点⇒これらは全て。

⊲ 確率分布 _{f (x)}に従って、実現値が発生。バラつきの中の、法則性。

⊲ ^例：_{X =}^{最高気温。確率分布} f (x)に従って（デタラメではない！）、実現値_xのバラつきが起こる。_...日々の暮らしで我々が出会うのは、この実現値のひとつ。

⊲ ∴確率分布 _{f (x)}を特定→_Xの予測（）が可能に！

代表的な確率分布：さまざまな現象の確率・頻度を近似する確率分布。

⊲ 離散型：二項分布、ポアソン分布（⇒今回）。

⊲ 連続型：一様分布、指数分布（⇒講義ノート_#10）。

⊲ 特に重要な連続型：正規分布（⇒講義ノート_#11）。

1

(2)

1.2

^{ベルヌーイ分布}

ベルヌーイ分布：実現値として_{0 or 1}いずれかの値をとる確率変数_Xの確率関数が f (x) = p^x^{(1 − p)}^1−x^, x = 0, 1, (0 ≤ p ≤ 1) (1)

のとき、これをと呼ぶ。_pは（生起確率）。

⊲ _{X = 0}、_{X = 1}の確率は、₍₁₎式より

Pr(X = 0) = f (0) = p⁰^{(1 − p)}¹ = ^, ⁽²⁾ Pr(X = 1) = f (1) = p¹^{(1 − p)}⁰ = ^. ⁽³⁾

∴成功確率_pは、_{X = 1}が出る確率_{Pr(X = 1)}のこと。

⊲ ^注意：(1)式は、次の表記でも良い。

Pr(X = x) = f (x) =

⎧⎪

⎪⎨

⎪⎪

⎩

1 − p (for x = 0)

p (for x = 1)^. ⁽⁴⁾

分岐表現を含む₍₄₎式より、₍₁₎式のほうが数学的に扱いやすい。

ベルヌーイ分布の期待値・分散：_Xがベルヌーイ確率変数ならば、期待値・分散は

E(X) = ^, Var(X) = ^. ⁽⁵⁾

∴成功確率_pがそのまま、_Xの期待値に。

⊲ _{E(X) = p}^の証明：(2)^式と(3)式、および期待値の定義（講義ノート_#08）から

E(X) = 0 · f (0) + 1 · f (1) = 0 · (1 − p) + 1 · p = p. ⁽⁶⁾

⊲ Var(X) = p(1 − p)^の証明：^⇒^{今回の復習問題。}

ベルヌーイ分布の具体例：結果がしかない確率的試行全般。結果のどちらかを便宜上₁と置く。

⊲ 受験で不合格_or合格（不合格_{= 0}、合格_{= 1}、合格確率_p）。

⊲ コイントスで裏_or表（裏_{= 0}、表_{= 1}、表の確率_{p = 0.5}）。

1.3

^二項分布

二項分布：成功確率 _pのベルヌーイ試行を独立に_n回行い、₁が出た回数を_Xと置けば、 X^{の実現値は} ^{。このとき}X^{の確率分布は}

f (x) =nCxp^x(1 − p)^n−x^, x = 0, 1, 2, . . . , n. ⁽⁷⁾

これをと呼ぶ。ここで_n_C_x ₌ ^n!

x!(n−x)!^{は組み合わせの数。}

⊲ 二つのパラメータ_p（一回当たりの成功確率）、_n（試行回数）を持つ。

⊲ _nは実現値_xの上限。∴ _Xは_nを。Pr(X > n) = 0^。

(3)

0 2 4 6 8 10

0.000.100.20

A: Bin(10,0.5)

x

Pr(X=x)=f(x) E( X) =5

0 2 4 6 8 10

0.000.100.200.30

B: Bin(10,0.8)

x Pr(X=x)=f(x) E( X) =8

0 2 4 6 8 10

0.000.100.200.30

C: Bin(5,0.2)

x

Pr(X=x)=f(x) ^{E( X) =1}

0 10 20 30 40 50

0.000.040.080.12

D: Bin(50,0.2)

x

Pr(X=x)=f(x)

E( X) =10

図_1:さまざまなパラメータ値の二項分布（_{E(X) = np}）

_Remark：₍₇₎式を書くのは面倒→二項分布に従う確率変数を、と略記

（Bin=binomial distribution^）^。

⊲ ∴^{ベルヌーイ分布は}_{n = 1}回きりの二項分布なので、X ∼ Bin(1, p)^。

⊲ 代表的な（固有名詞の）確率分布は、一般に次のように略記。

X ∼ ( , , . . .). (8)

「何分布で、パラメータの値がいくらか」が分かれば分布の描画・確率計算が可能。

二項分布_{Bin(n, p)}の期待値・分散：X ∼ Bin(n, p)ならば、期待値・分散は

E(X) = ^, Var(X) = ^. ⁽⁹⁾

∴ベルヌーイ試行一回当たりの期待値・分散₍₅₎式を倍→二項分布の期待値・分散。

⊲ 証明：テキスト_p130参照。モーメント母関数（テキスト_p102∼104）を使う。

_Remark：二項分布_{Bin(n, p)}のパラメータ_n、_pと、分布の形状（図₁）

⊲ ^図1A vs.^図1B^：n^{を固定すると、}pが大きいほど分布の重心がに。（_{p =}

で左右対称。）

⊲ ^図1C vs.^図1D^：p^固定でnを増やすと、やがて左右対称のに。

(4)

_{Bin(n, p)}の具体例：_n回繰り返されるベルヌーイ試行の、。

⊲ ^合格率p^{の試験で、}n^人中x^人（x = 0, 1, 2, . . . , n^{）合格する確率。}

⊲ 不良品の確率が_pのとき、_n個中_x個（x = 0, 1, 2, . . . , n^{）不良品が出る確率。}

⊲ ^打率 p^{の野球選手が、}n^打席中x^本（x = 0, 1, 2, . . . , n^{）ヒットを出す確率。}

例：サイコロを₂回振って、₄の目がx = 0, 1, 2^{回出る確率は？}^⇒^{コレは試行回数}n = 2^、成功確率_{p =} ¹

6^{の二項分布}^Bin

2,¹₆^。

⊲ ₍₇₎^{式で確率計算}^→₄が一回も出ない確率が、圧倒的に高い。

Pr(X = 0) = f (0) = ^2! 0!2!

1 6

0₅

6 2

= ^,

Pr(X = 1) = f (1) = ^2! 1!2!

1 6

1₅

6 1

= ^,

Pr(X = 2) = f (2) = ^2! 2!2!

1 6

2₅

6 0

= ^. (10)

2 ^{ポアソン分布}

2.1

^{ポアソン分布}

ポアソン分布：二項分布_{Bin(n, p)}について、_nが十分大きく、かつ_pが非常に小さい場合、成功回数_Xの分布は

f (x) = ^e

−λ_λx

x! ^, x = 0, 1, 2, . . . , ^{(λ > 0)} ⁽¹¹⁾

に収束。これを（Poisson distribution^{）と呼び、} ^と略記。

⊲ λ（ラムダ）はポアソン分布固有のパラメータ。e = 2.718...は自然対数の底、定数。

⊲ Bin(n, p)との共通点：回数・個数など、正の整数値をとるの分布。

⊲ _{Bin(n, p)}との相違点：試行回数_n（実現値_xの）に相当するパラメータが無

い。∴非常に大きな実現値の確率も、カバー。

ポアソン分布_Po(λ)の期待値・分散：_{X ∼ Po(λ)}ならば、、期待値・分散は

E(X) = ^, Var(X) = ^. ⁽¹²⁾

∴常に「期待値₌分散_{= λ}」という、珍しい性質。

⊲ 証明：テキスト_p130参照（モーメント母関数を使用）。

_Remark：ポアソン分布_Po(λ)のパラメータλと、分布の形状（図₂）

⊲ λ = E(X)^が大きい^⇔^{分布の重心が} ^に。

⊲ λを増やしてゆくと、やがて左右対称のに。

(5)

0 1 2 3 4 5 6

0.00.10.20.3

A: Po(1)

x

Pr(X=x)=f(x)

E( X) =1

0 2 4 6 8

0.000.100.20

B: Po(2)

x

Pr(X=x)=f(x)

E( X) =2

0 5 10 15

0.000.100.20

C: Po(4)

x

Pr(X=x)=f(x)

E( X) =4

0 20 40 60 80 100

0.000.020.04

D: Po(50)

x

Pr(X=x)=f(x)

E( X) =50

図_2:さまざまなパラメータ値のポアソン分布（_{E(X) = λ}）

_Po(λ)の具体例：試行回数はが、一回当たりの生起確率が試行の、生

起回数。

⊲ 堺市内の食中毒発生件数。

⊲ 第二京阪道路で追突事故が発生する回数。

⊲ 腎細胞で突然変異が検出される回数。

例：サッカー_Jリーグ一部（_J1）₂₀₁₂年第₁節∼第₃節、のべ₅₄チームのゴール数。

⊲ データ（サンプル数₅₄）の平均_{X = 1.116}¯ 、分散_s²_{= 1.001}、標準偏差_{s = 1.001}。

⊲ ポアソン分布の未知パラメータ_λを_{ˆλ = 1.116}と置き、ゴール数実現値x = 0, 1, 2, . . . , の確率計算。⇒データの相対度数と比較。

ポアソン確率（_%） _31.16 _36.33 _21.18 _8.23 _2.40 _0.56 データ相対度数（_%） _29.63 _35.19 _25.93 _7.41 _1.85 _0.00 x^{（ゴール数）} 0 1 2 3 4 5 ...^{ポアソン分布}Po(1.116)^は、(11)式の関数形でゴール数の分布をうまく近似！

_Remark：確率分布から確率計算をする手順。分布型₊パラメータ値→確率。

⊲ パラメータの値が未知なら、データから近似値を得る。（パラメータの。詳しくはこの講義の後半で）。例：_{λ = E(X)}が未知→データの平均値_{X = 1.116}¯ で代用。

⊲ ^{確率を求めたい実現値}xとパラメータ値を与え、パソコンで計算。例：_Po(1.116)で Pr(X = 2)^の計算^→^Excel^の関数POISSON.DIST(2, 1.116, FALSE)。

(6)

2.2

^{ポアソンの小数の法則}

二項分布とポアソン分布の関係：ポアソン分布_Po(λ)のパラメータをλ = np = 2.5^と置く。（_n、_pは二項分布_{Bin(n, p)}のパラメータ。_{E(X) = np}に注意。）

⊲ λ = np = 2.5^{と固定したまま、}ⁿ^{を増やし、}^p^{を減らしながら確率}Pr(X = 3)^を両分布で計算。（∴_λは_2.5で不変。）

n p λ = np Bin(n, p)^で計算 Po(λ)^で計算

5 0.5 2.5 Pr(X = 3) = 0.313 Pr(X = 3) = 0.213

10 0.25 2.5 0.250 0.213

50 0.05 2.5 0.220 0.213

100 0.025 2.5 0.217 0.213

⊲ ∴ ^、のとき、二項分布の確率はポアソン分布の確率に近づく。

ポアソンの小数の法則：二項分布_{Bin(n, p)}について、期待値をE(X) = np = λ^{（正の定数）} に固定しつつ_{n → ∞}（ここでおのずと_{p → 0}）という極限をとると、分布関数₍₇₎式はポアソン分布₍₁₁₎式に近づく。

f (x) =n^Cx^p^x^{(1 − p)}^n−x

Bin(n, p)

np = λ で固定

−−−−−−−−−−−→

n → ∞ (p → 0) ^{f (x) =}

e^−λλ^x

x!

Po(λ)

. (13)

この性質を、と呼ぶ。

⊲ ∴一回当たりの確率は小さいが試行回数が多い確率試行の生起回数の分布として、ポアソン分布がふさわしい。

⊲ ただの極限ではなく、_{np = λ}固定で_{n → ∞}。

⊲ 証明：岩田暁一『経済分析のための統計的方法（第₂版）』の_p47参照。

まとめと復習問題

今回のまとめ

二項分布_{Bin(n, p)}：成功確率_pで、x = 0, 1, 2, . . . , n^{回成功する確率。}

ポアソン分布_Po(λ)：試行回数が多く、成功確率の小さい状況で成功する回数x = 0, 1, 2, . . .^。

復習問題

出席確認用紙に解答し（用紙裏面を用いても良い）、退出時に提出せよ。

1. (5)^式のVar(X) = p(1 − p)を証明せよ。ヒント：分散はVar(X) = E(X²^{) − E(X)}²^{と書ける。} また_{E(X) = p}。_E(X²₎は_pを使うとどのように書ける？

2. ^二項分布Bin(n, p)^{とポアソン分布}Po(λ)にはどのような関係があるか？「小数の法則」と

いう用語を用いて、簡潔に述べよ。

代表的な確率分布（離散型） 経済統計 鹿野研究室

担当：鹿野（大阪府立大学）

はじめに

前回の復習

今回学ぶこと

1 二項分布

代表的な離散型・連続型確率分布

ベルヌーイ分布

二項分布

2 ポアソン分布

ポアソン分布

ポアソンの小数の法則

まとめと復習問題

今回のまとめ

復習問題

代表的な確率分布（離散型）経済統計鹿野研究室

1 ^二項分布

^{ベルヌーイ分布}

^二項分布

2 ^{ポアソン分布}

^{ポアソン分布}

^{ポアソンの小数の法則}