確率論 I レジメ
2010/01/03,
西岡1
確率論とは何か•
確率論を一口で言うと, ‘
偶然量の法則性を調べる数学’
である.
(i)
ところが偶然というのは, ‘
本来予測できない’
という意味だから, ‘
その法則性’
という説明は自己矛盾 とも考えられる.
(ii)
しかし実際には, ‘
粒子の存在確率’
という偶然性の概念が量子力学の基礎となっており,
それを取り除 くと幾つもの物理現象の説明は大変難しくなる*1 . ⇒
つまり,
自然界での偶然量には法則がある.
(iii)
また近年金融の基礎となりつつある「数理ファイナンス」は,
株価の変動をある法則性を持つ確率現象と捉え
, ‘
オプション’
と呼ばれる金融派生商品の適正価格を決定する理論である.
⇒
これらは‘
偶然量の法則’
が実社会に意味のある研究対象であることを示す例と言える.
•
それではどういう‘
偶然量’
が,
数学=
確率論 の対象になるのか?
確率論が扱う偶然量¶ ³
(i)
何回でも繰り返すと何らかの安定性のある量が現れるような‘
偶然量’
だけを対象としている. (ii)
どういうときに,
この安定性が出現するかは極限定理という言葉で厳密に定義されている.
(iii)
良く知られている‘
極限定理’
としては,
「大数の法則 」「ポアッソンの小数法則」「中心極限定理」などが有るa
.
(iv)
これらの極限定理どれも保険業務や統計などの基礎理論であり,
社会と密接に関連している.
a「確率論
II
」で講義する.
µ ´
1.1
確率論の始まり–
ラプラスによる確率の定義•
数学史で確率論の発端といわれるのは,
パスカルが父親から,
「ゲームを途中で止めたときに掛け金をど う配分したらよいか?
」という質問を受けた事とされている.
掛け金は「賭の勝率の期待値」 に従って配分 するので,
これは確率計算の問題になる.
•
パスカル以前にもケプラーやガリレオなども確率の計算結果を発表したり,
本を書いたりしている.
またパスカルと同時代の,
フェルマー,
ベルヌーイ,
ドゥ・モワブル,
ラプラス なども確率論を研究した.
•
この頃の確率論の問題は,
「サイコロの問題」とかごく簡単なものが対象なので, ‘
確率’
という概念も厳密 な吟味を必要としなかった.
例えばラプラスは,
次を確率の定義としている*2 .
定義
1.1 (
ラプラス).
全体が同じように起こりうるn
個の場合から成る.
事象A
がそのうちのk
個の場合 から成るとき,
事象A
の起こる確率P[A] = k/n
である.
*1 有名なアインシュタインは
,
当初‘
偶然性‘
を物理学に持ち込むことに反対で,
「神はサイコロを振らない」という言葉を残し た.しかし晩年には,その立場を変えた.*2 高校数学で学ぶ確率論でも, ‘確率の定義’として 定義
1.1
を採用している.1.2
ベルヌ-
イの発見–
大数の法則17
世紀までの確率論では,
有限な事象に対して組み合わせ論的な計算で確率を求めることが主な研究 だった.
この段階から本質的な飛躍が起こったのがベルヌーイの「大数の法則」の発見である
.
「大数の法則」は 後で詳しく講義するが,
その直感的イメージは次のようなものである:
‘
大数の法則’
のイメージ:
公平なサイコロをn
回振るとき, 1
の目がでる回数をn 1
とする.
するとn → ∞
のとき, n 1 /n → 1/6
となる.
これは「無限個のランダムな量に関する法則性が発見された」と見る事ができ
,
確率論と実社会との接点と なる発見であった*3 .
1.3
有限から無限事象へ•
ベルヌーイの大数の法則がそれまでの確率論からの 本質的な飛躍 と言う意味は,
無限個のランダムな 量を扱う故である.
•
ところが,
無限個の量を扱う場合には,
「ラプラスによる確率の定義1.1
」自体の正当性を再検討する必 要がある*4 .
•
実際に,
ラプラスの定義1.1
では不十分な例を「ベルトランドのパラドクス」(
付録を参照)
で挙げた.
1.4
近代確率論の立場–
確率空間•
近代の確率論では,
「極限定理」に代表されるように,
無限個の値をとる偶然量 が主たる対象と なる.
•
そこでは「ベルトランドのパラドクス」と同じように, ‘
確率の解釈での曖昧さ’
が出現するので,
「ま ず確率を定義してから議論を開始する」 との立場が共通認識となっている.
より詳しくいうと
,
近代確率論では(a)
観測する対象の全体:
事象空間 と呼ばれ, Ω
と表記されることが多い.
(b)
数学的な操作ができる対象のクラス:
加算加法族 と呼ばれ, F
等と表記される.
数理ファイナンス や確率論の専門家には重要なことだが,
本書の段階では気にしなくて良い.
(c)
確率:
事象空間Ω
に属する全てのものにたいし,
それが起こる確率P
を定義する. P
は確率測度と呼 ばれる.
の三つ組み
(Ω, F , P)
を予め確定してから,
議論を開始する.
つまり
,
確率は予め宣言するものであり,
観測や経験から導かれるものではないが「確率とはなにか」へ の回答と要約できる.
注意
1.2. (i)
この三つ組み(Ω, F , P)
は確率空間と呼ばれ,
これを準備することが近代確率論の特徴であ る. F
やP
は幾つかの条件を満たすことが要請されているが,
その概略は 後に述べる.
(ii)
ただし,
本講義で主に扱うΩ
が有限個の場合 には,
前記(i)
の厳密な準備は必要が無い場合が多く,
「ラプラスによる確率の定義
1.1
」でもそれほど不都合は生じない.
*3競馬,カジノ,宝くじ などの事業での利益を保証する原理である.
*4 無限を扱う場合,一見常識とは異なる事態が起こりえる. 例えば,次の等式が厳密に成立している: 0.999
· · · = 1
(iii)
事象空間Ω
が無限個からなるとき,
上記(c) (
事象空間Ω
に属する全てのものにたいし,
それが起こる 確率P
を定義する)
を実行することは,
決して簡単ではない*5 .
2
確率空間(i)
現代の確率論では,
無限個の事象を扱うため,
「まず適当な確率空間(Ω, P )
を定義する」という方法 をとる.
ただし,
事象が有限個の場合,
そのような厳密さを必要としない.
(ii)
また,
近代確率論では「集合論の演算と記号」を多用する.
2.1
確率空間の定義¶
確率空間³
• Ω
はn
個の元からなる集合Ω = { w 1 , w 2 , · · · , w
n}
であり
,
事象空間asample space
と呼ばれ,
その元w
k∈ Ω
は事象sample
と呼ばれる.
• P
は確率測度probability measure
であり,
ある集合族bF
上の集合関数で,
次の条件を満たして いる:
0 ≤ P[A] ≤ 1, P[Ω] = 1, P[ ∅ ] = 0, i ̸ = k
ならA
j∩ A
k= ∅
⇒ P[A 1 ∪ A 2 ∪ · · · ∪ A
n] = P[A 1 ] + P[A 2 ] + · · · + P[A
n] (2.1)
a しばしば, 事象空間
”とも呼ばれる.
b この講義では
, F
としては,
常に 巾集合族= Ω
の部分集合の全体 を考えるので,
今後は気にしなくて良い.
µ ´
•
つまり確率P
は予め与えられており,
観測などから自動的に導かれるものではない.
練習問題2.1.
確率空間(Ω, P)
において,
次のことを確かめよ.
(i) P[A
c] = 1 − P[A], (ii) A ⊂ B ⇒ P[A] ≤ P[B]
(iii) A ∩ B = ∅ ⇒ P[A ∪ B] = P[A] + P[B]. ♯
2.2
確率空間の例例題
2.2.
サイコロを1
回投げる.
起こり得る事象はw 1 ≡ { 1
の目がでる} , w 2 ≡ { 2
の目がでる} , · · · , w 6 ≡ { 6
の目がでる}
の6
通りであり,
事象空間はΩ = { w 1 , · · · , w 6 } *6 .
*5
20
世紀初頭に,ロシア人の数学者A. N.
コルモゴロフ が(iii)
を実行する一般的な方法(「コルモゴロフの拡張定理」)
を提案 し,近代確率論への道を切り開いた.*6
F
はΩ
の巾集合族F ≡ {∅ ,Ω, w
1, · · · , w
6, w
1∪ w
2, · · · , w
5∪ w
6, w
1∪ w
2∪ w
3, · · · }
で2
6= 64
個の集合から成っている.また
,
このサイコロが公正なものとすると,
確率測度P
はP[w 1 ] = 1
6 , P[w 2 ] = 1
6 , · · · , P[w 6 ] = 1 6
となる. ⋄
練習問題
2.3.
例題2.2
の確率空間(Ω, P)
で,
A ≡
サイコロの目が奇数= { w 1 , w 3 , w 5 } , B ≡
サイコロの目が4
以上= { w 4 , w 5 , w 6 }
とおく.
次の確率を計算せよ.
(i) P[A ∩ B], (ii) P[A ∪ B], (iii) P[A] + P[B] − P[A ∩ B]. ♯
例題2.4.
コインを2
回投げる.
起こり得る事象はw 1 ≡ { 1
回目=
表, 2
回目=
表} , w 2 ≡ { 1
回目=
裏, 2
回目=
表} , w 3 ≡ { 1
回目=
表, 2
回目=
裏} , w 4 ≡ { 1
回目=
裏, 2
回目=
裏} ,
の
4
通りであり,
事象空間はΩ = { w 1 , · · · , w 4 } ,
その巾集合族F
は16
個の集合から成っている*7 .
ここで(2.2)
投げたコインは必ずしも公正ではなく,
表がでる確率がp, 0 < p < 1,
とする
.
このとき 確率測度P
はP[w 1 ] = p 2 , P[w 2 ] = P[w 3 ] = p(1 − p), P[w 4 ] = (1 − p) 2
となる. ⋄
•
次の例の様に,
事象の数が多いときに,
確率空間をきちんと定義することは易しくない. 20
世紀初頭にロ シア人の数学者コロモゴロフKolmogorov
が,
次の例題
2.5
でn → ∞
の場合にも,
確率空間を定義できる方法(= Kolmogorov
の拡張定理)
を証明し,
近代確率論が誕生した.
例題
2.5.
今度は(2.2)
のコインをn
回投げる.
起こり得る事象はw 1 ≡ { 1
回目=
表, 2
回目=
表, 3
回目=
表, · · · , n
回目=
表} , w 2 ≡ { 1
回目=
裏, 2
回目=
表, 3
回目=
表, · · · , n
回目=
表} , w 3 ≡ { 1
回目=
表, 2
回目=
裏, 3
回目=
表, · · · , n
回目=
表} ,
.. .
w
N≡ { 1
回目=
裏, 2
回目=
裏, 3
回目=
裏, · · · , n
回目=
裏} , (2.3)
の
N = 2
n 通りであり,
事象空間はΩ = { w 1 , · · · , w
N} *8 .
このように極めて多数の元からなる
Ω
を扱う場合には, (2.3)
を次のように書き直した方が分かり易く なる.
*7
Ω
の巾集合族はF ≡ {∅ ,Ω, w
1, · · · , w
4, w
1∪ w
2, · · · , w
3∪ w
4, w
1∪ w
2∪ w
3, · · · , w
2∪ w
3∪ w
4}
で2
4= 16
個の集合から成っている.*8
F
はΩ
のべき集合族で2
N= 2
2n個の集合から成っている.別の表記法
: 1
が表, 0
が裏を表すとして,
w ∈ Ω
にたいしw = (w (1) , w (2) , · · · , w (n) )
ここでw (k) = 1
もしくは0.
(2.4)
この表記法を使うと
, (2.3)
はw 1 = (1, 1, · · · , 1), w 2 = (0, 1, · · · 1), w 3 = (1, 0, 1, · · · , 1), · · · , w
N= (0, 0, · · · , 0)
となる.
すると確率測度P
はw ∈ Ω
にたいしP[w] = p
|w|(1 − p)
n−|w|,
ここで
| w | ≡ w (1) + w (2) + · · · + w (n) =
表がでた回数(2.5)
となる
. ⋄
3
条件付き確率と独立確率空間
(Ω, P)
を固定する.
定義
3.1. P[B] ̸ = 0
である事象A, B
にたいし,
事象
B
が起こった後に,
事象A
が起こる確率 を条件付き確率conditional probability P[A/B]
と呼び,
(3.1) P[A/B] ≡ P[A ∩ B ]
P[B] (
ベイズの公式)
で定義する*9 . ⋄
定理
3.2 (
ベイズの定理). P[H] ̸ = 0, P[A] ̸ = 0
である事象H, A
にたいし,
次の等式が成立する:
(3.2) P[H/A] = P[H ] · P[A/H]
P[H] · P[A/H] + P[H
c] · P[A/H
c] .
ただし, P[H
c] = 0
の場合, P[H
c] · P[A/H
c] = 0
と約束する. ⋄
[
証明]
ベイズの公式を使う. P[A ∩ H] + P[A ∩ H
c] = P[A]
になることに注意して, (3.2)
の右辺= P[A ∩ H ]
P[A ∩ H ] + P[A ∩ H
c] = P[A ∩ H]
P[A] = (3.2)
の左辺. 2
例題
3.3 (
ベイジアン・フィルター).
迷惑メールの防止フィルターを,
件名に‘
援助交際’
という言葉が含ま れているか否かで設定する.
事象H, A
をH = {
迷惑メールである} ,
A = {
文中に‘
援助交際’
の言葉が含まれる} ,
とおく.
過去の統計データによれば(3.3) P[A/H ] = 0.3, P[A/H
c] = 0.01, P[H
c]
P[H] = 2
であった.
この迷惑メールの判定フィルターの有効確率P[H/A]
を求めよ. ⋄
*9
T. Bayes
は英国長老派教会の牧師でアマチュア数学者.
ベイズの公式(3.1)
は彼の死後に発表された.
条件付き確率P[A/B]
は
‘事後確率’
とも呼ばれる. なお,この公式は「朝日新聞」の特集記事で紹介されるなど,各方面へ応用され近年注目を集めている.
[
解答]
まず,
ベイズの公式 からP[H ∩ A] = P[H ∩ A]
P[H] · P[H] = P[A/H ] · P[H].
P[A] = P[A ∩ H ] + P[A ∩ H
c] = P[A ∩ H]
P[H] · P[H] + P[A ∩ H
c]
P[H
c] · P[H
c]
= P[A/H] · P[H ] + P[A/H
c] · P[H
c].
これを求めるべき
P[H/A] = P[H ∩ A]
P[A] .
の分母/
分子に代入する.
P[H/A] = P[A/H ] · P[H ]
P[A/H] · P[H] + P[A/H
c] · P[H
c] = P[A/H ] P[A/H ] + P[A/H
c] · (
P[H
c]/P[H ] ) .
この右辺に統計データを代入してP[H/A] = 0.3
0.3 + 2 × 0.01 ≅ 0.94.
なお
,
統計データ(3.3)
を時間と共に更新することで,
時間経過で進化する‘
学習型のベイジアン・フィル ター’
が得られる. 2
例題
3.4 (
迷惑メールの割合とベイジアン・フィルターの有効性).
例題3.3
で使用した統計データで 迷惑メールの割合P[H ]
が増加
/
減少するとき,
迷惑メールの判定フィルターの有効確率P[H/A]
はどう変化するか? H = {
迷惑メールである} , A = {
文中に‘
援助交際’
の言葉が含まれる} , P[A/H] = 0.3, P[A/H
c] = 0.01, P[H ] = x
と
,
迷惑メールの割合P[H ] = x
を変数とし, P[H/A]
をx
の関数として表せ. ⋄ [
解答]
前と同じ計算で, P[H/A] = P[H] · P[A/H]
P[H ] · P[A/H ] + P[H
c] · P[A/H
c] .
ここでP[H] + P[H
c] = 1 ⇒ P[H
c] = 1 − P[H ] = 1 − x
を代入して, P[H/A] = x · 0.3
x · 0.3 + (1 − x) · 0.01 = 30x 1 + 29x .
0.1 0.2 0.3 0.4 0.5 x
0.2 0.4 0.6 0.8 1.0
実際に計算すると
x 0.05 0.1 0.2 0.3 0.5 0.7 0.9 P[H/A] 0.61 0.77 0.88 0.93 0.97 0.99 0.996
つまり
,
迷惑メールの割合x = P[H ]
が30 %
以上ないと,
その有効性は急激に低くなる. 2
定義
3.5.
事象A
とB
が独立independent
とは(3.4) P[A ∩ B] = P[A] · P[B]
が成立することである
. ⋄
•
ベイズの公式を使うと,
独立 が 事象A
とB
は無関係 と同値であることが判る.
定理
3.6.
事象A
とB
が独立. ⇔ P[A/B] = P[A]. ⋄
[
証明]
まず⇒
を示す.
ベイズの公式(3.1)
と 独立の定義(3.4)
よりP[A/B] = P[A ∩ B]
P[B] = P[A] · P[B]
P[B] = P[A].
次に
⇐
を示す.
定理の仮定と ベイズの公式(3.1)
よりP[A ∩ B]
P[B] = P[A/B] = P[A]
となる
.
両辺にP[B ]
を乗じて, ‘
独立’
の定義(3.4)
が得られる. 2
• 3
個以上の事象にたいしては,
独立 を定義すること自体が煩雑な作業である.
定義
3.7. (i) 3
個の事象A, B, C
が互いに独立 とは,
次の四つの等式が成立することである: P[A ∩ B] = P[A] · P[B], P[B ∩ C] = P[B] · P[C],
P[C ∩ A] = P[C] · P[A], (3.5a)
(3.5b) P[A ∩ B ∩ C] = P[A] · P[B] · P[C].
(ii) k
個の事象A 1 , A 2 , · · · , A
k が互いに独立 とは, A 1 , A 2 , · · · , A
k から取り出した任意のj
個の事象A
i1, A
i2, · · · , A
ij にたいし,
次の等式が成立することである:
P[A
i1∩ A
i2∩ · · · ∩ A
ij] = P[A
i1] · P[A
i2] · · · P[A
ij]. ⋄
注意
3.8.
事象A, B, C
にたいし(3.5a)
が成立していても(3.5b)
が成立するとは限らない.
反例: 4
枚のカードa, b, c, d
があり,
「
a
には2
」,
「b
には3
」,
「c
には5
」,
「d
には30
」 と数字が書かれている.
いまランダムにカードを選ぶとし,
事象A, B, C
を事象
A :
カードの数字が2
で割り切れる,
事象B :
カードの数字が3
で割り切れる,
事象C :
カードの数字が5
で割り切れる,
とする.
このとき(3.5a)
は成立しているが, (3.5b)
は不成立である.
例題3.9.
注意3.8
の 反例 を証明せよ. ⋄
[
解答]
カードa, b, c, d
が選ばれる確率は各々1/4
なので,
P[A ∩ B ] = P[
カードd
を選ぶ] = 1 4
だがP[A] = P[
カードa
またはd
を選ぶ] = 1
2 , P[B] = P[
カードb
またはd
を選ぶ] = 1 2
となり
, (3.5a)
の第一式が成立している.
またP[B ∩ C] = P[
カードd
を選ぶ] = 1 4
だがP[B] = P[
カードb
またはd
を選ぶ] = 1
2 , P[C] = P[
カードc
またはd
を選ぶ] = 1 2
となり,
第二式も成立している.
第三式もこれと同様の計算で成立が示される.
一方,
P[A ∩ B ∩ C] = P[
カードd
を選ぶ] = 1 4 , P[A] · P[B] · P[C] = 1
2 · 1 2 · 1
2 = 1 8
だから, (3.5b)
は不成立である. 2
•
さらに(3.5b)
が成立していても(3.5a)
が成立するとは限らない.
例題
3.10. 24
枚のカードがあり,
各カードには数字が一つ書かれている. ‘
書かれた数字’
と‘
その数字が書 いてあるカードの枚数’
は以下の通り:
カードに書いてある数字 カードの枚数
2, 3, 5
それぞれ5
枚ずつ6, 10, 15
それぞれ2
枚ずつ30 3
枚いまランダムにカードを選ぶとし
,
事象A, B, C
を事象
A :
カードの数字が2
で割り切れる,
事象B :
カードの数字が3
で割り切れる,
事象C :
カードの数字が5
で割り切れる,
とする.
(i) (3.5b)
が成立していることを示せ. (ii) (3.5a)
は成立しないことを示せ. ⋄
4
確率変数確率空間
(Ω, P)
を固定する.
全ての事象
w ∈ Ω
にたいし実数を与える関数X : Ω → R
を確率変数random variable
と呼ぶ.
2つの確率変数X (w), Y (w)
を考え, X(w)
はa 1 , a 2 , · · · , a
n の値, Y (w)
はb 1 , b 2 , · · · , b
m の値をとる とする. X (w)
とY (w)
が独立independent
とは,
すべての1 ≤ j ≤ n, 1 ≤ k ≤ m
にたいし(4.1) P[X(w) = a
j, Y (w) = b
k] = P[X (w) = a
j] · P[Y (w) = b
k]
が成立することである.
例題
4.1.
例題2.4
の確率空間(Ω, P)
で 確率変数X(w), Y (w)
を次のように定義する: X(w) ≡
{ 1 1
回目に投げたコインが表− 1 1
回目に投げたコインが裏Y (w) ≡
{ 1 2
回目に投げたコインが表− 1 2
回目に投げたコインが裏(4.2)
すると
,
P[X (w) = 1] = P[w 1 ∪ w 3 ] = P[w 1 ] + P[w 3 ] = p 2 + p(1 − p) = p, P[X (w) = − 1] = P[w 2 ∪ w 4 ] = P[w 2 ] + P[w 4 ]
= p(1 − p) + (1 − p) 2 = 1 − p,
P[Y (w) = 1] = P[w 1 ∪ w 2 ] = P[w 1 ] + P[w 2 ] = p 2 + p(1 − p) = p, P[Y (w) = − 1] = P[w 3 ∪ w 4 ] = P[w 3 ] + P[w 4 ]
= p(1 − p) + (1 − p) 2 = 1 − p (4.3)
となる
. ⋄
練習問題
4.2.
上の(4.2)
で述べた確率変数X (w), Y (w)
は独立である.
実際にP[X(w) = 1, Y (w) = 1], P[X(w) = 1, Y (w) = − 1], P[X(w) = − 1, Y (w) = 1], P[X (w) = − 1, Y (w) = − 1],
を計算し,
独立であることを確かめよ. ♯
練習問題
4.3.
例題2.4
で述べたコインを2回投げ,
(4.4) Z(w) ≡
表の出た数× 100
円だけ賞金がもらえる
.
この確率変数Z(w)
を(4.2)
のX (w), Y (w)
を使って表せ.
また次の確率を計算せよ.
(i) P[Z(w) = 200], (ii) P[Z (w) = 100], (iii) P[Z(w) = 0]. ♯
例題
4.4.
つぎに,
例題2.5
の確率空間(Ω, P)
で,
確率変数X
k(w), k = 1, 2, · · · , n,
を次で定義する.
(4.5) X
k(w) ≡
{ 1 k
回目に投げたコインが表− 1 k
回目に投げたコインが裏この場合に
P[X
k(w) = ± 1]
の確率を計算してみよう: (2.4)
の表記法を使う.
数学的帰納法を使えばP[X
k(w) = 1] = P[{w ∈ Ω : w
(k)= 1}] = X
w∈Ω,w(k)=1
P[w] = p
P[X
k(w) = − 1] = P[ { w ∈ Ω : w
(k)= 0 } ] = X
w∈Ω,w(k)=0
P[w] = 1 − p
が簡単に証明できる
. ⋄
定義
4.5. (4.5)
の確率変数X
k(w), k = 1, 2, · · · , n
にたいし,
新しい確率変数を(4.6) S
k(w) ≡
{ 0 k = 0
X 1 (w) + · · · + X
k(w) 1 ≤ k ≤ n.
この確率変数は標準ランダム・ウォーク
random walk
と呼ばれ,
応用上,
重要なものである. ⋄
命題
4.6. (4.6)
のS
k(w), k = 0, 1, · · · , n,
の確率分布は,
以下の通りである: P[S
n(w) = m] =
nC (n+m)/2 p (n+m)/2 (1 − p) (n
−m)/2,
ここで
− n ≤ m ≤ n
かつn + m
は偶数. ⋄ (4.7)
[
証明] S
n(w) = m
なるランダム・ウォークにたいし,
u ≡ X 1 (w), · · · , X
n(w)
のなかで, 1
の値をとるものの総数v ≡ X 1 (w), · · · , X
n(w)
のなかで, − 1
の値をとるものの総数⇒
極端な例を考える:
最初からu
回は勝ち続け, v
回が負け続け.
0
(n,m) v
u
n m
とすると
,
次が成立:
u − v = m, u + v = n → u = n + m
2 , v = n − m 2 .
n
回のなかで, u
回勝つ道筋の個数は nC
u, u
回勝つ確率はp
u, v
回負ける確率は(1 − p)
v.
これらを掛け合わせて 命題が得られる. 2
2
項分布¶ ³
定義
4.7. ( (4.7)
の右辺はもっとも基礎となる確率分布の一つで, 2
項分布binomial distribution
と呼ばれる. ⋄
µ ´
5
確率変数の平均確率変数を特徴づける数値はいろいろあるが
,
特に 平均 が重要である.
定義5.1. (i) a 1 , · · · , a
n の値をとる確率変数X(w)
にたいして,
E[X(w)] ≡ a 1 P[X(w) = a 1 ] + a 2 P[X (w) = a 2 ] + · · · + a
nP[X (w) = a
n]
をX(w)
の平均mean *10
と呼ぶ. ⋄
*10 しばしば,期待値
expectation
とも呼ばれる.例題
5.2.
例題4.1
で定義された確率変数X (w)
の平均を求める. (4.3)
を使うとE[X(w)] = 1 · P[X (w) = 1] + ( − 1) · P[X(w) = − 1]
= 1 · p + ( − 1) · (1 − p) = 2p − 1. ⋄
例題5.3.
次の賭G
を行う:
G :
サイコロを1
回投げ,
出た目× 100
円の賞金を獲得 このとき,
賭G
の参加料を幾らに設定*11
すれば主催者/
参加者の両者に対し公平か? ⋄
解答.
例題2.2
の確率空間(Ω, P)
を考えると,
賭G
で得られる賞金の額はw = w
k のときZ(w) = k · 100, k = 1, 2, · · · , 6
と表現できる. § 5
で述べるKolmogorov
の強大数の法則 よりn
を十分大きな数とする.
賭G
がn
回実施されたとき,
賞金の支払い総額はn · E[Z(w)]
に近づく が判っている.
これより 賭G
の参加料 はE[Z(w)] = 100 · P[Z(w) = 100] + · · · + 600 · P[Z (w) = 600]
= 100 · 1
6 + · · · + 600 · 1
6 = 2100
6 = 350
円 に設定すれば,
主催者/
参加者の両者に対し公平である. 2
一般に
,
平均の計算は易しくない.
その計算を少しでも容易にするために,
次の補題がある.
平均の計算ツール¶ ³
補題
5.4 (
重要). X (w), Y (w)
を確率変数, a, b
を定数とする. (i) E [
a X(w) + b Y (w)] = a E[X (w)] + b E[Y (w)].
(ii)
定数a
にたいしては, E[a] = a.
(iii) X (w)
とY (w)
が独立ならE[X(w) · Y (w)] = E[X (w)] · E[Y (w)]. ⋄
µ ´
定義
5.5.
成功と失敗の2つの結果しかない試行をベルヌーイ試行と呼ぶ*12 . ⋄
例題
5.6.
表が出る確率がp (0 < p < 1)
である不正なコインを2
回投げる.
確率変数X 1 (w), X 2 (w)
を 次で定義:
X 1 (w) ≡
{ 1 1
回目に表0 1
回目に裏X 2 (w) ≡
{ 1 2
回目に表0 2
回目に裏. (i)
つぎの確率分布をもとめよ.
(a) X 1 + X 2 , (b) (X 1 + X 2 ) 2 , (c) X 1 · X 2
(ii)
つぎの平均を計算せよ.
(d) E[X 1 + X 2 ], (e) E[(X 1 + X 2 ) 2 ], (f) E[X 1 · X 2 ].
[
解答] (i) X 1 , X 2
は独立で,
*11 運営費用は考えない.
*12 ベルヌーイ試行は大変単純だが,実は多くの確率現象がベルヌーイ試行の組み合わせで表現できる.
確率
1 − p p X 1
の値0 1
確率
1 − p p X 2
の値0 1
これより確率
(1 − p) 2 2 p(1 − p) p 2
X 1 + X 2
の値0 1 2
(X 1 + X 2 ) 2
の値0 1 4
確率
1 − p 2 p 2 X 1 · X 2
の値0 1 (ii)
前の小問の解答を使うとE[X 1 + X 2 ] = 0 · (1 − p) 2 + 1 · 2p(1 − p) + 2 · p 2 = 2p.
E[(X 1 + X 2 ) 2 ] = 0 · (1 − p) 2 + 1 · 2p(1 − p) + 4 · p 2 = 2p + 2p 2 . E[X 1 · X 2 ] = 0 · (1 − p 2 ) + 4 · p 2 = 4p 2 .
[
別解]
スマートな方法もある.
まずE[X 1 ] = 0 · (1 − p) + 1 · p = p, E[X 2 ] = 0 · (1 − p) + 1 · p = p.
補題
5.4, (i)
を使うと,
E[X 1 + X 2 ] = E[X 1 ] + E[X 2 ] = p + p = p.
つぎに
X 1
とX 2
は独立だから,
補題5.4, (iii)
からE[X 1 · X 2 ] = E[X 1 ] · E[X 2 ] = p 2 .
最後にE[X 1 2 ] = 0 2 · (1 − p) + 1 2 · p = p, E[X 2 2 ] = 0 2 · (1 − p) + 1 2 · p = p.
これより
E[(X 1 + X 2 ) 2 ] = E[X 1 2
+ 2 X 1 · X 2 + X 2 2
]
= E[X 1 2
] + 2 E[X 1 · X 2 ] + E[X 2 2
] = p + 2 p 2 + p = 2p + 2p 2 . 2
例題
5.7.
成功確率p
のベルヌーイ試行を成功するまで繰り返す. (i) k
回以内に成功する確率F (k, p)
を計算せよ.
(ii)
成功するまでに要する回数Y (w)
の平均を求めよ. ⋄ [
解答] Step 1. q ≡ 1 − p
とおくと,
1
回目の成功する確率: P[Y (w) = 1] = p, 2
回目に成功する確率: P[Y (w) = 2] = q p,
.. .
k
回目に成功する確率: P[Y (w) = k] = q
k−1 p, .. .
(5.1)
となるので
,
F (k, p) = p + qp + q 2 p + · · · + q
k−1 p = p · 1 − q
k1 − q = 1 − (1 − p)
k.
ここで
,
いくつかのp
にたいしF (k, p)
の値を計算してみる:
成功確率
p 0.1 0.2 0.3 0.5 3
回以内に成功する確率F (3, p) 0.27 0.49 0.66 0.88 5
回以内に成功する確率F (5, p) 0.41 0.67 0.83 0.97 7
回以内に成功する確率F (7, p) 0.52 0.79 0.92 0.99 10
回以内に成功する確率F (10, p) 0.65 0.89 0.97 ∼ 1 Step 2. Y (w)
の平均値を求める. (5.1)
と平均値の定義より,
E[Y (w)] = 1 · p + 2 · q p + 3 · q 2 p + · · · + k · q
k−1 p + · · ·
= p (
1 + 2q + 3q 2 + · · · + kq
k−1 + · · · )
= p
(1 − q) 2 = 1 p .
注:
次の級数の計算を確かめる事(
「基礎数学I
」「基礎数学II
」):
1 + 2q + 3q 2 + · · · + kq
k−1 + · · · = 1
(1 − q) 2 . 2
例題
5.8.
ガムの景品にカードを付ける.
カードは4種類あり,
すべての種類を揃えると,
別の景品と交換で きる. Z (w)
個のガムを買うと, 4
種類のカードがすべて揃ったとする.
確率変数Z(w)
の平均をもとめよ.
⋄ [
解答]
•
まずガムを1
個買うと,
ある種類a
のカードが手に入る.
•
つぎにガムを買ったとき, a
以外のカードを手に入れる確率はp = 3/4.
つまり 成功確率3/4
のベ ルヌーイ試行 を成功するまで繰り返すことになる.
その試行の回数をY 1 (w)
とする.
• 3
種類目のカードを手に入れるには,
成功確率2/4
のベルヌーイ試行 を成功するまで繰り返すこ とになる.
その回数をY 2 (w)
とする.
• 4
種類目のカードを手に入れるには,
成功確率1/4
のベルヌーイ試行 を成功するまで繰り返すこ とになる.
その回数をY 3 (w)
とする.
•
結局1 + Y 1 (w) + Y 2 (w) + Y 3 (w)
個のガムを買うと, 4
種類すべてのカードが揃う.
ここで 例題5.7
を使うと, Y
k(w)
の平均が計算できるので,
E[Z(w)] = E[1+Y 1 (w)+ · · · +Y 3 (w)] = 1+E[Y 1 (w)]+ · · · +E[Y 3 (w)] = 1+ 1 3/4 + 1
2/4 + 1 1/4 = 25
3 .
6
確率変数の分散と相関係数確率変数の 散らばり具合 を特徴づける数値として
,
分散が重要である.
また 二つの確率変数の独立 性の度合い を量る量として相関係数がある.
6.1
分散確率変数
X (w)
にたいし,
平均m ≡ E[X(w)]
を 定義5.1
で与えた.
定義6.1. a 1 , · · · , a
n の値をとる確率変数X (w)
にたいして,
σ 2 [X(w)] ≡ E[ (
X (w) − m ) 2
] =
∑
n k=0( a
k− m ) 2
P[X(w) = a
k]
をX(w)
の分散variance
と呼ぶ. ⋄
注意
6.2.
次の2
種類の確率変数X(w)
とY (w)
を考えてみよう. P[X (w) = 1] = 1
2 = P[X(w) = − 1], P[Y (w) = 100] = 1
2 = P[Y (w) = − 100].
どちらの確率変数も
E[X(w)] = 1 · 1 2 − 1 · 1
2 = 0, E[Y (w)] = 100 · 1
2 − 100 · 1 2 = 0,
と平均は0
である.
ところが分散を比べるとσ 2 [X(w)] = E[ (
X (w) − 0 ) 2
] = 1 2 · 1
2 + ( − 1) 2 · 1 2 = 1 σ 2 [Y (w)] = E[ (
Y (w) − 0 ) 2
] = (100) 2 · 1
2 + ( − 100) 2 · 1
2 = 10000
となり大きく異なる
. X (w)
は出入り1
円, Y (w)
は出入り100
円の公平な賭と考えると,
分散は 賭の危 険度を表す と解釈できる*13 . ⋄
例題
6.3 (
卵の運搬).
2つの卵を籠に入れて運搬する. 2
種類の運搬方法 方法A: 2
つの卵を1つの籠で運ぶ.
方法
B:
卵を1
つずつ別の籠に入れ,
別々に運ぶ.
にたいし
,
それぞれのリスクを数値化せよ.
ただし「籠を落としたとき,
卵はすべて割れる」とする. (
ヒント:
籠を落として卵を割る確率をq
とし,
方法A
で届く卵の個数をX (w),
方法B
での個数をY (w)
とおく. X (w)
およびY (w)
の分散がリスクである. ) ⋄
[
解答]
リスクは「分散」を計算することで,
数値化される. Step 1.
まずX(w), Y (w)
の分布を求める.
X (w)
の値0 2
確率q 1 − q
Y (w)
の値0 1 2
確率
q 2 2q(1 − q) (1 − q) 2
この表から,
それぞれの平均を計算する.
E[X (w)] = 0 · q + 2 · (1 − q) = 2(1 − q),
E[Y (w)] = 0 · q 2 + 1 · 2 q (1 − q) + 2 · (1 − q) 2 = 2(1 − q).
つまり 無事に届く卵 の平均値は等しい
.
Step 2.
次に分散を計算し,
リスクを評価する.
X (w) = 0
のとき{
X(w) − 2(1 − q) } 2
= 4(1 − q) 2 , X (w) = 2
のとき{
X(w) − 2(1 − q) } 2
= 4q 2
だから
{
X (w) − 2(1 − q) } 2
の値
4(1 − q) 2 4q 2
確率q 1 − q
これよりσ 2 [X] = E[ {
X (w) − 2(1 − q) } 2
]
= 4(1 − q) 2 · q + 4q 2 · (1 − q) = 4q(1 − q).
*13 株式市場では,分散は ボラタリティー と呼ばれ, 相場変動の激しさ をボラタリティーの大きさで判定している.