確率論 I レジメ

(1)

確率論 I ^レジメ

2010/12/08,

西岡

1

確率論とは何か

• ^{確率論を一口で言うと}, ‘偶然量の法則性を調べる数学’ である.

(i) ところが偶然というのは, ‘本来予測できない’という意味だから, ‘その法則性’という説明は自己矛盾とも考えられる.

(ii) しかし実際には, ‘粒子の存在確率’ という偶然性の概念が量子力学の基礎となっており,それを取り除くと幾つもの物理現象の説明は大変難しくなる^*1. ⇒ ^つまり,自然界での偶然量には法則がある.

(iii) また近年金融の基礎となりつつある「数理ファイナンス」は,株価の変動をある法則性を持つ確率現象

と捉え, ‘オプション’ と呼ばれる金融派生商品の適正価格を決定する理論である.

⇒ ^これらは‘偶然量の法則’が実社会に意味のある研究対象であることを示す例と言える.

•^{それではどういう}‘偶然量’ が, 数学=確率論の対象になるのか? 確率論が扱う偶然量

(i) 何回でも繰り返すと何らかの安定性のある量が現れるような ‘偶然量’だけを対象としている. (ii) どういうときに,この安定性が出現するかは極限定理という言葉で厳密に定義されている.

(iii) 良く知られている‘極限定理’としては,「大数の法則」「ポアッソンの小数法則」「中心極限定理」

などが有る^a.

(iv) これらの極限定理どれも保険業務や統計などの基礎理論であり, 社会と密接に関連している.

a「確率論II」で講義する.

1.1

確率論の始まり

–

ラプラスによる確率の定義

• 数学史で確率論の発端といわれるのは,パスカルが父親から,「ゲームを途中で止めたときに掛け金をどう配分したらよいか?」という質問を受けた事とされている. 掛け金は「賭の勝率の期待値」に従って配分するので,これは確率計算の問題になる.

• パスカル以前にもケプラーやガリレオなども確率の計算結果を発表したり,本を書いたりしている. またパスカルと同時代の,フェルマー,ベルヌーイ,ドゥ・モワブル,ラプラスなども確率論を研究した.

• この頃の確率論の問題は,「サイコロの問題」とかごく簡単なものが対象なので, ‘確率’という概念も厳密な吟味を必要としなかった. 例えばラプラスは,次を確率の定義としている^*2.

定義1.1 (ラプラス). 全体が同じように起こりうるn個の場合から成る. 事象Aがそのうちのk個の場合から成るとき,事象Aの起こる確率P[A] =k/nである.

*1 有名なアインシュタインは,当初‘偶然性‘を物理学に持ち込むことに反対で,「神はサイコロを振らない」という言葉を残した.しかし晩年には,その立場を変えた.

*2 高校数学で学ぶ確率論でも, ‘確率の定義’として定義1.1を採用している.

(2)

1.2

ベルヌ

-

イの発見

–

大数の法則

17世紀までの確率論では, 有限な事象に対して組み合わせ論的な計算で確率を求めることが主な研究だった.

この段階から本質的な飛躍が起こったのがベルヌーイの「大数の法則」の発見である. 「大数の法則」は後で詳しく講義するが,その直感的イメージは次のようなものである:

‘大数の法則’ のイメージ: 公平なサイコロをn回振るとき, 1の目がでる回数をn1 とする. すると n→ ∞^のとき,n1/n→1/6 となる.

これは「無限個のランダムな量に関する法則性が発見された」と見る事ができ,確率論と実社会との接点となる発見であった^*3.

1.3

^{有限から無限事象へ}

• ベルヌーイの大数の法則がそれまでの確率論からの本質的な飛躍と言う意味は, 無限個のランダムな量を扱う故である.

• ^ところが, 無限個の量を扱う場合には, 「ラプラスによる確率の定義1.1 」自体の正当性を再検討する必要がある^*4 .

•^実際に,ラプラスの定義1.1では不十分な例を「ベルトランドのパラドクス」(付録を参照)で挙げた.

1.4

近代確率論の立場

–

確率空間

• ^{近代の確率論では},「極限定理」に代表されるように, 無限個の値をとる偶然量が主たる対象となる.

• そこでは「ベルトランドのパラドクス」と同じように, ‘確率の解釈での曖昧さ’が出現するので,「ま ず確率を定義してから議論を開始する」との立場が共通認識となっている.

より詳しくいうと,近代確率論では

(a) 観測する対象の全体: 事象空間と呼ばれ, Ωと表記されることが多い.

(b) 数学的な操作ができる対象のクラス: 加算加法族と呼ばれ,F ^{等と表記される}. 数理ファイナンスや確率論の専門家には重要なことだが,本書の段階では気にしなくて良い.

(c) 確率: 事象空間Ωに属する全てのものにたいし,それが起こる確率Pを定義する. P は確率測度と呼ばれる.

の三つ組み(Ω,F,P)を予め確定してから,議論を開始する.

つまり,確率は予め宣言するものであり, 観測や経験から導かれるものではないが「確率とはなにか」へ の回答と要約できる.

注意1.2. (i) この三つ組み(Ω,F,P)は確率空間と呼ばれ,これを準備することが近代確率論の特徴である. F ^やPは幾つかの条件を満たすことが要請されているが,その概略は後に述べる.

(ii) ただし,本講義で主に扱う Ωが有限個の場合には,前記(i)の厳密な準備は必要が無い場合が多く,

「ラプラスによる確率の定義1.1」でもそれほど不都合は生じない.

*3競馬,カジノ,宝くじなどの事業での利益を保証する原理である.

*4 無限を扱う場合,一見常識とは異なる事態が起こりえる. 例えば,次の等式が厳密に成立している: 0.999· · ·= 1

(3)

(iii)事象空間Ωが無限個からなるとき,上記(c) (事象空間Ωに属する全てのものにたいし,それが起こる確率Pを定義する)を実行することは,決して簡単ではない^*5.

2

確率空間

(i) 現代の確率論では,無限個の事象を扱うため,「まず適当な確率空間 (Ω,P)を定義する」という方法をとる. ただし,事象が有限個の場合,そのような厳密さを必要としない.

(ii) また,近代確率論では「集合論の演算と記号」を多用する.

2.1

確率空間の定義

確率空間

• Ωはn個の元からなる集合

Ω ={w₁, w₂,· · ·, w_n}

であり,事象空間^a sample spaceと呼ばれ,その元w_k ∈Ωは事象sampleと呼ばれる.

• Pは確率測度probability measureであり, ある集合族^bF ^{上の集合関数で},次の条件を満たしている:

0≤P[A]≤1, P[Ω] = 1, P[∅] = 0, i6=kならAj∩Ak =∅

⇒ P[A1∪A2∪ · · · ∪An] =P[A1] +P[A2] +· · ·+P[An] (2.1)

a しばしば, 事象空間”とも呼ばれる.

b この講義では,Fとしては,常に巾集合族= Ωの部分集合の全体を考えるので,今後は気にしなくて良い.

• ^{つまり確率} P は予め与えられており,観測などから自動的に導かれるものではない. 練習問題 2.1. 確率空間(Ω,P)において, 次のことを確かめよ.

(i) P[A^c] = 1−P[A], (ii) A⊂B ⇒ P[A]≤P[B]

(iii) A∩B=∅ ⇒ P[A∪B] =P[A] +P[B]. ]

2.2

確率空間の例

例題2.2. サイコロを 1回投げる. 起こり得る事象は

w1≡ {1 の目がでる}, w2≡ {2の目がでる},· · ·, w6≡ {6の目がでる} の6通りであり,事象空間はΩ ={w1,· · ·, w6} ^*6.

*520世紀初頭に,ロシア人の数学者A. N.コルモゴロフが(iii)を実行する一般的な方法(「コルモゴロフの拡張定理」)を提案し,近代確率論への道を切り開いた.

*6 F はΩの巾集合族

F ≡ {∅,Ω, w1,· · ·, w6, w1∪w2,· · ·, w5∪w6, w1∪w2∪w3,· · · } で2⁶= 64個の集合から成っている.

(4)

また,このサイコロが公正なものとすると,確率測度Pは P[w1] = 1

6, P[w2] = 1

6, · · · ,P[w6] = 1 6 となる.

練習問題 2.3. 例題2.2の確率空間(Ω,P)で,

A≡^{サイコロの目が奇数}={w1, w3, w5}, B ≡^{サイコロの目が}4以上={w4, w5, w6} とおく. 次の確率を計算せよ.

(i) P[A∩B], (ii) P[A∪B], (iii) P[A] +P[B]−P[A∩B]. ] 例題2.4. コインを 2回投げる. 起こり得る事象は

w1≡ {1回目=表, 2回目=表}, w2≡ {1 回目=裏, 2回目=表}, w3≡ {1回目=表, 2回目=裏}, w4≡ {1 回目=裏, 2回目=裏},

の4通りであり,事象空間はΩ ={w1,· · · , w4},その巾集合族F^は16個の集合から成っている^*7. ここで

(2.2) 投げたコインは必ずしも公正ではなく,表がでる確率がp, 0< p <1,

とする. このとき確率測度Pは

P[w1] =p², P[w2] =P[w3] =p(1−p), P[w4] = (1−p)² となる.

• ^{次の例の様に},事象の数が多いときに,確率空間をきちんと定義することは易しくない. 20世紀初頭にロシア人の数学者コロモゴロフKolmogorovが,

次の例題 2.5でn→ ∞^{の場合にも},確率空間を定義できる方法(= Kolmogorov の拡張定理) を証明し,近代確率論が誕生した.

例題2.5. 今度は (2.2)のコインをn回投げる. 起こり得る事象は

w1≡ {1 回目=表, 2回目=表, 3回目=表,· · · ,n回目=表}, w₂≡ {1 回目=裏, 2回目=表, 3回目=表,· · · ,n回目=表}, w3≡ {1 回目=表, 2回目=裏, 3回目=表,· · ·,n回目=表},

...

wN ≡ {1回目=裏, 2回目=裏, 3回目=裏,· · ·,n回目=裏}, (2.3)

のN= 2ⁿ 通りであり,事象空間はΩ ={w₁,· · · , w_N} ^*8.

このように極めて多数の元からなるΩ を扱う場合には, (2.3)を次のように書き直した方が分かり易くなる.

*7 Ωの巾集合族は

F ≡ {∅,Ω, w1,· · ·, w4, w1∪w2,· · ·, w3∪w4, w1∪w2∪w3,· · ·, w2∪w3∪w4} で2⁴= 16個の集合から成っている.

*8 F はΩのべき集合族で2^N= 2²ⁿ個の集合から成っている.

(5)

別の表記法: 1が表, 0が裏を表すとして,

w∈Ωにたいし w= (w⁽¹⁾, w⁽²⁾,· · · , w⁽ⁿ⁾) ここで w^(k) = 1もしくは0.

(2.4)

この表記法を使うと, (2.3)は

w₁= (1,1,· · · ,1), w₂= (0,1,· · ·1), w₃= (1,0,1,· · ·,1),· · ·, w_N = (0,0,· · ·,0) となる. すると確率測度Pは

w∈Ωにたいし P[w] =p^|^w^|(1−p)ⁿ^−|^w^|,

ここで|w| ≡w⁽¹⁾+w⁽²⁾+· · ·+w⁽ⁿ⁾=表がでた回数 (2.5)

となる.

3

^{条件付き確率と独立}

確率空間(Ω,P)を固定する.

定義3.1. P[B]6= 0である事象A, B にたいし,

事象B が起こった後に,事象 Aが起こる確率を条件付き確率conditional probabilityP[A/B]と呼び,

(3.1) P[A/B]≡ P[A∩B]

P[B] (ベイズの公式) で定義する^*9.

定理3.2 (ベイズの定理). P[H]6= 0, P[A]6= 0である事象H, Aにたいし,次の等式が成立する:

(3.2) P[H/A] = P[H]·P[A/H]

P[H]·P[A/H] +P[H^c]·P[A/H^c]. ただし,P[H^c] = 0の場合,P[H^c]·P[A/H^c] = 0と約束する.

[証明] ベイズの公式を使う. P[A∩H] +P[A∩H^c] =P[A]になることに注意して, (3.2)の右辺= P[A∩H]

P[A∩H] +P[A∩H^c] =P[A∩H]

P[A] = (3.2)の左辺. 2

例題3.3 (ベイジアン・フィルター). 迷惑メールの防止フィルターを,件名に‘援助交際’という言葉が含まれているか否かで設定する. 事象H, Aを

H ={^{迷惑メールである}},

A={^文中に ‘援助交際’の言葉が含まれる}, とおく. 過去の統計データによれば

(3.3) P[A/H] = 0.3, P[A/H^c] = 0.01, P[H^c]

P[H] = 2 であった. この迷惑メールの判定フィルターの有効確率 P[H/A] を求めよ.

*9 T. Bayesは英国長老派教会の牧師でアマチュア数学者.ベイズの公式(3.1)は彼の死後に発表された.条件付き確率P[A/B]

は‘事後確率’とも呼ばれる. なお,この公式は「朝日新聞」の特集記事で紹介されるなど,各方面へ応用され近年注目を集めて

いる.

(6)

[解答] まず, ベイズの公式から P[H∩A] = P[H∩A]

P[H] ·P[H] =P[A/H]·P[H].

P[A] =P[A∩H] +P[A∩H^c] = P[A∩H]

P[H] ·P[H] + P[A∩H^c]

P[H^c] ·P[H^c]

=P[A/H]·P[H] +P[A/H^c]·P[H^c].

これを求めるべき

P[H/A] = P[H∩A]

P[A] . の分母/分子に代入する.

P[H/A] = P[A/H]·P[H]

P[A/H]·P[H] +P[A/H^c]·P[H^c] = P[A/H] P[A/H] +P[A/H^c]·(

P[H^c]/P[H]). この右辺に統計データを代入して

P[H/A] = 0.3

0.3 + 2×0.01 '0.94.

なお, 統計データ(3.3)を時間と共に更新することで, 時間経過で進化する‘学習型のベイジアン・フィルター’が得られる. 2

例題3.4 (迷惑メールの割合とベイジアン・フィルターの有効性). 例題3.3で使用した統計データで迷惑メールの割合P[H]

が増加/減少するとき,迷惑メールの判定フィルターの有効確率 P[H/A] はどう変化するか? H={^{迷惑メールである}}, A={^文中に ‘援助交際’の言葉が含まれる}, P[A/H] = 0.3, P[A/H^c] = 0.01, P[H] =x

と,迷惑メールの割合P[H] =xを変数とし,P[H/A] をxの関数として表せ. [解答] 前と同じ計算で, P[H/A] = P[H]·P[A/H]

P[H]·P[A/H] +P[H^c]·P[A/H^c]. ここで

P[H] +P[H^c] = 1⇒P[H^c] = 1−P[H] = 1−x を代入して, P[H/A] = x·0.3

x·0.3 + (1−x)·0.01= 30x 1 + 29x.

0.1 0.2 0.3 0.4 0.5 x

0.2 0.4 0.6 0.8 1.0

実際に計算すると

x 0.05 0.1 0.2 0.3 0.5 0.7 0.9 P[H/A] 0.61 0.77 0.88 0.93 0.97 0.99 0.996

つまり,迷惑メールの割合x=P[H]が30 %以上ないと, その有効性は急激に低くなる. 2

(7)

定義3.5. 事象AとB が独立independent とは

(3.4) P[A∩B] =P[A]·P[B]

が成立することである.

• ^{ベイズの公式を使うと}, 独立が事象AとB は無関係と同値であることが判る.

定理3.6. 事象AとB が独立. ⇔ P[A/B] =P[A].

[証明] まず⇒^を示す. ベイズの公式(3.1)と独立の定義(3.4)より P[A/B] =P[A∩B]

P[B] = P[A]·P[B]

P[B] =P[A].

次に⇐^を示す. 定理の仮定とベイズの公式(3.1)より P[A∩B]

P[B] =P[A/B] =P[A]

となる. 両辺に P[B]を乗じて, ‘独立’の定義(3.4)が得られる. 2

• 3個以上の事象にたいしては, 独立を定義すること自体が煩雑な作業である.

定義3.7. (i) 3個の事象 A, B, C が互いに独立とは, 次の四つの等式が成立することである: P[A∩B] =P[A]·P[B], P[B∩C] =P[B]·P[C],

P[C∩A] =P[C]·P[A], (3.5a)

(3.5b) P[A∩B∩C] =P[A]·P[B]·P[C].

(ii) k個の事象A1, A2,· · ·, Ak が互いに独立とは,A1, A2,· · · , Ak から取り出した任意のj 個の事象 Ai₁, Ai₂,· · · , Ai_j にたいし,次の等式が成立することである:

P[Ai₁∩Ai₂∩ · · · ∩Ai_j] =P[Ai₁]·P[Ai₂]· · ·P[Ai_j].

注意3.8. 事象A, B, C にたいし (3.5a)が成立していても(3.5b)が成立するとは限らない. 反例: 4枚のカードa, b, c, dがあり,

「aには2」,「bには3」,「c には5」,「dには30」と数字が書かれている. いまランダムにカードを選ぶとし,事象A, B, C を

事象A: カードの数字が2で割り切れる, 事象B : カードの数字が3で割り切れる, 事象C : カードの数字が5で割り切れる, とする. このとき(3.5a) は成立しているが, (3.5b)は不成立である. 例題3.9. 注意3.8の反例を証明せよ.

(8)

[解答] カードa, b, c, d が選ばれる確率は各々1/4なので,

P[A∩B] =P[カードdを選ぶ] = 1 4 だが

P[A] =P[カードaまたは dを選ぶ] = 1

2, P[B] =P[カードbまたは dを選ぶ] = 1 2

となり, (3.5a) の第一式が成立している. また

P[B∩C] =P[カードdを選ぶ] = 1 4 だが

P[B] =P[カード bまたは dを選ぶ] = 1

2, P[C] =P[カード cまたはdを選ぶ] = 1 2 となり,第二式も成立している. 第三式もこれと同様の計算で成立が示される. 一方,

P[A∩B∩C] =P[カード dを選ぶ] = 1 4, P[A]·P[B]·P[C] = 1

2· 1 2·1

2 =1 8 だから, (3.5b) は不成立である. 2

• ^さらに (3.5b)が成立していても(3.5a)が成立するとは限らない.

例題3.10. 24枚のカードがあり,各カードには数字が一つ書かれている. ‘書かれた数字’と‘その数字が書いてあるカードの枚数’は以下の通り:

カードに書いてある数字カードの枚数

2, 3, 5 それぞれ 5枚ずつ

6, 10, 15 それぞれ2枚ずつ

30 3枚

いまランダムにカードを選ぶとし,事象A, B, C を

事象A: カードの数字が2で割り切れる, 事象B : カードの数字が3で割り切れる, 事象C : カードの数字が5で割り切れる, とする.

(i) (3.5b)が成立していることを示せ. (ii) (3.5a)は成立しないことを示せ.

4

^確率変数

確率空間(Ω,P)を固定する.

全ての事象w∈Ωにたいし実数を与える関数 X: Ω→Rを確率変数 random variableと呼ぶ. ２つの確率変数X(w),Y(w)を考え,X(w)はa₁, a₂,· · ·, a_n の値,Y(w)はb₁, b₂,· · ·, b_m の値をとるとする. X(w)とY(w)が独立independentとは,すべての1≤j≤n, 1≤k≤mにたいし

(4.1) P[X(w) =a_j, Y(w) =b_k] =P[X(w) =a_j]·P[Y(w) =b_k] が成立することである.

(9)

例題4.1. 例題2.4の確率空間(Ω,P)で確率変数X(w), Y(w)を次のように定義する: X(w)≡

{ 1 1回目に投げたコインが表

−1 1回目に投げたコインが裏 Y(w)≡

{ 1 2 回目に投げたコインが表

−1 2 回目に投げたコインが裏 (4.2)

すると,

P[X(w) = 1] =P[w1∪w3] =P[w1] +P[w3] =p²+p(1−p) =p, P[X(w) =−1] =P[w2∪w4] =P[w2] +P[w4]

=p(1−p) + (1−p)²= 1−p,

P[Y(w) = 1] =P[w1∪w2] =P[w1] +P[w2] =p²+p(1−p) =p, P[Y(w) =−1] =P[w₃∪w₄] =P[w₃] +P[w₄]

=p(1−p) + (1−p)²= 1−p (4.3)

となる.

練習問題 4.2. 上の(4.2)で述べた確率変数X(w), Y(w)は独立である. 実際に P[X(w) = 1, Y(w) = 1], P[X(w) = 1, Y(w) =−1], P[X(w) =−1, Y(w) = 1], P[X(w) =−1, Y(w) =−1], を計算し,独立であることを確かめよ. ]

練習問題 4.3. 例題2.4で述べたコインを２回投げ,

(4.4) Z(w)≡^{表の出た数}×100円

だけ賞金がもらえる. この確率変数Z(w)を(4.2)のX(w), Y(w)を使って表せ. また次の確率を計算せよ.

(i) P[Z(w) = 200], (ii) P[Z(w) = 100], (iii) P[Z(w) = 0]. ]

例題4.4. つぎに,例題2.5の確率空間(Ω,P)で, 確率変数Xk(w), k= 1,2,· · ·, n,を次で定義する.

(4.5) Xk(w)≡

{ 1 k 回目に投げたコインが表

−1 k 回目に投げたコインが裏

この場合にP[Xk(w) =±1]の確率を計算してみよう: (2.4)の表記法を使う. 数学的帰納法を使えば

P[Xk(w) = 1] =P[{w∈Ω :w^(k)= 1}] = X

w∈Ω,w^(k)=1

P[w] =p

P[Xk(w) =−1] =P[{w∈Ω :w^(k)= 0}] = X

w∈Ω,w^(k)=0

P[w] = 1−p

が簡単に証明できる.

定義4.5. (4.5)の確率変数X_k(w), k= 1,2,· · ·, nにたいし,新しい確率変数を

(4.6) Sk(w)≡

{ 0 k= 0

X1(w) +· · ·+Xk(w) 1≤k≤n.

この確率変数は標準ランダム・ウォークrandom walk^と呼ばれ,^応用上,^{重要なものである}.

(10)

命題4.6. (4.6)のSk(w), k= 0,1,· · · , n,の確率分布は,以下の通りである: P[Sn(w) =m] =nC_(n+m)/2 p^(n+m)/2 (1−p)⁽ⁿ⁻^m)/2,

ここで −n≤m≤nかつn+mは偶数. (4.7)

[証明] Sn(w) =mなるランダム・ウォークにたいし,





u≡X₁(w),· · · , X_n(w)のなかで, 1の値をとるものの総数 v≡X₁(w),· · · , X_n(w)のなかで,−1の値をとるものの総数

⇒ ^{極端な例を考える}: 最初からu回は勝ち続け,v 回が負け続け.

0

(n,m) v

u

n m

とすると,次が成立:

u−v=m, u+v=n → u= n+m

2 , v=n−m 2 .

n回のなかで,u回勝つ道筋の個数は _nCu,u回勝つ確率はp^u,v回負ける確率は(1−p)^v. これらを掛け合わせて命題が得られる. 2

2項分布

定義4.7. ( (4.7)の右辺はもっとも基礎となる確率分布の一つで, 2項分布binomial distribution と呼ばれる.

5

確率変数の平均

確率変数を特徴づける数値はいろいろあるが,特に平均が重要である. 定義5.1. (i) a₁,· · · , a_n の値をとる確率変数X(w)にたいして,

E[X(w)]≡a₁ P[X(w) =a₁] +a₂ P[X(w) =a₂] +· · ·+a_n P[X(w) =a_n] を X(w)の平均mean^*10 と呼ぶ.

*10 しばしば,期待値expectationとも呼ばれる.

(11)

例題5.2. 例題4.1で定義された確率変数X(w)の平均を求める. (4.3)を使うと E[X(w)] = 1·P[X(w) = 1] + (−1)·P[X(w) =−1]

= 1·p+ (−1)·(1−p) = 2p−1.

例題5.3. 次の賭 Gを行う:

G:サイコロを1 回投げ,出た目 ×100 円の賞金を獲得このとき,賭Gの参加料を幾らに設定^*11すれば主催者/参加者の両者に対し公平か? 解答. 例題2.2の確率空間(Ω,P)を考えると,賭Gで得られる賞金の額は

w=wk のとき Z(w) =k·100, k= 1,2,· · · ,6 と表現できる. §5 で述べる Kolmogorovの強大数の法則より

nを十分大きな数とする. 賭Gがn回実施されたとき,賞金の支払い総額は n·E[Z(w)]に近づくが判っている. これより賭Gの参加料は

E[Z(w)] = 100·P[Z(w) = 100] +· · ·+ 600·P[Z(w) = 600]

= 100·1

6+· · ·+ 600·1

6 =2100

6 = 350円に設定すれば,主催者/参加者の両者に対し公平である. 2

一般に,平均の計算は易しくない. その計算を少しでも容易にするために,次の補題がある. 平均の計算ツール

補題5.4 (重要). X(w), Y(w)を確率変数,a, bを定数とする. (i) E[

a X(w) +b Y(w)] =aE[X(w)] +bE[Y(w)].

(ii) 定数aにたいしては,E[a] =a.

(iii) X(w)とY(w)が独立なら E[X(w)·Y(w)] =E[X(w)]·E[Y(w)].

定義5.5. 成功と失敗の２つの結果しかない試行をベルヌーイ試行と呼ぶ^*12.

例題 5.6. 表が出る確率がp(0< p <1)である不正なコインを2回投げる. 確率変数X₁(w), X₂(w)を次で定義:

X1(w)≡

{ 1 1 回目に表

0 1 回目に裏 X2(w)≡

{ 1 2 回目に表 0 2 回目に裏. (i)つぎの確率分布をもとめよ.

(a) X1+X2, (b) (X1+X2)², (c) X1·X2

(ii)つぎの平均を計算せよ.

(d) E[X₁+X₂], (e) E[(X₁+X₂)²], (f) E[X₁·X₂].

[解答] (i) X1,X2 は独立で,

*11 運営費用は考えない.

*12 ベルヌーイ試行は大変単純だが,実は多くの確率現象がベルヌーイ試行の組み合わせで表現できる.

(12)

確率 1−p p X1 の値 0 1

確率 1−p p X2 の値 0 1 これより

確率 (1−p)² 2p(1−p) p²

X1+X2の値 0 1 2

(X1+X2)²の値 0 1 4

確率 1−p² p² X1·X2 の値 0 1 (ii) 前の小問の解答を使うと

E[X1+X2] = 0·(1−p)²+ 1·2p(1−p) + 2·p²= 2p.

E[(X₁+X₂)²] = 0·(1−p)²+ 1·2p(1−p) + 4·p²= 2p+ 2p². E[X1·X2] = 0·(1−p²) + 4·p²= 4p².

[別解] スマートな方法もある. まず

E[X₁] = 0·(1−p) + 1·p=p, E[X₂] = 0·(1−p) + 1·p=p.

補題5.4, (i)を使うと,

E[X₁+X₂] =E[X₁] +E[X₂] =p+p=p.

つぎにX1とX2は独立だから,補題5.4, (iii)から

E[X₁·X₂] =E[X₁]·E[X₂] =p². 最後に

E[X12] = 0²·(1−p) + 1²·p=p, E[X22] = 0²·(1−p) + 1²·p=p.

これより

E[(X1+X2)²] =E[X12

+ 2X1·X2+X22

]

=E[X12

] + 2E[X1·X2] +E[X22

] =p+ 2p²+p= 2p+ 2p². 2

例題5.7. 成功確率 pのベルヌーイ試行を成功するまで繰り返す. (i) k 回以内に成功する確率F(k, p) を計算せよ.

(ii) 成功するまでに要する回数Y(w) の平均を求めよ. [解答] Step 1. q≡1−pとおくと,

1回目の成功する確率:P[Y(w) = 1] =p, 2回目に成功する確率:P[Y(w) = 2] =q p,

...

k回目に成功する確率:P[Y(w) =k] =q^k⁻¹p, ...

(5.1)

となるので,

F(k, p) =p+qp+q²p+· · ·+q^k⁻¹p=p·1−q^k

1−q = 1−(1−p)^k.

(13)

ここで,いくつかの pにたいしF(k, p)の値を計算してみる:

成功確率 p 0.1 0.2 0.3 0.5 3回以内に成功する確率 F(3, p) 0.27 0.49 0.66 0.88 5回以内に成功する確率 F(5, p) 0.41 0.67 0.83 0.97 7回以内に成功する確率 F(7, p) 0.52 0.79 0.92 0.99 10回以内に成功する確率 F(10, p) 0.65 0.89 0.97 ∼1 Step 2. Y(w)の平均値を求める. (5.1)と平均値の定義より,

E[Y(w)] = 1·p+ 2·q p+ 3·q²p+· · ·+k·q^k⁻¹p+· · ·

=p(

1 + 2q+ 3q²+· · ·+kq^k⁻¹+· · ·)

= p

(1−q)² =1 p. 注: 次の級数の計算を確かめる事(「基礎数学I」「基礎数学II」):

1 + 2q+ 3q²+· · ·+kq^k⁻¹+· · ·= 1

(1−q)². 2

例題5.8. ガムの景品にカードを付ける. カードは４種類あり,すべての種類を揃えると, 別の景品と交換できる. Z(w)個のガムを買うと, 4種類のカードがすべて揃ったとする. 確率変数Z(w)の平均をもとめよ.

[解答]

• ^{まずガムを}1個買うと,ある種類a のカードが手に入る.

• つぎにガムを買ったとき, a以外のカードを手に入れる確率はp= 3/4. つまり成功確率3/4のベルヌーイ試行を成功するまで繰り返すことになる. その試行の回数をY1(w)とする.

• 3種類目のカードを手に入れるには, 成功確率2/4 のベルヌーイ試行を成功するまで繰り返すことになる. その回数を Y2(w)とする.

• 4種類目のカードを手に入れるには, 成功確率1/4 のベルヌーイ試行を成功するまで繰り返すことになる. その回数を Y₃(w)とする.

• ^結局1 +Y₁(w) +Y₂(w) +Y₃(w)個のガムを買うと, 4種類すべてのカードが揃う. ここで例題5.7 を使うと,Y_k(w)の平均が計算できるので,

E[Z(w)] =E[1+Y₁(w)+· · ·+Y₃(w)] = 1+E[Y₁(w)]+· · ·+E[Y₃(w)] = 1+ 1 3/4+ 1

2/4+ 1 1/4 =25

3 .

6

確率変数の分散と相関係数

確率変数の散らばり具合を特徴づける数値として,分散が重要である. また二つの確率変数の独立性の度合いを量る量として相関係数がある.

6.1

分散

確率変数X(w)にたいし,平均m≡E[X(w)]を定義5.1で与えた. 定義6.1. a₁,· · ·, a_n の値をとる確率変数X(w)にたいして,

σ²[X(w)]≡E[(

X(w)−m)2

] =

∑n k=0

(a_k−m)2

P[X(w) =a_k]

を X(w)の分散variance と呼ぶ.

(14)

注意6.2. 次の2種類の確率変数X(w)とY(w)を考えてみよう. P[X(w) = 1] = 1

2 =P[X(w) =−1], P[Y(w) = 100] = 1

2 =P[Y(w) =−100].

どちらの確率変数も

E[X(w)] = 1·1 2 −1·1

2 = 0, E[Y(w)] = 100·1

2 −100·1 2 = 0, と平均は0 である. ところが分散を比べると

σ²[X(w)] =E[(

X(w)−0)2

] = 1²·1

2+ (−1)²·1 2 = 1 σ²[Y(w)] =E[(

Y(w)−0)2

] = (100)²·1

2 + (−100)²· 1

2 = 10000

となり大きく異なる. X(w) は出入り1円,Y(w)は出入り100円の公平な賭と考えると, 分散は賭の危険度を表すと解釈できる^*13.

例題6.3 (卵の運搬). ２つの卵を籠に入れて運搬する. 2種類の運搬方法方法A: 2つの卵を１つの籠で運ぶ.

方法B: 卵を1つずつ別の籠に入れ,別々に運ぶ.

にたいし,それぞれのリスクを数値化せよ. ただし「籠を落としたとき, 卵はすべて割れる」とする. (ヒント: 籠を落として卵を割る確率をqとし,方法Aで届く卵の個数をX(w),方法Bでの個数をY(w) とおく. X(w)および Y(w)の分散がリスクである. )

[解答] リスクは「分散」を計算することで,数値化される. Step 1. まずX(w), Y(w)の分布を求める.

X(w)の値 0 2 確率 q 1−q

Y(w)の値 0 1 2

確率 q² 2q(1−q) (1−q)² この表から,それぞれの平均を計算する.

E[X(w)] = 0·q+ 2·(1−q) = 2(1−q),

E[Y(w)] = 0·q²+ 1·2q(1−q) + 2·(1−q)²= 2(1−q).

つまり無事に届く卵の平均値は等しい.

Step 2. 次に分散を計算し,リスクを評価する.

X(w) = 0 のとき {

X(w)−2(1−q)}2

= 4(1−q)², X(w) = 2 のとき {

X(w)−2(1−q)}2

= 4q²

だから {

X(w)−2(1−q)}2

の値 4(1−q)² 4q² 確率 q 1−q これより

σ²[X] =E[{

X(w)−2(1−q)}2

]

= 4(1−q)²·q+ 4q²·(1−q) = 4q(1−q).

*13 株式市場では,分散はボラタリティーと呼ばれ, 相場変動の激しさをボラタリティーの大きさで判定している.

(15)

Step 3. 同様に

Y(w) = 0のとき {

Y(w)−2(1−q)}2

= 4(1−q)², Y(w) = 1のとき {

Y(w)−2(1−q)}2

= (−1 + 2q)², Y(w) = 2のとき {

Y(w)−2(1−q)}2

= 4q²,

だから {

Y(w)−2(1−q)}2

の値 4(1−q)² (−1 + 2q)² 4q² 確率 q² 2q(1−q) (1−q)² これより

σ²[Y] =E[{

Y(w)−2(1−q)}2

]

= 4(1−q)²·q²+ (−1 + 2q)²·2q(1−q) + 4q²·(1−q)²= 2q(1−q).

Step 4. 以上より

σ²[X] = 2σ²[Y]

となる. つまり,方法Bでの運搬リスクは, 方法Aの1/2 と計算され,直感と一致する. 2

注意6.4. ”すべての卵を一つの籠で運ぶ方法がハイリスクであることは以下の事件で実証されている:

(i) 1949年,イタリアのサッカーリーグ,セリエAで4連覇を果たしたACトリノの選手18人全員がポル

トガルとの親善試合からの帰国中の飛行機事故で全員が命を落とした. 彼らはイタリアA代表の主要メンバーでもあった.

(ii) 1958年, 英国プレミアリーグの強豪であるマンチェスターユナイテッドは,欧州カップの準準決勝で勝

利したが,帰国途中の飛行機事故で3 名を残して全員死亡. チーム再建に10年を要した.

(iii) 1961年, USAフィギュアスケート代表チームを乗せた飛行機がブリュッセルで墜落. 代表チーム全員

を含む乗員乗客73名が全員死亡.

この例に見るとおり,全員が1台の飛行機を利用する方法では, チーム全滅のリスクが高いので, ”別々の籠で卵を運ぶ方法は実際に行われている(=遠征に出かける選手を半数ずつに分け, 別々の飛行機を使う.) 2

一般に,平均や分散の計算は易しくない. その計算を少しでも容易にするために,次の補題がある. 分散の計算ツール

補題6.5 (重要). X(w), Y(w)を確率変数,c, c⁰ を定数とする. (i) σ²[cX(w) +c⁰] =c²σ²[X(w)].

(ii) σ²[c] = 0. 逆に分散σ²[X(w)] = 0となる確率変数X(w)は定数である. (iii) σ²[X(w)] =E[(

X(w))2

]−(

E[X(w)])2

. (iv) X(w)とY(w)が独立なら

σ²[X(w) +Y(w)] =σ²[X(w)] +σ²[Y(w)].

練習問題 6.6 (卵の運搬2). n個の卵を籠に入れて運搬する. 2種類の運搬方法方法C: n個の卵を１つの籠で運ぶ.

(16)

方法D: n個の卵を1つずつ別の籠に入れ,それぞれ別々に運ぶ.

にたいし,それぞれのリスクを計算せよ. ただし「籠を落としたとき,卵はすべて割れる」とする. [解答] 籠を落として卵を割る確率をqとし,方法Cで届く卵の個数をX(w),方法Dでの個数をY(w)とおく.

X(w)およびY(w)の分散がリスクである. Step 1. まずX の分散を計算する.

X(w)の値 0 n {X(w)}2

の値 0 n² 確率 q 1−q となる. これより

E[X] = 0·q+n·(1−q) =n(1−q), E[X²] = 0²·q+n²·(1−q) =n²(1−q).

補題6.5, (iii)より

σ²[X] =E[X²]−{

E[X]}2

=n²(1−q)−n²(1−q)²=n²q(1−q).

Step 2. Y の分散を計算する. Y は「1 個ずつn回運ぶ」=「独立なベルヌーイ試行Z₁,· · · , Z_n の和」である: Y =Z1+· · ·+Zn.

確率 q 1−q 籠を落とす籠を落とさない

Zk(w)の値 0 1

まず

E[Z_k] = 0·q+ 1·(1−q) = (1−q), E[Z_k²] = 0²·q+ 1²·(1−q) = (1−q).

σ²[Zk] =E[Zk2

]−{

E[Zk]}2

= (1−q)−(1−q)²=q(1−q).

補題6.5, (iv)より E[Y] =E[Z₁] +· · ·+E[Z_n] =n(1−q) =E[X].

σ²[Y] =σ²[Z1] +· · ·+σ²[Zn] =nq(1−q) =σ²[X] n . 2 例題6.7. 確率変数 X の分布は以下の通り.

確率 1/3 1/3 1/6 1/6

X の値 0 1 2 3

(i) X の平均 E[X]および分散σ²[X]を求めよ.

(ii) 新しい確率変数Y をY ≡2X−3 とおく. Y の平均 E[Y]および分散σ²[Y]を求めよ.

[解答] (i) E[X] = 0·1

3 + 1· 1 3+ 2·1

6 + 3· 1 6 = 7

6. E[X²] = 0²·1

3 + 1²· 1

3+ 2²·1

6 + 3²·1 6 =15

6 . 補題6.5より σ²[X] =E[X²]−{

E[X]}2

= 15 6 −49

36 =41 36. (ii) 補題5.4より

E[Y] =E[2X−3] = 2E[X]−3 = 2·7

6 −3 =−2 3. 補題6.5, (i)より

σ²[Y] =σ²[2X−3] = 2²σ²[X] = 2²·41 36 =41

9 . 2