確率論の基礎とランダムウォーク; 追加分

(1)

数理統計学 I 前期

確率論の基礎とランダムウォーク ; 追加分

(Basics of Probability Theory and Random Walks; Additional Parts)

担当平場誠示

平成 25 年 4 月 15 日〜 ( 月 4 限実施 )

5 確率論の応用 (Applicatons of Probability Thoery)

本章では,まずランダムウォークの応用として,「ギャンブラーの破産問題」を, また数理ファイナンスの入門として、デリバティブの価格付け理論の初歩の「2項1期間モデル」について,解説しよう. さらに, 少し変わった話題として,「クイズショー」と「囚人のジレンマ」という問題についても解説しよう.

5.1 破産問題 (Ruin problem)

A, Bの2人が,それぞれ所持金a万円,b万円を持って,賭けを行う. 1回の賭けで, Aが勝てば, Bから 1万円を貰い, 負ければ逆とする. 1回ごとの賭けでA が勝つ確率は0< p <1 とする. 即ち, 負ける確率はq= 1−pとなる. この賭けを続けて,どちらかの所持金が0円になったときに,このゲームは終わるとする. Aが破産する確率P_A を求めよう.

その前にもう一つ問題として,共に破産しない,つまりゲームが永遠に続く確率P_∞はいくつだろうか？

直感的にはP_∞= 0 だと思えるであろうが,そんなに明らかではない. これについても考察する.

まず,結果は次のようになる.

定理 5.1 (1)p= 1/2のとき.

P_A= b

a+b, P_B= a a+b. (2)p̸= 1/2のとき. r:=q/p= 1/p−1 (̸= 1)とおく.

P_A= r^a−r^a+b

1−râ+b , P_B = 1−râ 1−râ+b.

(2)

(3)上の結果から,P_∞= 0, 即ち, ゲームは永遠には続かない,つまり,必ずどちらかは破産する.

所持金a万円のAが破産する確率をua と表すことにする. このとき最初の賭けで勝つか負けるかで条件付けることにより, 次の式を満たすことが分る.

u_a=pu_a+1+qu_a₋₁ (a≥1), u₀= 1, u_a+b= 0. (1) 問 5.1 上の式を証明せよ.

ヒントまず,最後の2式は明らかであろう. 所持金が初めから0なら,既に破産状態なので,破産確率は1で,所持金が初めからa+bなら, Bが破産状態なので,破産確率は0ということである. 最初の式も,直感的には明らかに思えるかも知れないが,厳密には次のように証明できる. Yn をn回目の掛けで, A が受け取る金額（単位は万円）, 即ち, Aが勝てばYn= 1. 負ければYn=−1とする, i.e.,P(Yn= 1) =p,P(Yn=−1) =q. またX0 =aとして, Xn=X0+∑n

k=1Yk(n≥1)とすると,これはAのn回目の賭けが終わった時点での所持金を表す. T0= inf{n≥0;Xn= 0}, Ta+b= inf{n≥0;Xn=a+b}

に対し,

ua=Pa(T0< Ta+b) =P(Ta< Ta+b|X0=a).

従って,Y1=±1 ⇐⇒ X1=a±1（複号同順）に注意すれば,

Pa(T0< Ta+b) = Pa(T0< Ta+b|Y1= 1)Pa(Y1= 1) +Pa(T0 < Ta+b|Y1=−1)Pa(Y1=−1)

= Pa+1(T0< Ta+b)P(Y1= 1) +P_a−1(T0< Ta+b)P(Y1=−1).

これより,最初の漸化式が得られる.

問 5.2 定理5.1を証明せよ.

ヒント漸化式(1)より,a≥1のとき,

ua+1−ua= (q/p)(ua−u_a−1) =r^a(u1−u0).

これより, 1≤n≤a+bに対し, un−u0=

∑n

k=1

r^k⁻¹(u1−u0) =

{ n(u1−u0) (r= 1)

1−rⁿ

1−r (u1−u0) (r̸= 1)

特に,n=a+bとして,境界条件,u0= 1, ua+b= 0を用いて,u1−u0=−1/(a+b) ifr= 1, =−(1−r)/(1−râ+b) ifr̸= 1. 従って,ua= 1−a/(a+b) =b/(a+b) ifr= 1, = 1−(1−râ)/(1−râ+b) = (râ−râ+b)/(1−râ+b) if r̸= 1.

さらにゲームが終わる（＝どちらかが破産する）までの平均回数を求めることもできる. 実際,N をゲームが終わったときの賭けの回数＝破産時刻として, B の所持金はb 万円で固定して, v_a =E_a[N] を Aが所持金a万円でゲームをスタートした場合の破産時刻の平均とおくと,これも最初の賭けでAが勝つか負けるかで条件付けることにより次を満たすことが分かる.

va= 1 +pva+1+qva−1 (a≥1), v0=va+b= 0.

これを解くことにより,次を得る.

va=ab (r= 1), 1 p−q

{

(a+b) 1−r^a 1−r^a+b −a

}

(r̸= 1).

問 5.3 上の計算を確かめよ.

(3)

ヒント r = 1 のときは, (va+1−va)−(va−va−1) + 2 = 0 より, ∆va = va−va−1 (a ≥ 1) とおくと,

∆va+1−∆va+ 2 = 0. これをa = 1 から n まで足し合わせると, ∆vn+1−∆v1+ 2n = 0. 即ち, ∆vn+1 =

∆v1−2n=v1−2n. (v0= 0を用いた.) さらにvn+1=∑n+1

k=1∆vk= (n+ 1)(v1−n). つまり,vn=n(v1−(n−1)).

これで, 0 =va+b= (a+b)(v1−(a+b−1))からv1=a+b−1.従って,va=a(v1−(a−1)) =abをえる. r̸= 1のとき. p∆va+1+ 1 =q∆vaより,pv+ 1 =qvを解いて,v= 1/(q−p). 従って,p(∆va+1−v) =q(∆va−v).

これから∆va+1−v= (q/p)(∆va−v) =r^a(∆v1−v). 即ち, ∆va−v=r^a−1(v1−v). (v0= 0 を用いた.) さらに va=

∑a

k=1

∆va=av+

∑a

k=1

r^k⁻¹(v1−v) =av+1−r^a

1−r (v1−v).

これで

0 =va+b= (a+b)v+1−r^a+b

1−r (v1−v) から, v1−v=−(a+b)v 1−r 1−r^a+b 従って,

va=av−(a+b)v 1−r^a 1−r^a+b =v

(

a−(a+b) 1−r^a 1−r^a+b

) .

これからr= 1,即ち,p=q= 1/2 のとき,a= 1, b= 100とすると, Aの破産する確率PA= 100/101 だが,平均回数は100となり, 1回でゲームが終わる確率が1/2であることを考えると結構な数である.

5.2 数理ファイナンス入門；2 項 1 期間モデル

藤田岳彦著「ファイナスの確率解析入門」は良く書かれた入門書だと思うが,それでも初学者には,一読しただけでは,なかなか難しいのではないかと思われる.

私の個人的な認識では,数理ファイナンスとは,証券会社などの金融派生商品＝デリバティブ(derivative) を扱う会社が,お客にその商品を売って、手数料を稼ぐための理論であると. そのためには,魅力的なデリバティブを開発し,それにお客が納得できる値段を付けて,売らなければならない. (お客が儲かるかどうかは関係なく, 商品さえ売れれば手数料が入るので, 会社はそれで儲けられるという事である.) そのデリバティブに値段を付けるための理論が数理ファイナンスである.

ここでは一番単純な,コールオプションと呼ばれるデリバティブの2項1期間モデルについて,その値段の決め方を解説しよう.

まず,市場での取引は,現時点t= 0から始めて,満期時t=T で終わるとする.

さらに市場は公平であるとしよう, 即ち, 「無裁定」であるとする. これは「絶対に損をせずに, しかも儲かる可能性のあるような金融商品は存在しない」ということである. つまりX₀ = 0, P(X_T ≥0) = 1, P(XT >0)>0となる金融商品 {Xt} は存在しないということである. ここでP は市場の不確実性を表す確率測度である.

コールオプション (Call Option)とは,ある株を満期時t=T に,ある価格K で購入＝コールできる権利のことで, もし,その時点での株価ST が, Kより下回っていた場合は,その権利を放棄できるという選択権＝オプションの付いたものをいう. 行使価格K のコールオプションという. このコールオプションの満期時での支払い＝ペイオフは, (S_T −K)∨0 = max{St−K,0} となる.

2項1期間モデルとは,市場に株式と安全資産(＝銀行預金など)の2種類しかないとして, 現時点t= 0 で1株 S 円としてこれが満期時 t= 1 =T に S1 の値になるのだが,それが上がって(1 +u)S になる場合と, 下がって(1 +d)S になる場合しかないとする. 但し, 0<1 +d <1<1 +u(d <0) で, さらに安全資産の利率はr >0 でu > rとする. (これは無裁定の仮定による.) つまり安全資産は 1から満期時に 1 +rに増えるが,これよりは株価が上がったときの方が大きいということである.

この設定で,行使価格K のコールオプションの値段=現在の価格Cを求めよう.

(4)

まず,満期時でのペイオフは{(1 +u)S−K} ∨0または,{(1 +d)S−K} ∨0 となる. これを同じ元手C で, 株式と安全資産の運用により得ようとすると, (これをポートフォリオで複製するという言い方をする.

ちなみにポートフォリオ (Portfolio)とは複数の金融商品を組み合わせたものをいう.) それぞれ,a単位, b単位で運用するとして,まず,現時点t= 0でC=aS+b を満たし,さらに満期時 t=T で,

(1 +u)Sa+ (1 +r)b={(1 +u)S−K} ∨0, (1 +d)Sa+ (1 +r)b={(1 +d)S−K} ∨0 を満たすことになる. t=T での値と,t= 0での値の差が利益(勿論,マイナスなら損失)となる. まず,上の2式を解くことにより,a, bが求まり,さらにC=aS+bによって,コールオプションの値段が決まる.

実際,

a=({(1 +u)S−K} ∨0)−({(1 +d)S−K} ∨0) (u−d)S

b= (1 +u)({(1 +d)S−K} ∨0)−(1 +d)({(1 +u)S−K} ∨0) (1 +r)(u−d)

となり,

C=aS+b= 1 1 +r

(

({(1 +u)S−K} ∨0)r−d

u−d+ ({(1 +d)S−K} ∨0)u−r u−d

)

を得る.

これで証券会社は,お客に,「自分で株と銀行預金で運用しなくても,このコールオプションさえ買えば, 全く同じ利益が見込めますから,手間が省けて,時間の節約にもなるし,お得ですよ.」と言って,売り込むことができるという訳である. (勿論,現実には,さらに手数料が掛かるが.)

ここで,確率変数X と確率測度Qを,

Q(X= 1 +u) = r−d

u−d=:p, Q(X = 1 +d) = u−r

u−d =:q= 1−p とおくと,

C= 1

1 +rE^Q[{XS−K} ∨0]

と表せる. このQをリスク中立確率測度, pをリスク中立上昇確率,qをリスク中立下降確率という. これにより,

コールオプションの値段(現在価格)＝コールオプションのペイオフ {XS−K} ∨0 をリスク中立確率Q で平均をとり, それを1/(1 +r) で割り引いたもの

と見ることができる.

実は, 無裁定という仮定の下では, このようなリスク中立確率Qの存在が知られている. （これは上昇と下降の確率が正で,元のP と同値な確率測度,即ち,P(A) = 1 ⇐⇒ Q(A) = 1を満たすもので,さらに無裁定の仮定より,利益の平均がQの下では0となるものをいう.）

2項 T 期間モデルのデリバティブ価格理論

一般のデリバティブY に対し,その値段＝現在価格は,リスク中立確率測度Q(同値マルチンゲール測度ともいう)により,E^QY /(1 +r)^T によって決まる.

これを厳密に説明するには,マルチンゲールという概念と,それに関して,元の確率測度P に対して,無裁定の仮定より,同値マルチンゲール測度Qの存在定理, 即ち,割引株価過程 S_t^′=S_t/(1 +r)^t がQの下でマルチンゲールになること,さらにそのマルチンゲールの表現定理が必要となる.

(5)

本講義ではそこまで説明する時間もないので,興味のある人は,自分で勉強してもらいたい.

ただ簡単に概要を解説しておくと,u=µ+σ, d=µ−σ として,ξ1, . . . , ξT を±1 に値をとる確率変数として,時刻tでの株価を

St=

∏t

i=1

(1 +µ+ξiσ)S とする.

さらに満期T のデリバティブY とは,ξ₁, . . . , ξ_T によって決まる確率変数をいう.

例えば,上のST を用いれば,次のようなものは全てデリバティブとなる.

例先物Y =S_T −K,

例コールオプション Y = (ST −K)∨0, 例プットオプション Y = (K−ST)∨0,

上で定義された一般的なデリバティブ Y に対し, 確率測度 Qを次のように定義する. ξ1, . . . , ξT は Q の下,独立同分布で,

Q(ξ_t= 1) =p:= r−µ+σ

2σ , Q(ξ_t=−1) =q:= 1−p= µ−r+σ

2σ .

これにより,S_t^′ は ξ1, . . . , ξT マルチンゲールとなり,

E^Q[S_t+1^′ |ξ₁, . . . , ξ_t) =S_t^′

Zt=ξ1+· · ·+ξtは非対称ランダムウォークとなる. (マルチンゲールになることは, E^Q[

∏t

i=1

(1 +µ+ξ_iσ)S|ξ₁, . . . , ξ_t) =

∏t

i=1

(1 +µ+ξ_iσ)SE^Q[1 +µ+ξ_t+1σ]

とE^Q[1 +µ+ξt+1σ] = 1 +rから分る.) このQを用いて,Y の現在価格がE^QY /(1 +r)^T で決まる.

5.3 囚人のジレンマ (Prisoner’s Dilemma)

ウィキペディアによると,一般に言われる「囚人のジレンマ」とは,共同で犯罪を行った2人の容疑者に自白をさせるために,

(i) 共に黙秘なら, 2人とも懲役2年

(ii) 1人だけが自白した場合は,自白した方は釈放し, 黙秘した方は懲役10年

(iii) 2人とも自白した場合は,共に懲役5年

という条件を提示すると, 2人とも自白し,それぞれ懲役5年になるというものである.

しかし,確率論において,熊谷隆著「確率論」において紹介されているのは,

A, B, Cの3人の死刑囚がいて,そのうち2人が明日,死刑になることが囚人にも知らされてい

るとする. そこで,囚人Aが看守に「明日、BかCのどちらが死刑になるのか教えて欲しい。」

と頼み、看守は、「Bは死刑になる」と教えた所, Aは喜んで,「自分が明日執行される確率が 2/3 から1/2 に減った。」と喜んだという。これは変な話ではないのか？

というものである. 確かにA からみれば,自分以外の少なくとも 1人は死刑になるのは明らかで,それを知った所で,自分の状況が変わる筈はないのに,確率を考えると,知った時点で,死刑になる確率が減ったことになる. これは確率論という理論自体がおかしいということになるのではないか？「囚人のジレンマ」というよりは「確率論者のジレンマ」とでもいうべき、大問題ではないか？

(6)

実は,この話は,確率論者の中でも,意見が分かれていて,「正しい」という人もいれば,「間違っている」

という人もいる.

例えば,仮に,明日死刑になる者をクジ引きで決めていたとして, Bが既にクジを引き,死刑が決まり,まだA もCも引いていなければ,確かにAの言うことは正しい. しかし,仮にCもクジを引いてしまっていれば,既に,どうなるかは確定していて,それがAには知らされていないだけということになるので,間違っているということになるだろう.

私個人の意見としては, 「この問題を確率で考えること自体が間違っている」という意見なのだが。実際,誰が明日死刑になるかは,既に決まっていて,それをいくらAにはまだ,分っていないからといって,それを確率で考えるのはおかしく,それでも,敢えて確率で言うなら, Aが死刑になるかどうかの確率は0か 1のどちらかしかないのである.

5.4 クイズショー

テレビのクイズ番組で,優勝者が最後に, 3つのドアから一つを選び,その中に,車があればそれを貰える.

但し,車は1台だけで,残りの2つドアの向こうには何も無く,外せば何も貰えない. さらにドアを一つ選んだ時点で,司会者は残りのドアの内, 外れのドアを1つ開け,選択を変えるかどうかを迫るという設定である. 問題は,「このとき,選択を変えるべきかどうか？」である。

考え方の一つとして,最初は確率 1/3 で当たりだが,ドアが一つ開いた時点で, 選択は2つになり, 当たる確率はどちらのドアも1/2 に上がったと思える. しかし, 選択しなかった2つのドアの少なくとも1つは外れで,それを開けたからと言って,自分の選択したドアが当たりなのか外れなのかは, 全く関係が無いように思える.

一見、これは前の「囚人のジレンマ」とよく似た話のように感じるかも知れない. ということは、確率で考えること自体が間違いなのだろうか？しかし,今の場合は,前と全然違って,自分で選択できるのである. (クジ引きでの説明と同じである.) ということはやはり、確率は1/2に上がったのであろうか？

答えは、「選択を変えた方が良い」で,実は選択を変えることにより,当たる確率は上がるのである. 最初の選択のままでは当たる確率は1/3のままで,選択を変えると, 2/3 になるのである.

なぜ, 1/2では無いのか？これはこれで不思議な気がするかも知れないが,最初に選んだドアは3つの内の１つなので, 1/3 のままであるが,ドアを開けた時点で選択を変えるということは,実は,最初に,残りの 2つのドアを選んだのと同じことになり,その内の外れのドアを開けた所で,確率は2/3のまま変わらないということなのである. 但し,これは,外れのドアを開ける司会者の癖など(の情報)が全くない場合である.

前述の熊谷氏の本では,司会者の開けるドアについての癖を条件付確率で導入し,その確率に応じて当たる確率は変わるが、やはり選択を変えた方が良いという結論を得ていて,こちらの方が, 数学としては,厳密な答えになる. 確かに、司会者の癖が分れば、外れのドアを開けた時点で、当たりのドアが分る場合もあるというのは、十分ありえる話である. 勿論、そのためには、既に、この番組が何度も放送されていて, それから司会者の癖の確率が分った場合である. (勿論、答えには,癖が無い場合も含まれているので,数学の答えとしては,より一般的な答えになっているといえる.)

確率論の基礎とランダムウォーク; 追加分

数理統計学 I 前期