2014 09 06吉田 論理パラドクシカ019「2つの封筒のパラドクス」へのトンデモ解答
【2封筒問題の基本設定】
外見では区別できない2つの封筒に、それぞれある金額を書き込んだ小切手が入ってい る。一方は片方の倍額である。あなたはどちらか片方をもらえる。あなたがとれる行動は、 次の2つを順に行うことである。(1)片方の封筒を取り、中の金額Mを見る。(2)「保持」 か「交換」の片方の手を選択する。
「保 持」を選 択すれ ば得られ る金額 は M で ある。「交換」 を選べば、M ではないほう の金額(2MまたはM/2)を得られる。
以上が基本設定である。論理パラドクシカ019では設定を少しずつ変えた問題と対比さ せながら議論を進めていくので、上記の基本問題を P2e[B]と呼ぶことにする。( Problem of 2 envelopes Baseline version)
なお、本書に書かれてはいないが、下記の点も基本設定に追加する。
・金額は正の整数値だけでなく、正の有理数値をも許す。
この追加は、「奇数が来たら必ず交換する」のような自明な必勝法を除去するためである。
【2封筒ゲームの進行手順】
(0) 胴元が何らかのアルゴリズムに従って賞金額のペアを決定する。 (1) プレーヤーが片方の封筒を取り、中の金額を見る。
(2) プレーヤーが「保持」または「交換」のいずれかの手を選択する。
【記法】
本書:『論理パラドクシカ』 続書:『思考実験リアルゲーム』 手:「保持」または「交換」
P(L=X):(1)で取った封筒の中身を見る前の時点で、少ない方の金額がXである確率。 P(V=M):(1)で取った封筒の中身を見る直前の時点で、封筒の中身が M である確率。 P(V=M|L=X):(1)で取った封筒の中身を見る直前の時点で、「少ない方の金額がXであ るならば、封筒の中身がMである」が成り立つ確率。
P(L=X|V=M):(1)で取った封筒の中身を見る直前の時点で、「中身がMであるならば、 少ない方の金額がXである」が成り立つ確率。
R(M): 手元の封筒の中身であるMが、少額側である確率と多額側である確率の比。 すなわち、P(L=M|V=M)/ P(L=M/2|V=M)。分母が 0 であるときは、R(M)の値は「いか なる有限の値よりも十分に大きい」とする。分子と分母が共に 0 であるような M は、R の定義域から除いておく
注0
。
Ehold:「保持」を選択した場合の利得の期待値。Ehold=Mで ある。 Eswap:「交換」を選択したときの利得の期待値。
Eswap = P(L=M|V=M) ×2M+P(L=M/2|V=M) ×M/2である。
EholdαZ、EswapαZ :問題設定P2e[Z]の元で、α説に則って求めた、EholdとEswap 。 基本 設定 を採 用し たと きは 下 付添 え字 が B にな る。 ど ちら の手を 選択し たかを明 示しな いときは、E
α
Bのように書く。
ヒュポドクス:本報告独自の用語。問題文に記載不足がある問題であって、記載内容の 補い方によって異なる複数通りの答えが存在し、それらの答えが相矛盾しうる物。
【報告者のスタンスと本報告の構成】
報告者は、本書が提示する答えに賛同していない。続書における答えのうち、「計算γ」 には 賛 同 する 。「 計 算γ 」 に 至る ま で の諸 結 論 に は賛 同 で きな い も のが 多 い 。報 告者 の見 解は、続書の注 28 での批判対象とおそらく一致している。したがって本報告は、本書の 答え に 対 する 反 論 を 行い 、「 計算 γ 」 を独 自 の ル ート か ら 肯定 す る こと が 前 半部 とな る。 一 方 で 報告 者 は 、 可能 世 界 論と 人 間 原理 を 、「 なぜ こ の 宇宙 で は この 物 理 法則 が成 り立 っているのか?」という物理学の究極の問いに対する、現時点での最有力の武器であると 考えている。したがって、本書と続書で展開されている、可能世界論的な確率論を否定し たまま本報告を終わらせたくはない。可能世界論的な確率論を構築するための手がかりを 提示して後半部とする。
【2封筒問題の問題点】
「保持」と「交換」、どちらがいくら得な手であるかを考えると、下記のように、推論A を経て不合理な結論が出てしまう。
推論 A 手 元の 金額 が少ない 方であ る確率と 多い方 である確 率は五 分五分 だ。だか ら、 Eswap推論AB = (1/2)*(2M)+(1/2)*(M/2) = 1.25Mである。Ehold推論AB はMに等しいから、
「保持」より「交換」は25%も得である。よって、交換すべし。
不合理な結論 2 人でこのゲームを行って、2 人が別々の封筒の中身を(1)で見た場合、2 人とも「交換」するのが得である。
【2封筒問題に対するポピュラーな説】
Devlin 説 :P(L=X) に 一 様 分布 が成 り立 たな いの で、 確定 し た期 待値 計算 はで きな い。 富永説:確率は数直線上の距離に比例すると考える。
M/2 M 2M
金額 M - M/2 2M- M
2M - M/2
P富永(L=M/2|V=M)=(2M-M)/(2M-M/2)=2/3であり、 P富永(L=M|V=M)=(M-M/2)/(2M-M/2)=1/3である。
Eswap富永B = M/2×P富永(L=M/2|V=M) + 2M×P富永(L=M|V=M)なのだから、 Eswap富永B =(M/2)(2/3)+(2M)(1/3) = M 。「交換」と「保持」は等価値である。
用語導入 確率分布説:封筒の中身が多額側である確率と少額側である確率とが、それ ぞれ1/2ずつではないとする説。
確率分布説を否定する本書の立場は、「M の値にかかわらず、R(M)=1 が成り立つ」を 主張するものである。したがって、本書が否定している確率分布説は、「∃x R(x)≠1」 という一言で書ける。一方で、本書が採用する確率分布否定説は「∀x∈D R(x)=1」と いう一言で書ける。(D は、Rの定義域。つまり、D={x|P(L=x)≠0∨P(L=x/2)≠0}。以 下では、Rの引数を全称化したときは、∈Dを省き、単に∀xR(x)=1と書く。)
1 この説の決定的な弱点を指摘してください 本書の答え
設定を変えた類似問題を2つ出し、確率分布説では不合理な結論に至ることを示すこと で、弱点を指摘している。
類似問題P2e[¬]:取らなかった方の封筒をもらえるという設定。 E富永¬ =(2M)(2/3)+(M/2)(1/3)
= 4M/3 + M/6 = 3M/2
こ の 類 似 問 題 か ら は 、数 字 の 大小 か ら 決 めた 確 率 (2/3 や 1/3) が ま っ た く恣 意 的 であ ることを指摘できる。
類 似 問 題 P2e[S] : (1) で取 ら な か った 方 の 封筒 の 中 身は 、 (1)の 後で コイ ン投 げで 決め る。
この類似問題は、推論 A の通りに、交換した方が25%の得となる。著者は、「このよう な紛 れ も なく 交 換 が 得で あ る よう な 設 定に お い ても 、 確 率 分布 説 は 「交 換 は 損得 なし 」 あるいは「確率分布が不明ゆえ回答不能」と言い張らねばならなくなるだろう」と言い、 このことを確率分布説の決定的な弱点として指摘している。
報告者の反論 E富永¬
の計算方法がおかしい。
「取らなかった方の封筒」というものが、(1)で取らなかった方の封筒なのか、(2)で取ら なかった方の封筒なのか、本書には明記されていないので、類似問題の設定をさらに次の ように明確化する。
類似問題P2e[¬1]:(1)で取らなかった方の封筒をもらえるという設定。
類似問題P2e[¬2]:(2)で交換を選択したときに取らなかった方の封筒をもらえるとい う設定。
これらの設定のもとでは、
E富永¬1は、(2)で交換を選択したときに得られる金額期待値Eswap
富永
B であり、
E富永¬2は、(2)で保持を選択したときに得られる金額期待値Ehold
富 永
Bであり、
いずれもMに等しい。
よって、答えに書かれていた計算では、富永説への反論にはならない。
また、仮に富永説を反証できたとしても、ある特定の確率分布を否定したに過ぎず、確 率分布説一般への反証にはならない。
類似問題 P2e[S]については、確率分布説が成り立たないことに異論はない。P(L=X)の 関数 形 は 少額 側 の 賞 金額 の 決 め方 に 支 配さ れ る ので 、R(M)の 関数 形も 少額 側の 賞金 額の 決め方に支配される。基本問題と類似問題とでは少額側の賞金額の決め方が異なるので、
「類似問題P2e[S]におけるR(M)が恒に1になること」と、「基本問題P2e[B]におけるR (M)が1以外の値を取り得ること」は、矛盾しない。
基 本問 題 P2e[B] にお いて は、 確 率分 布説 を採 用す る必 要がある ことを 、背理法 で証明 できる。
確率分布否定説とは∀x R(x)=1なので、∀x P(L=x|V=x)=P(L=x/2|V=x)とも書ける。 ベイズの定理より、
P(L=x|V=x) = P(V=x|L=x)P(L=x)/P(V=x) P(L=x/2|V=x) = P(V=x|L=x/2)P(L=x/2)/P(V=x) なので、確率分布否定説は
∀x P(V=x|L=x)P(L=x)/P(V=x) = P(V=x|L=x/2)P(L=x/2)/P(V=x)
と書き直せる。(1)でどちらの封筒を取る確率も1/2なのでP(V=x|L=x)とP(V=x|L=x/2)は 共に1/2に等しい。確率分布否定説は「 ∀x P(L=x) = P(L=x/2)」の一言で書ける。
P(L)が確率分布であるためには、規格化条件「ΣxP(L=x)=1」を満たす必要があるが、「
∀x P(L=x) = P(L=x/2)」と規格化条件を同時に満たすことは不可能である。(この下線部 を、以降、「規格化のジレンマ」と呼ぶことにする。)
以上で、確率分布否定説を採用すると規格化条件と矛盾することが示された。
注1
このような確率分布説肯定論に対し、続書の注 28 で、2 つの反論が為されている。反 論2は反論1を利用しているので、反論1のみを取り上げる。
> 反論 1 「{3 万,6 万}と{6 万,12 万}とで、いずれかの確率が大きかったはず」という
>の が その 通 り だっ た と して も 、 どち ら の 方 がど れ だ け大 き か った の か につ い て は全 然手
>がかりがない。したがって、主観確率で1/2ずつと考えるしかない。
手がか りがない からと いって、1/2 ずつ と考える論 法では、規格化条件を満たすことが できないということをすでに証明した。反論1は、規格化条件を満たすことができないの で 、 現 代 の 通 常 の 確 率 論 ( コ ル モ ゴ ロ フ 流
注 2
) と 両 立 し な い 。 続書 で は 確 率分 布 否 定論 に則って議論を継続しているが、そのような議論を行うには、コルモゴロフの公理系以外 の公理系に依拠する必要がある。しかし、本書でも続書でも、新しい公理系は提示されて いない。
報告者は、確率分布説を採用し、反論1に次のように答える。
「{3 万,6 万}と{6 万,12 万}とで、いずれかの確率が大きかったはず」というのが真だっ たとしても、どちらがどれだけ大きかったのかについては全然手がかりがない。手がかり
がないのは、問題文の記載内容が不十分だからである。
記載内容が不十分な問題文とは、次のような問題文である。「太郎君は直径 1km の池の 周りを時速8kmで走りました。この時、次郎君のABO式血液型は何でしょう?」このよ うな問題は、条件を補わなければ意味のある答えが出ない。条件を補った場合、補い方に よって4通りの相矛盾する答えが出る。しかし、答えの間に矛盾があるからと言って、こ の問題がパラドクスであることにはならない。単に、相反する複数通りの条件設定の補い かたがあっただけである。このような種類の、問題文の記載不足によって一見パラドクス に見える問題を、ヒュポドクスと呼ぶことにする。
確 率 の 問 題 に もヒ ュ ポ ドク ス は 存在 す る 。 論理 サ バ イバ ル 92「 ベ ル ト ラ ンの パ ラ ドク ス」においては、問題文の記述不足を3通りに補うことで3通りの相矛盾する答えを出し ている。心理パラドクス 68「庭のパラドクス」では 2 通りである。これらの問題は、本 報告の用語で分類すれば、ヒュポドクスである。
基本設定の2封筒問題P2e[B]も、P(L=X)の関数形が不明であるから、ヒュポドクスで ある。報告者は、次の2つを行うことでヒュポドクスを解決したことになると考えている。
①問題文に記述不足が存在することを指摘する。②記述不足を補えば解が存在することを 示す。①はここまでで行った。②は力尽くの計算でできる。
記述不足を補うことでP(L=X)の関数形が特定される。そのP(L=X)をP(L=X)
規
と置く。 R(M)規 = P(L=M|V=M)規/P(L=M/2|V=M)規
= P(V=M|L=M)
規 P(L=M)規 / P(V=M)規 P(V=M|L=M/2)規 P(L=M/2)規 / P(V=M)規
={ (1/2)P(L=M)規 } / { (1/2)P(L=M/2)規 }
= P(L=M)規 / P(L=M/2)規 このように、R(M)
規
は計算で求められる。この R(M)
規
が 1/2 を 超えていれば「交換」が 得であり、1/2未満であれば「保持」が得である。以上で②を行うことができた。
2 では、正解は?推論 A はどこが間違っていたのだろう?(ここでは、(1)で開封しな いで手を選ぶという条件で聞いている。開封する場合は4で論じる。)
本書の答え
推論 A では、(1)で取った封筒の中身を M とし、もう片方を M/2 または 2M とした。 しかし、存在するのは、N と2N という二つの可能性だけである。あなたが取ったのがN であれば、交換すれば2N-NでN の得。あなたが取ったのが2Nであれば、交換すればN の損。それぞれ確率は 1/2 だから、交換することの期待値はゼロとなって、常識通りに決 着する。
本書016【全体的証拠の原理】「関連のある情報はすべて証拠に含めよ」を無視すると、 推論Aに陥る。(報告者からも、特に異論なし)
3 なぜネクタイのパラドクスより本問は難しく感じられるのか? 本書の答え
ネクタイのパラドクスでは、具体物であるせいで、2つの物{ N, 2N }しかないという 認識に容易に従うことができた。本問では金額や小切手といった一種の記号を介するので、 3つの選択肢{M, M/2, 2M}があるように錯覚しやすいのだろう。
報告者の答え
ネクタイのパラドクスは、両方のネクタイを見たにもかかわらず目利きを誤った夫が、 少なくとも一人いたというだけである。二人の夫の見解を同時に採用すると矛盾を生じて しまうのは、二人の鑑定能力に差異があったからである。
本問では 2 人のプレーヤーが同じ能力を持っていた(同じ P(L)を前提としていた)と しても、ヒュポドクスを生じる。
4 (1)で開封した場合に戻ろう。中の金額が10万円であると分かった。今度こそ期待値 計算により25%の得ではないか?
本書の答え
1回限りのゲームなら、25%の得。しかし、100回 繰り返すと、損得なし。
1回限りのゲームで得をする理由は既出。100回繰り返すと損得なしになる理由は、「試 行全体の平均に照らして初期金額が大きいときに損しやすく、小さいときに得しやすい」 という事情。*確率分布説はこの事情を捕らえているつもりなのだろうが、1 度限りの試 行において初期金額の相対的大小の傾向を判定できるはずがないので、間違っているので ある。
報告者の反論 回 数 は 関 係 な い
注 3
。 問 題 文 に 記 載 さ れ て い ない 、 胴 元の 金 額 決定 方 法 を 補い 、 そ の決 定方法に従ってP(L=X)を求め、封筒の中身の金額Mを利用して、R(M)を求める。R(M)
>1/2なら「交換」が得。R(M)<1/2なら「保持」が得。
初期金額の相対的大小を 1 回目の試行で判定できないのは、P(L=X)が問題文に記載さ れていないから。ここを補ってしまえば、ただの確率問題になる。
* 以 降 の 記 述 は 、P(L=X) の 関 数 形 を 見 積 も る 際 に 、 反 復 試 行 の金 額 平 均 値の み が 手が かりになるという前提に立っている。しかし、試行を反復したときに P(L=X)が毎回同じ 関数形を取るという保証はないので、反復試行の金額平均値が手がかりになるとは限らな い。
5 あなたとA氏とで相対する形で、両者とも生涯一度きりのつもりでこのゲームをし、 両者とも自分の封筒の中身を確かめ、それぞれ自分の観点から「交換するのが得」と判断 する。両方とも交換が得と判断するのは不合理ではないか?
本書の答え
2 人は別々のゲームの中に身を置いているので、期待値計算が食い違ってもおかしくな い。試行がただ一度であれば、結果によって期待値判断を反証することはできない。
報告者の答え
も し 、「 交換 が 得 であ る 」 とい う 結 論を 、 少 額 側賞 金 額 によ ら ず 両者 が 必 ず出 すと いう のであれば、不合理である。しかし、両者が交換したがることが、少額側賞金額次第で起 きたり起きなかったりするのであれば、不合理ではない。
例えば、胴元が封筒の中身を決める際に、「サイコロを 1つ振り、1が出れば{10000 円 ,20000 円}を封筒に入れる。そ れ以外が出れば{20000 円,40000 円}を入れる」と決めてい たとする。サイコロが1の目を出し、あなたのMが20000円、AさんのMが10000円に なることがあり得る。この場合、両者は合理的に推論して、交換が得だと結論する。この ような結果が可能世界12個中の1個で出ることは、何もおかしくない。
想定される反論
規格化を義務づけても、元のパラドクスは解消されないはずである。例えば、 P(L=2)=1/3、P(L=4)=2/9、P(L=8)=4/27、P(L=16)=8/81、... P(L=2k)=(1/3)(2/3)k...
という確率分布は、規格化されているが、R(M)が恒に2/3であって1/2を超えるので、「交 換」が必ず得になってしまう。規格化されていても元のパラドクスを起こすではないか。
報告者の答え
元 の パ ラ ド ク ス が 起 き る 原 因 は 、P(L=X) の 規 格 化 可 能 性 に あ る の で は な い。 賞 金 額の 期待値が無限大になっていることが、∀M R(M)>1/2の原因である。推論Aに出てきた 分布も、賞金額の期待値が無限大になっていた。賞金額期待値が無限であるゲームに参加 しながら、手元の封筒に有限の金額しか書かれていないならば、交換するのが得と判断す るのは、ある意味で合理的である。
元のパラドクスが起きる必要十分条件は、「∀M R(M)>1/2」である。「∀M R(M)>1/2」 から「賞金期待値が無限大」を演繹することは容易である
注4
。その対偶である、「賞金期 待値が無限大にならないなら、元のパラドクスは起きない」も同時に証明できる。
した が っ て、「 賞 金 期待 値 が 無限 大 に なら な い こと を 保 証 する こ とは でき るの か」 が残 る問題の核心である。
報告 者 の 見解 で は、「 2封 筒 問題 に 限 らず 、 賞 金額 が 有 限 値で あ って 賞金 額の 事前 分布 を記述できるゲームであれば、現実のこの宇宙では保証できる。論理的に想像可能な他の 物理法則に従う宇宙では、賞金期待値が発散しても良い」である。
現実のこの宇宙では宇宙年齢は有限であり、しかも、論理サバイバル 009「トムソンの ランプ」的な超仕事は不可能である。したがって、この宇宙で走ったことのあるいかなる アル ゴ リ ズム も 有 限 の情 報 量 しか 吐 か なか っ た はず で あ る。(ブ ラ ック ホ ー ルに 突入 しな がらランプを点滅すれば、外部から見たときにトムソンのランプになる。という指摘は正 しい。しかし、ランプが事象の地平面に近づくと、外部者から見たランプの輝度は急速に 減衰 す る ので 、 結 局 有限 回 し か点 滅 を 検知 で き ない 。) 有 限の 情 報 量し か 得 られ ない 胴元 が、有限値の賞金額ペアを決めるのであれば、有限通りの有限値の中から賞金額ペアを設
定することになる。したがって、賞金額期待値は有限値であることが保証される。
一見すると、超仕事なしでも、賞金期待値が無限になるように賞金額を設定することは 可能であると思われるであろう。例えば、先ほどの確率分布
P(L=2)=1/3、P(L=4)=2/9、P(L=8)=4/27、P(L=16)=8/81、... P(L=2k)=(1/3)(2/3)k... に従って賞金額を設定することは、有限の手数で可能であるかのように思われる。
しかし、上記の確率分布に従う賞金額を生成する具体的な手順例は、次のようになる。 (i)少額側の賞金額の初期値を2とする。
(ii)サイコロ(を代表とする乱数発生器)を振る。 (iii)(ii)で出た目が 2以下なら現在の賞金額を採用する。
3以上なら賞金額を2倍にして(ii)に戻る。
仮に胴元が上記手順に従って賞金額を決めたと主張したとしても、プレーヤーは現在の 宇宙年齢と、現在までに手順が完了 したという情報から、k の上限値 kMAX を見積もり、 賞金期待値を有限であると判断できる。つまり、上記手順に、
(iv)サイコロをk# 回振ったら打ち切る。(k# は kMAXより大きい任意の整数) を付加した手順で賞金額を決めた物と見なすことができる。このようにして、現実のこの 宇宙では賞金期待値が無限大にならないことを保証できる。
超仕事が可能な宇宙では、上記の確率分布も可能である。それどころか、もっと極端な 宇宙では、∀x R(x)=1を満たす賞金額決定手順すら遂行可能である
注5
。確率分布否定論 者は、∀x R(x)=1が成り立つあちらの宇宙を舞台に議論をしていたのである。
2封筒問題のまとめ
あちらの宇宙で成り立つ推論 A と、こちらの宇 宙で成り立つ「P2e[B]は、どちらの手 を選択しても賞金期待値は変わらない」という事実との間には一見すると矛盾があるよう に見える。しかし、ゲーム当事者が従う物理法則を確定してしまえば、矛盾は解消する。
続書における「計算γ」
続書では第9章をまるごと2封筒問題に充てて、その章の後半部で「交換しないときの 獲得金額の期待値-交換したときの獲得金額の期待値」すなわちEhold - Eswapを 何通り かの方法で計算している。第9章が最後に肯定するのが「計算γ」である。
「計算γ」では、Ehold - Eswapを 次のように求める注6。
EholdγB - EswapγB =
・・・
+f×{(1/2)(20+40) - (1/2)(40+20)} ……封筒ペア{¥20,¥40}
+g×{(1/2)(40+80) -(1/2)(80+40)} ……封筒ペア{¥40,¥80}
+h×{(1/2)(80+160) -(1/2)(160+80) } ……封筒ペア{¥80,¥160}
+i×{(1/2)(160+320) -(1/2)(320+160) } ……封筒ペア{¥160,¥320}
+・・・
ここで 、f,g,h,i,...は 、そ れぞれの金額ペアを胴元が選ぶ確率であ って、総和が 1 である とされている。続書で計算γに対する最後の反論として登場する計算δを否定する際に、
「規格化のジレンマ」を使っているので、計算γは確率分布説を否定しない物と考えて良 いだろう。
確率分布説でEhold - Eswapを 求めると、次のようになる。
Ehold規B - Eswap規B =
・・・
+P(L = ¥20)
規
×{(1/2)(20+40) - (1/2)(40+20)} ……封筒ペア{¥20,¥40}
+P(L = ¥40)
規
×{(1/2)(40+80) - (1/2)(80+40)} ……封筒ペア{¥40,¥80}
+P(L = ¥80)
規
×{(1/2)(80+160) - (1/2)(160+80)} ……封筒ペア{¥80,¥160}
+P(L = ¥160)
規
×{(1/2)(160+320) -(1/2)(320+160)}……封筒ペア{¥160,¥320}
+・・・
P(L=X)は規格化されているので、総和が 1 である。したがって、P(L=X)を X の値に 応じてf,g,h,i,..のいずれかに置き換えれば、確率分布説から計算γを導出できる。
続書における「計算γ」の位置づけ
続書第9章第1~5節で、続書における答えを出している。この答えを「戦略特」と呼 ぶことにする。「戦略特」は、∀ x R(x)=1 を前提としている。したがって、こちらの宇 宙では成り立たない。第6節以降で、「無限大論者」が「計算α」「計算β」を出して「戦 略特」に反論している。著者は「計算γ」を用いて「無限大論者」を論駁しているが、「計 算γ」は規格化されているので、∀ x R(x)=1 を満たさない。したがって、「計算γ」で
「無限大論者」を論駁しても、「戦略特」を弁護したことにはならない。
「 計 算 γ」 は こ ち らの 宇 宙 で成 り 立 つ計 算 で あり 、「 戦 略特 」 は あち ら の 宇宙 で成 り立 つ答えである。
なお、「戦略特」の具体的内容は次の通りである。
封 筒 の 中 身 と し て 特 定 の 数 が 来 た と き だ け 、 交 換 せ よ 。 例 え ば 、M=60000 円 の と き に 限って交換せよ。そうすれば、必ず 保持するという「戦略保」に比べて、M ≠ 60000 円 のときは損得なし。M=60000円のときは25%の得。このように、得することはあっても、 損することはない。M≦100万 円の時は交換、でも良い。
追加問題
それでは、∀x R(x)=1が成り立つあちらの宇宙では、必ず「戦略特」が成り立つのだ ろうか?
以下、∀x R(x)=1が成り立つあちらの宇宙での2封筒問題をP2e[1]と呼ぶことにする。
確 率 分 布 否 定 論 者 に とっ て 、 この P2e[1] こ そが 真 の 2封 筒 問 題で あ ろ う 。こ の 問 題の 難しい点は、力尽くで解こうとすると、続書で「括弧付け替え計算」と呼ばれている計算 上の困難が生じ、相矛盾する複数の計算結果がいくらでも得られてしまう所にある。
胴元の少額側賞金額決定アルゴリズムを、次のように仮定しよう。 (0) 胴元は超仕事を行って整数nを得て、$ 2
n
を少額側の賞金額とする。
この仮定は、計算負荷を減らすためであって、問題の構造をとくに変えるものではない。 この賞金額を前提に、以下の戦略の利得を比較しよう。
「戦略換」:(2)で必ず「交換」する。
「戦略保」:(2)で必ず「保持」する。
「戦略特」:(1)で見た金額が$1であるときに限り(2)で「交換」する。
「戦略特+」:(1)で見た金額が$1または$2であるときに限り(2)で「交換」する。
「戦 略+特+」: (1)で 見 た金 額 が$0.5,$1 ま た は$2 で あ る と き に限 り (2)で 「 交換 」す る。
「戦略+特++」:(1)で見た金額が$0.5,$1,$2,ま たは$4であるときに限り(2)で「交換」する。
…
まず、「戦略保」を採用した人がもらえる賞金額の可能な値を、次のように一覧する。 保{ ・・・(0.125, 0.25), (0.25, 0.5),(0.5, 1),(1, 2),(2, 4),(4, 8), ・・・ }
胴元の準備額ごとに丸カッコでくくり、準備額が小さい方から左から順に書いた。丸カッ コ内は、少額側を(1)で取ったケースを左に書いた。
次に、「戦略特」を採用した人がもらえる額の可能な値を一覧する。
特{ ・・・(0.125, 0.25), (0.25, 0.5),(0.5, 0.5), (2, 2),(2, 4),(4, 8),・・・ }
「戦略保」との相違点を太字で書いた。
プレーヤーは、「自分は封筒の中身を Mと知った。保持と交換、どちらがいくら得だろ う?」と考えて、下記の枠のいずれかをM の値に従って採用し、「1 つの枠で 0.5 の得、 それ以外で損得なし」と判断するだろう。
胴元は、「自分は少額側賞金額として L を入れた。プレーヤーが保持するのと交換す るのと、どちらがいくら賞金額が大きくなるだろう?」と考えて下記の枠のいずれかを
Lの値に従って採用し、「1つの枠で0.5の出費減、1つの枠で1の出費増。それ以外で変
動なし」と判断するだろう。胴元とプレーヤーの見解は、この時点では一致している。
「 交 換 」 を 選 ぶ た め の 条 件 を 広 げ て い く と 、 次 の よ う に 、 真 上-真 下 比 較 に お け る 利 得 が増えていく。一般に、「2
a
≦M≦2 b
であれば交換する」という戦略は、2
b+1-2a-1の利
得をもたらす。
特+ { ・・・(0.125, 0.25),(0.25, 0.5) ,(0.5, 0.5), (2, 1), (4, 4),(4, 8),・・・ } +特+ { ・・・(0.125, 0.25),(0.25, 0.25),( 1, 0.5), (2, 1), (4, 4), (4, 8),・・・ } +特++{ ・・・(0.125, 0.25),(0.25, 0.25),( 1, 0.5), (2, 1), (4, 2),(8, 8),・・・ }
上記の一連の戦略は、a→-∞、b→+∞の極限で、「戦略換」に一致する。
換 {・・・(0.25, 0.125),(1, 0.25),( 1, 0.5), (2, 1), (4, 2),(8, 4),・・・}
「 戦 略 換」 と 「 戦 略保 」、 どち ら が どれ だ け 利 得が 大 き いだ ろ う か? プ レ ーヤ ーの 観点 からは、「すべての枠内で交換が 0.25M の 得」となり、胴元の観点からは「すべての枠内 で変動なし」となる。
このように、無限と無限を比較する計算では、どの計算を先に処理するかによって、異 なる結果が出てしまう。胴元でもプレーヤーでもない別の視点からこのゲームに関わる者 がいれば、また違った答えを出すであろう。
我々が通常用いているコルモゴロフ流確率論や本能的直観が、あちらの宇宙でこのよう に無力になってしまう原因は、コルモゴロフ流確率論や本能的直観がこちらの宇宙の確率 現象を扱うために生まれたものだからである。であれば、あちらの宇宙で生じる確率論な いしは確率に関する直観は、あちらの宇宙での確率現象を考えるのに有力であると期待で きる。
あちらの宇宙での確率論を、我々がこちらの宇宙に居ながらにして得るには、次の方法 が考えられる。
・あちらの宇宙における生物または学説の発生と進化的適応をシミュレートする。進化 的適応競争に勝ち抜きやすい生物または学説こそが、より正しい確率論を持っている。ど んな競争相手にも勝てる生物または学説が、その宇宙における真の確率論の保有者である。
もう少し詳細に書くと、次のようになる。
・あちらの宇宙で確率論Ψと確率論Φのどちらがより正しいかを知りたければ、次を行う とよい。
<0> Ψを 信じ る生 物 とΦ を信 じる 生物 を十 分多 い同 数 Z(有 限で なく て もよ い)ず つだけ 用意する。
<1>各個体に生涯一度だけ、互いに独立に、ギャンブルgを行わせる。
<2>g の 得 点 を 、そ の 個 体が 次 世 代 に残 す 子 の個 体 数 とす る 。 子は 親 と 同 じ確 率 論 を信 じる。
<3> 「<1><2>を十分な回数繰り返した後に、その地を遠くから眺めたとして、Φ種を見 つける可能性は無視できる」というgが存在するならば、ΨはΦより正しい。
この判定方法は、一見すると確率論の優劣を判定する万能の方法に見える。報告者は、 この宇宙での眠り姫問題(論理サバイバル98)における1/2論と1/3論をこの方法で比較し て1/3論に軍配を上げたことがある。
し かし 、得 点期 待値 が無 限大 で あっ たり 、Z が 無限 大で あっ たり す る場 合、 <3> におけ るランダムピックアップが無限大と無限大との比較になってしまい、一見するとパラドク スに陥るように見える。
その場合でも、ランダムピックアップの手順を詳細に定めれば、<3>の意味は確定する。 ランダムピックアップの手順を詳細に定めるとは、こちらの宇宙で言うところの、光学や 遺伝学や動物行動学などを定めるということである。つまり、あちらの宇宙における物理 法則を定めることで、あちらの宇宙での正しい確率論が決まるのである。
ここまでの議論から言える、物理法則と確率論の間に成り立つ興味深い関係を一言でまと める。
「どの確率論が成り立つかは、物理法則に依存する」
メタ確率論構築に向けて
この宇宙から生涯出られそうにない1生物である報告者が、あちらの宇宙における確率 論に熱くなっているのを見て、奇妙に思っている人も多いだろう。なぜこんな方向に話を 持っていって熱中しているのか?
報 告 者 は、 可 能 世 界論 と 人 間原 理 を、「な ぜ 我 々の 宇 宙 では こ の 物理 法 則 が成 り立 って いるのか?」問いに対する、現時点での最有力の武器であると考えている。可能世界論と 人間原理を使えば、次のように答えられるからだ。
「ほかの宇宙ではほかの物理法則が成り立っているだろう。宇宙たちのうち、自分自身 を認識したり宇宙を観測してモデルを提唱したり検証したり改定したりする内部構造を持 つ宇 宙 は、「 我々 の 宇宙 」 と 呼ば れ る 確率 が 高 い 。こ の 宇 宙の 物 理 法則 は ● ●と いう 特徴 を持つから我々のような観測者が大量に発生し、「我々の宇宙」になったのだよ」
このような答えが有意味であるためには、すべての宇宙たちを対等に扱える確率論(以 下で は 「 メタ 確 率 論」)が 存 在し て い る必 要 が あ る。 コ ル モゴ ロ フ 流は メ タ 確率 論で はな い。物理法則の候補は無限個存在するので、対等に扱おうとしたら規格化のジレンマに直 面するからだ。
だからほかの宇宙における確率論を構築したい。任意の宇宙における確率論を構築する 手法を編み出したい。任意の宇宙における確率論を構築する手法が存在すれば、メタ確率 論を構築するための有力な足場になるだろう。
次の手順でメタ確率論を構築できないだろうか。
1. 量子力学の多世界解釈に適当な仮定を追加することで、コルモゴロフ流確率論を導出 する。これによって、力学+X→確率論 を満たすXを、我々の宇宙において解く。 2. 他の宇宙における力学に、1.で得たXを追加することで、その宇宙における確率論を 導出できるか、試す。たぶん導出できない。Xを改良する必要と、そのための方針が 見えてくるだろう。この改良によって、任意の宇宙における力学からその宇宙におけ る確率論を導出できる「確率論ジェネレータ」になるまでXを磨き上げる。
3. 磨かれたXを、「可能な宇宙をすべて集めたもの」という宇宙に適用する。
1.の 目 途 は す で に 立 っ て お り 、「 自 意 識 と は い か な る 情 報 処 理 か 」 と い う 問 題 を 正 面 突 破しながらコルモゴロフ流確率論を導出する予定である。
なお、1.で コペン ハーゲン 解釈を 用いな い理由は、 コペンハーゲン解釈が確率論を前提 としているので、論点先取になってしまうからである。多世界解釈は確率論を前提とせず、 しかも、明快に定式化されているので、確率論の導出元として適切である。
注0 このようにR(M)を定義すると、EholdとEswapの大小を次のように簡潔に書ける。
Ehold< Eswap ⇔ 1/2< R(M) Ehold = Eswap ⇔ 1/2 = R(M) Ehold> Eswap ⇔ 1/2> R(M) 証明
Eswap /Ehold ={ P(L=M|V=M) ×2M+P(L=M/2|V=M)×M/2 }/ M
={ R/(1+R) ×2M+1/(1+R)×M/2 } / M
= 2 - 3/(2R+2)
右辺が、Rについて単調増加で、R=1/2のとき1になることは容易に確かめられる。
注 1 「Rの値は開封の前後で変化するのだ。ここで行われた計算では開封前のRしか論 じて いな いで はな いか 。パ ラ ドク スに 寄与 する のは 開封 後の R であ って 、開封に よって 中身がMであることがわかれば、R(M)=1になるのだ」という反論が可能かも知れない。 しかし、「M の値にかかわらず開封後には R(M)=1になる」という命題と「開封前の時点 で∀M R(M)=1である」という命題は同値である。後者の不可能性を証明すれば、前者 を証明したことになる。
注2 コルモゴロフの確率の公理
(a) すべての事象 A に対し 0 ≦ P(A) ≦ 1 (b) P(Ω) = 1(Ω : すべて可能な結果の集合) (c) 互いに排反な事象 A1, A
2, A3, · · · に 対して
P(∪Ak) =ΣAk
k k
注3 Wikipediaのサンクトペテルブルクのパラドックスの記事(2014年8月16日閲覧)に 拠れ ば 、「 この ゲ ー ムの 期 待 値が 無 限 大と な る の は無 限 回 ゲー ム を 行う こ と が仮 定さ れる 必要があり、ゲームの回数が有限回数である場合、期待値は遥かに小さな値に収束する」 とW.フェラーが証明したとされている。実際、その記事の参考文献『確率論とその応用I 下』W.フェラー、河田龍夫訳、紀伊國屋書店(1961)を読むと、n回だけサンクトペテルブ ルクの賭けに参加するならば、公平な参加料は n log2 nであることが証明されている。 この よ う に、 公 平 な 参加 料 が 参加 回 数に 依存 す るこ とは あり 得る 。し かし 、Wikipedia の 記事は誤っている。フェラーの言う「公平な参加料」とは、n 回のギャンブルの利得の総 和をSn としたときの、下の式を満たす en のことであるので、有限回だけ参加したときの 利得の期待値の計算には関係しない。
∀ε>0 lim P{ |Sn/en - 1 |>ε } = 0 n→∞
注5
その具体的手順は次の通り。
(i) 超仕事を行ってコインを可算無限回投げ、表裏裏表裏・・・という無限列を作成する。 (ii) その無限列が、「N 投目以降は全部表である」を満たすN を持つか、調べる。持たな かったら(i)に戻る。
(iii) 無限列の表を 0 に、裏を 1 に読み替えて、列を左右反転し、2 進数として読み、そ の値をkとする。kは0以上の有限値の整数であり、kの値は一様分布に従う。
(iv) 自然数を整数に写す適当な1対1対応でkを整数nに写し、2 n
を少額側の賞金額と する。
注6
厳密には続書では波括弧の内側は (1/2)(20+40) - (1/2)(40+20) ではなく
(1/2) (20-40) + (1/2)(40-20) で ある。 両者が同 じであ ることは 、続書 で「計算 α」を 論じた際に保証済みである。
注4
P(L=X)は確率分布なので、∃x P(L=x)>0。これを例化してP(c0)>0 を得る。
∀M R(M)>1/2 は、∀M{P(L=M)/ P(L=M/2)>1/2}であり、さらに書き換えると
∀x∈D{ P(L=x) < 2 P(L=2x) }となる。この不等式から、
0< P(L=c0) < 2 P(L=2c0) < 4 P(L=4c0) < 8 P(L=8c0) <・・・ が言える。(★)
賞金額は少額側の金額以上であるから、賞金期待値Eは、E≧ Σ x P(L=x)を満たす。
x∈正の有理数
E ≧ Σx P(L=x) の右辺は正の項の和なので、いくつかの項を右辺からそぎ落として も不等式は成り立つ。よって、
E≧ c0 P(L=c0) + 2c0 P(L=2c0) + 4c0 P(L=4c0) + 8c0 P(L=8c0) +…
が言える。右辺の各項に(★)の不等式を使うと、どの項も c0 P(L=c0)以上と言えるので E≧ c0 P(L=c0) + c0 P(L=c0) + c0 P(L=c0) + c0 P(L=c0) + … = ∞
となり、期待値が発散することが分かる。