個人の意思決定
~期待効用最大化~
期待効用最大化
中村國則
(東京工業大学)
オムレツの問題
• 妻がオムレツを作っていたが、途中で外出しな
ければならなくなった。そこでオムレツ作りを途
中から引き受けたが、台所には
5つの卵の殻と
ボールの中で混ぜられた卵 そして割られず
ボ ルの中で混ぜられた卵、そして割られず
に残された卵が1つある。あなたはどうするか?
ありえる可能性
1. 6個目の卵を割ろうとしていて、途中で外出しなけ ればならなくなった 2. 6個目の卵は多すぎると考え、残しておいた 3 最後の卵は実は賞味期限切れで、これを使うとオ 3. 最後の卵は実は賞味期限切れで、これを使うとオ ムレツが台無しになるから捨てようと思っていた もう1つの卵を使うべきか? 捨てるべきか?どう考えたらいい?
• それぞれの可能性の見込みはどれくらいだろうか? • オムレツが出来たときどれくらいうれしいだろうか? 見込みを表すのが確率 うれしさを表すのが効用 見込みを表すのが確率,うれしさを表すのが効用 確率と効用を状況を整理して考え、自分に最もよいと 思われる決定をしよう 卵が5個使われて、 1つあまっている 余った1個を使う 腐ってる 腐ってない オムレツ台無し オムレツ台無し 6 6個分のオムレツができる個分のオムレツができる 決定に伴う結果 余った1個を使わない 5 5個分のオムレツができる個分のオムレツができる 腐ってる 腐ってない 5 5個分のオムレツができる,個分のオムレツができる, しかし卵 しかし卵11個無駄個無駄 自分の決定 どのくらいの可能性?意思決定に必要なこと
• 一番良いものを選ぶ
• “
不確実さ
と
良さ
を見積もり,その見積もりで
一番良いを決めなければいけない
“
番良い
”を決めるには
ある物差し
の上で
• “一番良い”を決めるには,
ある物差し
の上で
何かが一番大きいことが示されなければならない
R Q P期待値(Expected value)
考えてみよう:パッチョリの問題
• 先に6勝した方が賭け金を全額得るという,と
いうゲームを2名でやっているとする
• ある事情で,Aが5勝,Bが3勝したところで中止
になってしまった
になってしまった
• 賭け金はどのように分配したらよいだろう?
勝 勝 勝 勝 勝 勝 勝 勝 勝 勝 勝 勝 A B色々な考え方
• 5勝3敗なのだから、
5対3がいい
(パッチョリと
いう人の答え)
• 6対1がいい
(カルダノという人の答え,根拠は
よく分からない)
よく分からない)
• 確率的に考えて,
7対1がいい
(パスカルという
人の答え
)
パスカルの答え
• ゲームが続いたと考えて,最終的に2人が勝
つ確率がどの程度になるかを考えよう
• 最終的な決着パターン
Aが最終的に勝利
• Aが最終的に勝利
– Aが次に勝つ – Bが次に勝って,その次にAが勝つ – Bが2連勝した後,その次にAが勝つ• Bが最終的に勝利
– Bが3連勝パスカルの答え
• Aが最終的に勝つ確率
:7/8
– Aが次に勝つ=1/2 – Bが次に勝って,その次にAが勝つ=1/2×1/2=1/4 – Bが2連勝した後 その次にAが勝つ=Bが2連勝した後,その次にAが勝つ 1/2×1/2×1/2=1/8• Bが最終的に勝つ確率:
1/8
– Bが3連勝=1/2×1/2×1/2=1/8• 確率の比で考えると7:1なので,賭け金もこの配分
にすべし
期待値という考え方
• 不確実性と結果の大きさとを掛け合わせたも
のを評価対象とする
• 確率と確率変数の積の総和をとる
例えば サイ ロの目の期待値は – 例えば,サイコロの目の期待値は, 1×1/6+2×1/6+3×1/6+4×1/6+5×1/6+6×1/6 =(1+2+3+4+5+6) ×1/6=21/6=3.5 – 偏りのないコインを投げて,表が出たら1000円, 裏が出たら500円貰える賭けの期待値は 1000×1/2+500×1/2=750円便利であることは確か
• 期待値が高い選択をすべき
という議論は非常に
説得的
– 偏りのないコインを投げて,表が出たら2000円貰え, 裏が出たら1000円失うという賭けを 400円払ったら 裏が出たら1000円失うという賭けを,400円払ったら 出来るとする.この賭けには乗った方がいいか? – 期待値は2000×1/2+(-1000)×1/2=500円 – 期待値で考えれば,乗った方が得になる しかし・・・・・聖ペテルズブルグのパラドクス
• 偏りのないコインを何回も投げる。もし一度目に
表が出たら、200円もらえる。もし一度目が裏で、
二度目で初めて表が出たら、400円もらえる。も
し一度目も二度目も裏で 三度目で初めて表が
し 度目も二度目も裏で、三度目で初めて表が
出たら、800円もらえる。つまり、n度目で初めて
表が出たとき、200×2
n-1円もらえる。あなたは
このゲームに対して
どのくらいまで参加費を
払っていい
と思うか?
答え:∞円払ってもいい
• 1回目で終わる場合:1/2×200=100
• 2回目で終わる場合:1/2×1/2×400=100
• 3回目で終わる場合:1/2
3×200×2
3=100
・・・・・・
• ⇒期待値はこのまま無限に足し合わせた値
なので,総和は∞円になる
• 期待値だけに従って行動を決めると変なこと
になる
期待効用(Expected utility)
ダニエル・ベルヌイの答え
• 期待
効用
という考え方
– 結果の大きさそのものではなく,その結果から見 出す物事の良さを指標とする,その良さを効用と 呼ぶ,効用に確率を掛けた期待値が期待効用 呼ぶ,効用に確率を掛けた期待値が期待効用 – 金額の大きさを適切に変換する関数(効用関数) を設定し,その関数に従って物事を決める – 例えば,聖ぺテルスブルグのパラドクスも,効用 関数として対数(log (金額))をとると,現実的な答 えになる対数をとると
• 1回目で終わる場合:1/2×200=100
• 2回目で終わる場合:1/2×1/2×400=100
• 3回目で終わる場合:1/2
3×200×2
3=100
・・・・・・
• ⇒期待値はこのまま無限に足し合わせた値
なので,総和は∞円になる
• 期待値だけに従って行動を決めると変なこと
になる
対数をとると
• 1回目で終わる場合:1/2×
log200
=2.7
• 2回目で終わる場合:1/2×1/2×
log400
=1.5
• 3回目で終わる場合:1/2
3×
log800
=0.8
・・・・・・
– 期待値をこのまま無限に足し合わせても有限 6 7 8 9 10 4 5 0 2000 4000 6000 8000 10000 12000 ちなみに,対数のグラフここで1つ注意
• 効用関数が
対数でなければいけない理由はど
こにもない
,対数で効用を表現すれば聖ぺテル
スブルグのパラドクスを解決できることがあると
いうだけである
いうだけである
• ポイントは飽くまで期待値だけで考えると不都合
が多いので,
より一般的な効用関数
を考えよう,
ということ
その人にとっての効用を知りたい
• ある選択肢の効用が
どれくらいの大きさか
を
測りたい
• 物事の良さは比べた結果しか分からない
– リンゴとみかん,どちらがどれくらい好きかを知りた くとも,実際にはどちらを好きかしか分からない• 序数的効用
から
基数的効用
を知りたい
– 序数:順序をあらわす,数の差には意味はない – 基数:大きさを表す,差に意味がある順序から物差しを作るために
• 不確実性を含む意思決定の結果から基数的な尺
度が構成されるためには,決定結果が下の
4つの
性質を満たさなければならない
完備性:好き嫌いをはっきりしなければいけない – 完備性:好き嫌いをはっきりしなければいけない – 推移性:堂々巡りになってはいけない – 独立性:関係ないものを気にしてはいけない – 連続性:穴があってはいけない完備性(Completeness)
• 全ての選択対象xとyについて,x
yあるい
は
y
xが必ず成り立つ
• どっちが好きか(あるいは全く同じに好き)はは
っきりとわかっていなければいけない
≥
≥
っきりとわかっていなければいけない
• 「比べらんなーい」は許されない
推移性(Transitivity)
• 全ての選択対象x,y,zについて
x
yかつy
zならば必ずx
zである
• ジャンケンのような
堂々めぐりの関係
が成り
立っていてはいけない
≥
≥
≥
立っていてはいけない
A < B < C 小 大 A B > C完備性と推移性だけでは×
• 完備性,推移性を満たすと序数尺度が成立
する,しかし,
基数尺度は成立しない
– 例えば,“確率0.4でx,確率0.6でy”と“確率1でz” を比較する場合 u(x)=5 u(y)=1 u(z)=2 の場 を比較する場合,u(x) 5, u(y) 1, u(z) 2, の場 合と,u(y)=1, u(z)=3, u(x)=5とでは,序数的効用 を満たすが基数的効用は満たさない独立性(Independency)
• P
Qならば,任意の確率pに対して
pP+(1-p)R
pQ+(1-p)Rである
• まったく同じものが加わったならば,
好みの関係は一緒でなければならない
≥
≥
P Q P Q R R連続性(Continuity)
• P
Q
Rならば,pP+(1-p)RとQが無差別
になる(全く同じになる)確率pが存在する
– P=9,Q=7,R=5とすると,0.5*5+0.5*9=7存在しないと
PとRとの間に穴があることに
≥ ≥
• 存在しないと,PとRとの間に穴があることに
なる,効用を測る物差しの中に絶対測れない
点がある
R Q P期待効用最大化仮説
• 確実な選択対象xに対して効用が対応し,リ
スクを含む選択対象の選好順序は効用の期
待値の大小に従う
意思決定者は期待効用を最大化する選択肢
• 意思決定者は期待効用を最大化する選択肢
を選択する
以上の4つの性質を満たす時
• 期待効用仮説が成立するような効用関数が
存在する
• さらに,選好順序が期待効用仮説を満たす時,
選好順序に対応する効用関数(ノイ
選好順序に対応する効用関数(ノイマン‐モル
ゲンシュテルン効用関数)は正一次変換を除い
て一意に定まる
常識じゃないか!!
• “あるものが別のものより好まれるか,同じか
のどちらか”とか,特別なことじゃないじゃん!!
• その特別でないことが満たされないと
おかしなこと
が起きます
おかしなこと
が起きます
• Dutch book argument とよばれています
Dutch book argument:必敗の状況
• ある人が仮に という選好を有しているとすると,