• 検索結果がありません。

<4D F736F F F696E74202D208AFA91D28CF897708DC591E589BB2E B8CDD8AB B83685D>

N/A
N/A
Protected

Academic year: 2021

シェア "<4D F736F F F696E74202D208AFA91D28CF897708DC591E589BB2E B8CDD8AB B83685D>"

Copied!
10
0
0

読み込み中.... (全文を見る)

全文

(1)

個人の意思決定

~期待効用最大化~

期待効用最大化

中村國則

(東京工業大学)

オムレツの問題

• 妻がオムレツを作っていたが、途中で外出しな

ければならなくなった。そこでオムレツ作りを途

中から引き受けたが、台所には

5つの卵の殻と

ボールの中で混ぜられた卵 そして割られず

ボ ルの中で混ぜられた卵、そして割られず

に残された卵が1つある。あなたはどうするか?

ありえる可能性

1. 6個目の卵を割ろうとしていて、途中で外出しなけ ればならなくなった 2. 6個目の卵は多すぎると考え、残しておいた 3 最後の卵は実は賞味期限切れで、これを使うとオ 3. 最後の卵は実は賞味期限切れで、これを使うとオ ムレツが台無しになるから捨てようと思っていた もう1つの卵を使うべきか? 捨てるべきか?

どう考えたらいい?

• それぞれの可能性の見込みはどれくらいだろうか? • オムレツが出来たときどれくらいうれしいだろうか? 見込みを表すのが確率 うれしさを表すのが効用 見込みを表すのが確率,うれしさを表すのが効用 確率と効用を状況を整理して考え、自分に最もよいと 思われる決定をしよう 卵が5個使われて、 1つあまっている 余った1個を使う 腐ってる 腐ってない オムレツ台無し オムレツ台無し 6 6個分のオムレツができる個分のオムレツができる 決定に伴う結果 余った1個を使わない 5 5個分のオムレツができる個分のオムレツができる 腐ってる 腐ってない 5 5個分のオムレツができる,個分のオムレツができる, しかし卵 しかし卵11個無駄個無駄 自分の決定 どのくらいの可能性?

意思決定に必要なこと

• 一番良いものを選ぶ

• “

不確実さ

良さ

を見積もり,その見積もりで

一番良いを決めなければいけない

番良い

”を決めるには

ある物差し

の上で

• “一番良い”を決めるには,

ある物差し

の上で

何かが一番大きいことが示されなければならない

R Q P

(2)

期待値(Expected value)

考えてみよう:パッチョリの問題

• 先に6勝した方が賭け金を全額得るという,と

いうゲームを2名でやっているとする

• ある事情で,Aが5勝,Bが3勝したところで中止

になってしまった

になってしまった

• 賭け金はどのように分配したらよいだろう?

勝 勝 勝 勝 勝 勝 勝 勝 勝 勝 勝 勝 A B

色々な考え方

• 5勝3敗なのだから、

5対3がいい

(パッチョリと

いう人の答え)

• 6対1がいい

(カルダノという人の答え,根拠は

よく分からない)

よく分からない)

• 確率的に考えて,

7対1がいい

(パスカルという

人の答え

)

パスカルの答え

• ゲームが続いたと考えて,最終的に2人が勝

つ確率がどの程度になるかを考えよう

• 最終的な決着パターン

Aが最終的に勝利

• Aが最終的に勝利

– Aが次に勝つ – Bが次に勝って,その次にAが勝つ – Bが2連勝した後,その次にAが勝つ

• Bが最終的に勝利

– Bが3連勝

パスカルの答え

• Aが最終的に勝つ確率

:7/8

– Aが次に勝つ=1/2 – Bが次に勝って,その次にAが勝つ=1/2×1/2=1/4 – Bが2連勝した後 その次にAが勝つ=Bが2連勝した後,その次にAが勝つ 1/2×1/2×1/2=1/8

• Bが最終的に勝つ確率:

1/8

– Bが3連勝=1/2×1/2×1/2=1/8

• 確率の比で考えると7:1なので,賭け金もこの配分

にすべし

期待値という考え方

• 不確実性と結果の大きさとを掛け合わせたも

のを評価対象とする

• 確率と確率変数の積の総和をとる

例えば サイ ロの目の期待値は – 例えば,サイコロの目の期待値は, 1×1/6+2×1/6+3×1/6+4×1/6+5×1/6+6×1/6 =(1+2+3+4+5+6) ×1/6=21/6=3.5 – 偏りのないコインを投げて,表が出たら1000円, 裏が出たら500円貰える賭けの期待値は 1000×1/2+500×1/2=750円

(3)

便利であることは確か

• 期待値が高い選択をすべき

という議論は非常に

説得的

– 偏りのないコインを投げて,表が出たら2000円貰え, 裏が出たら1000円失うという賭けを 400円払ったら 裏が出たら1000円失うという賭けを,400円払ったら 出来るとする.この賭けには乗った方がいいか? – 期待値は2000×1/2+(-1000)×1/2=500円 – 期待値で考えれば,乗った方が得になる しかし・・・・・

聖ペテルズブルグのパラドクス

• 偏りのないコインを何回も投げる。もし一度目に

表が出たら、200円もらえる。もし一度目が裏で、

二度目で初めて表が出たら、400円もらえる。も

し一度目も二度目も裏で 三度目で初めて表が

し 度目も二度目も裏で、三度目で初めて表が

出たら、800円もらえる。つまり、n度目で初めて

表が出たとき、200×2

n-1

円もらえる。あなたは

このゲームに対して

どのくらいまで参加費を

払っていい

と思うか?

答え:∞円払ってもいい

• 1回目で終わる場合:1/2×200=100

• 2回目で終わる場合:1/2×1/2×400=100

• 3回目で終わる場合:1/2

3

×200×2

3

=100

・・・・・・

• ⇒期待値はこのまま無限に足し合わせた値

なので,総和は∞円になる

• 期待値だけに従って行動を決めると変なこと

になる

期待効用(Expected utility)

ダニエル・ベルヌイの答え

• 期待

効用

という考え方

– 結果の大きさそのものではなく,その結果から見 出す物事の良さを指標とする,その良さを効用と 呼ぶ,効用に確率を掛けた期待値が期待効用 呼ぶ,効用に確率を掛けた期待値が期待効用 – 金額の大きさを適切に変換する関数(効用関数) を設定し,その関数に従って物事を決める – 例えば,聖ぺテルスブルグのパラドクスも,効用 関数として対数(log (金額))をとると,現実的な答 えになる

対数をとると

• 1回目で終わる場合:1/2×200=100

• 2回目で終わる場合:1/2×1/2×400=100

• 3回目で終わる場合:1/2

3

×200×2

3

=100

・・・・・・

• ⇒期待値はこのまま無限に足し合わせた値

なので,総和は∞円になる

• 期待値だけに従って行動を決めると変なこと

になる

(4)

対数をとると

• 1回目で終わる場合:1/2×

log200

=2.7

• 2回目で終わる場合:1/2×1/2×

log400

=1.5

• 3回目で終わる場合:1/2

3

×

log800

=0.8

・・・・・・

– 期待値をこのまま無限に足し合わせても有限 6 7 8 9 10 4 5 0 2000 4000 6000 8000 10000 12000 ちなみに,対数のグラフ

ここで1つ注意

• 効用関数が

対数でなければいけない理由はど

こにもない

,対数で効用を表現すれば聖ぺテル

スブルグのパラドクスを解決できることがあると

いうだけである

いうだけである

• ポイントは飽くまで期待値だけで考えると不都合

が多いので,

より一般的な効用関数

を考えよう,

ということ

その人にとっての効用を知りたい

• ある選択肢の効用が

どれくらいの大きさか

測りたい

• 物事の良さは比べた結果しか分からない

– リンゴとみかん,どちらがどれくらい好きかを知りた くとも,実際にはどちらを好きかしか分からない

• 序数的効用

から

基数的効用

を知りたい

– 序数:順序をあらわす,数の差には意味はない – 基数:大きさを表す,差に意味がある

順序から物差しを作るために

• 不確実性を含む意思決定の結果から基数的な尺

度が構成されるためには,決定結果が下の

4つの

性質を満たさなければならない

完備性:好き嫌いをはっきりしなければいけない – 完備性:好き嫌いをはっきりしなければいけない – 推移性:堂々巡りになってはいけない – 独立性:関係ないものを気にしてはいけない – 連続性:穴があってはいけない

完備性(Completeness)

• 全ての選択対象xとyについて,x

yあるい

y

xが必ず成り立つ

• どっちが好きか(あるいは全く同じに好き)はは

っきりとわかっていなければいけない

っきりとわかっていなければいけない

• 「比べらんなーい」は許されない

(5)

推移性(Transitivity)

• 全ての選択対象x,y,zについて

yかつy

zならば必ずx

zである

• ジャンケンのような

堂々めぐりの関係

が成り

立っていてはいけない

立っていてはいけない

A < B < C 小 大 A B > C

完備性と推移性だけでは×

• 完備性,推移性を満たすと序数尺度が成立

する,しかし,

基数尺度は成立しない

– 例えば,“確率0.4でx,確率0.6でy”と“確率1でz” を比較する場合 u(x)=5 u(y)=1 u(z)=2 の場 を比較する場合,u(x) 5, u(y) 1, u(z) 2, の場 合と,u(y)=1, u(z)=3, u(x)=5とでは,序数的効用 を満たすが基数的効用は満たさない

独立性(Independency)

• P

Qならば,任意の確率pに対して

pP+(1-p)R

pQ+(1-p)Rである

• まったく同じものが加わったならば,

好みの関係は一緒でなければならない

P Q P Q R R

連続性(Continuity)

• P

Q

Rならば,pP+(1-p)RとQが無差別

になる(全く同じになる)確率pが存在する

– P=9,Q=7,R=5とすると,0.5*5+0.5*9=7

存在しないと

PとRとの間に穴があることに

≥ ≥

• 存在しないと,PとRとの間に穴があることに

なる,効用を測る物差しの中に絶対測れない

点がある

R Q P

期待効用最大化仮説

• 確実な選択対象xに対して効用が対応し,リ

スクを含む選択対象の選好順序は効用の期

待値の大小に従う

意思決定者は期待効用を最大化する選択肢

• 意思決定者は期待効用を最大化する選択肢

を選択する

以上の4つの性質を満たす時

• 期待効用仮説が成立するような効用関数が

存在する

• さらに,選好順序が期待効用仮説を満たす時,

選好順序に対応する効用関数(ノイ

選好順序に対応する効用関数(ノイマン‐モル

ゲンシュテルン効用関数)は正一次変換を除い

て一意に定まる

(6)

常識じゃないか!!

• “あるものが別のものより好まれるか,同じか

のどちらか”とか,特別なことじゃないじゃん!!

• その特別でないことが満たされないと

おかしなこと

が起きます

おかしなこと

が起きます

• Dutch book argument とよばれています

Dutch book argument:必敗の状況

• ある人が仮に という選好を有しているとすると,

.

,

,

and

B

C

and

C

A

B

A

p

p

 

p

BとAを1円で取り替える (Bを持っている) ⇒CとBを1円で取り替える(Cを持っている) ⇒AとCを1円で取り替える(Aを持っている) ⇒最初に戻る というループが成立する.これは無限に繰り返せるこれは無限に繰り返せる.

確率(Probability)

比較的新しい概念

• 定式化が始まったのは18世紀くらいから

– 未だに「確率とは何か」という問題には決着がついて いない

• とにかく「

物事の起こりやすさ

物事の起こりやすさ

」を表す量

• とにかく「

物事の起こりやすさ

物事の起こりやすさ

」を表す量

– 最初は賭けの問題(パッチョリの問題)から始まる – とりあえず20世紀にKolmogorovによって体系化

確率の考え方

• 古典的定義:互いに等可能な事象の,総数に対

する比

• 頻度的定義:多数回の試行Nに対するある性質

を持った試行結果nの比(n/N)

を持った試行結果nの比(n/N)

• 主観的定義:物事の生起に対する主観的確信

の程度

•• まだどれがいいかははっきりと定まっていない

まだどれがいいかははっきりと定まっていない

古典的定義

• 互いに等可能な事象の,総数に対する比

– 無差別の原理 • 互いに背反で全ての可能性を尽くす等確率の基本事 象を数え上げる 次に確率を求めたい任意の事象を実現する「好都合」 • 次に確率を求めたい任意の事象を実現する「好都合」 な事象を数え上げる • 全ての基本事象の数で割る

• 2つの問題点

– 等確率の基本事象はあるの? – 等確率をどう決めるの?

(7)

無差別の原理の問題点

• 有る正方形の一辺の長さが0~20cmであるこ

とが分かっている。では、この正方形の一辺

の長さが

10cm以下である確率は?

50%?

• 長さで考えると、50%が自然?

• しかし、面積で考えると25%になる

20×20=400 10×10=100 10cm以下というこ – 20×20=400,10×10=100,10cm以下というこ とは400の中で100が占める比率ということで 25%になる

• 面積で考えるべきか、長さで考えるべきかを

決める基準は

無差別の原理の中にはない

ケインズの指摘

• ここにワインと水の混合物があり、1/3≦ワイン/水≦ 3であることだけが分っているとする。ワイン/水の値は 、1/3と3との間において決めかねる程度が同じである から 無差別の原理を適用して 同区間中 均 に分 から、無差別の原理を適用して、同区間中、均一に分 布していると仮定出来る。そうすると、ワイン/水の値が 2以下である確率P(ワイン/水≦2)は、 • P(ワイン/水≦2)=(2-1/3)/(3-1/3)=5/8.

ケインズの指摘

• しかし、一方、1/3≦ワイン/水≦3であれば、1/3≦水/ ワイン≦3であるが、これもそれだけしか分らないので 、無差別の原理を適用して、先程と同様に、水/ワイン の値が1/2以上である確率P(水/ワイン≧1/2)は の値が1/2以上である確率P(水/ワイン≧1/2)は、 • P(水/ワイン≧1/2)=(3-1/2)/(3-1/3)=15/16. しかし、ワイン/水≦2ということは、水/ワイン≧1/2という ことであり、同じことに対して2つの確率が導かれる。

頻度的定義

• 多数回の試行Nに対するある性質を持った試行

結果nの比(n/N)

– 相対的頻度の極限値が確率 – 確率を統計的な性質から考える

• 問題点

– 確率を有限の証拠から推測しなければならない – 単一の事象に対して確率を割り振ることができない

主観説

• 物事の生起に対する主観的確信の程度

– 値は主観的であっても構わない,しかし確率の公 理に従うものでなければならない – 一回限りの事象に対する確率も割り振れる – 回限りの事象に対する確率も割り振れる

• “賭け” によって確率の大小を決める

– “表が出れば300円受取り,裏が出たら200円払 う”という賭けを公平と考えているならば,この人 は表が出る可能性を40%と考えている

• 問題点:

主観的である

(8)

確率の公理

) 2 ( 1 ) ( 0 ) 1 ( A P ≤ ≤ をΩとして, 起こりうる全ての事象 全ての事象について,   L L L ) ( ) ( ) ( ) ( ) 3 ( 1 ) ( 3 2 1 3 2 1 A A P A P A P A A P P + + = ∪ ∪ = Ω に対し, A , A , 互いに排反な事象A1 2 3

ベイズの定理

• 確率の公理から論理的に導き出される定理

) ( ) | ( ) ( ) | ( ) ( ) | ( ) ( ) ( ) | ( ) | ( H P H D P H P H D P H P H D P D P H P H D P D H P + = = ) ( ) | ( ) ( ) | ( ) (D PD HPH PD HPH P + が正しい確率 が正しくない時に が正しい確率 , それぞれ が正しい確率 が与えられた時に H D D H P D H D P H P H D D H P : ) | ( : ) ( ), ( : ) | (

例題

• 3つの壺がある(壺A,B,C)、外から見るとどの壺かわからない • Aには赤3個、白1個 • Bには赤1個、白1個 • Cには赤1個、白2個 • ある壺から玉を抜いた時、赤であった • 玉を抜いたのがAだった確率は何%? • 玉を抜いたのがAだった確率は何%?

A

B

C

答え

• D:赤い玉を抜き出した • HA:Aから玉を抜き出した, HB :Bから玉を抜き出し た,HC:Cから玉を抜き出した、とすると、 • P(D| HA)=3/4、 P(D| HB)=1/2、 P(D| HC)=1/3 • さらにP(H )= P(H ) = P(H ) 1/3と仮定すると • さらにP(HA)= P(HB) = P(HC) 1/3と仮定すると

( )( )

( )( ) ( )( ) ( )( )

19 9 3 / 1 3 / 1 2 / 1 3 / 1 4 / 3 3 / 1 4 / 3 3 / 1 ) | ( ) ( ) | ( ) ( ) | ( ) ( ) | ( ) ( ) | ( = + + = + + = C C B B A A A A A H D P H P H D P H P H D P H P H D P H P D H P

A

B

C

赤が現れた、ということは・・・・

A

Aから出た=3/43/4

B

Bから出た=1/21/2

C

Cから出た=1/31/3

便利じゃないか!

• 様々な局面で使われている

• 例:疫病診断

– 病気に感染しているかどうかを調べるためにある 検査をした.この病気は1000人に1人の割合で 検 を 病気 感染していることが知られており,さらに検査は 99%の確率で正しい結果を返してくれることが知 られている. – この検査で陽性反応が出た.では,実際に病気 に感染している可能性は?

(9)

A

B

病気に懸かっ ているときに 陽性=0.99 病気に懸かっていな いときに陽性=0.01 0.001 0.999 陽性 090164 . 0 01 . 0 999 . 0 99 . 0 001 . 0 99 . 0 001 . 0 ) | ( ) ( ) | ( ) ( ) | ( ) ( ) | ( = × + × × = + = 罹っていない 陽性 罹っていない 罹っている 陽性 罹っている 罹っている 陽性 罹っている 陽性 罹っている P P P P P P P

期待効用という考え方の限界

期待効用が分かれば決められる?

• そうはいかない:期待効用を

どのような視点

で定めるべきか

には議論がある

• 2つの著名なパラドクス

N のパラドクス – Newcomeのパラドクス – 封筒問題

Newcomeの問題

• 目の前に2つの箱A,Bがある.Aは透明で,中に10万円入っ ているのが分かっている.もう1つのBは中が見えない. • ここで,予知能力抜群の神がいる.この人がいうには, “あなたがBだけをとる時に1億円を入れておくが, あなたがAをとるときにはBを空にしておく.” • このとき,あなたは以下の2つのうちどちらを選びますか?

1.Bだけを取る

2.A,B両方取る

10万円 1億円?

考えられる答え

1. 神様のほぼ全能な予知能力を前提とすると,

両方をとった場合には10万円しか入らない

が,Bだけを取った場合は1億円入るため,B

だけを取る

だけを取る

2. 神の予測は過去のある時点ですでに行われ

ているに違いないのだから,両方とる方がB

だけを取るよりも10万円余計にとれる

期待効用最大化原理自体はこの問に対して

答えを与えてくれない

封筒問題(Envelop problem)

• ここに、2つの封筒があります。それぞれの封筒に幾ら 入っているか分かりませんが、片方の封筒には、もう片 方の封筒の2倍のお金が入っていることが分かってい ます。 • あなたは1つの封筒を手にし もう1人がもう片方の封 • あなたは1つの封筒を手にし,もう1人がもう片方の封 筒を手にしました。あなたが自分の封筒を開けると、そ こには1万円入っていました。あなたは封筒を変えるこ とができます。 • ここで、もう片方の封筒に代えますか?

(10)

考えられる答え

• もう片方の封筒には、2,0000円か5000円のど

ちらかが入っている。

• どちらかが可能性が高いということはないの

で 期待値は (20000+5000)/2=12500円とな

で、期待値は、(20000+5000)/2=12500円とな

り、手持ちの金額1,0000円よりも多い。従って、

交換したほうがいい。

• どちらにとっても交換した方がいいことになる

参照

関連したドキュメント

[r]

【対策 2】経営層への監視・支援強化 期待要件 4:社内外の失敗・課題からの学び 【対策 3】深層防護提案力の強化 期待要件

静岡大学 静岡キャンパス 静岡大学 浜松キャンパス 静岡県立大学 静岡県立大学短期大学部 東海大学 清水キャンパス

講師:首都大学東京 システムデザイン学部 知能機械システムコース 准教授 三好 洋美先生 芝浦工業大学 システム理工学部 生命科学科 助教 中村

静岡大学 静岡キャンパス 静岡大学 浜松キャンパス 静岡県立大学 静岡県立大学短期大学部 東海大学 清水キャンパス

 「世界陸上は今までの競技 人生の中で最も印象に残る大 会になりました。でも、最大の目

© 2018 Toshiba Infrastructure Systems &amp; Solutions

話題提供者: 河﨑佳子 神戸大学大学院 人間発達環境学研究科 話題提供者: 酒井邦嘉# 東京大学大学院 総合文化研究科 話題提供者: 武居渡 金沢大学