• 検索結果がありません。

Lec2 最近の更新履歴 yyasuda's website

N/A
N/A
Protected

Academic year: 2017

シェア "Lec2 最近の更新履歴 yyasuda's website"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

ゲーム理論

Lecture 2:ナッシュ均衡

(2)

イントロダクション



テキスト

 天谷研一『図解で学ぶゲーム理論』



第一回:戦略的状況とゲーム理論

 テキスト1~2章



第二回:ナッシュ均衡

 テキスト2~3章



第三回:より複雑なゲーム

 テキスト3章



第四回:ゲームを後ろから解く

(3)

コーディネーションゲーム:利得表



共同作業のために新しいパソコンを購入する

 相手と異なるOSでは全く意味がないとする

 (Mac, Mac)の方が(Win, Win)よりも2人にとってベター

プレイヤー

プレイヤー プレイヤー

プレイヤー

2

プレイヤー

プレイヤー プレイヤー

プレイヤー

1

Windows Mac

Windows 1

1

0 0

Mac 0

0

2 2

(4)

コーディネーションゲーム:分析1



最適戦略(支配戦略)は存在しない!

 相手がMacなら自分もMac、相手がWinなら自分もWinが得

 最適な行動が相手の行動によって変化する!



個人の合理性だけからでは問題を解くことができない

 囚人のジレンマのようにはいかない

 「ナッシュ均衡」「ナッシュ均衡」の考えを使う必要がある!「ナッシュ均衡」「ナッシュ均衡」



一見するとベストな結果(Mac, Mac)が選ばれそうだが…

 まずはナッシュ均衡の定義をおさらいしよう!

(5)

ナッシュ均衡の定義



プレーヤーたちの選択した行動の組がナッシュ均衡

であるとき

1.

(すべてのプレーヤーにとって)自分一人だけが行

動を変更しても利得を上げることができない



安定的な状況をうまく描写できる

2.

プレーヤー同士がお互いの行動を正しく予想してそれ

に対して最適な行動を選択し合っている

 合理的な結果の予測として優れている



数学的には全く同じ定義でも多様な解釈ができる!

(6)

コーディネーションゲーム:分析2



このゲームには2つナッシュ均衡がある!

 (Mac, Mac)と(Win, Win)のどちらもナッシュ均衡



コーディネーションゲームのように

 (一般に)ナッシュ均衡は複数存在する場合がある

 プレイヤー全員にとってあるナッシュ均衡よりも別のナッシュ 均衡の方が望ましい場合もある



良い均衡(Mac, Mac)ではなく悪い均衡(Win, Win)が選

ばれてしまう危険性がある

「コーディネーションの失敗」

「コーディネーションの失敗」「コーディネーションの失敗」

「コーディネーションの失敗」と呼ばれる

(7)

男女の争い:利得表



妻(プレイヤー1)と夫(プレイヤー2)が休みの日にどこに

遊びに行くかをそれぞれ決定

 別々の場所に行くのは2人にとって最悪

 妻は遊園地、夫は野球観戦の方が好き

遊園地

遊園地

遊園地

遊園地 野球 野球 野球 野球

遊園地

遊園地

遊園地

遊園地

1

3

0 0

野球 野球

野球 野球

0

0

3 1

(8)

男女の争い:分析



このゲームにもナッシュ均衡が2つ!

 (遊園地、遊園地)と(野球、野球)のどちらもナッシュ均衡



今回は “良い”(“悪い”)均衡は存在しない

 状況が対称的でどちらの均衡が実現しそうか分からない



理論以外の要素ーたとえば慣習や文化、規範などーに

よってどちらのナッシュ均衡が選ばれるかが決まる

 例)レディファースト⇒(遊園地、遊園地)

 例)男社会(?)⇒(野球、野球)

(9)

タカ ―ハト・ゲーム(チキンゲーム)



交渉事に強気(タカ戦略)でのぞむか弱気(ハト戦略)でのぞ

むかをそれぞれのプレーヤーが決定

 ナッシュ均衡は非対称な行動の組:(ハト、タカ)と(タカ、ハト)

 現実に、ハト戦略とタカ戦略のどちらも観察されることに対応

プレイヤー

プレイヤー プレイヤー

プレイヤー

2

プレイヤー

プレイヤー

プレイヤー

プレイヤー

1

ハト

ハト

ハト

ハト タカ タカ タカ タカ

ハト

ハト

ハト

ハト

2

2

3 0

タカ

タカ

タカ

タカ

0

3

-1 -1

(10)

ストーリーとしてのナッシュ均衡



なぜ/どのようにしてナッシュ均衡は実現するのか?

 少なくとも次の4つのストーリー(理由)が考えられる

1.

合理的な推論によって導かれる

2.

(理論以外の理由で)結果がそもそも目立つ

3.

話し合いの結果

4.

時間を通じた調整(試行錯誤)



状況に応じて、どのストーリーがよくあてはまりそうかは

違ってくる

(11)

1. 合理的な推論



個々のプレーヤーの合理性だけで解けるゲームもある

 合理性:自分にとってより高い利得をもたらす行動を選ぶ

 最適戦略(支配戦略)がある場合:例)囚人のジレンマ



すべてのプレーヤーに支配戦略が無いゲームでも解け

る場合がある

 「支配される戦略の逐次消去」(後述)



(お互いの行動に関する)「正しい予想の共有+合理性」

によってナッシュ均衡は実現する!

 いかにして正しい予想が形成されるかが重要…

(12)

2. 目立つ均衡(フォーカル・ポイント)



個々人の推測だけから正しい予想が共有されることも!



実験)都内の地下鉄の駅を一つを選んで駅名を紙に書く

 一番多い答えを書いていれば勝ち(利得が1)

 それ以外は負け(利得は0)

 周りのプレーヤーが書きそうな駅名をうまく予想するのがミソ

⇒どんな駅名が“目立つ”のかを考えよう!



潜在的なナッシュ均衡は駅名の数だけ存在する

 しかし、状況によって非常に目立つ均衡がある場合も

(13)

3. 自発的に守られる口約束



ナッシュ均衡は、ゲームの外部で罰則や報酬がいっさい

与えられない状況でも口約束によって達成できる

 相手が口約束にしたがって(ナッシュ均衡の)行動をとるので あれば、自分にとっても約束した(ナッシュ均衡の)行動を選 ぶのが最適!⇒合意が“自己拘束的”



ナッシュ均衡ではない結果は達成不可能

 口約束の結果がナッシュ均衡ではないので、少なくとも一人 は約束をやぶって他の行動をとることで得できる人がいる



ナッシュ均衡=「自己拘束的な合意」

(14)

4. 試行錯誤の結果



繰り返しゲームを行い経験を積むことで予想を共有



コーディネーションゲームの例

 エスカレーター(左側と右側どちらに並ぶか)

 ビデオテープ規格(VHS vs. ベータ)

 キーボード配列(QWERTY型 vs. DVORAK型)



ゲームが行われる初期の段階でどのような行動がとら

れたか、という“歴史”が均衡を決定する上で重要

 ポール・デイヴィットが提唱⇒「経路依存性」「経路依存性」「経路依存性」「経路依存性」

(15)

合理的なプレーヤーの行動



合理的なプレーヤーは

 支配戦略があれば常にそれを選択する

 強く支配される戦略は絶対にとらない



戦略Aが戦略Bに強く支配される

 相手がどんな行動をとってきたとしても、自分が戦略Aを選ん だ場合の利得が戦略Bを選んだときの利得よりも常に大きい



戦略Aが戦略Bに弱く支配される

 相手がどんな行動をとってきたとしても、自分が戦略Aを選ん だ場合の利得が必ず戦略Bを選んだときの利得以上になる

(16)

合理的な豚:利得表



大豚(プレイヤー1)と子豚(プレイヤー2)が同じオリの中

でエサをまっている

 エサ箱のスイッチを押すか待つかをそれぞれ決定

 エサは5単位、スイッチを押すのに1だけコストがかかる

子豚

子豚

子豚

子豚

大豚

大豚

大豚

大豚

スイッチ押す

スイッチ押す

スイッチ押す

スイッチ押す 待つ 待つ 待つ 待つ

スイッチ押す

スイッチ押す

スイッチ押す

スイッチ押す

-1

4

3 1

待つ 待つ

待つ 待つ

-1 0

(17)

合理的な豚:分析



子豚には最適戦略(支配戦略)が存在する!

 大豚の行動によらず「待つ」のが常に最適

 子豚が合理的ならば絶対にスイッチを押さない

 子豚の「スイッチを押す」は可能性から消去される



大豚は子豚が「待つ」を選ぶので「スイッチを押す」

 子豚の行動を織り込んでしぶしぶスイッチを押す羽目に…



(スイッチを押す、待つ)が実現される

 これがこのゲームの唯一のナッシュ均衡

合理的な推論からナッシュ均衡が導かれた!

(18)

合理的な推論で解ける例:利得表



どのようにして答えを導くことができるだろうか?

 プレイヤーたちの合理性だけからゲームは解いてみよう! 2

1

左 左

真ん中真ん中真ん中真ん中

右 右 右 右

0

1

2 1

1 0

下 下

下 下

3

0

1 0

0 2

(19)

支配される戦略の逐次消去



強く支配される戦略はとられないことに注目!

1. プレイヤー2の「右」は「真ん中」に強く支配される

 プレイヤー2の「真ん中」を消去

2. プレイヤー1の「下」は「上」に強く支配される

 プレイヤー1の「下」を消去

3. プレイヤー2の「左」は「真ん中」に強く支配される

 プレイヤー2の「左」を消去

4. (上、真ん中)のみが逐次消去によって生き残る!



この結果(上、真ん中)は唯一のナッシュ均衡に一致



一見すると複雑なゲームでも合理的な推論から解けた!



逐次消去で残った行動の組にナッシュ均衡は含まれる?

(20)

合理的な推論とナッシュ均衡の関係



自分が合理的なだけでなく、相手が合理的なこともお互

いに知り合っていないと消去が進まない点に注意



支配される戦略の逐次消去は多くの場合不十分

 消去のプロセスが途中で(場合によっては最初から)止まる

 理論的な結果(の予測)をあまり絞ることができない



ナッシュ均衡の概念の方がより“強い”

 逐次消去の途中でナッシュ均衡においてとられる行動が消去 されることは絶対にない!

 もしも逐次消去で唯一の行動の組が生き残った場合には、そ れは必ずナッシュ均衡になっている!

参照

関連したドキュメント

今日のお話の本題, 「マウスの遺伝子を操作する」です。まず,外から遺伝子を入れると

この数日前に、K児の母から「最近、家でも参観曰の様子を見ていても、あまり話をし

第四章では、APNP による OATP2B1 発現抑制における、高分子の関与を示す事を目 的とした。APNP による OATP2B1 発現抑制は OATP2B1 遺伝子の 3’UTR

教育・保育における合理的配慮

線遷移をおこすだけでなく、中性子を一つ放出する場合がある。この中性子が遅発中性子で ある。励起状態の Kr-87

 親権者等の同意に関して COPPA 及び COPPA 規 則が定めるこうした仕組みに対しては、現実的に機

※証明書のご利用は、証明書取得時に Windows ログオンを行っていた Windows アカウントでのみ 可能となります。それ以外の

同研究グループは以前に、電位依存性カリウムチャネル Kv4.2 をコードする KCND2 遺伝子の 分断変異 10) を、側頭葉てんかんの患者から同定し報告しています