ゲーム理論
Lecture 2:ナッシュ均衡
イントロダクション
テキスト
天谷研一『図解で学ぶゲーム理論』
第一回:戦略的状況とゲーム理論
テキスト1~2章
第二回:ナッシュ均衡
テキスト2~3章
第三回:より複雑なゲーム
テキスト3章
第四回:ゲームを後ろから解く
コーディネーションゲーム:利得表
共同作業のために新しいパソコンを購入する
相手と異なるOSでは全く意味がないとする
(Mac, Mac)の方が(Win, Win)よりも2人にとってベター
プレイヤー
プレイヤー プレイヤー
プレイヤー
2プレイヤー
プレイヤー プレイヤー
プレイヤー
1Windows Mac
Windows 1
1
0 0
Mac 0
0
2 2
コーディネーションゲーム:分析1
最適戦略(支配戦略)は存在しない!
相手がMacなら自分もMac、相手がWinなら自分もWinが得
最適な行動が相手の行動によって変化する!
個人の合理性だけからでは問題を解くことができない
囚人のジレンマのようにはいかない
「ナッシュ均衡」「ナッシュ均衡」の考えを使う必要がある!「ナッシュ均衡」「ナッシュ均衡」
一見するとベストな結果(Mac, Mac)が選ばれそうだが…
まずはナッシュ均衡の定義をおさらいしよう!
ナッシュ均衡の定義
プレーヤーたちの選択した行動の組がナッシュ均衡
であるとき
1.
(すべてのプレーヤーにとって)自分一人だけが行
動を変更しても利得を上げることができない
安定的な状況をうまく描写できる
2.
プレーヤー同士がお互いの行動を正しく予想してそれ
に対して最適な行動を選択し合っている
合理的な結果の予測として優れている
数学的には全く同じ定義でも多様な解釈ができる!
コーディネーションゲーム:分析2
このゲームには2つナッシュ均衡がある!
(Mac, Mac)と(Win, Win)のどちらもナッシュ均衡
コーディネーションゲームのように
(一般に)ナッシュ均衡は複数存在する場合がある
プレイヤー全員にとってあるナッシュ均衡よりも別のナッシュ 均衡の方が望ましい場合もある
良い均衡(Mac, Mac)ではなく悪い均衡(Win, Win)が選
ばれてしまう危険性がある
「コーディネーションの失敗」
「コーディネーションの失敗」「コーディネーションの失敗」
「コーディネーションの失敗」と呼ばれる
男女の争い:利得表
妻(プレイヤー1)と夫(プレイヤー2)が休みの日にどこに
遊びに行くかをそれぞれ決定
別々の場所に行くのは2人にとって最悪
妻は遊園地、夫は野球観戦の方が好き
夫
夫
夫
夫
妻
妻
妻
妻
遊園地
遊園地
遊園地
遊園地 野球 野球 野球 野球
遊園地
遊園地
遊園地
遊園地
13
0 0
野球 野球
野球 野球
00
3 1
男女の争い:分析
このゲームにもナッシュ均衡が2つ!
(遊園地、遊園地)と(野球、野球)のどちらもナッシュ均衡
今回は “良い”(“悪い”)均衡は存在しない
状況が対称的でどちらの均衡が実現しそうか分からない
理論以外の要素ーたとえば慣習や文化、規範などーに
よってどちらのナッシュ均衡が選ばれるかが決まる
例)レディファースト⇒(遊園地、遊園地)
例)男社会(?)⇒(野球、野球)
タカ ―ハト・ゲーム(チキンゲーム)
交渉事に強気(タカ戦略)でのぞむか弱気(ハト戦略)でのぞ
むかをそれぞれのプレーヤーが決定
ナッシュ均衡は非対称な行動の組:(ハト、タカ)と(タカ、ハト)
現実に、ハト戦略とタカ戦略のどちらも観察されることに対応
プレイヤー
プレイヤー プレイヤー
プレイヤー
2プレイヤー
プレイヤー
プレイヤー
プレイヤー
1ハト
ハト
ハト
ハト タカ タカ タカ タカ
ハト
ハト
ハト
ハト
22
3 0
タカ
タカ
タカ
タカ
03
-1 -1
ストーリーとしてのナッシュ均衡
なぜ/どのようにしてナッシュ均衡は実現するのか?
少なくとも次の4つのストーリー(理由)が考えられる
1.
合理的な推論によって導かれる
2.
(理論以外の理由で)結果がそもそも目立つ
3.
話し合いの結果
4.
時間を通じた調整(試行錯誤)
状況に応じて、どのストーリーがよくあてはまりそうかは
違ってくる
1. 合理的な推論
個々のプレーヤーの合理性だけで解けるゲームもある
合理性:自分にとってより高い利得をもたらす行動を選ぶ
最適戦略(支配戦略)がある場合:例)囚人のジレンマ
すべてのプレーヤーに支配戦略が無いゲームでも解け
る場合がある
「支配される戦略の逐次消去」(後述)
(お互いの行動に関する)「正しい予想の共有+合理性」
によってナッシュ均衡は実現する!
いかにして正しい予想が形成されるかが重要…
2. 目立つ均衡(フォーカル・ポイント)
個々人の推測だけから正しい予想が共有されることも!
実験)都内の地下鉄の駅を一つを選んで駅名を紙に書く
一番多い答えを書いていれば勝ち(利得が1)
それ以外は負け(利得は0)
周りのプレーヤーが書きそうな駅名をうまく予想するのがミソ
⇒どんな駅名が“目立つ”のかを考えよう!
潜在的なナッシュ均衡は駅名の数だけ存在する
しかし、状況によって非常に目立つ均衡がある場合も
3. 自発的に守られる口約束
ナッシュ均衡は、ゲームの外部で罰則や報酬がいっさい
与えられない状況でも口約束によって達成できる
相手が口約束にしたがって(ナッシュ均衡の)行動をとるので あれば、自分にとっても約束した(ナッシュ均衡の)行動を選 ぶのが最適!⇒合意が“自己拘束的”
ナッシュ均衡ではない結果は達成不可能
口約束の結果がナッシュ均衡ではないので、少なくとも一人 は約束をやぶって他の行動をとることで得できる人がいる
ナッシュ均衡=「自己拘束的な合意」
4. 試行錯誤の結果
繰り返しゲームを行い経験を積むことで予想を共有
コーディネーションゲームの例
エスカレーター(左側と右側どちらに並ぶか)
ビデオテープ規格(VHS vs. ベータ)
キーボード配列(QWERTY型 vs. DVORAK型)
ゲームが行われる初期の段階でどのような行動がとら
れたか、という“歴史”が均衡を決定する上で重要
ポール・デイヴィットが提唱⇒「経路依存性」「経路依存性」「経路依存性」「経路依存性」
合理的なプレーヤーの行動
合理的なプレーヤーは
支配戦略があれば常にそれを選択する
強く支配される戦略は絶対にとらない
戦略Aが戦略Bに強く支配される
相手がどんな行動をとってきたとしても、自分が戦略Aを選ん だ場合の利得が戦略Bを選んだときの利得よりも常に大きい
戦略Aが戦略Bに弱く支配される
相手がどんな行動をとってきたとしても、自分が戦略Aを選ん だ場合の利得が必ず戦略Bを選んだときの利得以上になる
合理的な豚:利得表
大豚(プレイヤー1)と子豚(プレイヤー2)が同じオリの中
でエサをまっている
エサ箱のスイッチを押すか待つかをそれぞれ決定
エサは5単位、スイッチを押すのに1だけコストがかかる
子豚
子豚
子豚
子豚
大豚
大豚
大豚
大豚
スイッチ押す
スイッチ押す
スイッチ押す
スイッチ押す 待つ 待つ 待つ 待つ
スイッチ押す
スイッチ押す
スイッチ押す
スイッチ押す
-14
3 1
待つ 待つ
待つ 待つ
-1 0合理的な豚:分析
子豚には最適戦略(支配戦略)が存在する!
大豚の行動によらず「待つ」のが常に最適
子豚が合理的ならば絶対にスイッチを押さない
子豚の「スイッチを押す」は可能性から消去される
大豚は子豚が「待つ」を選ぶので「スイッチを押す」
子豚の行動を織り込んでしぶしぶスイッチを押す羽目に…
(スイッチを押す、待つ)が実現される
これがこのゲームの唯一のナッシュ均衡
合理的な推論からナッシュ均衡が導かれた!
合理的な推論で解ける例:利得表
どのようにして答えを導くことができるだろうか?
プレイヤーたちの合理性だけからゲームは解いてみよう! 2
1
左
左 左
左
真ん中真ん中真ん中真ん中右 右 右 右
上
上
上
上
01
2 1
1 0
下 下
下 下
30
1 0
0 2
支配される戦略の逐次消去
強く支配される戦略はとられないことに注目!
1. プレイヤー2の「右」は「真ん中」に強く支配される
プレイヤー2の「真ん中」を消去
2. プレイヤー1の「下」は「上」に強く支配される
プレイヤー1の「下」を消去
3. プレイヤー2の「左」は「真ん中」に強く支配される
プレイヤー2の「左」を消去
4. (上、真ん中)のみが逐次消去によって生き残る!
この結果(上、真ん中)は唯一のナッシュ均衡に一致
一見すると複雑なゲームでも合理的な推論から解けた!
逐次消去で残った行動の組にナッシュ均衡は含まれる?
合理的な推論とナッシュ均衡の関係
自分が合理的なだけでなく、相手が合理的なこともお互
いに知り合っていないと消去が進まない点に注意
支配される戦略の逐次消去は多くの場合不十分
消去のプロセスが途中で(場合によっては最初から)止まる
理論的な結果(の予測)をあまり絞ることができない
ナッシュ均衡の概念の方がより“強い”
逐次消去の途中でナッシュ均衡においてとられる行動が消去 されることは絶対にない!
もしも逐次消去で唯一の行動の組が生き残った場合には、そ れは必ずナッシュ均衡になっている!