• 検索結果がありません。

game1608notes 最近の更新履歴 H Reiju Mihara

N/A
N/A
Protected

Academic year: 2018

シェア "game1608notes 最近の更新履歴 H Reiju Mihara"

Copied!
49
0
0

読み込み中.... (全文を見る)

全文

(1)

ゲーム理論 : 補助教材

三原麗珠

香川大学図書館

2016 8

目次

はじめに 2

2016年度ゲーム理論受講者へ . . . 2

経済学を学ぶ方のための読書案内 . . . 3

1章 導入 6 1.1 なぜゲーム理論が必要なのか . . . 6

1.2 コメント . . . 6

1.3 読書案内 . . . 6

2章 戦略形ゲーム 7 2.1 ナッシュ均衡 その1 . . . 7

2.2 戦略形・支配・ナッシュ均衡のフォーマルな定義. . . 7

2.3 ナッシュ均衡 その2 . . . 14

2.4 不確実性と期待効用 . . . 15

2.5 混合戦略とナッシュ均衡の存在 . . . 15

2.6 混合戦略均衡の求め方 . . . 15

2.7 コメント . . . 15

2.8 課題 . . . 17

2.9 読書案内 . . . 28

3章 展開形ゲーム 28 3.1 部分ゲーム完全均衡 . . . 28

3.2 コミットメント . . . 30

3.3 長期的関係と協調 . . . 30

3.4 コメント . . . 30

3.5 課題 . . . 30

H. Reiju Mihara: http://www5.atwiki.jp/reiju/ (リンク)

(2)

3.6 読書案内 . . . 37

4章 不完備情報ゲーム 37 4.1 ベイジアン均衡 . . . 37

4.2 完全ベイジアン均衡 . . . 37

4.3 戦略にたいして整合的な信念,条件付き確率を求めるベイズの公式 . . . 38

4.4 就職市場のシグナリング . . . 38

4.5 オークション. . . 38

4.6 コメント . . . 38

4.7 課題 . . . 39

4.8 読書案内 . . . 43

5章 その他の応用例とまとめ 43 5.1 投票とゲーム理論 . . . 43

5.2 おわりに . . . 43

5.3 コメント . . . 45

5.4 課題 . . . 45

5.5 読書案内 . . . 46

参考文献 48

はじめに

2016 年度ゲーム理論受講者へ

香川大学で開講するゲーム理論の授業(学問基礎科目 数学 B)で入手してもらう教材や文献を以下に簡潔に まとめておく(識別コードをカッコ内に付記).これらの文献の必読部分,特に参考にすべき部分,そしてこれ ら以外の参考文献については,シラバスの「必読文献・参考文献」やこの補助教材のいくつかのセクションに 載せた「読書案内」を参照のこと.変更があるばあいはGoogle サイトの講義ページ(リンク)でアナウンス する.

公開分(講義ページから入手できるもの)は以下のとおり.これらは当然必読であり,補助教材は持参して いることを前提として授業を進める:

• 三原麗珠. シラバス (babygames16syllabus)

• 三原麗珠. ゲーム理論: 補助教材, 2016年8月(game1608notes) [この文書]

• 三原麗珠. 授業中に解説する課題一覧2016年度版(assignments16 [リンク])

非公開分(香川大学Moodle上の本コース用ページに入手方法を掲載)を授業で最初に現れる順序で挙げる:

• 神取道宏. ミクロ経済学の力. 日本評論社, 2014. 第6章(kandori14ch6;第II部イントロダクション をふくむ)と第7章(kandori14ch7).大部分必読.該当回に持参

• 奥野正寛. ミクロ経済学. 東京大学出版会, 2008. 第4章(okuno08ch4). 参考

(3)

• 茨木俊秀. 情報学のための離散数学. 昭晃堂, 2004. 第1章(ibaraki04ch1). 参考

• 岡田章. ゲーム理論・入門(新版). 有斐閣, 2014. 第4章(okada14ch4). 一部必読.該当回に持参

• 武藤滋夫. ゲーム理論入門. 日本経済新聞社, 2001. IV章(muto01ch4).必読.該当回に持参

• 渡辺隆裕. ゼミナール ゲーム理論入門. 日本経済新聞出版社, 2008. 10章(watanabe08ch10) と11章 (watanabe08ch11).参考

• 三原麗珠. 板書の一部を再現したメモ(game16memos). 必読.該当回に持参

• 梶井厚志,松井彰彦. ミクロ経済学: 戦略的アプローチ. 日本評論社, 2000. 第5章(kajii-m00ch5),一 部必読.該当回に持参

• 天谷研一. 図解で学ぶゲーム理論入門. 日本能率協会マネジメントセンター, 2011. 第5 章と9章 (amaya11ch5&9). 大部分必読.該当回に持参

• 梶井厚志, 松井彰彦. ミクロ経済学: 戦略的アプローチ. 日本評論社, 2000. 第6章 (kajii-m00ch6), 参考

• 渡辺隆裕. ゼミナール ゲーム理論入門. 日本経済新聞出版社, 2008. 7.4節(watanabe08ch7sec4).必 読.該当回に持参

この補助教材は授業の進行順序に合わせて構成されている.この教材の各章を構成するセクションには以下 の4種類がある:

• 文献を補足する講義ノート

• その章にかんする課題および正解例.これらは授業の進行に沿って配列されている.各自が取り組むべ きタイミングの詳細は,シラバスの「授業計画」に載っている.また,授業中に解説する分については, 解説する時期が上記 Webページ「授業中に解説する課題一覧」にまとめてある.

• その章であつかう文献にたいするコメント.文献あるいは授業内容についての訂正,断り,明確化な ど.かなり自由に個人的意見も書いている.

• その章にかかわる読書案内

この文書からWebサイトにリンクが貼られている部分には,丸括弧内に「リンク」と書いた.

経済学を学ぶ方のための読書案内

ここでは主として経済学を学ぶ学生を念頭に,より高度なレベルの学習に効率的に進むことを重視して, ゲーム理論周辺の厳選した読書案内を提示する.書籍を適切に理解するには,講義を受けたりそれを読むべき インセンティブがあった方がいいので,そのような機会を実現するための環境についても触れる.ここで紹介 するテキストのうち主としてゲーム理論とその応用を扱うものは,政治学や経営学や情報科学などの他分野を 学ぶ学生にも薦められる.他分野を学ぶ学生は少なくともそれらを知った上で,自分の分野に近いゲーム理論 のテキストと比較した上で読む本を選ぶといいだろう.

ゲーム理論は市場の働きをあつかう価格理論とともに,ミクロ経済学の一環として教えられることが多い. ミクロ経済学全般を知ることは,ゲーム理論の理解に不可欠とは言わないが理解を深めるために役立つことは まちがいない.まず,これから経済学を学ぶすべての学生に伊藤[13]『ひたすら読むエコノミクス』を通読し てミクロ経済学の全体像を掴むことを薦めたい.教科書以前の一冊として書かれた本だから,この科目を完了 する前に大半の章を読めるだろう.

(4)

伊藤の本でミクロ経済学の全体像をつかんだあとは,数あるミクロ経済学のテキストから一二冊選んで「ミ クロ経済学」の科目の受講に合わせて読み進めるといい.学部生として本格的に勉強したければ,その際,神 取[18]『ミクロ経済学の力』を最初か二冊目として読むことを薦める.このテキストは説明の丁寧さや現実の 事例の豊富な提示などから,極めて評価の高い一冊である.伊藤と神取のあいだに一種類入門書を挟んだ方が スムーズに勉強が進む人もいるだろう.そのための候補になる入門書はひじょうに多いし,どれがいいかはそ の人の性格に左右される部分が大きいので,ミクロ経済学担当の講師その他から情報を得て自分で探してもら いたい.

一方で,ゲーム理論とその応用の勉強も開始するとよい.そのためにはいまや古典ともいえる梶井・松井 [10]『ミクロ経済学: 戦略的アプローチ』がオススメだ.順番は神取の前でも後でも同時並行でも構わないし, 神取の第II部と重なる話題も多い.十分モーティベーションが高い学生なら自力で読める本だが,この科目 かそれに類するゲーム理論科目を取って非協力ゲーム理論の全体像を把握し均衡の計算もできるようになった 後の方がスムーズに読めるだろう.三原のこの科目にかんしては,必読文献を読んだり演習問題をこなすこと で効果的に学べるはずだ.

神取と梶井・松井のテキストを読了しそのレベルの問題を解くために必要な数学をマスターしたら,学部レ ベルのミクロ経済理論の基礎固めはできたと言える.数学の勉強は通常なら微分積分と線形代数と確率をふく む科目を取るのが最低ラインだが,とりあえず学部レベルの経済学に必要な数学を(経済学に出てくる例を通 して)学ぶ目的には,尾山・安田編[16]『経済学で出る数学: 高校数学からきちんと攻める』が評判が良いよ うだ.

経済学を学ぶ学部生の大部分にとって,(ミクロ)経済理論の学習は以上で十分だろう.前提知識なしで読め なくはない書籍4冊で済むと思えば大したことはないかもしれない.(ミクロ経済学じたい意思決定や社会の 理解に役立つので,経済学と関係の薄い分野を専攻する学生も教養としてこれくらいの経済学は知っておいて 損はないだろう.絞りたければ梶井・松井か他のゲーム理論のテキストから選べばいい.)大学のカリキュラ ムにもよるが,受講した科目を深化させる形で勉強すれば2年生を終えるまでにここまで終わらせることは十 分可能だ.あとはマクロ経済学その他の応用分野を学ぶなり,統計学・計量経済学で実証分析の理論とそれに 役立つプログラミングを学ぶなり,集合と位相や解析学のような抽象数学を学ぶなり,ゼミナールに参加して 特定分野を掘り下げてみるのもいいだろう(次のパラグラフから述べる高度なレベルを目指す学生は,ゼミを 選ぶときに教員の研究能力も重視した方がいいかも).特定分野を概観するサーベイ論文をはじめ,適切な指 導さえ受ければこの段階でまずまず読める学術論文もあるから,指導教授に読めと言われたら読んでみるとい い.それらの読書案内はこのセクションの範囲外なので省略する.*1

次に,より高度なレベルへの最短距離をしめそう.まず留意すべきは,学部レベルの応用分野の勉強をや りすぎないことである.経済学は実証にせよ応用にせよ,モデル (理論) をひじょうに重視する分野だから だ.応用分野であっても,理論の理解なしでは高度なレベルには進めないのだ.学部レベルの科目で学べ ることと言ったら,詳細な事実の蓄積であったり,理論的か統計的に得られた結果だけであったりと,経

*1ただ,まちがって非主流派の経済学 (マルクス主義経済学) に引っかからないように注意した方がいい.それらは学問でないわけ ではないけれども,「経済学」として国際的に教えられているものとはだいぶちがうからだ.政治学や社会学や法学などと異なる経 済学のひとつの重要な特徴は, (自然科学と同様に) 世界中のほとんどどこの大学でも同じようなトピックをカバーしたテキスト で教えられていることである.留学を考える学生にとっても,ビジネスパーソンを目指す学生にとっても,これは留意すべき点だ. たとえばこのゲーム理論科目でよい成績を収めておけば,留学先の米国大学でより詳細なゲーム理論科目を受講してトップに近い 成績を収めるといったことがわりと簡単にできることになる.ただし講義で使われる英語はかなり限られていたり (ネィティブス ピーカーでもきちんと英語で説明せずに図を書いて “like this” とか言うだけで済ませたり) まちがっていたりする (学生は講師 の英語の誤りは滅多に指摘しない) ので,高度な英語力をつけたい人には経済学科目は物足りないかも.

(5)

済学的深まりのないものになりがちだ.高度なレベルをめざすならば,早めに大学院必修レベルの経済理 論を学ぶべきなのである.それを学ぶ意欲のある学部生には,このレベルの標準的なテキスト Jehle and Reny [1], Advanced Microeconomic Theory とゲーム理論に特化したTadelis [4], Game Theory:

An Introduction から,いくつかの章を読んでみることを薦める.これらはより詳細な Mas-Colell,

Whinston, and Green [2], Microeconomic Theory のようなテキストとともに国内外の大学院必修科

目で採用されることの多いものであり,学部生が読破する必要はないが,必要に応じて自力で読めることが大 学院生になるための条件である.(国内でも主要経済学大学院ではミクロ経済学の講義自体が英語で行われる ので,まず「読める」ことは最低条件と言えるだろう.英語で読むのは大部分の学生にとってたいへん時間が かかるかもしれないが,このレベルになると日本語でもいずれにせよとても時間がかかるものである.)神取 や梶井・松井を読み必要な数学を押さえた後なら,これら英文テキストに進むのに深刻なギャップはないはず である.一方で神取や梶井・松井よりは高度でJehle and RenyやTadelisよりは取っ付きやすそうな日本語 テキストも林[7]『ミクロ経済学』をはじめいくつか存在する.それらは大学院レベルの英文テキストを読め るようになることを優先しつつ,補助的に利用するといいだろう.

Jehle and RenyやTadelisのような読みやすいテキストではあまり感じないかもしれないが,大学院レベ

ルの経済理論を学ぼうとすると数学力の不足を感じる人が多いだろう.特に理論自体を研究対象にすることを 目指す人にとっては,数学を使って自分で証明を構築できるようになっておくことが必須である.そのために は数学専攻者を対象とした集合と位相や解析学などの数学科目を受講して証明を添削し合ったりして抽象数学 のトレーニングを受けるのが最適だろう.これは経済学大学院進学後にはなかなかできないことなので,学部 時代にやっておくのがいい.*2もし自力でやるとしたら,とりあえずJehle and Renyの付録[1, Chapter A1] をやるだけでも違いはあるだろうし,より本格的にはたとえば金子[11]『数理基礎論講義: 論理・集合・位相』 が幅広いトピックをカバーしている.

大学院レベルの経済理論テキストを何章か読んでみても経済理論にたいする強い関心を持ち続けられるよう な奇特な人は,大学院ミクロ経済学の講義を受けるといい.このレベルの講義を提供するようなまともな経済 学大学院を上に持つ経済学部に在学する学部生なら,そのような講義の受講が許可されているのが普通だ.残 念ながら(香川大学をふくむ)多くの大学の大学院ではこのレベルの科目は提供されていないから,まずはま ともな経済学大学院(国内なら東大,一橋,慶応,大阪大あたり)に進学してからということになる.*3

まともな大学院進学のメリットとしては,まずは就ける職業の種類が増えることが挙げられる.たとえば学 者,国際機関,シンクタンク,金融の専門職などであり,各大学院が就職先を公表している.これは大学院で 学ぶ内容の問題だけでなく大学院で知り合う人とのコネクションの問題でもある.次に,就職後に勉強が必要 になったときに呑み込みが早かったりより高度なところから始められるといったことも挙げられるだろう.た とえば同じ資料や本を読むにしても,背景知識があれば必要部分をすばやく見つけ出して読むことができる. 体系的な分野のばあい,このような読み方は背景知識なしではなかなか難しいのだ.まともな大学院に進学す るためには英語や数学や経済学の勉強をふくめ準備に相当時間がかかるが,大学1年のときから適切に受講科 目を選んだりして本格的に勉強を開始すれば,それらを3年次までに済ませることは不可能ではないだろう. 早期卒業制度を利用するのも悪くはないが,大学院進学前に学んだ方がいい事柄は経済理論以外にもたくさん ある.それらを学べる環境が整っているのなら,焦って卒業を前倒しする必要はない.

*2米国大学の数学科では日本の数学科と同一内容をたっぷり時間をかけて学べるところが多いので,数学を学ぶために学部留学する のもいいかもしれない.

*3もちろんこのレベルの科目を受講できる大学に学部留学する手はあるし,このレベルに近いネット上の講義もないわけではない. たとえば Game Theory Online [リンク] の第 II 部がある.

(6)

まともな経済学大学院でミクロ経済学,マクロ経済学,計量経済学などの必修科目を受講すれば,国際学術 誌に掲載されている論文もかなり読めるようになる.大学院の専門科目を取ったり専門書を読んだりサーベイ 論文を読んだりして,自力で読める論文を増やして行こう.このくらいになったうえで修士号も取れば,統計 分析や経済学を用いる仕事に就ける可能性が高まってくる.銀行,証券,保険,通信・情報,シンクタンク, コンサルタント,官庁など,結構いい就職先はあるようだ.

たとえ経済学への関心がひじょうに強くても通常はこのあたりで脱落するのが幸せだと思うが,まだ続けた いばあい経済学を読む側から書く側への移行,つまり大学などの研究者を目指すのが数少ない選択肢のひとつ である.「自分は教育だけをやる大学教員になりたい」と思う人もいるかもしれないが,大学というところは 研究できることがきちんと教育をこなせるための前提と考えられている.単に既存の研究成果をまとめて分か りやすい文章にできるようなレベルの書く能力だけではダメで,その分野として一定レベルを満たす新たな研 究成果を自ら生み出す能力が(少なくとも大学等への最初の就職時には)求められる.研究者を目指すばあい, 米国をはじめとする国内外の博士課程へと進み,*4 一定レベルの国際学術誌に自分で論文を載せられるように なるあたりから,具体的な就職可能性が出てくる.(なかには修士論文の段階で「フィールド代表誌」と呼ば れるような経済学特定分野の専門誌に載るレベルの論文を要求する教員もいる.修士論文での要求レベルが高 いばあい,学生が時間を浪費しないで済むように指導教員が研究テーマを与えてくたり関連論文を読むのを手 伝ってくれたりすることはあるかもしれないが,期待しすぎてはいけない.大学院レベルのミクロ経済学,マ クロ経済学,計量経済学の勉強の一部を前倒しするとか,修士論文のテーマを大学院入学前から見つけておく といった対応が必要になるつもりでいた方がいいだろう.ちなみに米国経済学大学院のプログラムでは修士号 は博士課程中退者向けの「残念賞」の意味合いが強く,通常は修士論文は要求されない.)

論文掲載可否のための審査がある,「レフェリー制」の経済学学術誌のレベルは他分野と比べても相当厳し いから(香川大学経済学部をふくむ大部分の大学の経済学部では,レフェリー制国際学術誌にほとんど論文を 持たない研究者が大半であるのが現状),ここまで至るのは並大抵のことではなく,学士号取得後5年はかか るし,10年かけてもそこに至らない例は少なくない.でも最近は競争も激しくなっており,若手が経済学者 になるためにはそういう並大抵ではないことが要求されるようになって来ている.

1 章 導入

1.1 なぜゲーム理論が必要なのか

神取[18, 第II部イントロダクション, 304–307頁]にもとづいて進める.

1.2 コメント

1.3 読書案内

• この章は神取 [18, 第II部イントロダクション, 304–307頁]に沿って進めた.同様の議論としては奥 野[6, 4.1節]を挙げておく.

• 経済学を始めとする社会科学分野でゲーム理論が役立つことは,その成果から明らかだろう.一方,ビ ジネスや日常生活で役立つかどうかは,個人的資質に左右される部分が大きいと思う.それでも新しい

*4「米国大学院の場合このような推薦状 3 通が必要」といった博士課程進学のノウハウは,大学院生や入学審査を担当した教員が日 本語で Web に書いたものが見つかるはずだ.手遅れになる前に最新情報を入手しておくとよい.

(7)

ものの見方を獲得できるとか知識や直感の裏付けになるくらいのことならかなり一般的に言えるだろう (たとえば天谷[8, 1章]).そういった「ゲーム理論を実践する」ことを重視する人には,その副題を持 つ梶井 [9]『戦略的思考の技術』を薦める.

2 章 戦略形ゲーム

2.1 ナッシュ均衡 その 1

神取[18, 6.1節–6.2節例6.2まで]にもとづいて進める.

2.2 戦略形・支配・ナッシュ均衡のフォーマルな定義

このセクションでは非協力ゲーム理論(noncooperative game theory)のうち,行動決定が同時に行われる 場合をあつかう.数学的な定式化や例の追加など,神取[18, 6章]を補足するような話題を重視する.

2.2.1 支配戦略

最初に,非協力ゲーム理論の分野でもっとも有名な例である囚人のジレンマ(The Prisoner’s Dilemma)を 考える.「ジレンマ」とは窮地,板挟み,困難な状況のこと.

ある犯罪の容疑者2人(じつは共犯)が別件で逮捕された.自白を引きだすために,取り調べ人は2人を隔 離してそれぞれの容疑者に脅し(はったり? )をかける(共犯であることは見抜いている;あとは自白が欲し い) :

• 2人とも黙秘を続ければともに 1年の刑(別件で),

• 1人だけが自白すれば直ちに釈放で相手は9年の刑,

• 2人とも自白すればともに6年の刑になる. この状況を非協力ゲーム理論の言葉に直そう.

リマーク2.1 具体的なシチュエーションである上の寓話を一歩抽象化したいわけである.具体的ケースをたくさん並べ ることに終わっていては大学で勉強する意味が半減するから.

この戦略ゲーム(strategic game) の

プレーヤー(players)は囚人1と囚人2で,

• それぞれのプレーヤーは〈黙秘〉と〈自白〉という2つの 戦略(strategies)を持つ.

• 2人の戦略の組 (ペア)のおのおのにたいして,それぞれのプレーヤの利得 (payoff)を表(利得行列) にすれば下のようになる.たとえば戦略ペア 〈黙秘,自白〉—つまり囚人1が黙秘して囚人2が自白す る状況—での利得の組は(−9, 0).(ただし第1項が囚人1の利得,第2項が囚人2の利得;刑期をマイ ナスの利得とみなしている.)

囚人2 黙秘 自白

囚人1 黙秘 −1, −1 −9, 0

自白 0, −9 −6, −6

(8)

リマーク2.2 後述するように,この特定の利得行列で表されたゲームはさまざまな具体的シチュエーションを抽象化し ている.しかしわれわれはこの行列で表された特定のゲーム以外のさまざまなゲーム(たとえば後で述べるBattle of the Sexes)をも同時に考えるための言葉が欲しい.プレーヤーの数は2人とは限らないし,戦略もいくつあるか分からないか ら,単に利得行列の戦略のラベルや利得を変数とするだけでは不十分だ.さらに抽象化を進める必要があるのだ.そのた めに以下では「ゲーム」を数学的オブジェクト(対象物)として一般的に定義することにする.読者は「そこまで極端に抽 象化する必要があるのか!」と思うかもしれない.たしかに実社会で接するレベルの抽象度は超えている.しかしせっかく 大学に来たんだから,またとない機会だと思ってついてきて欲しい.世界の見え方が変わってくるかもしれないよ. 補足2.1 ゲームを一般的に定義する前に,集合の記号を復習しておく.

集合(set)とは「きちんと定義された相異なる《もの》のあつまり」と考えておけばよい.集合を構成する《もの》を要 素(element)と言い,たとえば集合N = {香川,徳島,愛媛}は香川,徳島,愛媛の3つの要素を持つことになる.aが 集合Aの要素であるとき,a ∈ Aと書いて,aはAに属すると言う.aが集合Aの要素でないとき,a /∈ Aと書く.た とえば,香川∈ Nであり,高知∈ N/ である.

太字のRは慣例的に「すべての実数の集合」を表す.実数とは数直線上の一点で表せるような数(有理数と無理数をふ くむ)を指すが,とりあえず「数」とだけ理解してくれても問題ない.

n個の集合S1, S2, . . . , Snから1つずつ要素si∈ Siを選んで,i = 1, 2, . . . , nの順に並べた束(s1, s2, . . . , sn) を n-(n-tuple)という.このようにして作られたすべてのn-組の集合をS1, . . . , Snの直積(direct product)といい, S1× · · · × Snと書く.すなわち

S1× · · · × Sn:= {(s1, . . . , sn) : s1∈ S1, . . . , sn∈ Sn} である.*5

2.1 S1= {t, b}, S2= {l, m, r}のときは,S1 × S2= {(t, l), (t, m), (t, r), (b, l), (b, m), (b, r)}となる.

集合Aから集合Bへの関数(function)あるいは写像(mapping) f : A → B とは,定義域とよばれる集合Aの任意 図 の要素x ∈ Aにたいして,値域と呼ばれる集合Bの要素を1つ(その要素をf (x)と書く)対応させる関係である.要素 に注目してf : x 7→ f(x)と書くこともある.定義域や値域は明示されないことがある.たとえば「関数f (x) = 2x」と あれば,通常はf : R → Rなる関数で,x 7→ 2xの対応を持つものを意味する.

定義2.1 戦略形ゲーム(strategic game)とは以下の要素から構成される組(S1, . . . , Sn; u1, . . . , un)である:

プレーヤー(players)の集合{1, . . . , n} (この教材では上記の組には明示的にふくめないことにする)

• それぞれのプレーヤーiについて,iの戦略集合(the set of strategies) Si

• それぞれのプレーヤーiについて,iの利得関数(payoff function)あるいは効用関数(utility function)*6 ui: S1× · · · × Sn→ R

プレーヤーiの戦略集合 Si iがどういう行動を選べるかを記述する.*7

各プレーヤーの利得関数の定義域S1× · · · × Sn に属する要素(s1, . . . , sn)を戦略の組あるいは戦略プロ

ファイル(strategy profile)とよぶ.つまり戦略プロファイルは「だれがどの戦略を採るか」という,全員の

戦略の組合せを記述している.

*5記号 := は等号の一種で,左辺を右辺によって定義するという意味.

*6定義域と値域を明示しないと関数をきちんと定義したことにならないため,この利得関数の定義では,あえてそれらの集合を明示 した.(利得関数 uiの定義域は後述する S1× · · · × Snで,値域はすべての実数の集合 R であることが分かる.) ところが最近 のゲーム理論入門テキストでは記号化を嫌って,定義域や値域はおろか戦略集合 Siさえ明示的に記号化しないことが多い.(むか しとちがって最近は小学生に集合の記号を教えないためだろうか.) そのばあい,たとえば「任意の si∈ Siについて」と書くか わりに,「プレーヤー i の任意の戦略 siについて」と言葉で書く.つまりプレーヤー i の戦略の集合は記号化しないまでも分かっ ているものとして扱われている.

*7具体的なゲームが決まれば戦略を具体的に列挙できるが,ゲーム一般をあつかうときにはそうはできないために,プレーヤー i の 取りうる戦略を集合 Siによって抽象的に表現する.

(9)

プレーヤーiの利得関数とは,任意の戦略プロファイル(s1, . . . , sn)にたいして,そのプロファイルが選ば れたときのプレーヤーiの利得ui(s1, . . . , sn)を実数で与える関数である.*8利得関数の値は利得行列上では 以下の例のように配列される.

Player 2

l m r

Player 1 t u1(t, l), u2(t, l) u1(t, m), u2(t, m) u1(t, r), u2(t, r) b u1(b, l), u2(b, l) u1(b, m), u2(b, m) u1(b, r), u2(b, r)

2.2 上 の 囚 人 の ジ レ ン マ で は ,S1 = S2 = {〈黙秘〉〈自白〉, }.利 得 関 数 u1,u2 は た と え ば u1〈黙秘〉( ,〈自白〉) = −9やu2〈黙秘〉( ,〈自白〉) = 0という値をとる.

リマーク2.3 2人のプレーヤーからなる戦略形ゲームは利得行列で表せた.いま利得行列のそれぞれの枡目に,その枡 目に対応する戦略ペアが取られたときの(利得ペアのかわりに)結果(アウトカム)を記入する.こうやって得られる表を ゲーム・フォーム(ゲーム形式, game form)とかメカニズム(mechanism)とよぶ.たとえば2車線道路のある地点での 対向車の運命は以下のゲーム・フォームで与えられる:

ドライバー2 左側 右側 ドライバー1 左側 無事 衝突 右側 衝突 無事

囚人のジレンマの分析に戻る.「2人の囚人は脅しを本気にして,できるだけ自分の刑期を短くしたいと考 える」と仮定.つまりこのゲームを信じ,自分の利得を最大化したいと.すると

• 2人が隔離されている状況では,合理的なプレーヤは自白を選ぶだろう.相手が黙秘しようが自白しよ うが,自分は自白したほうが有利(利得が高い)だから.(演習: 表でチェックせよ.)

• その結果実現する戦略ペアは〈自白, 自白〉で利得のペアは(−6, −6).

• ところがふたりがともに黙秘する戦略ペア〈黙秘, 黙秘〉にたいする利得ペアは(−1, −1).この方が どちらのプレーヤにとってもより望ましい.(「〈黙秘, 黙秘〉は〈自白, 自白〉よりも パレート優位 (Pareto-superior) である」という.)

協力しあえばプレーヤー全員に利益があるのに,それぞれのプレーヤーが相手に「ただ乗り(free riding)」 しようとしてしまうため,その利益を実現できない.現実社会でもこの種のジレンマはいろいろある.国際紛 争やゴミ収集所の清掃などに該当する例が見られる.

囚人のジレンマでは,囚人1にとって〈自白〉が支配戦略 (dominant strategy): (囚人2の戦略がなんで あっても)囚人1は〈自白〉という戦略を選ぶのがもっとも有利になっている.囚人2にとっても〈自白〉が 支配戦略になっている.

ノーテーション (記号): i 以外のプレーヤーの戦略集合の直積S1× · · · × Si−1× Si+1 × · · · × Sn

S−i,その要素をs−iなどと書く.たとえば4人のばあい,s−2 = (s1, s3, s4),(s2, s−2) = (s1, s2, s3, s4), s−4= (s1, s2, s3).

*8利得関数の代わりに,戦略集合 S1× · · · × Sn上で定義された「選好」を考えることもある.

(10)

このノーテンションに従えば,s = (s1, . . . , sn)がある戦略プロファイルとすると,(si, s−i)はプレーヤーi ひとりだけが戦略をsiからsiに変えた戦略プロファイルを表す.

定義2.2 戦略形ゲーム(S1, . . . , Sn; u1, . . . , un)が与えられているとする. 利得 表 次の不等式群がみたされるとき,プレーヤーiの戦略si∈ Siがプレーヤーiの戦略si∈ Si()支配す る((strictly) dominates)という: 他のプレーヤーの任意の戦略組s−i∈ S−iにたいして,*9

ui(si, s−i) > ui(si, s−i). なお,siがsiを支配するとき,siはsiに支配されるという.

戦略si∈ Siが個人iの支配戦略(dominant strategy)であるとは,siがsi以外のすべての戦略si∈ Siを 支配することをいう.

次の(i),(ii)の不等式群がみたされるとき,戦略si∈ Siが戦略si ∈ Siを弱支配する(weakly dominates) 利得 表 という:*10 (i)すべてのs−i ∈ S−iにたいして,ui(si, s−i) ≥ ui(si, s−i); (ii) あるs−i ∈ S−iにたいして, ui(si, s−i) > ui(si, s−i).

戦略si∈ Siが個人iの弱支配戦略(weakly dominant strategy)であるとは,sisi以外のすべての戦略

si∈ Siを弱支配することをいう.

リマーク2.4sisiを支配する」「sisiを弱支配する」という概念は,同一プレーヤーの戦略を比較するものであ る.定義2.2でsiとsi は同一プレーヤーの戦略になっている(ともにSi の要素である) ことに注意.たとえばプレー ヤー1の戦略s1がプレーヤー2の戦略s2を支配することは,概念上ありえない.

リマーク2.5 戦略si∈ Siが戦略si∈ Siを支配するとき,siはsiを弱支配すると当然いえる.(支配が成り立つとき, 弱支配を定義するいずれの不等式も>でなりたっている.左辺が右辺より大きい[たとえば3 > 2]ということは,左辺が 右辺以上である[たとえば3 ≥ 2]ことの特殊ケースにすぎないためだ.)しかしsiがsiを弱支配するとき,支配すると はかぎらない.すなわち支配は弱支配より「強い」条件である.

リマーク2.6 2人ゲーム(S1, S2; u1, u2)のばあい,プレーヤー1の戦略s1∈ S1がプレーヤー1の戦略s′′1 ∈ S1を支配

するのはつぎの条件がみたされるとき:プレーヤー2のすべての戦略s2∈ S2にたいして, 利得 u1(s1, s2) > u1(s′′1, s2). 表

たとえば,囚人のジレンマではプレーヤー1の〈自白〉がプレーヤー1の〈黙秘〉を支配する:*11 u1〈自白〉( ,〈黙秘〉) > u1〈黙秘〉( 〈黙秘〉, )

u1〈自白〉( ,〈自白〉) > u1〈黙秘〉( 〈自白〉, )

*9以下の不等式は,i 以外の戦略が s−iで固定されているもとでは,i にとって siを選ぶ方が siを選ぶよりも利得が高いことを意 味する.「siが siを支配する」と言えるためには,他人の戦略の任意の組合せ s−iについて,その不等式が成り立つ必要があるこ とに注意.

*10不等式 a ≥ b は「a は b 以上である」という意味.高校の教科書では記号 ≥ のかわりに記号 ≧ を使っていたかもしれない.大学 数学では後者の記号は別の文脈で使われることが多く,実数どうしを比較して「以上」を表すには ≥ を,「以下」を表すには ≤ を 使用するのが普通である.なお,文献によっては「弱支配」を「支配」と呼ぶことがある.

*11以下の式では,s

1=〈自白〉, s′′1 =〈黙秘〉であり,最初の式で s2=〈黙秘〉,2 番目の式で s2=〈自白〉となっている.S2= { 黙秘〉,〈自白〉} だから,これですべての s2∈ S2を考えたことになる.

(11)

2.2.2 支配される戦略

あるプレーヤーの戦略が同一プレーヤーの他のいずれかの戦略に支配されるとき,後者の戦略を選んだ方が 必ず利得が高いので,合理的なプレーヤーならば前者の戦略を選ばないはずだ.囚人のジレンマの解は,その ような支配される戦略を削除した結果と考えることもできる.この考え方をいずれかのプレーヤーが支配戦略 を持たない場合にも拡張したのが「支配される戦略の繰り返し消去」である.いずれのプレーヤーも支配戦 略を持たない例は天谷[8, 46–47頁]に譲り,ここでは片方のプレーヤーのみが支配戦略を持つ簡単な例を挙 げる:

小豚 入れに行く 待つ 大豚 入れに行く 4, −1 1, 3

待つ 5, −1 0, 0

これは「合理的な豚」と呼ばれる有名なゲームで,餌箱のそばにいる強い大豚と弱い小豚のどちらが餌箱のふ たのスイッチを押しに行くかという状況を表している.餌箱には5単位の餌が入っており,離れた場所にある スイッチを入れて帰ってくるには1単位の労力がかかる.*12

小豚にとって〈入れに行く〉は〈待つ〉に支配されるため選ばれることはない.このことを大豚が読み込め ば,小豚の〈入れに行く〉を消去できるので,次のゲームが得られる:

小豚 待つ 大豚 入れに行く 1, 3

待つ 0, 0

このゲームでは大豚の〈待つ〉は〈入れに行く〉に支配されるため削除されるため次のようになり 小豚

待つ 大豚 入れに行く 1, 3

けっきょく最後に残る戦略の組は大豚の〈入れに行く〉と小豚の〈待つ〉となる.この結果は「弱者が強者に 勝つ」例としてしばしば言及される.大豚は5, 4といったより高い利得が可能だったにもかかわらず下から2 番目である1の利得にとどまり,小豚は−1, 0, 3という可能な利得のなかではいちばん高い3の利得を得て いるためである.

「支配される戦略の繰り返し消去」では,得られる戦略の組がじゅうぶん絞られるとは限らない.例えばど のプレーヤーも (いずれかの戦略に)支配される戦略を持たない場合,すべての戦略組が解になってしまう.

「支配」の概念とは異なる考え方が求められるのだ.ふたつ例を挙げておく.

例2.3 つぎのゲーム(男女の闘い; Battle of the Sexes; Bach or Stravinsky;利得のちがいはあるものの,神

*12大豚だけがスイッチを入れに行ったときに得られる餌は 2 単位とする.詳細はたとえば天谷 [8, 42–45 頁] を参照.このゲームに 限らず,状況の詳しい説明をわざと省略することがある.どうして利得が与えられたような数値になるのか,背後にあるストー リーをまずは想像してみるとよい.どうしても想像できないばあい,有名なゲームについてはネットで調べればストーリーの詳細 はすぐに見つかるはずだ.

(12)

取[18,例6.5]にある「男女の戦いゲーム」も同じ構造)ではいずれのプレーヤーも支配戦略を持たないし,支 配される戦略も持たない(演習: 説明せよ):

ふみ Bach Stravinsky いちろう Bach 2, 1 0, 0

Stravinsky 0, 0 1, 2

2.4 つぎのゲーム(チキンゲーム; Chicken;弱虫ゲーム)は,血気盛んなふたりの若者が正面からお互いに 向かって車を走らせる危ない状況を描いている.

B 直進 避ける

A 直進 −5, −5 2, 0

避ける 0, 2 1, 1

ふたりとも直進した場合は正面衝突しともに大怪我,ひとりだけが直進した場合は,直進した者は仲間の賞賛 を得,避けた者は弱虫呼ばわりされる.ふたりとも避けた場合は大怪我や弱虫呼ばわりは免れるが賞賛もされ ない.以上のストーリーのままで真似することは勧められないが,現実でも家庭内や会社内で特定の仕事の分 担がチキンゲームになっている例は見かけられる(〈直進〉がその仕事をしない「強行姿勢」に,〈避ける〉が その仕事をする「譲歩」に対応).このゲームでもいずれのプレーヤーも支配戦略を持たないし,支配される 戦略も持たない(演習: 説明せよ).

2.2.3 ナッシュ均衡

「ナッシュ均衡」の考え方を導入するために,この考え方にしたがって例2.4のチキンゲームを解いてみる.

• プレーヤーBが〈直進〉という戦略を選んだとき,プレーヤーAの利得を最大にする戦略は〈避ける〉 になっている(Aが〈直進〉を選べばAの利得は−5で,〈避ける〉を選べば0).このとき「Bの〈直 進〉という戦略にたいするAの最適反応(best response) は〈避ける〉である」という.

• 逆に,Aの〈避ける〉という戦略にたいするBの最適反応は〈直進〉になっている.

• 戦略のペア(s, s)がたがいに相手の戦略にたいする最適反応からなっているとき(つまりsはsにた いする最適反応,sはsにたいする最適反応),そのペアをナッシュ均衡(Nash equilibrium)とよぶ.

「おたがいがナッシュ均衡を構成する戦略をとっているかぎり,どちらもそのペアを離れる誘因はない」 という意味で,安定したペアである.

• 〈避ける,直進〉はこのゲームのナッシュ均衡である.

• 〈直進,避ける〉もナッシュ均衡である.

• これら以外にナッシュ均衡はない.

チキンゲームでは,片方が強行姿勢を取りもう片方が譲歩するのが均衡になっている.複数ある均衡のどれ が実現するかはこれだけの理論からはなんとも言えない.現実ではなんらかの経緯などでどれかの均衡が実現 しており,その状態から抜け出すことがなかなかできないといったケースが見られる.たとえば(だれもやら ないとみんなが困るけど自分がやることはできれば避けたいような)ある種の仕事について「べつに決めたわ

(13)

けでもないのにいつも同じ人がやることがみんなの了解になっている」ような職場は,特定の均衡から別の均 衡に移行することの難しさを物語っている.

補足2.2 最適反応を定義する前に,「最大化問題の最適解」という概念を復習しておく.実数値関数 f : A → Rの最大 化問題(maximization problem)とは

「条件x ∈ Aのもとでf (x)を最大化せよ」

という問題のことをいう.ある特定のx∈ Aがこの問題の最適解(optimal solution)であるとは,すべてのx ∈ Aに ついて,

f (x) ≥ f(x)

となることをいう.たとえば[0, 2] = {x ∈ R : 0 ≤ x ≤ 2}を0以上2以下の実数の集合 (区間) とするとき, g(x) = −(x − 1)2 で与えられた関数g : [0, 2] → Rは,任意のx ∈ [0, 2]についてg(1) ≥ g(x)を満たすので,x = 1は グラ 最大化問題の最適解である(グラフ参照). フ

定義2.3 戦略形ゲーム(S1, . . . , Sn; u1, . . . , un)が与えられているとする.プレーヤーiの戦略si∈ Siが他

のプレーヤーのとる戦略の組

s−i= (s1, . . . , si−1, si+1, . . . , sn) ∈ S−i

にたいする最適反応(best response)であるとは,以下の条件*13をみたすことである: すべてのsi∈ Siにた

いして,

ui(si, s−i) ≥ ui(si, s−i) となる.

リマーク2.7「戦略siは戦略組s−iにたいする最適反応である」という言い方に注意.どういうs−iにたいするものか を明示せずに「戦略siは最適反応である」と言うのは概念上正しくない.

リマーク2.8 2人ゲーム(S1, S2; u1, u2)のばあい,プレーヤー1の戦略s1∈ S1 がプレーヤー2の戦略s2∈ S2にたい する最適反応であるとは,すべてのs′′1 ∈ S1について,

u1(s1, s2) ≥ u1(s′′1, s2)

となることである.ここでプレーヤー2の戦略s2が両辺に共通である(「固定されている」)ことに注意.相手の戦略s2

を固定したうえでプレーヤー1が自分の戦略s′′1 を動かして見つけた最適解がs1になっている.

すべてのs′′1 ∈ S1についてこの不等式が成り立つことの意味を利得表で言えば,ある特定の列を(s2に対応するものに) 固定したうえで行(つまりPlayer 1の戦略s′′1)をいろいろ変えてu1の値がいちばん大きくなる行(戦略s1に対応)を見 つけていることになる.*14演習2.4の正解例にある図が参考になるだろう.

定義2.4 戦略プロファイルs= (s1, . . . , sn) ∈ S1× · · · × Sn がナッシュ均衡(Nash equilibrium)であると は,おのおののプレーヤーiについて,戦略si が他のプレーヤーのとる戦略s−i= (s1, . . . , si−1, si+1, . . . , sn) への最適反応となっていることである.*15

*13以下は siが,最大化問題「条件 si∈ Siのもとで ui(si, s−i)を最大化せよ.ただし s−iは固定されている」の最適解になるこ とを意味している.

*14s

1 と s′′1 は別変数である.上の定義の中身をたとえば次のように言い換えてもまったく同じである: 「すべての t1∈ S1につい て,u1(s1, s2) ≥ u1(t1, s2)となることである.」

*15べつの言い方をしてみよう.いま,プレーヤー i が予想する他のプレーヤーの戦略の組を ˜s−iとする.sがナッシュ均衡である とは,任意の i にたいして,(i) siが予想 ˜s−iにたいする最適反応になっており,かつ (ii) 予想が合理的であること (˜s−i= s−i) を意味している.奥野 4.3.1 節を参照.

(14)

2.3 ナッシュ均衡 その 2

神取[18, 6.2節例6.3と6.3節–6.4節]にもとづいて進める.

2.3.1 立地ゲーム

この節は神取[18, 例6.3, 321–323頁]を講義するためのノートである.その他の解説については2.9節の 読書案内を参照.

「ホテリング・モデル」とか「ホテリングの立地ゲーム」などとよばれるこの戦略形ゲームのプレーヤー,戦 略集合,利得関数は以下のとおり:

• プレーヤは焼きそばの屋台AとB.

• 各プレーヤーの戦略は屋台を出す場所xA, xB であり,戦略集合はSA= SB= [0, 1] = {x ∈ R : 0 ≤ x ≤ 1} (銀杏並木通り).*16

• 各プレーヤーの利得は客数であり,客は一様に分布していていちばん近い屋台に行くと仮定.プレー ヤーAの利得は(図6.3参照)

uA(xA, xB) =





xA+xB

2 if xA< xB

1/2 if xA= xB

1 − xA+x2 B if xA> xB

であり,プレーヤーBの利得も同様.

このゲームの(ナッシュ)均衡は(xA, xB) = (1/2, 1/2)だけであることは以下のようにして示せる: CasexA< xB: xA< x

A< xB となるxAをとればプレーヤーAの利得はuA(xA, xB) > uA(xA, xB)とな る (図6.3参照).よってxAはxB にたいする最適反応ではない.したがって(xA, xB)は均衡ではな い.(もし均衡ならばxAxBにたいする最適反応になっているはずだから.)

CasexA> xB: 上記ケースと同様.

CasexA= xB: 以下の2つのケースに分ける:

• xA = xB ̸= 1/2のばあい,たとえばxA = 1/2をとればプレーヤーAの利得はuA(xA, xB) > 1/2 = uA(xA, xB)となる.[あるいはxAを図6.4のように左右のうちより広く空いている方にわ ずかに移動した場所としてもよい.]よってxAxBにたいする最適反応ではない.したがって (xA, xB)は均衡ではない.

• xA= xB = 1/2のばあい,(xA, xB) = (1/2, 1/2)は均衡である(図6.5).この状態でAは利得 uA(xA, xB) = 1/2を得ているが,仮にxA̸= 1/2に移動すれば,xAがどこであってもAの利得 はuA(xA, xB) < 1/2となり,利得が低くなる.よってxAはxBにたいして最適反応であると言 える.同様に,xBはxAにたいして最適反応であると言える.

「2人が真ん中に立地する」という以上の結論は,3人以上では成り立たないことに注意(リマーク 2.11).

*16[a, b]は,a 以上 b 以下の実数からなる区間を表す標準的な記法である.

(15)

2.4 不確実性と期待効用

神取[18, 6.6節]にもとづいて進める.以下は補足.

ある個人がある「くじ」と「確実にx円もらえる」ことを同等と評価する (つまり無差別である; 同じ利 得である)とき,このx円をそのくじの確実性同値額と言い,そのくじの期待値(期待金額)と確実性同値額 の差額をリスクプレミアムと言う.確実性同値額x円はその個人のそのくじにたいする「評価額」とみなせ,

「半々の確率で1000円か3000円が当たるくじ」の場合それは1000円と3000円のあいだになるだろう.危 険回避的個人であれば期待金額を確実に受け取る方をそのくじを引くよりも高く評価しているので,このばあ い確実性同値額x円は期待金額2000円より低くなる.仮に確実性同値額xが1600円ならば,リスクプレミ

アムは2000 − 1600 = 400円であり,この差額はこのくじが期待値2000円と等価になるためにリスクに対し

て補償してもらわなければならない金額と考えられる.

2.5 混合戦略とナッシュ均衡の存在

神取[18, 6.7節]にもとづいて進める.

2.6 混合戦略均衡の求め方

岡田[15, 4章4 節前半]にもとづいて進める.

2.7 コメント

• (蛇足) 2.2節はこの科目でもっとも抽象度が高いトピックである.過去「テキストとギャップがある」

という意見があった.しかし受講生のみなさんはすでにテキストや講義で「支配」「ナッシュ均衡」な どの概念の直観的な意味は分かっているはず.2.2節の抽象度の高い部分では,それらすでに意味の分 かっていることを数学的にきちんと定義し直しているにすぎない.集合や関数や最適解など必要な数学 については補足している.ギャップがあるのではなくて,抽象度が高くなっているだけという方が正し いだろう.

一般に定義というのは簡単ではない.たとえば形のない「愛」はもちろん,形があるものでも簡単では ない.一応知っているはずの「大学」や,よく知っているはずの「ネコ」をみなさんは定義できるだろ うか? すべての概念を定義する必要はないが,きちんと定義しておかなければ正確な議論ができなく なるような概念は定義したほうがいい.さいわい,上記の「愛」「大学」「ネコ」などとちがって,(「支 配する」であれ「最適反応」であれ「ナッシュ均衡」であれ)ゲーム理論の主要概念はいずれも数学的 に簡単に定義できる.

• 2.2節にある囚人のジレンマを示したうえで,自分が囚人1だったらどういう行動を取るか尋ねたら,

ある学生は状況の記述が不十分だから分からないとの趣旨の回答をした.仮に状況がこのゲームで完全 に記述されていて,ナッシュ均衡の考え方にしたがって解くとどうなるか尋ねたら,ちゃんと「自白」 と答えた.現実の囚人の場合,たとえば先に出所した囚人1にたいして囚人2が殺し屋を送るなども考 えられる.そういう状況を記述するゲームは,通常は囚人のジレンマとは異なるものになる.あるゲー ムが記述している状況でどういう行動を取るべきかという問題は,じっさいにその状況をそのゲームが

(16)

ちゃんと記述できているかどうかとは分けて考えることにする.あくまでそのゲームが状況をきちんと 記述できていると想定したうえで答えてくれればよい.

• 2.2節にある弱支配と最適反応の定義式が同じという指摘が過去にあった.ちがいはどの変数を動かし

ているかということ.弱支配の不等式は他人が戦略s−iをいろいろ変えても,つねに左辺が右辺以上の 値を取ることを言っている.最適反応の不等式は他人の戦略 s−iを固定した上で,自分の戦略si をい ろいろうごかして最適なものを探している.

• 2.2.2節の「合理的な豚」について動物行動学者が実際にブタで実験したところ,理論通りの結果にな

ることが多かったらしい.ブタが合理的な推論を行ったというよりは,試行錯誤の中で賢明なやり方を 学んだと理解できる.

– 本文ではボタンを押しに行くことは大豚にとっても小豚にとっても同じコストを伴うと仮定してい るが,大豚にとってのコストはより少ないϵ であると仮定した方が自然かもしれない.(ここでϵ は「イプシロン」とか「エプシロン」と読み,数学では微少量を表わすときに使うことが多い.) 本文と同様の議論はϵが0 < ϵ < 2を満たせば成り立つことを確認するといい.

– 合理的な豚のゲームのように,「弱いものが優位に立つ方法」を知りたいという質問が過去にあっ た.一般的な方法があるわけではないが,たとえば自分の選択肢を絞って「コミットメント」する ことにより有利な状況を作り出すことができる場合もある.あくまで「そういう場合もある」とい うふうに理解すべき.ゲーム理論を知っていれば多少有利になる場面は増えるが,絶対的なもので はない.「矛盾」の起源となった故事の盾と矛の関係を考えれば分かるだろう.相手もゲーム理論 を知っているかもしれないし,あるいはゲーム理論を知らなくても直観でじゅうぶん戦略的に行 動できるひとかもしれない.「攻略方法を知っていれば必ず勝つ」ゲームは存在するが,そういう ゲームでも自分が勝てる方のプレーヤーになるとは限らない.

• Strategy (戦略), equilibrium (均衡), incentive (インセンティブ)などの単語の発音は日本語流ではま ず通じない.正しく発音できないと聴き取るのも困難.CALD (リンク)など適当な電子辞書で発音を マスターしておこう.

• リマーク 2.11で言及したホテリングモデルの3人ケース (梶井・松井練習問題13.1, 13.2) について

「3人が同じ場所に移動しようとするのに,同じ場所に来てしまったらそこからはなれようとするのは 矛盾しないか?」と過去に質問があった.「同じ場所に移動しようとする」というのは不正確.正しく は同じ場所に限りなく近づこうとするだけ.かりに他の2人が地点1/2にいるとき,縦軸に利得そして 横軸に自分の場所をとったグラフを描けば,地点1/2に近づくにつれて利得も1/2に近づくが,地点 1/2に一致したところで利得が不連続に下がって1/3となる.このばあい最適な地点というものは存在 しないが,「1/2のすぐ右あるいはすぐ左」という,位置を特定できないものがそれにあたる.

• 神取6.3節.複数均衡にかんして過去尋ねられた質問は,均衡(s, t), (s, t) (男女の戦いゲームでは均 衡(サッカー,サッカー)と(ショッピング,ショピング)に当たる)があったとして,Player 1が前者 の均衡を,Player 2が後者の均衡を想定して行動した結果,(s, t) (このゲームでは(サッカー,ショッ ピング)に当たる)が実現してしまわないかというもの.もちろん (s, t)は一般にはナッシュ均衡にな らないが,そういう戦略の組合せをどうやって避けるかというのは問題になる.べつの言い方をすれ ば,複数ある均衡のどれをどうやって実現するかという問題であり,ゲーム理論における大きな課題と して残っている.その際重要なのは「相手の出方を正しく予想すること」であり,そのような予想がど のように生まれるかの説明として「試行錯誤の落ち着いた先」「話し合いの結果」などが考えられる(神

(17)

取[18, 6.3節]を参照).なお,今後導入する「部分ゲーム完全均衡」では,いくつかのふさわしくない ナッシュ均衡を取り除くことができる.しかし多くのゲームではプレーヤーたちの行動を一意的には予 想できないと考える方が自然だ.一意的に予想できないなら,解概念としても複数の均衡を選ぶように しておくべきである.

ただ,非協力ゲーム理論は取るべき行動をしめすための規範的理論とは通常見なされてはいない. じっさいに観察される社会現象を説明したり予想したりするための事実解明的理論と見なされる. まだ出ていない結果を予想するためでなく,すでに分かっている結果を説明するために使うばあ い,複数均衡のそれぞれをどう実現するかという問題は生じない.すでに特定の結果が決まってい るのだから.それが均衡として説明出来ればいちおうは満足できるのだ.現実に観察されるような 結果のいずれもが均衡になっていて,逆に均衡になる結果がいずれも現実にも観察できるなら,事 実を説明する理論としては特に問題はないと言えるかもしれない.

• 混合戦略のナッシュ均衡は,2.5節と2.6節のいずれのやり方でも求められるようにしておくこと.前 者では,2つの純粋戦略を用いたときの期待利得を等しくする.後者では最適反応グラフの交点を見つ ける.試験問題でこのグラフを書かせる可能性がある.

• 2.6節で参照した岡田[15, 75-76頁]では,各人の期待利得を改めてx とy の両方をふくむ式で表し

ているが,このような式を立てる必要はない.すでに男性の期待利得はy の式(72頁)で,女性のはx の式で表しているのだから,それらを用いればよい.たとえば男性が野球とバレエをどちらも正の確率 で選ぶ均衡(x, y) = (2/3, 1/3)では,野球を選択してもバレエを選択しても同じ期待利得が得られる はずであり,じっさい野球を選んだときの期待利得は2y= 2/3でバレエを選んだときの期待利得は

1 − y= 2/3となり,同じ値になっている.よって野球とバレエを混合しても期待利得は2/3 である.

2.8 課題

演習2.1 2.2節の囚人のジレンマを考える.囚人2の戦略〈黙秘〉にたいする囚人1の最適反応はなにか? 囚

人2の戦略〈自白〉にたいする囚人1の最適反応はなにか? このゲームにナッシュ均衡は存在するか? 存在す るならすべて列挙せよ.

正解例.

• 囚人2の〈黙秘〉に対する囚人1の最適反応は〈自白〉である.

• 囚人2の〈自白〉に対する囚人1の最適反応は〈自白〉である.

• ナッシュ均衡は存在し,〈自白,自白〉のみである.

演習2.2 (最重要; 最適反応・支配・ナッシュ均衡の理解) 以下のゲームを考える.

Player 2

l m r

Player 1 U 2, 3 3, 2 0, 0 M 1, −1 1, −1 1, 1 D 2, 1 1, 2 −1, 1 (i) Player 1の戦略UにたいするPlayer 2の最適反応を求めよ. (ii) Player 2の支配戦略を見つけよ.

参照

関連したドキュメント

※1・2 アクティブラーナー制度など により、場の有⽤性を活⽤し なくても学びを管理できる学

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

手話の世界 手話のイメージ、必要性などを始めに学生に質問した。

脱型時期などの違いが強度発現に大きな差を及ぼすと

関西学院大学には、スポーツ系、文化系のさまざまな課

一貫教育ならではの ビッグブラ ザーシステム 。大学生が学生 コーチとして高等部や中学部の

断するだけではなく︑遺言者の真意を探求すべきものであ

を育成することを使命としており、その実現に向けて、すべての学生が卒業時に学部の区別なく共通に