• 検索結果がありません。

game notes1509 最近の更新履歴 H Reiju Mihara

N/A
N/A
Protected

Academic year: 2018

シェア "game notes1509 最近の更新履歴 H Reiju Mihara"

Copied!
52
0
0

読み込み中.... (全文を見る)

全文

(1)

ゲーム理論 : 補助教材

三原麗珠

香川大学図書館

2015 9

目次

はじめに 2

2015年度ゲーム理論受講者へ . . . 2

経済学を学ぶ方のための読書案内 . . . 3

1章 なぜ今「ゲーム理論」が注目されているのか 62章 ゲーム理論の基本同時ゲームと交互ゲーム 6 2.1 渡辺2章へのコメント . . . 6

2.2 渡辺2章の補足: 戦略形ゲームの定式化. . . 9

2.3 渡辺2章の補足にたいするコメント. . . 14

2.4 渡辺2章とその補足にかんする課題. . . 14

2.5 渡辺2章とその補足にかかわる読書案内 . . . 20

3章 基本で読み解くゲーム理論のキーワード 20 3.1 渡辺3章へのコメント . . . 20

3.2 渡辺3章の補足: 立地ゲーム . . . 23

3.3 渡辺3章の補足にたいするコメント. . . 24

3.4 渡辺3章とその補足にかんする課題. . . 24

3.5 渡辺3章とその補足にかかわる読書案内 . . . 26

4章 少し高度なゲーム理論の戦略的思考法 26 4.1 渡辺4章へのコメント . . . 26

4.2 渡辺4章の補足にたいするコメント. . . 28

4.3 渡辺4章とその補足にかんする課題. . . 28

4.4 渡辺4章とその補足にかかわる読書案内 . . . 37

5章 不確実性と情報をゲーム理論で考察する 38

H. Reiju Mihara: http://www5.atwiki.jp/reiju/ (リンク)

(2)

5.1 渡辺5章へのコメント . . . 38

5.2 渡辺5章の補足にたいするコメント. . . 41

5.3 渡辺5章とその補足にかんする課題. . . 42

5.4 渡辺5章とその補足にかかわる読書案内 . . . 47

6章 大きく広がるゲーム理論最新研究トピックス 48 6.1 渡辺6章へのコメント . . . 48

7 おわりに 48 7.1 最後の読書案内 . . . 49

8 三原麗珠の自己紹介への補足 51

参考文献 52

はじめに

2015 年度ゲーム理論受講者へ

香川大学で開講するゲーム理論の授業(学問基礎科目 数学B)では,次の書籍をメインテキストとする:

• 渡辺隆裕. 図解雑学ゲーム理論 [リンク]. ナツメ社, 2004

入手してもらう教材や文献を以下に簡潔にまとめておく(括弧内は識別コード).これらの文献の必読部分, 特に参考にすべき部分,そしてこれら以外の参考文献については,シラバスの「必読文献・参考文献」やこの 補助教材のいくつかのセクションに載せた「読書案内」を参照のこと.変更があるばあいはGoogle サイトの 講義ページ(リンク)でアナウンスする.

公開分(講義ページから入手できるもの)は以下のとおり:

• 三原麗珠. シラバス (babygames15syllabus)

• 三原麗珠. ゲーム理論: 補助教材, 2015年3月(game1503notes) [この文書]

• 三原麗珠. 授業中に解説する課題一覧(2015年度版) [Webページ]

非公開分(香川大学Moodle上の本コース用ページに入手方法を掲載)は以下のとおり:

• 茨木俊秀. 情報学のための離散数学. 昭晃堂, 2004. 第1章(ibaraki04ch1). 参考

• 奥野正寛. ミクロ経済学. 東京大学出版会, 2008. 第4章(okuno08ch4). 参考

• 三原麗珠. 板書の一部を再現したノート(babygames-notes). 必読

• 神取道宏. ミクロ経済学の力. 日本評論社, 2014. 第6章(kandori14ch6;第II部イントロダクション をふくむ)と第7章(kandori14ch7).一部必読

– 例6.3 (321–323頁)は印刷して該当回に持参 – 7.1–7.2 節(358–374 頁)は印刷して該当回に持参

• 岡田章. ゲーム理論・入門(新版). 有斐閣, 2014. 第4章(okada14ch4). 一部必読 – 4節前半「混合戦略のナッシュ均衡点」(71–76 頁)は印刷して該当回に持参

(3)

• 武藤滋夫. ゲーム理論入門. 日本経済新聞社, 2001. IV章(muto01ch4).一部必読

この補助教材はメインテキストである渡辺隆裕[21] 『図解雑学 ゲーム理論』の章の順に構成されている. この教材の各章を構成するセクションには以下の4種類がある:

• その章あるいはその章の「補足」にたいするコメント.テキスト自体あるいは授業内容についての訂 正,断り,明確化など.かなり自由に書いている.なお,該当ページのみでラベル付けしたコメントは, 特に断らないかぎり渡辺[21] 『図解雑学ゲーム理論』にたいするものであり,具体的には初版第14刷

(2008年6月30日)を対象にしている.最近の「刷」では誤りは修正されていることがある.

• シラバスの授業計画にある「補足」のための講義ノート (2.2節と3.2節)

• 当該章とその補足にかんする課題および正解例.これらは授業の進行に沿って配列されている.各自が 取り組むべきタイミングの詳細は,シラバスの「授業計画」に載っている.また,授業中に解説する分 については,解説する時期が上記 Webページ「授業中に解説する課題一覧」にまとめてある.

• その章にかかわる読書案内

この文書からWebサイトにリンクが貼られている部分には,丸括弧内に「リンク」と書いた.

経済学を学ぶ方のための読書案内

ここでは主として経済学を学ぶ学生を念頭に,より高度なレベルの学習に効率的に進むことを重視して, ゲーム理論周辺の厳選した読書案内を提示する.書籍を適切に理解するには,講義を受けたりそれを読むべき インセンティブがあった方がいいので,そのような機会を実現するための環境についても触れる.ここで紹介 するテキストのうち主としてゲーム理論とその応用を扱うものは,政治学や経営学や情報科学などの他分野を 学ぶ学生にも薦められる.他分野を学ぶ学生は少なくともそれらを知った上で,自分の分野に近いゲーム理論 のテキストと比較した上で読む本を選ぶといいだろう.

ゲーム理論は市場の働きをあつかう価格理論とともに,ミクロ経済学の一環として教えられることが多い. ミクロ経済学全般を知ることは,ゲーム理論の理解に不可欠とは言わないが理解を深めるために役立つことは まちがいない.まず,これから経済学を学ぶすべての学生に伊藤[11]『ひたすら読むエコノミクス』を通読し てミクロ経済学の全体像を掴むことを薦めたい.教科書以前の一冊として書かれた本だから,この科目を完了 する前に大半の章を読めるだろう.

伊藤の本でミクロ経済学の全体像をつかんだあとは,数あるミクロ経済学のテキストから一二冊選んで「ミ クロ経済学」の科目の受講に合わせて読み進めるといい.学部生として本格的に勉強したければ,その際,神 取[15]『ミクロ経済学の力』を最初か二冊目として読むことを薦める.このテキストは説明の丁寧さや現実の 事例の豊富な提示などから,極めて評価の高い一冊である.伊藤と神取のあいだに一種類入門書を入れた方が スムーズに勉強が進む人もいるだろう.そのための候補になる入門書はひじょうに多いし,どれがいいかはそ の人の性格に左右される部分が大きいので,ミクロ経済学担当の講師その他から情報を得て自分で探してもら いたい.

一方で,ゲーム理論とその応用の勉強も開始するとよい.そのためにはいまや古典ともいえる梶井・松井 [8]『ミクロ経済学: 戦略的アプローチ』がオススメだ.順番は神取の前でも後でも同時並行でも構わないし, 神取の第II部と重なる話題も多い.十分モーティベーションが高い学生なら自力で読める本だが,この科目 かそれに類するゲーム理論科目を取って非協力ゲーム理論の全体像を把握し均衡の計算もできるようになった

(4)

後の方がスムーズに読めるだろう.三原のこの科目にかんしては,必読文献を読んだり演習問題をこなすこと で効果的に学べるはずだ.

神取と梶井・松井のテキストを読了しそのレベルの問題を解くために必要な数学をマスターしたら,学部レ ベルのミクロ経済理論の基礎固めはできたと言える.数学の勉強は通常なら微分積分と線形代数と確率をふく む科目を取るのが最低ラインだが,とりあえず学部レベルの経済学に必要な数学を(経済学に出てくる例を通 して)学ぶ目的には,尾山・安田編[14]『経済学で出る数学: 高校数学からきちんと攻める』が評判が良いよ うだ.

経済学を学ぶ学部生の大部分にとって,(ミクロ)経済理論の学習は以上で十分だろう.前提知識なしで読め なくはない書籍4冊で済むと思えば大したことはないかもしれない.(ミクロ経済学じたい意思決定や社会の 理解に役立つので,経済学と関係の薄い分野を専攻する学生も教養としてこれくらいの経済学は知っておいて 損はないだろう.絞りたければ梶井・松井か他のゲーム理論のテキストから選べばいい.)大学のカリキュラ ムにもよるが,受講した科目を深化させる形で勉強すれば2年生を終えるまでにここまで終わらせることは十 分可能だ.あとはマクロ経済学その他の応用分野を学ぶなり,統計学・計量経済学で実証分析の理論とそれに 役立つプログラミングを学ぶなり,集合と位相や解析学のような抽象数学を学ぶなり,ゼミナールに参加して 特定分野を掘り下げてみるのもいいだろう(次のパラグラフから述べる高度なレベルを目指す学生は,ゼミを 選ぶときに教員の研究能力も重視した方がいいかも).特定分野を概観するサーベイ論文をはじめ,適切な指 導さえ受ければこの段階でまずまず読める学術論文もあるから,指導教授に読めと言われたら読んでみるとい い.それらの読書案内はこのセクションの範囲外なので省略する.*1

次に,より高度なレベルへの最短距離をしめそう.まず留意すべきは,学部レベルの応用分野の勉強をや りすぎないことである.経済学は実証にせよ応用にせよ,モデル (理論) をひじょうに重視する分野だから だ.応用分野であっても,理論の理解なしでは高度なレベルには進めないのだ.学部レベルの科目で学べる ことと言ったら,詳細な事実の蓄積であったり,理論的か統計的に得られた結果だけであったりと,経済 学的深まりのないものになりがちだ.高度なレベルをめざすならば,早めに大学院で必修レベルの経済理 論を学ぶべきなのである.それを学ぶ意欲のある学部生には,このレベルの標準的なテキスト Jehle and Reny [1], Advanced Microeconomic Theory とゲーム理論に特化したTadelis [4], Game Theory:

An Introduction から,いくつかの章を読んでみることを薦める.これらはより詳細な Mas-Colell,

Whinston, and Green [2], Microeconomic Theory のようなテキストとともに国内外の大学院必修科 目で採用されることの多いものであり,学部生が読破する必要はないが,必要に応じて自力で読めることが大 学院生になるための条件である.(国内でも主要経済学大学院ではミクロ経済学の講義自体が英語で行われる ので,まず「読める」ことは最低条件と言えるだろう.英語で読むのは大部分の学生にとってたいへん時間が かかるかもしれないが,このレベルになると日本語でもいずれにせよとても時間がかかるものである.)神取 や梶井・松井を読み必要な数学を押さえた後なら,これら英文テキストに進むのに深刻なギャップはないはず である.一方で神取や梶井・松井よりは高度でJehle and RenyやTadelisよりは取っ付きやすそうな日本語

*1ただ,まちがって非主流派の経済学 (マルクス主義経済学) に引っかからないように注意した方がいい.それらは学問でないわけ ではないけれども,「経済学」として国際的に教えられているものとはだいぶちがうからだ.政治学や社会学や法学などと異なる経 済学のひとつの重要な特徴は, (自然科学と同様に) 世界中のほとんどどこの大学でも同じようなトピックをカバーしたテキスト で教えられていることである.留学を考える学生にとっても,ビジネスパーソンを目指す学生にとっても,これは留意すべき点だ. たとえばこのゲーム理論科目でよい成績を収めておけば,留学先の米国大学でより詳細なゲーム理論科目を受講してトップに近い 成績を収めるといったことがわりと簡単にできることになる.ただし講義で使われる英語はかなり限られていたり (ネィティブス ピーカーでもきちんと英語で説明せずに図を書いて “like this” とか言うだけで済ませたり) まちがっていたりする (学生は講師 の英語の誤りは滅多に指摘しない) ので,豊かな英語力をつけたい人には経済学科目は物足りないかも.

(5)

テキストも林[7]『ミクロ経済学』をはじめいくつか存在する.それらは大学院レベルの英文テキストを読め るようになることを優先しつつ,補助的に利用するといいだろう.

Jehle and RenyやTadelisのような読みやすいテキストではあまり感じないかもしれないが,大学院レベ

ルの経済理論を学ぼうとすると数学力の不足を感じる人が多いだろう.特に理論自体を研究対象にすることを 目指す人にとっては,数学を使って自分で証明を構築できるようになっておくことが必須である.そのために は数学専攻者を対象とした集合と位相や解析学などの数学科目を受講して証明を添削し合ったりして抽象数学 のトレーニングを受けるのが最適だろう.これは経済学大学院進学後にはなかなかできないことなので,学部 時代にやっておくのがいい.*2もし自力でやるとしたら,とりあえずJehle and Renyの付録[1, Chapter A1] をやるだけでも違いはあるだろうし,より本格的にはたとえば金子[9]『数理基礎論講義: 論理・集合・位相』 が幅広いトピックをカバーしている.

大学院レベルの経済理論テキストを何章か読んでみても経済理論にたいする強い関心を持ち続けられるよう な奇特な人は,大学院ミクロ経済学の講義を受けるといい.このレベルの講義を提供するようなまともな経済 学大学院を上に持つ経済学部に在学する学部生ならそのような講義を受講できることが多い.残念ながら(香 川大学など)多くの大学の大学院ではこのレベルの科目は提供されていないから,まずはまともな経済学大学 院(国内なら東大,一橋,慶応,大阪大あたり)に進学してからということになる.*3

まともな大学院進学のメリットとしては,まずは就ける職業の種類が増えることが挙げられる.たとえば学 者,国際機関,シンクタンク,金融の専門職などであり,各大学院が就職先を公表してる.これは大学院で学 ぶ内容の問題だけでなく大学院で知り合う人とのコネクションの問題でもある.次に,就職後に勉強が必要に なったときに呑み込みが早かったりより高度なところから始められるといったことも挙げられるだろう.まと もな大学院に進学するためには英語や数学や経済学の勉強をふくめ準備に相当時間がかかるが,大学1年のと きから適切に受講科目を選んだりして本格的に勉強を開始すれば,それらを3年次までに済ませることは不可 能ではないだろう.早期卒業制度を利用するのも悪くはないが,大学院進学前に学んだ方がいい事柄は経済理 論以外にもたくさんある.それらを学べる環境が整っているのなら,卒業を焦る必要はない.

まともな経済学大学院でミクロ経済学,マクロ経済学,計量経済学などの必修科目を受講すれば,国際学術 誌に掲載されている論文もかなり読めるようになる.大学院の専門科目を取ったり専門書を読んだりサーベイ 論文を読んだりして,自力で読める論文を増やして行こう.このくらいになった上で修士号も取れば,統計分 析や経済学を用いる仕事に就ける可能性が高まってくる.銀行,証券,保険,通信・情報,シンクタンク,コ ンサルタント,官庁など,結構いい就職先はあるようだ.

たとえ経済学への関心がひじょうに強くても通常はこのあたりで脱落するのが幸せだと思うが,まだ続けた いばあい経済学を読む側から書く側への移行,つまり大学などの研究者を目指すのが数少ない選択肢のひとつ である.「自分は教育だけをやる大学教員になりたい」と思う人もいるかもしれないが,大学というところは 研究できることがきちんと教育をこなせるための前提と考えられている.単に既存の研究成果をまとめて分か りやすい文章にできるようなレベルの書く能力だけではダメで,その分野として一定レベルを満たす新たな研 究成果を自ら生み出す能力が(少なくとも大学等への最初の就職時には)求められる.研究者を目指すばあい, 米国をはじめとする国内外の博士課程へと進み,一定レベルの国際学術誌に自分で論文を載せられるようにな るあたりから,具体的な就職可能性が出てくる.(なかには修士論文の段階で「フィールド代表誌」と呼ばれ

*2米国大学の数学科では日本の数学科と同一内容をたっぷり時間をかけて学べるところが多いので,数学を学ぶために学部留学する のもいいかもしれない.

*3もちろんこのレベルの科目を受講できる大学に学部留学する手はあるし,このレベルに近いネット上の講義もないわけではない. たとえば Game Theory Online [リンク] の第 II 部がある.

(6)

るような経済学特定分野の専門誌に載るレベルの論文を要求する教員もいる.修士論文での要求レベルが高い ばあい,学生が時間を浪費しないで済むように指導教員が研究テーマを与えてくたり関連論文を読むのを手 伝ってくれたりすることはあるかもしれないが,期待しすぎてはいけない.大学院レベルのミクロ経済学,マ クロ経済学,計量経済学の勉強の一部を前倒しするとか,修士論文のテーマを大学院入学前から見つけておく といった対応が必要になるつもりでいた方がいいだろう.ちなみに米国経済学大学院のプログラムでは修士号 は博士課程中退者向けの「残念賞」の意味合いが強く,通常は修士論文は要求されない.)論文掲載可否のた めの審査がある,「レフェリー制」の経済学学術誌のレベルは他分野と比べても相当厳しいから(香川大学経 済学部をふくむ大部分の大学の経済学部では,レフェリー制国際学術誌にほとんど論文を持たない研究者が大 半であるのが現状),ここまで至るのは並大抵のことではなく,学士号取得後5年はかかるし,10年かけても そこに至らない例は少なくない.でも最近は競争も激しくなっており,若手が経済学者になるためにはそうい う並大抵ではないことが要求されるようになって来ている.

1 章 なぜ今「ゲーム理論」が注目されているのか

特に補足はない.

2 章 ゲーム理論の基本 同時ゲームと交互ゲーム

2.1 渡辺 2 章へのコメント

• 46頁.サンペイ君とルイス君のゲームは「合理的な豚」という名前でも知られる.動物行動学者が実 際に大ブタ小ブタでで実験したところ,理論通りの結果になることが多かったらしい.ブタが合理的な 推論を行ったというよりは,試行錯誤の中で賢明なやり方を学んだと理解できる.

– ここではボタンを押しに行くことはサンペイにとってもルイスにとっても金貨10枚分の苦痛を伴 うと仮定しているが,ルイスにとっての苦痛はより少ない金貨ϵ枚分であると仮定した方が自然か もしれない.(ここで ϵは「イプシロン」とか「エプシロン」と読み,数学では微少量を表わすと きに使うことが多い.)テキストと同様の議論はϵ が0 < ϵ < 20を満たせば成り立つことを確認 するといい.

– サンペイとルイスのゲームのように,「弱いものが優位に立つ方法」を知りたいという質問が過去 にあった.一般的な方法があるわけではないが,渡辺3章のはじめでやる例のように自分の選択肢 を絞って「コミットメント」することにより有利な状況を作り出すことができる場合もある.あく まで「そういう場合もある」というふうに理解すべき.ゲーム理論を知っていれば多少有利になる 場面は増えるが,絶対的なものではない.相手もゲーム理論を知っているかもしれないし,あるい はゲーム理論を知らなくても直観でじゅうぶん戦略的に行動できるひとかもしれない.「攻略方法 を知っていれば必ず勝つ」ゲームは存在するが,そういうゲームでも自分が勝てる方のプレーヤー になるとは限らない.「矛盾」の起源となった故事の盾と矛の関係を考えれば分かるだろう.

• 54頁.複数均衡にかんして過去尋ねられた質問は,均衡(s, t), (s, t) (このゲームでは均衡 (疑惑,金 融)と(金融,疑惑)に当たる)があったとして,Player 1が前者の均衡を,Player 2 が後者の均衡を 想定して行動した結果,(s, t) (このゲームでは (疑惑,疑惑)に当たる)が実現してしまわないかとい うもの.もちろん(s, t)は一般にはナッシュ均衡にならないが,そういう戦略の組合せをどうやって避

(7)

けるかというのは問題になる.べつの言い方をすれば,複数ある均衡のどれをどうやって実現するかと いう問題であり,ゲーム理論における大きな課題として残っている(武藤42–43頁や渡辺80頁参照). その際重要なのは「相手の出方を正しく予想すること」であり,そのような予想がどのように生まれる かの説明として「試行錯誤の落ち着いた先」「話し合いの結果」などが考えられる (神取[15, 6.3節]を 参照).なお,今後導入する「部分ゲーム完全均衡」では,いくつかのふさわしくないナッシュ均衡を 取り除くことができる.しかし多くのゲームではプレーヤーたちの行動を一意的には予想できないと考 える方が自然だ.一意的に予想できないなら,解概念としても複数の均衡を選ぶようにしておくべきで ある.

ただ,非協力ゲーム理論は取るべき行動をしめすための規範的理論とは通常見なされてはいない. じっさいに観察される社会現象を説明したり予想したりするための事実解明的理論と見なされる. まだ出ていない結果を予想するためでなく,すでに分かっている結果を説明するために使うばあ い,複数均衡のそれぞれをどう実現するかという問題は生じない.すでに特定の結果が決まってい るのだから.それが均衡として説明出来ればいちおうは満足できるのだ.現実に観察されるような 結果のいずれもが均衡になっていて,逆に均衡になる結果がいずれも現実にも観察できるなら,事 実を説明する理論としては特に問題はないと言えるかもしれない.

• 68頁.均衡を正しく記述するためには,結果の経路を述べるだけでは不十分な理由を補足しよう. –「均衡」とは戦略の組であるため,文秋の戦略「疑惑」とともに新朝の戦略も記述する必要がある.

ところが上の点(文秋が「疑惑」を選んだばあい)における新朝の行動である「金融」を指定した だけでは新朝の戦略を記述したことにはならない.72頁で述べるように,下の点 (文秋が「金融」 を選んだばあい)における新朝の行動である「疑惑」も指定してはじめて新朝の戦略を記述したこ とになる.(新朝の戦略は「文秋が「疑惑」を選んだ場合自分は__を選び,文秋が「金融」を選ん だ場合自分は__を選ぶ」という形で表せることに注意.)

– ではなぜ均衡が戦略の組であることを要求するのか?  その理由はナッシュ均衡の要請から説明 することができる.ナッシュ均衡では,相手の戦略にたいして自分の戦略が最適反応であることを 各プレーヤーに要請する.自分の戦略が最適反応になっていることを確証できるためには,相手の 戦略がきちんと記述されている必要がある.たとえば,文秋が「金融」を選び新朝が「金融」を選 んだときの文秋の利得を25 から80に修正したゲームを考えよう.このばあい均衡は修正前と同 じで,文秋が「疑惑」,新朝が上の点で「金融」下の点で「疑惑」を選ぶこととなる.したがって結 果の経路は,文秋が「疑惑」,新朝が「金融」となる.ところが均衡として結果の経路を記述した だけでは,新朝が下の点で取る行動が分からない.かりにそれが「金融」であるとすると,文秋は

「疑惑」よりも「金融」を選んだ方が利得が高くなるので,最適反応をしていないことになる.つ まりこの戦略の組は均衡ではない.均衡を記述したつもりだったのに,均衡でない戦略組までふく まれてしまうという不都合が起きている.このような不都合を避けるには,均衡ははじめから「戦 略の組」とする必要がある.

• 72–73頁で説明した,展開形ゲーム(ゲームの木)の「戦略」の意味や,展開形ゲームを戦略形になお

す手続きは完全に理解すること.

– その展開形ゲームにおける新朝の4つの戦略は図でしめすことができる.これらの戦略は,以下の ように言い換えることができる:

∗ (疑惑,疑惑)は「つねに疑惑を選ぶ」戦略,

∗ (疑惑,金融)は「先手と同じ選択をする」戦略,

(8)

∗ (金融,疑惑)は「先手と逆の選択をする」戦略,

∗ (金融,金融)は「つねに金融を選ぶ」戦略.

– 時間の概念がある展開形ゲームを戦略形ゲームに変換するということは,いわば展開形ゲームの開 始時に「同時ゲーム」をプレイして先のことまですべて決めてしまうようなものである.合理的な プレーヤーならば,ゲームの途中にある意思決定点に至ってはじめてその点における選択肢を決め るはずはない.それでは遅いのだ.合理的なプレーヤなら,ゲーム開始時にすべての意思決定点に おける選択ができるはずである.それにあわせて「戦略」の概念も,あらゆる意思決定点 (より一 般的には情報集合)にたいしてなんらかの選択肢を指定することを要求するものになっている.こ れはたとえばプレゼンテーションであらゆる想定される質問にたいして準備しておくことに相当 する.じっさいには一部の質問しかされないだろうが,どの質問をされるかは分からないので,す べての質問にたいして何らかの応え (「知らねえよ!」でもいいが)を用意してこそ「戦略」と呼 べる.

– 時間差じゃんけんの後手について言えば,「相手がグー出しそうだから自分はパーを出そう」だけ では戦略にならない.「相手がグーを出したら自分はパーを,相手がチョキを出したら自分はグー を,相手がパーを出したら自分はチョキを出そう」というふうに,(実際には起きなくても)あらゆ る場合を想定しておくのが戦略だ.

– 展開形ゲームを戦略形になおす理由を尋ねた学生が過去にいた.まず,展開形ゲームを戦略形ゲー ムにしたら情報が一部失われる.展開形から一意的に戦略形を導くことはできるが,逆は一意的に はできない.にもかかわらずなぜ「わざわざ」戦略形を考えるのかという疑問だ.これは参考文 献としてシラバスに掲載した奥野正寛『ミクロ経済学』を参照するのが分かりやすい.奥野の定 義4.2に「展開型ゲームでのナッシュ均衡とは,展開型ゲームから構成される戦略型ゲームのナッ シュ均衡のことを言う」とある一見無意味な記述が,端的な理由を物語っている.つまり,「ナッ シュ均衡」という概念を戦略形ゲームで定めておけば,そして展開形ゲームにたいして戦略形ゲー ムをひとつ対応させる手続きを決めておけば,それをもちいて展開形ゲームの「ナッシュ均衡」を 定義できるのだ.より一般的には,展開形ゲームを戦略形になおす方法を決めておけば,戦略形 ゲームにおける「支配」とか「均衡」といった概念や命題をふくむ理論を,展開形ゲームの理論を 構築するのに使える.展開形ゲームを戦略形になおす理由はこれだ.

さらに一般化すれば,ある集合の要素にたいして定義されたある概念を,べつの集合の要素に たいしてべつの概念を定義するために援用することは頻繁にある.たとえば「エロい女子高 生」という概念は.その心理や行動などいろいろな要素を考慮してはじめて定義できる複雑な ものかもしれない.しかしいったんそれを定義してしまえば,たとえば「す敵な女子高」とい うべつの概念を定義するためにそれを利用できる.「す敵な女子高とは,その生徒の75パーセ ント以上がエロい女子高生である女子高のことである」といった具合に定義でき,あらためて 心理や行動に言及する必要はなくなる.このばあい必要なのは,与えられた女子高—それ自体 は立地とか,建物とか,提供科目とか,学則とか,年表とか,教員の集合とか,生徒の集合な どをふくみ得る概念と考えられる—にその生徒の集合を対応させる手続きである.

• (蛇足) 74頁にエスカレータで右を空けるか左を空けるかという話が出て来る.川西は「本当ならエス カレータで歩く行為が禁止されるべきなのに,多くの人がつくりあげた暗黙のルールによって,立ち止 まってる人が注意されてしまうのです」(川西諭『ゲーム理論の思考法』117頁)と言う.じっさいエレ ベータは片方を空けるようには作られてはいないから,その指摘自体は正しい.ただ,人々が作り上

(9)

げた暗黙のルールを簡単には変えられない以上,「歩く奴が悪い」といっても解決にはならない.エレ ベータをデザインする段階から,人々の行動を読み込んでデザインする必要があるんじゃないか.

2.2 渡辺 2 章の補足 : 戦略形ゲームの定式化

このセクションでは非協力ゲーム理論(noncooperative game theory)のうち,行動決定が同時に行われる 場合をあつかう.

最初に,非協力ゲーム理論の分野でもっとも有名な例である囚人のジレンマ(The Prisoner’s Dilemma)を 考える.「ジレンマ」とは窮地,板挟み,困難な状況のこと.

ある犯罪の容疑者2人(じつは共犯)が別件で逮捕された.自白を引きだすために,取り調べ人 (検事? ) は2人を隔離してそれぞれの容疑者に脅し(はったり? )をかける(共犯であることは見抜いている;あとは 自白が欲しい) :

• 2人とも黙秘を続ければともに 1年の刑(別件で),

• 1人だけが自白すれば直ちに釈放で相手は9年の刑,

• 2人とも自白すればともに6年の刑になる. この状況を非協力ゲーム理論の言葉に直そう.

リマーク2.1 具体的なシチュエーションである上の寓話を一歩抽象化したいわけである.具体的ケースをたくさん並べ ることに終わっていては大学で勉強する意味が半減するから.

この戦略ゲーム(strategic game) の

プレーヤー(players)は囚人1と囚人2で,

• それぞれのプレーヤーは〈黙秘〉と〈自白〉という2つの 戦略(strategies)を持つ.

• 2人の戦略の組 (ペア)のおのおのにたいして,それぞれのプレーヤの利得 (payoff)を表(利得行列) にすれば下のようになる.たとえば戦略ペア 〈黙秘,自白〉—つまり囚人1が黙秘して囚人2が自白す る状況—での利得の組は(−9, 0).(ただし第1項が囚人1の利得,第2項が囚人2の利得;刑期をマイ ナスの利得とみなしている.)

囚人2 黙秘 自白

囚人1 黙秘 −1, −1 −9, 0

自白 0, −9 −6, −6

リマーク2.2 後述するように,この特定の利得行列で表されたゲームはさまざまな具体的シチュエーションを抽象化し ている.しかしわれわれはこの行列で表された特定のゲーム以外のさまざまなゲーム(たとえば後で述べるBattle of the Sexes)をも同時に考えるための言葉が欲しい.プレーヤーの数は2人とは限らないし,戦略もいくつあるか分からないか ら,単に利得行列の戦略のラベルや利得を変数とするだけでは不十分だ.さらに抽象化を進める必要があるのだ.そのた めに以下では「ゲーム」を数学的オブジェクト(対象物)として一般的に定義することにする.読者は「そこまで極端に抽 象化する必要があるのか!」と思うかもしれない.たしかに実社会で接するレベルの抽象度は超えている.しかしせっかく 大学に来たんだから,またとない機会だと思ってついてきて欲しい.世界の見え方が変わってくるかもしれないよ.

(10)

補足2.1 ゲームを一般的に定義する前に,集合の記号を復習しておく.

集合(set)とは「きちんと定義された相異なる《もの》のあつまり」と考えておけばよい.集合を構成する《もの》を要 素(element)と言い,たとえば集合N = {香川,徳島,愛媛}は香川,徳島,愛媛の3つの要素を持つことになる.aが 集合Aの要素であるとき,a ∈ Aと書いて,aはAに属すると言う.aが集合Aの要素でないとき,a /∈ Aと書く.た とえば,香川∈ Nであり,高知∈ N/ である.

太字のRは慣例的に「すべての実数の集合」を表す.実数とは数直線上の一点で表せるような数(有理数と無理数をふ くむ)を指すが,とりあえず「数」とだけ理解してくれても問題ない.

n個の集合S1, S2, . . . , Snから1つずつ要素si∈ Siを選んで,i = 1, 2, . . . , nの順に並べた束(s1, s2, . . . , sn) を n-(n-tuple)という.このようにして作られたすべてのn-組の集合をS1, . . . , Snの直積(direct product)といい, S1× · · · × Snと書く.すなわち

S1× · · · × Sn:= {(s1, . . . , sn) : s1∈ S1, . . . , sn∈ Sn}

である.*4

集合Aから集合Bへの関数(function)あるいは写像(mapping) f : A → B とは,定義域とよばれる集合Aの任意 の要素x ∈ Aにたいして,値域と呼ばれる集合Bの要素を1つ(その要素をf (x)と書く)対応させる関係である.要素 に注目してf : x 7→ f(x)と書くこともある.定義域や値域は明示されないことがある.たとえば「関数f (x) = 2x」と あれば,通常はf : R → Rなる関数で,x 7→ 2xの対応を持つものを意味する.

定義2.1 戦略形ゲーム(strategic game)とは以下の要素から構成される組(S1, . . . , Sn; u1, . . . , un)である:

• プレーヤー(players)の集合{1, . . . , n} (この教材では上記の組には明示的にふくめないことにする)

• それぞれのプレーヤーiについて,iの戦略集合(the set of strategies) Si

• それぞれのプレーヤーiについて,iの利得関数(payoff function)あるいは効用関数(utility function)*5 ui: S1× · · · × Sn→ R

プレーヤーiの戦略集合 Si iがどういう行動を選べるかを記述する.*6

各プレーヤーの利得関数の定義域S1× · · · × Sn に属する要素(s1, . . . , sn)を戦略の組あるいは戦略プロ

ファイル(strategy profile)とよぶ.つまり戦略プロファイルは「だれがどの戦略を採るか」という,全員の

戦略の組合せを記述している.

プレーヤーiの利得関数とは,任意の戦略プロファイル(s1, . . . , sn)にたいして,そのプロファイルが選ば れたときのプレーヤーiの利得ui(s1, . . . , sn)を実数で与える関数である.*7利得関数の値は利得行列上では 以下の例のように配列される.

Player 2

l m r

Player 1 t u1(t, l), u2(t, l) u1(t, m), u2(t, m) u1(t, r), u2(t, r) b u1(b, l), u2(b, l) u1(b, m), u2(b, m) u1(b, r), u2(b, r)

*4記号 := は等号の一種で,左辺を右辺によって定義するという意味.

*5定義域と値域を明示しないと関数をきちんと定義したことにならないため,この利得関数の定義では,あえてそれらの集合を明示 した.(利得関数 uiの定義域は後述する S1× · · · × Snで,値域はすべての実数の集合 R であることが分かる.) ところが最近 のゲーム理論入門テキストでは記号化を嫌って,定義域や値域はおろか戦略集合 Siさえ明示的に記号化しないことが多い.(むか しとちがって最近は小学生に集合の記号を教えないためだろうか.) そのばあい,たとえば「任意の si∈ Siについて」と書くか わりに,「プレーヤー i の任意の戦略 siについて」と言葉で書く.つまりプレーヤー i の戦略の集合は記号化しないまでも分かっ ているものとして扱われている.

*6具体的なゲームが決まれば戦略を具体的に列挙できるが,ゲーム一般をあつかうときにはそうはできないために,プレーヤー i の 取りうる戦略を集合 Siによって抽象的に表現する.

*7利得関数の代わりに,戦略集合 S1× · · · × Sn上で定義された「選好」を考えることもある.

(11)

2.1 上 の 囚 人 の ジ レ ン マ で は ,S1 = S2 = {〈黙秘〉〈自白〉, }.利 得 関 数 u1,u2 は た と え ば u1〈黙秘〉( ,〈自白〉) = −9やu2〈黙秘〉( ,〈自白〉) = 0という値をとる.

リマーク2.3 2人のプレーヤーからなる戦略形ゲームは利得行列で表せた.いま利得行列のそれぞれの枡目に,その枡 目に対応する戦略ペアが取られたときの(利得ペアのかわりに)結果(アウトカム)を記入する.こうやって得られる表を ゲーム・フォーム(ゲーム形式, game form)とかメカニズム(mechanism)とよぶ.たとえば2車線道路のある地点での 対向車の運命は以下のゲーム・フォームで与えられる:

ドライバー2 左側 右側 ドライバー1 左側 無事 衝突 右側 衝突 無事

囚人のジレンマの分析に戻る.「2人の囚人は脅しを本気にして,できるだけ自分の刑期を短くしたいと考 える」と仮定.つまりこのゲームを信じ,自分の利得を最大化したいと.すると

• 2人が隔離されている状況では,合理的なプレーヤは自白を選ぶだろう.相手が黙秘しようが自白しよ うが,自分は自白したほうが有利(利得が高い)だから.(演習: 表でチェックせよ.)

• その結果実現する戦略ペアは〈自白, 自白〉で利得のペアは(−6, −6).

• ところがふたりがともに黙秘する戦略ペア〈黙秘, 黙秘〉にたいする利得ペアは(−1, −1).この方が どちらのプレーヤにとってもより望ましい.(「〈黙秘, 黙秘〉は〈自白, 自白〉よりも パレート優位 (Pareto-superior) である」という.)

協力しあえばプレーヤー全員に利益があるのに,それぞれのプレーヤーが相手に「ただ乗り(free riding)」 しようとしてしまうため,その利益を実現できない.現実社会でもこの種のジレンマはいろいろある.国際紛 争,ゴミ収集所の清掃,など.

囚人のジレンマでは,囚人1にとって〈自白〉が支配戦略 (dominant strategy): (囚人2の戦略がなんで あっても)囚人1は〈自白〉という戦略を選ぶのがもっとも有利になっている.囚人2にとっても〈自白〉が 支配戦略になっている.

ノーテーション (記号): i 以外のプレーヤーの戦略集合の直積S1× · · · × Si−1× Si+1 × · · · × Sn

S−i,その要素をs−iなどと書く.たとえば4人のばあい,s2 = (s1, s3, s4),(s2, s2) = (s1, s2, s3, s4), s4= (s1, s2, s3).

このノーテンションに従えば,s = (s1, . . . , sn)がある戦略プロファイルとすると,(si, s−i)はプレーヤーi ひとりだけが戦略をsiからsiに変えた戦略プロファイルを表す.

定義2.2 戦略形ゲーム(S1, . . . , Sn; u1, . . . , un)が与えられているとする. 利得 表 次の不等式群がみたされるとき,プレーヤーiの戦略si∈ Siがプレーヤーiの戦略si∈ Siを(強)支配す る((strictly) dominates)という: 他のプレーヤーの任意の戦略組s−i∈ S−iにたいして,*8

ui(si, s−i) > ui(si, s−i).

*8以下の不等式は,i 以外の戦略が s−iで固定されているもとでは,i にとって siを選ぶ方が siを選ぶよりも利得が高いことを意 味する.「siが siを支配する」と言えるためには,他人の戦略の任意の組合せ s−iについて,その不等式が成り立つ必要があるこ とに注意.

(12)

戦略si∈ Siが個人iの支配戦略(dominant strategy)であるとは,sisi以外のすべての戦略si∈ Si

支配することをいう.

次の(i),(ii)の不等式群がみたされるとき,戦略si∈ Siが戦略si ∈ Siを弱支配する(weakly dominates) 利得 表 という:*9 (i) すべてのs−i ∈ S−iにたいして,ui(si, s−i) ≥ ui(si, s−i); (ii) あるs−i ∈ S−iにたいして,

ui(si, s−i) > ui(si, s−i).

戦略si∈ Siが個人iの弱支配戦略(weakly dominant strategy)であるとは,sisi以外のすべての戦略

si∈ Siを弱支配することをいう.

リマーク2.4sisiを支配する」「sisiを弱支配する」という概念は,同一プレーヤーの戦略を比較するものであ る.定義2.2でsiとsi は同一プレーヤーの戦略になっている(ともにSi の要素である) ことに注意.たとえばプレー ヤー1の戦略s1がプレーヤー2の戦略s2を支配することは,概念上ありえない.

リマーク2.5 戦略si∈ Siが戦略si∈ Siを支配するとき,siはsiを弱支配すると当然いえる.(支配が成り立つとき, 弱支配を定義するいずれの不等式も>でなりたっている.左辺が右辺より大きい[たとえば3 > 2]ということは,左辺が 右辺以上である[たとえば3 ≥ 2]ことの特殊ケースにすぎない.)しかしsiがsiを弱支配するとき,支配するとはかぎ らない.すなわち支配は弱支配より「強い」条件である.

リマーク2.6 2人ゲーム(S1, S2; u1, u2)のばあい,プレーヤー1の戦略s1∈ S1がプレーヤー1の戦略s′′1 ∈ S1を支配 するのはつぎの条件がみたされるとき: プレーヤー2のすべての戦略s2∈ S2にたいして,

u1(s1, s2) > u1(s′′1, s2).

たとえば,囚人のジレンマではプレーヤー1の〈自白〉がプレーヤー1の〈黙秘〉を支配する:*10 u1〈自白〉( ,〈黙秘〉) > u1〈黙秘〉( 〈黙秘〉, )

u1〈自白〉( ,〈自白〉) > u1〈黙秘〉( 〈自白〉, )

2.2 つぎのゲーム(男女の闘い; Battle of the Sexes; Bach or Stravinsky)ではいずれのプレーヤーも支配 戦略を持たない(演習: 説明せよ):

ふみ Bach Stravinsky いちろう Bach 2, 1 0, 0

Stravinsky 0, 0 1, 2

• ふみが〈Bach〉という戦略を選んだとき,いちろうの利得を最大にする戦略は〈Bach〉になっている. このとき「ふみの〈Bach〉という戦略にたいするいちろうの最適反応(best response) は〈Bach〉で ある」という.

• 逆に,いちろうの〈Bach〉という戦略にたいするふみの最適反応は〈Bach〉になっている.

• 戦略のペア(s, s)がたがいに相手の戦略にたいする最適反応からなっているとき(つまりsはsにた いする最適反応,sはsにたいする最適反応),そのペアをナッシュ均衡(Nash Equilibrium)とよぶ.

「おたがいがナッシュ均衡を構成する戦略をとっているかぎり,どちらもそのペアを離れる誘因はない」 という意味で,安定したペアである.

*9文献によっては「弱支配」を「支配」と呼ぶことがある.

*10以下の式では,s

1=〈自白〉, s′′1 =〈黙秘〉であり,最初の式で s2=〈黙秘〉,2 番目の式で s2=〈自白〉となっている.S2= { 黙秘〉,〈自白〉} だから,これですべての s2∈ S2を考えたことになる.

(13)

• 〈Bach, Bach〉はこのゲームのナッシュ均衡である.

• 〈Stravinsky, Stravinsky〉もナッシュ均衡である.

• これら以外にナッシュ均衡はない.

補足2.2 最適反応を定義する前に,「最大化問題の最適解」という概念を復習しておく.実数値関数 f : A → Rの最大 化問題(maximization problem)とは

「条件x ∈ Aのもとでf (x)を最大化せよ」

という問題のことをいう.ある特定のx∈ Aがこの問題の最適解(optimal solution)であるとは,すべてのx ∈ Aに ついて,

f (x) ≥ f(x)

となることをいう.たとえば[0, 2] = {x ∈ R : 0 ≤ x ≤ 2}を0以上2以下の実数の集合 (区間) とするとき, g(x) = −(x − 1)2 で与えられた関数g : [0, 2] → Rは,任意のx ∈ [0, 2]についてg(1) ≥ g(x)を満たすので,x = 1は グラ 最大化問題の最適解である(グラフ参照). フ

定義2.3 戦略形ゲーム(S1, . . . , Sn; u1, . . . , un)が与えられているとする.プレーヤーiの戦略si∈ Siが他

のプレーヤーのとる戦略の組

s−i= (s1, . . . , si−1, si+1, . . . , sn) ∈ S−i

にたいする最適反応(best response)であるとは,以下の条件*11をみたすことである: すべてのsi∈ Siにた いして,

ui(si, s−i) ≥ ui(si, s−i) となる.

リマーク2.7「戦略siは戦略組s−iにたいする最適反応である」という言い方に注意.どういうs−iにたいするものか を明示せずに「戦略siは最適反応である」と言うのは概念上正しくない.

リマーク2.8 2人ゲーム(S1, S2; u1, u2)のばあい,プレーヤー1の戦略s1∈ S1 がプレーヤー2の戦略s2∈ S2にたい する最適反応であるとは,すべてのs′′1 ∈ S1について,

u1(s1, s2) ≥ u1(s′′1, s2)

となることである.ここでプレーヤー2の戦略s2が両辺に共通である(「固定されている」)ことに注意.相手の戦略s2

を固定したうえでプレーヤー1が自分の戦略s′′1 を動かして見つけた最適解がs1になっている.

すべてのs′′1 ∈ S1についてこの不等式が成り立つことの意味を利得表で言えば,ある特定の列を(s2に対応するものに) 固定したうえで行(つまりPlayer 1の戦略s′′1)をいろいろ変えてu1の値がいちばん大きくなる行(戦略s1に対応)を見 つけていることになる.*12

定義2.4 戦略プロファイルs= (s1, . . . , sn)がナッシュ均衡(Nash Equilibrium) であるとは,おのおのの プレーヤーiについて,戦略si が他のプレーヤーのとる戦略s−i= (s1, . . . , si−1, si+1, . . . , sn)への最適反応 となっていることである.*13

*11以下は siが,最大化問題「条件 si∈ Siのもとで ui(si, s−i)を最大化せよ.ただし s−iは固定されている」の最適解になるこ とを意味している.

*12s

1 と s′′1 は別変数である.上の定義の中身をたとえば次のように言い換えてもまったく同じである: 「すべての t1∈ S1につい て,u1(s1, s2) ≥ u1(t1, s2)となることである.」

*13べつの言い方をしてみよう.いま,プレーヤー i が予想する他のプレーヤーの戦略の組を ˜s−iとする.sがナッシュ均衡である とは,任意の i にたいして,(i) siが予想 ˜s−iにたいする最適反応になっており,かつ (ii) 予想が合理的であること (˜s−i= s−i) を意味している.奥野 4.3.1 節を参照.

(14)

2.3 渡辺 2 章の補足にたいするコメント

• 渡辺2章への補足は,この科目でもっとも抽象度が高いトピックである.過去「渡辺本とギャップがあ る」という意見があった.しかし受講生のみなさんはすでに渡辺本や講義で「支配」「ナッシュ均衡」な どの概念の直観的な意味は分かっているはず.補助教材2節ではそれらすでに意味の分かっていること を数学的にきちんと定義し直しているにすぎない.集合や関数や最適解など必要な数学については補足 している.ギャップがあるのではなくて,抽象度が高くなっているだけという方が正しいだろう. 一般に定義というのは簡単ではない.たとえば形のない「愛」はもちろん,形があるものでも簡単では ない.一応知っているはずの「大学」や,よく知っているはずの「ネコ」をみなさんは定義できるだろ うか? すべての概念を定義する必要はないが,きちんと定義しておかなければ正確な議論ができなく なるような概念は定義したほうがいい.さいわい,上記の「愛」「大学」「ネコ」などとちがって,(「支 配する」であれ「最適反応」であれ「ナッシュ均衡」であれ)ゲーム理論の主要概念はいずれも数学的 に簡単に定義できる.

• 三原の補助教材2節にある囚人のジレンマを示したうえで,自分が囚人1だったらどういう行動を取る か尋ねたら,ある学生は状況の記述が不十分だから分からないとの趣旨の回答をした.仮に状況がこの ゲームで完全に記述されていて,ナッシュ均衡の考え方にしたがって解くとどうなるか尋ねたら,ちゃ んと「自白」と答えた.現実の囚人の場合,たとえば先に出所した囚人1にたいして囚人2が殺し屋を 送るなども考えられる.そういう状況を記述するゲームは,通常は囚人のジレンマとは異なるものにな る.あるゲームが記述している状況でどういう行動を取るべきかという問題は,じっさいにその状況を そのゲームがちゃんと記述できているかどうかとは分けて考えることにする.あくまでそのゲームが状 況をきちんと記述できていると想定したうえで答えてくれればよい.

• 三原の補助教材2節にある弱支配と最適反応の定義式が同じという指摘が過去にあった.ちがいはどの 変数を動かしているかということ.弱支配の不等式は他人が戦略s−iをいろいろ変えても,つねに左辺 が右辺以上の値を取ることを言っている.最適反応の不等式は他人の戦略s−iを固定した上で,自分の 戦略siiをいろいろうごかして最適なものを探している.

• Strategy (戦略), equilibrium (均衡), incentive (インセンティブ)などの単語の発音は日本語流ではま ず通じない.正しく発音できないと聴き取るのも困難.CALD (リンク)など適当な電子辞書で発音を マスターしておこう.

2.4 渡辺 2 章とその補足にかんする課題

演習2.1 囚人のジレンマを考える.囚人2の戦略〈黙秘〉にたいする囚人1の最適反応はなにか? 囚人2の 戦略〈自白〉にたいする囚人1の最適反応はなにか? このゲームにナッシュ均衡は存在するか? 存在するなら すべて列挙せよ.

正解例.

• 囚人2の〈黙秘〉に対する囚人1の最適反応は〈自白〉である.

• 囚人2の〈自白〉に対する囚人1の最適反応は〈自白〉である.

• ナッシュ均衡は存在し,〈自白,自白〉のみである.

演習2.2 (最重要; 最適反応・支配・ナッシュ均衡の理解) 以下のゲームを考える.

(15)

Player 2

l m r

Player 1 U 2, 3 3, 2 0, 0 M 1, −1 1, −1 1, 1 D 2, 1 1, 2 −1, 1 (i) Player 1の戦略UにたいするPlayer 2の最適反応を求めよ. (ii) Player 2の支配戦略を見つけよ.

(iii) [問は4つある] Player 1 の戦略UはM を支配するか? 弱支配するか? Player 1の戦略U はDを支 配するか? 弱支配するか?

(iv) [すべての正解候補を選んだ場合のみ得点] このゲームの(純粋戦略による)ナッシュ均衡をすべて求めよ.

正解例. (i) U にたいする最適反応はlである.U に対応する行のPlayer 2の利得は以下のようになり,Player 2が l を選んだときに最大化される.

u2(U, l) = 3 u2(U, m) = 2 u2(U, r) = 0.

Player 1の戦略U にたいするPlayer 2の最適反応を求めるには,Uに対応する行のなかでPlayer 2の3つの利得を比 較し,いちばん高い利得(複数あればすべて)に下線などでマークすればいい(問(iv)の解答を参照).その利得の列に対 応するPlayer 2の戦略(いまのばあいはl)がU にたいする最適反応である.

(ii) Player 2 は支配戦略を持たない.もし支配戦略が存在して s2 であれば,s2 Player 2 の (s2 を除く) いか なる戦略 s2 も支配するため,Player 1の任意の戦略s1 にたいして,s2 が s2 よりも高い利得をもたらす,つまり, u2(s1, s2) > u2(s1, s2)となるはずである.つまりs2 は任意の s1にたいする唯一の最適反応になっているはずである. ところが以下で分かるように,つねに最適反応になる戦略はl, m, rのなかには存在しない:

• U にたいする最適反応はl.

• M にたいする最適反応はr.

• Dにたいする最適反応はm.

(iii) UMを支配しないし,弱支配しない.弱支配しないことをしめせば十分である.(真の命題「もしUがMを支 配すれば,UはMを弱支配する」の対偶「もしUがMを弱支配しなければ,U はMを支配しない」は真であるため.) U がMを弱支配するとすれば,以下の不等式がすべて満たされるはずである.しかし実際は最後の式が満たされない:

• u1(U, l) ≥ u1(M, l). これは2 > 1となるため,等号なしで成立.

• u1(U, m) ≥ u1(M, m). これは3 > 1となるため,等号なしで成立.

• u1(U, r) ≥ u1(M, r). これは0 ≥ 1となり,実際は0 < 1であることに反する. U Dを支配しないが,弱支配する.以下から弱支配するための条件を満たすことが分かる:

• u1(U, l) ≥ u1(D, l). これは2 ≥ 2となるため,等号で成立.不等号>では成立しないため,U はDを支配しな いことが分かる.

• u1(U, m) ≥ u1(D, m).これは3 > 1となるため,等号なしで成立.

• u1(U, r) ≥ u1(D, r). これは0 > −1となるため,等号なしで成立. (iv) (U, l)(M, r)がナッシュ均衡である.具体的な求め方を説明する:

1. Player 2の各戦略にたいするPlayer 1の最適反応と,Player 1の各戦略にたいするPlayer 2の最適反応を求め る手続きを問(i)の正解例の要領にしたがって実行し,対応する利得にマークする(次の戦略形を参照):

Player 2

l m r

Player 1 U 2, 3 3, 2 0, 0 M 1, −1 1, −1 1, 1 D 2, 1 1, 2 −1, 1

参照

関連したドキュメント

731 部隊とはということで,簡単にお話しします。そこに載せてありますのは,

私はその様なことは初耳であるし,すでに昨年度入学の時,夜尿症に入用の持物を用

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

であり、最終的にどのような被害に繋がるか(どのようなウイルスに追加で感染させられる

太宰治は誰でも楽しめることを保証すると同時に、自分の文学の追求を放棄していませ

わかりやすい解説により、今言われているデジタル化の変革と

経済学研究科は、経済学の高等教育機関として研究者を

パルスno調によ るwo度モータ 装置は IGBT に最な用です。この用では、 Figure 1 、 Figure 2 に示すとおり、 IGBT