• 検索結果がありません。

game1301notes 最近の更新履歴 H Reiju Mihara

N/A
N/A
Protected

Academic year: 2018

シェア "game1301notes 最近の更新履歴 H Reiju Mihara"

Copied!
21
0
0

読み込み中.... (全文を見る)

全文

(1)

ゲーム理論 : 補助教材

三原麗珠 (H. Reiju Mihara)

香川大学図書館

2013 年 1 月

目次

1 2013年度ゲーム理論受講者へ 1

2 戦略形ゲーム 2

3 展開形ゲーム 12

4 情報不完備ゲーム 15

5 追加問題 16

1 2013 年度ゲーム理論受講者へ

香川大学で開講するゲーム理論の授業(学問基礎科目 数学 B)で配布するハンドアウトと文献を以下にまと めておく(括弧内は識別コード).特に重要な部分やこれら以外の必読文献・参考文献については,シラバスの

「必読文献・参考文献」を参照のこと.変更があるばあいはWeb上の講義ページでアナウンスする.

公開分(Googleサイトの講義ページから入手できるもの)は以下のとおり:

• 三原麗珠. シラバス (babygames13syllabus).

• 三原麗珠. ゲーム理論: 補助教材, 2013年1月(game1301notes;この文書).

• 三原麗珠. 課題のあつかい(2013年度暫定版).

• 三原麗珠. 演習問題の正解(game04ans). 演習問題番号他の訂正が必要かも.

• 三原麗珠. ゲーム理論: 授業内容補足(babygames13comm).

非公開分(香川大学Moodle上の本コース用ページに入手方法を掲載)は以下のとおり:

• 茨木俊秀. 情報学のための離散数学. 昭晃堂, 2004. 第1章(ibaraki04ch1). 参考.

• 奥野正寛. ミクロ経済学. 東京大学出版会, 2008. 第4章(okuno08ch4). 参考.

• 三原麗珠. 板書の一部を再現したノート(babygames-notes).

http://www5.atwiki.jp/reiju/

(2)

• 梶井厚志,松井彰彦. ミクロ経済学: 戦略的アプローチ. 日本評論社, 2000. 以下が必読部分: – ホテリングモデルにかかわる部分(238–242頁,251頁,305頁) (kajii-m00p239) – ホテリングモデルにかかわる三原ノート(kajii-m00p239notes).

なお,課題については,シラバスの「授業計画」に各課題に取り組むべきタイミングが授業の進行に合わせ て挙げてある.また,「課題のあつかい」という文書にこの授業で解説する時期がまとめてある.正解は補助 教材自体または「演習問題の正解」に載っている.

2 戦略形ゲーム

このセクションでは非協力ゲーム理論(noncooperative game theory)のうち,行動決定が同時に行われる 場合をあつかう.

最初に,非協力ゲーム理論の分野でもっとも有名な例である囚人のジレンマ(The Prisoner’s Dilemma)を 考える.「ジレンマ」とは窮地,板挟み,困難な状況のこと.

ある犯罪の容疑者2人(じつは共犯)が別件で逮捕された.自白を引きだすために,取り調べ人 (検事? ) は2人を隔離してそれぞれの容疑者に脅し(はったり? )をかける(共犯であることは見抜いている;あとは 自白が欲しい) :

• 2人とも黙秘を続ければともに 1年の刑(別件で),

• 1人だけが自白すれば直ちに釈放で相手は9年の刑,

• 2人とも自白すればともに6年の刑になる. この状況を非協力ゲーム理論の言葉に直そう.

リマーク2.1 具体的なシチュエーションである上の寓話を一歩抽象化したいわけである.具体的ケースをたくさん並べ ることに終わっていては大学で勉強する意味が半減するから.

この戦略ゲーム(strategic game) の

プレーヤー(players)は囚人1と囚人2で,

• それぞれのプレーヤーは〈黙秘〉と〈自白〉という2つの 戦略(strategies)を持つ.

• 2人の戦略の組 (ペア)のおのおのにたいして,それぞれのプレーヤの利得 (payoff)を表(利得行列) にすれば下のようになる.たとえば戦略ペア 〈黙秘,自白〉—つまり囚人1が黙秘して囚人2が自白す る状況—での利得の組は(−9, 0).(ただし第1項が囚人1の利得,第2項が囚人2の利得;刑期をマイ ナスの利得とみなしている.)

囚人2 黙秘 自白

囚人1 黙秘 −1, −1 −9, 0

自白 0, −9 −6, −6

リマーク2.2 後述するように,この特定の利得行列で表されたゲームはさまざまな具体的シチュエーションを抽象化し ている.しかしわれわれはこの行列で表された特定のゲーム以外のさまざまなゲーム(たとえば後で述べるBattle of the

(3)

Sexes)をも同時に考えるための言葉が欲しい.よって抽象化をさらにすすめてみよう.そのために,以下では「ゲーム」 を数学的オブジェクト(対象物) として一般的に定義することにする.読者は「ここまで極端に抽象化する必要があるの か!」と思うかもしれない.たしかに実社会で接するレベルの抽象度は超えている.しかしせっかく大学に来たんだから, またとない機会だと思ってついてきて欲しい.世界の見え方が変わってくるかもしれないよ.

補足2.1 ゲームを一般的に定義する前に,集合の記号を復習しておく.

集合(set)とは「きちんと定義された相異なる《もの》のあつまり」と考えておけばよい.集合を構成する《もの》を要 素(element)と言い,たとえば集合N = {香川,徳島,愛媛}は香川,徳島,愛媛の3つの要素を持つことになる.aが 集合Aの要素であるとき,a ∈ Aと書いて,aはAに属すると言う.aが集合Aの要素でないとき,a /∈ Aと書く.た とえば,香川∈ Nであり,高知∈ N/ である.

太字のRは慣例的に「すべての実数の集合」を表す.実数とは数直線上の一点で表せるような数(有理数と無理数をふ くむ)を指すが,とりあえず「数」とだけ理解してくれても問題ない.

n個の集合S1, S2, . . . , Snから1つずつ要素si∈ Siを選んで,i = 1, 2, . . . , nの順に並べた束(s1, s2, . . . , sn) を n-(n-tuple)という.このようにして作られたすべてのn-組の集合をS1, . . . , Snの直積(direct product)といい, S1× · · · × Snと書く.すなわち

S1× · · · × Sn:= {(s1, . . . , sn) : s1∈ S1, . . . , sn∈ Sn}

である.*1

集合Aから集合Bへの関数(function)あるいは写像(mapping) f : A → B とは,定義域とよばれる集合Aの任意の 要素x ∈ Aにたいして,値域と呼ばれる集合Bの要素を1つ(その要素をf (x)と書く)対応させる関係である.要素に 注目してf : x 7→ f(x)と書くこともある.定義域や値域は明示されないことがある.たとえば「関数f (x) = 2x」とあれ ば,通常はf : R → Rなる関数で,x 7→ 2xの対応を持つものを意味する.

定義2.1 戦略形ゲーム(strategic game)とは以下の要素から構成される組(S1, . . . , Sn; u1, . . . , un)である:

• プレーヤー(players)の集合{1, . . . , n} (この教材では上記の組には明示的にふくめないことにする)

• それぞれのプレーヤーiについて,iの戦略集合(the set of strategies) Si

• それぞれのプレーヤーiについて,iの利得関数(payoff function)あるいは効用関数(utility function)*2 ui: S1× · · · × Sn→ R

プレーヤーiの戦略集合 Si iがどういう行動を選べるかを記述する.*3

各プレーヤーの利得関数の定義域S1× · · · × Sn に属する要素(s1, . . . , sn)を戦略の組あるいは戦略プロ

ファイル(strategy profile)とよぶ.つまり戦略プロファイルは「だれがどの戦略を採るか」という,全員の

戦略の組合せを記述している.

プレーヤーiの利得関数とは,任意の戦略プロファイル(s1, . . . , sn)にたいして,そのプロファイルが選ば れたときのプレーヤーiの利得ui(s1, . . . , sn)を実数で与える関数である.*4利得関数の値は利得行列上では 以下の例のように配列される.

*1記号 := は等号の一種で,左辺を右辺によって定義するという意味.

*2定義域と値域を明示しないと関数をきちんと定義したことにならないため,この利得関数の定義では,あえてそれらの集合を明示 した.(利得関数 uiの定義域は後述する S1× · · · × Snで,値域はすべての実数の集合 R であることが分かる.) ところが最近 のゲーム理論入門テキストでは記号化を嫌って,定義域や値域はおろか戦略集合 Siさえ明示的に記号化しないことが多い.(むか しとちがって最近は小学生に集合の記号を教えないためだろうか.) そのばあい,たとえば「任意の si∈ Siについて」と書くか わりに,「プレーヤー i の任意の戦略 siについて」と言葉で書く.つまりプレーヤー i の戦略の集合は記号化しないまでも分かっ ているものとして扱われている.

*3具体的なゲームが決まれば戦略を具体的に列挙できるが,ゲーム一般をあつかうときにはそうはできないために,プレーヤー i の 取りうる戦略を集合 Siによって抽象的に表現する.

*4利得関数の代わりに,戦略集合 S1× · · · × Sn上で定義された「選好」を考えることもある.

(4)

Player 2

l m r

Player 1 t u1(t, l), u2(t, l) u1(t, m), u2(t, m) u1(t, r), u2(t, r) b u1(b, l), u2(b, l) u1(b, m), u2(b, m) u1(b, r), u2(b, r)

例2.1 上 の 囚 人 の ジ レ ン マ で は ,S1 = S2 = {〈黙秘〉〈自白〉, }.利 得 関 数 u1,u2 は た と え ば u1〈黙秘〉( ,〈自白〉) = −9やu2〈黙秘〉( ,〈自白〉) = 0という値をとる.

リマーク2.3 2人のプレーヤーからなる戦略形ゲームは利得行列で表せた.いま利得行列のそれぞれの枡目に,その枡 目に対応する戦略ペアが取られたときの(利得ペアのかわりに)結果(アウトカム)を記入する.こうやって得られる表を ゲーム・フォーム(ゲーム形式, game form)とかメカニズム(mechanism)とよぶ.たとえば2車線道路のある地点での 対向車の運命は以下のゲーム・フォームで与えられる:

ドライバー2 左側 右側 ドライバー1 左側 無事 衝突 右側 衝突 無事

囚人のジレンマの分析に戻る.「2人の囚人は脅しを本気にして,できるだけ自分の刑期を短くしたいと考 える」と仮定.つまりこのゲームを信じ,自分の利得を最大化したいと.すると

• 2人が隔離されている状況では,合理的なプレーヤは自白を選ぶだろう.相手が黙秘しようが自白しよ うが,自分は自白したほうが有利(利得が高い)だから.(演習: 表でチェックせよ.)

• その結果実現する戦略ペアは〈自白, 自白〉で利得のペアは(−6, −6).

• ところがふたりがともに黙秘する戦略ペア〈黙秘, 黙秘〉にたいする利得ペアは(−1, −1).この方が どちらのプレーヤにとってもより望ましい.(「〈黙秘, 黙秘〉は〈自白, 自白〉よりも パレート優位 (Pareto-superior) である」という.)

協力しあえばプレーヤー全員に利益があるのに,それぞれのプレーヤーが相手に「ただ乗り(free riding)」 しようとしてしまうため,その利益を実現できない.現実社会でもこの種のジレンマはいろいろある.国際紛 争,ゴミ収集所の清掃,など.

囚人のジレンマでは,囚人1にとって〈自白〉が支配戦略 (dominant strategy): (囚人2の戦略がなんで あっても)囚人1は〈自白〉という戦略を選ぶのがもっとも有利になっている.囚人2にとっても〈自白〉が 支配戦略になっている.

ノーテーション (記号): i 以外のプレーヤーの戦略集合の直積S1× · · · × Si−1× Si+1 × · · · × Sn

S−i,その要素をs−iなどと書く.たとえば4人のばあい,s−2 = (s1, s3, s4),(s2, s−2) = (s1, s2, s3, s4), s−4= (s1, s2, s3).

定義2.2 戦略形ゲーム(S1, . . . , Sn; u1, . . . , un)が与えられているとする. 利得 表 次の不等式群がみたされるとき,プレーヤーiの戦略si∈ Siがプレーヤーiの戦略si∈ Si()支配す る((strictly) dominates)という: 他のプレーヤーの任意の戦略組s−i∈ S−iにたいして,*5

ui(si, s−i) > ui(si, s−i).

*5以下の不等式は,i 以外の戦略が s−iで固定されているもとでは,i にとって siを選ぶ方が siを選ぶよりも利得が高いことを意

(5)

戦略si∈ Siが個人iの支配戦略(dominant strategy)であるとは,sisi以外のすべての戦略si∈ Si

支配することをいう[武藤33—34頁].

次の(i),(ii)の不等式群がみたされるとき,戦略si∈ Siが戦略si ∈ Siを弱支配する(weakly dominates) 利得 表 という[武藤34頁]: *6 (i)すべてのs−i∈ S−iにたいして,ui(si, s−i) ≥ ui(si, s−i); (ii)あるs−i∈ S−iに たいして,ui(si, s−i) > ui(si, s−i).

戦略si∈ Siが個人iの弱支配戦略(weakly dominant strategy)であるとは,sisi以外のすべての戦略

si∈ Siを弱支配することをいう[武藤44頁].

リマーク2.4sisiを支配する」「sisiを弱支配する」という概念は,同一プレーヤーの戦略を比較するものであ る.定義2.2でsiとsi は同一プレーヤーの戦略になっている(ともにSi の要素である) ことに注意.たとえばプレー ヤー1の戦略s1がプレーヤー2の戦略s2を支配することは,概念上ありえない.

リマーク2.5 戦略si∈ Siが戦略si∈ Siを支配するとき,siはsiを弱支配すると当然いえる.(支配が成り立つとき, 弱支配を定義するいずれの不等式も>でなりたっている.左辺が右辺より大きい[たとえば3 > 2]ということは,左辺が 右辺以上である[たとえば3 ≥ 2]ことの特殊ケースにすぎない.)しかしsiがsiを弱支配するとき,支配するとはかぎ らない.すなわち支配は弱支配より「強い」条件である.

リマーク2.6 2人ゲーム(S1, S2; u1, u2)のばあい,プレーヤー1の戦略s1∈ S1がプレーヤー1の戦略s′′1 ∈ S1を支配 するのはつぎの条件がみたされるとき: プレーヤー2のすべての戦略s2∈ S2にたいして,

u1(s1, s2) > u1(s′′1, s2).

たとえば,囚人のジレンマではプレーヤー1の〈自白〉がプレーヤー1の〈黙秘〉を支配:*7 u1〈自白〉( ,〈黙秘〉) > u1〈黙秘〉( 〈黙秘〉, )

u1〈自白〉( ,〈自白〉) > u1〈黙秘〉( 〈自白〉, )

2.2 つぎのゲーム(男女の闘い; Battle of the Sexes; Bach or Stravinsky)ではいずれのプレーヤーも支配 戦略を持たない(演習: 説明せよ):

ふみ Bach Stravinsky いちろう Bach 2, 1 0, 0

Stravinsky 0, 0 1, 2

• ふみが〈Bach〉という戦略を選んだとき,いちろうの利得を最大にする戦略は〈Bach〉になっている. このとき「ふみの〈Bach〉という戦略にたいするいちろうの最適反応(best response) は〈Bach〉で ある」という.

• 逆に,いちろうの〈Bach〉という戦略にたいするふみの最適反応は〈Bach〉になっている.

• 戦略のペア(s, s)がたがいに相手の戦略にたいする最適反応からなっているとき(つまりsはsにた いする最適反応,sはsにたいする最適反応),そのペアをナッシュ均衡(Nash Equilibrium)とよぶ.

「おたがいがナッシュ均衡を構成する戦略をとっているかぎり,どちらもそのペアを離れる誘因はない」 という意味で,安定したペアである.

味する.「siが siを支配する」と言えるためには,他人の戦略の任意の組合せ s−iについて,その不等式が成り立つ必要があるこ とに注意.

*6文献によっては「弱支配」を「支配」と呼ぶことがある.

*7以下の式では,s

1=〈自白〉, s′′1 =〈黙秘〉であり,最初の式で s2=〈黙秘〉,2 番目の式で s2=〈自白〉となっている.S2= { 黙秘〉,〈自白〉} だから,これですべての s2∈ S2を考えたことになる.

(6)

• 〈Bach, Bach〉はこのゲームのナッシュ均衡である.

• 〈Stravinsky, Stravinsky〉もナッシュ均衡である.

• これら以外にナッシュ均衡はない.

補足2.2 最適反応を定義する前に,「最大化問題の最適解」という概念を復習しておく.実数値関数f : A → Rの最大化 問題(maximization problem)とは

「条件x ∈ Aのもとでf (x)を最大化せよ」

という問題のことをいう.ある特定のx∈ Aがこの問題の最適解(optimal solution)であるとは,すべてのx ∈ Aに ついて,

f (x) ≥ f(x)

となることをいう.たとえば[0, 2] = {x ∈ R : 0 ≤ x ≤ 2}を0以上2以下の実数の集合 (区間) とするとき, g(x) = −(x − 1)2 で与えられた関数g: [0, 2] → Rは,任意のx ∈ [0, 2]についてg(1) ≥ g(x)を満たすので,x = 1は グラ 最大化問題の最適解である(グラフ参照). フ

定義2.3 戦略形ゲーム(S1, . . . , Sn; u1, . . . , un)が与えられているとする.プレーヤーiの戦略si∈ Siが他

のプレーヤーのとる戦略の組

s−i= (s1, . . . , si−1, si+1, . . . , sn) ∈ S−i

にたいする最適反応(best response)であるとは,以下の条件*8をみたすことである: すべてのsi ∈ Siにた

いして,

ui(si, s−i) ≥ ui(si, s−i) となる.

リマーク2.7「戦略siは戦略組s−iにたいする最適反応である」という言い方に注意.どういうs−iにたいするものか を明示せずに「戦略siは最適反応である」と言うのは概念上正しくない.

リマーク2.8 2人ゲーム(S1, S2; u1, u2)のばあい,プレーヤー1の戦略s1∈ S1 がプレーヤー2の戦略s2∈ S2にたい する最適反応であるとは,すべてのs′′1 ∈ S1について,

u1(s1, s2) ≥ u1(s′′1, s2)

となることである.ここでプレーヤー2の戦略s2が両辺に共通である(「固定されている」)ことに注意.相手の戦略s2

を固定したうえでプレーヤー1が自分の戦略s′′1 を動かして見つけた最適解がs1になっている.

すべてのs′′1 ∈ S1についてこの不等式が成り立つことの意味を利得表で言えば,ある特定の列を(s2に対応するものに) 固定したうえで行(つまりPlayer 1の戦略s′′1)をいろいろ変えてu1の値がいちばん大きくなる行(戦略s1に対応)を見 つけていることになる.*9

演習2.1 例2.2でふみの〈Bach〉にたいするいちろうの最適反応(best response)は〈Bach〉であることを チェックせよ.

*8以下は siが,最大化問題「条件 si∈ Siのもとで ui(si, s−i)を最大化せよ.ただし s−iは固定されている」の最適解になるこ とを意味している.

*9s

1 と s′′1 は別変数である.上の定義の中身をたとえば次のように言い換えてもまったく同じである: 「すべての t1∈ S1につい て,u1(s1, s2) ≥ u1(t1, s2)となることである.」

(7)

定義2.4 戦略プロファイルs= (s1, . . . , sn)がナッシュ均衡(Nash Equilibrium) であるとは,おのおのの プレーヤーiについて,戦略si が他のプレーヤーのとる戦略s−i= (s1, . . . , si−1, si+1, . . . , sn)への最適反応 となっていること.*10

演習2.2 (i)以下の利得表で表わされるゲームを考える.

粕さん

左 右

沙理さん 上 14, 14 7, 17 下 17, 7 10, 10 沙理さんの支配戦略について正しいものを選べ.

シ.沙理さんの支配戦略は上である. ハ.沙理さんの支配戦略は下である. イ.沙理さんの支配戦略は(下,右)である. カ.沙理さんの支配戦略は存在しない.

(ii)問題(i)のゲームにかんする記述のうち正しいものを選べ.[パレート優位,パレート効率が未定義.] パ.(上,左)は(下,左)にたいしてパレート優位である.

ユ.(下,左)は(下,右)にたいしてパレート優位である. ウ.(下,右)はパレート効率である.

イ.(下,左)はパレート効率である.

演習2.3 囚人のジレンマを考える.囚人2の戦略〈黙秘〉にたいする囚人1の最適反応はなにか? 囚人2の 戦略〈自白〉にたいする囚人1の最適反応はなにか? このゲームにナッシュ均衡は存在するか? 存在するなら すべて列挙せよ.

演習2.4 戦略形ゲーム(S1, S2; u1, u2)が与えられている.戦略プロファイルs = (s1, s2)がナッシュ均衡で あるとは,以下のどの条件をみたすことか:

(1) u1(s1, s2) ≥ u1(s1, s2) for all s1∈ S1

and u2(s1, s2) ≥ u2(s1, s2) for all s1∈ S1. (2) u1(s1, s2) ≥ u1(s1, s2) for all s2∈ S2

and u2(s1, s2) ≥ u2(s1, s2) for all s2∈ S2. (3) u1(s1, s2) ≥ u1(s1, s2) for all s1∈ S1, s2∈ S2

and u2(s1, s2) ≥ u2(s1, s2) for all s1∈ S1, s2∈ S2. (4) u1(s1, s2) ≥ u1(s1, s2) for all s1∈ S1

and u2(s1, s2) ≥ u2(s1, s2) for all s2∈ S2.

正解例. (4)が正解.最初の式はs1がs2にたいして最適反応であることを,次の式はs2 がs1にたいして最適反応であ 図 ることを言っている(リマーク2.8).たとえば最初の式でs2が両辺に共通である(「固定されている」)ことに注意.プ

*10べつの言い方をしてみよう.いま,プレーヤー i が予想する他のプレーヤーの戦略の組を ˜s−iとする.sがナッシュ均衡である とは,任意の i にたいして,(i) siが予想 ˜s−iにたいする最適反応になっており,かつ (ii) 予想が合理的であること (˜s−i= s−i) を意味している.奥野 4.3.1 節を参照.

(8)

レーヤー1の利得u1の最大化を考えるときは,相手の戦略s2を固定したうえで,自分の戦略s1を動かしてみるわけで ある.たとえば(2)の最初の不等式はプレーヤー1の利得u1 を最大化するとき,自分ではないプレーヤー2の戦略s2

を動かしているのでおかしい.

追加演習 2.1 戦略形ゲーム(S1, S2, S3; u1, u2, u3)が与えられている.

(i)いま,s2 およびs′′2 はプレーヤー 2 の戦略(つまりS2 の要素)であるとする.s2がs′′2 を支配すると は,任意の(s1, s3)について,どういう条件が成立することか? 条件を不等式でしめせ.

(ii)戦略プロファイル(s1, s2, s3) がナッシュ均衡であるとは,以下の条件(a), (b), (c)がすべて成り立つ ことである:

(a) s1が(s2, s3)にたいする最適反応である; (b) s2が(s1, s3)にたいする最適反応である; (c) が にたいする最適反応である. 空欄を埋めて(c)を完成させよ.

また,条件(b)を不等式をもちいて表現せよ.必要におうじて“for all si∈ Si”あるいは「すべてのsi∈ Si

にたいして」(ただしiは1, 2, 3のような具体的な数字に置き換える)といった言葉を添えること. 正解例. (i)不等式は以下のようになる:

u2(s1, s2, s3) > u2(s1, s′′2, s3).

意味としては,「他のプレーヤーの戦略がなんであろうとも,プレーヤー2にとっては,戦略s2の方が戦略s′′2 よりも望 ましい」となる.定義2.2の表現通りに書けば,「他のプレーヤーの任意の戦略組s−2にたいして

u2(s2, s−2) > u2(s′′2, s−2)

となる」とすべきところだが, 「任意の(s1, s3)について」と問題文にあり,s−2= (s1, s3)と書けることから,正解の ようにするのがよい.(戦略列(s1, s2, s3)のことを(s2, s1, s3)と書くべきではない.(s2, s−2)のような順番を無視した 書き方は,s−2といった短縮表現をもちいるばあいに留めるべき.)

参考.問題文中の表現「任意の(s1, s3)について」(for all (s1, s3) ∈ S1× S3)と重複するので,“for all s1∈ S1, for all s3∈ S3”といった記述を添えてはならない.

参考.すでに問題文にs2 およびs′′2 が S2の要素であると記述されているので,“for s2, s′′2 ∈ S2といった表現は不 要.この表現を用いると,問題文中のs2, s′′2 と解答のそれが異なるという誤解を与える可能性がある.かりに“for all s2, s′′2 ∈ S2と書いたら,両者ははっきりと異なるものになってしまう.その際,たとえばs2= s′′2 となる場合も不等式 が成り立つことを要求することになり,あきらかに条件は満たせない.

参考.右辺をS2(s1, s2, s3)といった意味不明の式にした誤答があった.S2は集合であり,関数ではないことに注意. (ii)条件(c)は「s3が(s1, s2)にたいする最適反応である」となる.

条件(b)を不等式をもちいて表現すると,以下のように書ける:

u2(s1, s2, s3) ≥ u2(s1, s2, s3) for all s2∈ S2.

定義2.3を参照.この不等式は,戦略s2を集合S2のなかでいろいろ変えたとき,右辺の利得が最大化されるのがs2 = s2

のときであることを言っている.不等号を>と間違わないように注意.

参考.正解の“for all s2 ∈ S2”の部分を“for all s2∈ S1”あるいは“for all s1∈ S1としたり,u2をu1とするよう なミスに注意.

参考.u2(s1, s2)といったナンセンスな表記も見られた.利得関数は戦略プロファイルをインプットとし実数をアウト プットとする関数である.いま問題にしているのは3人ゲームだから戦略プロファイルは3人の戦略を並べたものであ る.(s1, s2)では2人分の戦略しか書かれていないのでダメ.期末試験ではヒントなしで「戦略プロファイル(s1, s2, s3) がナッシュ均衡である」を定義せよと言われても正解を答えられるようにしておくべき.

(9)

演習2.5 以下のゲームを考える.

Player 2

l m r

Player 1 u 1, −1 1, −1 1, 1 d 100, 0 0, 100 −1, 1

(i) Player 1の戦略uにたいするPlayer 2の最適反応を以下のリスト[次の設問と共通]から選べ.

(ii) Player 2の支配戦略を以下のリストから選べ.

(1)戦略u, (2)戦略d, (3)戦略l, (4)戦略m, (5)戦略r, (6)存在しない.

(iii)このゲームの(純粋戦略による)ナッシュ均衡は

(1) (u, l)だけである,(2) (u, m)だけである,(3) (u, r)だけである,(4) (d, l)だけである,(5) (d, m)だけ である,(6) (d, r)だけである,(7)存在しない.

演習2.6 以下のゲームを考える.

Player 2

l m r

Player 1 U 2, 3 3, 2 0, 0 M 1, −1 1, −1 1, 1 D 2, 1 1, 2 −1, 1

(i) Player 1の戦略UにたいするPlayer 2の最適反応を以下の正解候補[設問(ii)と共通]から選べ.

(ii) Player 2の支配戦略を以下の正解候補から選べ.

設問(i), (ii)の正解候補: (1)戦略U , (2)戦略M , (3)戦略D, (4)戦略l, (5)戦略m, (6)戦略r, (7)存在 しない.

(iii) Player 1の戦略U はM を支配するか? 弱支配するか? Player 1の戦略U はDを支配するか? 弱支 配するか?

(iv)このゲームの(純粋戦略による)ナッシュ均衡を以下の正解候補から選べ.[すべての正解候補を選んだ場 合のみ得点]

設問(iv)の正解候補(均衡が存在しない場合は(0)を,存在する場合はそれらすべて(1つとは限らない)を (1)–(9)から選ぶこと): (1) (U, l),(2) (U, m),(3) (U, r),(4) (M, l),(5) (M, m),(6) (M, r),(7) (D, l), (8) (D, m),(9) (D, r),(0)存在しない.

正解例. (i) U にたいする最適反応はlである.U に対応する行のPlayer 2の利得は以下のようになり,Player 2が l を選んだときに最大化される.

u2(U, l) = 3 u2(U, m) = 2 u2(U, r) = 0.

Player 1の戦略U にたいするPlayer 2の最適反応を求めるには,Uに対応する行のなかでPlayer 2の3つの利得を比 較し,いちばん高い利得(複数あればすべて)に下線などでマークすればいい.その利得の列に対応するPlayer 2の戦略 (いまのばあいはl)がUにたいする最適反応である.(言葉では分かりにくいが,黒板でやれば一目瞭然.)

(ii) Player 2 は支配戦略を持たない.もし支配戦略が存在して s2 であれば,s2 は Player 2 の (s2 を除く) いか なる戦略 s2 も支配するため,Player 1の任意の戦略s1 にたいして,s2 が s2 よりも高い利得をもたらす,つまり,

(10)

u2(s1, s2) > u2(s1, s2)となるはずである.つまりs2 は任意の s1にたいする唯一の最適反応になっているはずである. ところが以下で分かるように,つねに最適反応になる戦略はl, m, rのなかには存在しない:

• U にたいする最適反応はl.

• M にたいする最適反応はr.

• Dにたいする最適反応はm.

参考.Player 2の支配戦略とは戦略なので,l, m, rのいずれかでしかありえない.支配戦略自体が(D, l)のような戦 略の組(ペア) になることはない.ただし,「支配戦略の組」といえば,文字通り戦略の組であり,たとえば囚人のジレン マの解がそれにあたる.

(iii) UMを支配しないし,弱支配しない.弱支配しないことをしめせば十分である.(真の命題「もしUがMを支 配すれば,UはMを弱支配する」の対偶「もしUがMを弱支配しなければ,U はMを支配しない」は真であるため.) U がMを弱支配するとすれば,以下の不等式がすべて満たされるはずである.しかし実際は最後の式が満たされない:

• u1(U, l) ≥ u1(M, l). これは2 > 1となるため,等号なしで成立.

• u1(U, m) ≥ u1(M, m). これは3 > 1となるため,等号なしで成立.

• u1(U, r) ≥ u1(M, r). これは0 ≥ 1となり,実際は0 < 1であることに反する. U Dを支配しないが,弱支配する.以下から弱支配するための条件を満たすことが分かる:

• u1(U, l) ≥ u1(D, l). これは2 ≥ 2となるため,等号で成立.不等号>では成立しないため,U はDを支配しな いことが分かる.

• u1(U, m) ≥ u1(D, m).これは3 > 1となるため,等号なしで成立.

• u1(U, r) ≥ u1(D, r). これは0 > −1となるため,等号なしで成立.

参考.この問では間違えようがないが,ちょっと質問の仕方を変えると,「U がlを支配する」とか「U がmを支配す る」と答える誤解が多いので注意.そういうことはありえない.一般に「戦略stを支配する」という概念は,同一プ レーヤーの戦略stを比較するものである.sと tは同一プレーヤーの戦略でなければならない.(一般的に書くとき はプレーヤーiの戦略であることを明示するため,だれの戦略かはっきりしないs やtを使うよりも添字iのついたsi

とかti という記号を使うのが普通.)ここではU はPlayer 1の戦略だから,それが支配できる戦略はPlayer 1のもの であるM かD しかありえない.

(iv) (U, l)(M, r)がナッシュ均衡である.具体的な求め方を述べる:

• Player 2の各戦略にたいするPlayer 1の最適反応と,Player 1の各戦略にたいするPlayer 2の最適反応を問 (i)の正解例の要領で求める.

• 利得の両方にマークがついた「升目」(利得ペア)をすべてみつける.その升目に対応する戦略の組がナッシュ均衡 である.(理由.Player 1の利得にマークがついているということは,その升目に対応するPlayer 2の戦略にた いしてPlayer 1が最適反応をしているということである.同様にPlayer 2の利得にマークがついているという ことは,その升目に対応する Player 1の戦略にたいしてPlayer 2が最適反応をしているということである.こ れらから,互いに最適反応をしていることが分かる.)

参考.ナッシュ均衡を問われたときに誤って利得の組(ペア)を答えないように.ナッシュ均衡とは戦略の組であり,だ れがどの戦略を取るかを記述したものであることに注意.

演習2.7 以下のゲームを考える.

Player 2

s2 t2 u2

Player 1 s1 1, −1 1, −1 1, 1 t1 100, 0 0, 100 −1, 1 u1 0, 100 100, 0 −1, 1

Player 2 の戦略 t2 にたいする Player 1 の最適反応は である.Player 1 の戦略 t1 にた

いする Player 2 の最適反応は である.このゲームの (純粋戦略による)ナッシュ均衡は

である.(たとえば「(s1, s2), (s1, t2)」のように,すべてのナッシュ均衡を

(11)

挙げること.)

次に簡単な真偽問題を載せる.試験では複数の真偽問題を組みあわせて出題することが多いので注意.ま た,反例などによって簡単に理由があげられるばあい,試験では理由を問うかもしれない.

演習2.8 以下のそれぞれのステートメントの真偽を答えよ.

a. 非協力ゲーム理論は,プレーヤーたちがどのように協力を実現できるかを分析できない. b. (強)支配される戦略がナッシュ均衡にふくまれることはない.

c. (強)支配戦略の組はナッシュ均衡になるとはかぎらない.

d. 戦略s1が戦略 s1を(強)支配するとき,戦略 s1は戦略 s1を弱支配する. e. 弱支配戦略は他のプレーヤーの任意の戦略にたいする最適反応である.

f. ある混合戦略が相手のある戦略にたいする最適反応であるとき,その混合戦略にふくまれる純粋戦略(その 混合戦略が正の確率を与える純粋戦略)はどれも,相手のその戦略にたいする最適反応である.

g. ナッシュ均衡から1人のプレーヤーだけが離れる(戦略を変える)ことによって,そのプレーヤーの利得が 改善されることはない.

h. ナッシュ均衡から同時に2人が離れる(戦略を変える)ことによって,その2人の利得が両方とも改善され ることはない.

i. 戦略形ゲームに複数の均衡があるとき,特定のプレーヤーの利得はそれらどの均衡においても等しい. j. もし(s1, s2)と(s1, s2)がナッシュ均衡であるとき,(s1, s2)または(s1, s2)もナッシュ均衡である.

正解例. a.偽.協力ゲーム理論は提携を組むひとびとが協力できることを前提として分析.非協力ゲーム理論は協力でき ることを前提とせず,競争や協力などさまざまな行動を個々のプレーヤーの意思決定レベルで分析.

b. 真.武藤44頁参照. c. 偽.武藤44頁参照.

d. 真.武藤33–34頁.逆にある戦略が他の戦略を弱支配するからといって,支配するとはいえないことに注意. e. 真.ただし任意の戦略にたいする唯一の最適反応とはかぎらない.

f. 真.たとえばS1= {U, M, D}, S2= {L, R}とする.Player 1の混合戦略p= (1/3, 2/3, 0) (U , M , Dをそれぞ れ1/3, 2/3, 0の確率でプレイする混合戦略) がPalyer 2の混合戦略q= (q, 1 − q)にたいする最適反応のとき,U や M 自体も qにたいする最適反応であるという意味.かりにU が最適反応でないばあい,Uに正の確率を与えるよりは, ほかのMまたはDにすべての確率を与えた方が利得が高くなるはずである.

g. 真.(s1, s2)がナッシュ均衡ならば,s1はs2にたいする最適反応だから(s2が固定されているかぎり) s1 から離れ てs1 (ただしs1̸= s1)に動くことで利得が増えることはない.以下の不等式群がしめすところである:

u1(s1, s2) ≥ u1(s1, s2) for all s1∈ S1

h. 偽.たとえば囚人のジレンマ(武藤39頁あるいは31頁表2-1)では,均衡から2人が同時に動くと2人の利得はと もに改善する.

i. 偽.たとえばBattle of the Sexes (武藤67頁)では(サッカー,サッカー)と(映画,映画)が均衡.しかしPlayer A の利得は前者で2,後者で1となって等しくない.あるいは以下のような簡単なゲームを考えてもいい:

Player 2 L R Player 1 U 1,1 0,0

D 0,0 2,2

j. 偽.たとえばBattle of the Sexes (武藤67頁)では(サッカー,サッカー)と(映画,映画)が均衡.しかし(映画, サッカー)も(サッカー,映画)も均衡ではない.問iの正解例の別ゲームでも同様.

(12)

以下2題はややすすんだ演習問題.学生の答案作成能力や採点の手間などを考えると,試験でこのままの形 で出すには厳しいものがある.必要な条件が抜けているなど,設問に不完全な部分があれば適当に補って答 えよ.

演習2.9 室温が0度から50度の範囲で自由にコントロールできる,冷暖房完備の部屋の温度設定を考える. この部屋には5人がいて,それぞれが自分にとって最適な室温をこの範囲に持っており,その温度から離れれ ば離れるほど快適さは下がる(単峰型の効用)とする.もちろん各人は自分の快適さを最大化しようとするも のとする.

(i)各自に自分の最適室温を報告してもらって,室温をそれらの平均値に設定する決め方を採用したとする. このとき,みんないつも本当の最適室温を報告しようとする(その決め方が「戦略的操作にたえる」)といえ るか? 各自の戦略集合を[0, 50] = {x ∈ R : 0 ≤ x ≤ 50}とし(戦略は室温を表す),自分の本当の最適室温を 報告するのが弱支配戦略であるかどうかをしめせ.

(ii)各自に自分の最適室温を報告してもらうとし,全員がじっさいに本当の最適室温を報告すると仮定する. どのような決め方を採用すれば,その決め方で定まる室温が他の室温に(1対1の)単純多数決で負けることが ないようにできるか?

(iii)問題(ii) では全員が本当の最適室温を報告すると仮定した.じっさいはどうだろうか? 問題(ii)で答え

た決め方を採用したとき,みんないつも最適室温を報告しようとするといえるか? 自分の本当の最適気温を報 告するのが弱支配戦略であるかどうかをしめせ.

演習2.10 2人以上の入札者が,セカンドプライス・オークションに参加している.これは参加者が入札額を

他の参加者に分からないように紙に書いて競り人に渡し,いちばん高い額をつけた参加者が落札する封印入札 方式である.ただし,落札者が支払うべき価格は,落札者以外の参加者のつけた額でいちばん高いもの(2番 目に高い入札額)となる.もし最高の入札額を提示した参加者が複数のばあい,その中からくじ引きで落札者 を決め,支払うべき価格はその最高額とする.入札者1の評価額(当該商品を得るために払ってもよいと思っ ている上限価格)がv1 のとき,どのような入札額b1 を提示するのがいいか? 入札額として,評価額v1をそ のまま提示する戦略が弱支配戦略であるかどうかをしめせ.ただし落札しなかったときの利得をゼロとし,落 札したときの利得を評価額から支払額を引いた値とする.

3 展開形ゲーム

「武藤」とあるのは,武藤『ゲーム理論入門』[3]のこと.まず武藤章末の練習問題より易しめの問題を列挙 する.

演習3.1 武藤の事例3-1(p. 71)と事例2-1 (p. 25)をそれぞれ展開形ゲームで表現せよ.[正解はそれぞれ図 3-1と図3-2.]

演習3.2 武藤の図3-3 (p. 79)の展開形ゲームを戦略形ゲーム表現に直せ.Bの戦略をすべて列挙せよ.Bの

「維持-引き下げ(維下)」という戦略を展開形ゲーム上に表現せよ.[正解は表3-1.「維下」という戦略は図3-3 では点線で表現されている.演習5.1の類題.]

(13)

演習3.3 武藤の図3-4 (p. 83)の展開形ゲームを戦略形ゲーム表現に直せ.純粋戦略によるナッシュ均衡をす べて列挙せよ.[正解は表3-2とp. 83 本文.演習5.1の類題.]

演習3.4 武藤の事例3-6 (p. 87)のケース1とケース2のそれぞれを情報集合に注意しながら展開形ゲームで 表現せよ.それぞれのケースについて,全体ゲーム以外の部分ゲームをすべて特定せよ.それぞれのケースに ついて,プレーヤーCの純粋戦略の個数を求めよ.[正解: 図3-9(矢印と枝の数字は無視)と本文pp. 88-89. 全体ゲーム以外の部分ゲームについてはケース1では6個,ケース2では2個を特定すればいい.プレーヤー Cの純粋戦略の個数はケース1では2 × 2 × 2 × 2 = 16個,ケース2では2 × 2 = 4個.]

演習3.5 武藤の図3-11 (p. 97)の展開形ゲームで,利得が一部欠けているとする.利得を記入してゲームを

完成せよ.そして部分ゲーム完全均衡を求めよ.[正解: 利得はその図のとおり.本文の説明を参照.部分ゲー ム完全均衡はp. 98の本文にある.]

演習3.6 武藤の事例3-5 (p. 72)の2期間のケースを展開形ゲームで表現せよ.ただし割引因子をδとする. このゲームには全体ゲーム以外の部分ゲームがいくつあるか.[正解: 図3-12.全体ゲーム以外の部分ゲーム は4個.]

演習3.7 武藤の表2-1 (p. 31)の戦略形ゲームを無限回繰り返す繰り返しゲームを考える.利得は割引因子δ

をもちいてp. 105で与えられる平均利得で定義する.

(i)2人のプレーヤーがトリガー(永久懲罰)戦略をとるときのプレイは毎期「維持」をとりつづけることにな ることを確認せよ.

(ii)トリガー戦略の組がナッシュ均衡であることをしめそう.いまBがトリガー戦略をとっているとする.こ のとき,Aがトリガー戦略をとったときの利得と t 期にトリガー戦略を逸脱したときの利得を比べることに より,トリガー戦略が確実にAの最適反応になるためのδ の値の範囲をもとめよ.

[正解: p. 106の下から第2パラグラフ.pp. 106-108.] 演習3.8 以下のそれぞれのステートメントの真偽を答えよ.

a. 囚人のジレンマの有限回繰り返しゲームでは,毎期裏切り(自白)をとりつづける戦略の組は部分ゲーム完 全均衡である.

b. 囚人のジレンマの有限回繰り返しゲームで割引因子δがじゅうぶん大きければ,毎期裏切り(自白)をとり つづける戦略の組以外の部分ゲーム完全均衡が存在する.

c. 囚人のジレンマの無限回繰り返しゲームでは,毎期裏切り(自白)をとりつづける戦略の組は部分ゲーム完 全均衡である.

d. 囚人のジレンマの無限回繰り返しゲームで割引因子δがじゅうぶん大きければ,毎期裏切り(自白)をとり つづける戦略の組以外の部分ゲーム完全均衡が存在する.

[正解: 真,偽,真,真.]

演習3.9 シュタッケルベルグの複占市場の部分ゲーム完全均衡(武藤pp. 111-114)における先導者である企 業A の利潤は,少なくともクルーノー・ナッシュ均衡における企業 A の利潤以上である理由をしめそう. シュタッケルベルグの複占市場では企業 Aはクルーノー・ナッシュ均衡のときと同じ生産量 x = (a − c)/3 を選ぶことができたはずである.そのときの利潤はクルーノーナッシュ均衡のときの利潤uA= (a − c)2/9と

(14)

同じになっていたはずである(設問: それをしめせ).生産量xを選べば同じ利潤uAを得られたのに,企業A はあえてxとは異なる生産量x= (a − c)/2を選んでいる.そのことからシュタッケルベルグの複占市場の 部分ゲーム完全均衡における企業Aの利潤は少なくともuA以上であることが分かる.

[正解: シュタッケルベルグの複占市場で企業A がx = (a − c)/3を選んだとすれば,企業Bはxにたい する最適反応y = (a − c)/3を選んだはずである.このyがxにたいする最適反応であることは,戦略のペ

ア(x, y)がナッシュ均衡であることから分かる(武藤 p. 56).両企業の生産量がクルーノー・ナッシュ均衡

のときと同じだから,企業 Aはクルーノー・ナッシュ均衡のときと同じ利潤uAを得ることができたはずで ある.]

演習3.10 梶井・松井[2, p. 251]の練習問題13.1と13.2. ホテリングモデルで3人あるいは4人競争するば あい.なお,消費者が自分の居場所にもっとも近い店を訪れることを前提とすれば,このゲームは2軒の店を プレーヤーとする戦略形ゲームとなり,部分ゲーム完全均衡のかわりにナッシュ均衡が適用できる.

演習3.11 (議員報酬引き上げ点呼式投票 (Pay raise roll-call voting); Morrow [1], pp. 125-126) 3 人の議員からなる議会で,議員報酬の引き上げについてroll-call方式(公開で順番に投票;自分より前に投票 した議員の投じた票が分かる)で投票を行う.3人の議員はいずれも報酬引き上げを望んでいる(引き上げの

利益をb > 0とする).その一方で,もし引き上げに投票すれば,有権者の反感を買うためのコストc (ただし

b > c > 0)を被るとする.いま投票する順番にしたがってプレーヤーを 1, 2, 3 と呼び,各プレーヤーはy

(yes: 引き上げに賛成)またはn (no: 引き上げに反対)のいずれか一方に投票するとする.

(i)この状況を展開形ゲームで表現せよ.図1を完成させればよい.

n y 1

n y 2

n y 2

n (0, 0, 0) y (0, 0, −c) 3

n y 3

n y 3

y (b − c, b − c, b − c) 3 n (b − c, b − c, b) 3

図1 議員報酬引き上げ点呼式投票

(ii)このゲームを逆向き帰納法(backwards induction)で解くことにより,部分ゲーム完全均衡と均衡におけ る利得列を求めよ.その際,おのおのの決定節(点)で各プレーヤーが選ぶ選択肢(行動)に対応する枝に矢印 を記入せよ(プレーヤー3のいちばん上の決定節から出ている選択肢nに対応する枝にある矢印が一例).

(iii)何番目に投票する議員がもっとも有利だといえるか?

演習3.12 (複数段階投票手続と戦略的投票 (sophisticated voting); Morrow [1], p. 135, Example) 3人の投票者(プレーヤー1, 2, 3)が,選択肢x, y, zからひとつ選ぼうとしている.3人の選好は以下で表さ れる: プレーヤー1がxyz (x, y, z の順で好ましい),プレーヤー2がyzx,プレーヤー3がzxy. いま次の ようなアジェンダ(選択肢を比較する順序を定めた手続き)により多数決投票を行う: まず第一段階でy とz とで投票し,つぎに第二段階でその勝者とxとで投票して最終アウトカム(結果)を決める.

(15)

(i)過半数のプレーヤーによる選好をx, y, zを点(ノード)とする有向グラフ(たとえば2人以上がxをyよ り好むならば,点xから点yに向かう矢印付きの枝を記入し,そのxyという選好をもつプレーヤーの名前を その枝のラベルとして記入)で表せ.以下の図を完成させればよい.

x z ❏❏y

✡✡ 1, 3

(ii)このアジェンダを投票の木(voting tree)で表現せよ. (iii)正直な投票(sincere voting)によるアウトカムは何か? (iv)戦略的投票(sophisticated voting)によるアウトカムは何か?

(v) 戦略的投票 (sophisticated voting)をしたとき,第一段階で自分の選好に反する投票をするのはどのプ レーヤーか?

(vi)以上の結果を第一段階でxとy とで投票し第二段階でその勝者とz とで投票して最終アウトカムを決め るアジェンダにおけるアウトカム(ある年の授業ノートの44–46頁)と比較し,戦略的投票を前提としていて も異なるアジェンダは異なるアウトカムを生じうることを確認せよ.

正解例. 手書きの正解例15頁参照.

演習3.13 (交渉ゲーム) 図2の展開形で表されるプレーヤーAとBの2段階交渉ゲームを考える.第1ラ

ウンドでBがx2をオファーし(ただし0 ≤ x2 ≤ 1),Aがa (accept; 承諾)またはr (reject; 拒否)を選ぶ. Aがrを選べば,第2ラウンドでAがx1をオファーし(ただし0 ≤ x1≤ 1),Bがa (承諾)またはr (拒否) を選んでゲームは終わる.利得はAの利得,Bの利得の順で表されている.また,割引率δ = 4/5で,交渉が 決裂したときのAの取り分はゼロだが,Bの取り分は1/5とする.このゲームの部分ゲーム完全均衡(バッ クワード・インダクションの解)におけるオファーx1とx2の値を求めよ.

0 1

x2

B r

a (x2,1 − x2) A

0 1

x1

A r (0,15)

a (45x1, 4

5(1 − x1)) B

図2 2段階交渉ゲーム

正解例. 手書きの正解例16頁参照.*11

4 情報不完備ゲーム

演習4.1 武藤の事例4-1(p. 120)を戦略形ゲームとして表現せよ.特にプレーヤーAの戦略とプレーヤーB の利得に注意せよ.[正解: 表4-3.A の戦略はタイプA1のときの選択とタイプA2のときの選択をリスト

*11正解例の move 4 と move 2 の分析で説明を省略したことがある.たとえば move 4 において境界値 x1= 3/4のとき Player Bは A のオファーをアクセプトするものとしてあつかった.境界値 x1= 3/4では B がリジェクトするのも最適な反応である のに,なぜ均衡ではアクセプトすると言えるか?  もしリジェクトするなら,move 3 において Player A にとって最適な x1 存在しなくなり (B の「x1< 3/4なら受け入れ」という行動を前提にして A が x1 を最大化しようとしても最大値が存在しな い),均衡にならないためである.

(16)

したもの.]

演習4.2 武藤の表4-3のベイジアンゲーム(p. 123)で,(下維,維)がベイジアン均衡であることを確認せよ. (維維,維)がベイジアン均衡でない理由を述べよ.[正解: 本文pp. 124-5参照.]

演習4.3 武藤の事例4-2 (p. 126)を展開形ゲームとして表現せよ.[正解: 図4-3.]*12

演習4.4 武藤の図4-3のゲーム(p. 127)において,プレーヤーAの情報集合での Aの信念が(r, 1 − r)で 与えられている.このときA の期待利得をrの関数としてもとめ,その期待利得が最大になるような行動を rの値におうじて決定せよ.[正解: 本文p. 128第4パラグラフ.]

演習4.5 武藤の図4-3のゲーム(p. 127)において,プレーヤーAの情報集合での Aの信念が(r, 1 − r)で 表されている.強いタイプの Bと弱いタイプのBのとりうる行動の組(4つある)のそれぞれにたいして整 合的なA の信念をもとめよ.[正解: 本文p. 128第5パラグラフからp. 129.]

演習4.6 武藤の図4-3のゲーム(p. 127)において,強いタイプのBが「参入する」をとり,弱いタイプのB

が「参入しない」をとるような完全ベイジアン均衡をもとめよ.[正解: (Aの行動,強いBの行動,弱いBの 行動,Aの信念)の組が(阻止,参入する,参入しない,(1,0))となるのが均衡.本文p. 130ケース2を参照. 演習5.9の類題.]

演習4.7 武藤の図4-3のゲーム(p. 127)において,強いタイプのBが「参入しない」をとるような完全ベイ

ジアン均衡は存在しないことをしめせ.[正解: 強いBが参入しなければ利得は0で,参入すれば利得は1ま たは3となり,いずれにせよ参入したほうが利得が高い.本文 pp. 130-1ケース3, 4を参照.]

演習4.8 (就職市場のシグナリングゲーム) 梶井・松井[2, p. 93]の練習問題5.3.

5 追加問題

「渡辺」とあるのは渡辺隆裕(2004)『図解雑学 ゲーム理論』のこと.

演習5.1 渡辺73頁の展開形ゲーム(交互ゲーム) を戦略形(同時ゲーム)に直せ.新朝の(金融,疑惑)とい う戦略を展開形ゲーム上に表現せよ.このゲームの純粋戦略によるナッシュ均衡をすべて列挙せよ.[正解. 戦略形は同ページ下.新朝の戦略(金融,疑惑)は「新朝」とある2つの丸から描かれた2本の太い矢印で表さ れている.ナッシュ均衡は(疑惑,(金融,疑惑))と(疑惑, (金融,金融))の2つ.戦略の意味を誤解している 学生が過去ひじょうに多かった.本文の説明をきちんと読んで正しく理解しておくこと.演習3.2と演習3.3 は類題.]

演習5.2 渡辺85頁の「時間差じゃんけん」で後手の戦略はいくつあるか?  すべて列挙せよ. 正解例. 後手の戦略をg (グー), c (チョキ). p (パー)のいずれかの文字を3つ並べた文字列s1s2s3で表す.ただし

• 1番目の文字s1は先手がgを出した場合の後手の出す手,

*12演習 4.3–4.7 は演習 5.10 の類題である.

参照

関連したドキュメント

  BCI は脳から得られる情報を利用して,思考によりコ

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

それでは資料 2 ご覧いただきまして、1 の要旨でございます。前回皆様にお集まりいただ きました、昨年 11

てい おん しょう う こう おん た う たい へい よう がん しき き こう. ほ にゅうるい は ちゅうるい りょうせい るい こんちゅうるい

(自分で感じられ得る[もの])という用例は注目に値する(脚注 24 ).接頭辞の sam は「正しい」と

黒い、太く示しているところが敷地の区域という形になります。区域としては、中央のほう に A、B 街区、そして北側のほうに C、D、E

と判示している︒更に︑最後に︑﹁本件が同法の範囲内にないとすれば︑

○安井会長 ありがとうございました。.