• 検索結果がありません。

第 4 章 不完備情報ゲーム 47

4.7 課題

追加演習 4.1 武藤[10, 事例4-1,120頁)]のベイジアンゲームにおけるプレーヤーAの戦略をすべて列挙せ よ.[正解: 表4-3のAの戦略4つを列挙すればいい.各戦略はタイプA1のときの選択とタイプA2のとき の選択の組であり,授業では「維維」「維下」「下維」「下下」などと略す.]

追加演習 4.2 武藤[10,事例4-1,120頁)]のベイジアンゲームのベイジアン均衡を求めよ.[正解: (下維,維) が均衡.解き方はこのノートの4.1節のとおり.武藤の表4-3を作る必要はない.]

追加演習 4.3 天谷[6, 5章124頁]のベイジアンゲームが与えられている.このとき田中君が「しない」よう

なベイジアン均衡が存在するための確率pの範囲を求め,そのときの均衡を求めよ.[正解: 0≤p≤1/2. 均 衡は(するしない,しない);すなわち普通タイプの鈴木君は「する」,多忙タイプの鈴木君は「しない」,田中 君は「しない」という戦略の組み合わせ.本文参照.]

演習4.1 武藤[10]の事例4-2 (p. 126)を展開形ゲームとして表現せよ.[正解: 図4-3.]

演習4.2 (最重要; 与えられた信念のもとでの最大化) 武藤の図4-3のゲーム(p. 127)において,プレーヤー Aの情報集合でのAの信念が(r,1−r)で与えられている.このときAの期待利得をrの関数としてもとめ,

その期待利得が最大になるような行動をrの値におうじて決定せよ.[正解: 本文p. 128第4パラグラフ.] 演習4.3 (最重要; 整合的な信念) 武藤の図4-3のゲーム(p. 127)において,プレーヤーAの情報集合での Aの信念が(r,1−r)で表されている.強いタイプのBと弱いタイプのBのとりうる行動の組(4つある)の それぞれにたいして整合的なAの信念をもとめよ.[正解: 本文p. 128第5パラグラフからp. 129.]

演習4.4 (最重要; 完全ベイジアン均衡) 武藤の図4-3のゲーム(p. 127)において,強いタイプのBが「参入 する」をとり,弱いタイプのBが「参入しない」をとるような完全ベイジアン均衡をもとめよ.[正解: (Aの 行動,強いBの行動,弱いBの行動,Aの信念)の組が (阻止,参入する,参入しない,(1,0))となるのが均 衡.本文p. 130ケース2を参照.演習??の類題.]

演習4.5 (最重要; 完全ベイジアン均衡) 武藤の図4-3のゲーム(p. 127)において,強いタイプのBが「参入 しない」をとるような完全ベイジアン均衡は存在しないことをしめせ.[正解: 強いBが参入しなければ利得 は0で,参入すれば利得は1または3となり,いずれにせよ参入したほうが利得が高い.本文pp. 130-1ケー ス3, 4 を参照.]

演習4.6 (重要; 完全ベイジアン均衡と弱支配される戦略) [武藤IV章 練習問題1 (135頁)から]次の展開形 ゲーム(演習3.7と同じ)の完全ベイジアン均衡を求め,弱支配される戦略は含まれないことを確かめよ.

正解例. Player 2の情報集合における信念を(r,1−r)とする.ただしrはこの情報集合が実現したという条件のもとで

Player 2が上の点にいる確率である.この信念のもとでPlayer 2dを選ぶことが直ちに分かる.上の点でも下の点で

もdを選ぶ方がeを選ぶより利得が高いからである.[詳細: dを選んだときの期待利得は3r+ 2(1−r) =r+ 2eを選 んだときの期待利得は2r+ 1(1−r) =r+ 1.よってrの値にかかわらずdの方が高い利得を与える.]

このとき,点1におけるPlayer 1の最適な選択はaである:

• aをとれば1の利得は(Player 2がdをとるため) 4

• bをとれば1の利得は(Player 2がdをとるため) 1

• cをとれば1の利得は3

Player 1の上記の行動と整合的なPlayer 2の信念は(1,0)である.情報集合の下の点に至らず上の点には至るため.

以上から完全ベイジアン均衡は,「1はaを,2はdを選び,Player 2の情報集合における信念は(1,0)となる」よう な行動と信念の組み合わせである.この均衡には弱支配される戦略e(eがdに弱支配されることは演習3.7の正解例を 参照)は含まれない.

リマーク4.1 上記の解答例より長くなるが,Player 1がaを選ぶケース,bを選ぶケース,cを選ぶケースに分けて考え てもいい.いずれのケースでもPlayer 2はdを選ぶことから,Player 1がaを選ぶケース以外は場合分けの条件が不合 理であることがしめせる.

演習4.7 (最重要; 完全ベイジアン均衡と逆選抜) [武藤IV章 練習問題2 (135頁)から] 次の図の左側のゲー 修正 す る?

ムは,武藤の図4-4 (133頁)の中古車市場の展開形ゲームと同じ構造を持つ.*24 終点にはPlayer 1の利得

とPlayer 2の利得をこの順序で記入している.このゲームの完全ベイジアン均衡を求め,2Gはnを,2Bは

*24最初にNature (自然)Player 2のタイプ(属性)を選び(確率1/2で良いタイプG,確率1/2で悪いタイプBとなる),

Player 2は自分のタイプを知った上でb(bring;持ち込む)またはn(not;持ち込まない)を選択し,Player 1Player 2 (タイプを知らずに)bという選択のみを知ったうえで,h(high;高い)またはl(low;低い)を選ぶ.Player 2の情報集合は点 2G(タイプGに対応)と点2B(タイプBに対応)であり,Player 1の情報集合は左から3列目の2点からなる集合(Player 2 の選択bに対応)である.

(0,2) (2,3) (4,1) (−1,3)

(1,1) (0,0) r h

l h

l b

b n

2B n 2G (1/2)

(1/2) Nature

1−r 1

(0,2) (2,3) (4,1) (−1,3)

(1,1) (0,0) r= 0h

l h

l b

b n

2B n 2G (1/2)

(1/2) Nature

1−r 1

bを,1はlを選ぶ(すなわち「良いタイプのPlayer 2 は持ち込まず,悪いタイプのPlayer 2のみが持ち込

み,Player 1は低い価格で買う」となる)ことを確かめよ.

正解例. Player 1の情報集合における信念を(r,1−r)とする.ただしrはこの情報集合が実現したという条件のもと

でPlayer 1 が上の点にいる確率で,1−rは同条件のもとでPlayer 1 が下の点にいる確率である.この信念のもとで

Player 1lを選ぶことが直ちに分かる.上の点でも下の点でもlを選ぶ方がhを選ぶより利得が高いからである.[詳

細: hを選んだときの期待利得は2r−1(1−r) = 3r−1.lを選んだときの期待利得は4r+ 1(1−r) = 3r+ 1.よって rの値にかかわらずlの方が高い利得を与える.]

このとき,点2GにおけるPlayer 2の最適な選択はnである:

• nをとれば2Gの利得は2

• bをとれば2Gの利得は(Player 1がlをとるため) 1 また,点2BにおけるPlayer 2の最適な選択はbである:

• nをとれば2Bの利得は0

• bをとれば2Bの利得は(Player 1がlをとるため) 1

2Gと2Bの上記の行動と整合的な Player 1の信念は(0,1)である.情報集合の上の点に至らず下の点には至るため.

以上から完全ベイジアン均衡は,「1はlを,2Gはnを,2Bはbを選び,Player 1の情報集合における信念は(0,1) となる」ような行動(図の右側のゲームに赤い矢印で示している)と信念の組み合わせである.この均衡で「2Gはnを,

2Bはbを,1はlを選ぶ」ことは明らか.

リマーク4.2 授業では図4-4の利得を修正したゲームを考えた.そちらも解けるようにしておくこと.

演習4.8 (重要; シグナリングゲーム) 梶井・松井88頁の図5.7の利得を練習問題5.3に従って修正したゲー ム(授業で採り上げたもの)を考える.(展開形はこのページか次のページに掲載.端点は(労働者の利得,企 業の利得)である.)

(i)「能力高タイプの労働者は資格を取得し,能力低タイプの労働者は取得しない」ような分離型の完全ベ イジアン均衡(ベイズ完全均衡)は存在するか? 存在するならひとつ求めよ.

(ii)「どちらのタイプの労働者も資格を取得する」ような混在型の完全ベイジアン均衡は存在するか? 存在 するならひとつ求めよ.

(iii)「どちらのタイプの労働者も資格を取得せず,企業は(資格なし労働者に)高給を払う」ような混在型の

完全ベイジアン均衡は存在するか? 存在するならひとつ求めよ.

(iv)「どちらのタイプの労働者も資格を取得せず,企業は(資格なし労働者に)低給を払う」ような混在型の 完全ベイジアン均衡は存在するか? 存在するならひとつ求めよ.

正解例. 問(i), (ii)は授業で解説したものとほぼ同様.ここでは(iii)と(iv)の解答を与える.これらいずれの小問の均

自然 労働者 能力高 [r]

(4,2) 高給

(3,−1) 低給

資格取得

[q]

(3,−1) 低給

(4,2) 高給

資格なし

0.5

労働者 能力低 [1r]

(0,−1) 高給

(−3,2) 低給

資格取得 [1q]

(1,2) 低給

(4,−1) 高給

資格なし 0.5

企業 企業

衡でも「どちらのタイプの労働者も資格を取得しない」ことから,「資格なし」に対応する右側の情報集合における企業の 信念は上下2点に同じ確率を与える(0.5,0.5)とするのが整合的である.この信念を前提にしてこの情報集合で企業が

•「高給」を選んだときの利得は0.5×2 + 0.5×(−1) = 0.5になり,

•「低給」を選んだときの利得は0.5×(−1) + 0.5×2 = 0.5になる.

したがってこの情報集合では企業は「低給」を選んでも「高給」を選んでも合理的な選択をしていることになる.また,こ の均衡では左側の情報集合には到達しないため,その情報集合ではどんな信念も労働者の行動に対して整合的であること に注意.よって(この問題では均衡を各問ひとつずつ求めればいいことから)左側の情報集合での企業の行動が合理的に なるように信念を適当に割り当てればいい.一方,能力の低い労働者は資格を取ったら高々利得は0で,資格を取らなけ れば最低利得は1なので,資格を取得しないのが合理的である.以上から,能力が高い労働者の行動の合理性を確認する ことが鍵になる.

(iii)企業が(資格なし労働者に)「高給」を選ぶ場合.左の情報集合における企業の信念は(0,1)すなわち(ちょっとヘ

ンだけど)「資格のある労働者は必ず能力が低い」と企業が想定するとする.このとき企業は「低給」を選ぶのが合理的 (「高給」なら利得−1で「低給」なら利得2だから).よって能力の高い労働者は「資格なし」を選ぶのが合理的(「資格 なし」なら利得は4で「資格取得」なら利得は3だから).以上の行動と信念の組は合理性の条件も整合性の条件も満たす ため完全ベイジアン均衡である.(別解として,左の情報集合における信念を任意の(r,1−r)にしてもいい.左の情報集 合における企業の行動を合理的に選びさえすれば問題ない.能力の高い労働者にとって「資格なし」が合理的であること は,「資格なし」の利得が4で「資格取得」の利得が高々4であることから示せる.)

(iv)企業が(資格なし労働者に)「低給」を選ぶ場合.左の情報集合における企業の信念を(0,1)とすると,(iii)と同 様に企業は「低給」を選ぶのが合理的.よって能力の高い労働者にとって「資格なし」を選ぶのは合理的(「資格なし」な ら利得は3で「資格取得」なら利得は3だから,どちらを選んでも合理的).以上の行動と信念の組は合理性の条件も整合 性の条件も満たすため完全ベイジアン均衡である.

演習4.9 (分離均衡のないシグナリングゲーム) 渡辺 [15,図11.10]のシグナリングゲームの完全ベイジアン 均衡をすべて求めよ.

正解例. 渡辺[15, 11.2.3節]のとおり.このゲームでは資格取得費用に労働者の能力によるちがいがなく,分離均衡が存

在しないのがポイント.つまりシグナリングは機能しない.

演習4.10 (重要;第二価格封印オークションと真の評価額) ある商品に対する入札者 1 の評価額は9000 である.以下ではn人(ただしn≥3)の参加する封印オークションを考える.ただし,入札額が最高の入札 者がふたり以上いたばあいは入札者 1がこの商品を落札するものとする.その商品を落札したときの利得は 評価額から支払額を引いた値とし,落札しなかったときの利得はゼロとする.入札者1は自分以外の入札者の

最高入札額x円やその次に高い入札額y(ただしx≥0かつy≥0)を知らないとする.

(i)x= 6000円とする.第二価格封印オークションで入札者1が落札した場合の利得と落札しなかった場合の

利得を求めよ.落札する方が望ましいか,しない方が望ましいか? 入札者1はどのような範囲の金額を入札 すれば望ましい結果(落札するかしないか)を得られるか?

(ii)x= 11000円とする.第二価格封印オークションで入札者1が落札した場合の利得と落札しなかった場合

の利得を求めよ.落札する方が望ましいか,しない方が望ましいか? 入札者1はどのような範囲の金額を入 札すれば望ましい結果(落札するかしないか)を得られるか?

(iii)第二価格封印オークションでは,入札者1にとって真の評価額9000円を入札することはxの値に関わら

ず望ましいか?

(iv)第三価格封印オークション(最高額の入札者が落札し,3番目に高い入札額を支払う)では,入札者1に とって真の評価額9000円を入札することは,自分以外の入札額上位ふたつx,y (ただしy≥0)の値に関わら ず望ましいか?

正解例. 天谷132–133頁も参考に.

(i)落札した場合の利得は(評価額マイナス支払額である) 9000−6000 = 3000で,しない場合の利得はゼロである.

したがって落札する方が望ましい.入札者1は6000円以上を入札すれば落札できて望ましい状態を実現できる.

(ii)落札した場合の利得は9000−11000 =−2000で,しない場合の利得はゼロである.したがって落札しない方が望 ましい.入札者1は11000円未満を入札すれば落札せずに済むため望ましい状態を実現できる.

(iii)望ましい.もしx≤9000ならば(i)と同様にx円以上を入札するのが望ましく,もしx >9000ならば(ii)と同 様にx円未満を入札するのが望ましい.9000円を入札するのはいずれにせよこの範囲に含まれるため望ましい. 図

(iv)望ましくない場合がある.たとえばx= 11000円でy= 6000円のとき,真の評価額9000円を入札すると落札で きないため利得ゼロだが,割り増して12000円を入札すると落札できて利得9000−6000 = 3000を得られる.

演習4.11 (参考;ふたつの評価額の小さい方と大きい方の期待値) [天谷134頁] 2人の買い手の評価額がそ れぞれ実数区間[0, V] ={x: 0≤x≤V}上で独立に一様分布しているとする.このとき低い方の評価額の期 待値がV /3に,高い方の評価額の期待値が2V /3になることをしめせ.

正解例. いずれ掲載したい.気になる人は本章末の「読書案内」に挙げた文献を参照.

演習4.12 (余裕があれば解説;第一価格封印オークションのベイジアン均衡) [天谷140頁の一般化]n人(た だしn≥2) の入札者の参加する第一価格封印オークションを考える.各人の評価額は実数区間 [0,1] ={x: 0≤x≤1}上で独立に一様分布しており,各人は自分の評価額だけを知るものとする.また,利得は落札し たときの利得(評価額から支払額を引いた値)と落札しなかったときの利得(ゼロ)の期待値とする.このとき 各人が自分の評価額のk倍 (0< k ≤1) を入札するような「対称な」ベイジアン(ナッシュ) 均衡を以下の 手順で求めよ: 入札者1, 2, . . . ,n の評価額をそれぞれx1,x2, . . . ,xn とすればこの均衡ではそれぞれkx1, kx2, . . . ,kxnを入札することになる.(各入札者iの戦略は,自分のタイプである評価額xiを知ったうえで 金額kxiを入札するという行動を選ぶ関数で表される.)どの入札者を取り上げても同様の議論ができるの で,以下では入札者1を取り上げる.1以外の入札者が上記均衡にしたがって行動していると仮定し,評価額 がx=x1で入札額がb(ただし0≤b≤x)の入札者1にとって,最適な入札額がb=kxとなるようなkを 見つければよい.

(i)入札額bで入札者1が落札できた場合の利得を求めよ.

(ii)入札額bで入札者1が落札できる確率を求めよ.ただしb≤kを仮定してよい.

(iii)入札額bのときの入札者1の期待利得を求め,それを最大にするようなbおよびkを見つけよ.ただし

b≤kとn−1≤knを仮定してよい.

正解例. より一般的なケースについては, たとえば尾山・安田[14, 10.9節]や林[5, 24.2.2節]を参照.*25

(i)入札者1が落札できた場合の利得は評価額マイナス支払額だから,x−bとなる.第一価格オークションなので,支 払額は自分の入札額に等しいことに注意.*26

(ii)入札額bで入札者1が落札できるのは,他の入札者の入札額がすべてb未満のときである.*27他の入札者iは評価 額xiのときkxiを入札するので,その入札額がb未満(kxi< b)となるのは評価額がkb 未満になる(xi<kb)ときであ り,その確率はkbとなる(kb ≤1すなわち0≤b≤kのとき;k < b≤xのときは確率1になる).*28入札額bで入札者1 が落札できる確率は,((n−1)人全員の入札額がb未満になるときだから)分布の独立性から(bk)n1になる.*29

(iii)期待利得u(b)は落札したときの利得と落札しなかったときの利得の期待値であるため,

u(b) =

!b

k

"n1

·(x−b) +{1−

!b

k

"n1

} ·0 = 1

kn1(xbn1−bn)

となる.ここで0≤b≤kという仮定を利用した.以下の議論でもbをこの範囲に限定することにする.u(b)を最大にす るようなbはこの範囲に存在するためである.*30

u(b)をbについて微分することにより導関数は(リマーク4.3を参照), u(b) = 1

kn1{x(n−1)bn2−nbn1}= bn2

kn1{x(n−1)−nb}

となる.この導関数の値がゼロとなるのはb= 0 (n >2の場合)のときとb= nn1xのときで,u(b) の増減を[0, x]区 間で調べると,

*25ただしこの解答の(ii)(iii)の脚注にあるようなケースまできちんと場合分けして議論したテキストは見当たらなかった.この 解答にまちがいがあれば指摘して欲しい.

*26変数bの入らない形である「xkx」だけ答えたばあい,出題意図を理解していないとみなす.それは入札者1の戦略がb=kx と書けるときの均衡における利得ではあるが,問(iii)では使えないためである.入札者1が動かせるのは(他人の戦略にかかわ る係数)kや自分の評価額xではなくて,入札額bである.最適なbを求めるためには,その変数が入った式を立てる必要がある.

(あるいは入札者1が動かせる変数k1を新たに導入してb=k1xとし,利得をxk1xとしたうえで最適なk1を求めることも 可.)もし入札者1kを動かしているとすると,他人の戦略も動かしていることになるので注意.

*27b未満の代わりにb以下としても同じ.連続確率変数を考えているため,特定の値を取る確率はゼロになる.

*28評価額が[0,1]上の一様分布であることから,(0z1を満たすzについて)評価額がz未満になる確率はzである.この分 布の密度関数はg(z) = 1で,(確率変数がz未満になる確率を与える)分布関数はG(z) =zと書けることに注意.

*290bkを仮定した.k < bxのときは確率は当然1n1= 1になる.

*30 k < bxのときは落札確率が1なので期待利得はu(b) = 1(xb) =xbになる.この期待利得はk < bxなるbについ て減少し,u(k) =xk > u(b) =xbが成り立つ.

重要

ドキュメント内 game1709notes 最近の更新履歴 H Reiju Mihara (ページ 55-61)

関連したドキュメント