宿題ゲーム理論 2011 HW3ans

(1)

ゲーム理論 2011

^∗

宿題 ³ の解答

^{† ‡}

平成 23 年 8月 25 日

問題 1 ₍長期的関係による協力_). テレビ業界は新規参入が難しく_Aと_Bとの長期的な関係が続くと考えられるため、これは繰り返しゲーム的状況と見ることができます。そこで、たとえば両企業が

• 均衡上では相手の不祥事を報道しない

• 相手がもし自分の不祥事を報道すれば、翌日自分は相手の不祥事を報道する

というトリガー戦略をとれば、両者は協力関係を維持できる可能性があります（もちろん、ほかのトリガー戦略でも協力が維持できるかもしれません）。ただし、どちらか一方または両方が将来を重視しない場合（つまり割引率が非常に低い場合）、協力を維持できず、不祥事が明るみに出てしまうことも考えられます。

問題 2 ₍無限繰り返しゲーム_). 各企業_iのつける価格を_p_iとします。

(a) ステージゲームのナッシュ均衡は_(p₁_{, p}₂_{) = (0, 0)}および_{(1, 1)}の₂つです。ただし、両社にとって価格₀は価格₁および₂に弱支配されていることに注意してください。

(b) ^{相手が価格}2を選ぶとき、自分は価格₁を選ぶともっとも利得が大きく、そのときの増分は_{3−2 = 1} となります。

(c) ^{相手が価格}2を選んでいるとき、自分が価格₂から逸脱してしまうと、来期以降ずっと_(p₁_{, p}₂_{) =}

(1, 1)をプレイすることになり、そのときの各期の利得は

3

2^{となります。よって}

∞

∑

t=1

δ^t (

2 −³ 2

)

= ^δ

2(1 − δ)

だけ損をこうむることになります。

(d) ^均衡価格2から逸脱することによって得られる利益がこうむる損失以下であるとき、このトリガー戦略の組はサブゲーム完全均衡となることができます。よって

1 ≤ ^δ

2(1 − δ) ^⇐⇒ ^δ ^≥ 2 3 がその条件となります。

∗https://sites.google.com/site/gametheory2011mats/

†

梶哲也（赤門総合研究棟₄₂₀室_/メール：[email protected]^）

‡

質問やコメント等あればメールをくださるか、直接来訪してください。

1

(2)

(e) 各ステージゲームにおいてプレイされる（すべてのプレーヤーの）行動の組をα(0), α(1), . . . ^とし、プレーヤー_iの期待利得関数を_g_iとします。このとき無限繰り返しゲームにおける「平均利得」は

(1 − δ)

∞

∑

t=0

δ^tgi(α(t))

で計算されます。これは、利得の現在価値

∑∞ t=0^δ

tgi(α(t))が与えられたときに、それをあたかも毎期毎期同じ利得_cを得ているとみなしたときの現在価値

c

1−δ と等しくなるように選んだ_cのことです。繰り返しゲームから得られる利得をステージゲームにおける利得と同じ土俵で議論するための概念といえます。

(f) ステージゲームにおけるミニマックス値は₀（＝相手が価格₀を選んだときの最大利得）となります。

(g) 平均利得の実現可能領域は図₁の灰色の領域で、境界も含む閉じた領域となります。一方、トリガー戦略によって（_δが₁に近ければ）達成可能な領域は、先ほどの実現可能領域のうち両者の利得が厳密に₀より大きい部分（つまり_π1軸、_π2軸上の点を除いた領域）となります。

π1

π2

(0, 0)^• _{(3, 0)}^•

•^{(2, 2)} (0, 3) •

(³₂,³₂)

◦

図₁ 実現可能・達成可能な平均利得

問題 3 ₍有限繰り返しゲーム_).

(a) バックワード・インダクションを用いて考えます。価格の組_{(1, 1)}はステージゲームにおけるナッシュ均衡になっているので、_T期（最後の期）には_{(1, 1)}をプレイすることはお互いに最適反応となっています。次に_T _{− 1}期には、

• 今期自分がどんな行動をとっても次の期に実現する結果は変わらない

• ^{均衡上では相手は価格}2^{をつけてくる}

ということから、価格₁に逸脱する動機があることになります。よって₁つ目のトリガー戦略は T ≥ 2のときサブゲーム完全均衡とはなりえません。

(b) ここでも同様にバックワード・インダクションを用いて考えます。今まで均衡上を進んできた場合、_T期に相手は価格₁をつけることがわかっているので、それに対する最適反応は₁となります。もしどちらかが均衡から外れていた場合、_T期にもう一方は価格₀をつけることがわかっているので、自分もそれに対する最適反応のひとつである₀をとれば、_T 期から始まるサブゲームのナッシュ均衡となります。次に_T _{− 1}期には、

• 今まで均衡上を進んできた場合、今期価格₂から逸脱すれば最大で_{3 − 2 = 1}の利得を得られるが、_δ(

3

2 ^{− 0) =} 3

2^δ^{の利得を失う}

2

(3)

• もしどちらかが均衡から外れていた場合、上に述べた理由で_T 期に_{(0, 0)}をプレイすることになるので、_T _{− 1}期にも価格₀から逸脱する動機はない

ということから_{1 ≤}

3

2^δ^{⇔ δ ≥} 2

3であればこの戦略はこのサブゲームのナッシュ均衡として成り立つことがわかります。同じことを続けていくと、_T_{− 2}期には

1 ≤ 2δ + ³ 2^δ

2

(

= ³ 2^δ⁺

( 1 2^δ⁺

3 2^δ

2

))

であればいいことになりますが、これは_δ _≥

2

3 であれば自動的に満たされることになります。同様に_δ _≥

2

3 であればそれ以前のすべてのサブゲームでこの戦略はナッシュ均衡となることが確認できます。以上より_δ _≥

2

3^であれば²つ目のトリガー戦略の組はサブゲーム完全均衡となります。 (c) ^詳しくはBenoit and Krishna (1985)^{を参照してください。}

問題 4 ₍情報不完備ゲーム_). この問題で仮定される戦略_b_i _{= βv}_iは価値_v_iに対して強く単調となるので、引き分けとなる確率は₀です（_β _{= 0}の場合は若干プラスの_βに逸脱する動機があるので考えません）。したがって以下の計算では引き分けのケースは無視することとします。

(a) vi ∈ [0, 1]^{の確率密度関数は}f(v) = 2vで与えられるので、分布関数は_F_{(v) = v}

2

となります。よって企業₂が戦略_b2 _{= βv}2を取ってくるとき、企業₁が_b1をビッドして勝てる確率は

Pr{b2< b1} = Pr {

v2 < ^b¹ β

}

=^{( b}¹ β

)²

となります。ここで企業₁は_b₁ _{> β}をビッドする動機はないので、その場合は考慮しなくてよいことに注意してください。よって企業₁の期待利得は

g1(b1, b2) =^{( b}¹ β

)²

(v1− b1)

となります。

(b) (a)^{で求めた期待利得を}b1について微分すると、一階条件より

2 β

( b1

β )

(v¹− b¹) −^{( b}¹ β

)²

= 0 ⇐⇒ b1 ₌

2 3^v¹ と解けます。

(c) (b)^よりβ = ²₃ のとき互いに最適反応となります。よってベイジアン・ナッシュ均衡は

(b^∗1(v1), b^∗2(v2)) =^{( 2} 3^v¹^,

2 3^v²

)

と導かれます。

2

3 ^<¹なので、各企業は自分の価値よりも低めに入札する動機があることがわかります。一般にsecond-price sealed-bid auctionであれば正直にビッドする戦略が支配的になることが知られています。上と同様にして、企業が支払う価格が自分のビッドではなく相手のビッドであるとき、均衡戦略が_b_i _{= v}_iとなることを確かめてみてください。

参考文献

Benoit, J.-P. and V. Krishna (1985): “Finitely Repeated Games,” Econometrica, 53, 4, 905–922.

3

宿題 ゲーム理論 2011 HW3ans

ゲーム理論 2011

宿題 3 の解答

参考文献

宿題ゲーム理論 2011 HW3ans

宿題 ³ の解答