• 検索結果がありません。

純粋戦略における Nash 均衡より緩い安定性

N/A
N/A
Protected

Academic year: 2021

シェア "純粋戦略における Nash 均衡より緩い安定性"

Copied!
15
0
0

読み込み中.... (全文を見る)

全文

(1)

純粋戦略におけるNash均衡よ り緩い安定性

行 方 常 幸

1. は じめに

2.プ レイヤーが同時に手 を変え る可能性を考慮 に入れた安定性 3.例 と考察

3.1. 1:簡単 な例

3. 2. 2:安定 な解が存在 しない例

3. 3. 3:∫(cl)‑ ¢≠†1,2)の場合 (囚人 の ジ レンマ) 3. 4. 4 :∫(cl)ll,2)の場合 (チキ ンゲーム)

3. 5.例 5 :R osENTHALの例 ([2]よ り) 3. 6. 6 :ccが複数 あ る場合

3. 7.考察 4.関連す る研究 5.ま とめ

6.参考文献

1.はじめに

非協力ゲームは与え られた問題 に対 して,ある意味で安定な状況を見つける 理論である。 この安定性の1つの解釈 と してNash均衡が有名であるが,状 況によってはそれが要求す る安定性が強す ぎるために,それを単純に適用 して も,現実を十分説明 しているとは言い難い場合がある。例えば,有限回繰返 し 囚人の ジレンマゲームにおいて,協調行動が実現す る戦略の組みが Nash 衡 となるためには,一方のプレイヤーがいっ も 「しっぺ返 し戦略」を使 う不確

95

(2)

定性をモデルに組み込む,等の細工を しなければな らない。 しか し,Nash 衡の定義 「自分以外の他のプ レイヤーが Nash均衡で指定 された戦略を とっ

ている時, 自分だけが違 う戦略を とって も有利 にはな らない。」の下線部を再 考 し, 自分が戦略を変える時,相手 も昆瞳旦;華 略を変える可能性を考慮すれば 1回きりの囚人のジレンマゲームにおいて も,ある条件の もとで,共に協調行 動を とるのが安定であることを [1]で示 した。本稿においてはこの考えを発 展 させて,純粋戦略におけるNash均衡 より緩い安定性 について考察 してみ る。ゲーム論的状況において,何が起 こるか又は何が望ま しいかが皆 目見当が つかない場合 もあるが‥あ らか じめ望ましいと思われる結果があ りそれを正当 化す る根拠に欠けている場合 も多 く存在す る。本稿の目的は先験的に望ま しい と考え られる (例えば,なるべ くパ レ‑ 卜最適な利得を与える)戦略の組みを 正当であるとする安定性を考察す ることである。

2.プ レイヤーが 同時 に手 を変 え る可能性 を考慮 に入れ た安定性 戦略形で与え られた有限2人ゲームIl‑ (N,C,a)を考え る。ただ し,N

(1, 2)はプ レイヤーの集合,C‑CIXC2 Ctはプ レイヤー iの純粋 戦略の集合,a‑(u l, u2)ulはプ レイヤー iの利得関数 (ui.・C‑R)

ある。また,対応 T :C‑CをT(C)‑Tl(C)×T2(C), T7(C)‑

(

(dLmax u7(e,i)‑ut(d,i))ifmaxe zLi(e,i)>ui(C) (CiI ifmaxe ui(e,i)‑ui(C) とし,I(C)‑ (ilc7年Ti(C))と定める。すなわち,今,戦略の組みC‑(cl,C2)をみ んなで利用 している時, 自分一人だけ変わることにより利得が本当に増加す る 場合 はその戦略を,そ うでない場合 は元の戦略を取 るようにす るのが T(C) ある。 この時,元の戦略 と異な った戦略を取 るプ レイヤーの集合がJ(C)であ J(C)‑¢であることとCが純粋戦略Nash均衡であることとは同値である0 さて,プレイヤーが同時に手を変える可能性を考慮 に入れた安定性を次のよう に定義する :

純粋戦略の組みC*‑ (C,C芸)が追随定数の組み8‑ (81,82)に関 して安

(3)

純粋戦 略 におけ るNash均衡 よ り緩 い安定性 97 定である。」とは

J(C*)≠¢な らば,

tch)(cOC*,ck'1∈T(ck))か ら次のよ うに して極限値 C∞を得 る。I(cl)

N な らば Ccl,I(c l)≠N な らば列fckHこ無限回現われ る項を C∞とする1)0

この極限値cmに関 して, 全てのi∈.Ⅳに対 して,

uZl(C*)etui(C瓜)+(1‑et)uL(cT,C空ll) となること

(ST)

である。

C*がNash均衡な らば,I(C*)‑少なので上記の定義の仮定の部分を満足 し ないので次の性質が成 り立つ

性質 1.「Nash均衡 は任意の追随定数の組みに関 して上記の意味で安定であ る。

すなわち,上記の安定性 はNash均衡 よ り緩い安定概念である。 この安定 性の意味は次のようである。今,必ず しもNash均衡でない C*を正当化 した 。C∈T(C*)(CC*)が存在すれば,i∈I(C*)であるプ レイヤー iはciに変 更 しようとす る動機が存在す る。 この動機を何 とか して抑止 したいのである。

そ こで思考過程の列 (ck)(cO‑C*,ck'1∈T(ck))と同時に手を変える可能性 を以下のよ うに考慮す る。 この列の極限値 C∞が各 プ レイヤーの脳裏に残 るで あろう 上記の思考過程により,各プ レイヤー iは自分が手を変えるな ら,結 局,C;Oに変更す ることになるだろ う。そ してその際,他のプ レイヤー も同時

に手を変える可能性を考慮す る。すなわち, 自分だけが変更す る確率を1‑81 (eiは追随定数),他 の全ての プ レイヤー も同時 に変更す る確率を elと見積 もっているとする。 自分の手を変更 しようとして も有利ではないとい う条件が 上式 (ST)である。

自分が戦略を変えようとす ると,自分以外の全てのプ レイヤーも同時に戦略 1) このよ うにccoを決める理由は次節で述べ る.

(4)

を変えよ うとす る確率が正 と考え られ る場合 は存在す るか ?また,存在す ると した らどのよ うな場合か ?

通常,われわれ は結果 として生 じる利得が各 プ レイヤーへ支払われ ると仮定 しているので,頭の中で行 う思考過程 において も同様 に各 プ レイヤーが独立 に 行動を行 うと簡単 に仮定 している。 しか しなが ら,人間は社会的動物であ り関 係 の渦中にあって行動を決定す るので,事後 に生 じる結果 とあま り直接 に関係 な く,事前 の思考過程で は同時に戦略を変更す る可能性 を案外考えていると忠 われ る。 このよ うな思考過程 における同時に戦略を変更す る可能性が意思決定 に大 きな影響を与え る場合, さ らに,C*が社会 的 に望 ま しい性質 を持 ってい て,その実現が望 まれ る場合 な らば,C*か らの逸脱 を抑止 を促すための思考 フ レームワ‑クとして,上記の同時に戦 略を変更す ると考え るのは無理 な こと で はない と思われ る。

3.例 と考察

この節で は色 々な例を通 じて前節で述べた安定な解を求め る。われわれの立 場 は先験的に2人 のプ レイヤーにとって望 ま しい と思われ る純粋戦略の組みが 安定であ るのはどうい う場合かを調べ ることである。 ここで先験的に望 ま しい とは,明確 に限定的な表現方法ではないが,な るべ くパ レー ト最適でかつ両 プ レイヤーの利得の差がな るべ く小 さい ものを意味す る。

3.1. 1:簡単な例

表 1 先 ず,表 1で与 え られ た ゲ ー ム プ レイヤー2 を考 察 す る。パ レー ト最 適 な利得 プ レイヤー 1

の組 み (4, 5)を与 え る戦 略 の 組 み(U,L)を正 当化 したい。(U,L)

Nash均衡で はない。C*‑(U,L) と し,思考過程 の列 ich)(cO‑C*,c k十1∈T(ck)) を求 め ると,cl‑(D,L),

C2‑ C3‑・‑‑ (D,R)((D,R) Nash均衡であ ることによ る),I(cl)‑(2) とな るので,思考過程 は C00‑ (D,R)で停止す る. 条件 (ST)に代入 して,

(5)

純粋戦 略におけるNash均衡 よ り緩 い安定性 99 u(C*)‑(4,5)≧(381, 282)+(5(1‑81),4(1‑82))

これを解 いて,81≧与, 0≦82≦ 1とな る。すなわち, プ レイヤー1が 自分が 手 を変え るときに相手 も手を変え る確率を50%以上 と見積 もっているな らば,

(U,L)は安定である。

3. 2. 2:安定な解が存在 しない例 表 2

プレ 2

プ レイヤー1

次 に,安 定 な解 が存 在 しな い表 2 の ゲ ー ム を 見 て み る。 今, C*‑ (U,L)と して話 しを進 め る。

他 の戦 略 の組 み合 わせ で も同様 で あ る。思考過程 の列 (ckI(cO‑C*, ck'1∈T(ck))を求 め ると,cl‑(U,R)(I (cl)‑ (1)),C2‑(D,R),C3

(D,L),C4‑cO,C5‑cl, ・ ・ ・とな る。 思 考 過 程 は (U,L),(U,R), (D,R),(D,L)の中の どれで停止す るか解 らないので,全ての可能性 を考 慮 に入れ ることにす る。すなわち,Cの‑(U,L)または(U,R)または (D,R)

または (D,L)とおいて,条件 (ST)に代入す ると,

(1, ‑ 1)≧(81, ‑82)+((1‑81), ‑(1‑82))これは常 に成立 (1, ‑ 1)≧(‑81,82)+((1‑81),(1‑82))これ は常 に不成立 (1, ‑ 1)≧(81, ‑82)+(‑(1‑81), (1182))より82‑ 1 (1, l l)≧(‑el,e2)+(‑(1‑81),(1‑82))これ は常 に不成立

これ ら4つの不等式 の少 な くとも1つが成立 しないので (U,L)は安定で は

ない。

3. 3. 3:∫(cl)¢≠(1, 2)の場合 (囚人の ジレンマ) 3 囚人 の ジ レンマ

プ レイヤー2 プ レイヤー1

てサ ポー トしたいので C*‑(C,C)と し,

3の囚人 の ジ レンマゲ ームを 考 え る。パ レー ト最適 で あ る利得 の組 み (5, 5)が 両 プ レイ ヤ ー に と って望 ま しい と思 われ る こで,協 調 行動 (C,C)を解 と し 思考過程 の列 (ckl(cO‑C*,ck十1

(6)

T(ck))を求 め ると,(D,D) Nash均衡 なので,cl‑C2‑‑(D,D) な る。すなわち,思考過程 はC∞‑(D,D)で停止す る。 これを条件 (ST) 代入す ると,zL(C*)‑(5, 5)≧(81,82)+(6(1‑81),6(1‑82))よりei

Ⅰ(i 1, 2)となる。す なわち,両 プ レイヤー共 自分が手を変え る時相手 も同時 に手 を変え る確率 を20%以上 であ ると見積 もって い るな ら,協調行動

(C,C)は安定である。

3. 4. 4:∫(cl)ll,2)の場合 (チキ ンゲーム)

4 チキ ンゲ ーム 4で 与 え られ て い る チ キ ン プ レイヤー2 ゲ ー ムを考 察 す る。パ レー ト最適 プ レイヤー1

で あ る利 得 の組 み (4, 4) が両 プ レイヤー に とって望 ま しい と思 われ るので,C*‑ (C,C)とす る。

思考過程の列 ichl(cO‑C*,ck'1∈T(ck)) を求 めると,先ず,cl‑(B,B) な る。∫(cl) ll, 2)なので思考過程を ここで停止 し,C00‑cl‑(B,B) とす る。 これ は2つの思考過程 tcO,cl) と (cl,C2,・)の関連 を意味付 け ら れなか らで あ る.a(C')‑(4,4)≧ (‑3e1, ‑ 382)+(6(1‑81),

6(1‑82))よ りEi≧%(i 1, 2)とな る。すなわち,両 プ レイヤー共 自 分 が手 を変 え る時相 手 も同時 に手 を変 え る確 率 を22.2%以 上 で あ る と見積

もっているな ら,(C,C)は安定である。

(7)

純粋戦 略にお けるNash均衡 よ り緩い安定性

3. 5. 5:Rosenthalの例 ([2] より)

101

I R A .⊥ R i r⊥ R ま ,⊥ R i ,⊥ R ヱ r 10 D T d T , T d T , T d T , T d T , T d 10 0 1 2 1 4 3 6 5 8 7

d rd rrd rrrd rrrrd rrrrr

D ^且 ,A 0,

A

0,

A

0,

』 ̲

0

, ̲ 旦

0

, ̲ 良

RD l‑1, 3 ^1 , 2 2, 2 2, 2 2, 2 2, 2

RRD ‑1, 3 l l, 5 ^1 , 4 4, 4 4, 4 4, 4

RRRD ‑1, 3 1, 5 l3, 人且 , 6 6, 6 6, 6

RRRRD ‑1, 3 1, 5 3,‑7 l 5, 9 ∧且, 8 8, 8

次に,図 1で展開形が与え られているRosenthalの例を考察す る。始点 は 左端のノー ドでプ レイヤー 1と 2が交互 にD(d)かR(r)を選ぶ。 D(d)を選 べばその時点でゲームは終わる。 これを戦略形で表わ したのが表 5である。図 1よ り唯一の部分ゲーム完全 Nash均衡 は 「常 にD(d)を選ぶ」であ り,義 5 (D,d)に対応す る。Rosenthalの考 えは次節で述べ るとして, ここで はパ レー ト最適な利得の組み(10,10)を与え る戦略の組み(RRRRR,rrrrr) 安定である条件を求めてみよう 思考過程の列 ickf(cO‑C*,ck'1∈T(ck))

を求めると,次のようになる (∫(cl)‑ (1)であることに注意)。

C*‑(RRRRR,rrrrr),cl‑(RRRRR,rrrrd),

C2‑(RRRRD,rrrrd),C3‑(RRRRD,rrrd),

(8)

C4‑(RRRD,rrrd),C5‑(RRRD,rrd),

C6‑(RRD,rrd), C7‑(RRD,rd), C8‑(RD,rd),

C9‑(RD,d),clO‑cl1‑‑‑(D,d), C∞‑(D,d)

u(C*)‑(10,10)≧(081, 082)+(0(1‑81), 3(1‑82)) この不等式 は常 に成立す る。

これ は任意の追随定数 に対 して,すなわち,同時に手を変え る確率をどのよ う に見積 もって いよ うとも (た とえ 0であ って も),(RRRRR,rrrrr)は安定 であることを示 している。

3. 6.例6 :C∞が複数 ある場合

6

プ レイヤー 2

プ レイヤー 1

a b C d

A ‑ .0, 3 0,2 ‑1, 0 B 2, 0 :1, 0 0, i . ‑1, 0 C 2, 0 lo, 1 1, Ov ‑1, 0 D 0,1 0,‑1 0,‑10

, 0

最後 に,表 6で与 え られ たゲームを考察す る。パ レー ト最適 な利得 の組 み (3,2)を与え る戦略の組み (A,a)が安定である条件を以下で求める

C*‑(A,a),cl‑(A,b),cl‑(,b),C3‑(,C),

C4‑(C,C),C5‑(C,ち),C6‑ C2,‑

C∞‑(B,b),or(,C),or(C,C),or(C,b)

u(C*)‑(3, 2)≧(8 1, 0)+(2(1‑81), 3(1‑82))‑82≧与

u(C*)‑(3,2)≧(0,82)+(2(1‑81),2(1‑82))常 に成立 zL(C*)‑(3,2)≧(81, 0)+(2(1‑81),2(1‑82))常 に成立 zL(C*)‑(3,2)≧(0,82)+(2(1‑81),3(1‑82))‑e2≧与

なわち,プ レイヤー2が同時に手 を変え る確率を50%以上 と見積 もっている な らば, (A,a)は安定である。

(9)

純粋戦略におけるNash均衡 よ り緩 い安定性 103 3. 7.考察

以上の例を参考に しなが ら本稿で述べている安定性の概念の妥当性 について 検討 してみる。

先ず,同時に手を変える可能性に関 して考えてみ る。われわれの立場 は 「自 分が手を変え ることにより他のプ レイヤーの 自律性を脅かす何かが伝播 し,そ の結果,ある頻度で他のプ レイヤー も手を変える」 と主張す るものでは決 して ない。両プ レイヤーにとって望 ま しいと思われる戦略の組みか ら逸脱 したい理 由は, 自分だけが手を変えれば自分の利得が増加す る (多分相手の利得 は減少 す る)か らであるが,相手 も同様な状況にあるので 自分だけが手を変え られ る

と考え るのは甘す ぎる。 この考えを直接かつ素朴に表現 したのが同時に手を変 える可能性である。特 に,社会的に望 ま しい と思われる状態か らの逸脱 に関 し ては, 「そ うしたいが相手 も同 じことを考えているだろうか ら,やはり止めて おこう」 とい うタイプの思考で対処 していることが多いのではないだろうか ?

このよ うに同時に手を変える可能性を考慮す るのは社会的に望ま しいと思われ る状態か らの逸脱を抑止す るときによ く使われ るパ ター ンの‑表現 と見なせ る か らであ り,手を変えようとす る意思が伝播す る可能性を考えているのではな い。

次 に,思考過程の列 fck)(cOC*,ck'l∈T(ch))か ら求 め る極 限値の求 め 方に関 して考えてみ る。

1と例 5のよ うに,∫(C*)‑(1)ori2),∫(C∞)‑ ¢となる場合,思考過 程 は各 々のプ レイヤーが交互 に自分 に有利 になるよ うに手を変えていき,最終 的にNash均衡 に落 ち着 くことになる。C*か ら逸脱 したい誘惑を次 々に辿 っ て来て,最終的に C∞が得 られた ことになるので十分 に納得 出来 る求め方であ

る。

次 に例 3の囚人の ジレンマゲームのよ うにJ(C*)‑il,2)であるがJ(cl)

‑I(C00)‑ ¢となる場合 も,C*か ら逸脱 したい誘惑を1回辿 るだけで,最終 的な C00が得 られた ことになるので十分 に納得 出来 る求や方であるo

4のチキ ンゲームのようにJ(C*)‑∫(cl)‑(1, 2)とな る場合,最初の恩

(10)

考過程 (co, C*,cl)のclが実現す るため には, 同時 に手 を変 え ることが 確率 1で成立 していなければな らない。われわれは同時に手を変え る確率を必 ず しも1と仮定 して いないので,この clを出発点 とす る思考過程tcl,C2,‑) を最初 の fcO‑ C*,cli とつなげるの はあま り納得 出来 ることで はない。 そ こ で この場合 はclで思考過程を停止 し,C‑ clとした。

最後 に例 6のような場合であるが,思考過程の続 き方 は例 1,例 5と同 じな ので問題 はないであろ う C∞を思考過程 に無限回現 われ る全ての項 に したの は,全ての場合 に条件 (ST)が成立すれば C*か ら逸脱す る動機を抑止で きる であろ うと思われ るか らであ る。

7

プ レイ ヤー2 さて,最後 に条件 (ST)を検討 プ レイヤー1

u≧elu7+(1‑81)a

す る。思 考過 程 の最 初 と最後 だ け を書 いたのが表 7で あ る。 これか

ら条件 (Sr)

(ST) zL82u冨+(1‑82)b

すなわち,a;がzL了とaの内分点以上であ り,かつ u芸がu言とbの内分点以 上で あ ることを意味す る。 (,u芸)がパ レー ト最適で あ る場合 には不等式 u言>u冒,u芸>u言の少 な くとも一方 は成立 す る。 もし,両方 の不等式 が成立す れば十分 1に近 い et(i‑ 1, 2)で条件 (ST)が成 り立つ ことになる。言 い 換え ると u芋>u冒,u芸>u言が成立 している場合 に本稿 で述べている安定性が活 躍す るのである

C∞‑ clの場合 は,u苦a,u芸<bの少な くとも一方が成立 してい るので,秦 (ST)が成 り立っためには81,82の少な くとも一方又 は両方が 1に近 くな ければな らない。C≠ clの場合 はu芋と a,u芸とbの大小関係 は不明で あ り, 極端 な場合,例 5のよ うに条件 (ST)が無条件 に成立す ることが あるO これ

は思考過程を先 に考え,後で同時に手 を変え る可能性 を考慮 しているか らであ るが,上 に述べたよ うに C*か らco‑の思考過程 は直線的な ものであるので,

(11)

純粋戦 略 にお け るNash均衡 よ り緩 い安定性 105 その後同時に手を変える可能性を考慮 して も十分納得出来 ると思われる。言い 換えれば,例 5のように u;≧u,u≧u言とu芋a,u≧bが成立 し, C∞が Nash均衡 となる場合 (結局,条件 (ST)が無条件 に成立す る) も本稿の安 定性が活躍する。

4.関連する研究

本節では本稿に関連する他の研究について少 し述べる。

0 ‑1 2 1 4 3 6 5 8

0 3 2 5 4 7 6 9 8

利益 の差がDの時 に有利 な方 の手 を取 る確率 は min(1,0.5+OAD )

2

7

Rosenthalの例5においてRosenthalは以下のように考えることにより両 プレイヤーがR(r)を取る可能性を正当化 している。プ レイヤーは利得が大 き い方を必ず しも確率 1で選ぶのではな く,利得の差が D の時,有利な方の手 を取 る確率をmin(1,0.5+0.4D)と仮定するのである。例えば,1番右端 のノー ドでプレイヤー2は利得の差がD‑ll‑10‑ 1なのでdを確率0.9r を確率0.1で取 る。 これが与え られるとプ レイヤー11番右のノー ドでR とった時の期待利得 はプレイヤー 1には0.9*7+0.1*10‑7.3,プ レイヤー 2には0.9*11+0.1*10‑10.9となる。同様 に計算を行 うと図2が得 られる。

プレイヤー1の第 1手番 と第2手番ではRを確率 1で取 り,プ レイヤー2の第

1手番 と第2手番で もrを確率0.93で取 るようになっている。

(12)

3 Myersonの例

Myerson[3]はRosenthalと類似のゲームに図3のような細工を施 して同 様な結果を得ている。左端の白丸のノー ドか らゲームは始まる。プ レイヤー1

2Rosenthalの例 と同様のゲームを行 うが,プ レイヤー2はタイプ1 タイプ2であり,タイプ2rLか取 ることが出来ない。プ レイヤー2は自分 のタイプを知 っているが,プ レイヤー1は知 らない095%の確率でプ レイヤー 2はタイプ1である。 このゲームのsequentialequilibrium は図 3のよ う になる。プレイヤー 1の第 1手番ではRを取 り,第2手番では20%の確率でR を取 る。タイプ 1は第 1手番では確率 4/19rを取 る。 もし,100%の確率 でプレイヤーがタイプ 1であるな ら,両プ レイヤー共いっ もD(d)を取 るのが sequentialequilibrium である。 しか し, このよ うに相手が いっ もrを取 る可能性が少 し (5%)で もあればRを取 るのが有利になる。

最後 に,表8を例に して,Muto[4]の alternating‑movepreplaysにつ いて述べ る。 この場合 も (C,C)が正当化 され る プ レイヤーはゲームを始 める前にどの手を取ろうとするかを交互 に宣言する。 ここではプ レイヤー1 ら宣言を開始す ると仮定する。前回に行 った自分の宣言 と違 う宣言をすれば,

(13)

純粋戦略におけるNash均衡 よ り緩 い安定性

8 チキ ンゲーム 2 プ レイヤ‑ 2 プ レイヤー1

107

相手の プ レイヤーが次 に宣言 を行 前 回の宣言 と同 じ宣言 を した 場合 に初 めてゲームが行 われ る。

各 プ レイヤーが最後 に宣言 した手 を取 りそれ に対応す る利得 を貰 い ゲームは終わ る。もし,前回に行 った自分の宣言 と違 う宣言を し続 けるな らば, ゲームを行 うことが出来ず,両プ レイヤーとも0の利得を得 ると仮定す る。表

8は利得を 0以上 とす るために表 4に 3を加えた ものである。

1 2 3 4 5 取 る手 利得

a プ レイヤー1 C C C 7

プ レイヤー2 C C 7

b プ レイヤー1 B C C 1

プ レイヤー 2 B B B 6

C プ レイヤー1 B C B ?

0

例えば,表 9 (a)ではプ レイヤー1が第3期に第 1期 と同 じCを宣言 し たので, ここでゲームにおいて取 る手が決 ま り,プ レイヤー1Cをプ レイ ヤー2Cを取 り,利得 7を貰 う。(b)ではプ レイヤー2が第 4期に第2 と同 じBを宣言 したので, ここでゲームにおいて取 る手が決 まり,プ レイヤー 1Cをプ レイヤー2Bを取 り,利得 16を貰 う。 (C)ではどち らのプ レイヤ‑も前回 と同 じ宣言を しないので,利得 0を貰 う Mutoは次の4つの 性質を満足す る戦略(CMPE :conservativeMarkovperfectequilibrium) を求めている。2)

1.部分ゲーム完全である

2)詳 しい定義は [4]参照。

(14)

2.どの部分ゲームにおいて も弱支配 されない

3.定常である (両プレイヤーの最近の宣言にのみ依存する) 4.conservativeである

表10

最 近 の プ レイ 最 近 の プ レイ CMPE にお け CMPE に お け ヤ ‑ 1の 宣 言 ‑ 2の 宣 言 るプ レイヤー 1 るプ レイヤ ‑ 2

C C ̀C C

C B B B

B C B B

B B C C

C C

B B

8CMPEを求めると、表10のようになる。これを実行すると表9(a) となり, (C,C)が実現す る。

5.まとめ

本稿では2人非協力ゲームにおいて,同時に手を変え る可能性を考慮 に入 れ,純粋戦略におけるNash均衡 よりも緩い安定性 について考察を行 った。

単純 にNash均衡を通用す ると問題がある例 に本稿で述べている安定性を適 用 し,更に,関連す る研究に関 して も言及 した。望ましいと思われる戦略の組 みを正当化する試みはこのように色々あるが,本稿の特徴 は同時に手を変える 可能性を考慮 した点である。

(15)

純粋戦 略 にお け るNash均衡 よ り緩 い安定性 109

[1]行方常幸 「プ レーヤーの繋が りと囚人の ジレンマ」小樽商科大学 『商学討究』

Vol.44,193‑208(1994).

[2]Rosenthal,R.W.,GamesofPerfectlnformation,Predatory Pric‑

ing and the Chain‑Store Paradox,Journalof Economic Theory 25,92‑100(1981).

[3]Myerson,R.B.,GameTheory.HavardUniversityPress,(1991). [4]Muto,S.,Alternating‑MovePreplaysandvN‑M StableSetsinTwo

Person Strategic Form Games. Center for Economic Research,

(1993).

図 3 Myer s on の例

参照

関連したドキュメント

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

取締役会は、事業戦略に照らして自らが備えるべきスキル

DX戦略 知財戦略 事業戦略 開発戦略

ヒュームがこのような表現をとるのは当然の ことながら、「人間は理性によって感情を支配

オーディエンスの生徒も勝敗を考えながらディベートを観戦し、ディベートが終わると 挙手で Government が勝ったか

7.自助グループ

(自分で感じられ得る[もの])という用例は注目に値する(脚注 24 ).接頭辞の sam は「正しい」と

子ども・かがやき戦略 元気・いきいき戦略 花*みどり・やすらぎ戦略