• 検索結果がありません。

人非協力非零和ゲーム

N/A
N/A
Protected

Academic year: 2021

シェア "人非協力非零和ゲーム"

Copied!
43
0
0

読み込み中.... (全文を見る)

全文

(1)

意思決定科学: ゲーム理論2

情報学部 堀田敬介

2012/11/19,Mon.

(2)

Contents

2

人非協力非零和ゲーム

定義:ゲームのルール,双行列

例:囚人のジレンマ,面会ゲーム,恋人達のジレンマ,

最適応答,

Nash

均衡点

Nash

均衡点と線形相補性問題(

LCP

戦略形ゲームの社会・経済問題への応用例

(3)

Example

プレイヤーは

A

B

2

各プレイヤーは,独立に自分の戦略を決定

(非協力)

プレイヤーの利得の和は一定とは限らない

(非零和)

純粋戦略の数は有限

2 人非協力非零和ゲーム

A

B sB1 sB2 sA1 (2, 3) (-1,-2) sA2 (-2,-1) (1,1)

A

B

の利得表

N={A, B}

Si={si1, si2}, (i=A,B)

fi : SA×SB→ R, (i=A,B)

fA (sA1, sB1) = 2 + fA (sA1, sB2) = -1 + fA (sA2, sB1) = -2 + fA (sA2, sB2) = 1 +

fB (sA1, sB1) = 3 ≠0 fB (sA1, sB2) = -2 ≠0 fB (sA2, sB1) = -1 ≠0 fB (sA2, sB2) = 1 ≠0

SA={sA1, sA2}, SB ={sB1, sB2},

(4)

2 人非協力非零和ゲーム

双行列ゲーム

利得関数

利得行列

) , ( : )

, (

) ,

( )

, (

) ,

( )

, (

) ,

(

) ,

( )

, (

) ,

(

2 2

1 1

2 2

22 22

21 21

1 1

12 12

11 11

B A b

a b

a b

a

b a

b a

b a

b a

b a

b a

mn mn

m m

m m

n n

n n

ij B

A B ij

B A

A s s a f s s b

f j

i i j i j

, , ( , ) , ( , ) ]

[

],

[aij bij

B

A

プレイヤーBの戦略(n個)の利得(右側)

プレイヤーA の戦略(m個)

の利得(左側)

双行列 和が零(一定)という条件はない(非零和)

(5)

2 人非協力非零和ゲーム

例1:恋人達のジレンマ

battle of sexes

ある一組のカップルがデートをしたいと思っている

男性は野球観戦を希望し,女性は映画鑑賞がしたい

各々が好きなものを見るより一緒にいることの方が大事

女 野球 映画

野球

(2,1) (-1,-1)

映画

(-1,-1) (1,2)

性の戦い,男女の戦い,

逢引きのジレンマ,…

互いに支配戦略は持たない

ミニマックス原理に従うと,互いにどちらの戦略でも良い?

(または各戦略のマックスが大きくなる方を選ぶ!?)

1 min

max ij

j

i a

1 min

max ij

j

i b

(6)

2 人非協力非零和ゲーム

例1:恋人達のジレンマ

battle of sexes

零和ゲームの時と同じ方法で,混合戦略で期待利得最大化すると

野球 映画 野球 (2,1) (-1,-1) 映画 (-1,-1) (1,2)

p1 p2

q1 q2



2 2 1

2 2

1 1

1

2 2 1

2 2

1 1

1 2

) ,

( , ) 2 (

q p q

p q

p q

p E

q p q

p q

p q

p E

B

A p q

q p



1 2

)) 1 , 0 ( ,

( ,(1,0)) 3 1 (

1 1p E

p E

A

A p

p



2 3

) ), 1 , 0

((1,0), ) 2 1 ((

1 1q E

q E

B

B q

q

5 ) 1 , ˆ ( ˆ 5, ) 1 , ˆ ( ˆ , 5) , 2 5 (3 5), , 3 5 (2 ˆ)

ˆ,

(

p q p q

q

p EA EB

ところが

5 ) 1

, ˆ

( p1 EA p q

5 ) 4

ˆ,

( q1 EB p q

B をとるならA ではなく(1,0)にする方が 期待利得が高くなる!

qˆ pˆ A をとるならB

ではなく(0,1)にする方が

期待利得が高くなる!

qˆ pˆ

均衡しない

つまり,相手が純粋戦略を取ってきたときだけの自分の混合戦略を考えて 期待利得を求めるやり方では,均衡解を求められない

(7)

最適応答対応

best response correspondence

Bの戦略 に対するAの最適応答の集合

を,プレイヤーAの最適応答対応とよび,

を,プレイヤーAの最適応答集合とよぶ

Definition

最適応答と最適応答対応

最適応答

best response

プレイヤーAの戦略 が,プレイヤーBの戦略 に対 する最適応答であるとは,以下が成り立つこと

2 人非協力非零和ゲーム

A

A S

s sB SB

) , ( max

) ,

( p q p q

p A

A E

E

) ,

( max

) ,

( A A B

S B s

A

A s s f s s

f

A A

純粋戦略の場合

混合戦略の場合

B

B S

s

} {

( , ) max ( , )

)

( A A B

S B s

A A A A

B

A s s S f s s f s s

R

A A

} {

( A, B) A A( B), B B

A s s s R s s S

D

} {

( , ) max ( , )

)

(q p p q p q

p A

A

A E E

R

純粋戦略 の場合 混合戦略

の場合

2人零和ゲームでは,

ミニマックス原理は 最適応答原理に帰着

最適応答原理

(8)

プレイヤーAの(純戦略での)最適応答 sB1 → max{7,8,4} = 8

sB2→ max{0,6,3} = 6 sB3 → max{5,2,6} = 6

最適応答と最適応答対応

プレイヤーA,Bが各々最適応答をとる場合,その組の集合は となる

2 人非協力非零和ゲーム

B

A D

D

D :

sB1 sB2 sB3 sA1 (7,7) (0,8) (5,5) sA2 (8,0) (6,6) (2,7) sA3 (4,5) (3,1) (6,2)

例:

} { ) (

} { ) (

} { ) (

3 3

2 2

2 1

A B

A

A B

A

A B

A

s s

R

s s

R

s s

R

} {( A2 , B1 ),( A2 , B2 ),( A3, B3 )

A s s s s s s

D

プレイヤーBの(純戦略での)最適応答 sA1→ max{7,8,5} = 8

sA2→ max{0,6,7} = 7

sA3→ max{5,1,2} = 5 ( ) { } } { ) (

} { ) (

1 3

3 2

2 1

B A

B

B A

B

B A

B

s s

R

s s

R

s s

R

} {( A2 , B3 ),( A1, B2 ),( A3 , B1)

B s s s s s s

D

互いに最適応答なら均衡する

D なら均衡)

より,

純粋戦略のみでは 均衡しない

D

(9)

2 人非協力非零和ゲーム

Definition Nash

均衡点

Nash equilibrium point

(混合)戦略の組 が次の条件を満たすとき,

Nash

均衡点とよぶ

*)

*, ( p q

q q

p q

p

p q

p q

p

)

*, (

*)

*,

( *, *) ( , *) (

B B

A

A E

E

E E

Theorem 1

(混合)戦略の組 が互いに最適応答であるならば

Nash

均衡点であり,逆も成り立つ.即ち,

Nash

均衡点の集 合を

E

とすると,

B

A D

D

E

ˆ) ˆ, (p q

Nash均衡点は,零和ゲー ムの均衡点(鞍点)を含む

一般的な概念

*)

*, ( p q

Theorem 2

(混合)戦略の組 が

Nash

均衡点であるた めの必要十分条件は

*)

*, ( p q

n j

s E

E

m i

s E

E

j i

B B

B

A A

A( *, *) ( *, ) 1, , , ,

1

*) ,

(

*)

*, (

p q

p

q q

p

Bq*をとるならAp*がベスト Ap*をとるならBq*がベスト

(10)

2 人非協力非零和ゲーム

2

人非協力非零和ゲームの

Nash

均衡点

A, B

) ,

( ) ,

(

) ,

( )

, (

22 22

21 21

12 12

11

11

b a

b a

b a

b p1 a

p2

q1 q2



1 ,

0 ,

00, 0, 1

2 1

2 1

2 1

2

1 q q q

q

p p

p p

22 1

1 1

1

22 1

22 21

1 12 22

1 1 12

22 21

11

22 1

1 1

1

22 1

22 21

1 12 22

1 1 12

22 21

11

ˆ ~ ˆ)

( ) ( )} ( ) ( )

) {(

, (

ˆ ~ ˆ)

( ) ( )} ( ) ( )

) {(

, (

b q

c p

c q

p c c

b q

b b

p b

b q

p b

b b

b E

a q

r p

r q

p r r

a q

a a

p a

a q

p a

a a

a E

T B

T A

Bq p

q p

Aq p

q p

プレイヤーA,Bが混合戦略をとった際の期待利得





)) 1 , 0 ( , ( )

,

( , ) ( ,(1,0)) (

) ), 1 , 0 ((

) ,

( , ) ((1,0), ) (

p q

p

p q

p

q q

p

q q

p

B B

B B

A A

A A

E E

E E

E E

E

Theorem 2 より, E

Nash均衡点

(11)

2 人非協力非零和ゲーム

2

人非協力非零和ゲームの

Nash

均衡点

プレイヤーAの最適応答について







0 ˆ}

ˆ)

{( ˆ) ˆ}(1 ) 0 {(

~ ˆ ~

ˆ) (

ˆ ~ ˆ)

~ ( ) ˆ

( ˆ

) ), 1 , 0 ((

) ,

( , ) ((1,0), ) (

1 1

1 1

22 1

22 1

1 1

1

22 1

1 22

1 1

1 1

p r q

r r

p r

q r r

a q

r a

q r p

r q

p r r

a q

r r q

r r

a q

r p

r q

p r r

E E

E E

A A

A

A p q q

q q

p

1

1 ˆ 0

ˆ)

(r r q r

となる

q



0 0 1

1

p 1

p

1

1 ˆ 0

ˆ)

(r r q r

となる

q

1

1 ˆ 0

ˆ)

(r r q r

となる

q

 

任意 任意

: : 1

1

p 1

p



0 0 1

1

p 1

p

故に,pRA(q) となるためには,

1 1 p

: 任意

p1 1 0 p

(12)

2 人非協力非零和ゲーム

2

人非協力非零和ゲームの

Nash

均衡点

プレイヤーBの最適応答について







0

~} ˆ)

{( ˆ) ~}(1 ) 0 {(

~ ˆ ) ˆ

( ˆ

ˆ ~ ˆ)

~ ( ) ˆ

( ˆ

)) 1 , 0 ( , ( )

,

( , ) ( ,(1,0)) (

1 1

1 1

22 1

22 1

1 1

1

22 1

1 22

1 1

1 1

q c p

c c

q c

p c c

b p

c b

q c p

c q

p c c

b c

p c p

c c

b q

c p

c q

p c c

E E

E E

B B

B

B p q p

p q

p

1

1 ~ 0

ˆ)

(c c p c

となる

p



0 0 1

1

q 1

q

 

任意 任意

: : 1

1

q 1

q



0 0 1

1

q 1

q

故に,q RB( p) となるためには,

1 1 q

: 任意

q1 1 0 q

1

1 ~ 0

ˆ)

(c c p c

となる

p

1

1 ~ 0

ˆ)

(c c p c

となる

p

(13)

2 人非協力非零和ゲーム

2

人非協力非零和ゲームの

Nash

均衡点

例:

sB1 sB2 sA1 (6,5) (2,7) sA2 (3,4) (6,1)

4 ˆ 7

ˆ)

(r r q1 r q1 p1

p2

q1 q2





3 1

~ˆ 154 74 16 3 6

~ˆ 663 32 34

22 21

12 22

21 11

22 21

12 22

21 11

b b

c

b b

c

b b

c

a a

r

a a

r

a a

r

0 7 :

4 7 : 4

1 7 :

4

1 1

1 1

1 1

p q

p q

p q

任意



0 5 :

3 5 : 3

1 5 :

3

1 1

1 1

1 1

q p

q p

q p

任意

3

~ 5 ˆ)

(c c p1 c p1

p1 q1

0 1

1

4/7

3/5

プレイヤーA の最適応答 プレイヤーB

の最適応答 Nash均衡点

(14)

2 人非協力非零和ゲーム

sB1 sB2

sA1 (6,5) (2,7) sA2 (3,4) (6,1)

0

0.25

0.5

0.75

1 player A

0

0.25 0.5

0.75 1

player B 2

3 4 5 6 Exp

0

0.25

0.5 player A 0.75

EA(p,q)

0

0.25

0.5

0.75

1 player A

0

0.25 0.5

0.75 1

player B 0

2 4 6 Exp

0

0.25

0.5 player A 0.75

EB(p,q)

EA(p,(4/7,3/7))=30/7 EB((3/5,2/5), q)=23/5

p1 q1

0 1

1

4/7

3/5

(15)

2 人非協力非零和ゲーム

Theorem 3

(混合戦略まで拡大すると,)双行列ゲームには,少なくと も

1

Nash

均衡点が存在する

Theorem 4

cf. Theorem 2

(混合)戦略の組 が

Nash

均衡点であるための必要 十分条件は, が写像 の不動点であ ること.即ち,

*)

*, (p q

*) (

*) (

*

* q q p

p RA RB

*)

*, ( p q

戦略の組が均衡点であるための必要十分性(Theorem 2, 4など)

の証明は,「Brouwerの不動点定理」「角谷の不動点定理」などから

) ( )

(q B p

A R

R

(16)

演習1:

次の双行列ゲームの

Nash

均衡点を求めよ

B s

B1

s

B2

s

A1 (-2 , 1) ( 4 , 6)

s

A2 ( 6 , -8) (-2 , 2)

(17)

Coffee Brake!

John F. Nash (1928- )

紹介サイトの情報

A Beautiful Mind

いずれも2004119日(火)取得の情報 Non-Cooperative Games Nash [pdf]

(18)

補足: 2 人非協力零和ゲーム

2

人非協力零和ゲームの

Nash

均衡点

例:プレイヤーAの利得表

sB1 sB2 sA1 3 -2 sA2 -1 4

6 ˆ 10

ˆ)

(r r q1 r q1

p1 p2

q1 q2





5 ) 4 (

~ˆ ((1 34)) 12 46 5 4

) 1

~ˆ 34( (( 12)) 46

22 21

12 22

21 11

22 21

12 22

21 11

b b

c

b b

c

b b

c

a a

r

a a

r

a a

r



0 5 :

3 5 : 3

1 5 :

3

1 1

1 1

1 1

p q

p q

p q

任意

0 2 :

1 2 : 1

1 2 :

1

1 1

1 1

1 1

q p

q p

q p

任意

5

~ 10 ˆ)

(c c p1 c p1

p1 q1

0 1

1

3/5

1/2

プレイヤーA の最適応答

Nash均衡点 プレイヤーB

の最適応答 4

5 6

10 )

,

( p1q1 p1 q1 E p q





6 4, ((((10,,01),), )) 55 2 4 ))

1 , 0 ( ,

( ,(1,0)) 4 1 (

1 1 1

1 E p

q E

p E

p E

q q p

p

p1 E

1 0 1/2

1 E

1

0 3/5 q1

零和ゲームの場合は

最適応答戦略

ミニマックス戦略 いずれの考え方でも均 衡解を求められるよ

(19)

2 人非協力非零和ゲーム

例2:囚人のジレンマ

prisoner’s dilemma

2人の凶悪犯が別個に取り調べを受けている

現状では証拠不十分で軽い罪でしか起訴できないため,2 人とも

3

各囚人は司法取引を持ちかけられ,応じた方は

1

年,応じな い方は

10

年,ただし,2人ともが応じた場合は2人とも

8

AB

黙秘 自白

黙秘

(3,3) (10,1)

自白

(1,10) (8,8)

※司法取引:被告が自分の罪を認める代わりに罪を軽くしてもらうこと 注意:値が小さい

方が嬉しい!

(20)

最適応答原理に従ってまじめに計算しても

2 人非協力非零和ゲーム

例2:囚人のジレンマ

prisoner’s dilemma

AB

黙秘 自白

黙秘

(3,3) (10,1)

自白

(1,10) (8,8)

注意:値が小さい 方が嬉しい!

各プレイヤーとも,「自白」が支配戦略! 結果として,

(自白,自白)がNash均衡点であり,ゲームは支配可解

} {((0,1),q)0 q 1

A D

最適応答原理に従って考えても

} {( p,(0,1))0 p 1

B D

p1 p2

q1 q2

}

{

(0,1),(0,1)

: DA DB D

p1 q1

0 1

1



ˆ) ~ 0 2 0

( ˆ) ˆ 0 2 0

(

1 1

1

1 c p

p c c

q r

q r r



00

1

q1

p

注意:±逆で計算

明らかにもっと良い解がある Pareto最適でない!

(21)

2 人非協力非零和ゲーム

Nash

均衡点が最適戦略か?

2

人零和ゲーム

ミニマックス戦略が最適戦略!

2

人非零和ゲーム

Nash均衡点が最適戦略を与えるわけではない!

ゲームの値が異なる複数の均衡点が存在する場合がある!

Nash均衡点は,必ずしもPareto最適ではない!

行動の指針を与えてくれる

最適応答原理は不十分かも!?

(しかし他に適切なものがあるか?)

得られる解の状態を示すことで,何らかの均衡戦略を とるべきことを教える

均衡状態が複数あることを示すことで,戦略決定判断 が困難であることも教える

非協力ゲーム

Nash均衡点の精緻化 協力ゲームへの転換

参照

関連したドキュメント

[r]

[r]

Issue Date 2005-11-08 Rights ここに掲載した著作物の利用に関する注意 本著作物の著作

[r]

合意には公平さが必要とされるが,この公平さ を表わすのにいくつかの公理が要請され糺

[r]

1 人当りの分配額は 0 円であり人身は利益を得る機会を 失なってしまう.これに対して,もし全員が一律に 1000 円寄付すれば

Stackelberg 戦略を用いる場合,両 方のプレイヤーがともに先導者になろうとして, 2 人とも不利益を受ける,いわゆる