• 検索結果がありません。

意思決定科学: ゲーム理論2

N/A
N/A
Protected

Academic year: 2021

シェア "意思決定科学: ゲーム理論2"

Copied!
21
0
0

読み込み中.... (全文を見る)

全文

(1)

意思決定科学: ゲーム理論2

情報学部 堀田敬介

2010/11/30,Tue. ~

Contents

V 2

人非協力非零和ゲーム

V定義:ゲームのルール,双行列

V例:囚人のジレンマ,面会ゲーム,恋人達のジレンマ,…

V最適応答,Nash均衡点

V Nash

均衡点と線形相補性問題(

LCP

V

戦略形ゲームの社会・経済問題への応用例

(2)

V Example

VプレイヤーはAとBの2人

V各プレイヤーは,独立に自分の戦略を決定

(非協力)

Vプレイヤーの利得の和は一定とは限らない

(非零和)

V純粋戦略の数は有限

A

B s B1 s B2 s A1 (2, 3) (-1,-2) s A2 (-2,-1) (1,1)

A

B

の利得表

N={A, B}

Si

={s

i1

, s

i2

}, (i=A,B)

fi

:

SA×SB→ R, (i=A,B) fA(sA1, sB1) = 2 +

fA(sA1, sB2) = -1 + fA(sA2, sB1) = -2 + fA(sA2, sB2) = 1 +

fB(sA1, sB1) = 3 ≠0 fB(sA1, sB2) = -2 ≠0 fB(sA2, sB1) = -1 ≠0 fB(sA2, sB2) = 1 ≠0 SA={sA1, sA2}, SB={sB1, sB2},

2 人非協力非零和ゲーム

V

双行列ゲーム

V利得関数

V利得行列

) , ( : ) , ( )

, ( ) , (

) , ( )

, ( ) , (

) , ( )

, ( ) , (

2 2 1

1

2 2 22

22 21

21

1 1 12

12 11

11

B A b

a b

a b

a

b a b

a b

a

b a b

a b

a

mn mn m

m m

m

n n

n n

=

⎥ ⎥

⎥ ⎥

⎢ ⎢

⎢ ⎢

L

M O

M M

L L

ij B A B ij B A

A

s s a f s s b

f j

i

i j

=

i j

=

∀ , , ( , ) , ( , ) ]

[ ],

[ a

ij

= b

ij

= B

A

プレイヤーBの戦略(n個)の利得(右側)

プレイヤーA の戦略(m個)

の利得(左側)

双行列 和が零(一定)という条件はない(非零和)

(3)

2 人非協力非零和ゲーム

V

例1:恋人達のジレンマ

battle of sexes

Vある一組のカップルがデートをしたいと思っている

V男性は野球観戦を希望し,女性は映画鑑賞がしたい

V各々が好きなものを見るより一緒にいることの方が大事

野球 映画 野球

(2,1) (-1,-1)

映画

(-1,-1) (1,2)

性の戦い,男女の戦い,

逢引きのジレンマ,…

互いに支配戦略は持たない

ミニマックス原理に従うと,互いにどちらの戦略でも良い?

(または各戦略のマックスが大きくなる方を選ぶ!?)

1 min

max

ij

= −

i j

a

1 min

max

ij

= −

j

i

b

2 人非協力非零和ゲーム

V

例1:恋人達のジレンマ

battle of sexes

V 零和ゲームの時と同じ方法で,混合戦略で期待利得最大化すると

野球 映画

野球

(2,1) (-1,-1)

映画

(-1,-1) (1,2)

p

1

p

2

q

1

q

2

⎩⎨

⎧ = = − − − − + +

2 2 1 2 2 1 1 1

2 2 1 2 2 1 1

1

2

) , ( , ) 2 (

q p q p q p q p E

q p q p q p q p E

B

A

p q

q p

⎩⎨

⎧ = = − − +

1 2 )) 1 , 0 ( ,

( , ( 1 , 0 )) 3 1 (

1 1

p E

p E

A

A

p

p

⎩⎨

⎧ = = − − +

2 3 ) ), 1 , 0

(( 1 , 0 ), ) 2 1 ((

1 1

q E

q E

B

B

q

q

5 ) 1 , ˆ ( ˆ 5 , ) 1 , ˆ ( ˆ , 5 ) , 2 5 ( 3 5 ), , 3 5 ( 2 ˆ ) ˆ ,

( ⎟ = =

⎜ ⎞

= ⎛ p q p q

q

p E

A

E

B

ところが…

5 ) 1

, ˆ

( = p

1

E

A

p q

5 ) 4

ˆ ,

( = − q

1

+ E

B

p q

Bが

をとるならAは ではなく(1,0)にする方が 期待利得が高くなる!

q ˆ p ˆ Aが

をとるならBは ではなく(0,1)にする方が 期待利得が高くなる!

q ˆ p ˆ

均衡しない

つまり,相手が純粋戦略を取ってきたときだけの自分の混合戦略を考えて 期待利得を求めるやり方では,均衡解を求められない

(4)

V最適応答対応

best response correspondence

Bの戦略 に対するAの最適応答の集合

を,プレイヤーAの最適応答対応とよび,

を,プレイヤーAの最適応答集合とよぶ

V Definition

最適応答と最適応答対応

V最適応答

best response

プレイヤーAの戦略 が,プレイヤーBの戦略 に対 する最適応答であるとは,以下が成り立つことA A

S

ss

B

S

B

) , ( max ) ,

( p q p q

p A

A

E

E =

) , ( max ) ,

(

A A B

S B s A

A

s s f s s

f

A A

=

純粋戦略の場合

混合戦略の場合

B

B

S

s

} { ( , ) max ( , )

)

(

A A B

S B s A A A A B

A

s s S f s s f s s

R

A A

=

=

} { (

A

,

B

)

A A

(

B

),

B B

A

s s s R s s S

D = ∈ ∈

} { ( , ) max ( , )

)

( q p p q p q

p A

A

A

E E

R = =

純粋戦略 の場合 混合戦略

の場合

最適応答原理に帰着

最適応答原理

プレイヤーAの(純戦略での)最適応答

s

B1→ max{7,8,4} = 8

s

B2→ max{0,6,3} = 6

s

B3→ max{5,2,6} = 6

V

最適応答と最適応答対応

プレイヤーA,Bが各々最適応答をとる場合,その組の集合は となる

2 人非協力非零和ゲーム

B

A

D

D D : = ∩

s

B1

s

B2

s

B3

s

A1

(7,7) (0,8) (5,5) s

A2

(8,0) (6,6) (2,7) s

A3

(4,5) (3,1) (6,2)

V例:

} { ) (

} { ) (

} { ) (

3 3

2 2

2 1

A B A

A B A

A B A

s s R

s s R

s s R

=

==

} { ( s , s ), ( s , s ), ( s , s ) D =

プレイヤーBの(純戦略での)最適応答

s

A1→ max{7,8,5} = 8

s

A2→ max{0,6,7} = 7

s

A3→ max{5,1,2} = 5

( ) { } } { ) (

} { ) (

1 3

3 2

2 1

B A B

B A B

B A B

s s R

s s R

s s R

==

=

} { (

A2

,

B3

), (

A1

,

B2

), (

A3

,

B1

)

B

s s s s s s

D =

互いに最適応答なら均衡する

D≠∅なら均衡)

より,

純粋戦略のみでは 均衡しない

=

D

(5)

2 人非協力非零和ゲーム

V Definition Nash

均衡点

Nash equilibrium point

V(混合)戦略の組 が次の条件を満たすとき,

をNash均衡点とよぶ

( *, *) q p

q q p q

p

p q p q

p ≥ ≥ ∀ ∀

)

*, (

*)

*,

( *, *) ( , *) (

B B

A

A

E

E

E E

V Theorem 1

V(混合)戦略の組 が互いに最適応答であるならば

Nash

均衡点であり,逆も成り立つ.即ち,

Nash

均衡点の集 合を

E

とすると,

B

A

D

D E = ∩

ˆ ) ˆ , ( p q

Nash均衡点は,零和ゲー

ムの均衡点(鞍点)を含む

一般的な概念

*)

*, ( p q

V Theorem 2

V(混合)戦略の組 がNash均衡点であるた めの必要十分条件は

*)

*, ( p q

n j

s E E

m i

s E E

j i

B B B

A A

A

( *, *) ( *, ) 1 , ,

, , 1

*) , (

*)

*, (

L L

=

≥ ∀ =

p q

p

q q

p

Bがq*をとるならAはp*がベスト Aがp*をとるならBはq*がベスト

2 人非協力非零和ゲーム

V 2

人非協力非零和ゲームの

Nash

均衡点

[ A, B ]

) , ( ) , (

) , ( ) , (

22 22 21 21

12 12 11

11

⎥ =

⎢ ⎤

b a b a

b a b p

1

a

p

2

q

1

q

2

⎩⎨

⎧ ≥ ≥ ≥ ≥ + + = = 1 ,

0 ,

0 0 , 0 , 1

2 1 2 1

2 1 2

1

q q q

q

p p p p

22 1 1 1 1

22 1 22 21 1 12 22 1 1 12 22 21 11

22 1 1 1 1

22 1 22 21 1 12 22 1 1 12 22 21 11

ˆ ~ ˆ )

( ) ( )} ( ) ( )

) {(

, (

ˆ ~ ˆ )

( ) ( )} ( ) ( )

) {(

, (

b q c p c q p c c

b q b b p b b q p b b b b E

a q r p r q p r r

a q a a p a a q p a a a a E

T B

T A

+ +

− +

= − + − − − + − +

= = + − + +

= − + − − − + − +

= = Bq p q p

Aq p q p

プレイヤーA,Bが混合戦略をとった際の期待利得

⎩⎨

⎧ ≥ ≥

⎩⎨ ⎧

≥ ≥

)) 1 , 0 ( , ( ) ,

( , ) ( , ( 1 , 0 )) (

) ), 1 , 0 ((

) ,

( , ) (( 1 , 0 ), ) (

p q

p

p q

p

q q

p

q q

p

B B

B B

A A

A A

E E

E E

E E

E Theorem 2 より, E

Nash均衡点

(6)

V 2

人非協力非零和ゲームの

Nash

均衡点

VプレイヤーAの最適応答について

⎩⎨

⎧ + + − − − ≥ ≤

⎩⎨

⎧ + + − − + + + + ≥ ≥ + + − + +

⎩⎨ ⎧

≥ ≥

0 ˆ } ˆ )

{( ˆ ) ˆ }( 1 ) 0 {(

~ ˆ ~

ˆ ) (

ˆ ~ ˆ )

~ ( ) ˆ

( ˆ

) ), 1 , 0 ((

) ,

( , ) (( 1 , 0 ), ) (

1 1

1 1

22 1 22 1 1 1 1

22 1 1

22 1 1 1 1

p r q r r

p r q r r

a q r a q r p r q p r r

a q r r q r r a q r p r q p r r

E E

E E

A A

A

A

p q q

q q

p

1

1

ˆ 0

ˆ )

( r + r qr >

となる

q

⎩⎨ ⎧

≥ ≤

− 0 0 1

1 1

p p

1

1

ˆ 0

ˆ )

( r + r qr =

となる

q

1

1

ˆ 0

ˆ )

( r + r qr <

となる

q

⎩⎨ ⎧ −

任意

任意

: : 1

1 1

p p

⎩⎨

⎧ − ≤ ≥ 0 0 1

1 1

p p

故に,

pR

A

(q )

となるためには,

1

= 1 p

:

任意

p

1

1

= 0 p

2 人非協力非零和ゲーム

V 2

人非協力非零和ゲームの

Nash

均衡点

VプレイヤーBの最適応答について

⎩⎨ ⎧

≥ +

+ + − ≤

⇔ +

⎩⎨ ⎧

+

≥ + +

+ − + + ≥ + − + +

⇔ +

⎩⎨

⎧ ≥ ≥

0

~ } ˆ )

{( ˆ ) ~ }( 1 ) 0 {(

~ ˆ ) ˆ

( ˆ

ˆ ~ ) ˆ

~ ( ˆ )

ˆ (

)) 1 , 0 ( , ( ) ,

( , ) ( , ( 1 , 0 )) (

1 1

1 1

22 1 22 1 1 1 1

22 1

1 22

1 1 1 1

q c p c c

q c p c c

b p c b q c p c q p c c

b c p c p c c b q c p c q p c c

E E

E E

B B

B

B

p q p

p q

p

1

1

~ 0

ˆ )

( c + c p + c >

となる

p

⎩⎨

⎧ − ≥ ≤ 0 0 1

1

q

1

q

⎩⎨

⎧ −

任意 任意

: : 1

1

q

1

q

⎩⎨ ⎧

≤ ≥

− 0 0 1

1 1

q q

故に,

qR

B

( p )

となるためには,

1

= 1 q

:

任意

q

1

1

= 0 q

1

1

~ 0

ˆ )

( c + c p + c =

となる

p

1

1

~ 0

ˆ )

( c + c p + c <

となる

p

(7)

2 人非協力非零和ゲーム

V 2

人非協力非零和ゲームの

Nash

均衡点

V例:

s

B1

s

B2

s

A1

(6,5) (2,7) s

A2

(3,4) (6,1)

4 ˆ 7

ˆ )

( r + r q

1

r = q

1

p

1

p

2

q

1

q

2

⎪⎩

⎪ ⎨

=

=

= − = − = −

= = − = − =

⎪⎩

⎪ ⎨

=

=

= − = − =

= = − = − =

3 1

~ ˆ 1 5 4 7 4 1 6 3 6

~ ˆ 6 6 3 3 2 3 4

22 21

12 22

21 11

22 21

12 22

21 11

b b c

b b c

b b c

a a r

a a r

a a r

⎪⎩

⎪⎨

=

<

=

=

>

0 7 :

4 7 : 4

1 7 : 4

1 1

1 1

1 1

p q

p q

p q

任意

⎪⎪

⎪⎪⎨

=

>

=

=

<

0 5 :

3 5 : 3

1 5 : 3

1 1

1 1

1 1

q p

q p

q p

任意

3

~ 5 ˆ )

( c + c p

1

+ c = − p

1

+

p

1

q

1

0 1

1 4/7

3/5

プレイヤーA の最適応答 プレイヤーB

の最適応答

Nash均衡点

2 人非協力非零和ゲーム

s

B1

s

B2

s

A1 (6,5) (2,7)

s

A2 (3,4) (6,1)

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B 2

3 4 5 6 Exp

0 0.25

0.5 player A 0.75

EA

(p,q)

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B 0

2 4 6 Exp

0 0.25

0.5 player A 0.75

EB

(p,q)

EA

(p,(4/7,3/7))=30/7

EB

((3/5,2/5), q)=23/5

p

1

q

1

0 1

1 4/7

3/5

(8)

V Theorem 3

V(混合戦略まで拡大すると,)双行列ゲームには,少なくと も1つNash均衡点が存在する

V Theorem 4

cf. Theorem 2

V(混合)戦略の組 がNash均衡点であるための必要 十分条件は, が写像 の不動点であ ること.即ち,

*)

*, ( p q

*) (

*) (

*

* q q p

p × ∈ R

A

× R

B

*)

*, ( p q

戦略の組が均衡点であるための必要十分性(Theorem 2, 4など)

の証明は,「Brouwerの不動点定理」「角谷の不動点定理」などから

)

( )

( q

B

p

A

R

R ×

演習1:

V

次の双行列ゲームの

Nash

均衡点を求めよ

s B1 s B2 s A1 (-24, 12) ( 4 , 6)

s A2 ( 6 , -8) (-2 , 2)

(9)

Coffee Brake!

V John F. Nash (1928- )

V紹介サイトの情報

V

A Beautiful Mind

いずれも2004年11月9日(火)取得の情報

Non-Cooperative Games Nash [pdf]

補足: 2 人非協力零和ゲーム

V 2

人非協力零和ゲームの

Nash

均衡点

V 例:プレイヤーAの利得表

s

B1

s

B2

s

A1

3 -2 s

A2

-1 4

6 ˆ 10 ˆ)

(r+r q1r= q1

p

1

p

2

q

1

q

2

⎪⎩

⎪⎨

=

=

= − = − − =−

== − = − − =−

⎪⎩

⎪⎨

=

=

= − = − − =

== − = − − =

5 ) 4 (

~ˆ ((143)) 12 46 5 4 ) 1

~ˆ 34( (( 12)) 46

22 21

12 22

21 11

22 21

12 22

21 11

b b c

b b c

b b c

a a r

a a r

a a r

⎪⎪

=

<

=

=

>

0 5 : 3

5 : 3

1 5 : 3

1 1

1 1

1 1

p q

p q

p q

任意

=

>

=

=

<

0 2 : 1

2 : 1

1 2 : 1

1 1

1 1

1 1

q p

q p

q p

任意

5

~ 10 ˆ)

(c+c p1+c=− p1+

p

1

q

1

0 1

1 3/5

1/2

プレイヤーA の最適応答

Nash均衡点

プレイヤーB

の最適応答 4

5 6 10 ) ,

( = p1q1p1q1+ E pq

⎩⎨

⎧ ==− −+

⎩⎨

⎧ ==− −+

4 5 ) ), 1 , 0

((1,0), ) 5 2 , ((

4 6 )) 1 , 0 ( ,

( ,(1,0)) 4 1 (

1 1 1

1 E p

q E

p E

p E

q q p

p

p1 E

1 0 1/2

1 E

1

0 3/5 q1

零和ゲームの場合は

¾最適応答戦略

¾ミニマックス戦略 いずれの考え方でも均 衡解を求められるよ

(10)

V

例2:囚人のジレンマ

prisoner’s dilemma

V2人の凶悪犯が別個に取り調べを受けている

V現状では証拠不十分で軽い罪でしか起訴できないため,2 人とも3年

V各囚人は司法取引を持ちかけられ,応じた方は1年,応じな い方は10年,ただし,2人ともが応じた場合は2人とも8年

A

B

黙秘 自白

黙秘

(3,3) (10,1)

自白

(1,10) (8,8)

※司法取引:被告が自分の罪を認める代わりに罪を軽くしてもらうこと 注意:値が小さい

方が嬉しい!

最適応答原理に従ってまじめに計算しても…

2 人非協力非零和ゲーム

V

例2:囚人のジレンマ

prisoner’s dilemma

A

B

黙秘 自白

黙秘

(3,3) (10,1)

自白

(1,10) (8,8)

注意:値が小さい 方が嬉しい!

各プレイヤーとも,「自白」が支配戦略! 結果として,

(自白,自白)がNash均衡点であり,ゲームは支配可解

} { (( 0 , 1 ),

q

)

0q1

A= D

最適応答原理に従って考えても…,

} { (

p

, ( 0 , 1 ))

0p1

B= D

p

1

p

2

q

1

q

2

( ) } { ( 0 , 1 ), ( 0 , 1 )

: = D

A

D

B

= D

q

1

1

⎩⎨ ⎧

<

= +

+ − = − <

+ ˆ ) ~ 0 2 0

( ˆ ) ˆ 0 2 0

(

1 1

1

1

c p

p c c

q r q r r

⎩⎨

⎧ ==

0 0

1 1

q p

明らかにもっと良い解がある

Pareto最適でない!

(11)

2 人非協力非零和ゲーム

V Nash

均衡点が最適戦略か?

V

2人零和ゲーム

ミニマックス戦略が最適戦略!

V

2人非零和ゲーム

Nash均衡点が最適戦略を与えるわけではない!

ゲームの値が異なる複数の均衡点が存在する場合がある!

Nash均衡点は,必ずしもPareto最適ではない!

行動の指針を与えてくれる

最適応答原理は不十分かも…!?

(しかし他に適切なものがあるか?)

•得られる解の状態を示すことで,何らかの均衡戦略を

とるべきことを教える

•均衡状態が複数あることを示すことで,戦略決定判断

が困難であることも教える

非協力ゲーム

Nash均衡点の精緻化

協力ゲームへの転換

2 人非協力非零和ゲーム

V

例3:面会ゲーム

V遠く離れている2人が至急会う必要がある

V今居る場所は互いにわかっており,会いに行くか,相手が 来るのを待つかの選択が出来る.(途中で会うことはない)

A

B

行く 待つ

行く

(-6,-6) (6,10)

待つ

(10,6) (0,0)

⎪ ⎪

⎪ ⎪

⎪⎩

⎪ ⎨

=

< → ∈

= → =

+ >

= + +

⎪⎩

⎪ ⎨

=

< → ∈

= → =

+ >

=

− +

0 0 [ 0 , 1 ]

0 1

6 0

~ 22 ˆ )

(

0 0 [ 0 , 1 ]

0 1

6 0 ˆ 22

ˆ ) (

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r

r p

1

q

1

0 1

1

3/11

3/11 Nash均衡点

((0,1),(1,0)),

((3/11,8/11),(3/11,8/11)),

((1,0),(0,1))

(12)

p

1

0 1

3/11

3/11

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B -5

0 5 10 Exp

0 0.25

0.5 player A 0.75

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B -5

0 5 10 Exp

0 0.25

0.5 player A 0.75

E

A

(p,q)

E

B

(p,q)

E

A

(p,(3/11,8/11))=30/11 E

B

((3/11,8/11), q)=30/11

2 人非協力非零和ゲーム

V

例4:弱虫ゲーム

chicken game

V2人の人間が2台の車をそれぞれ運転する

V2人は,お互いに向かって車を走らせる

V2台ともそのまま走り続ければ,やがてぶつかり死ぬため,

直前で回避してよい.

Vしかし,相手より先によけた(進路を変えた)プレイヤーは

「チキン」と罵られ,臆病者のレッテルを貼られる

A

B

避ける 避けない

避ける

(2,2) (0,9)

避けない

(9,0) (-5,-5)

(13)

2 人非協力非零和ゲーム

V

例4:弱虫ゲーム

chicken game A

B

避ける 避けない 避ける

(2,2) (0,9)

避けない

(9,0) (-5,-5)

⎪ ⎪

⎪ ⎪

⎪⎩

⎪ ⎨

=

< → ∈

= → =

+ >

= + +

⎪⎩

⎪ ⎨

=

< → ∈

= → =

+ >

=

− +

0 0 [ 0 , 1 ]

0 1

5 0

~ 12 ˆ )

(

0 0 0 0 [ 1 0 , 1 ] 5

ˆ 12 ˆ )

(

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r r

p

1

q

1

0 1

1

5/12

5/12

Nash均衡点

((0,1),(1,0)),

((5/12,7/12),(5/12,7/12)),

((1,0),(0,1))

E

A

(p,(5/12,7/12))=10/12 E

B

((5/12,7/12), q)=10/12 (9,0)

(0,9)

2 人非協力非零和ゲーム

V

例1:恋人達のジレンマ

battle of sexes

野球 映画

野球

(2,1) (-1,-1)

映画

(-1,-1) (1,2)

⎪ ⎪

⎪ ⎪

⎪⎩

⎪ ⎨

=

< → ∈

= → =

− >

= + +

⎪⎩

⎪ ⎨

=

< → ∈

= → =

− >

=

− +

0 0 [ 0 , 1 ]

0 1

3 0

~ 5 ˆ ) (

0 0 [ 0 , 1 ]

0 1

2 0 5 ˆ ) ˆ (

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r r

p

1

q

1

0 1

1

2/5

3/5

Nash均衡点

((1,0),(1,0)),

((3/5,2/5),(2/5,3/5)),

((0,1),(0,1))

E

A

(p,(5/12,7/12))=1/5 E

B

((5/12,7/12), q)=1/5 (2,1)

(1,2)

(14)

V

例5:病的な例

A

B s

B1

s

B2

s

A1

(8,8) (4,8) s

A2

(8,4) (4,4)

友情ルール:自分の利得が同じなら,

相手の利得が大きくなる戦略を選ぶ 嫌がらせルール:自分の利得が同じなら,

相手の利得が小さくなる戦略を選ぶ

Nash均衡点の精緻化

全ての純粋戦略の組がNash均衡点!

(sA

,s

B1)が均衡点

⎩⎨

= + +

=

− +

] 1 , 0 [ 0 0 ) 0 0 (

] 1 , 0 [ 0 0 ) 0 0 (

1 1

1 1

q p

p q

p

1

q

1

0 1

1

全ての混合戦略の組がNash均衡点!

(sA2

,s

B2)が均衡点

Aが友情 & Bが嫌がらせルールに従う

(sA1

,s

B2),

Aが嫌がらせ & Bが友情ルールに従う

(sA2

,s

B1

⎩⎨EB(p,q)=8p1q1+4p2q1+8p1q2+4p2q2=8p1+4p2

↑自分の期待利得を自分の戦略で決められないことによる

弱支配

2 人非協力非零和ゲーム

V

例6:共有地の悲劇(囚人のジレンマのn人拡張版)

V 数軒の酪農家が共有の牧草地を所有している.各酪農家が先を争って 牛を放牧し,自分の利益最大をはかる限り,牛の数を増やし続けると,

待っているのは共有地の荒廃という悲劇である.

V 単純なモデルでの考察

酪農家は4軒

(i=1,2,3,4)

酪農家iが放牧する牛の数qi

各酪農家は3頭まで牛を購入でき,購入価格は全て等しく2

酪農家iの収益をxiとし,xi

= q

i

{16

(q

1

+ q

2

+ q

3

+ q

4

)}

2 q

i

i

others 0 1 2 3 4 5 6 7 8 9

0 0 0 0 0 0 0 0 0 0 0

1 13 12 11 10 9 8 7 6 5 4

2 24 22 20 18 16 14 12 10 8 6 3

たくさん放牧する と収益が減る!

Nash均衡点

(15)

Nash 均衡点と線形相補性問題

V Definition

戦略的同等性

VゲームGのNash均衡点がG’のそれであり,かつその逆も成 立するとき,2つのゲームは戦略的に同等であるという

V Theorem 5

V

2

つの双行列ゲーム

G, G’

において,任意の要素について,

という関係があるとき,

G

G’

は戦略的に同等である

⎩ ⎨

⎧ ′ ′ = = + +

>

>

2 2

1 2 1

1 2

1

0 , α 0 , β , β , α α β β

α

ij ij

ij ij

b b

a a

V例:

A

B s

B1

s

B2

s

A1

(3,-1) (0,2) s

A2

(-2,4) (5,-2)

A

B s

B1

s

B2

s

A1

(5,-1) (-1,8) s

A2

(-5,14) (9,-4)

戦略的同等

2 , 3 , 1 ,

2

1 2 2

1

= β = − α = β =

α

G G’

Nash 均衡点と線形相補性問題

V Nash

均衡点を求める

Nash

均衡点

Th.2

*)

*, ( p q

⎩ ⎨

⎧ = = ≥ ≥ ∀ ∀ = =

n j

s E E

v

m i

s E E

v

j i

B B B

A A

A

( *, *) ( *, ) 1 , ,

:

, , 1

*) , (

*)

*, ( :

2

1

L L

p q

p

q q

p

⎪⎩

⎪ ⎨

=

=

∑ ∑

=

=

n j

p b v

m i

q a v

m

i ij j

n

j ij j

, , 1

, , 1

1

* 2

1

* 1

L L

Th.5 ⎪⎩

⎪ ⎨

=

=

∑ ∑

=

=

n j

p b v

m i

q a v

m

i ij j

n

j ij j

, , 1

~ 1 , ,

~

1

* 2

1

* 1

L

L ( ~ 0 )

~ , ,

, >

i j a

ij

b

ij ただし,

0 ,

2

1

v >

v

⎪⎩

⎪ ⎨

=

=

∑ ∑

=

=

n j

p b

m i

q a

m

i ij i

n

j ij j

, , 1

~ 1 ~

, , 1

~ 1 ~

1 1

L L

⎩ ⎨

=

=

2

* 1

*

~ : :

~

v p p

v q q

i i

j j

ただし,

⎪⎩

⎪ ⎨

=

=

=

=

∑ ∑

=

=

) , , 1 ( 0)

~ ( 1 ~

:

) , , 1 ( 0)

~ ( 1 ~

:

1 1

n j

p b w

m i

q a u

m

i ij i

j

n

j ij j

i

L

L

とおく

(16)

V Proposition 1

相補性

complementarity

⎪⎩

⎪ ⎨

=

=

∑ ∑

=

= m

i ij i

j

j ij j

i

p b w

q a u

1 1

~ ~ 1

: 1 :

⎪⎩

⎪ ⎨

=

=

=

=

∑ ∑

=

=

) , , 1 (

~ 0 0 ( 1 , , )

~

1 1

m i

q w

n j

p u

n

j j j

m

i i i

L L

Nash均衡点

が存在する まとめると…

) , , 1 ( 0

, 0 ( 1 , , ) ,

0 0

) , , 1 (

~ 1

:

) , , 1 (

~ 1

:

1 1

1 1

n j

q w

m i

p u

q w

p u

n j

p b w

m i

q a u

j j

i i

n

j j j

m

i i i

m i ij i j

n j ij j i

L L

L L

=

≥ =

=

=

=

=

=

=

∑ ∑ ∑ ∑

=

=

=

=

を満たす

u w , , p q ( ( i j 1 , 1 , , m , n ) )

が存在

j j

i

i

L L

= =

が成立

Nash 均衡点と線形相補性問題

V LCP, Linear Complementarity Problem

) , , 1 ( 0

, 0 ( 1 , , ) ,

0 0

) , , 1 (

~ 1

:

) , , 1 (

~ 1

:

1 1

1 1

n j

q w

m i

p u

q w

p u

n j

p b w

m i

q a u

j j

i i

n

j j j

m

i i i

m i ij i j

n j ij j i

L L

L L

=

≥ =

=

=

=

=

=

=

∑ ∑ ∑ ∑

=

=

=

=

を満たす解

⎩ ⎨

⎧ = =

) , , 1 (

, ( 1 , , ) ,

n j

q w

m i

p u

j j

i

i

L L

⎪⎩

⎪ ⎨

=

= ∑ ∑

j j j j

i i i i

q q q

p p p

: :

*

*

Nash

均衡点

⎥ ⎦

⎢ ⎤

= −

⎥ ⎥

⎥ ⎥

⎥ ⎤

⎢ ⎢

⎢ ⎢

⎢ ⎡

=

⎥ ⎥

⎥ ⎥

⎥ ⎤

⎢ ⎢

⎢ ⎢

⎢ ⎡

=

⎥ ⎥

⎥ ⎥

⎥ ⎤

⎢ ⎢

⎢ ⎢

⎢ ⎡

= B 0

A M 0

z y

x 1 1 , :

T

1 : , : , :

1 1

1 1

M M M

M M

M

m m

w u u

q p p

0 y x

x y

z Mx y

= ≥ +

= ) ,

( 0 , ,

T

ただし,

B=-AだとLP ⇔

零和ゲーム

Lemke法(M≧0)

参照

関連したドキュメント

 当図書室は、専門図書館として数学、応用数学、計算機科学、理論物理学の分野の文

[r]

高機能材料特論 システム安全工学 セメント工学 ハ バイオテクノロジー 高機能材料プロセス特論 焼結固体反応論 セラミック科学 バイオプロセス工学.

Photo Library キャンパスの夏 ひと 人 ひと 私たちの先生 文学部  米山直樹ゼミ SKY SEMINAR 文学部総合心理科学科教授・博士(心理学). 中島定彦

ABSTRACT: [Purpose] To develop a simple method to measure the lower-limb muscle strength, verify its intra- and inter-rater reliability, and analyze the correlation between

赤坂 直紀 さん 石井 友理 さん.

意思決定支援とは、自 ら意思を 決定 すること に困難を抱える障害者が、日常生活や 社会生活に関して自