V 2人非協力非零和ゲーム

(1)

意思決定科学：ゲーム理論２

情報学部堀田敬介

2007/30,Fri. ～

2 人非協力非零和ゲーム

V

ゲームのルール

V

プレイヤーの数は2人

V

各プレイヤーは，独立に自分の戦略を決定（非協力）

V

プレイヤーの利得の和は一定とは限らない（非零和）

V

ゲームは1回限り

V

各プレイヤーは戦略決定時に，他のプレイヤーがどの戦略をとるかは知らない

V

純粋戦略の数は有限

⎩ ⎨

⎧ = =

} , , , {

2 1

n m B B B B

A A A A

s s s S

L L } 2 , 1

= { N

2 人非協力非零和ゲーム

V

例１：恋人達のジレンマ

battle of sexes

V

ある一組のカップルがデートをしたいと思っている

V

男性は野球観戦を希望し，女性は映画鑑賞がしたい

V

各々が好きなものを見るより一緒にいることの方が大事

(1,2) (-1,-1)

映画

(-1,-1) (2,1)

野球

映画野球男＼女

性の戦い，男女の戦い，

逢引きのジレンマ，…

互いに支配戦略は持たない

ミニマックス原理に従うと，互いにどちらの戦略でも良い？

（または各戦略のマックスが大きくなる方を選ぶ！？）

1 min max

_ij

= −

j

i

a

1 min max

_ij

= −

j

i

b

2 人非協力非零和ゲーム

V

双行列ゲーム

V

利得関数

V

利得行列

) , ( : ) , ( ) , ( ) , (

) , ( ) , ( ) , (

2 2 1 1

2 2 22

22 21 21

1 1 12

12 11 11

B A b

a b

a b a

b a b

a b a

b a b

a b a

mn mn m

m m m

n n

=

⎥ ⎥

⎦

⎤

⎢ ⎢

⎣

⎡

L M O M M

L L

ij B A B ij B A

A

s s a f s s b

f j

i

i j

=

i j

=

∀ , , ( , ) , ( , ) ]

[ ], [ a

_ij

= b

_ij

= B

A

プレイヤーBの戦略（n個）の利得（右側）

プレイヤーA の戦略（m個）

の利得（左側）

双行列双行列和が零（一定）という条件はない（非零和）

2 人非協力非零和ゲーム

V

例１：恋人達のジレンマbattle of sexes

V零和ゲームの時と全く同じやり方で，混合戦略でミニマックス原理に基づき期待利得最大化をしてみると…

(1,2) (-1,-1)

映画

(-1,-1) (2,1)

野球

p ₁ p ₂

q ₁ q ₂

⎩⎨

⎧ = = − − − − + +

2 2 1 2 2 1 1 1

2 2 1 2 2 1 1

1

2 ) , (

q p q p q p q p E

B

A

p q

q p

⎩⎨

⎧ = = − − +

1 2 )) 1 , 0 ( , (

1 3 )) 0 , 1 ( , (

1 1

p E

A

p

⎩⎨

⎧ = = − − +

2 3 ) ), 1 , 0 ((

1 2 ) ), 0 , 1 ((

1 1

q E

B

q

5 ) 1 ˆ , ˆ ( 5 , ) 1 ˆ , ˆ ( , 5 ) , 2 5 ( 3 5 ), , 3 5 ( 2 ) ˆ , ˆ

( ⎟ = =

⎠

⎜ ⎞

⎝

= ⎛ p q p q

q

p E

A

E

B

ところが…

5 ) 1 , ˆ

( = p

₁

−

E

_A

p q

5 ) 4 ˆ , ( = − q

₁

+ E

_B

p q Bが

をとるならAは

ではなく(1,0)にする方が期待利得が高くなる！

q ˆ p ˆ Aが

をとるならBはではなく(0,1)にする方が期待利得が高くなる！

q ˆ p ˆ

均衡しない

つまり，相手が純粋戦略を取ってきたときだけの自分の混合戦略を考えて期待利得を求めるやり方では，均衡解を求められない

(2)

V

最適応答対応

best response correspondence

• Ｂの戦略に対するＡの最適応答の集合

を，プレイヤーＡの最適応答対応プレイヤーＡの最適応答対応とよび，

を，プレイヤーＡの最適応答集合最適応答集合とよぶ

V Definition 最適応答と最適応答対応

V

最適応答

best response

• プレイヤーＡの戦略が，プレイヤーＢの戦略に対する最適応答最適応答であるとは，以下が成り立つこと

2 人非協力非零和ゲーム

A

S

s ∈ s

_B

∈ S

_B

) , ( max ) ,

( p q p q

p A

A

E

E =

) , ( max ) ,

(

_A _A _B

S B s A

A

s s f s s

f

A A∈

=

^{純粋戦略の場合}

混合戦略の場合

B

S

s ∈

} { ( , ) max ( , ) )

(

A A B

S B s A A A A B

A

s s S f s s f s s

R

A

A∈

=

∈

=

} { (

A

,

B

)

A A

(

B

),

B B

A

s s s R s s S

D = ∈ ∈

} { ( , ) max ( , ) )

( q p p q p q

p A

A

E E

R = =

純粋戦略の場合混合戦略

の場合

2人零和ゲームでは，

ミニマックス原理は最適応答原理に帰着

最適応答原理最適応答原理

プレイヤーＡの（純戦略での）最適応答

s

_B1→

max{7,8,4} = 8

s

_B2→

max{0,6,3} = 6 s

_B3→

max{5,2,6} = 6 V

最適応答と最適応答対応

• プレイヤーＡ，Ｂが各々最適応答をとる場合，その組の集合はとなる

2 人非協力非零和ゲーム

B

A

D

D D : = ∩

(6,2) (3,1) (4,5)

s _A3

(2,7) (6,6) (8,0)

s _A2

(5,5) (0,8) (7,7)

s _A1

s _B3 s _B2 s _B1

Ａ＼Ｂ

V

例：

} { ) (

3 3

2 2

2 1

A B A

s s R

= =

=

} { (

A₂

,

B₁

), (

A₂

,

B₂

), (

A₃

,

B₃

)

A

s s s s s s

D =

プレイヤーＢの（純戦略での）最適応答

s

_A1→max{7,8,5} = 8

s

_A2→

max{0,6,7} = 7

s

_A3→max{5,1,2} = 5

( ) { } } { ) (

} { ) (

1 3

3 2

2 1

B A B

s s R

= =

=

} { ( , ), ( , ), ( , )

1 3 2 1 3

2 B A B A B

A

B

s s s s s s

D =

互いに最適応答なら均衡する

（

D ≠ ∅

なら均衡）

より，

純粋戦略のみでは均衡しない

∅ D =

2 人非協力非零和ゲーム

V Definition Nash均衡点 Nash equilibrium point V

（混合）戦略の組が次の条件を満たすとき，

を

Nash均衡点 Nash

均衡点とよぶ

*)

*, ( p q

q q p q p

p q p q

p ≥ ≥ ∀ ∀

)

*, (

*)

*, (

*) , (

*)

*, (

B B

A A

E E

V Theorem 1

V

（混合）戦略の組が互いに最適応答であるならば

Nash均衡点であり，逆も成り立つ．即ち，Nash均衡点の集

合を

E

とすると，

B

A D

D E = ∩

ˆ ) ˆ , ( p q

Nash均衡点は，零和ゲー

ムの均衡点（鞍点）を含む

一般的な概念

*)

*, ( p q

V Theorem 2

V

（混合）戦略の組がNash均衡点であるための必要十分条件は

*)

*, ( p q

n j s E E

m i s E E

j i

B B B

A A A

, , 1 )

*, (

*)

*, (

, , 1

*) , (

*)

*, (

L

= L

∀

≥ ∀ =

≥ p q p

q q

p

Bがq*をとるならAはp*がベスト Aがp*をとるならBはq*がベスト

2 人非協力非零和ゲーム

V 2人非協力非零和ゲームのNash均衡点

[ A, B ]

) , ( ) , (

22 22 21 21

12 12 11

11

⎥ =

⎦

⎢ ⎤

⎣

⎡

b a b a

b a b p ₁ a p ₂

q ₁ q ₂

⎩⎨

⎧ ≥ ≥ ≥ ≥ + + = = 1 , 0 , 0

1 , 0 , 0

2 1 2 1

q q q q

p p p p

22 1 1 1 1

22 1 22 21 1 12 22 1 1 12 22 21 11

22 1 1 1 1

22 1 22 21 1 12 22 1 1 12 22 21 11

ˆ ~ ˆ ) (

) ( ) ( )}

( ) {(

) , (

ˆ ~ ˆ ) (

) ( ) ( )}

( ) {(

) , (

b q c p c q p c c

b q b b p b b q p b b b b E

a q r p r q p r r

a q a a p a a q p a a a a E

T B

T A

+ +

− +

= − + − − − + − +

= = + − + +

= − + − − − + − +

= = Bq p q p

Aq p q p

プレイヤーＡ，Ｂが混合戦略をとった際の期待利得

⎩⎨ ⎧

≥ ≥

⎩⎨ ⎧

≥ ≥

)) 1 , 0 ( , ( ) , (

)) 0 , 1 ( , ( ) , (

) ), 1 , 0 ((

) , (

) ), 0 , 1 ((

) , (

p q p

q q

p

q q

p

B B

A A

E E

E Theorem 2 より， E

Nash均衡点

2 人非協力非零和ゲーム

V 2人非協力非零和ゲームのNash均衡点

V

プレイヤーＡの最適応答について

⎩⎨

⎧ + + − − − ≥ ≤

⇔

⎩⎨

⎧ + + − − + + + + ≥ ≥ + + − + +

⇔

⎩⎨

⎧ ≥ ≥

0 } ˆ ) ˆ {(

0 ) 1 }(

ˆ ) ˆ {(

~ ˆ ~

ˆ ) (

ˆ ~ ˆ )

~ ( ) ˆ

( ˆ

) ), 1 , 0 ((

) , (

) ), 0 , 1 ((

) , (

1 1

22 1 22 1 1 1 1

22 1 1 22 1 1 1 1

p r q r r

a q r a q r p r q p r r

a q r r q r r a q r p r q p r r

E E

A A

q q

p

q q

p

1

ˆ 0

) ˆ

( r + r q − r >

となる

q

⎩⎨

⎧ − ≥ ≤ 0

0 1

1 1

p p

1

ˆ 0

) ˆ

( r + r q − r =

となる

q

1

ˆ 0

) ˆ

( r + r q − r <

となる

q

⎩⎨

⎧ −

任意

:

: 1

1 1

p p

⎩⎨

⎧ − ≤ ≥ 0

0 1

1 1

p p

故に，

p ∈ R

_A

(q )

となるためには，

1

= 1 p

:

任意

p

1

= 0 p

2 人非協力非零和ゲーム

V 2人非協力非零和ゲームのNash均衡点

V

プレイヤーＢの最適応答について

⎩⎨

⎧ + + + + − ≥ ≤

⇔

⎩⎨

⎧ + + − − + + + + ≥ ≥ − + + − + +

⇔

⎩⎨

⎧ ≥ ≥

0 ~ } ) ˆ {(

0 ) 1

~ }(

) ˆ {(

~ ˆ ) ˆ

( ˆ

ˆ ~ ˆ )

~ ( ) ˆ

( ˆ

)) 1 , 0 ( , ( ) , (

)) 0 , 1 ( , ( ) , (

1 1

22 1 22 1 1 1 1

22 1 1 22

1 1 1 1

q c p c c

b p c b q c p c q p c c

b c p c p c c b q c p c q p c c

E E

B B

p q p

1

~ 0

) ˆ

( c + c p + c >

となる

p

⎩⎨

⎧ − ≥ ≤ 0

0 1

1 1

q q

⎩⎨

⎧ −

任意

:

: 1

1 1

q q

⎩⎨

⎧ − ≤ ≥ 0

0 1

1 1

q q

故に，

q ∈ R

_B

( p )

となるためには，

1

= 1 q

:

任意

q

1

= 0 q

1

~ 0

) ˆ

( c + c p + c =

となる

p

1

~ 0

) ˆ

( c + c p + c <

となる

p

(3)

2 人非協力非零和ゲーム

V 2人非協力非零和ゲームのNash均衡点

V

例：

(6,1) (3,4)

s _A2

(2,7) (6,5)

s _A1

s _B2 s _B1

Ａ＼Ｂ

4 ˆ 7 ˆ )

( r + r q

₁

− r = q

₁

− p ₁

p 2

q ₁ q ₂

⎪⎩

⎪ ⎨

⎧

=

−

=

−

= − = − = −

= − = − =

⎪⎩ =

⎪ ⎨

⎧

−

=

−

=

−

= − = − =

=

3 1

~ ˆ 1 5 4 7 4 1 6 3 6

~ ˆ 6 3 2 4

3 3 6

22 21

12 22

21 11

22 21

12 22

21 11

b b c

b b c b b c

a a r

⎪ ⎩

⎪ ⎨

⎧

=

→

<

→

=

→

>

0 7 : 4

7 : 4

1 7 : 4

1 1

p q

任意

⎪ ⎪

⎩

⎪⎪ ⎨

⎧

=

→

>

→

=

→

<

0 5 : 3

5 : 3

1 5 : 3

1 1

q p

任意

3 ~ 5 ˆ )

( c + c p

₁

+ c = − p

₁

+

p

₁

q

₁

0 1

1 4/7

3/5

プレイヤーＡの最適応答プレイヤーＢ

の最適応答

Nash均衡点

2 人非協力非零和ゲーム

(6,1) (3,4)

s

_A2

(2,7) (6,5)

s

_A1

s

_B2

s

_B1

Ａ＼Ｂ

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B 2

3 4 5 6 Exp

0 0.25

0.5 player A 0.75

E

_A

(p,q)

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B 0

2 4 6 Exp

0 0.25

0.5 player A 0.75

E

_B

(p,q)

E

_A

(p,(4/7,3/7))=30/7 E

_B

((3/5,2/5), q)=23/5

p

₁

q

₁

0 1

1 4/7

3/5

2 人非協力非零和ゲーム

V Theorem 3

V

（混合戦略まで拡大すると，）双行列ゲームには，少なくとも1つNash均衡点が存在する

V Theorem 4 （cf. Theorem 2）

V

（混合）戦略の組がNash均衡点であるための必要十分条件は，が写像の不動点であること．即ち，

*)

*, ( p q

*) (

*

* q q p

p × ∈ R

A

× R

B

*)

*, ( p q

戦略の組が均衡点であるための必要十分性（Theorem 2, 4など）

の証明は，「Brouwerの不動点定理」「角谷の不動点定理」などから

) ( ) ( q

B

p

A

R

R ×

演習１：

V

次の双行列ゲームのNash均衡点を求めよ

(-2 , 2) ( 6 , -8)

s _A2

( 4 , 6) (-24, 12)

s _A1

s _B2 s _B1

Ａ＼Ｂ

Coffee Brake!

V John F. Nash (1928- )

V

紹介サイトの情報

V A Beautiful Mind

いずれも2004年11月9日（火）取得の情報

Non-Cooperative Games Nash [pdf]

補足：補足 2 人非協力零和ゲーム

V 2人非協力零和ゲームのNash均衡点

V例：プレイヤーAの利得表

4 s _A2 -1 -2

s _A1 3

s _B2 s _B1

Ａ＼Ｂ

6 10 ˆ ) ˆ (r+rq1−r= q1−

p

₁

p

₂

q

₁

q

₂

⎪⎩

⎪ ⎨

⎧

=

−

=

−

= − = − − = −

= = − = − − = −

⎪⎩

⎪ ⎨

⎧

−

=

−

=

−

= − = − − =

= = − = − − =

5 ) 4 (

~ ˆ ( ( 1 4 3 ) ) 1 2 4 6 5 4 ) 1

~ ˆ 3 4 ( ( ( 1 2 ) ) 4 6

22 21

12 22

21 11

22 21

12 22

21 11

b b c

b b

c b b

c a a

r a a

r a a r

⎪⎪

⎩

⎪⎪⎨

⎧

=

→

<

→

=

→

>

0 5 : 3

5 : 3

1 5 : 3

1 1

p q

任意

⎪⎩

⎪⎨

⎧

=

→

>

→

=

→

<

0 2 : 1

2 : 1

1 2 : 1

1 1

q p

任意 5

~ 10 ) ˆ

(c+cp₁+c=− p₁+

p

₁

q

₁

0 1

1 3/5

1/2

プレイヤーＡの最適応答

Nash均衡点

プレイヤーＢ

の最適応答

4 5 6 10 ) ,

( = p

1

q

1

− p

1

− q

1

+ E

pq

⎩⎨

⎧ = = − − +

⎩⎨

⎧ = = − − +

4 5 ) ), 1 , 0 (( 1 , 0 ), ) 5 2 , ((

4 6 )) 1 , 0 ( , ( , ( 1 , 0 )) 4 1 (

1 1 1

1

p

E q

E p

E

q q p

p

₁

E

1 0 1/2

1 E

1 0 3/5 q

₁

零和ゲームの場合は

¾最適応答戦略

¾ミニマックス戦略いずれの考え方でも均衡解を求められるよ

(4)

2 人非協力非零和ゲーム

V

例２：囚人のジレンマ

prisoner’s dilemma

V

２人の凶悪犯が別個に取り調べを受けている

V

現状では証拠不十分で軽い罪でしか起訴できないため，２人とも3年

V

各囚人は司法取引を持ちかけられ，応じた方は1年，応じない方は10年，ただし，２人ともが応じた場合は２人とも8年

(8,8) (1,10)

自白

(10,1) (3,3)

黙秘

自白

A

＼

B

黙秘

※司法取引：被告が自分の罪を認める代わりに罪を軽くしてもらうこと注意：値が小さい

方が嬉しい！

最適応答原理に従ってまじめに計算しても…

2 人非協力非零和ゲーム

V

例２：囚人のジレンマ

prisoner’s dilemma

(8,8) (1,10)

自白

(10,1) (3,3)

黙秘

自白

A

^＼

B

黙秘 ^{注意：値が小さい}方が嬉しい！

各プレイヤーとも，「自白自白」が支配戦略！結果として，

（自白，自白）がNash均衡点であり，ゲームは支配可解

} { ⁽⁽ ⁰ ^, ¹ ^), ^q ⁾ ⁰ ≤ ^q ≤ ¹

A

= D

最適応答原理に従って考えても…，

} { ( p , ( 0 , 1 )) 0 ≤ p ≤ 1

B

= D

p ₁ p ₂

q ₁ q ₂

( ) } { ( 0 , 1 ), ( 0 , 1 ) : = D

_A

∩ D

_B

=

D

p

₁

q

₁

0 1

1 ⎩⎨ ⎧

<

−

= + + − = − <

+

0 2

~ 0 ) ˆ (

0 2 0 ˆ ) ˆ (

1 1

p c p c c

q r q r r

⎩⎨ ⎧

= = 0 0

1

q

1

p

注意：±逆で計算

明らかにもっと良い解がある

Pareto最適でない！

2 人非協力非零和ゲーム

V Nash均衡点が最適戦略か？

V 2人零和ゲーム

• ミニマックス戦略が最適戦略！

V 2人非零和ゲーム

•

Nash均衡点が最適戦略を与えるわけではない！

• ゲームの値が異なる複数の均衡点が存在する場合がある！

•

Nash均衡点は，必ずしもPareto最適ではない！

行動の指針を与えてくれる

最適応答原理は不十分かも…！？

（しかし他に適切なものがあるか？）

•得られる解の状態を示すことで，何らかの均衡戦略を

とるべきことを教える

•均衡状態が複数あることを示すことで，戦略決定判断

が困難であることも教える

非協力ゲーム

Nash均衡点の精緻化

協力ゲームへの転換

2 人非協力非零和ゲーム

V

例３：面会ゲーム

V

遠く離れている２人が至急会う必要がある

V

今居る場所は互いにわかっており，会いに行くか，相手が来るのを待つかの選択が出来る．（途中で会うことはない）

(0,0) (10,6)

待つ

(6,10) (-6,-6)

行く

待つ

A

＼

B

行く

⎪ ⎪

⎩

⎪ ⎪

⎨

⎧

⎪⎩

⎪ ⎨

⎧

=

→

< → ∈

= → =

+ >

−

= + +

⎪⎩

⎪ ⎨

⎧

=

→

< → ∈

= → =

+ >

−

=

− +

0 0

] 1 , 0 [ 0

1 0 6

~ 22 ) ˆ (

0 0

] 1 , 0 [ 0

1 0 6 ˆ 22 ˆ ) (

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r

r ^p

1

q

₁

0 1

1 3/11

3/11 Nash均衡点

（（0,1）,（1,0））,

（（3/11,8/11）,（3/11,8/11））,

（（1,0）,（0,1））

2 人非協力非零和ゲーム

p

₁

q

₁

0 1

1 3/11

3/11

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B -5

0 5 10 Exp

0 0.25

0.5 player A 0.75

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B -5

0 5 10 Exp

0 0.25

0.5 player A 0.75

E _A (p,q)

E _B (p,q)

E A (p,(3/11,8/11))=30/11 E _B ((3/11,8/11), q)=30/11

2 人非協力非零和ゲーム

V

例４：弱虫ゲーム

chicken game

V

２人の人間が２台の車をそれぞれ運転する

V

２人は，お互いに向かって車を走らせる

V

２台ともそのまま走り続ければ，やがてぶつかり死ぬため，

直前で回避してよい．

V

しかし，相手より先によけた（進路を変えた）プレイヤーは

「チキン」と罵られ，臆病者のレッテルを貼られる

(-5,-5) (9,0)

避けない

(0,9) (2,2)

避ける

避ける避けない

A

^＼

B

(5)

2 人非協力非零和ゲーム

V

例４：弱虫ゲーム

chicken game

(-5,-5) (9,0)

避けない

(0,9) (2,2)

避ける

避ける避けない

A

^＼

B

⎪ ⎪

⎩

⎪ ⎪

⎨

⎧

⎪⎩

⎪ ⎨

⎧

=

→

< → ∈

= → =

+ >

−

= + +

⎪⎩

⎪ ⎨

⎧

=

→

< → ∈

= → =

+ >

−

=

− +

0 0

] 1 , 0 [ 0

1 0 5

~ 12 ˆ ) (

0 0

] 1 , 0 [ 0

1 0 5 12 ˆ ) ˆ (

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r r

p

₁

q

₁

0 1

1 5/12

5/12

Nash均衡点

（（0,1）,（1,0））,

（（5/12,7/12）,（5/12,7/12））,

（（1,0）,（0,1））

E

_A

(p,(5/12,7/12))=10/12 E

_B

((5/12,7/12), q)=10/12 (9,0)

(0,9)

2 人非協力非零和ゲーム

V

例１：恋人達のジレンマ

battle of sexes

(1,2) (-1,-1)

映画

(-1,-1) (2,1)

野球

⎪ ⎪

⎩

⎪ ⎪

⎨

⎧

⎪⎩

⎪ ⎨

⎧

=

→

< → ∈

= → =

− >

= + +

⎪⎩

⎪ ⎨

⎧

=

→

< → ∈

= → =

− >

=

− +

0 0

] 1 , 0 [ 0

1 0 3

~ 5 ˆ ) (

0 0

] 1 , 0 [ 0

1 0 2 5 ˆ ) ˆ (

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r r

p

₁

q

₁

0 1

1 2/5

3/5

Nash均衡点

（（1,0）,（1,0））,

（（3/5,2/5）,（2/5,3/5））,

（（0,1）,（0,1））

E

_A

(p,(5/12,7/12))=1/5 E

_B

((5/12,7/12), q)=1/5 (2,1)

(1,2)

2 人非協力非零和ゲーム

V

例５：純粋戦略全ての組合せがNash均衡

(4,4) (8,4) s

_A2

(4,8) (8,8) s

_A1

s

_B2

s

_B1

A

＼

B

友情ルール

友情ルール：自分の利得が同じならば，

相手の利得が大きい方の戦略を選ぶ

Nash均衡点の精緻化

全ての戦略の組がNash均衡点！

（s_A_１

,s

_B1）が均衡点となる

弱支配

2 人非協力非零和ゲーム

V

例６：共有地の悲劇（囚人のジレンマのn人拡張版）

V数軒の酪農家が共有の牧草地を所有している．各酪農家が先を争って牛を放牧し，自分の利益最大をはかる限り，牛の数を増やし続けると，

待っているのは共有地の荒廃という悲劇である．

V単純なモデルでの考察

• 酪農家は4軒

(i=1,2,3,4)

• 酪農家iが放牧する牛の数

q

_i

• 各酪農家は3頭まで牛を購入でき，購入価格は全て等しく2

• 酪農家iの収益をx_iとし，x_i

= q

_i

{16－(q

₁

+ q

₂

+ q

₃

+ q

₄

)}－2 q

_i

12 10 6 0 7

15 12 7 0 6

18 14 8 0 5

21 16 9 0 4

24 18 10 0 3

27 20 11 0 2

6 6 4 0 9

30 22 12 0 1

33 24 13 0 0 0 0

2 8 3 9 1 5

8 i

＼

others

たくさん放牧すると収益が減る！

Nash均衡点

Nash 均衡点と線形相補性問題

V Definition 戦略的同等性

V

ゲームGのNash均衡点がG’のそれであり，かつその逆も成立するとき，

2

つのゲームは戦略的に同等戦略的に同等であるという

V Theorem 5

V 2つの双行列ゲームG, G’において，任意の要素について，

という関係があるとき，GとG’は戦略的に同等である

⎩ ⎨

⎧ ′ ′ = = + +

∃

>

∃

2 2

1 1 2 1 2

1

0 , α 0 , β , β , α α β β

α

ij ij

b b

a a

V

例：

(5,-2) (-2,4) s

_A2

(0,2) (3,-1) s

_A1

s

_B2

s

_B1

A

＼

B

(9,-4) (-5,14) s

_A2

(-1,8) (5,-1) s

_A1

s

_B2

s

_B1

A

＼

B

戦略的同等

2 , 3 , 1 ,

2

₁ ₂ ₂

1

= β = − α = β =

α

G G’

Nash 均衡点と線形相補性問題

V Nash均衡点を求める

Nash均衡点 ⁽ ^p ^, ^q ^) ^Th.2 ⎩ ⎨ ⎧

=

∀

≥

= ≥ ∀ =

=

n j s E E

v

m i s E E

v

j i

B B B

A A A

, , 1 )

*, (

*)

*, ( :

, , 1

*) , (

*)

*, ( :

2 1

L L p

q p

q q

p

⎪⎩

⎪ ⎨

⎧

=

∀

≥

=

∀

≥

∑ ∑

=

n j p b v

m i q a v

m

i ij j

n

j ij j

, , 1

1

* 2

1

* 1

L L

Th.5 ⎪⎩

⎪ ⎨

⎧

=

∀

≥

=

∀

≥

∑ ∑

=

n j p b v

m i q a v

m

i ij j

n

j ij j

, , 1

~

, , 1

~

1

* 2

1

* 1

L

L ( ^∀ i ^, j ^, a ^~

ij

^, ^~ b

ij

^> ⁰ )

ただし，

0 ,

2 1

v >

v

⎪⎩

⎪ ⎨

⎧

=

∀

≥

=

∀

≥

∑ ∑

=

n j p b

m i q a

m i ij i n

j ij j

, , 1

~ 1 ~

, , 1

~ 1 ~

1 1

L L

⎩ ⎨

⎧

=

2

* 1

*

~ : :

~ v p p

v q q

i i

j j

ただし，

⎪⎩

⎪ ⎨

⎧

=

≥

−

=

≥

−

=

∑ ∑

=

) , , 1 ( 0)

~ ( 1 ~ :

) , , 1 ( 0)

~ ( 1 ~ :

1 1

n j p b w

m i q a u

m i ij i j

n

j ij j

i

L

とおく

(6)

Nash 均衡点と線形相補性問題

V Proposition 1 相補性 complementarity

⎪⎩

⎪ ⎨

⎧

−

=

−

=

∑ ∑

=

= m

i ij i

j n

j ij j

i

p b w

q a u

1 1

~ ~ 1 :

~ 1 ~ :

⎪⎩

⎪ ⎨

⎧

=

∑ ∑

=

) , , 1 (

~ 0

) , , 1 (

~ 0

1 1

m i q w

n j p u

n

j j j

m

i i i

L L

Nash均衡点

が存在するまとめると…

) , , 1 ( 0 ,

0 0

) , , 1 (

~ 1 :

) , , 1 (

~ 1 :

1 1

n j q w

m i p u

q w

p u

n j p b w

m i q a u

j j

i i

n

j j j

m

i i i

m i ij i j

n j ij j i

L L L L

=

≥ =

≥

=

−

=

−

=

∑ ∑ ∑ ∑

=

を満たす

^u _w ^, _, ^p _q ⁽ ₍ ⁱ _j ¹ ^, ₁ _, ^, ^m _, _n ⁾ ₎

が存在

j j

i

L L

= =

が成立

Nash 均衡点と線形相補性問題

V LCP, Linear Complementarity Problem

) , , 1 ( 0 ,

0 0

) , , 1 (

~ 1 :

) , , 1 (

~ 1 :

1 1

n j q w

m i p u

q w

p u

n j p b w

m i q a u

j j

i i

n

j j j

m

i i i

m i ij i j

n j ij j i

L L L L

=

≥ =

≥

=

−

=

−

=

∑ ∑ ∑ ∑

=

を満たす解

⎩ ⎨

⎧ = =

) , , 1 ( ,

n j q w

m i p u

j j

i

L L

⎪⎩

⎪ ⎨

⎧

=

= ∑ ∑

j j j j

i i i i

q q q

p p p

: :

*

がNash均衡点

⎥ ⎦

⎢ ⎤

⎣

⎡

−

= −

⎥ ⎥

⎥

⎦

⎤

⎢ ⎢

⎢

⎣

⎡

=

⎥ ⎥

⎥

⎦

⎤

⎢ ⎢

⎢

⎣

⎡

=

⎥ ⎥

⎥

⎦

⎤

⎢ ⎢

⎢

⎣

⎡

= B 0

A M 0

z y

x , :

_T

1 1 1 1 : , : , :

1 1

M M M M M M

n m

w w u u

q q p p 0

y x

x y

z Mx y

= ≥ +

= ) , (

, 0

,

T

ただし，

B=-AだとLP

⇔ 零和ゲーム

Lemke法（M≧0）

内点法（M：PSD,P₀

,…）

戦略形ゲームの応用

（岡田章『ゲーム理論』p.49-59等）

V

応用例１：クールノー複占市場

V

2企業（i=1,2）が同質な財を生産し，同一市場に供給している

V企業iの供給量q_i

(

≧0) → 財の価格

p=max{a－b(q

₁

+ q

₂

), 0}, (a,b>0)

V企業iの費用関数

C

_i

(q

_i

)= c

_i

q

_i

, (0<c

_i

<a)

V企業iの利潤関数π_i

(q

₁

, q

₂

)=pq

_i－

c

_i

q

_i

限界費用限界費用

各企業は利潤最大化利潤最大化したい！

クールノー・ナッシュ均衡

Cournot-Nash equilibrium

⎪⎩

⎪ ⎨

⎧

=

⇔ =

≥

) , ( max ) , (

) , ( max ) , ( . . . : ) , (

2

* 1 0 2

* 2

* 1 2

* 2 1 0 1

* 2

* 1

* 1 2

* 1

2 1

q q q

q

q q q

q eq N C q q

q

π

π π

V企業i（=1,2）の企業j（≠i）に対する最適応答対応

⎪ ⎩

⎪ ⎨

⎧

− <

≤ −

≤

− −

=

⇒

⎩ ⎨

⎧ − − − + ≤ − < ≤ −

=

i i

i i i j

i

i j i

i

j i i i

i

b q c

a b

c q a q b

c a q

q q b a q

c

q b a q q q q b c q a q

if 0

0 if 2 2

/ if

/ 0 if )) ( ) (

, (

*

2 1 2

π

1

⎥⎦

⎢ ⎤

⎣

⎡ < =

∂

= ∂

∂

∂ 0, 0 ( 1,2)

) ₂

2

i q

q i

i i

i π

Q π

p＞0

p＝0

戦略形ゲームの応用

V

応用例１：クールノー複占市場

⎪ ⎩

⎪ ⎨

⎧

− <

≤ −

≤

− −

i i

i i i j

b q c

a b

c q a q b

c a

if 0

0 if 2 2

b c a

2 −

2

b c a −

1

b c a −

2

b c a

2 −

1

q

₁

q

₂

0

) , 2 , 1 (

2 i j i

b c a b

c

a i − j = ≠

− ≤

の場合

クールノー・ナッシュ均衡点

⎟ ⎠

⎜ ⎞

⎝

⎛ − + + −

= b

c c a b

c c q a

q 3

, 2 3 ) 2 ,

(

^*2 ¹ ² ¹ ²

* 1

* a c 3

¹

c

²

p = + +

⎪ ⎩

⎪ ⎨

⎧

−

= + +

= −

b c c q a q

9 ) 2 ) ( , (

2 2 1

* 1

* 1 2

2 2

* 1 1

π π

各企業の利潤財の価格

パレート最適ではない例：c₁

=c

₂の時，q₁

=q

₂

=(a-c)/4b

とした方が，どちらの企業もより多くの利潤が得られる

戦略形ゲームの応用

V

応用例２：寄付金ゲーム

Vある町の町長が，公共事業のため，n人の住人に寄付を募る

V各住人は，寄付額

0円～1000円を自分の好きな分だけ寄付

V寄付総額の2倍を，n人の住人に均等に分配する

V住人i (=1,…,n) の戦略（寄付額）：

x

_i （0≦x_i≦1000）

V住人i (=1,…,n) の利得関数： _i

n

k k n

i

x x x x

u = ∑ −

=1

1

, , ) 2

( L

n>2

の時，戦略

x

_i

*=0 が，他の戦略 x

_i

>0 に対する支配戦略となる！

戦略の組

**x*=(0,…,0) が唯一の均衡点，**

即ち，誰も寄付しない誰も寄付しない！

寄付はいくら集まるだろう？

パレート最適ではない全ての住人が1000円寄付すると，全ての住民の利得は1000 円であり，均衡点より望ましい

しかし，x=(1000,…,1000)では，

どの住民も裏切る動機を持つ

) 1000 1 ( 2000 ) , 0

(

−

= − >

n x n u

_i _i ただ乗り

ただ乗り

free- free -riding riding：

他人の貢献を利用して個人的利益を得る行為

戦略形ゲームの応用

V

応用例３：電力消費ゲーム

Vある都市で，n人の住人がクーラーを所持．暑い日の出来事

V各住人i (=1,…,n)の戦略と，その費用，及び効用は，

• 戦略：低温設定（x_i

=α)，電力消費1000W，効用U

• 戦略：中温設定（x_i

=β)，電力消費500W，効用u

（U>u>0) Vこの都市の停電確率は，総電力量をQとしたとき，

n c Q n

c c Q Q

P 1 ( if ) where 500 1000

) 0 if ( ) 0

( < <

⎩⎨ ⎧

< ≤ ≤

=

停電臨界点停電臨界点

V節電する住人の数をs (0≦

s

≦

n)とすると，総電力消費量は

•

Q(s) := 500s + 1000(n-s)=1000n-500s

V住人i の効用は

•

⎪⎩

⎪ ⎨

⎧

=

≤ =

< ≤

=

)) , ) ( if (

) , ) ( if (

)) ( if ( 0 ) , , (

1

α β

i i n

i

x c s Q u

x c s Q U

s Q c x

x

u L

減少関数Q(s)について，Q(s’)≦c≦Q(s’-1) を満たすs’が唯一定まり，0≦s*≦s’-2, s*=s’を満たす全てのsが均衡点

(7)

戦略形ゲームの応用

V

応用例３：電力消費ゲーム

s Q

0 1000n

s’-1 s’ s’+1 n s’-2

均衡点

c

都市停電停電！

•全住人の効用は0．

•1人の住人だけ設定を変えても

効用は0のままなので均衡状態都市停電停電せず

•低温設定住人の効用U

•中温設定住人の効用u

•中温設定の1人でも低温に変更

すると停電（効用がu→0)より均衡状態

戦略形ゲーム

V

囚人のジレンマ型ゲーム

(T ₁ , T ₂ ) (B ₁ , W ₂ )

D

(W ₁ , B ₂ ) (S ₁ , S ₂ )

C

D C

A

^＼

B

ただし，B_i

(best) > S

i

(second) > T

i

(third) > W

i

(worst)

さらに

も満たすならば，『標準的標準的な囚人のジレンマ型ゲーな囚人のジレンマ型ゲーム』とよばれるム

) 2 , 1 ( 2 =

= B + W i S

_i ⁱ ⁱ 異なる戦略を交互に取る，即ち，

(C,D)→(D,C)→(C,D)→…

とするときの期待利得が，協調行動(C,C)の利得より小さい状況

⎩⎨

⎧ = = − − < > = = − − > < = = − − > <

) 0

~ ( ), 0 ( ˆ ), 0 (

) 0

~ ( ), 0 ( ˆ ), 0 (

2 2 2

1 1 1

T W c B T c W S c

T B r W T r B S r

⎪⎩

⎪ ⎨

⎧

=

→

< → ∈

= → =

⎪⎩ >

⎪ ⎨

⎧

=

→

< → ∈

= → =

>

⇒

⎩⎨ ⎧

+ +

= + −

=

0 0 ) (

] 1 , 0 [ 0 )

( ) 0 1

(

, 0 0 ) (

] 1 , 0 [ 0 ) (

1 0 ) (

) ~ ( ˆ : ) (

) ˆ ( ˆ : ) (

2 1 2

1 2 1

1 1 2

1 2 1

q p f

q p

f p q

f p q f

p q f

c p c c p f

r q r r q f

⎩ ⎨

⎧

= =

⇒

⎩⎨

⎧ + + − + < <

⇒

⎪⎩

⎪ ⎨

⎧

=

−

≤

−

= − + −

= + ≤ +

0 0

~ 0 ˆ ) (

0 ˆ ) ˆ (

) ~ ( ) (

) ( ) ˆ (

ˆ ˆ

* 1

1 1

2 2 2 2 2 2

2 2 2 2

q p

c p c c

r q r r

c T W T W B S

B T W S c c

r r r

→

Nash均衡は(D,D)

戦略形ゲーム

V

演習：

V

身近な所，あるいは社会において，囚人のジレンマと同じ状況となっていると思われる例を２つ上げよ．

参考文献

V

鈴木光男「ゲーム理論入門」共立出版（1981, 2003^{（新装版）}）

V

鈴木光男「新ゲーム理論」勁草書房（1994）

V

岡田章「ゲーム理論」有斐閣（1996）

V

今野浩「線形計画法」日科技連（1987）

V R. Axelrod,

松田裕之訳「つきあい方の科学」ミネルヴァ書房（1998）

V ……

V 2人非協力非零和ゲーム

意思決定科学： ゲーム理論２

2007/30,Fri. ～

Contents