• 検索結果がありません。

V 2人非協力非零和ゲーム

N/A
N/A
Protected

Academic year: 2021

シェア "V 2人非協力非零和ゲーム"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

意思決定科学: ゲーム理論2

情報学部 堀田敬介

2006/11/17,Fri. ~

Contents

V 2人非協力非零和ゲーム

V

定義:ゲームのルール,双行列

V

例:囚人のジレンマ,面会ゲーム,恋人達のジレンマ,…

V

最適応答,

Nash

均衡点

V Nash均衡点と線形相補性問題(LCP)

V

戦略形ゲームの社会・経済問題への応用例

2 人非協力非零和ゲーム

V

ゲームのルール

V

プレイヤーの数は2人

V

各プレイヤーは,独立に自分の戦略を決定(非協力)

V

プレイヤーの利得の和は一定とは限らない(非零和)

V

ゲームは1回限り

V

各プレイヤーは戦略決定時に,他のプレイヤーがどの 戦略をとるかは知らない

V

純粋戦略の数は有限

⎩ ⎨

⎧ = =

} , , , {

} , , , {

2 1

2 1

n m B B B B

A A A A

s s s S

s s s S

L L } 2 , 1

= { N

2 人非協力非零和ゲーム

V

双行列ゲーム

V

利得関数

V

利得行列

) , ( : ) , ( ) , ( ) , (

) , ( ) , ( ) , (

) , ( ) , ( ) , (

2 2 1 1

2 2 22

22 21 21

1 1 12

12 11 11

B A b

a b

a b a

b a b

a b a

b a b

a b a

mn mn m

m m m

n n

n n

=

⎥ ⎥

⎥ ⎥

⎢ ⎢

⎢ ⎢

L M O M M

L L

ij B A B ij B A

A

s s a f s s b

f j i

j i j

i

= =

∀ , , ( , ) , ( , ) ]

[ ], [ a

ij

= b

ij

= B

A

プレイヤーBの戦略(n個)の利得(右側)

プレイヤーA の戦略(m個)

の利得(左側)

双行列 双行列 和が零(一定)という条件はない(非零和)

2 人非協力非零和ゲーム

V

例1:恋人達のジレンマ

battle of sexes

V

ある一組のカップルがデートをしたいと思っている

V

男性は野球観戦を希望し,女性は映画鑑賞がしたい

V

各々が好きなものを見るより一緒にいることの方が大事

(1,2) (-1,-1)

映画

(-1,-1) (2,1)

野球

映画 野球

性の戦い,男女の戦い,

逢引きのジレンマ,…

互いに支配戦略は持たない

ミニマックス原理に従うと,互いにどちらの戦略でも良い?

(または各戦略のマックスが大きくなる方を選ぶ!?)

1 min max

ij

= −

j

i

a

1 min max

ij

= −

j

i

b

2 人非協力非零和ゲーム

V

例1:恋人達のジレンマ

battle of sexes

V零和ゲームの時と全く同じやり方で,混合戦略でミニマックス原理に基 づき期待利得最大化をしてみると…

(1,2) (-1,-1)

映画

(-1,-1) (2,1)

野球

映画 野球

p 1 p 2

q 1 q 2

⎩⎨

⎧ = = − − − − + +

2 2 1 2 2 1 1 1

2 2 1 2 2 1 1

1

2

) , (

2 ) , (

q p q p q p q p E

q p q p q p q p E

B

A

p q

q p

⎩⎨

⎧ = = − − +

1 2 )) 1 , 0 ( , (

1 3 )) 0 , 1 ( , (

1 1

p E

p E

A

A

p

p

⎩⎨

⎧ = = − − +

2 3 ) ), 1 , 0 ((

1 2 ) ), 0 , 1 ((

1 1

q E

q E

B

B

q

q

5 ) 1 ˆ , ˆ ( 5 , ) 1 ˆ , ˆ ( , 5 ) , 2 5 ( 3 5 ), , 3 5 ( 2 ) ˆ , ˆ

( ⎟ = =

⎜ ⎞

= ⎛ p q p q

q

p E

A

E

B

ところが…

5 ) 1 , ˆ

( = p

1

E

A

p q

5 ) 4 ˆ , ( = − q

1

+ E

B

p q Bが

をとるならAは

ではなく(1,0)にする方が 期待利得が高くなる!

q ˆ p ˆ Aが

をとるならBは ではなく(0,1)にする方が 期待利得が高くなる!

q ˆ p ˆ

均衡しない!

(2)

V

最適応答対応

best response correspondence

Bの戦略 に対するAの最適応答の集合

を,プレイヤーAの最適応答対応プレイヤーAの最適応答対応とよび,

を,プレイヤーAの最適応答集合最適応答集合とよぶ

V Definition 最適応答と最適応答対応

V

最適応答

best response

プレイヤーAの戦略 が,プレイヤーBの戦略 に対 する最適応答最適応答であるとは,以下が成り立つこと

2 人非協力非零和ゲーム

A

A

S

ss

B

S

B

) , ( max ) ,

( p q p q

p A

A

E

E =

) , ( max ) ,

(

A A B

S B s A

A

s s f s s

f

A A

=

純粋戦略の場合

混合戦略の場合

B

B

S

s

} { ( , ) max ( , ) )

(

A A B

S B s A A A A B

A

s s S f s s f s s

R

A

A

=

=

} { (

A

,

B

)

A A

(

B

),

B B

A

s s s R s s S

D = ∈ ∈

} { ( , ) max ( , ) )

( q p p q p q

p A

A

A

E E

R = =

純粋戦略 の場合 混合戦略

の場合

2人零和ゲームでは,

ミニマックス原理は 最適応答原理に帰着

最適応答原理 最適応答原理

プレイヤーAの(純戦略での)最適応答

s

B1

max{7,8,4} = 8

s

B2

max{0,6,3} = 6 s

B3

max{5,2,6} = 6 V

最適応答と最適応答対応

プレイヤーA,Bが各々最適応答をとる場合,その組の集合は となる

2 人非協力非零和ゲーム

B

A

D

D D : = ∩

(6,2) (3,1) (4,5)

s A3

(2,7) (6,6) (8,0)

s A2

(5,5) (0,8) (7,7)

s A1

s B3 s B2 s B1

V

例:

} { ) (

} { ) (

} { ) (

3 3

2 2

2 1

A B A

A B A

A B A

s s R

s s R

s s R

= =

=

} { (

A2

,

B1

), (

A2

,

B2

), (

A3

,

B3

)

A

s s s s s s

D =

プレイヤーBの(純戦略での)最適応答

s

A1→max{7,8,5} = 8

s

A2

max{0,6,7} = 7

s

A3→max{5,1,2} = 5

( ) { } } { ) (

} { ) (

1 3

3 2

2 1

B A B

B A B

B A B

s s R

s s R

s s R

= =

=

} { ( , ), ( , ), ( , )

1 3 2 1 3

2 B A B A B

A

B

s s s s s s

D =

互いに最適応答なら均衡する

D ≠ ∅

なら均衡)

より,

純粋戦略のみでは 均衡しない

D =

2 人非協力非零和ゲーム

V Definition Nash均衡点 Nash equilibrium point V

(混合)戦略の組 が次の条件を満たすとき,

Nash均衡点 Nash

均衡点とよぶ

*)

*, ( p q

q q p q p

p q p q

p ≥ ≥ ∀ ∀

)

*, (

*)

*, (

*) , (

*)

*, (

B B

A A

E E

E E

V Theorem 1

V

(混合)戦略の組 が互いに最適応答であるならば

Nash均衡点であり,逆も成り立つ.即ち,Nash均衡点の集

合を

E

とすると,

B

A D

D E = ∩

ˆ ) ˆ , ( p q

Nash均衡点は,零和ゲー

ムの均衡点(鞍点)を含む

一般的な概念

*)

*, ( p q

V Theorem 2

V

(混合)戦略の組 がNash均衡点であるた めの必要十分条件は

*)

*, ( p q

n j s E E

m i s E E

j i

B B B

A A A

, , 1 )

*, (

*)

*, (

, , 1

*) , (

*)

*, (

L

= L

≥ ∀ =

p q p

q q

p

2 人非協力非零和ゲーム

V 2人非協力非零和ゲームのNash均衡点

[ A, B ]

) , ( ) , (

) , ( ) , (

22 22 21 21

12 12 11

11

⎥ =

⎢ ⎤

b a b a

b a b p 1 a p 2

q 1 q 2

⎩⎨

⎧ ≥ ≥ ≥ ≥ + + = = 1 , 0 , 0

1 , 0 , 0

2 1 2 1

2 1 2 1

q q q q

p p p p

22 1 1 1 1

22 1 22 21 1 12 22 1 1 12 22 21 11

22 1 1 1 1

22 1 22 21 1 12 22 1 1 12 22 21 11

ˆ ~ ˆ ) (

) ( ) ( )}

( ) {(

) , (

ˆ ~ ˆ ) (

) ( ) ( )}

( ) {(

) , (

b q c p c q p c c

b q b b p b b q p b b b b E

a q r p r q p r r

a q a a p a a q p a a a a E

T B

T A

+ +

− +

= − + − − − + − +

= = + − + +

= − + − − − + − +

= = Bq p q p

Aq p q p

プレイヤーA,Bが混合戦略をとった際の期待利得

⎩⎨ ⎧

≥ ≥

⎩⎨ ⎧

≥ ≥

)) 1 , 0 ( , ( ) , (

)) 0 , 1 ( , ( ) , (

) ), 1 , 0 ((

) , (

) ), 0 , 1 ((

) , (

p q p

p q p

q q

p

q q

p

B B

B B

A A

A A

E E

E E

E E

E Theorem 2 より, E

Nash均衡点

2 人非協力非零和ゲーム

V 2人非協力非零和ゲームのNash均衡点

V

プレイヤーAの最適応答について

⎩⎨

⎧ + + − − − ≥ ≤

⎩⎨

⎧ + + − − + + + + ≥ ≥ + + − + +

⎩⎨

⎧ ≥ ≥

0 } ˆ ) ˆ {(

0 ) 1 }(

ˆ ) ˆ {(

~ ˆ ~

ˆ ) (

ˆ ~ ˆ )

~ ( ) ˆ

( ˆ

) ), 1 , 0 ((

) , (

) ), 0 , 1 ((

) , (

1 1

1 1

22 1 22 1 1 1 1

22 1 1 22 1 1 1 1

p r q r r

p r q r r

a q r a q r p r q p r r

a q r r q r r a q r p r q p r r

E E

E E

A A

A A

q q

p

q q

p

1

1

ˆ 0

) ˆ

( r + r qr >

となる

q

⎩⎨

⎧ − ≥ ≤ 0

0 1

1 1

p p

1

1

ˆ 0

) ˆ

( r + r qr =

となる

q

1

1

ˆ 0

) ˆ

( r + r qr <

となる

q

⎩⎨

⎧ −

任意

任意

:

: 1

1 1

p p

⎩⎨

⎧ − ≤ ≥ 0

0 1

1 1

p p

故に,

pR

A

(q )

となるためには,

1

= 1 p

:

任意

p

1

1

= 0 p

2 人非協力非零和ゲーム

V 2人非協力非零和ゲームのNash均衡点

V

プレイヤーBの最適応答について

⎩⎨

⎧ + + + + − ≥ ≤

⎩⎨

⎧ + + − − + + + + ≥ ≥ − + + − + +

⎩⎨

⎧ ≥ ≥

0

~ } ) ˆ {(

0 ) 1

~ }(

) ˆ {(

~ ˆ ) ˆ

( ˆ

ˆ ~ ˆ )

~ ( ) ˆ

( ˆ

)) 1 , 0 ( , ( ) , (

)) 0 , 1 ( , ( ) , (

1 1

1 1

22 1 22 1 1 1 1

22 1 1 1 22

1 1 1 1

q c p c c

q c p c c

b p c b q c p c q p c c

b c p c p c c b q c p c q p c c

E E

E E

B B

B B

p q p

p q p

1

1

~ 0

) ˆ

( c + c p + c >

となる

p

⎩⎨

⎧ − ≥ ≤ 0

0 1

1 1

q q

⎩⎨

⎧ −

任意

任意

:

: 1

1 1

q q

⎩⎨

⎧ − ≤ ≥ 0

0 1

1 1

q q

故に,

qR

B

( p )

となるためには,

1

= 1 q

:

任意

q

1

1

= 0 q

1

1

~ 0

) ˆ

( c + c p + c =

となる

p

1

1

~ 0

) ˆ

( c + c p + c <

となる

p

(3)

2 人非協力非零和ゲーム

V 2人非協力非零和ゲームのNash均衡点

V

例:

(6,1) (3,4)

s A2

(2,7) (6,5)

s A1

s B2 s B1

4 ˆ 7 ˆ )

( r + r q

1

r = q

1

p 1

p 2

q 1 q 2

⎪⎩

⎪ ⎨

=

=

= − = − = −

= − = − =

⎪⎩ =

⎪ ⎨

=

=

= − = − =

= − = − =

=

3 1

~ ˆ 1 5 4 7 4 1 6 3 6

~ ˆ 6 3 2 4

3 3 6

22 21

12 22

21 11

22 21

12 22

21 11

b b c

b b c b b c

a a r

a a r

a a r

⎪ ⎩

⎪ ⎨

=

<

=

=

>

0 7 : 4

7 : 4

1 7 : 4

1 1

1 1

1 1

p q

p q

p q

任意

⎪ ⎪

⎪⎪ ⎨

=

>

=

=

<

0 5 : 3

5 : 3

1 5 : 3

1 1

1 1

1 1

q p

q p

q p

任意

3

~ 5 ˆ )

( c + c p

1

+ c = − p

1

+

p

1

q

1

0 1

1

4/7

3/5

プレイヤーA の最適応答 プレイヤーB

の最適応答

Nash均衡点

2 人非協力非零和ゲーム

(6,1) (3,4)

s

A2

(2,7) (6,5)

s

A1

s

B2

s

B1

A\B

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B 2

3 4 5 6 Exp

0 0.25

0.5 player A 0.75

E

A

(p,q)

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B 0

2 4 6 Exp

0 0.25

0.5 player A 0.75

E

B

(p,q)

E

A

(p,(4/7,3/7))=30/7 E

B

((3/5,2/5), q)=23/5

p

1

q

1

0 1

1

4/7

3/5

2 人非協力非零和ゲーム

V Theorem 3

V

(混合戦略まで拡大すると,)双行列ゲームには,少なくと も1つNash均衡点が存在する

V Theorem 4 (cf. Theorem 2)

V

(混合)戦略の組 がNash均衡点であるための必要 十分条件は, が写像 の不動点であ ること.即ち,

*)

*, ( p q

*) (

*) (

*

* q q p

p × ∈ R

A

× R

B

*)

*, ( p q

戦略の組が均衡点であるための必要十分性(Theorem 2, 4など)

の証明は,「Brouwerの不動点定理」「角谷の不動点定理」などから

) ( ) ( q

B

p

A

R

R ×

演習1:

V

次の双行列ゲームのNash均衡点を求めよ

(-2 , 2) ( 6 , -8)

s A2

( 4 , 6) (-24, 12)

s A1

s B2 s B1

Coffee Brake!

V John F. Nash (1928- )

V

紹介サイトの情報

V A Beautiful Mind

いずれも2004年11月9日(火)取得の情報

Non-Cooperative Games Nash [pdf]

2 人非協力非零和ゲーム

V

例2:囚人のジレンマ

prisoner’s dilemma

V

2人の凶悪犯が別個に取り調べを受けている

V

現状では証拠不十分で軽い罪でしか起訴できないため,2 人とも3年

V

各囚人は司法取引を持ちかけられ,応じた方は

1

年,応じな い方は10年,ただし,2人ともが応じた場合は2人とも8年

(8,8) (1,10)

自白

(10,1) (3,3)

黙秘

自白

A

B

黙秘

※司法取引:被告が自分の罪を認める代わりに罪を軽くしてもらうこと 注意:値が小さい

方が嬉しい!

(4)

最適応答原理に従ってまじめに計算しても…

2 人非協力非零和ゲーム

V

例2:囚人のジレンマ

prisoner’s dilemma

(8,8) (1,10)

自白

(10,1) (3,3)

黙秘

自白

A

B

黙秘 注意:値が小さい方が嬉しい!

各プレイヤーとも,「自白自白」が支配戦略! 結果として,

(自白,自白)がNash均衡点であり,ゲームは支配可解

} { (( 0 , 1 ), q ) 0q1

A

= D

最適応答原理に従って考えても…,

} { ( p , ( 0 , 1 )) 0p1

B

= D

p 1 p 2

q 1 q 2

( ) } { ( 0 , 1 ), ( 0 , 1 ) : = D

A

D

B

=

D

p

1

q

1

0 1

1

⎩⎨ ⎧

<

= + + − = − <

+

0 2

~ 0 ) ˆ (

0 2 0 ˆ ) ˆ (

1 1

1 1

p c p c c

q r q r r

⎩⎨ ⎧

= = 0 0

1

q

1

p

注意:±逆で計算

明らかにもっと良い解がある

Pareto最適でない!

2 人非協力非零和ゲーム

V Nash均衡点が最適戦略か?

V 2

人零和ゲーム

ミニマックス戦略が最適戦略!

V 2人非零和ゲーム

• Nash均衡点が最適戦略を与えるわけではない!

ゲームの値が異なる複数の均衡点が存在する場合がある!

• Nash均衡点は,必ずしもPareto最適ではない!

行動の指針を与えてくれる

最適応答原理は不十分かも…!?

(しかし他に適切なものがあるか?)

•得られる解の状態を示すことで,何らかの均衡戦略を

とるべきことを教える

•均衡状態が複数あることを示すことで,戦略決定判断

が困難であることも教える

非協力ゲーム

Nash均衡点の精緻化

2 人非協力非零和ゲーム

V

例3:面会ゲーム

V

遠く離れている2人が至急会う必要がある

V

今居る場所は互いにわかっており,会いに行くか,相手が 来るのを待つかの選択が出来る.(途中で会うことはない)

(0,0) (10,6)

待つ

(6,10) (-6,-6)

行く

待つ

A

B

行く

⎪ ⎪

⎪ ⎪

⎪⎩

⎪ ⎨

=

< = > → → ∈ = +

= + +

⎪⎩

⎪ ⎨

=

< → ∈

= → =

+ >

=

− +

0 0

] 1 , 0 [ 0

1 0 6

~ 22 ) ˆ (

0 0

] 1 , 0 [ 0

1 0 6 ˆ 22 ˆ ) (

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r

r p

1

q

1

0 1

1

3/11

3/11 Nash均衡点

((0,1),(1,0)),

((3/11,8/11),(3/11,8/11)),

((1,0),(0,1))

2 人非協力非零和ゲーム

p

1

q

1

0 1

1

3/11

3/11

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B -5

0 5 10 Exp

0 0.25

0.5 player A 0.75

0 0.25

0.5 0.75

1 player A

0 0.25

0.5 0.75

1

player B -5

0 5 10 Exp

0 0.25

0.5 player A 0.75

E A (p,q)

E B (p,q)

E A (p,(3/11,8/11))=30/11 E B ((3/11,8/11), q)=30/11

2 人非協力非零和ゲーム

V

例4:弱虫ゲーム

chicken game

V

2人の人間が2台の車をそれぞれ運転する

V

2人は,お互いに向かって車を走らせる

V

2台ともそのまま走り続ければ,やがてぶつかり死ぬため,

直前で回避してよい.

V

しかし,相手より先によけた(進路を変えた)プレイヤーは

「チキン」と罵られ,臆病者のレッテルを貼られる

(-5,-5) (9,0)

避けない

(0,9) (2,2)

避ける

避ける 避けない

A

B

2 人非協力非零和ゲーム

V

例4:弱虫ゲーム

chicken game

(-5,-5) (9,0)

避けない

(0,9) (2,2)

避ける

避ける 避けない

A

B

⎪ ⎪

⎪ ⎪

⎪⎩

⎪ ⎨

=

< = > → → ∈ = +

= + +

⎪⎩

⎪ ⎨

=

< → ∈

= → =

+ >

=

− +

0 0

] 1 , 0 [ 0

1 0 5

~ 12 ˆ ) (

0 0

] 1 , 0 [ 0

1 0 5 ˆ 12 ˆ ) (

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r r

p

1

q

1

0 1

1

5/12

5/12

Nash均衡点

((0,1),(1,0)),

((5/12,7/12),(5/12,7/12)),

((1,0),(0,1))

E

A

(p,(5/12,7/12))=10/12 E

B

((5/12,7/12), q)=10/12 (9,0)

(0,9)

(5)

2 人非協力非零和ゲーム

V

例1:恋人達のジレンマ

battle of sexes

(1,2) (-1,-1)

映画

(-1,-1) (2,1)

野球

映画 野球

⎪ ⎪

⎪ ⎪

⎪⎩

⎪ ⎨

=

< → ∈

= → =

− >

= + +

⎪⎩

⎪ ⎨

=

< → ∈

= → =

− >

=

− +

0 0

] 1 , 0 [ 0

1 0 3

~ 5 ˆ ) (

0 0

] 1 , 0 [ 0

1 0 2 5 ˆ ) ˆ (

1 1 1 1

1

1 1 1 1

1

q q q p

c p c c

p p p q

r q r r

p

1

q

1

0 1

1

2/5

3/5

Nash均衡点

((1,0),(1,0)),

((3/5,2/5),(2/5,3/5)),

((0,1),(0,1))

E

A

(p,(5/12,7/12))=1/5 E

B

((5/12,7/12), q)=1/5 (2,1)

(1,2)

2 人非協力非零和ゲーム

V

例5:純粋戦略全ての組合せがNash均衡

(4,4) (8,4) s A2

(4,8) (8,8) s A1

s B2 s B1 A

B

友情ルール

友情ルール:自分の利得が同じならば,

相手の利得が大きい方の戦略を選ぶ

Nash均衡点の精緻化

全ての戦略の組がNash均衡点!

(sA

,s

B1)が均衡点となる

弱支

2 人非協力非零和ゲーム

V

例6:共有地の悲劇(囚人のジレンマのn人拡張版)

V数軒の酪農家が共有の牧草地を所有している.各酪農家が先を争って 牛を放牧し,自分の利益最大をはかる限り,牛の数を増やし続けると,

待っているのは共有地の荒廃という悲劇である.

V単純なモデルでの考察

酪農家は4軒

(i=1,2,3,4)

酪農家iが放牧する牛の数

q

i

各酪農家は3頭まで牛を購入でき,購入価格は全て等しく2

酪農家iの収益をxiとし,xi

= q

i

{16-(q

1

+ q

2

+ q

3

+ q

4

)}-2 q

i

12 10 6 0 7

15 12 7 0 6

18 14 8 0 5

21 16 9 0 4

24 18 10 0 3

27 20 11 0 2

6 6 4 0 9

30 22 12 0 1

33 24 13 0 0 0 0

2 8 3 9 1 5

8 i

others

たくさん放牧する と収益が減る!

Nash均衡点

Nash 均衡点と線形相補性問題

V Definition 戦略的同等性

V

ゲームGのNash均衡点がG’のそれであり,かつその逆も成 立するとき,2つのゲームは戦略的に同等戦略的に同等であるという

V Theorem 5

V 2つの双行列ゲームG, G’において,任意の要素について,

という関係があるとき,GとG’は戦略的に同等である

⎩ ⎨

⎧ ′ ′ = = + +

>

>

2 2

1 1 2 1 2

1

0 , α 0 , β , β , α α β β

α

ij ij

ij ij

b b

a a

V

例:

(5,-2) (-2,4) s

A2

(0,2) (3,-1) s

A1

s

B2

s

B1

A

B

(9,-4) (-5,14) s

A2

(-1,8) (5,-1) s

A1

s

B2

s

B1

A

B

戦略的

2 , 3 , 1 ,

2

1 2 2

1

= β = − α = β =

α

G G’

Nash 均衡点と線形相補性問題

V Nash均衡点を求める

Nash均衡点 ( p *, q *) Th.2 ⎩ ⎨ ⎧

=

= ≥ ∀ =

=

n j s E E

v

m i s E E

v

j i

B B B

A A A

, , 1 )

*, (

*)

*, ( :

, , 1

*) , (

*)

*, ( :

2 1

L L p

q p

q q

p

⎪⎩

⎪ ⎨

=

=

∑ ∑

=

=

n j p b v

m i q a v

m

i ij j

n j ij j

, , 1

, , 1

1

* 2

1

* 1

L L

Th.5 ⎪⎩

⎪ ⎨

=

=

∑ ∑

=

=

n j p b v

m i q a v

m

i ij j

n j ij j

, , 1

~

, , 1

~

1

* 2

1

* 1

L

L ( i , j , ~ a

ij

, b ~

ij

> 0 )

ただし,

0 ,

2 1

v >

v

⎪⎩

⎪ ⎨

=

=

∑ ∑

=

=

n j p b

m i q a

m i ij i n

j ij j

, , 1

~ 1 ~

, , 1

~ 1 ~

1 1

L L

⎩ ⎨

=

=

2

* 1

*

~ : :

~ v p p

v q q

i i

j j

ただし,

⎪⎩

⎪ ⎨

=

=

=

=

∑ ∑

=

=

) , , 1 ( 0)

~ ( 1 ~ :

) , , 1 ( 0)

~ ( 1 ~ :

1 1

n j p b w

m i q a u

m i ij i j

n j ij j i

L L

とおく

Nash 均衡点と線形相補性問題

V Proposition 1 相補性 complementarity

⎪⎩

⎪ ⎨

=

=

∑ ∑

=

= m

i ij i

j n

j ij j

i

p b w

q a u

1 1

~ ~ 1 :

~ 1 ~ :

⎪⎩

⎪ ⎨

=

=

=

∑ =

=

=

) , , 1 (

~ 0

) , , 1 (

~ 0

1 1

m i q w

n j p u

n

j j j

m

i i i

L L

Nash均衡点

が存在する まとめると…

) , , 1 ( 0 ,

) , , 1 ( 0 ,

0 0

) , , 1 (

~ 1 :

) , , 1 (

~ 1 :

1 1

1 1

n j q w

m i p u

q w

p u

n j p b w

m i q a u

j j

i i

n

j j j

m

i i i

m i ij i j

n j ij j i

L L L L

=

≥ =

=

=

=

=

=

=

∑ ∑ ∑ ∑

=

=

=

=

を満たす

w u , , p q ( ( i j 1 , 1 , , m , n ) )

が存在

j j

i

i

L L

= =

が成立

(6)

Nash 均衡点と線形相補性問題

V LCP, Linear Complementarity Problem

) , , 1 ( 0 ,

) , , 1 ( 0 ,

0 0

) , , 1 (

~ 1 :

) , , 1 (

~ 1 :

1 1

1 1

n j q w

m i p u

q w

p u

n j p b w

m i q a u

j j

i i

n

j j j

m

i i i

m i ij i j

n j ij j i

L L L L

=

≥ =

=

=

=

=

=

=

∑ ∑ ∑ ∑

=

=

=

=

を満たす解

⎩ ⎨

⎧ = =

) , , 1 ( ,

) , , 1 ( ,

n j q w

m i p u

j j

i

i

L L

⎪⎩

⎪ ⎨

=

= ∑ ∑

j j j j

i i i i

q q q

p p p

: :

*

*

がNash均衡点

⎥ ⎦

⎢ ⎤

= −

⎥ ⎥

⎥ ⎥

⎢ ⎢

⎢ ⎢

=

⎥ ⎥

⎥ ⎥

⎢ ⎢

⎢ ⎢

=

⎥ ⎥

⎥ ⎥

⎢ ⎢

⎢ ⎢

= B 0

A M 0

z y

x , :

T

1 1 1 1 : , : , :

1 1

1 1

M M M M M M

n m

n m

w w u u

q q p p 0

y x

x y

z Mx y

= ≥ +

= ) , (

, 0

,

T

ただし,

B=-AだとLP

⇔ 零和ゲーム

Lemke法(M≧0)

内点法(M:PSD,P0

,…)

戦略形ゲームの応用

(岡田章『ゲーム理論』p.49-59等)

V

応用例1:クールノー複占市場

V

2企業(i=1,2)が同質な財を生産し,同一市場に供給している

V企業iの供給量qi

(

≧0) → 財の価格

p=max{a-b(q

1

+ q

2

), 0}, (a,b>0)

V企業iの費用関数

C

i

(q

i

)= c

i

q

i

, (0<c

i

<a)

V企業iの利潤関数πi

(q

1

, q

2

)=pq

i

c

i

q

i

限界費用 限界費用

各企業は利潤最大化利潤最大化したい!

クールノー・ナッシュ均衡

Cournot-Nash equilibrium

⎪⎩

⎪ ⎨

=

⇔ =

) , ( max ) , (

) , ( max ) , ( . . . : ) , (

2

* 1 0 2

* 2

* 1 2

* 2 1 0 1

* 2

* 1

* 1 2

* 1

2 1

q q q

q

q q q

q eq N C q q

q

q

π

π

π π

V企業i(=1,2)の企業j(≠i)に対する最適応答対応

⎪ ⎩

⎪ ⎨

− <

≤ −

− −

=

⎩ ⎨

⎧ − − − + ≤ − < ≤ −

=

i i

i i i j

i

i j i

i

j i i i

i

b q c

a b

c q a q b

c a q

q q b a q

c

q b a q q q q b c q a q

if 0

0 if 2 2

/ if

/ 0 if )) ( ) (

, (

*

2 1 2

π

1

⎥⎦

⎢ ⎤

⎡ < =

= ∂

∂ 0, 0 ( 1,2)

) 2

2

q i

q i

i i

i π

Q π

p>0

p=0

戦略形ゲームの応用

V

応用例1:クールノー複占市場

⎪ ⎩

⎪ ⎨

− <

≤ −

− −

i i

i i i j

b q c

a b

c q a q b

c a

if 0

0 if 2 2

b c a

2

2

b c a

1

b c a

2

b c a

2

1

q

1

q

2

0

) , 2 , 1 (

2 i j i

b c a b

c

a ij = ≠

− ≤

の場合

クールノー・ナッシュ均衡点

⎟ ⎠

⎜ ⎞

⎛ − + + −

= b

c c a b

c c q a

q 3

, 2 3 ) 2 ,

(

2* 1 2 1 2

* 1

* a c 3

1

c

2

p = + +

⎪ ⎩

⎪ ⎨

= + +

= −

b c c q a q

b c c q a q

9 ) 2 ) ( , (

9 ) 2 ) ( , (

2 2 1

* 1

* 1 2

2 2

* 1 1

* 1 1

π π

各企業の利潤 財の価格

パレート最適ではない 例:c1

=c

2の時,q1

=q

2

=(a-c)/4b

とした方が,どちらの企業もよ り多くの利潤が得られる

戦略形ゲームの応用

V

応用例2:寄付金ゲーム

Vある町の町長が,公共事業のため,n人の住人に寄付を募る

V各住人は,寄付額

0円~1000円 を自分の好きな分だけ寄付

V寄付総額の2倍を,n人の住人に均等に分配する

V住人i (=1,…,n) の戦略(寄付額):

x

i (0≦xi≦1000)

V住人i (=1,…,n) の利得関数: i n

k k n

i

x x x x

u = ∑ −

=1

1

, , ) 2

( L

n>2の時,戦略 x

i

*=0 が,他の戦略 x

i

>0 に対する支配戦略となる!

戦略の組

x*=(0,…,0) が唯一の均衡点,

即ち,誰も寄付しない誰も寄付しない!

寄付はいくら集 まるだろう?

パレート最適ではない 全ての住人が1000円寄付する

と,全ての住民の利得は1000 円であり,均衡点より望ましい

しかし,x=(1000,…,1000)では,

どの住民も裏切る動機を持つ

) 1000 1 ( 2000 ) , 0

(

= − >

n x n u

i i ただ乗り

ただ乗り

free free- -riding riding:

他人の貢献を利用して個人的利益を得る行為

戦略形ゲームの応用

V

応用例3:電力消費ゲーム

Vある都市で,n人の住人がクーラーを所持.暑い日の出来事

V各住人i (=1,…,n)の戦略と,その費用,及び効用は,

戦略:低温設定(xi

=α),電力消費1000W,効用U

戦略:中温設定(xi

=β),電力消費500W,効用u

(U>u>0) Vこの都市の停電確率は,総電力量をQとしたとき,

n c Q n

c c Q Q

P 1 ( if ) where 500 1000

) 0 if ( ) 0

( < <

⎩⎨ ⎧

< ≤ ≤

=

停電臨界点 停電臨界点

V節電する住人の数をs (0

s

n)とすると,総電力消費量は

Q(s) := 500s + 1000(n-s)=1000n-500s

V住人i の効用は

⎪⎩

⎪ ⎨

=

≤ =

< ≤

=

)) , ) ( if (

) , ) ( if (

)) ( if ( 0 ) , , (

1

α β

i i n

i

x c s Q u

x c s Q U

s Q c x

x

u L

減少関数Q(s)について,Q(s’)≦c≦Q(s’-1) を満たすs’が 唯一定まり,0≦s*≦s’-2, s*=s’を満たす全てのsが均衡点

戦略形ゲームの応用

V

応用例3:電力消費ゲーム

s Q

0 1000n

s’-1 s’ s’+1 n s’-2

均衡点

均衡点

c

都市停電停電!

•全住人の効用は0.

•1人の住人だけ設定を変えても

効用は0のままなので均衡状態 都市停電停電せず

•低温設定住人の効用U

•中温設定住人の効用u

•中温設定の1人でも低温に変更

すると停電(効用がu→0)より均 衡状態

(7)

戦略形ゲーム

V

囚人のジレンマ型ゲーム

(T 1 , T 2 ) (B 1 , W 2 )

D

(W 1 , B 2 ) (S 1 , S 2 )

C

D C

A

B

ただし,Bi

(best) > S

i

(second) > T

i

(third) > W

i

(worst)

さらに

も満たすならば,『標準的標準的 な囚人のジレンマ型ゲー な囚人のジレンマ型ゲー ム』 とよばれる

) 2 , 1 ( 2 =

= B + W i S

i i i 異なる戦略を交互に取る,即ち,

(C,D)→(D,C)→(C,D)→…

とするときの期待利得が,協調行 動(C,C)の利得より小さい状況

⎩⎨

⎧ = = − − < > = = − − > < = = − − > <

) 0

~ ( ), 0 ( ˆ ), 0 (

) 0

~ ( ), 0 ( ˆ ), 0 (

2 2 2

2 2 2

1 1 1

1 1 1

T W c B T c W S c

T B r W T r B S r

⎪⎩

⎪ ⎨

=

< → ∈

= → =

⎪⎩ >

⎪ ⎨

=

< → ∈

= → =

>

⎩⎨ ⎧

+ +

= + −

=

0 0 ) (

] 1 , 0 [ 0 )

( ) 0 1

(

, 0 0 ) (

] 1 , 0 [ 0 ) (

1 0 ) (

) ~ ( ˆ : ) (

) ˆ ( ˆ : ) (

2 1 2

2 1 2

2 1 2

1 2 1

1 2 1

1 2 1

1 1 2

1 2 1

q p f

q p

f p q

f p q f

p q f

p q f

c p c c p f

r q r r q f

⎩ ⎨

= =

⎩⎨

⎧ + + − + < <

⎪⎩

⎪ ⎨

=

= − + −

= + ≤ +

0 0

~ 0 ˆ ) (

0 ˆ ) ˆ (

) ~ ( ) (

) ( ) ˆ (

ˆ ˆ

* 1

* 1

1 1

2 2 2 2 2 2

2 2 2 2

q p

c p c c

r q r r

c T W T W B S

B T W S c c

r r r

→Nash均衡は(D,D)

戦略形ゲーム

V

演習:

V

身近な所,あるいは社会において,囚人のジレンマと同じ状 況となっていると思われる例を2つ上げよ.

参考文献

V

鈴木光男「ゲーム理論入門」共立出版(1981, 2003(新装版)

V

鈴木光男「新ゲーム理論」勁草書房(1994)

V

岡田章「ゲーム理論」有斐閣(1996)

V

今野浩「線形計画法」日科技連(1987)

V R. Axelrod,

松田裕之訳「つきあい方の科学」ミネルヴァ書房(1998)

V ……

参照

関連したドキュメント

[r]

3いこーよ協力! 非認知能力を育む「3~6歳児のあそび図鑑」発売 https://iko-yo.net/articles/5848

特定非営利活動法人

• 使用済燃料プール壁 ※1 は、非常に厚いうえに、プール全体は、非常に厚い壁 ※2

平成 28 年度は 4 月以降、常勤 2

成果指標 地域生活支援部会を年2回以上開催する 実施場所 百花園宮前ロッヂ・静岡市中央福祉センター. 実施対象..

 福永 剛己 累進消費税の導入の是非について  田畑 朋史 累進消費税の導入の是非について  藤岡 祐人

生活介護  2:1  *1   常勤2名、非常勤5名  就労継続支援B型  7.5:1+1  *2