意思決定科学: ゲーム理論2
情報学部 堀田敬介
2007/30,Fri. ~
Contents
V 2人非協力非零和ゲーム
V
定義:ゲームのルール,双行列V
例:囚人のジレンマ,面会ゲーム,恋人達のジレンマ,…V
最適応答,Nash
均衡点V Nash均衡点と線形相補性問題(LCP)
V
戦略形ゲームの社会・経済問題への応用例2 人非協力非零和ゲーム
V
ゲームのルールV
プレイヤーの数は2人V
各プレイヤーは,独立に自分の戦略を決定(非協力)V
プレイヤーの利得の和は一定とは限らない(非零和)V
ゲームは1回限りV
各プレイヤーは戦略決定時に,他のプレイヤーがどの 戦略をとるかは知らないV
純粋戦略の数は有限⎩ ⎨
⎧ = =
} , , , {
} , , , {
2 1
2 1
n m B B B B
A A A A
s s s S
s s s S
L L } 2 , 1
= { N
2 人非協力非零和ゲーム
V
例1:恋人達のジレンマbattle of sexes
V
ある一組のカップルがデートをしたいと思っているV
男性は野球観戦を希望し,女性は映画鑑賞がしたいV
各々が好きなものを見るより一緒にいることの方が大事(1,2) (-1,-1)
映画(-1,-1) (2,1)
野球
映画 野球 男\女
性の戦い,男女の戦い,
逢引きのジレンマ,…
互いに支配戦略は持たない
ミニマックス原理に従うと,互いにどちらの戦略でも良い?
(または各戦略のマックスが大きくなる方を選ぶ!?)
1 min max
ij= −
j
i
a
1 min max
ij= −
j
i
b
2 人非協力非零和ゲーム
V
双行列ゲームV
利得関数V
利得行列) , ( : ) , ( ) , ( ) , (
) , ( ) , ( ) , (
) , ( ) , ( ) , (
2 2 1 1
2 2 22
22 21 21
1 1 12
12 11 11
B A b
a b
a b a
b a b
a b a
b a b
a b a
mn mn m
m m m
n n
n n
=
⎥ ⎥
⎥ ⎥
⎦
⎤
⎢ ⎢
⎢ ⎢
⎣
⎡
L M O M M
L L
ij B A B ij B A
A
s s a f s s b
f j
i
i j=
i j=
∀ , , ( , ) , ( , ) ]
[ ], [ a
ij= b
ij= B
A
プレイヤーBの戦略(n個)の利得(右側)
プレイヤーA の戦略(m個)
の利得(左側)
双行列 双行列 和が零(一定)という条件はない(非零和)
2 人非協力非零和ゲーム
V
例1:恋人達のジレンマbattle of sexesV零和ゲームの時と全く同じやり方で,混合戦略でミニマックス原理に基 づき期待利得最大化をしてみると…
(1,2) (-1,-1)
映画(-1,-1) (2,1)
野球映画 野球 男\女
p 1 p 2
q 1 q 2
⎩⎨
⎧ = = − − − − + +
2 2 1 2 2 1 1 1
2 2 1 2 2 1 1
1
2
) , (
2 ) , (
q p q p q p q p E
q p q p q p q p E
B
A
p q
q p
⎩⎨
⎧ = = − − +
1 2 )) 1 , 0 ( , (
1 3 )) 0 , 1 ( , (
1 1
p E
p E
A
A
p
p
⎩⎨
⎧ = = − − +
2 3 ) ), 1 , 0 ((
1 2 ) ), 0 , 1 ((
1 1
q E
q E
B
B
q
q
5 ) 1 ˆ , ˆ ( 5 , ) 1 ˆ , ˆ ( , 5 ) , 2 5 ( 3 5 ), , 3 5 ( 2 ) ˆ , ˆ
( ⎟ = =
⎠
⎜ ⎞
⎝
= ⎛ p q p q
q
p E
AE
Bところが…
5 ) 1 , ˆ
( = p
1−
E
Ap q
5 ) 4 ˆ , ( = − q
1+ E
Bp q Bが
をとるならAはではなく(1,0)にする方が 期待利得が高くなる!
q ˆ p ˆ Aが
をとるならBは ではなく(0,1)にする方が 期待利得が高くなる!q ˆ p ˆ
均衡しない
つまり,相手が純粋戦略を取ってきたときだけの自分の混合戦略を考えて 期待利得を求めるやり方では,均衡解を求められない
V
最適応答対応best response correspondence
• Bの戦略 に対するAの最適応答の集合
を,プレイヤーAの最適応答対応プレイヤーAの最適応答対応とよび,
を,プレイヤーAの最適応答集合最適応答集合とよぶ
V Definition 最適応答と最適応答対応
V
最適応答best response
• プレイヤーAの戦略 が,プレイヤーBの戦略 に対 する最適応答最適応答であるとは,以下が成り立つこと
2 人非協力非零和ゲーム
A
A
S
s ∈ s
B∈ S
B) , ( max ) ,
( p q p q
p A
A
E
E =
) , ( max ) ,
(
A A BS B s A
A
s s f s s
f
A A∈
=
純粋戦略の場合混合戦略の場合
B
B
S
s ∈
} { ( , ) max ( , ) )
(
A A BS B s A A A A B
A
s s S f s s f s s
R
A
A∈
=
∈
=
} { (
A,
B)
A A(
B),
B BA
s s s R s s S
D = ∈ ∈
} { ( , ) max ( , ) )
( q p p q p q
p A
A
A
E E
R = =
純粋戦略 の場合 混合戦略
の場合
2人零和ゲームでは,
ミニマックス原理は 最適応答原理に帰着
最適応答原理 最適応答原理
プレイヤーAの(純戦略での)最適応答
s
B1→max{7,8,4} = 8
s
B2→max{0,6,3} = 6 s
B3→max{5,2,6} = 6 V
最適応答と最適応答対応• プレイヤーA,Bが各々最適応答をとる場合,その組の集合は となる
2 人非協力非零和ゲーム
B
A
D
D D : = ∩
(6,2) (3,1) (4,5)
s A3
(2,7) (6,6) (8,0)
s A2
(5,5) (0,8) (7,7)
s A1
s B3 s B2 s B1
A\B
V
例:} { ) (
} { ) (
} { ) (
3 3
2 2
2 1
A B A
A B A
A B A
s s R
s s R
s s R
= =
=
} { (
A2,
B1), (
A2,
B2), (
A3,
B3)
A
s s s s s s
D =
プレイヤーBの(純戦略での)最適応答
s
A1→max{7,8,5} = 8s
A2→max{0,6,7} = 7
s
A3→max{5,1,2} = 5( ) { } } { ) (
} { ) (
1 3
3 2
2 1
B A B
B A B
B A B
s s R
s s R
s s R
= =
=
} { ( , ), ( , ), ( , )
1 3 2 1 3
2 B A B A B
A
B
s s s s s s
D =
互いに最適応答なら均衡する
(
D ≠ ∅
なら均衡)より,
純粋戦略のみでは 均衡しない
∅ D =
2 人非協力非零和ゲーム
V Definition Nash均衡点 Nash equilibrium point V
(混合)戦略の組 が次の条件を満たすとき,を
Nash均衡点 Nash
均衡点とよぶ*)
*, ( p q
q q p q p
p q p q
p ≥ ≥ ∀ ∀
)
*, (
*)
*, (
*) , (
*)
*, (
B B
A A
E E
E E
V Theorem 1
V
(混合)戦略の組 が互いに最適応答であるならばNash均衡点であり,逆も成り立つ.即ち,Nash均衡点の集
合をE
とすると,B
A D
D E = ∩
ˆ ) ˆ , ( p q
Nash均衡点は,零和ゲー
ムの均衡点(鞍点)を含む一般的な概念
*)
*, ( p q
V Theorem 2
V
(混合)戦略の組 がNash均衡点であるた めの必要十分条件は*)
*, ( p q
n j s E E
m i s E E
j i
B B B
A A A
, , 1 )
*, (
*)
*, (
, , 1
*) , (
*)
*, (
L
= L
∀
≥ ∀ =
≥ p q p
q q
p
Bがq*をとるならAはp*がベスト Aがp*をとるならBはq*がベスト
2 人非協力非零和ゲーム
V 2人非協力非零和ゲームのNash均衡点
[ A, B ]
) , ( ) , (
) , ( ) , (
22 22 21 21
12 12 11
11
⎥ =
⎦
⎢ ⎤
⎣
⎡
b a b a
b a b p 1 a p 2
q 1 q 2
⎩⎨
⎧ ≥ ≥ ≥ ≥ + + = = 1 , 0 , 0
1 , 0 , 0
2 1 2 1
2 1 2 1
q q q q
p p p p
22 1 1 1 1
22 1 22 21 1 12 22 1 1 12 22 21 11
22 1 1 1 1
22 1 22 21 1 12 22 1 1 12 22 21 11
ˆ ~ ˆ ) (
) ( ) ( )}
( ) {(
) , (
ˆ ~ ˆ ) (
) ( ) ( )}
( ) {(
) , (
b q c p c q p c c
b q b b p b b q p b b b b E
a q r p r q p r r
a q a a p a a q p a a a a E
T B
T A
+ +
− +
= − + − − − + − +
= = + − + +
= − + − − − + − +
= = Bq p q p
Aq p q p
プレイヤーA,Bが混合戦略をとった際の期待利得
⎩⎨ ⎧
≥ ≥
⎩⎨ ⎧
≥ ≥
)) 1 , 0 ( , ( ) , (
)) 0 , 1 ( , ( ) , (
) ), 1 , 0 ((
) , (
) ), 0 , 1 ((
) , (
p q p
p q p
q q
p
q q
p
B B
B B
A A
A A
E E
E E
E E
E Theorem 2 より, E
Nash均衡点
2 人非協力非零和ゲーム
V 2人非協力非零和ゲームのNash均衡点
V
プレイヤーAの最適応答について⎩⎨
⎧ + + − − − ≥ ≤
⇔
⎩⎨
⎧ + + − − + + + + ≥ ≥ + + − + +
⇔
⎩⎨
⎧ ≥ ≥
0 } ˆ ) ˆ {(
0 ) 1 }(
ˆ ) ˆ {(
~ ˆ ~
ˆ ) (
ˆ ~ ˆ )
~ ( ) ˆ
( ˆ
) ), 1 , 0 ((
) , (
) ), 0 , 1 ((
) , (
1 1
1 1
22 1 22 1 1 1 1
22 1 1 22 1 1 1 1
p r q r r
p r q r r
a q r a q r p r q p r r
a q r r q r r a q r p r q p r r
E E
E E
A A
A A
q q
p
q q
p
1
1
ˆ 0
) ˆ
( r + r q − r >
となるq
⎩⎨
⎧ − ≥ ≤ 0
0 1
1 1
p p
1
1
ˆ 0
) ˆ
( r + r q − r =
となるq
1
1
ˆ 0
) ˆ
( r + r q − r <
となるq
⎩⎨
⎧ −
任意任意
:
: 1
1 1
p p
⎩⎨
⎧ − ≤ ≥ 0
0 1
1 1
p p
故に,p ∈ R
A(q )
となるためには,1
= 1 p
:
任意p
11
= 0 p
2 人非協力非零和ゲーム
V 2人非協力非零和ゲームのNash均衡点
V
プレイヤーBの最適応答について⎩⎨
⎧ + + + + − ≥ ≤
⇔
⎩⎨
⎧ + + − − + + + + ≥ ≥ − + + − + +
⇔
⎩⎨
⎧ ≥ ≥
0
~ } ) ˆ {(
0 ) 1
~ }(
) ˆ {(
~ ˆ ) ˆ
( ˆ
ˆ ~ ˆ )
~ ( ) ˆ
( ˆ
)) 1 , 0 ( , ( ) , (
)) 0 , 1 ( , ( ) , (
1 1
1 1
22 1 22 1 1 1 1
22 1 1 22
1 1 1 1
q c p c c
q c p c c
b p c b q c p c q p c c
b c p c p c c b q c p c q p c c
E E
E E
B B
B B
p q p
p q p
1
1
~ 0
) ˆ
( c + c p + c >
となるp
⎩⎨
⎧ − ≥ ≤ 0
0 1
1 1
q q
⎩⎨
⎧ −
任意任意
:
: 1
1 1
q q
⎩⎨
⎧ − ≤ ≥ 0
0 1
1 1
q q
故に,q ∈ R
B( p )
となるためには,1
= 1 q
:
任意q
11
= 0 q
1
1
~ 0
) ˆ
( c + c p + c =
となるp
1
1
~ 0
) ˆ
( c + c p + c <
となるp
2 人非協力非零和ゲーム
V 2人非協力非零和ゲームのNash均衡点
V
例:(6,1) (3,4)
s A2
(2,7) (6,5)
s A1
s B2 s B1
A\B
4 ˆ 7 ˆ )
( r + r q
1− r = q
1− p 1
p 2
q 1 q 2
⎪⎩
⎪ ⎨
⎧
=
−
=
−
= − = − = −
= − = − =
⎪⎩ =
⎪ ⎨
⎧
−
=
−
=
−
= − = − =
= − = − =
=
3 1
~ ˆ 1 5 4 7 4 1 6 3 6
~ ˆ 6 3 2 4
3 3 6
22 21
12 22
21 11
22 21
12 22
21 11
b b c
b b c b b c
a a r
a a r
a a r
⎪ ⎩
⎪ ⎨
⎧
=
→
<
→
=
=
→
>
0 7 : 4
7 : 4
1 7 : 4
1 1
1 1
1 1
p q
p q
p q
任意
⎪ ⎪
⎩
⎪⎪ ⎨
⎧
=
→
>
→
=
=
→
<
0 5 : 3
5 : 3
1 5 : 3
1 1
1 1
1 1
q p
q p
q p
任意
3
~ 5 ˆ )
( c + c p
1+ c = − p
1+
p
1q
10 1
1
4/7
3/5
プレイヤーA の最適応答 プレイヤーB
の最適応答
Nash均衡点
2 人非協力非零和ゲーム
(6,1) (3,4)
s
A2(2,7) (6,5)
s
A1s
B2s
B1A\B
0 0.25
0.5 0.75
1 player A
0 0.25
0.5 0.75
1
player B 2
3 4 5 6 Exp
0 0.25
0.5 player A 0.75
E
A(p,q)
0 0.25
0.5 0.75
1 player A
0 0.25
0.5 0.75
1
player B 0
2 4 6 Exp
0 0.25
0.5 player A 0.75
E
B(p,q)
E
A(p,(4/7,3/7))=30/7 E
B((3/5,2/5), q)=23/5
p
1q
10 1
1
4/7
3/5
2 人非協力非零和ゲーム
V Theorem 3
V
(混合戦略まで拡大すると,)双行列ゲームには,少なくと も1つNash均衡点が存在するV Theorem 4 (cf. Theorem 2)
V
(混合)戦略の組 がNash均衡点であるための必要 十分条件は, が写像 の不動点であ ること.即ち,*)
*, ( p q
*) (
*) (
*
* q q p
p × ∈ R
A× R
B*)
*, ( p q
戦略の組が均衡点であるための必要十分性(Theorem 2, 4など)
の証明は,「Brouwerの不動点定理」「角谷の不動点定理」などから
) ( ) ( q
Bp
A
R
R ×
演習1:
V
次の双行列ゲームのNash均衡点を求めよ(-2 , 2) ( 6 , -8)
s A2
( 4 , 6) (-24, 12)
s A1
s B2 s B1
A\B
Coffee Brake!
V John F. Nash (1928- )
V
紹介サイトの情報V A Beautiful Mind
いずれも2004年11月9日(火)取得の情報
Non-Cooperative Games Nash [pdf]
補足: 補足 2 人非協力零和ゲーム
V 2人非協力零和ゲームのNash均衡点
V例:プレイヤーAの利得表
4
s A2 -1 -2
s A1 3
s B2 s B1
A\B
6 10 ˆ ) ˆ (r+rq1−r= q1−
p
1p
2q
1q
2⎪⎩
⎪ ⎨
⎧
=
−
−
=
−
= − = − − = −
= = − = − − = −
⎪⎩
⎪ ⎨
⎧
−
=
−
−
=
−
= − = − − =
= = − = − − =
5 ) 4 (
~ ˆ ( ( 1 4 3 ) ) 1 2 4 6 5 4 ) 1
~ ˆ 3 4 ( ( ( 1 2 ) ) 4 6
22 21
12 22
21 11
22 21
12 22
21 11
b b c
b b
c b b
c a a
r a a
r a a r
⎪⎪
⎩
⎪⎪⎨
⎧
=
→
<
→
=
=
→
>
0 5 : 3
5 : 3
1 5 : 3
1 1
1 1
1 1
p q
p q
p q
任意
⎪⎩
⎪⎨
⎧
=
→
>
→
=
=
→
<
0 2 : 1
2 : 1
1 2 : 1
1 1
1 1
1 1
q p
q p
q p
任意 5
~ 10 ) ˆ
(c+cp1+c=− p1+
p
1q
10 1
1
3/5
1/2
プレイヤーA の最適応答
Nash均衡点
プレイヤーBの最適応答
4
5 6 10 ) ,
( = p
1q
1− p
1− q
1+ E
pq⎩⎨
⎧ = = − − +
⎩⎨
⎧ = = − − +
4 5 ) ), 1 , 0 (( 1 , 0 ), ) 5 2 , ((
4 6 )) 1 , 0 ( , ( , ( 1 , 0 )) 4 1 (
1 1 1
1
p
E q
E p
E p
E
q q p
p
p
1E
1 0 1/2
1 E
1 0 3/5 q
1零和ゲームの場合は
¾最適応答戦略
¾ミニマックス戦略 いずれの考え方でも 均衡解を求められるよ
2 人非協力非零和ゲーム
V
例2:囚人のジレンマprisoner’s dilemma
V
2人の凶悪犯が別個に取り調べを受けているV
現状では証拠不十分で軽い罪でしか起訴できないため,2 人とも3年V
各囚人は司法取引を持ちかけられ,応じた方は1年,応じな い方は10年,ただし,2人ともが応じた場合は2人とも8年(8,8) (1,10)
自白(10,1) (3,3)
黙秘
自白
A
\B
黙秘※司法取引:被告が自分の罪を認める代わりに罪を軽くしてもらうこと 注意:値が小さい
方が嬉しい!
最適応答原理に従ってまじめに計算しても…
2 人非協力非零和ゲーム
V
例2:囚人のジレンマprisoner’s dilemma
(8,8) (1,10)
自白(10,1) (3,3)
黙秘
自白
A
\B
黙秘 注意:値が小さい方が嬉しい!各プレイヤーとも,「自白自白」が支配戦略! 結果として,
(自白,自白)がNash均衡点であり,ゲームは支配可解
} { (( 0 , 1 ), q ) 0 ≤ q ≤ 1
A
= D
最適応答原理に従って考えても…,
} { ( p , ( 0 , 1 )) 0 ≤ p ≤ 1
B
= D
p 1 p 2
q 1 q 2
( ) } { ( 0 , 1 ), ( 0 , 1 ) : = D
A∩ D
B=
D
p
1q
10 1
1
⎩⎨ ⎧
<
−
= + + − = − <
+
0 2
~ 0 ) ˆ (
0 2 0 ˆ ) ˆ (
1 1
1 1
p c p c c
q r q r r
⎩⎨ ⎧
= = 0 0
1
q
1p
注意:±逆で計算明らかにもっと良い解がある
Pareto最適でない!
2 人非協力非零和ゲーム
V Nash均衡点が最適戦略か?
V 2人零和ゲーム
• ミニマックス戦略が最適戦略!
V 2人非零和ゲーム
•
Nash均衡点が最適戦略を与えるわけではない!
• ゲームの値が異なる複数の均衡点が存在する場合がある!
•
Nash均衡点は,必ずしもPareto最適ではない!
行動の指針を与えてくれる
最適応答原理は不十分かも…!?
(しかし他に適切なものがあるか?)
•得られる解の状態を示すことで,何らかの均衡戦略を
とるべきことを教える•均衡状態が複数あることを示すことで,戦略決定判断
が困難であることも教える非協力ゲーム
Nash均衡点の精緻化
協力ゲームへの転換2 人非協力非零和ゲーム
V
例3:面会ゲームV
遠く離れている2人が至急会う必要があるV
今居る場所は互いにわかっており,会いに行くか,相手が 来るのを待つかの選択が出来る.(途中で会うことはない)(0,0) (10,6)
待つ(6,10) (-6,-6)
行く待つ
A
\B
行く⎪ ⎪
⎩
⎪ ⎪
⎨
⎧
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
+ >
−
= + +
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
+ >
−
=
− +
0 0
] 1 , 0 [ 0
1 0 6
~ 22 ) ˆ (
0 0
] 1 , 0 [ 0
1 0 6 ˆ 22 ˆ ) (
1 1 1 1
1
1 1 1 1
1
q q q p
c p c c
p p p q
r q r
r p
1q
10 1
1
3/11
3/11 Nash均衡点
((0,1),(1,0)),
((3/11,8/11),(3/11,8/11)),
((1,0),(0,1))
2 人非協力非零和ゲーム
p
1q
10 1
1
3/11
3/11
0 0.25
0.5 0.75
1 player A
0 0.25
0.5 0.75
1
player B -5
0 5 10 Exp
0 0.25
0.5 player A 0.75
0 0.25
0.5 0.75
1 player A
0 0.25
0.5 0.75
1
player B -5
0 5 10 Exp
0 0.25
0.5 player A 0.75
E A (p,q)
E B (p,q)
E A (p,(3/11,8/11))=30/11 E B ((3/11,8/11), q)=30/11
2 人非協力非零和ゲーム
V
例4:弱虫ゲームchicken game
V
2人の人間が2台の車をそれぞれ運転するV
2人は,お互いに向かって車を走らせるV
2台ともそのまま走り続ければ,やがてぶつかり死ぬため,直前で回避してよい.
V
しかし,相手より先によけた(進路を変えた)プレイヤーは「チキン」と罵られ,臆病者のレッテルを貼られる
(-5,-5) (9,0)
避けない
(0,9) (2,2)
避ける避ける 避けない
A
\B
2 人非協力非零和ゲーム
V
例4:弱虫ゲームchicken game
(-5,-5) (9,0)
避けない
(0,9) (2,2)
避ける避ける 避けない
A
\B
⎪ ⎪
⎩
⎪ ⎪
⎨
⎧
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
+ >
−
= + +
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
+ >
−
=
− +
0 0
] 1 , 0 [ 0
1 0 5
~ 12 ˆ ) (
0 0
] 1 , 0 [ 0
1 0 5 12 ˆ ) ˆ (
1 1 1 1
1
1 1 1 1
1
q q q p
c p c c
p p p q
r q r r
p
1q
10 1
1
5/12
5/12
Nash均衡点
((0,1),(1,0)),
((5/12,7/12),(5/12,7/12)),
((1,0),(0,1))
E
A(p,(5/12,7/12))=10/12 E
B((5/12,7/12), q)=10/12 (9,0)
(0,9)
2 人非協力非零和ゲーム
V
例1:恋人達のジレンマbattle of sexes
(1,2) (-1,-1)
映画(-1,-1) (2,1)
野球
映画 野球 男\女
⎪ ⎪
⎩
⎪ ⎪
⎨
⎧
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
− >
= + +
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
− >
=
− +
0 0
] 1 , 0 [ 0
1 0 3
~ 5 ˆ ) (
0 0
] 1 , 0 [ 0
1 0 2 5 ˆ ) ˆ (
1 1 1 1
1
1 1 1 1
1
q q q p
c p c c
p p p q
r q r r
p
1q
10 1
1
2/5
3/5
Nash均衡点
((1,0),(1,0)),
((3/5,2/5),(2/5,3/5)),
((0,1),(0,1))
E
A(p,(5/12,7/12))=1/5 E
B((5/12,7/12), q)=1/5 (2,1)
(1,2)
2 人非協力非零和ゲーム
V
例5:純粋戦略全ての組合せがNash均衡(4,4) (8,4) s
A2(4,8) (8,8) s
A1s
B2s
B1A
\B
友情ルール
友情ルール:自分の利得が同じならば,
相手の利得が大きい方の戦略を選ぶ
Nash均衡点の精緻化
全ての戦略の組がNash均衡点!
(sA1
,s
B1)が均衡点となる弱支配
2 人非協力非零和ゲーム
V
例6:共有地の悲劇(囚人のジレンマのn人拡張版)V数軒の酪農家が共有の牧草地を所有している.各酪農家が先を争って 牛を放牧し,自分の利益最大をはかる限り,牛の数を増やし続けると,
待っているのは共有地の荒廃という悲劇である.
V単純なモデルでの考察
• 酪農家は4軒
(i=1,2,3,4)
• 酪農家iが放牧する牛の数
q
i• 各酪農家は3頭まで牛を購入でき,購入価格は全て等しく2
• 酪農家iの収益をxiとし,xi
= q
i{16-(q
1+ q
2+ q
3+ q
4)}-2 q
i12 10 6 0 7
15 12 7 0 6
18 14 8 0 5
21 16 9 0 4
24 18 10 0 3
27 20 11 0 2
6 6 4 0 9
30 22 12 0 1
33 24 13 0 0 0 0
2 8 3 9 1 5
8 i
\others
たくさん放牧する と収益が減る!
Nash均衡点
Nash 均衡点と線形相補性問題
V Definition 戦略的同等性
V
ゲームGのNash均衡点がG’のそれであり,かつその逆も成 立するとき,2
つのゲームは戦略的に同等戦略的に同等であるというV Theorem 5
V 2つの双行列ゲームG, G’において,任意の要素について,
という関係があるとき,GとG’は戦略的に同等である
⎩ ⎨
⎧ ′ ′ = = + +
∃
>
>
∃
2 2
1 1 2 1 2
1
0 , α 0 , β , β , α α β β
α
ij ij
ij ij
b b
a a
V
例:(5,-2) (-2,4) s
A2(0,2) (3,-1) s
A1s
B2s
B1A
\B
(9,-4) (-5,14) s
A2(-1,8) (5,-1) s
A1s
B2s
B1A
\B
戦略的同等
2 , 3 , 1 ,
2
1 2 21
= β = − α = β =
α
G G’
Nash 均衡点と線形相補性問題
V Nash均衡点を求める
Nash均衡点 ( p *, q *) Th.2 ⎩ ⎨ ⎧
=
∀
≥
= ≥ ∀ =
=
n j s E E
v
m i s E E
v
j i
B B B
A A A
, , 1 )
*, (
*)
*, ( :
, , 1
*) , (
*)
*, ( :
2 1
L L p
q p
q q
p
⎪⎩
⎪ ⎨
⎧
=
∀
≥
=
∀
≥
∑ ∑
=
=
n j p b v
m i q a v
m
i ij j
n
j ij j
, , 1
, , 1
1
* 2
1
* 1
L L
Th.5 ⎪⎩
⎪ ⎨
⎧
=
∀
≥
=
∀
≥
∑ ∑
=
=
n j p b v
m i q a v
m
i ij j
n
j ij j
, , 1
~
, , 1
~
1
* 2
1
* 1
L
L ( ∀ i , j , a ~
ij, ~ b
ij> 0 )
ただし,
0 ,
2 1v >
v
⎪⎩
⎪ ⎨
⎧
=
∀
≥
=
∀
≥
∑ ∑
=
=
n j p b
m i q a
m i ij i n
j ij j
, , 1
~ 1 ~
, , 1
~ 1 ~
1 1
L L
⎩ ⎨
⎧
=
=
2
* 1
*
~ : :
~ v p p
v q q
i i
j j
ただし,
⎪⎩
⎪ ⎨
⎧
=
≥
−
=
=
≥
−
=
∑ ∑
=
=
) , , 1 ( 0)
~ ( 1 ~ :
) , , 1 ( 0)
~ ( 1 ~ :
1 1
n j p b w
m i q a u
m i ij i j
n
j ij j
i
L
L
とおくNash 均衡点と線形相補性問題
V Proposition 1 相補性 complementarity
⎪⎩
⎪ ⎨
⎧
−
=
−
=
∑ ∑
=
= m
i ij i
j n
j ij j
i
p b w
q a u
1 1
~ ~ 1 :
~ 1 ~ :
⎪⎩
⎪ ⎨
⎧
=
=
=
=
∑ ∑
=
=
) , , 1 (
~ 0
) , , 1 (
~ 0
1 1
m i q w
n j p u
n
j j j
m
i i i
L L
Nash均衡点
が存在する まとめると…) , , 1 ( 0 ,
) , , 1 ( 0 ,
0 0
) , , 1 (
~ 1 :
) , , 1 (
~ 1 :
1 1
1 1
n j q w
m i p u
q w
p u
n j p b w
m i q a u
j j
i i
n
j j j
m
i i i
m i ij i j
n j ij j i
L L L L
=
≥ =
≥
=
=
=
−
=
=
−
=
∑ ∑ ∑ ∑
=
=
=
=
を満たす
u w , , p q ( ( i j 1 , 1 , , m , n ) )
が存在j j
i
i
L L
= =
が成立Nash 均衡点と線形相補性問題
V LCP, Linear Complementarity Problem
) , , 1 ( 0 ,
) , , 1 ( 0 ,
0 0
) , , 1 (
~ 1 :
) , , 1 (
~ 1 :
1 1
1 1
n j q w
m i p u
q w
p u
n j p b w
m i q a u
j j
i i
n
j j j
m
i i i
m i ij i j
n j ij j i
L L L L
=
≥ =
≥
=
=
=
−
=
=
−
=
∑ ∑ ∑ ∑
=
=
=
=
を満たす解
⎩ ⎨
⎧ = =
) , , 1 ( ,
) , , 1 ( ,
n j q w
m i p u
j j
i
i
L L
⎪⎩
⎪ ⎨
⎧
=
= ∑ ∑
j j j j
i i i i
q q q
p p p
: :
*
*
がNash均衡点
⎥ ⎦
⎢ ⎤
⎣
⎡
−
= −
⎥ ⎥
⎥ ⎥
⎥
⎦
⎤
⎢ ⎢
⎢ ⎢
⎢
⎣
⎡
=
⎥ ⎥
⎥ ⎥
⎥
⎦
⎤
⎢ ⎢
⎢ ⎢
⎢
⎣
⎡
=
⎥ ⎥
⎥ ⎥
⎥
⎦
⎤
⎢ ⎢
⎢ ⎢
⎢
⎣
⎡
= B 0
A M 0
z y
x , :
T1 1 1 1 : , : , :
1 1
1 1
M M M M M M
n m
n m
w w u u
q q p p 0
y x
x y
z Mx y
= ≥ +
= ) , (
, 0
,
T
ただし,
B=-AだとLP
⇔ 零和ゲームLemke法(M≧0)
内点法(M:PSD,P0
,…)
戦略形ゲームの応用
(岡田章『ゲーム理論』p.49-59等)V
応用例1:クールノー複占市場V
2企業(i=1,2)が同質な財を生産し,同一市場に供給している
V企業iの供給量qi
(
≧0) → 財の価格p=max{a-b(q
1+ q
2), 0}, (a,b>0)
V企業iの費用関数
C
i(q
i)= c
iq
i, (0<c
i<a)
V企業iの利潤関数πi
(q
1, q
2)=pq
i-c
iq
i限界費用 限界費用
各企業は利潤最大化利潤最大化したい!
クールノー・ナッシュ均衡
Cournot-Nash equilibrium
⎪⎩
⎪ ⎨
⎧
=
⇔ =
≥
≥
) , ( max ) , (
) , ( max ) , ( . . . : ) , (
2
* 1 0 2
* 2
* 1 2
* 2 1 0 1
* 2
* 1
* 1 2
* 1
2 1
q q q
q
q q q
q eq N C q q
q
q
π
π
π π
V企業i(=1,2)の企業j(≠i)に対する最適応答対応
⎪ ⎩
⎪ ⎨
⎧
− <
≤ −
≤
− −
=
⇒
⎩ ⎨
⎧ − − − + ≤ − < ≤ −
=
i i
i i i j
i
i j i
i
j i i i
i
b q c
a b
c q a q b
c a q
q q b a q
c
q b a q q q q b c q a q
if 0
0 if 2 2
/ if
/ 0 if )) ( ) (
, (
*
2 1 2
π
1⎥⎦
⎢ ⎤
⎣
⎡ < =
∂
= ∂
∂
∂ 0, 0 ( 1,2)
) 2
2
i q
q i
i i
i π
Q π
p>0
p=0
戦略形ゲームの応用
V
応用例1:クールノー複占市場⎪ ⎩
⎪ ⎨
⎧
− <
≤ −
≤
− −
i i
i i i j
b q c
a b
c q a q b
c a
if 0
0 if 2 2
b c a
2
−
2b c a −
1b c a −
2b c a
2
−
1q
1q
20
) , 2 , 1 (
2 i j i
b c a b
c
a i − j = ≠
− ≤
の場合
クールノー・ナッシュ均衡点
⎟ ⎠
⎜ ⎞
⎝
⎛ − + + −
= b
c c a b
c c q a
q 3
, 2 3 ) 2 ,
(
*2 1 2 1 2* 1
* a c 3
1c
2p = + +
⎪ ⎩
⎪ ⎨
⎧
−
= + +
= −
b c c q a q
b c c q a q
9 ) 2 ) ( , (
9 ) 2 ) ( , (
2 2 1
* 1
* 1 2
2 2
* 1 1
* 1 1
π π
各企業の利潤 財の価格パレート最適ではない 例:c1
=c
2の時,q1=q
2=(a-c)/4b
とした方が,どちらの企業もよ り多くの利潤が得られる戦略形ゲームの応用
V
応用例2:寄付金ゲームVある町の町長が,公共事業のため,n人の住人に寄付を募る
V各住人は,寄付額
0円~1000円 を自分の好きな分だけ寄付
V寄付総額の2倍を,n人の住人に均等に分配する
V住人i (=1,…,n) の戦略(寄付額):
x
i (0≦xi≦1000)V住人i (=1,…,n) の利得関数: i
n
k k n
i
x x x x
u = ∑ −
=1
1
, , ) 2
( L
n>2
の時,戦略x
i*=0 が,他の戦略 x
i>0 に対する支配戦略となる!
戦略の組
x*=(0,…,0) が唯一の均衡点,
即ち,誰も寄付しない誰も寄付しない!
寄付はいくら集 まるだろう?
パレート最適ではない 全ての住人が1000円寄付する と,全ての住民の利得は1000 円であり,均衡点より望ましい
しかし,x=(1000,…,1000)では,
どの住民も裏切る動機を持つ
) 1000 1 ( 2000 ) , 0
(
−= − >
n x n u
i i ただ乗りただ乗り
free- free -riding riding:
他人の貢献を利用して個人的利益を得る行為
戦略形ゲームの応用
V
応用例3:電力消費ゲームVある都市で,n人の住人がクーラーを所持.暑い日の出来事
V各住人i (=1,…,n)の戦略と,その費用,及び効用は,
• 戦略:低温設定(xi
=α),電力消費1000W,効用U
• 戦略:中温設定(xi
=β),電力消費500W,効用u
(U>u>0) Vこの都市の停電確率は,総電力量をQとしたとき,n c Q n
c c Q Q
P 1 ( if ) where 500 1000
) 0 if ( ) 0
( < <
⎩⎨ ⎧
< ≤ ≤
=
停電臨界点 停電臨界点
V節電する住人の数をs (0≦
s
≦n)とすると,総電力消費量は
•
Q(s) := 500s + 1000(n-s)=1000n-500s
V住人i の効用は•
⎪⎩
⎪ ⎨
⎧
=
≤ =
< ≤
=
)) , ) ( if (
) , ) ( if (
)) ( if ( 0 ) , , (
1α β
i i n
i
x c s Q u
x c s Q U
s Q c x
x
u L
減少関数Q(s)について,Q(s’)≦c≦Q(s’-1) を満たすs’が 唯一定まり,0≦s*≦s’-2, s*=s’を満たす全てのsが均衡点
戦略形ゲームの応用
V
応用例3:電力消費ゲームs Q
0 1000n
s’-1 s’ s’+1 n s’-2
均衡点
均衡点
c
都市停電停電!
•全住人の効用は0.
•1人の住人だけ設定を変えても
効用は0のままなので均衡状態 都市停電停電せず
•低温設定住人の効用U
•中温設定住人の効用u
•中温設定の1人でも低温に変更
すると停電(効用がu→0)より均 衡状態戦略形ゲーム
V
囚人のジレンマ型ゲーム(T 1 , T 2 ) (B 1 , W 2 )
D
(W 1 , B 2 ) (S 1 , S 2 )
C
D C
A
\B
ただし,Bi
(best) > S
i(second) > T
i(third) > W
i(worst)
さらにも満たすならば,『標準的標準的 な囚人のジレンマ型ゲー な囚人のジレンマ型ゲー ム』 とよばれるム
) 2 , 1 ( 2 =
= B + W i S
i i i 異なる戦略を交互に取る,即ち,(C,D)→(D,C)→(C,D)→…
とするときの期待利得が,協調行 動(C,C)の利得より小さい状況
⎩⎨
⎧ = = − − < > = = − − > < = = − − > <
) 0
~ ( ), 0 ( ˆ ), 0 (
) 0
~ ( ), 0 ( ˆ ), 0 (
2 2 2
2 2 2
1 1 1
1 1 1
T W c B T c W S c
T B r W T r B S r
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
⎪⎩ >
⎪ ⎨
⎧
=
→
< → ∈
= → =
>
⇒
⎩⎨ ⎧
+ +
= + −
=
0 0 ) (
] 1 , 0 [ 0 )
( ) 0 1
(
, 0 0 ) (
] 1 , 0 [ 0 ) (
1 0 ) (
) ~ ( ˆ : ) (
) ˆ ( ˆ : ) (
2 1 2
2 1 2
2 1 2
1 2 1
1 2 1
1 2 1
1 1 2
1 2 1
q p f
q p
f p q
f p q f
p q f
p q f
c p c c p f
r q r r q f
⎩ ⎨
⎧
= =
⇒
⎩⎨
⎧ + + − + < <
⇒
⎪⎩
⎪ ⎨
⎧
=
−
≤
−
−
−
= − + −
= + ≤ +
0 0
~ 0 ˆ ) (
0 ˆ ) ˆ (
) ~ ( ) (
) ( ) ˆ (
ˆ ˆ
* 1
* 1
1 1
2 2 2 2 2 2
2 2 2 2
q p
c p c c
r q r r
c T W T W B S
B T W S c c
r r r
→