意思決定科学: ゲーム理論2
情報学部 堀田敬介
2010/11/30,Tue. ~
Contents
V 2
人非協力非零和ゲームV定義:ゲームのルール,双行列
V例:囚人のジレンマ,面会ゲーム,恋人達のジレンマ,…
V最適応答,Nash均衡点
V Nash
均衡点と線形相補性問題(LCP
)V
戦略形ゲームの社会・経済問題への応用例V Example
:VプレイヤーはAとBの2人
V各プレイヤーは,独立に自分の戦略を決定
(非協力)
Vプレイヤーの利得の和は一定とは限らない
(非零和)
V純粋戦略の数は有限
A
\B s B1 s B2 s A1 (2, 3) (-1,-2) s A2 (-2,-1) (1,1)
A
,B
の利得表N={A, B}
Si
={s
i1, s
i2}, (i=A,B)
fi
:
SA×SB→ R, (i=A,B) fA(sA1, sB1) = 2 +fA(sA1, sB2) = -1 + fA(sA2, sB1) = -2 + fA(sA2, sB2) = 1 +
fB(sA1, sB1) = 3 ≠0 fB(sA1, sB2) = -2 ≠0 fB(sA2, sB1) = -1 ≠0 fB(sA2, sB2) = 1 ≠0 SA={sA1, sA2}, SB={sB1, sB2},
2 人非協力非零和ゲーム
V
双行列ゲームV利得関数
V利得行列
) , ( : ) , ( )
, ( ) , (
) , ( )
, ( ) , (
) , ( )
, ( ) , (
2 2 1
1
2 2 22
22 21
21
1 1 12
12 11
11
B A b
a b
a b
a
b a b
a b
a
b a b
a b
a
mn mn m
m m
m
n n
n n
=
⎥ ⎥
⎥ ⎥
⎦
⎤
⎢ ⎢
⎢ ⎢
⎣
⎡
L
M O
M M
L L
ij B A B ij B A
A
s s a f s s b
f j
i
i j=
i j=
∀ , , ( , ) , ( , ) ]
[ ],
[ a
ij= b
ij= B
A
プレイヤーBの戦略(n個)の利得(右側)
プレイヤーA の戦略(m個)
の利得(左側)
双行列 和が零(一定)という条件はない(非零和)
2 人非協力非零和ゲーム
V
例1:恋人達のジレンマbattle of sexes
Vある一組のカップルがデートをしたいと思っている
V男性は野球観戦を希望し,女性は映画鑑賞がしたい
V各々が好きなものを見るより一緒にいることの方が大事
男\女 野球 映画 野球
(2,1) (-1,-1)
映画(-1,-1) (1,2)
性の戦い,男女の戦い,
逢引きのジレンマ,…
互いに支配戦略は持たない
ミニマックス原理に従うと,互いにどちらの戦略でも良い?
(または各戦略のマックスが大きくなる方を選ぶ!?)
1 min
max
ij= −
i j
a
1 min
max
ij= −
j
i
b
2 人非協力非零和ゲーム
V
例1:恋人達のジレンマbattle of sexes
V 零和ゲームの時と同じ方法で,混合戦略で期待利得最大化すると
…
男\女 野球 映画野球
(2,1) (-1,-1)
映画(-1,-1) (1,2)
p
1p
2q
1q
2⎩⎨
⎧ = = − − − − + +
2 2 1 2 2 1 1 1
2 2 1 2 2 1 1
1
2
) , ( , ) 2 (
q p q p q p q p E
q p q p q p q p E
B
A
p q
q p
⎩⎨
⎧ = = − − +
1 2 )) 1 , 0 ( ,
( , ( 1 , 0 )) 3 1 (
1 1
p E
p E
A
A
p
p
⎩⎨
⎧ = = − − +
2 3 ) ), 1 , 0
(( 1 , 0 ), ) 2 1 ((
1 1
q E
q E
B
B
q
q
5 ) 1 , ˆ ( ˆ 5 , ) 1 , ˆ ( ˆ , 5 ) , 2 5 ( 3 5 ), , 3 5 ( 2 ˆ ) ˆ ,
( ⎟ = =
⎠
⎜ ⎞
⎝
= ⎛ p q p q
q
p E
AE
Bところが…
5 ) 1
, ˆ
( = p
1− E
Ap q
5 ) 4
ˆ ,
( = − q
1+ E
Bp q
Bが
をとるならAは ではなく(1,0)にする方が 期待利得が高くなる!q ˆ p ˆ Aが
をとるならBは ではなく(0,1)にする方が 期待利得が高くなる!q ˆ p ˆ
均衡しない
つまり,相手が純粋戦略を取ってきたときだけの自分の混合戦略を考えて 期待利得を求めるやり方では,均衡解を求められない
V最適応答対応
best response correspondence
• Bの戦略 に対するAの最適応答の集合
を,プレイヤーAの最適応答対応とよび,
を,プレイヤーAの最適応答集合とよぶ
V Definition
最適応答と最適応答対応V最適応答
best response
• プレイヤーAの戦略 が,プレイヤーBの戦略 に対 する最適応答であるとは,以下が成り立つことA A
S
s ∈ s
B∈ S
B) , ( max ) ,
( p q p q
p A
A
E
E =
) , ( max ) ,
(
A A BS B s A
A
s s f s s
f
A A∈
=
純粋戦略の場合混合戦略の場合
B
B
S
s ∈
} { ( , ) max ( , )
)
(
A A BS B s A A A A B
A
s s S f s s f s s
R
A A∈
=
∈
=
} { (
A,
B)
A A(
B),
B BA
s s s R s s S
D = ∈ ∈
} { ( , ) max ( , )
)
( q p p q p q
p A
A
A
E E
R = =
純粋戦略 の場合 混合戦略
の場合
最適応答原理に帰着
最適応答原理
プレイヤーAの(純戦略での)最適応答
s
B1→ max{7,8,4} = 8s
B2→ max{0,6,3} = 6s
B3→ max{5,2,6} = 6V
最適応答と最適応答対応• プレイヤーA,Bが各々最適応答をとる場合,その組の集合は となる
2 人非協力非零和ゲーム
B
A
D
D D : = ∩
A\B
s
B1s
B2s
B3s
A1(7,7) (0,8) (5,5) s
A2(8,0) (6,6) (2,7) s
A3(4,5) (3,1) (6,2)
V例:
} { ) (
} { ) (
} { ) (
3 3
2 2
2 1
A B A
A B A
A B A
s s R
s s R
s s R
=
==
} { ( s , s ), ( s , s ), ( s , s ) D =
プレイヤーBの(純戦略での)最適応答
s
A1→ max{7,8,5} = 8s
A2→ max{0,6,7} = 7s
A3→ max{5,1,2} = 5( ) { } } { ) (
} { ) (
1 3
3 2
2 1
B A B
B A B
B A B
s s R
s s R
s s R
==
=
} { (
A2,
B3), (
A1,
B2), (
A3,
B1)
B
s s s s s s
D =
互いに最適応答なら均衡する
(D≠∅なら均衡)
より,
純粋戦略のみでは 均衡しない
∅
=
D
2 人非協力非零和ゲーム
V Definition Nash
均衡点Nash equilibrium point
V(混合)戦略の組 が次の条件を満たすとき,
をNash均衡点とよぶ
( *, *) q p
q q p q
p
p q p q
p ≥ ≥ ∀ ∀
)
*, (
*)
*,
( *, *) ( , *) (
B B
A
A
E
E
E E
V Theorem 1
V(混合)戦略の組 が互いに最適応答であるならば
Nash
均衡点であり,逆も成り立つ.即ち,Nash
均衡点の集 合をE
とすると,B
A
D
D E = ∩
ˆ ) ˆ , ( p q
Nash均衡点は,零和ゲー
ムの均衡点(鞍点)を含む一般的な概念
*)
*, ( p q
V Theorem 2
V(混合)戦略の組 がNash均衡点であるた めの必要十分条件は
*)
*, ( p q
n j
s E E
m i
s E E
j i
B B B
A A
A
( *, *) ( *, ) 1 , ,
, , 1
*) , (
*)
*, (
L L
=
∀
≥ ∀ =
≥ p q
p
q q
p
Bがq*をとるならAはp*がベスト Aがp*をとるならBはq*がベスト
2 人非協力非零和ゲーム
V 2
人非協力非零和ゲームのNash
均衡点[ A, B ]
) , ( ) , (
) , ( ) , (
22 22 21 21
12 12 11
11
⎥ =
⎦
⎢ ⎤
⎣
⎡
b a b a
b a b p
1a
p
2q
1q
2⎩⎨
⎧ ≥ ≥ ≥ ≥ + + = = 1 ,
0 ,
0 0 , 0 , 1
2 1 2 1
2 1 2
1
q q q
q
p p p p
22 1 1 1 1
22 1 22 21 1 12 22 1 1 12 22 21 11
22 1 1 1 1
22 1 22 21 1 12 22 1 1 12 22 21 11
ˆ ~ ˆ )
( ) ( )} ( ) ( )
) {(
, (
ˆ ~ ˆ )
( ) ( )} ( ) ( )
) {(
, (
b q c p c q p c c
b q b b p b b q p b b b b E
a q r p r q p r r
a q a a p a a q p a a a a E
T B
T A
+ +
− +
= − + − − − + − +
= = + − + +
= − + − − − + − +
= = Bq p q p
Aq p q p
プレイヤーA,Bが混合戦略をとった際の期待利得
⎩⎨
⎧ ≥ ≥
⎩⎨ ⎧
≥ ≥
)) 1 , 0 ( , ( ) ,
( , ) ( , ( 1 , 0 )) (
) ), 1 , 0 ((
) ,
( , ) (( 1 , 0 ), ) (
p q
p
p q
p
q q
p
q q
p
B B
B B
A A
A A
E E
E E
E E
E Theorem 2 より, E
Nash均衡点
V 2
人非協力非零和ゲームのNash
均衡点VプレイヤーAの最適応答について
⎩⎨
⎧ + + − − − ≥ ≤
⇔
⎩⎨
⎧ + + − − + + + + ≥ ≥ + + − + +
⇔
⎩⎨ ⎧
≥ ≥
0 ˆ } ˆ )
{( ˆ ) ˆ }( 1 ) 0 {(
~ ˆ ~
ˆ ) (
ˆ ~ ˆ )
~ ( ) ˆ
( ˆ
) ), 1 , 0 ((
) ,
( , ) (( 1 , 0 ), ) (
1 1
1 1
22 1 22 1 1 1 1
22 1 1
22 1 1 1 1
p r q r r
p r q r r
a q r a q r p r q p r r
a q r r q r r a q r p r q p r r
E E
E E
A A
A
A
p q q
q q
p
1
1
ˆ 0
ˆ )
( r + r q − r >
となるq
⎩⎨ ⎧
≥ ≤
− 0 0 1
1 1
p p
1
1
ˆ 0
ˆ )
( r + r q − r =
となるq
1
1
ˆ 0
ˆ )
( r + r q − r <
となるq
⎩⎨ ⎧ −
任意任意
: : 1
1 1
p p
⎩⎨
⎧ − ≤ ≥ 0 0 1
1 1
p p
故に,p ∈ R
A(q )
となるためには,1
= 1 p
:
任意p
11
= 0 p
2 人非協力非零和ゲーム
V 2
人非協力非零和ゲームのNash
均衡点VプレイヤーBの最適応答について
⎩⎨ ⎧
≥ +
+ + − ≤
⇔ +
⎩⎨ ⎧
+
−
≥ + +
−
+ − + + ≥ + − + +
⇔ +
⎩⎨
⎧ ≥ ≥
0
~ } ˆ )
{( ˆ ) ~ }( 1 ) 0 {(
~ ˆ ) ˆ
( ˆ
ˆ ~ ) ˆ
~ ( ˆ )
ˆ (
)) 1 , 0 ( , ( ) ,
( , ) ( , ( 1 , 0 )) (
1 1
1 1
22 1 22 1 1 1 1
22 1
1 22
1 1 1 1
q c p c c
q c p c c
b p c b q c p c q p c c
b c p c p c c b q c p c q p c c
E E
E E
B B
B
B
p q p
p q
p
1
1
~ 0
ˆ )
( c + c p + c >
となるp
⎩⎨
⎧ − ≥ ≤ 0 0 1
1
q
1q
⎩⎨
⎧ −
任意 任意: : 1
1
q
1q
⎩⎨ ⎧
≤ ≥
− 0 0 1
1 1
q q
故に,q ∈ R
B( p )
となるためには,1
= 1 q
:
任意q
11
= 0 q
1
1
~ 0
ˆ )
( c + c p + c =
となるp
1
1
~ 0
ˆ )
( c + c p + c <
となるp
2 人非協力非零和ゲーム
V 2
人非協力非零和ゲームのNash
均衡点V例:
A\B
s
B1s
B2s
A1(6,5) (2,7) s
A2(3,4) (6,1)
4 ˆ 7
ˆ )
( r + r q
1− r = q
1− p
1p
2q
1q
2⎪⎩
⎪ ⎨
⎧
=
−
=
−
= − = − = −
= = − = − =
⎪⎩
⎪ ⎨
⎧
−
=
−
=
−
= − = − =
= = − = − =
3 1
~ ˆ 1 5 4 7 4 1 6 3 6
~ ˆ 6 6 3 3 2 3 4
22 21
12 22
21 11
22 21
12 22
21 11
b b c
b b c
b b c
a a r
a a r
a a r
⎪⎩
⎪⎨
⎧
=
→
<
→
=
=
→
>
0 7 :
4 7 : 4
1 7 : 4
1 1
1 1
1 1
p q
p q
p q
任意
⎪⎪
⎩
⎪⎪⎨
⎧
=
→
>
→
=
=
→
<
0 5 :
3 5 : 3
1 5 : 3
1 1
1 1
1 1
q p
q p
q p
任意
3
~ 5 ˆ )
( c + c p
1+ c = − p
1+
p
1q
10 1
1 4/7
3/5
プレイヤーA の最適応答 プレイヤーB
の最適応答
Nash均衡点
2 人非協力非零和ゲーム A\B s
B1 s
B2
s
A1 (6,5) (2,7)
s
A2 (3,4) (6,1)0 0.25
0.5 0.75
1 player A
0 0.25
0.5 0.75
1
player B 2
3 4 5 6 Exp
0 0.25
0.5 player A 0.75
EA
(p,q)
0 0.25
0.5 0.75
1 player A
0 0.25
0.5 0.75
1
player B 0
2 4 6 Exp
0 0.25
0.5 player A 0.75
EB
(p,q)
EA
(p,(4/7,3/7))=30/7
EB((3/5,2/5), q)=23/5
p
1q
10 1
1 4/7
3/5
V Theorem 3
V(混合戦略まで拡大すると,)双行列ゲームには,少なくと も1つNash均衡点が存在する
V Theorem 4
(cf. Theorem 2
)V(混合)戦略の組 がNash均衡点であるための必要 十分条件は, が写像 の不動点であ ること.即ち,
*)
*, ( p q
*) (
*) (
*
* q q p
p × ∈ R
A× R
B*)
*, ( p q
戦略の組が均衡点であるための必要十分性(Theorem 2, 4など)
の証明は,「Brouwerの不動点定理」「角谷の不動点定理」などから
)
( )
( q
Bp
A
R
R ×
演習1:
V
次の双行列ゲームのNash
均衡点を求めよA\B
s B1 s B2 s A1 (-24, 12) ( 4 , 6)
s A2 ( 6 , -8) (-2 , 2)
Coffee Brake!
V John F. Nash (1928- )
V紹介サイトの情報
V
A Beautiful Mind
いずれも2004年11月9日(火)取得の情報
Non-Cooperative Games Nash [pdf]
補足: 2 人非協力零和ゲーム
V 2
人非協力零和ゲームのNash
均衡点V 例:プレイヤーAの利得表
A\B
s
B1s
B2s
A13 -2 s
A2-1 4
6 ˆ 10 ˆ)
(r+r q1−r= q1−
p
1p
2q
1q
2⎪⎩
⎪⎨
⎧
=
−
−
=
−
= − = − − =−
== − = − − =−
⎪⎩
⎪⎨
⎧
−
=
−
−
=
−
= − = − − =
== − = − − =
5 ) 4 (
~ˆ ((143)) 12 46 5 4 ) 1
~ˆ 34( (( 12)) 46
22 21
12 22
21 11
22 21
12 22
21 11
b b c
b b c
b b c
a a r
a a r
a a r
⎪⎪
⎩
⎪⎪⎨
⎧
=
→
<
→
=
=
→
>
0 5 : 3
5 : 3
1 5 : 3
1 1
1 1
1 1
p q
p q
p q
任意
⎪⎩
⎪⎨
⎧
=
→
>
→
=
=
→
<
0 2 : 1
2 : 1
1 2 : 1
1 1
1 1
1 1
q p
q p
q p
任意
5
~ 10 ˆ)
(c+c p1+c=− p1+
p
1q
10 1
1 3/5
1/2
プレイヤーA の最適応答
Nash均衡点
プレイヤーBの最適応答 4
5 6 10 ) ,
( = p1q1− p1− q1+ E pq
⎩⎨
⎧ ==− −+
⎩⎨
⎧ ==− −+
4 5 ) ), 1 , 0
((1,0), ) 5 2 , ((
4 6 )) 1 , 0 ( ,
( ,(1,0)) 4 1 (
1 1 1
1 E p
q E
p E
p E
q q p
p
p1 E
1 0 1/2
1 E
1
0 3/5 q1
零和ゲームの場合は
¾最適応答戦略
¾ミニマックス戦略 いずれの考え方でも均 衡解を求められるよ
V
例2:囚人のジレンマprisoner’s dilemma
V2人の凶悪犯が別個に取り調べを受けている
V現状では証拠不十分で軽い罪でしか起訴できないため,2 人とも3年
V各囚人は司法取引を持ちかけられ,応じた方は1年,応じな い方は10年,ただし,2人ともが応じた場合は2人とも8年
A
\B
黙秘 自白黙秘
(3,3) (10,1)
自白(1,10) (8,8)
※司法取引:被告が自分の罪を認める代わりに罪を軽くしてもらうこと 注意:値が小さい
方が嬉しい!
最適応答原理に従ってまじめに計算しても…
2 人非協力非零和ゲーム
V
例2:囚人のジレンマprisoner’s dilemma
A
\B
黙秘 自白黙秘
(3,3) (10,1)
自白(1,10) (8,8)
注意:値が小さい 方が嬉しい!
各プレイヤーとも,「自白」が支配戦略! 結果として,
(自白,自白)がNash均衡点であり,ゲームは支配可解
} { (( 0 , 1 ),
q)
0≤q≤1A= D
最適応答原理に従って考えても…,
} { (
p, ( 0 , 1 ))
0≤p≤1B= D
p
1p
2q
1q
2( ) } { ( 0 , 1 ), ( 0 , 1 )
: = D
A∩ D
B= D
q
11
⎩⎨ ⎧
<
−
= +
+ − = − <
+ ˆ ) ~ 0 2 0
( ˆ ) ˆ 0 2 0
(
1 1
1
1
c p
p c c
q r q r r
⎩⎨
⎧ ==
0 0
1 1
q p
明らかにもっと良い解がある
Pareto最適でない!
2 人非協力非零和ゲーム
V Nash
均衡点が最適戦略か?V
2人零和ゲーム
• ミニマックス戦略が最適戦略!
V
2人非零和ゲーム
•
Nash均衡点が最適戦略を与えるわけではない!
• ゲームの値が異なる複数の均衡点が存在する場合がある!
•
Nash均衡点は,必ずしもPareto最適ではない!
行動の指針を与えてくれる
最適応答原理は不十分かも…!?
(しかし他に適切なものがあるか?)
•得られる解の状態を示すことで,何らかの均衡戦略を
とるべきことを教える•均衡状態が複数あることを示すことで,戦略決定判断
が困難であることも教える非協力ゲーム
Nash均衡点の精緻化
協力ゲームへの転換2 人非協力非零和ゲーム
V
例3:面会ゲームV遠く離れている2人が至急会う必要がある
V今居る場所は互いにわかっており,会いに行くか,相手が 来るのを待つかの選択が出来る.(途中で会うことはない)
A
\B
行く 待つ行く
(-6,-6) (6,10)
待つ(10,6) (0,0)
⎪ ⎪
⎩
⎪ ⎪
⎨
⎧
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
+ >
−
= + +
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
+ >
−
=
− +
0 0 [ 0 , 1 ]
0 1
6 0
~ 22 ˆ )
(
0 0 [ 0 , 1 ]
0 1
6 0 ˆ 22
ˆ ) (
1 1 1 1
1
1 1 1 1
1
q q q p
c p c c
p p p q
r q r
r p
1q
10 1
1
3/11
3/11 Nash均衡点
((0,1),(1,0)),
((3/11,8/11),(3/11,8/11)),
((1,0),(0,1))
p
10 1
3/11
3/11
0 0.25
0.5 0.75
1 player A
0 0.25
0.5 0.75
1
player B -5
0 5 10 Exp
0 0.25
0.5 player A 0.75
0 0.25
0.5 0.75
1 player A
0 0.25
0.5 0.75
1
player B -5
0 5 10 Exp
0 0.25
0.5 player A 0.75
E
A(p,q)
E
B(p,q)
E
A(p,(3/11,8/11))=30/11 E
B((3/11,8/11), q)=30/11
2 人非協力非零和ゲーム
V
例4:弱虫ゲームchicken game
V2人の人間が2台の車をそれぞれ運転する
V2人は,お互いに向かって車を走らせる
V2台ともそのまま走り続ければ,やがてぶつかり死ぬため,
直前で回避してよい.
Vしかし,相手より先によけた(進路を変えた)プレイヤーは
「チキン」と罵られ,臆病者のレッテルを貼られる
A
\B
避ける 避けない避ける
(2,2) (0,9)
避けない
(9,0) (-5,-5)
2 人非協力非零和ゲーム
V
例4:弱虫ゲームchicken game A
\B
避ける 避けない 避ける(2,2) (0,9)
避けない
(9,0) (-5,-5)
⎪ ⎪
⎩
⎪ ⎪
⎨
⎧
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
+ >
−
= + +
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
+ >
−
=
− +
0 0 [ 0 , 1 ]
0 1
5 0
~ 12 ˆ )
(
0 0 0 0 [ 1 0 , 1 ] 5
ˆ 12 ˆ )
(
1 1 1 1
1
1 1 1 1
1
q q q p
c p c c
p p p q
r q r r
p
1q
10 1
1
5/12
5/12
Nash均衡点
((0,1),(1,0)),
((5/12,7/12),(5/12,7/12)),
((1,0),(0,1))
E
A(p,(5/12,7/12))=10/12 E
B((5/12,7/12), q)=10/12 (9,0)
(0,9)
2 人非協力非零和ゲーム
V
例1:恋人達のジレンマbattle of sexes
男\女 野球 映画野球
(2,1) (-1,-1)
映画(-1,-1) (1,2)
⎪ ⎪
⎩
⎪ ⎪
⎨
⎧
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
− >
= + +
⎪⎩
⎪ ⎨
⎧
=
→
< → ∈
= → =
− >
=
− +
0 0 [ 0 , 1 ]
0 1
3 0
~ 5 ˆ ) (
0 0 [ 0 , 1 ]
0 1
2 0 5 ˆ ) ˆ (
1 1 1 1
1
1 1 1 1
1
q q q p
c p c c
p p p q
r q r r
p
1q
10 1
1
2/5
3/5
Nash均衡点
((1,0),(1,0)),
((3/5,2/5),(2/5,3/5)),
((0,1),(0,1))
E
A(p,(5/12,7/12))=1/5 E
B((5/12,7/12), q)=1/5 (2,1)
(1,2)
V
例5:病的な例A
\B s
B1s
B2s
A1(8,8) (4,8) s
A2(8,4) (4,4)
友情ルール:自分の利得が同じなら,
相手の利得が大きくなる戦略を選ぶ 嫌がらせルール:自分の利得が同じなら,
相手の利得が小さくなる戦略を選ぶ
Nash均衡点の精緻化
全ての純粋戦略の組がNash均衡点!
(sA1
,s
B1)が均衡点⎩⎨
⎧
∈
→
= + +
∈
→
=
− +
] 1 , 0 [ 0 0 ) 0 0 (
] 1 , 0 [ 0 0 ) 0 0 (
1 1
1 1
q p
p q
p
1q
10 1
1
全ての混合戦略の組がNash均衡点!
(sA2
,s
B2)が均衡点Aが友情 & Bが嫌がらせルールに従う
→ (sA1,s
B2),Aが嫌がらせ & Bが友情ルールに従う
→ (sA2,s
B1)⎩⎨EB(p,q)=8p1q1+4p2q1+8p1q2+4p2q2=8p1+4p2
↑自分の期待利得を自分の戦略で決められないことによる
弱支配
2 人非協力非零和ゲーム
V
例6:共有地の悲劇(囚人のジレンマのn人拡張版)V 数軒の酪農家が共有の牧草地を所有している.各酪農家が先を争って 牛を放牧し,自分の利益最大をはかる限り,牛の数を増やし続けると,
待っているのは共有地の荒廃という悲劇である.
V 単純なモデルでの考察
• 酪農家は4軒
(i=1,2,3,4)
• 酪農家iが放牧する牛の数qi
• 各酪農家は3頭まで牛を購入でき,購入価格は全て等しく2
• 酪農家iの収益をxiとし,xi
= q
i{16
-(q
1+ q
2+ q
3+ q
4)}
-2 q
ii
\others 0 1 2 3 4 5 6 7 8 9
0 0 0 0 0 0 0 0 0 0 0
1 13 12 11 10 9 8 7 6 5 4
2 24 22 20 18 16 14 12 10 8 6 3
たくさん放牧する と収益が減る!
Nash均衡点
Nash 均衡点と線形相補性問題
V Definition
戦略的同等性VゲームGのNash均衡点がG’のそれであり,かつその逆も成 立するとき,2つのゲームは戦略的に同等であるという
V Theorem 5
V
2
つの双行列ゲームG, G’
において,任意の要素について,という関係があるとき,
G
とG’
は戦略的に同等である⎩ ⎨
⎧ ′ ′ = = + +
∃
>
>
∃
2 2
1 2 1
1 2
1
0 , α 0 , β , β , α α β β
α
ij ij
ij ij
b b
a a
V例:
A
\B s
B1s
B2s
A1(3,-1) (0,2) s
A2(-2,4) (5,-2)
A
\B s
B1s
B2s
A1(5,-1) (-1,8) s
A2(-5,14) (9,-4)
戦略的同等
2 , 3 , 1 ,
2
1 2 21
= β = − α = β =
α
G G’
Nash 均衡点と線形相補性問題
V Nash
均衡点を求めるNash
均衡点Th.2
*)
*, ( p q
⎩ ⎨
⎧ = = ≥ ≥ ∀ ∀ = =
n j
s E E
v
m i
s E E
v
j i
B B B
A A
A
( *, *) ( *, ) 1 , ,
:
, , 1
*) , (
*)
*, ( :
2
1
L L
p q
p
q q
p
⎪⎩
⎪ ⎨
⎧
=
∀
≥
=
∀
≥
∑ ∑
=
=
n j
p b v
m i
q a v
m
i ij j
n
j ij j
, , 1
, , 1
1
* 2
1
* 1
L L
Th.5 ⎪⎩
⎪ ⎨
⎧
=
∀
≥
=
∀
≥
∑ ∑
=
=
n j
p b v
m i
q a v
m
i ij j
n
j ij j
, , 1
~ 1 , ,
~
1
* 2
1
* 1
L
L ( ~ 0 )
~ , ,
, >
∀ i j a
ijb
ij ただし,0 ,
21
v >
v
⎪⎩
⎪ ⎨
⎧
=
∀
≥
=
∀
≥
∑ ∑
=
=
n j
p b
m i
q a
m
i ij i
n
j ij j
, , 1
~ 1 ~
, , 1
~ 1 ~
1 1
L L
⎩ ⎨
⎧
=
=
2
* 1
*
~ : :
~
v p p
v q q
i i
j j
ただし,
⎪⎩
⎪ ⎨
⎧
=
≥
−
=
=
≥
−
=
∑ ∑
=
=
) , , 1 ( 0)
~ ( 1 ~
:
) , , 1 ( 0)
~ ( 1 ~
:
1 1
n j
p b w
m i
q a u
m
i ij i
j
n
j ij j
i
L
L
とおくV Proposition 1
相補性complementarity
⎪⎩
⎪ ⎨
−
=
−
=
∑ ∑
=
= m
i ij i
j
j ij j
i
p b w
q a u
1 1
~ ~ 1
: 1 :
⎪⎩
⎪ ⎨
⎧
=
=
=
=
∑ ∑
=
=
) , , 1 (
~ 0 0 ( 1 , , )
~
1 1
m i
q w
n j
p u
n
j j j
m
i i i
L L
Nash均衡点
が存在する まとめると…) , , 1 ( 0
, 0 ( 1 , , ) ,
0 0
) , , 1 (
~ 1
:
) , , 1 (
~ 1
:
1 1
1 1
n j
q w
m i
p u
q w
p u
n j
p b w
m i
q a u
j j
i i
n
j j j
m
i i i
m i ij i j
n j ij j i
L L
L L
=
≥ =
≥
=
=
=
−
=
=
−
=
∑ ∑ ∑ ∑
=
=
=
=
を満たす
u w , , p q ( ( i j 1 , 1 , , m , n ) )
が存在j j
i
i
L L
= =
が成立
Nash 均衡点と線形相補性問題
V LCP, Linear Complementarity Problem
) , , 1 ( 0
, 0 ( 1 , , ) ,
0 0
) , , 1 (
~ 1
:
) , , 1 (
~ 1
:
1 1
1 1
n j
q w
m i
p u
q w
p u
n j
p b w
m i
q a u
j j
i i
n
j j j
m
i i i
m i ij i j
n j ij j i
L L
L L
=
≥ =
≥
=
=
=
−
=
=
−
=
∑ ∑ ∑ ∑
=
=
=
=
を満たす解
⎩ ⎨
⎧ = =
) , , 1 (
, ( 1 , , ) ,
n j
q w
m i
p u
j j
i
i
L L
⎪⎩
⎪ ⎨
⎧
=
= ∑ ∑
j j j j
i i i i
q q q
p p p
: :
*
*
が
Nash
均衡点⎥ ⎦
⎢ ⎤
⎣
⎡
−
= −
⎥ ⎥
⎥ ⎥
⎥ ⎤
⎢ ⎢
⎢ ⎢
⎢ ⎡
=
⎥ ⎥
⎥ ⎥
⎥ ⎤
⎢ ⎢
⎢ ⎢
⎢ ⎡
=
⎥ ⎥
⎥ ⎥
⎥ ⎤
⎢ ⎢
⎢ ⎢
⎢ ⎡
= B 0
A M 0
z y
x 1 1 , :
T1 : , : , :
1 1
1 1
M M M
M M
M
m m
w u u
q p p
0 y x
x y
z Mx y
= ≥ +
= ) ,
( 0 , ,
T
ただし,