意思決定科学：ゲーム理論１

(1)

意思決定科学：ゲーム理論１

情報学部堀田敬介

2012/11/12,Tue. ^～

• 均衡点（ i,* j* ）は鞍点なので，プレイヤー A が戦略 i* を用いると，プレイヤー B がいかなる戦略をとっても少なくとも v(A) を得ることができ，また， B が戦略 j を取る限り，* A は戦略を変えても利得を増加させることはできない．

戦略 i* ^が A の最適戦略



純粋戦略と混合戦略

• Theorem2

• 厳密に確定的な零和ゲームにおいて，均衡点が複数ある場合，各均衡点の値は等しい．また，(i, j), (i

₀

, j

₀

) が均衡点ならば， (i*, j

₀

), (i

₀

, j*) も均衡点である．

2 人非協力零和ゲーム

均衡戦略は交換可能

a a

a a i

i

j j

j i j i

 





 





*

* 0

0

0 0 0 0

*



純粋戦略と混合戦略

• Example3 ：

2 人非協力零和ゲーム

A＼B s

_B1

s

_B2

s

_B3

s

_A1

-4 2 0

s

_A2

4 3 1

s

_A3

1 -3 2

完全予見は不可能！

決断は下さねばならない！

主体的な賭，

最適な賭の確率

期待効用原理

(8)



純粋戦略と混合戦略

• Example3 ：

2 人非協力零和ゲーム

A ＼ B s

_B1

s

_B2

s

_B3

s

_A1

-4 2 0

s

_A2

4 3 1

s

_A3

1 -3 2

p1

p₂ p₃

q1 q2 q3

1 ) 3 , 2 , 1 ( , 0

3 2 1

    

p p p

i p

_i

1 ) 3 , 2 , 1 ( , 0

3 2

1

  



 q q q

j q

_j

純粋戦略 pure strategy 混合戦略

mixed strategy

s_A1 -4 2 0

s_A2 4 3 1

s_A3 1 -3 2



純粋戦略と混合戦略

• Example3 ：

• player Aの期待効用（player A = 期待効用最大化プレイヤー= maximin player）

← player B が戦略s_B1の時の期待効用

• player Bの期待損失（player B = 期待損失最小化プレイヤー= minimax player）

← player A が戦略s_A1の時の期待損失

2 人非協力零和ゲーム

p₁ p2

p₃

q₁ q₂ q₃



 





  

   



3 2 1

3 2 1 1

2 ) (

3 3 2 ) (

4 4 ) (

3 2 1

p p s

E

p p p s E

B B B

p, p, p,



 







     



3 2 1 2

2 1 2

2 3 ) , (

3 4 ) , (

2 4 ) , (

3 2 1

q q q s

E

q q q s

E

q q s

E

A A A

q q q

補足：A, Bが各々混合戦略(p₁,p₂,p₃), (q₁,q₂,q₃)のとき



   

3 2

1 2

3 2

1

1( , ) ( , ) ( , ) ( , )

) , ( ) , ( ) , ( ) , (

3 2

1

3 2

1

p s E p s E p s E E

q s E q s E q s E E

A A

A

B B

B

q q

q q p

p p

p q p

) ( ) ( : )

(p,q E1 p,q E2 p,q

E  



戦略の支配

• Example3 ：

2 人非協力零和ゲーム

A ＼ B s

_B1

s

_B2

s

_B3

s

_A1

-4 2 0

s

_A2

4 3 1

s

_A3

1 -3 2

> > >

A ＼ B s

_B1

s

_B2

s

_B3

s

_A2

4 3 1

s

_A3

1 -3 2

>

A ＼ B s

_B2

s

_B3

s

_A2

3 1

s

_A3

-3 2

支配する dominate 被支配戦略

支配戦略

戦略の支配domination of strategies プレイヤーi の戦略h, k について，

戦略h が戦略k を支配するとは，

任意のに対して，

が成立すること．

i

S

s

_



_

) , ( ) ,

( s h f s k

f

_i __i



_i __i

被支配戦略除去の原理

「支配される戦略は用いない」

•＝だと「同等」

•≧かつ≠

だと「弱支配」

補足）通常は，被弱支配戦略は除去しない→共有地の悲劇

補足：被支配戦略除去の原理による均衡点が存在

→ ゲームは支配可解dominance solvable



最適混合戦略

• Example3 ：

•

player A = 期待効用最大化プレイヤー = maximin player

← player B

が戦略 s

_B2

の時の期待効用

← player B

が戦略 s

_B3

の時の期待効用

•

player B = 期待損失最小化プレイヤー = minimax player

← player A

が戦略 s

_A2

の時の期待損失

← player A

が戦略 s

_A3

の時の期待損失

2 人非協力零和ゲーム ^A ^＼ ^{B s}

B2

s

_B3

s

_A2

3 1

s

_A3

-3 2

p₂

p₃

q₂ q₃



      2 ))

1 , 0 (

( ( 1 , 0 )) 6 3 (

2

p

2

E

p E

p, p,

 





 

 5 2

) ) 1 , 0

(( 1 , 0 ) ) 2 1 ((

2 2

q E

q ,

p2

E1

1

0 5/7 q2

E1

1 0 1/7 9/7 一致 2

1

v

v 

Aの最適戦略 p*=(0, 5/7, 2/7)

Bの最適戦略 q*=( 0, 1/7, 6/7)

**(p,q)：均衡解**

(9)

0 0.25

0.5

0.75

1 player A

0 0.25

0.5 0.75

1

player B -2

0 2 Exp

0 0.25

0.5 player A 0.75



最適混合戦略

• Example3 ：

2 人非協力零和ゲーム

player B player A

  



 



 

 





 



 





 









   

 



) 1 (

2 3

1 1 3

) 1 ))(

1 ( 2 ( )) 1 ( 3 3

(3 3 ) ( 2 )

(( ) ( )

) (

2 2 2 2

2

2 2 2 2 2 2

3 3 2 2 3 2

3

2 3

2

q p, p,

p, q p,

q E p q

p

q p p q p p

q s E q s E

E B B

0 0.25 0.5 0.75 1

player A

0.250.50 0.751 player B

-2 0 2

Exp

0.250.750.501 player A

0 0.25 0.5 0.75 1

player B

-2 0 2

Exp

2 人非協力零和ゲーム

^A＼B ^s^B2 ^s^B3

s_A2 3 1

s_A3 -3 2

p2

p3

q₂ q₃

0 0.25

0.5 0.75

1 playerA

0 0.25

0.5 0.75

1

playerB -2

0 2 Exp

0 0.25

0.5 0.75 playerA

player A maximin player

player B minimax player

5/7

1/7



最適混合戦略

• Example3 ：



混合戦略の意味

• p,q の確率のくじをつくって，引いていずれかに決する方法が，なぜ合理的な決定方法なのか？

2 人非協力零和ゲーム

^A＼B ^s^B2 ^s^B3

s_A2 3 1

s_A3 -3 2

p2

p₃

q₂ q₃

Aの最適戦略p*=(0, 5/7,2/7) Bの最適戦略q*=( 0, 1/7,6/7)

• player A は S

_A2

なら 3 ， S

_A3

なら 2 が望ましいが，

の確率で望ましくない結果になる．

49

*

32

2

* 3

*

2

q  p q 

p

しまった！

• このような状況も全て考慮に入れた上で，最適戦略が決定された！

しかし，これは事後的

演習２：



プレイヤー A の利得表が以下の表で与えられるゲームを考える．

プレイヤー A ， B がそれぞれ期待効用原理に基づいて戦略決定をすると，ゲームの解はどうなるか？

A＼B s

_B1

s

_B2

s

_A1

4 -2 s

_A2

-3 3

（１）

A ＼ B s

_B1

s

_B2

s

_B3

s

_B4

s

_A1

3 1 3 4

s

_A2

4 4 2 3

s

_A3

2 3 1 2

（２） A＼B s

_B1

s

_B2

s

_A1

3 1

s

_A2

-1 5 A ＼ B s

_B1

s

_B2

s

_B3

s

_A1

3 2 4

s

_A2

-1 3 0

s

_A3

2 1 -2

（３）（４）

(10)



ミニマックス定理

• プレイヤー A, B の純粋戦略

• プレイヤー A の利得行列（ B の損失行列）

2 人非協力零和ゲーム

a a a

a a a a

mn m m

n n

ij

























2 1

2 22 21

1 12 11

] [ A

} , , 1

| { }, , , 1

|

{ s i m S s j n

S

_A



_A_i

 

_B



_B_j

 

• プレイヤー A, B の混合戦略 )

, , ( p

₁

 p

_m

 p



     , 0 ,

, 1

1 1

m m

p p

 



     0 ,

, 1

1 1

n n

q q

  , ) , ( q

₁

 q

_n

 q

利得関数



 



^m

i n

j j i ij

p q a E

1 1

) ,

( p q p

^T

Aq

) 0 , , 1 , , 0

(  

i

 s

A

) 0 , , 1 , , 0

(  

j

 s

B



ミニマックス定理

• プレイヤー A の保証水準

• プレイヤー B の保証水準

2 人非協力零和ゲーム

) , ( min p q

q

E

) , (

max p q

p

E

) , ( min

1

max p q

q p

E v 

) , ( max

2

min p q

p

q

E

v 

p を操作して期待利得最大

q を操作して期待損失最小

) , ( max min )

, ( min

max p q p q

q p

p q

E  E

• Proposition2



ミニマックス定理

• Theorem3

また，これを成立させる戦略の組（p, q）を均衡点といい，

均衡点における利得 v(A) をゲームの値という．

2 人非協力零和ゲーム

) , ( max min )

, ( min

max p q p q

p q q

p

E  E

J. von Neumann, 1928



 



^m

i n

j

j i ij

T

a p q

v

1 1

*

* : )

( A p Aq

• Theorem4

戦略の組（p, q）が均衡点であるための必要十分条件は，

（p, q）が関数 E(p, q) の鞍点であること．即ち，

が成立すること．

)

*, (

*)

*, (

*) , ( ,

, q p q p q p q

p E  E  E



均衡点における戦略が最適戦略

Aがp*の時，Bはq*にするのが損失最小

Bがq*の時，Aはp*にするのが利得最大



ミニマックス定理

• Theorem5

v(A) がゲームの値，（ p, q ）が均衡点であるための必要十分条件は

が成立すること．

2 人非協力零和ゲーム

)

*, (

*)

*, (

*) , ( ,

, j E s

Ai

E E s

Bj

i q  p q  p



*)

*, (

, , ,

1

ⁿ

1 j

*

E p q

q a m

i 

_ij _j



 















^m

1 i

*)

*

*, ( , , ,

1 n E a

_ij

p

_i

j  p q

(11)



ミニマックス定理

• Example4

2 人非協力零和ゲーム

A ＼ B s

_B1

s

_B2

s

_B3

s

_B4

s

_B5

s

_A1

-2 -1 2 3 3

s

_A2

5 2 4 -1 0

s

_A3

4 ^< 1 ^< 3 ^< -2 ^< -1 ^<

<

≦

p

₁ ≦

p

₂

q

₃

q

₂

q

₄

q

₅

q

₁

1

1 2 1

3 ) , (

1 4 3

) , (

4 2 4 2 ) , (

2 3 2 )

, (

5 7 5 2 ) , (

5 4 3 2 1

p s E

p p p s

E

p p p s

E

p p p s

E

p p p s

E

B B B B B

   

    

     



p p p p p

p₁ E1

1 0

p2

0 1

4/7

) 0 7 , , 3 7 ( 4

*  p



ミニマックス定理

• Example5 ^：一般の 2 × 2 ゲーム

2 人非協力零和ゲーム

A ＼ B s

_B1

s

_B2

s

_A1

^a

11

a

₁₂

s

_A2

a

₂₁

a

₂₂

p

₁

p

₂

q

₂

q

₁

鞍点が存在すればそれが均衡点．

なければ，混合戦略を考えるが，

このとき，必ずE(p,s_B1)とE(p,s_B2)及びE(s_A1,q)とE(s_A2,q)は交点を持つ．

均衡点



 















 

12 22 21 11

12 11 12 22 21 11

21 22

* 2

*

1, ) ,

( a a a a

a a a a a a

a p a

p



 















 

21 22 12 11

21 11 21 22 12 11

12

* 22 2

*

1, ) ,

( a a a a

a a a a a a

a q a

q



  



  

2 22 1 21

2 12 1 11

2 22 1 12

2 21 1 11

) (

) , (

2 1

q a q a s E

p a p a s E

A A

B B

q q p p

演習３：



プレイヤー A の利得表が以下の表で与えられるゲームを考える．

プレイヤー A ， B がそれぞれ期待効用原理に基づいて戦略決定をすると，ゲームの解はどうなるか？

A ＼ B s

_B1

s

_B2

s

_A1

4 -2 s

_A2

-3 3

（１）（２）

A ＼ B s

_B1

s

_B2

s

_A1

3 1

s

_A2

-1 5



2 人零和ゲームと線形計画法

• プレイヤー A の利得行列と混合戦略 p

2 人非協力零和ゲーム

0 , ,

1 . . . max

1 1 1 1

2 1

12

1 1

11

 



  







  



m m

m mn n

m m

p p

u p a p

a

u p a p

a

u p a p

a t s

u

 

   

a a

a

a a a

p p p

mn m

m

n n

m

























2 1

2 22 21

1 12 11 2 1













   



m mn n

n B

m m B

p a p a p a s E

n 

 

2 2 1 1

2 2

22 1 12

1 2

21 1 11

) , (

2 1

p p p

まとめると…

 ( , ), ( , ), , ( , ) 

min

max

₁ ₂

Bn B

B

E s E s

s

E p p p

p



(12)



2 人零和ゲームと線形計画法

• プレイヤー B の損失行列（ A の利得行列）と混合戦略 q

2 人非協力零和ゲーム

a a

a

a a

a

a a

a

q q

q

mn m

m

n n n m

























2 1

2 22 21

1 12 11 1













   



n mn m

m A

n n A

q a q a q a s E

m 

 

2 2 1 1

2 2 22 1 21

1 2 12 1 11

) , (

2 1

q q q

まとめると…



( , ), ( , ), , ( , )



max

min ₁ q ₂ q q

q EsA E sA  EsA^m

0 , ,

1 . . . min

1 1 1 1

2 1

21

1 1

11

 



  







  



n n

n mn m

n n

q q

w q a q

a

w q a q

a

w q a q

a t s

w

  

  



2 人零和ゲームと線形計画法

2 人非協力零和ゲーム

Theorem6

（Ｐ），（Ｄ）の最適解が（p, u），（q*,

w*）のとき，（p*, q*）がゲームの

均衡点であり，v:= u= wがゲームの値である

プレイヤー

A

の最適化問題

（ LP の主問題：

P

）

プレイヤー

B

の最適化問題

（ LP の双対問題：

D

）

主・双対

0 , ,

1 . . . max

1 1 1 1

2 1

12

1 1

11

 



  







  



m m

m mn n

m m

p p

u p a p

a

u p a p

a

u p a p

a t s

u

 

   

0 , ,

1 . . . min

1 1 1 1

2 1

21

1 1

11

 



  







  



n n

n mn m

n n

q q

w q a q

a

w q a q

a

w q a q

a t s

w

  

  

注）（P）（D）ともに自明解（p=(1,0,…,0), q=(1,0,…,0)）があるので実行可能．

→双対定理より，最適解が存在し，最適値は一致する



2 人零和ゲームと線形計画法

• Example6 ：じゃんけん

2 人非協力零和ゲーム

A ＼ B

0 2 -7

-2 0 4

7 -4 0

min max -7 -2 -2 -4

max 7 2 4

min 2

j ij

i

a

v max min 2 

₁





i ij

j

a

v min max 2 

₂



マキシミン戦略

ミニマックス戦略

 両プレイヤーとも，支配戦略は存在しない．

 純粋戦略ではミニマックス均衡点は存在しない．



2 人零和ゲームと線形計画法

• Example6 ：じゃんけん

2 人非協力零和ゲーム

^A＼B

0 2 -7

-2 0 4

7 -4 0

0 , ,

1 7 4 2 4 . . . 2 7 max

3 2 1

2 1

3 1

3 2

 



 



      p p p

p p p

u p

p

u p p

u p p t

s u

0 , ,

1 7 4 2 4 . . . 2 7 min

3 2 1

2 1

3 1

3 2

 



 

  

  

q q q

w q

q

w q q

w q q t

s w

自己双対線形計画問題 self-dual LP

(p

₁

*, p

₂

*, p

₃

)=(0.538462, 0.153846, 0.307692), u=0 (q

₁

*, q

₂

*, q

₃

)=(0.538462, 0.153846, 0.307692), w=0

p

₁

p

₂

p

₃

q

₁

q

₂

q

₃

(13)

演習４：



LP による均衡解の求解

• ２人のプレイヤー A, B は，プレイヤー A の利得行列（ B の損失行列 ) が以下で与えられるゲームをする．各プレイヤーの問題を LP で表し，均衡解とゲームの値を求めよ．

A ＼ B s

_B1

s

_B2

s

_B3

s

_B4

s

_B5

s

_A1

1 5 -2 -4 3

s

_A2

4 -1 3 2 -7

s

_A3

-4 3 6 -2 2

s

_A4

1 6 -4 3 -3

s

_A5

-3 -6 4 5 1

参考文献



S.J. Brams

&

A.D. Taylor, ``Fair Division’’, Cambridge Univ. Press (1996)



鈴木光男「ゲーム理論入門」共立出版（ 1981,2003

^{（新装版）}

）



鈴木光男「新ゲーム理論」勁草書房（ 1994 ）



岡田章「ゲーム理論」有斐閣（ 1996 ）



渡辺隆裕「ゲーム理論入門」日本経済新聞社（ 2008 ）



今野浩「線形計画法」日科技連（ 1987 ）



中山幹夫

・武藤滋夫・舟木由喜彦

「ゲーム理論で解く」

有斐閣（2000）



武藤滋夫「ゲーム理論入門」日本経済新聞社（ 2001 ）



逢沢明「ゲーム理論トレーニング」かんき出版（ 2003 ）



今井春雄・岡田章

編著

「ゲーム理論の応用」勁草書房（ 2005 ）



R. アクセルロッド「つきあい方の科学」ミネルヴァ書房（ 1998 ）

意思決定科学：ゲーム理論１