混合戦略

第 4 章ゲーム理論入門 172

4.2 静学的なゲームとナッシュ均衡

4.2.3 混合戦略

企の製品X 製品Y 業戦製品X 5, 5 8, 2 Ａ略製品Y 8, 2 5, 5 表4.5 ^ゲーム3–^{類似品のゲーム}

4.2 静学的なゲームとナッシュ均衡 179 呼ぶ。

上のゲーム3であれば，企業Aが確率1/3で製品Xを選び，確率2/3で製品Yを選ぶというような戦略を考えることになる。サイコロをころがして1から4までの目が出れば製品X，5または6の目が出れば製品Yというように選べばそのような確率になる。このような混合戦略に対してこれまで考えてきたように行動をはっきり一つに決めて選ぶような戦略を純粋戦略(pure strategy)と呼ぶ。混合戦略は純粋戦略を確率的に組み合わせたものであるが，純粋戦略も混合戦略の一種（Xを選ぶ確率が1あるいは0の）と見ることができる。

自分あるいは相手が混合戦略を選んでいる場合は，自分がある戦略（純粋戦略でも）を選んだときに得られる利得は確実なものではなく確率的なものになる。

混合戦略を考えたときでも純粋戦略の場合と同じように，最適反応およびナッシュ均衡が定義される。すなわち，それぞれのプレイヤーが相手の戦略に対して自分にとって最も有利な戦略（最適反応）を選んでいるときの戦略の組合せがナッシュ均衡である。表4.5 のゲームで混合戦略によるナッシュ均衡を考えてみよう。企業Aが確率p^で製品Xを，

確率1 p^で製品Yを選び，企業Bが確率q^で製品Xを，確率1 q^で製品Yを選んだ場合に企業Aが獲得する利潤の期待値（平均値）をA，企業Bが獲得する利潤の期待値をBとすると^*5

AD5pqC8.1 p/qC8p.1 q/C5.1 p/.1 q/

D5C.3 6q/pC3q (4.1)

および

B D5pqC2.1 p/qC2p.1 q/C5.1 p/.1 q/

D5C.6p 3/q 3p (4.2)

が得られる。企業Aは式 (4.1)が最大となるようにp を決め，企業Bは式(4.2)が最大となるようにqを決めるのであるが，(4.1)の3 6q がゼロでなければ，p D 1（ 3 6q > 0の場合），またはp D0（3 6q < 0の場合）とすることによって企業Aの利潤が最大となるから純粋戦略になる。純粋戦略では均衡がないことを確認済みなので

*5期待値は以下のように計算する。『サイコロを2個同時に振って両方とも1^{の目が出れば賞} 金1200円，1と2が出れば300円それ以外は賞金なし』というゲームを考えると，1回だけそのゲームをプレイしたときの賞金の期待値は

361200C 1

18300D50

となる。これはサイコロの目が事前の確率通りに出たとして（2個のサイコロともに同じ目が出る確率はそれぞれの目について ¹

36，異なった目が出る確率はそれぞれの組み合わせについて₁₈¹）このゲームを何度もプレイして得られる平均の賞金に等しい。

D D を得る。一方(4.2)の6p 3^{がゼロでなければ，}q D 1^（6p 3 > 0^{の場合），または} qD0^（6p 3 < 0の場合）とすることによって企業Bの利潤が最大となり，純粋戦略となる。混合戦略の均衡を考えるには6p 3D0となっていなければならない。したがってpD1=2を得る。以上のことからゲーム3のナッシュ均衡は次のように表現される。

ゲーム3のナッシュ均衡企業A，企業Bともに確率1/2で製品X，製品Yを選択するという戦略の組合せがナッシュ均衡となる。そのとき企業Aが獲得する利潤（の期待値）は6.5，企業Bが獲得する利潤（の期待値）は3.5である。

qD1=2，すなわち企業Bが確率1/2で製品X，製品Yを選択するとき式(4.1)の3 6q がゼロであるから，企業Aにとってはどのような確率で製品Xを選んでも得られる利潤の期待値は同じである。その場合，混合戦略ではなく純粋戦略として製品X（p D1^のとき）を選んでも製品Y（pD0のとき）を選んでも得られる利潤の期待値は等しくなっている。したがってp D 1=2とするのも最適反応である。同様に，p D1=2^{，すなわち企} 業Aが確率1/2で製品X，製品Yを選択するとき，式(4.2)の6p 3^{がゼロであるから，}

企業Bにとってどのような確率で製品Xを選んでも得られる利潤の期待値は同じであり，

qD1=2とするのも最適反応になっている。したがって，pD1=2，qD1=2は互いに最適反応であるからナッシュ均衡になる。

このように混合戦略が相手のある戦略に対して最適反応になっている場合には，その混合戦略を構成する各純粋戦略自体も最適反応になっている^*6。そうすると確率1/2はそれを選ぶプレイヤーの合理的な判断によって選ばれたものと考えるよりも，そのプレイヤーの戦略についての相手の予想を示すものと考えた方がよい。つまり企業Bにとっては企業Aが確率1/2で製品Xを選んでいると予想したときに製品Xと製品Yが同じ利得をもたらす戦略になり，逆に企業Aにとっては企業Bが確率1/2で製品Xを選んでいると予想したときに製品Xと製品Yが同じ利得をもたらす戦略になる。確率1/2はお互いの戦略が最適反応になるためにつじつまの合う予想になっている。

先に見たゲーム2も，2つの純粋戦略によるナッシュ均衡の他に次のような混合戦略によるナッシュ均衡を持つ。

ゲーム2の混合戦略によるナッシュ均衡企業Aは確率5/7で規格Xを，確率2/7で規格Yを選び，一方企業Bは確率2/7で規格Xを，確率5/7で規格Yを選ぶという戦略の組合せがナッシュ均衡である。

*6ここでは戦略の数が2つのゲームを考えているので混合戦略はその2^{つの戦略をある確率で} 選ぶものとなっているが，戦略の数が3つ（あるいはそれ以上）あるゲームにおいては3^つすべてからなる混合戦略の他に3つの内の2つからなる混合戦略も考えることができる。そのような戦略が最適反応になっている場合には，それを構成する2つの純粋戦略それぞれも最適反応である。

4.2 静学的なゲームとナッシュ均衡 181 これは以下のようにして示される。

ゲーム3の場合と同様に企業Aが確率p^で規格Xを，確率1 p^で規格Yを選び，企業Bが確率q^で規格Xを，確率1 q^で規格Yを選んだ場合に企業Aが獲得する利潤の期待値（平均値）をA，企業Bが獲得する利潤の期待値をB とすると

AD8pqC3.1 p/qC4p.1 q/C6.1 p/.1 q/

D6C.7q 2/p 3q (4.3)

および

B D6pqC3.1 p/qC4p.1 q/C8.1 p/.1 q/

D8C.7p 5/q 4p (4.4)

と表される。各企業の最適反応は以下の通りである。

(1). 企業Aの最適反応

(i) ²₇ < q51のときはpD1が最適 (ii) 05q < ²₇のときはpD0が最適 (iii) qD ²7 のときはpの値は何でもよい (2). 企業Bの最適反応

(i) ⁵₇ < p51のときはqD1が最適 (ii) 05p < ⁵₇ のときはqD0が最適 (iii) pD ⁵7のときはq^{の値は何でもよい}

以上によってナッシュ均衡は次のように分類される。

(1). pD1,qD1^{。これは企業}AがX，BもXを選ぶ純粋戦略による均衡である。

(2). pD0,qD0^{。これは企業}AがY，BもYを選ぶ純粋戦略による均衡である。

(3). pD ⁵7,qD ²7。これはともに（純粋戦略ではない）混合戦略を選ぶ均衡である。

混合戦略によるナッシュ均衡においては企業Aは確率5/7で規格Xを確率2/7で規格Y を選び，一方企業Bは確率2/7で規格Xを確率5/7で規格Yを選ぶ。この場合には，企業Bにとっては企業Aが確率5/7で規格Xを選んでいると予想したときに規格Xと規格Yが同じ利得をもたらす戦略になり，逆に企業Aにとっては企業Bが確率2/7で規格 Xを選んでいると予想したときに規格Xと規格Yが同じ利得をもたらす戦略になる。5/7 と2/7がつじつまの合う予想になっている。

ナッシュ(John Nash)はプレイヤーの数や戦略の数が2以上の場合も含めて一般的に次

のような定理を証明した^*7。

*7この定理の証明にはブラウワーの不動点定理（またはそれの拡張版である角谷の不動点定理）

が用いられている。詳しくは数理経済学の書物を参照されたい。ブラウワーの不動点定理の証明については第2章で解説している。

G C P プレイ G 0, 0 1,-1 -1, 1 ヤーＡ C -1, 1 0, 0 1, -1 の戦略 P 1,-1 -1, 1 0, 0

表4.6 ^{ジャンケンゲーム}

ナッシュの定理混合戦略を考えるとあらゆるゲームに少なくとも一つのナッシュ均衡が存在する。

このナッシュの業績にちなんでナッシュ均衡と呼ばれている。前章で見たクールノー均衡，ベルトラン均衡もナッシュ均衡の一種である。

■ジャンケンゲームジャンケンのゲームを考えよう。プレイヤーをA，Bとすると，それぞれ戦略はグー，チョキ，パーの3つであり，これらをG, C, Pと表す。そのゲームの利得表は表4.6のように表現される。勝てば利得は1，負ければ 1^{，あいこの場合は}0とする。このゲームに純粋戦略に限定したナッシュ均衡はない。混合戦略を考えよう。プレイヤーＡがG, C, Pをそれぞれ確率pA,qA,1 pA qAで出し，プレイヤーＢがG, C, P を確率pB,qB,1 pB qB で出すとすると，プレイヤーＡの期待利得は

ADpAŒ0pBCqB .1 pB qB/CqAŒ pBC0qBC.1 pB qB/

C.1 pA qA/ŒpB qBC0.1 pB qB/

DpA.3qB 1/CqA.1 3pB/CpB qB

となる。したがって混合戦略の均衡においては 3qB 1D0 1 3pB D0 が成り立たなければならない。これらから

pB DqB D 1 3 同様にプレイヤーＢの期待利得を考えることによって

pADqA D 1 3 が求まる。つまりグー，チョキ，パーをそれぞれ ¹

3の確率で出すような戦略の組が混合戦略を含めたときのナッシュ均衡である。

4.2 静学的なゲームとナッシュ均衡 183

ドキュメント内 i * III () 23. *1 (ページ 189-194)

第 4 章 ゲーム理論入門 172

4.2 静学的なゲームとナッシュ均衡

4.2.3 混合戦略

第 4 章ゲーム理論入門 172