第 4 章 ゲーム理論入門 172
4.2 静学的なゲームとナッシュ均衡
4.2.3 混合戦略
企 の 製品X 製品Y 業 戦 製品X 5, 5 8, 2 A 略 製品Y 8, 2 5, 5 表4.5 ゲーム3–類似品のゲーム
4.2 静学的なゲームとナッシュ均衡 179 呼ぶ。
上のゲーム3であれば,企業Aが確率1/3で製品Xを選び,確率2/3で製品Yを選ぶと いうような戦略を考えることになる。サイコロをころがして1から4までの目が出れば 製品X,5または6の目が出れば製品Yというように選べばそのような確率になる。この ような混合戦略に対してこれまで考えてきたように行動をはっきり一つに決めて選ぶよう な戦略を純粋戦略(pure strategy)と呼ぶ。混合戦略は純粋戦略を確率的に組み合わせた ものであるが,純粋戦略も混合戦略の一種(Xを選ぶ確率が1あるいは0の)と見ること ができる。
自分あるいは相手が混合戦略を選んでいる場合は,自分がある戦略(純粋戦略でも)を 選んだときに得られる利得は確実なものではなく確率的なものになる。
混合戦略を考えたときでも純粋戦略の場合と同じように,最適反応およびナッシュ均衡 が定義される。すなわち,それぞれのプレイヤーが相手の戦略に対して自分にとって最も 有利な戦略(最適反応)を選んでいるときの戦略の組合せがナッシュ均衡である。表4.5 のゲームで混合戦略によるナッシュ均衡を考えてみよう。企業Aが確率pで製品Xを,
確率1 pで製品Yを選び,企業Bが確率qで製品Xを,確率1 qで製品Yを選んだ 場合に企業Aが獲得する利潤の期待値(平均値)をA,企業Bが獲得する利潤の期待値 をBとすると*5
AD5pqC8.1 p/qC8p.1 q/C5.1 p/.1 q/
D5C.3 6q/pC3q (4.1)
および
B D5pqC2.1 p/qC2p.1 q/C5.1 p/.1 q/
D5C.6p 3/q 3p (4.2)
が得られる。企業Aは式 (4.1)が最大となるようにp を決め,企業Bは式(4.2)が最 大となるようにqを決めるのであるが,(4.1)の3 6q がゼロでなければ,p D 1( 3 6q > 0の場合),またはp D0(3 6q < 0の場合)とすることによって企業Aの 利潤が最大となるから純粋戦略になる。純粋戦略では均衡がないことを確認済みなので
*5期待値は以下のように計算する。『サイコロを2個同時に振って両方とも1の目が出れば賞 金1200円,1と2が出れば300円それ以外は賞金なし』というゲームを考えると,1回だけ そのゲームをプレイしたときの賞金の期待値は
1
361200C 1
18300D50
となる。これはサイコロの目が事前の確率通りに出たとして(2個のサイコロともに同じ目 が出る確率はそれぞれの目について 1
36,異なった目が出る確率はそれぞれの組み合わせにつ いて181)このゲームを何度もプレイして得られる平均の賞金に等しい。
D D を得る。一方(4.2)の6p 3がゼロでなければ,q D 1(6p 3 > 0の場合),または qD0(6p 3 < 0の場合)とすることによって企業Bの利潤が最大となり,純粋戦略と なる。混合戦略の均衡を考えるには6p 3D0となっていなければならない。したがっ てpD1=2を得る。以上のことからゲーム3のナッシュ均衡は次のように表現される。
ゲーム3のナッシュ均衡 企業A,企業Bともに確率1/2で製品X,製品Yを選択する という戦略の組合せがナッシュ均衡となる。そのとき企業Aが獲得する利潤(の 期待値)は6.5,企業Bが獲得する利潤(の期待値)は3.5である。
qD1=2,すなわち企業Bが確率1/2で製品X,製品Yを選択するとき式(4.1)の3 6q がゼロであるから,企業Aにとってはどのような確率で製品Xを選んでも得られる利潤 の期待値は同じである。その場合,混合戦略ではなく純粋戦略として製品X(p D1のと き)を選んでも製品Y(pD0のとき)を選んでも得られる利潤の期待値は等しくなって いる。したがってp D 1=2とするのも最適反応である。同様に,p D1=2,すなわち企 業Aが確率1/2で製品X,製品Yを選択するとき,式(4.2)の6p 3がゼロであるから,
企業Bにとってどのような確率で製品Xを選んでも得られる利潤の期待値は同じであり,
qD1=2とするのも最適反応になっている。したがって,pD1=2,qD1=2は互いに最 適反応であるからナッシュ均衡になる。
このように混合戦略が相手のある戦略に対して最適反応になっている場合には,その混 合戦略を構成する各純粋戦略自体も最適反応になっている*6。そうすると確率1/2はそれ を選ぶプレイヤーの合理的な判断によって選ばれたものと考えるよりも,そのプレイヤー の戦略についての相手の予想を示すものと考えた方がよい。つまり企業Bにとっては企 業Aが確率1/2で製品Xを選んでいると予想したときに製品Xと製品Yが同じ利得をも たらす戦略になり,逆に企業Aにとっては企業Bが確率1/2で製品Xを選んでいると予 想したときに製品Xと製品Yが同じ利得をもたらす戦略になる。確率1/2はお互いの戦 略が最適反応になるためにつじつまの合う予想になっている。
先に見たゲーム2も,2つの純粋戦略によるナッシュ均衡の他に次のような混合戦略に よるナッシュ均衡を持つ。
ゲーム2の混合戦略によるナッシュ均衡 企業Aは確率5/7で規格Xを,確率2/7で規 格Yを選び,一方企業Bは確率2/7で規格Xを,確率5/7で規格Yを選ぶという 戦略の組合せがナッシュ均衡である。
*6ここでは戦略の数が2つのゲームを考えているので混合戦略はその2つの戦略をある確率で 選ぶものとなっているが,戦略の数が3つ(あるいはそれ以上)あるゲームにおいては3つ すべてからなる混合戦略の他に3つの内の2つからなる混合戦略も考えることができる。そ のような戦略が最適反応になっている場合には,それを構成する2つの純粋戦略それぞれも 最適反応である。
4.2 静学的なゲームとナッシュ均衡 181 これは以下のようにして示される。
ゲーム3の場合と同様に企業Aが確率pで規格Xを,確率1 pで規格Yを選び,企 業Bが確率qで規格Xを,確率1 qで規格Yを選んだ場合に企業Aが獲得する利潤の 期待値(平均値)をA,企業Bが獲得する利潤の期待値をB とすると
AD8pqC3.1 p/qC4p.1 q/C6.1 p/.1 q/
D6C.7q 2/p 3q (4.3)
および
B D6pqC3.1 p/qC4p.1 q/C8.1 p/.1 q/
D8C.7p 5/q 4p (4.4)
と表される。各企業の最適反応は以下の通りである。
(1). 企業Aの最適反応
(i) 27 < q51のときはpD1が最適 (ii) 05q < 27のときはpD0が最適 (iii) qD 27 のときはpの値は何でもよい (2). 企業Bの最適反応
(i) 57 < p51のときはqD1が最適 (ii) 05p < 57 のときはqD0が最適 (iii) pD 57のときはqの値は何でもよい
以上によってナッシュ均衡は次のように分類される。
(1). pD1,qD1。これは企業AがX,BもXを選ぶ純粋戦略による均衡である。
(2). pD0,qD0。これは企業AがY,BもYを選ぶ純粋戦略による均衡である。
(3). pD 57,qD 27。これはともに(純粋戦略ではない)混合戦略を選ぶ均衡である。
混合戦略によるナッシュ均衡においては企業Aは確率5/7で規格Xを確率2/7で規格Y を選び,一方企業Bは確率2/7で規格Xを確率5/7で規格Yを選ぶ。この場合には,企 業Bにとっては企業Aが確率5/7で規格Xを選んでいると予想したときに規格Xと規 格Yが同じ利得をもたらす戦略になり,逆に企業Aにとっては企業Bが確率2/7で規格 Xを選んでいると予想したときに規格Xと規格Yが同じ利得をもたらす戦略になる。5/7 と2/7がつじつまの合う予想になっている。
ナッシュ(John Nash)はプレイヤーの数や戦略の数が2以上の場合も含めて一般的に次
のような定理を証明した*7。
*7この定理の証明にはブラウワーの不動点定理(またはそれの拡張版である角谷の不動点定理)
が用いられている。詳しくは数理経済学の書物を参照されたい。ブラウワーの不動点定理の 証明については第2章で解説している。
G C P プレイ G 0, 0 1,-1 -1, 1 ヤーA C -1, 1 0, 0 1, -1 の戦略 P 1,-1 -1, 1 0, 0
表4.6 ジャンケンゲーム
ナッシュの定理 混合戦略を考えるとあらゆるゲームに少なくとも一つのナッシュ均衡が 存在する。
このナッシュの業績にちなんでナッシュ均衡と呼ばれている。前章で見たクールノー均 衡,ベルトラン均衡もナッシュ均衡の一種である。
■ジャンケンゲーム ジャンケンのゲームを考えよう。プレイヤーをA,Bとすると,そ れぞれ戦略はグー,チョキ,パーの3つであり,これらをG, C, Pと表す。そのゲームの 利得表は表4.6のように表現される。勝てば利得は1,負ければ 1,あいこの場合は0と する。このゲームに純粋戦略に限定したナッシュ均衡はない。混合戦略を考えよう。プレ イヤーAがG, C, Pをそれぞれ確率pA,qA,1 pA qAで出し,プレイヤーBがG, C, P を確率pB,qB,1 pB qB で出すとすると,プレイヤーAの期待利得は
ADpAŒ0pBCqB .1 pB qB/CqAŒ pBC0qBC.1 pB qB/
C.1 pA qA/ŒpB qBC0.1 pB qB/
DpA.3qB 1/CqA.1 3pB/CpB qB
となる。したがって混合戦略の均衡においては 3qB 1D0 1 3pB D0 が成り立たなければならない。これらから
pB DqB D 1 3 同様にプレイヤーBの期待利得を考えることによって
pADqA D 1 3 が求まる。つまりグー,チョキ,パーをそれぞれ 1
3の確率で出すような戦略の組が混合戦 略を含めたときのナッシュ均衡である。
4.2 静学的なゲームとナッシュ均衡 183