第 4 章 ゲーム理論入門 172
4.2 静学的なゲームとナッシュ均衡
4.2.2 ナッシュ均衡
ゲーム1の均衡を考える。ゲームの均衡というのは,実際にこのゲームが行われたとき にプレイヤーが選択するであろうと思われる戦略の組み合わせである。ゲームの均衡につ いて最も基本となる考え方は次のナッシュ均衡である。
ナッシュ均衡 各プレイヤーが選んでいる戦略が,それぞれ相手の戦略に対する最適 反応になっている場合,そのような戦略の組み合わせをナッシュ均衡 (Nash
equilibrium)と呼ぶ。ナッシュ均衡においては相手が戦略を変えなければ自分だ
けが一方的に戦略を変えても利得を増やすことはできない(利得が減るとは限ら ない)。
ゲーム1のナッシュ均衡を考えてみよう。このゲームでは企業Aにとっては企業Bがど ちらの戦略を選んでも低価格を選択することが最適になっている。同様に企業Bにとっ ても企業Aがどちらの戦略を選んでも低価格を選択することが最適になっている。した がってこのゲームのナッシュ均衡は企業A,企業Bの戦略がともに低価格となる組合せで あり,そのとき各プレイヤーが得る利得(利潤)は表4.1の右下の枠に示されている(2,2) である。
このゲームでは2つの企業がカルテルを結んでともに高価格をつけるように協力すれば 左上に示されている利潤(5,5)を実現することができる。しかし,拘束力のある協力関係 を結べない非協力ゲームでは相手が高価格をつけると想定すると自分が低価格をつけた方 が利潤が大きくなる(それが最適反応)ので両企業ともに低価格をつけ,結果的に低い利 潤になってしまう。
支配戦略 このゲームでの低価格戦略のように,あるプレイヤーにとって相手がどのよう な戦略を選ぼうとも自分にとって最適な戦略がただ一つに決まっている場合,その 戦略を支配戦略(dominant strategy)と呼ぶ。ここで支配というのは,低価格とい う戦略が高価格という戦略を支配しているという意味であり,どちらかのプレイ ヤーが相手を支配しているということではない。
この例のようなゲームは囚人のジレンマ(prisoner’s dilemma)と呼ばれる。表4.1を 表4.2のように作り変えてみる。この表の利得は表4.1の利得からすべて7を引いた数字 である。期待効用と同様にこのようにしてもゲームの構造は変わらず,最適反応,ナッ シュ均衡も変わらない。「高価格」「低価格」という戦略はそれぞれ「黙秘」「自白」と名前 が変わっている。ある犯罪を共同で犯した2人の容疑者(取調べ段階で留置場などに入っ ている囚人)A,Bがいて別々に取り調べられている。検察官は「自白すれば罪を軽くし てやる」と言う。自分だけが自白すれば無罪放免(利得は0),自分だけが黙秘すると懲役 6年(利得は 6),ともに自白すれば懲役5年,そしてともに黙秘を貫けば証拠不十分で
囚 の 黙秘 自白 人 戦 黙秘 -2, -2 -6, 0 A 略 自白 0, -6 -5, -5
表4.2 囚人のジレンマ
企業Bの戦略 企業 規格X 規格Y Aの 規格X 8, 6 4, 4 戦略 規格Y 3, 3 6, 8 表4.3 ゲーム2–互換性のゲーム
懲役2年になることがわかっているものとする。このゲームでは「自白」が支配戦略であ り,ともに自白することがナッシュ均衡である。相手の自白を心配して自白するのではな く,相手がどうであれ自分にとって自白した方が有利なので自白してしまうのである。
ゲーム1のように両方のプレイヤーに支配戦略があれば互いにその支配戦略を選ぶとい う組合せがナッシュ均衡になるが,支配戦略のあるゲームばかりではない。次の例を考え てみよう。
ゲーム2 企業AとBがある製品の規格を決める問題を考える。規格にXとYの2種類 があり,両方の企業が同じ規格を選ぶと製品の互換性が高くなり消費者にとって便 利になるので市場が大きくなって企業は大きな利潤を得られるが,各企業が異なっ た規格を選ぶと消費者には不便になって市場が小さくなり利潤も少なくなる。また 企業Aは規格Xに,企業Bは規格Yにすぐれた技術を持っていると仮定する。
この状況を表にすると表4.3のようになる。先ほどの例と同じく,表の各桝目の中の数 字は,左側が企業Aの利潤を右側が企業Bの利潤を表している。このゲームについて各 プレイヤーの最適反応を考えると
(1). 企業Aの最適反応
(i) 企業Bが規格Xを選んだ場合!規格Xを選ぶのが最適 Xを選ぶと利潤は8,Yを選ぶと利潤は3。
(ii) 企業Bが規格Yを選んだ場合!規格Yを選ぶのが最適 Xを選ぶと利潤は4,Yを選ぶと利潤は6。
(2). 企業Bの最適反応
(i) 企業Aが規格Xを選んだ場合!規格Xを選ぶのが最適
4.2 静学的なゲームとナッシュ均衡 177 女性の戦略
男性 サッカー 音 楽 の サッカー 5, 3 1, 1 戦略 音 楽 0, 0 3, 5
表4.4 両性の闘い
Xを選ぶと利潤は6,Yを選ぶと利潤は4。
(ii) 企業Aが規格Yを選んだ場合!規格Yを選ぶのが最適 Xを選ぶと利潤は3,Yを選ぶと利潤は8。
すなわち,各企業とも相手と同じ規格を選ぶのが最適反応になっている。各プレイヤーに とって相手の戦略によって自分の最適な戦略が異なっているので支配戦略はないが,ナッ シュ均衡はある。しかもこのゲームの場合ナッシュ均衡は2つある。具体的には次のよう になる。
(1). ナッシュ均衡1–企業A,企業Bともに規格Xを選ぶ。
企業Aが規格Xを選んだ場合の企業Bの最適反応は規格Xであり,企業Bが規 格Xを選んだ場合の企業Aの最適反応が規格Xなので,お互いに最適反応になっ ておりこの戦略の組合せはナッシュ均衡である。
(2). ナッシュ均衡2–企業A,企業Bともに規格Yを選ぶ。
企業Aが規格Yを選んだ場合の企業Bの最適反応は規格Yであり,企業Bが規 格Yを選んだ場合の企業Aの最適反応が規格Yなので,お互いに最適反応になっ ておりこの戦略の組合せはナッシュ均衡である。
この2つの均衡のうち,ともに規格Xを選ぶ均衡の方が企業Aにとって有利であり,と もに規格Yを選ぶ均衡の方が企業Bにとって有利であるが,どちらの方が実現しやすい 均衡であるかはわからない。このようにゲームの均衡は一つとは限らない。
このゲームは両性の闘いと呼ばれるゲームの一例になっている。表4.3を表4.4のよう に作り変える。この表の利得は表4.3の利得からすべて3を引いたものになっている。互 いに連絡を取れない状況におかれた(なぜかは問わない)男女がある日のある時刻にサッ カー(のある特定の試合)を見に行くかある音楽コンサートに行くかを決めなければなら ない。男性はサッカーを,女性は音楽を好むが,何よりも会えなければいけない。利得は それぞれの状況での2人の効用(満足感)を表すものと考えられる。このゲームにはナッ シュ均衡が2つある。1つはともにサッカーを見に行くことであり,もう1つはともに音 楽を聞きに行くことである。
企 の 製品X 製品Y 業 戦 製品X 5, 5 8, 2 A 略 製品Y 8, 2 5, 5 表4.5 ゲーム3–類似品のゲーム