1
11.進化ゲーム
0.ゲームの理論の分類
・これまで授業で取り扱ってきたゲームは、⾮協⼒ゲームと呼ばれるものである。これはプ レイヤー同士が独立して意思決定する状況を表すゲームであり、ふつう「ゲーム理論」 といえば、非協力ゲームを表す。 ・これに対して、プレイヤー同士が協力するという前提のもとに提携形成のパタンや利得 配分の在り方を分析するゲームを協⼒ゲームという。もっとも、社会現象への応用可能性 も大きいはずなのに、なぜかそれほど流行っていない(ので、授業でも省略)。 ・もう 1 つのゲーム理論に進化ゲームがある。これについて取り上げて解説する。1.進化ゲームの基礎
・進化ゲームは、多人数の社会においてどのような戦略が優勢なのかという社会全体での 分布を対象とする。つまり、個々のプレイヤーがどのような戦略をとるのかではなく、 ある戦略をとるプレイヤーの割合とその時間的変化に焦点を合わせている。 ➢時間が経過するにつれて、社会状態がどのように変化するのかを分析するのがポイ ント。 ・これは生物進化のプロセスになじみやすい発想である。生物進化の基本的な考え方は、 多数の個体がランダムに相互作用する中で、適応度の高い個体が生き残り、適応度の低 い個体は絶滅するというものである(自然淘汰、自然選択)。時間の変化とともに個体の 分布は変わっていくが、どのような特性をもった個体が長続きするのか(定常状態)が 重要な関心である。 ・しかし、遺伝には突然変異が生じる。そして、突然変異した個体が集団の中に増殖して いくこともある。突然変異が生じても元の定常状態が維持されるとき、進化的に安定とい う。生物学では、進化的に安定な定常状態が成立する条件を分析する。 ・これをゲーム理論的状況に置き換えて考えよう。社会の中に様々な戦略をとる人々がい たとしても、利得が低い(適応度が低い)戦略はやがて用いられなくなる。そして、利 得の高い戦略が定常状態として出現する。さらに、新たな戦略が登場することもある(突 然変異)。進化ゲームでは、どのような戦略が生き残って社会の中で定常状態となるのか、 また、新たな突然変異戦略が普及するのかを探究していくことになる。 ・進化ゲームでは、進化論になぞらえて、ゲームの「プレイヤー」ではなく、「エージェン ト」または「個体」と呼ぶ。2 ・進化ゲームでは、非協力ゲームのように、プレイヤーの選択から得られる期待利得を予 想して意思決定するわけではない。戦略は自動的に決まっており、過去にとった行動の 利得によって変更することもある(たとえば、前回 A という行動をとったら利得が低か ったから B という戦略に変更する、など)。これを後ろ向き合理性という。
2.進化のダイナミックス
例 1)技術スタンダードの選択問題 ・パソコンの OS(Windows と Macintosh)、次世代 DVD(ブルーレイと HDVD)など、技 術の標準規格(デファクト・スタンダード)をめぐって競争が行われている。人々は標 準規格となった技術を使うほうがいろいろと便利である。それでは、どれが標準規格に なるのだろうか。 ・パソコンの OS を例に考える。下記の利得のように、みなが Windows で一致すれば 2 の 利得があり、Macintosh で一致すれば 4 の利得があるものとする。つまり、ここでは Mac のほうが性能がよいものと考える。互いの OS が異なると、ファイルの交換などが面倒な ので利得を 0 とする。Win Mac
Win
2,2
0,0
Mac
0,0
4,4
・これは 2 人ゲームではなく、C 行動または D 行動をとるエージェントが無数いると考え る。Win を使っているエージェントの割合を x、Mac を使っている割合を 1-x とする。Win ユーザーの利得は 2x+0(1-x)、Mac ユーザーの利得は 0x+4(1-x)である。x≥2/3 のとき、 Win ユーザーのほうが利得が大きい。一方、x<2/3 のとき、Mac ユーザーのほうが利得が 大きい。 ➢エージェントの割合は時間が経過するにつれ、どのように変わるのだろうか。利得 の大きい戦略が生き残るとしたら、x≥2/3 のとき Win、x<2/3 のとき Mac となるはず である。 ・Win をとるエージェントの変化率を次の微分方程式で表す。 ୢ୶ ୢ୲=(Win を選択したときの期待利得-社会全体の期待利得)×Win を選択したエージェントの割合 ={2x-(2x×x+4(1-x)×(1-x))}×x =(-6x2 +10x-4)x3
・この式が正であれば Win が増加し、負であれば Win が減少(Mac が増加)する。0 であ れば Win の割合は変化しない。 ➢たとえば、Win ユーザーが 50%ならば dx/dt=-0.25 なので減少する。Win ユーザーが 70%ならば dx/dt=5.64 なので増加する。 ➢戦略の増減が起きない(つまり、dx/dt=0)ときの x の値(極値)を求めると、x=2/3,1,0 である。 ➢つまり、x の増減は下記のようになる。 x の値 0 0<x<2/3 x=2/3 x>2/3 x=1 dx/dt の符号 0 - 0 + 0 x の増減 なし 減少 なし 増加 なし ・ここから、初期の Win ユーザーが 2/3 より少なければ減少を続け、やがて Win ユーザー がいなくなる(全員が Mac ユーザーになる)時点で減少が終わる。これに対して、初期 の Win ユーザーがちょうど 2/3 であれば、ユーザー数に変化はない。Win ユーザーが 2/3 より多ければ増加し続け、やがて全員が Win ユーザーとなる。 ➢進化の定常状態が戦略の初期分布によって異なる。このように、初期条件とその後 の経過によって現在の社会状態を経路依存性という。 ・Win ユーザーがいない(x=0)という状態から、わずかな割合のユーザーが現れたとして も、これらのユーザーはやがて戦略を変更するので、また x=0 に戻る。x=1 についても同 様である。 ・しかし、x=2/3 という状態から Win ユーザーがわずかでも増えれば、Win ユーザーは増加 してやがて x=1 となる。また、x=2/3 という状態から Win ユーザーがわずかでも減れば、 Win ユーザーは減少してやがて x=0 となる。 ➢x=0,1 はわずかな突然変異が生じても元に戻るので進化的に安定であるが、x=2/3 は わずかな突然変異で社会状態が大きく変化すので進化的に安定ではない。 例2)異文化交流 ・日本人とアメリカ人が共同作業するとします。お互いの文化や慣習に違いがありますが、 一緒に働くうえでは共通したやり方を用いたほうが効率的です。相手に合わせるのは大 変なので、それぞれ自分の文化と同じやり方であるほうが利得が大きいものとします。 利得行列は下記の通りです。
アメリカ人
日本文化
米文化
日本人
日本文化
3,1
0,0
米文化
0,0
1,3
4 このゲームでは、日本人とアメリカ人という 2 種類のプレイヤーが存在する。この場合、 それぞれの集団があると考え、その中から 1 人がランダムに選ばれると考える。今、日本 人で、アメリカ人に会っても日本文化を通そうとする人の割合を x、アメリカ文化に合わせ ようとする人の割合を 1-x とする。同様に、アメリカ人で、日本人に会ってもアメリカ文化 を通そうとする人の割合を y、日本文化に合わせようとする人の割合を 1-y とする。 ➢時間の経過とともにそれぞれの分布はどのように変わり、定常状態に到達するのだろ うか。 ➢このように異なる集団間での相互作用によって、それぞれの集団の戦略が進化してい くことを共進化という。 ・日本人で日本文化を通そうとする人の割合の変化率は、 ୢ୶ ୢ୲={3y-(3yx+(1-y)(1-x)}×x =(4y-1) (1-x) x 割合が変わらない(dx/dt=0)とき、x=0,1 y=1/4。日本人の戦略分布はアメリカ人の戦略分 布によっても決まる。 0≤y<1/4 のとき、dx/dt<0 1/4≤y<1 のとき、dx/dt ≥0 ・アメリカ人で日本文化に合わせようとする人の割合の変化率は、 ୢ୷ ୢ୲={x-(xy-(1-x)(1-y)}×x =(4x-3) (1-y) y 割合が変わらない(dy/dt=0)とき、x=3/4 y=0,1。アメリカ人の戦略分布は日本人の戦略分 布によっても決まる。 0≤x<3/4 のとき、dy/dt<0 3/4≤x<1 のとき、dy/dt ≥0 1 1 0 3/4 1/4 x y ・戦略の分布(0,0)と(1,1)はわず かな突然変異が起きても元 に戻るので進化的に安定。 ・(3/4, 1/4)はわずかな突然変 異で元にもどる場合もある が、大きく変化する場合もあ る。したがって、進化的に安 定ではない。
5