第 6 章 切り替え戦略と戦略適用トポロジー拡大を同時適用したネットワーク互恵
6.3 結果及び考察
図 6-1にAllPD領域の平均協調率を示す.離散戦略,切替戦略とも拡張モデルは従来 モデルに比べて高い協調率を示している.また同じ拡張モデルでも,切替戦略の方が離 散戦略に比べて高い協調率を得ていることが分かる.
図 6-1 AllPD領域の平均協調率
上記の結果について詳細に考察する.図 6-2にAllPD領域の100アンサンブル平均均 衡協調率のDg-Dr相図を示す.まず拡張モデルの従来モデルに対する優位性について,
離散戦略から考察する.
相図の右下すなわちチキン型ジレンマ弱,鹿狩り型ジレンマ強の領域では,従来モデ ルでは裏切り戦略に吸引されているのに対し,拡張モデルでは高いenhance効果を示し ている. この領域の代表例として Dr=0.8,Dg=0.0 における従来モデル,拡張モデルの 100 アンサンブル平均の均衡協調率の時系列データを図 6-3 に,代表エピソードのスナ ップショットを図 6-4に示す.図 6-3の協調率の時系列グラフを見ると,両者ともEND 期間でDエージェントからの侵襲を受け協調率は低下するが,その後のEXP期間で従来 モデルは協調率が大きく上昇することなく平衡状態に達しているのに対し,拡張モデル はほぼ全員協調の吸引相に至っていることがわかる.スナップショットを見ると,従来 モデルでは生き残ったクラスタが安定状態に入っているのに対し,拡張モデルでは各ク ラスタが拡大,結合し大きなクラスタを形成していることが分かる.これらにより,従
80
来モデルでは低い協調率,拡張モデルでは高い協調率が達成されたと考えられる.この クラスタの挙動の違いを演繹的に検討する為,「クラスタが拡大する条件」について調べ ていくことにする.
図 6-2 100アンサンブル平均均衡協調率のDg-Dr相図(AllPD領域)
(a) 離散戦略 従来モデル (b) 離散戦略 拡張モデル (c) 切替戦略 従来モデル (d) 切替戦略 拡張モデル
81
図 6-3 Dr=0.8,Dg=0.0における100アンサンブル平均の均衡協調率の時系列
(破線:離散戦略 従来モデル,実線:離散戦略 拡張モデル)
図 6-4 Dr=0.8,Dg=0.0における代表エピソードのスナップショット
((a)離散戦略 従来モデル(b)離散戦略 拡張モデル)
0 0.2 0.4 0.6 0.8 1
1 10 100
c o o p e ra ti o n f ra c ti o n
time steps
Standard IN & LN, discrete strategy system
Standard IN & large LN,
discrete strategy system
82
議論を簡単にする為,離散戦略時の3×3クラスターについて考えることにする.ま ず,従来モデルのクラスタ拡大条件について見ていく.図 6-5に3×3クラスタの概念図 を示す.クラスタを構成するCエージェントと,クラスタの境界上に存在するDエージ ェントは,自身ならびに隣接するCエージェント,Dエージェントの最大利得によりC1, C2,D1,D2の4つのグループに分類できる.各グループの隣接Cエージェント,Dエー ジェントの最大利得を表 6-1に示す.例えば図 6-5のグループD1に属するDエージェ ントを見ると,隣接するCエージェントは唯1つであり,その利得は 3-5Drである.従 って隣接するCエージェントの最大利得は3-5Drとなる.一方隣接するDエージェント は自身を含めて8つあり,その中で最大利得を取るのは,グループ D2に属する D エー ジェントであり,その利得は2(1+Dg)である.なお図 6-5に示されていない,より外側の Dエージェントの利得は0である.従って隣接するDエージェントの最大利得は2(1+Dg) である.この3×3クラスターが次の時点で拡大するか,衰退するか,あるいは安定する かは,クラスタを構成するCエージェントとクラスタ境界上のDエージェントが次の時 点でどちらの戦略を取るかによって決まる.そして IM のもとでは,それは隣接する C エージェント,Dエージェントの最大利得の大小関係によって決まる.表 6-1にもとづ いて,各グループの最大利得の大小関係について見ていく.最初にグループC1に属する Cエージェントだが,このエージェントに隣接するのはCエージェントのみである.従 って隣接エージェントの利得に関係なく次の時点では必ず戦略値Cを保持する.次にグ ループC2に属するCエージェントについて考える.IMの定義より(隣接Cエージェント の最大利得) > (隣接Dエージェントの最大利得)ならば戦略値Cを保持し,それ以外なら 戦略値Dに変化する.従って,
) 1 ( 3
8 ≥ + D
g 即ち3
≤5
Dg の時,戦略Cを保持する.
3
>5
Dg の時,戦略Dに変化する.
グループD1, D2についても同様に計算すると,
グループD1
2 1 2
5 +
−
< r
g D
D の時,戦略Cに変化する.
2 1 2
5 +
−
≥ r
g D
D の時,戦略Dを保持する.
83 グループD2
3 +2
−
< r
g D
D の時,戦略Cに変化する.
3 +2
−
≥ r
g D
D の時,戦略Dを保持する.
となる.これらに基づき,3×3クラスターの次ステップにおける推移をDg-Dr平面 上に図示した結果が図 6-6である.
図 6-5 3×3クラスター概念図(従来モデル)
表 6-1 各グループの隣接Cエージェント,Dエージェントの最大利得(従来モデル)
84
図 6-6 3×3クラスターの挙動(従来モデル)
続いて,拡張モデルのクラスタ拡大条件について上記同様に吟味する.従来モデルの時 と同様に図 6-7に3×3クラスター概念図,
表 6-2に各グループの隣接Cエージェント,Dエージェントの最大利得を示す.従来モ デル同様,各グループの戦略値の変化条件を以下に求め,図 6-8を得る.従来モデルに 比して,EXPで拡張できる領域が大幅に拡がっていることが証された.
グループC1
85 3
≤5
Dg の時,戦略Cを保持する.
3
>5
Dg の時,戦略Dに変化する.
グループD1
3
≥5
Dg の時,戦略Dを保持する.
3
<5
Dg の時,戦略Cに変化する.
グループD2
2 1 2
5 +
−
< r
g D
D の時,戦略Cに変化する.
2 1 2
5 +
−
≥ r
g D
D の時,戦略Dを保持する.
グループD3
3 +2
−
< r
g D
D の時,戦略Cに変化する.
3 +2
−
≥ r
g D
D の時,戦略Dを保持する.
図 6-7 3×3クラスター概念図(拡張モデル)
86
表 6-2 各グループの隣接Cエージェント,Dエージェントの最大利得(拡張モデル)
図 6-8 3×3クラスターの挙動(拡張モデル)
87
例えば,Dr=0.8,Dg=0.0におけるCクラスターの挙動を図 6-6,図 6-8で確認すると,
従来モデルでは安定状態に,拡張モデルではクラスターは拡大する.これは図 6-4で確 認される実験結果と一致している.
さて上記の演繹より,拡張モデルでは 0≤Dr ≤1,
0 ≤ D
g≤ 1
のAllPD領域において クラスターが拡大するが,これはあくまでENDののちCクラスターが一つでも生き残 ることが出来た場合に均衡が協調相に達することを示唆するに過ぎない.例えば,図 6-2(b)の結果を見るとチキン型ジレンマが強い部分では裏切り戦略に吸引されている.こ れは,チキン型ジレンマが強い領域ではその強さ故,初期状態から次のstepで拡大でき るだけの大きさ,形状を備えたクラスターが形成されなくなり,以降のstepでクラスタ ーが消滅してしまうため,裏切り戦略へ吸引されてしまうと推測される.すなわちEXP を至ることなく,END期間中に全員裏切り層に吸引される.
ところで,図 6-2(b)を見るとDg=0.4~0.5の領域では中程度の協調率を示している ことに気が付く.以下,これについて考察する.図 6-9に離散戦略 拡張モデルにおける
AllPD領域の100試行の均衡到達後における協調率の分散を示す.Dg=0.4~0.5の領域で
高い分散値を示している.これは,高協調率に至る試行と裏切り戦略に吸引される試行 が混在するbi-stable的な特性を示していると言える.つまりこの領域では,エピソード により,初期状態から次のstepで,拡大可能なクラスターが生成される試行とされない 試行が確率的に出現し,拡大可能なクラスタが生成されれば最終的に高協調率に至り,
されなければ裏切り戦略に吸引される.この意味で,このジレンマ境域は,拡大可能な Cクラスターが生成されるか否かの臨界領域であると考えられる.
図 6-9 100試行の均衡到達後における協調率の分散 離散戦略 拡張モデル(AllPD領 域)
88
次に切替戦略における拡張モデルの従来モデルに対する優位性,ならびに離散戦略に 対する優位性について考察する.再び図 6-2(c)(d)のDg - Dr相図に戻ると,チキン型 ジレンマ弱,鹿狩り型ジレンマ強の領域において,拡張モデルが従来モデルに比べて高 い協調率を示している.これは離散戦略の時と同様であるが,特徴的なのは,相図上部 すなわちチキン型ジレンマ強の部分において切り換え戦略かつ拡張モデルでは,ある程 度の協調率を保っていることである.
この領域の代表例として,図 6-10に切替戦略 拡張モデルDr=0.8,Dg=0.7における代 表エピソードの均衡協調率の時系列推移を,またそのスナップショットを図 6-11に示す.
図 6-10の協調率の時系列推移を見ると,END期間においては同条件の離散戦略のよう に初期段階で裏切り戦略の激しい侵襲を受け協調が絶滅してしまうことはない.これは 切替戦略においては切替前のEND期間が連続戦略であるため,裏切り戦略の侵襲が離散 戦略に比べて(戦略差は常に1になるのに比して)相対的に弱いことが原因と考えられ る.EXP期間を見ると,切替後に一旦協調率は上昇するが,高い協調率に達することは なく,0.2程度で摂動を繰り返し平衡状態に達している.これは図 6-11のスナップショ ットを見ると分かるように,複数のクラスタが拡大し境界が近づくと,強ジレンマ故 境 界Dエージェントの利得が高くなり,境界CエージェントがD化しクラスタが縮小分裂 し,その後縮小分裂したクラスタは再び他のクラスタとの境界が近づくまで拡大する,
ということを繰り返しているため協調率が上昇せず平衡状態に達してしまうと推測され る.
図 6-10 Dr=0.8,Dg=0.7における代表エピソードの均衡協調率の時系列
(切替戦略 拡張モデル)
0 0.2 0.4 0.6 0.8 1
1 10 100 1000 10000
c o o p e ra ti o n f ra c ti o n
time steps
END EXP
Continuous
strategy Discrete strategy
89
図 6-11 Dr=0.8,Dg=0.7における代表エピソードのスナップショット
(切替戦略 拡張モデル)
90
ここで切替戦略 拡張モデルについて,チキン型ジレンマを拡張したPD領域で見た結 果を図 6-12に示す.(100アンサンブル平均).さきほど考察した,ある程度の協調率を 得ることができる領域は
D
g≤ 1 . 6
まで続き,D
g≥ 1 . 7
では完全に裏切り戦略に吸引され る.これは前述演繹の結果, ( 1.67)3 5 ≈
g ≥
D になると拡張モデルであってももはやクラ スタは拡大できない状態になるとの言明に一致する.つまり切替戦略かつ拡張モデルに おいては,
①連続戦略から離散戦略への切替により拡大可能なCクラスタが形成され,弱ジレン マゆえ各クラスタはEXP(成長過程)で相互干渉なく結合し得,巨大クラスタを形 成して最終的には高い協調率に至る相
②切替により拡大可能なクラスタが形成されるが各クラスタは拡大過程で相互干渉 により縮小,成長を繰り返し,最終的に中程度の協調率で平衡状態に達する相
③大ジレンマゆえ,切り替えで形成されたCクラスタは拡大できず消滅し,裏切り戦 略に吸引される相
の3相で構成されていると言える.