結果及び考察

第 6 章切り替え戦略と戦略適用トポロジー拡大を同時適用したネットワーク互恵

6.3 結果及び考察

図 6-1にAllPD領域の平均協調率を示す．離散戦略，切替戦略とも拡張モデルは従来モデルに比べて高い協調率を示している．また同じ拡張モデルでも，切替戦略の方が離散戦略に比べて高い協調率を得ていることが分かる．

図 6-1 AllPD領域の平均協調率

上記の結果について詳細に考察する．図 6-2にAllPD領域の100アンサンブル平均均衡協調率のDg－D_r相図を示す．まず拡張モデルの従来モデルに対する優位性について，

離散戦略から考察する．

相図の右下すなわちチキン型ジレンマ弱，鹿狩り型ジレンマ強の領域では，従来モデルでは裏切り戦略に吸引されているのに対し，拡張モデルでは高いenhance効果を示している．この領域の代表例として Dr=0.8，D_g=0.0 における従来モデル，拡張モデルの 100 アンサンブル平均の均衡協調率の時系列データを図 6-3 に，代表エピソードのスナップショットを図 6-4に示す．図 6-3の協調率の時系列グラフを見ると，両者ともEND 期間でDエージェントからの侵襲を受け協調率は低下するが，その後のEXP期間で従来モデルは協調率が大きく上昇することなく平衡状態に達しているのに対し，拡張モデルはほぼ全員協調の吸引相に至っていることがわかる．スナップショットを見ると，従来モデルでは生き残ったクラスタが安定状態に入っているのに対し，拡張モデルでは各クラスタが拡大，結合し大きなクラスタを形成していることが分かる．これらにより，従

来モデルでは低い協調率，拡張モデルでは高い協調率が達成されたと考えられる．このクラスタの挙動の違いを演繹的に検討する為，「クラスタが拡大する条件」について調べていくことにする．

図 6-2 100アンサンブル平均均衡協調率のDg－D_r相図（AllPD領域）

(a) 離散戦略従来モデル (b) 離散戦略拡張モデル (c) 切替戦略従来モデル (d) 切替戦略拡張モデル

図 6-3 D_r=0.8，D_g=0.0における100アンサンブル平均の均衡協調率の時系列

（破線：離散戦略従来モデル，実線：離散戦略拡張モデル）

図 6-4 D_r=0.8，D_g=0.0における代表エピソードのスナップショット

（（a）離散戦略従来モデル（b）離散戦略拡張モデル）

0 0.2 0.4 0.6 0.8 1

1 10 100

c o o p e ra ti o n f ra c ti o n

time steps

Standard IN & LN, discrete strategy system

Standard IN & large LN,

discrete strategy system

議論を簡単にする為，離散戦略時の3×3クラスターについて考えることにする．まず，従来モデルのクラスタ拡大条件について見ていく．図 6-5に3×3クラスタの概念図を示す．クラスタを構成するCエージェントと，クラスタの境界上に存在するDエージェントは，自身ならびに隣接するCエージェント，Dエージェントの最大利得によりC1， C2，D1，D₂の４つのグループに分類できる．各グループの隣接Cエージェント，Dエージェントの最大利得を表 6-1に示す．例えば図 6-5のグループD1に属するDエージェントを見ると，隣接するCエージェントは唯１つであり，その利得は 3-5Drである．従って隣接するCエージェントの最大利得は3-5Drとなる．一方隣接するDエージェントは自身を含めて８つあり，その中で最大利得を取るのは，グループ D2に属する D エージェントであり，その利得は2(1+Dg)である．なお図 6-5に示されていない，より外側の Dエージェントの利得は0である．従って隣接するDエージェントの最大利得は2(1+Dg) である．この3×3クラスターが次の時点で拡大するか，衰退するか，あるいは安定するかは，クラスタを構成するCエージェントとクラスタ境界上のDエージェントが次の時点でどちらの戦略を取るかによって決まる．そして IM のもとでは，それは隣接する C エージェント，Dエージェントの最大利得の大小関係によって決まる．表 6-1にもとづいて，各グループの最大利得の大小関係について見ていく．最初にグループC1に属する Cエージェントだが，このエージェントに隣接するのはCエージェントのみである．従って隣接エージェントの利得に関係なく次の時点では必ず戦略値Cを保持する．次にグループC2に属するCエージェントについて考える．IMの定義より(隣接Cエージェントの最大利得) > (隣接Dエージェントの最大利得)ならば戦略値Cを保持し，それ以外なら戦略値Dに変化する．従って，

) 1 ( 3

8 ≥ + D

_g ^即ち

≤5

Dg ^{の時，戦略}Cを保持する．

Dg ^{の時，戦略}Dに変化する．

グループD1， D₂についても同様に計算すると，

グループD1

2 1 2

5 +

−

< r

g D

D ^{の時，戦略}Cに変化する．

2 1 2

5 +

−

≥ r

g D

D ^{の時，戦略}Dを保持する．

83 グループD2

3 +2

−

< r

g D

D ^{の時，戦略}Cに変化する．

3 +2

−

≥ r

g D

D ^{の時，戦略}Dを保持する．

となる．これらに基づき，3×3クラスターの次ステップにおける推移をDg－D_r平面上に図示した結果が図 6-6である．

図 6-5 3×3クラスター概念図（従来モデル）

表 6-1 各グループの隣接Cエージェント，Dエージェントの最大利得（従来モデル）

図 6-6 3×3クラスターの挙動（従来モデル）

続いて，拡張モデルのクラスタ拡大条件について上記同様に吟味する．従来モデルの時と同様に図 6-7に3×3クラスター概念図，

表 6-2に各グループの隣接Cエージェント，Dエージェントの最大利得を示す．従来モデル同様，各グループの戦略値の変化条件を以下に求め，図 6-8を得る．従来モデルに比して，EXPで拡張できる領域が大幅に拡がっていることが証された．

グループC1

85 3

≤5

Dg ^{の時，戦略}Cを保持する．

Dg ^{の時，戦略}Dに変化する．

グループD1

≥5

Dg ^{の時，戦略}Dを保持する．

Dg ^{の時，戦略}Cに変化する．

グループD2

2 1 2

5 +

−

< r

g D

D ^{の時，戦略}Cに変化する．

2 1 2

5 +

−

≥ r

g D

D ^{の時，戦略}Dを保持する．

グループD3

3 +2

−

< r

g D

D ^{の時，戦略}Cに変化する．

3 +2

−

≥ r

g D

D ^{の時，戦略}Dを保持する．

図 6-7 3×3クラスター概念図(拡張モデル)

表 6-2 各グループの隣接Cエージェント，Dエージェントの最大利得（拡張モデル）

図 6-8 3×3クラスターの挙動（拡張モデル）

例えば，Dr=0.8，Dg=0.0におけるCクラスターの挙動を図 6-6，図 6-8で確認すると，

従来モデルでは安定状態に，拡張モデルではクラスターは拡大する．これは図 6-4で確認される実験結果と一致している．

さて上記の演繹より，拡張モデルでは 0≤Dr ≤1，

0 ≤ D

≤ 1

のAllPD領域においてクラスターが拡大するが，これはあくまでENDののちCクラスターが一つでも生き残ることが出来た場合に均衡が協調相に達することを示唆するに過ぎない．例えば，図 6-2

（b）の結果を見るとチキン型ジレンマが強い部分では裏切り戦略に吸引されている．これは，チキン型ジレンマが強い領域ではその強さ故，初期状態から次のstepで拡大できるだけの大きさ，形状を備えたクラスターが形成されなくなり，以降のstepでクラスターが消滅してしまうため，裏切り戦略へ吸引されてしまうと推測される．すなわちEXP を至ることなく，END期間中に全員裏切り層に吸引される．

ところで，図 6-2（b）を見るとDg=0.4～0.5の領域では中程度の協調率を示していることに気が付く．以下，これについて考察する．図 6-9に離散戦略拡張モデルにおける

AllPD領域の100試行の均衡到達後における協調率の分散を示す．D_g=0.4～0.5の領域で

高い分散値を示している．これは，高協調率に至る試行と裏切り戦略に吸引される試行が混在するbi-stable的な特性を示していると言える．つまりこの領域では，エピソードにより，初期状態から次のstepで，拡大可能なクラスターが生成される試行とされない試行が確率的に出現し，拡大可能なクラスタが生成されれば最終的に高協調率に至り，

されなければ裏切り戦略に吸引される．この意味で，このジレンマ境域は，拡大可能な Cクラスターが生成されるか否かの臨界領域であると考えられる．

図 6-9 100試行の均衡到達後における協調率の分散離散戦略拡張モデル（AllPD領域）

次に切替戦略における拡張モデルの従来モデルに対する優位性，ならびに離散戦略に対する優位性について考察する．再び図 6-2（c）（d）のDg - Dr相図に戻ると，チキン型ジレンマ弱，鹿狩り型ジレンマ強の領域において，拡張モデルが従来モデルに比べて高い協調率を示している．これは離散戦略の時と同様であるが，特徴的なのは，相図上部すなわちチキン型ジレンマ強の部分において切り換え戦略かつ拡張モデルでは，ある程度の協調率を保っていることである．

この領域の代表例として，図 6-10に切替戦略拡張モデルDr=0.8，D_g=0.7における代表エピソードの均衡協調率の時系列推移を，またそのスナップショットを図 6-11に示す．

図 6-10の協調率の時系列推移を見ると，END期間においては同条件の離散戦略のように初期段階で裏切り戦略の激しい侵襲を受け協調が絶滅してしまうことはない．これは切替戦略においては切替前のEND期間が連続戦略であるため，裏切り戦略の侵襲が離散戦略に比べて（戦略差は常に1になるのに比して）相対的に弱いことが原因と考えられる．EXP期間を見ると，切替後に一旦協調率は上昇するが，高い協調率に達することはなく，0.2程度で摂動を繰り返し平衡状態に達している．これは図 6-11のスナップショットを見ると分かるように，複数のクラスタが拡大し境界が近づくと，強ジレンマ故境界Dエージェントの利得が高くなり，境界CエージェントがD化しクラスタが縮小分裂し，その後縮小分裂したクラスタは再び他のクラスタとの境界が近づくまで拡大する，

ということを繰り返しているため協調率が上昇せず平衡状態に達してしまうと推測される．

図 6-10 D_r=0.8，D_g=0.7における代表エピソードの均衡協調率の時系列

（切替戦略拡張モデル）

0 0.2 0.4 0.6 0.8 1

1 10 100 1000 10000

c o o p e ra ti o n f ra c ti o n

time steps

END EXP

Continuous

strategy Discrete strategy

図 6-11 D_r=0.8，D_g=0.7における代表エピソードのスナップショット

（切替戦略拡張モデル）

ここで切替戦略拡張モデルについて，チキン型ジレンマを拡張したPD領域で見た結果を図 6-12に示す．（100アンサンブル平均）．さきほど考察した，ある程度の協調率を得ることができる領域は

D

≤ 1 . 6

まで続き，

D

≥ 1 . 7

では完全に裏切り戦略に吸引される．これは前述演繹の結果， ( 1.67)

3 5 ≈

g ≥

D になると拡張モデルであってももはやクラスタは拡大できない状態になるとの言明に一致する．つまり切替戦略かつ拡張モデルにおいては，

①連続戦略から離散戦略への切替により拡大可能なCクラスタが形成され，弱ジレンマゆえ各クラスタはEXP（成長過程）で相互干渉なく結合し得，巨大クラスタを形成して最終的には高い協調率に至る相

②切替により拡大可能なクラスタが形成されるが各クラスタは拡大過程で相互干渉により縮小，成長を繰り返し，最終的に中程度の協調率で平衡状態に達する相

③大ジレンマゆえ，切り替えで形成されたCクラスタは拡大できず消滅し，裏切り戦略に吸引される相

の３相で構成されていると言える．

ドキュメント内第 1 部序論 (ページ 81-95)

第 6 章 切り替え戦略と戦略適用トポロジー拡大を同時適用したネットワーク互恵

6.3 結果及び考察

0 0.2 0.4 0.6 0.8 1

1 10 100

c o o p e ra ti o n f ra c ti o n

time steps

Standard IN & LN, discrete strategy system

Standard IN & large LN,

discrete strategy system

) 1 ( 3

8 ≥ + D

0 ≤ D

≤ 1

0 0.2 0.4 0.6 0.8 1

1 10 100 1000 10000

c o o p e ra ti o n f ra c ti o n

time steps

END EXP

D

≤ 1 . 6

D

≥ 1 . 7

第 6 章切り替え戦略と戦略適用トポロジー拡大を同時適用したネットワーク互恵