• 検索結果がありません。

研究内容 72 囚人のジレンマ問題における最適戦略の考察

N/A
N/A
Protected

Academic year: 2021

シェア "研究内容 72 囚人のジレンマ問題における最適戦略の考察"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

72 囚人のジレンマ問題における最適戦略の考察

情報論理研究室 竹内亮太

1.

囚人のジレンマ問題とは、ゲームの理論における概 念の一つであり、お互い協力する方が協力しないより もよい結果になることがわかっていても、協力しない 者が利益を得る状況ではお互いに協力しなくなるとい うジレンマを扱う問題である。

本研究では囚人のジレンマを応用した競りゲームに 対して、その最適戦略を考察する。

2. 研究内容

競りゲームは囚人のジレンマ問題の一種であり、2 人のプレイヤーが 1~10 までの数を一つ同時に出し、

より小さい数を出した方が出した数と同じ数の得点を 得るゲームである。両者が得る得点の期待値は、両者 が共に10を出した時に最も高くなる。しかし、得点を 得るためには相手より低い数を出す必要があるため、

ミニ・マックス法に従うと最終的には両者が 1 を出す 結果に収束し、両者が得られる得点は最低のものにな ってしまう。本研究では、競りゲームに対する最適な 戦略を得るために、Javaを用いて11の3回勝負の 競りゲームを作成し、各戦略間で対戦させてその有用 性を検証する。本研究では、戦略としてランダムに数 を出す戦略(RND)、小さい数を出す戦略(LOW)、真ん 中の数を出す戦略(MID)、高い数を出す戦略(HI)、相 手の出した数より低い数を出す戦略(-1)を用いる。そ れぞれの戦略を 100回ずつ対戦させ、その勝率と合計 得点を調べる。このとき、勝率が最も高く且つ合計ポ イントも高い戦略が競りゲームにおける最適戦略とい える。

3. 結果・考察

本研究では、5 つの戦略に対し、総当たり戦で 100 回ずつ対戦させ、それぞれの勝率と合計得点を調べた。

1 にその結果を示す。また、各戦略得た相手の戦略 ごとの得点を表2に示す。

表1 5つの戦略の合計得点と勝率

戦略 RND LOW MID HI -1 得点 520 593 626 573 577 勝率 0.41 0.62 0.49 0.32 0.57

1から、戦略LOWが勝率が最も高く、また他の戦 略と比較しても合計得点に大きな差がないため、戦略

LOWが最も効率よく得点を稼ぐ戦略といえる。

一方、表 2 より、各プレイヤーが得る得点は、双方 が戦略LOWを採ったときよりも、双方が戦略HIを採 ったときの方が高いことが示される。すなわち、競り ゲームでは単純に双方が利益を追求するよりも、協力 しあった方が得点が高くなる。

本研究では、各対戦では途中で戦略を変更すること なく、最後まで同一の戦略を用いている。しかし、相 手の出した手から相手の戦略を推定し、それに合わせ て対戦中に戦略を変更することで結果も大きく異なる と考えられる。

2 各戦略間での得点

RND LOW MID HI -1 RND 611 200 561 748 481 LOW 593 334 820 860 357 MID 816 177 677 934 525 HI 752 62 358 1024 669

-1 553 311 597 970 453

4.

本研究では 5 つの戦略に絞ってその中で最適解を見 つけることができた。しかしこの競りゲームは不完全 情報ゲームであるため、不確定な情報や人間的要素が 多く存在する。より多くの戦略に対して実験を行い、

最も最適な戦略を探し出すことが今後の課題となる。

参考文献

1) Morton D.Davis著,桐谷維,森克美 訳:ゲームの理論 入門チェスから核戦争まで,講談社 (1973).

2) 梅原嘉介,小川敬治 著:進化ゲーム理論と遺伝的アル ゴリズム,工学社(2007)

参照

関連したドキュメント

と判示している︒更に︑最後に︑﹁本件が同法の範囲内にないとすれば︑

検討対象は、 RCCV とする。比較する応答結果については、応力に与える影響を概略的 に評価するために適していると考えられる変位とする。

自然言語というのは、生得 な文法 があるということです。 生まれつき に、人 に わっている 力を って乳幼児が獲得できる言語だという え です。 語の それ自 も、 から

都調査において、稲わら等のバイオ燃焼については、検出された元素数が少なか

両者が対立する場合であれ,ローカルな福利の方が犠牲にされ得るし,また