情報力学に基づくコンピュータ・ゲーム「大貧民」に関する研究
森近 泰匡
1、飯田 弘之
1、中川 武夫
1 はじめに フォン・ノイマン( Neumann J. von 1926)により提唱されたゲーム理論は、経済学などへの応用によ り一定の成果を人類にもたらしたことはその議論の余地のないところである。しかしながら、彼の理論 から私たちが得た果実は、その味の良し悪しを提示したにすぎない。これに対する顕著な改良を実現し た新しい理論が著者ら(Iida et al 2012a)により提唱され、すでにその有用性は実証済みである。この理論 は、流体力学におけるいわゆる境界層流れをゲームと観ることによりゲームの開始から終了までの時間 経過を可視化したものである。換言すれば、新しいゲーム理論により、ゲーム結果のみならずその進行 過程を詳細に理解・解釈することができるようになったわけである。ここで、情報力学とは、ゲーム理 論の独立変数として時間が介在するようになったために派生し、定義された用語である。この新しいゲーム・モデル(Iida etal 2012a)は、一例として次のように表現されている。 ξ=ηm, (1) ここで、ξはゲーム結果の確かさ、ηは無次元ゲーム長、そしてm は正の実数パラメータである。式(1) は、その簡潔さにかかわらずパラメータm を変えることにより現存する大部分のゲームを表現する無尽 蔵のポテンシャルを有していることがすでに明らかにされている(Iida et al 2012a, b, c)。さらに、力学 とのアナロジーを用いることにより、情報の速度、加速度、運動量、力、エネルギーいった力学概念を 情報科学にもたらした事実は注目に値しよう(Iida et al 2012b)。 本研究の主な目的は、5 人(人間1人、コンピュータ4人)で争われたコンピュータ・ゲーム「大貧民」 を題材にして、ゲーム情報を分析することである。 ゲームの分析 これまで、著者らは、ゲーム・モデル(1)を2人または2チームで争われるゲームを分析するため に用いてきた。しかしながら、ゲームには3人または3チーム以上で争われることも多い。そのために、 ここでは、5 人(人間1人、コンピュータ4人)で争われたコンピュータ・ゲーム「大貧民」のゲーム結 果にゲーム・モデル(1)を適用する。なお、大貧民のルールの概要は付録1に示した。 付録2に、5 人のプレーヤーごとのゲーム・スコア―が指し手に依存してどのように推移していったか を一覧表としてまとめたものを示した。 次に、付録2のデータを用いて、先ず、無次元化アドバンテージαと無次元化ゲーム長ηとの関係を 求める。続いて、勝者の勝率を 1 北陸先端科学技術大学院大学
p1=0.5+α/2 (1) の関係より、敗者の勝率 p2=0.5--α/2 (2) の関係より、それぞれ求める。さらに、ゲーム結果の確かさξは、次の関係から求められる。 ξ=∣α∣ (0≤η≺1) = 1 (η=1) (3) 以上のデータ分析方法の詳細については、Iida et al(2012)を参照されたい。 分析結果 ここで対象とした大貧民は総勢 5 人によるゲームであるので、このゲームが全部で 10 個の 2 人によっ て争われた小ゲームから成り立っているものと捉えることができる。以下、順次これらの 10 個の小ゲー ムの分析結果を提示する。
1.Human Player vs. Computer Player 1:
Fig.1 に無次元化アドバンテージαと無次元化ゲーム長ηとの関係を示した。ここで、勝者にアドバン テージが存在する場合にαを正、敗者にアドバンテージが存在する場合にはαを負と定義した。この図 より、ゲーム長ηが 0.7 付近までは、Computer Player 1 に
Fig.1 Normalized Advantage α against Normalized Game Length η for Human Player(Winner) vs. Computer Player 1(loser).
わずかではあるがアドバンテージが存在していたことを見て取れる。しかしながら、これ 以降は、Human Player が圧倒的なアドバンテージを維持しつつ、ゲームが終結した。
Fig.2 は勝者である Human Player の勝率 p1と敗者であるComputer Player 1 の勝率 p2との関係を独 立変数としてゲーム長ηを用いて示したものである。このように、データを整理することで、Fig.1 より 鮮明にゲームの推移を表現できる場合がある。 -0.2 0 0.2 0.4 0.6 0.8 0 0.2 0.4 0.6 0.8 1 1.2 N or mali ze d A dv anta ge α
Normalized Game Length η
The Great Poor
Fig.2 Winning Rate p against Normalized Game Length η for Human Player vs. Computer Player 1.
Fig.3 Certainty of Game Outcome ξagainst Normalized Game Length ηfor Human Player vs. Computer Player 1.
Fig.3 にゲーム結果の確かさξとゲーム長ηとの関係を示した。式(3)を見てあきらかなようにゲーム結 果の確かさξは、η=1 の場合を除いて、アドバンテージαの絶対値に等しいので、このゲームがη=0.7 付近まで均衡状態を保ったまま推移したものの、以降は急激にHuman Player 側に勝利が傾き、この状 態を保ったまま終結している。 Fig.4 にゲーム長η≃0.788(指し手数=26)のゲームの状況を例示した。この、指し手によりゲーム結果 の確かさξが零付近から急増して、0.7 程度の値となったわけである。 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 1.2 W in n ing R at e p
Normalized Game Length η
The Great Poor
Human Player(Winner) Computer player 1(Loser)
-0.2 0 0.2 0.4 0.6 0.8 1 1.2 0 0.2 0.4 0.6 0.8 1 1.2 C er ta inty o f G am e O u tc ome ξ
Normalized Game Length η
The Great Poor
Fig. 4 ゲーム長η≃0.788(指し手数=26)のゲームの状況 以下、同様に付録2 のデータを用いて、
2. Human Player vs. Computer Player 2, 3. Human Player vs. Computer Player 3, 4. Human Player vs. Computer Player 4, 5. Computer Player 1 vs. Computer Player 2, 6. Computer Player 1 vs. Computer Player 3, 7. Computer Player 1 vs. Computer Player 4, 8. Computer Player 2 vs. Computer Player 3, 9. Computer Player 2 vs. Computer Player 4, そして、
10. Computer Player 2 vs. Computer Player 4
に関する分析を実施した。これらの分析結果については紙幅の制限により別の論文中で公表する。 考察
ここで取り上げた、大貧民のゲームにおける最終結果は、次のとおりとなった。 1位:Human Player,
3 位:Computer Player 3, 4 位:Computer Player 1, 5 位:Computer Player 4
一方、この5 人によって争われたゲームを 10 個の 2 人のプレーヤーによる小ゲームと観て導かれた結 果を見ても、Human Player:4 勝 0 敗、Computer Player 2:3 勝1敗、Computer Player 3:2 勝 2 敗, Computer Player 1: 1 勝 3 敗, Computer Player 4: 0 勝 4 敗となっており、上で述べた最終結果と両 立していることがわかる。
この結果は、3 人以上のプレーヤーによって争われる複雑なゲームの分析においても、これを 2 人のプ レーヤーによる複数の小ゲームの集合と観て、分析をすれば十分である可能性を示唆しており興味深い。
Fig.5 Computer Player 3 vs. Computer Player 4 のゲーム情報力学モデルによる近似
次にゲーム・モデル(1)を用いて、ゲーム情報力学の議論をする。Fig.5 は Computer Player 3 vs. Computer player 4 のケースにおけるゲーム結果の確かさξとゲーム長ηの関係を表す曲線をモデリン グすることを意図して、この曲線と比較のために式(1)においてパラメータm=2,3,4.5,そして 10 に相当す る 5 本のモデル曲線を描いた。最少二乗法に基づいて検討した結果、モデル曲線ξ=η3がゲーム、 Computer Player 3 vs. Computer player 4 の最も良い近似曲線になっていることが判明した。これより、 情報速度と情報加速度はそれぞれ次のように求められる。 dξ/dη=3η2, (5) d2ξ/dt2=6η. (6) 当然ながら、無次元単位質量 M=1 を考えれば、(5)と(6)は、それぞれ情報運動量と情報力となる。 一方、単位質量当たりの情報運動エネルギーEKは次のようにあらわすことができる。 EK=1/2・(dξ/dη)2=9/2・η4 (7) ここで、(5)を用いた。さらに、情報力学エネルギーが保存されるものと仮定すれば、次の関係が成り立 つはずである。 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 0 0.2 0.4 0.6 0.8 1 1.2 C er ta inty o f G am e O u tc ome ξ
Normalized Game Length η Computer Player 3 vs. Computer Player 4 m=2 m=3 m=4 m=5
EK +Ep=Constant, (8)
ここで、Epは情報位置エネルギーである。(7)を(8)に代入してから、η=1 と置くことにより Constant=4.5 が求められる。よって、情報位置エネルギーは、(7), (8)より次のように表される。
Ep=4.5(1-η4). (9)
情報運動エネルギーEK ,(7)と情報位置エネルギーEp,(9)をゲーム長ηの関数として同じ紙面上に描くと、 Fig.6 のようになる。この図より、対象とするゲーム、Computer Player 3 vs. Computer Player が、ゲ ームの進行に伴って、徐々に情報位置エネルギーEpを情報運動エネルギーEKに変換している状況を良く 理解することができる。
Fig.6 Information Energy against Normalized Game Length η
結論 本研究を通じて明らかになった新たな知見並びに洞察を次のように要約することができる。 3 人、ないしは 3 チーム以上で争われるゲームを分析する、最も確実かつ簡便なアプローチは、これら のゲームを2 人ないし 2 チームで争われる小ゲームに分解することである。このことは、Iida et al(2012) によって、提案されたゲーム情報力学モデルを3 人、ないしは 3 チーム以上で争われるゲームの分析に 直接適用することができることを意味しているので、その応用可能性が一層拡大されることになった。 さらに、3 人、ないしは 3 チーム以上で争われるゲームを 2 人ないし 2 チームで争われる小ゲームに 分解して分析することにより、ゲームの進行状況をおり詳細に、より深く考察できる利点があることが 明らかとなった。したがって、この分析手法は、ゲームの戦略、戦術を打ち立てる上で貴重な情報を、 プレーヤー、監督などにもたらすことが期待される。 ゲーム情報の力学的挙動に関して、情報力学モデルを用いて考察することにより、ゲームの実相によ り厳しく迫り得る可能性があることが示唆された。 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0 0.2 0.4 0.6 0.8 1 1.2 II n fo rm at io n E n erg y
Normalized Game Length η
参考文献
Neumann, J. von(1926) Zur Theorie der Gesellschaftsspiele. Gӧttinger Math. Ges. 7. Ⅻ 1926. Iida, H., Nakagawa, T., Spoerter, K.(2012a) Game information dynamic models based on fluid mechanics. Entertainment Computing, 3, 89-99
Iida, H., Nakagawa, T., Horikawa, A., Sone, S., Muangkasem, A., Ishitobi, T., (2012b) On a construction procedure of Pyramids. AlaSim International 2012, 45-51
Iida, H., Nakagawa, T., Spoerer, K., Sone, S.(2012c) Three elemental game progress pattern. IScIDE 2011, LNCS, 7202, 571-81 付録1:大貧民のルール概略 トランプはジョーカーを含まない52枚を使用する。これを参加者に均等に配る。順番に手札からカ ードを出していく。この際、前のカードより強いカードをださなくてはいけない。カードを出せない、 または出したくないときにはパスをする。 カードは2 が一番強く、以下 A, K., Q, J, 10,…..と続き、3 が一番弱い。スペードやハートなどのマー クはカードの強さに全く関係しない。 自分から始める時に、同じ数なら、2 枚組、3 枚組、4 枚組で出すことができる。2 枚組で始まったら 2 枚組でしか出すことができない。他の枚数でも同じ。 このように、どんどんカードを出していき、最後に出した人以外が全てパスしたら、場からカードを 無くし、最後のカードを出した人から新たにカードを出していく。この作業を繰り返して、最初に手札 が全て亡くなった人が大富豪になる。以下、上がった順番に富豪、平民、貧民、大貧民となる。5 人以上 でゲームをする場合には、平民の数がふえる。 位が決まったら。場所を移動して、次のゲームからは大貧民、貧民、平民、富豪、大富豪の順番でゲ ームを開始するわけであるが、開始前にカード交換がある。まず、大貧民は自分が持っている一番強い カード2枚を大富豪に渡す。これに対して、大富豪は自分のいらないカード2枚を大貧民に渡す。同様 にして、富豪と貧民は 1 枚ずつお互いにカード交換する。なお、平民はカード交換をしない。この、ル ールにより、大貧民はなかなか勝負に勝つことができない。 大富豪は1 位にならなかったら、必ず大貧民に落ちる。4 枚組のカードが場に出たら、必ず革命になる。 革命になると、数字の強さが逆転する。つまり、2 が一番弱く、3 が一番強くなる。
付録2:5 人のプレーヤーごとのゲーム・スコア―推移
Move No. Human Comp. 1 Comp. 2 Comp. 3 Comp. 4
1 0 0 0 0 0 2 30 0 0 0 0 3 30 280 0 0 0 4 30 400 0 0 0 5 30 400 0 480 0 6 30 400 0 520 0 7 30 400 0 520 100 8 30 400 0 800 100 9 30 400 0 950 100 10 30 400 0 950 400 11 390 400 0 950 400 12 480 400 0 950 400 13 480 670 0 950 400 14 480 670 330 950 400 15 480 670 340 950 400 16 480 670 340 1090 400 17 590 670 340 1090 400 18 590 800 340 1090 400 19 590 830 340 1090 400 20 590 830 410 1090 400 21 590 830 410 1330 400 22 980 830 410 1330 400 23 1100 830 410 1330 400 24 5140 830 410 1330 400 25 5140 940 410 1330 400 26 5140 940 650 1330 400 27 5140 940 1450 1330 400 28 5140 940 1580 1330 400 29 5140 940 3760 1330 400 30 5140 940 3760 2530 400 31 5140 940 3760 2530 410 32 5140 1140 3760 2530 410 33 5140 1140 3760 2530 -590