p1=.5+α/2 (1) の関係より敗者の勝率 p 2 =.5--α/2 (2) の関係よりそれぞれ求めるさらにゲーム結果の確かさξは次の関係から求められる ξ= α ( η 1) = 1 (η=1) (3) 以上のデータ分析方法の詳細については Iida et al(212) を参照さ

(1)

情報力学に基づくコンピュータ・ゲーム「大貧民」に関する研究

森近泰匡

1

_{、飯田弘之}

1

_{、中川武夫}

1 はじめにフォン・ノイマン( Neumann J. von 1926)により提唱されたゲーム理論は、経済学などへの応用により一定の成果を人類にもたらしたことはその議論の余地のないところである。しかしながら、彼の理論から私たちが得た果実は、その味の良し悪しを提示したにすぎない。これに対する顕著な改良を実現した新しい理論が著者ら(Iida et al 2012a)により提唱され、すでにその有用性は実証済みである。この理論は、流体力学におけるいわゆる境界層流れをゲームと観ることによりゲームの開始から終了までの時間経過を可視化したものである。換言すれば、新しいゲーム理論により、ゲーム結果のみならずその進行過程を詳細に理解・解釈することができるようになったわけである。ここで、情報力学とは、ゲーム理論の独立変数として時間が介在するようになったために派生し、定義された用語である。

この新しいゲーム・モデル（Iida etal 2012a）は、一例として次のように表現されている。 ξ＝ηｍ_{, (1)} ここで、ξはゲーム結果の確かさ、ηは無次元ゲーム長、そしてm は正の実数パラメータである。式(1) は、その簡潔さにかかわらずパラメータm を変えることにより現存する大部分のゲームを表現する無尽蔵のポテンシャルを有していることがすでに明らかにされている(Iida et al 2012a, b, c)。さらに、力学とのアナロジーを用いることにより、情報の速度、加速度、運動量、力、エネルギーいった力学概念を情報科学にもたらした事実は注目に値しよう(Iida et al 2012b)。本研究の主な目的は、5 人（人間１人、コンピュータ４人）で争われたコンピュータ・ゲーム「大貧民」を題材にして、ゲーム情報を分析することである。ゲームの分析これまで、著者らは、ゲーム・モデル（１）を２人または２チームで争われるゲームを分析するために用いてきた。しかしながら、ゲームには３人または３チーム以上で争われることも多い。そのために、ここでは、5 人（人間１人、コンピュータ４人）で争われたコンピュータ・ゲーム「大貧民」のゲーム結果にゲーム・モデル（１）を適用する。なお、大貧民のルールの概要は付録１に示した。付録２に、5 人のプレーヤーごとのゲーム・スコア―が指し手に依存してどのように推移していったかを一覧表としてまとめたものを示した。次に、付録２のデータを用いて、先ず、無次元化アドバンテージαと無次元化ゲーム長ηとの関係を求める。続いて、勝者の勝率を 1 _{北陸先端科学技術大学院大学}

(2)

p1＝0.5+α/2 (1) の関係より、敗者の勝率 p２＝0.5--α/2 (2) の関係より、それぞれ求める。さらに、ゲーム結果の確かさξは、次の関係から求められる。 ξ=∣α∣ （0≤η≺1） = 1 (η=1) (3) 以上のデータ分析方法の詳細については、Iida et al(2012)を参照されたい。分析結果ここで対象とした大貧民は総勢 5 人によるゲームであるので、このゲームが全部で 10 個の 2 人によって争われた小ゲームから成り立っているものと捉えることができる。以下、順次これらの 10 個の小ゲームの分析結果を提示する。

１．Human Player vs. Computer Player 1:

Fig.1 に無次元化アドバンテージαと無次元化ゲーム長ηとの関係を示した。ここで、勝者にアドバンテージが存在する場合にαを正、敗者にアドバンテージが存在する場合にはαを負と定義した。この図より、ゲーム長ηが 0.7 付近までは、Computer Player 1 に

Fig.1 Normalized Advantage α against Normalized Game Length η for Human Player(Winner) vs. Computer Player 1(loser).

わずかではあるがアドバンテージが存在していたことを見て取れる。しかしながら、これ以降は、Human Player が圧倒的なアドバンテージを維持しつつ、ゲームが終結した。

Fig.2 は勝者である Human Player の勝率 p1と敗者であるComputer Player 1 の勝率 p２との関係を独立変数としてゲーム長ηを用いて示したものである。このように、データを整理することで、Fig.1 より鮮明にゲームの推移を表現できる場合がある。 -0.2 0 0.2 0.4 0.6 0.8 0 0.2 0.4 0.6 0.8 1 1.2 N or mali ze d A dv anta ge α

Normalized Game Length η

The Great Poor

(3)

Fig.2 Winning Rate p against Normalized Game Length η for Human Player vs. Computer Player 1.

Fig.3 Certainty of Game Outcome ξagainst Normalized Game Length ηfor Human Player vs. Computer Player 1.

Fig.3 にゲーム結果の確かさξとゲーム長ηとの関係を示した。式(3)を見てあきらかなようにゲーム結果の確かさξは、η=1 の場合を除いて、アドバンテージαの絶対値に等しいので、このゲームがη＝0.7 付近まで均衡状態を保ったまま推移したものの、以降は急激にHuman Player 側に勝利が傾き、この状態を保ったまま終結している。 Fig.4 にゲーム長η≃0.788(指し手数=26)のゲームの状況を例示した。この、指し手によりゲーム結果の確かさξが零付近から急増して、0.7 程度の値となったわけである。 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 1.2 W in n ing R at e p

The Great Poor

Human Player(Winner) Computer player 1(Loser)

-0.2 0 0.2 0.4 0.6 0.8 1 1.2 0 0.2 0.4 0.6 0.8 1 1.2 C er ta inty o f G am e O u tc ome ξ

The Great Poor

(4)

Fig. 4 ゲーム長η≃0.788(指し手数=26)のゲームの状況以下、同様に付録2 のデータを用いて、

2. Human Player vs. Computer Player 2, 3. Human Player vs. Computer Player 3, 4. Human Player vs. Computer Player 4, 5. Computer Player 1 vs. Computer Player 2, 6. Computer Player 1 vs. Computer Player 3, 7. Computer Player 1 vs. Computer Player 4, 8. Computer Player 2 vs. Computer Player 3, 9. Computer Player 2 vs. Computer Player 4, そして、

10. Computer Player 2 vs. Computer Player 4

に関する分析を実施した。これらの分析結果については紙幅の制限により別の論文中で公表する。考察

ここで取り上げた、大貧民のゲームにおける最終結果は、次のとおりとなった。１位：Human Player,

(5)

3 位：Computer Player 3, 4 位：Computer Player 1, 5 位：Computer Player 4

一方、この5 人によって争われたゲームを 10 個の 2 人のプレーヤーによる小ゲームと観て導かれた結果を見ても、Human Player：4 勝 0 敗、Computer Player 2：3 勝１敗、Computer Player 3：2 勝 2 敗, Computer Player 1: 1 勝 3 敗, Computer Player 4: 0 勝 4 敗となっており、上で述べた最終結果と両立していることがわかる。

この結果は、3 人以上のプレーヤーによって争われる複雑なゲームの分析においても、これを 2 人のプレーヤーによる複数の小ゲームの集合と観て、分析をすれば十分である可能性を示唆しており興味深い。

Fig.5 Computer Player 3 vs. Computer Player 4 のゲーム情報力学モデルによる近似

次にゲーム・モデル(1)を用いて、ゲーム情報力学の議論をする。Fig.5 は Computer Player 3 vs. Computer player 4 のケースにおけるゲーム結果の確かさξとゲーム長ηの関係を表す曲線をモデリングすることを意図して、この曲線と比較のために式(1)においてパラメータｍ=2,3,4.5,そして 10 に相当する 5 本のモデル曲線を描いた。最少二乗法に基づいて検討した結果、モデル曲線ξ＝η３_{がゲーム、} Computer Player 3 vs. Computer player 4 の最も良い近似曲線になっていることが判明した。これより、情報速度と情報加速度はそれぞれ次のように求められる。 dξ/dη=3η2_{, (5)} d2_ξ/dt2_{=6η. (6)} 当然ながら、無次元単位質量 M=1 を考えれば、(5)と(6)は、それぞれ情報運動量と情報力となる。一方、単位質量当たりの情報運動エネルギーEKは次のようにあらわすことができる。 EK=１/2・（dξ/dη）2=9/2・η４ (7) ここで、(5)を用いた。さらに、情報力学エネルギーが保存されるものと仮定すれば、次の関係が成り立つはずである。 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 0 0.2 0.4 0.6 0.8 1 1.2 C er ta inty o f G am e O u tc ome ξ

Normalized Game Length η Computer Player 3 vs. Computer Player 4 m=2 m=3 m=4 m=5

(6)

EK ＋Eｐ＝Constant, (8)

ここで、Eｐは情報位置エネルギーである。(7)を(8)に代入してから、η=1 と置くことにより Constant=4.5 が求められる。よって、情報位置エネルギーは、(7), (8)より次のように表される。

Eｐ＝4.5(1-η4). (9)

情報運動エネルギーEK ,(7)と情報位置エネルギーEｐ,(9)をゲーム長ηの関数として同じ紙面上に描くと、 Fig.6 のようになる。この図より、対象とするゲーム、Computer Player 3 vs. Computer Player が、ゲームの進行に伴って、徐々に情報位置エネルギーEｐを情報運動エネルギーEKに変換している状況を良く理解することができる。

Fig.6 Information Energy against Normalized Game Length η

結論本研究を通じて明らかになった新たな知見並びに洞察を次のように要約することができる。 3 人、ないしは 3 チーム以上で争われるゲームを分析する、最も確実かつ簡便なアプローチは、これらのゲームを2 人ないし 2 チームで争われる小ゲームに分解することである。このことは、Iida et al(2012) によって、提案されたゲーム情報力学モデルを3 人、ないしは 3 チーム以上で争われるゲームの分析に直接適用することができることを意味しているので、その応用可能性が一層拡大されることになった。さらに、3 人、ないしは 3 チーム以上で争われるゲームを 2 人ないし 2 チームで争われる小ゲームに分解して分析することにより、ゲームの進行状況をおり詳細に、より深く考察できる利点があることが明らかとなった。したがって、この分析手法は、ゲームの戦略、戦術を打ち立てる上で貴重な情報を、プレーヤー、監督などにもたらすことが期待される。ゲーム情報の力学的挙動に関して、情報力学モデルを用いて考察することにより、ゲームの実相により厳しく迫り得る可能性があることが示唆された。 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0 0.2 0.4 0.6 0.8 1 1.2 II n fo rm at io n E n erg y

(7)

参考文献

Neumann, J. von(1926) Zur Theorie der Gesellschaftsspiele. Gӧttinger Math. Ges. 7. Ⅻ 1926. Iida, H., Nakagawa, T., Spoerter, K.(2012a) Game information dynamic models based on fluid mechanics. Entertainment Computing, 3, 89-99

Iida, H., Nakagawa, T., Horikawa, A., Sone, S., Muangkasem, A., Ishitobi, T., (2012b) On a construction procedure of Pyramids. AlaSim International 2012, 45-51

Iida, H., Nakagawa, T., Spoerer, K., Sone, S.(2012c) Three elemental game progress pattern. IScIDE 2011, LNCS, 7202, 571-81 付録１：大貧民のルール概略トランプはジョーカーを含まない５２枚を使用する。これを参加者に均等に配る。順番に手札からカードを出していく。この際、前のカードより強いカードをださなくてはいけない。カードを出せない、または出したくないときにはパスをする。カードは2 が一番強く、以下 A, K., Q, J, 10,…..と続き、3 が一番弱い。スペードやハートなどのマークはカードの強さに全く関係しない。自分から始める時に、同じ数なら、2 枚組、3 枚組、4 枚組で出すことができる。2 枚組で始まったら 2 枚組でしか出すことができない。他の枚数でも同じ。このように、どんどんカードを出していき、最後に出した人以外が全てパスしたら、場からカードを無くし、最後のカードを出した人から新たにカードを出していく。この作業を繰り返して、最初に手札が全て亡くなった人が大富豪になる。以下、上がった順番に富豪、平民、貧民、大貧民となる。5 人以上でゲームをする場合には、平民の数がふえる。位が決まったら。場所を移動して、次のゲームからは大貧民、貧民、平民、富豪、大富豪の順番でゲームを開始するわけであるが、開始前にカード交換がある。まず、大貧民は自分が持っている一番強いカード２枚を大富豪に渡す。これに対して、大富豪は自分のいらないカード２枚を大貧民に渡す。同様にして、富豪と貧民は 1 枚ずつお互いにカード交換する。なお、平民はカード交換をしない。この、ルールにより、大貧民はなかなか勝負に勝つことができない。大富豪は1 位にならなかったら、必ず大貧民に落ちる。4 枚組のカードが場に出たら、必ず革命になる。革命になると、数字の強さが逆転する。つまり、2 が一番弱く、3 が一番強くなる。

(8)

付録2：5 人のプレーヤーごとのゲーム・スコア―推移

Move No. Human Comp. 1 Comp. 2 Comp. 3 Comp. 4

1 0 0 0 0 0 2 30 0 0 0 0 3 30 280 0 0 0 4 30 400 0 0 0 5 30 400 0 480 0 6 30 400 0 520 0 7 30 400 0 520 100 8 30 400 0 800 100 9 30 400 0 950 100 10 30 400 0 950 400 11 390 400 0 950 400 12 480 400 0 950 400 13 480 670 0 950 400 14 480 670 330 950 400 15 480 670 340 950 400 16 480 670 340 1090 400 17 590 670 340 1090 400 18 590 800 340 1090 400 19 590 830 340 1090 400 20 590 830 410 1090 400 21 590 830 410 1330 400 22 980 830 410 1330 400 23 1100 830 410 1330 400 24 5140 830 410 1330 400 25 5140 940 410 1330 400 26 5140 940 650 1330 400 27 5140 940 1450 1330 400 28 5140 940 1580 1330 400 29 5140 940 3760 1330 400 30 5140 940 3760 2530 400 31 5140 940 3760 2530 410 32 5140 1140 3760 2530 410 33 5140 1140 3760 2530 -590

p1=.5+α/2 (1) の関係より 敗者の勝率 p 2 =.5--α/2 (2) の関係より それぞれ求める さらに ゲーム結果の確かさξは 次の関係から求められる ξ= α ( η 1) = 1 (η=1) (3) 以上のデータ分析方法の詳細については Iida et al(212) を参照さ

情報力学に基づくコンピュータ・ゲーム「大貧民」に関する研究

森近 泰匡

、飯田 弘之

、中川 武夫

The Great Poor

The Great Poor

The Great Poor

p1=.5+α/2 (1) の関係より敗者の勝率 p 2 =.5--α/2 (2) の関係よりそれぞれ求めるさらにゲーム結果の確かさξは次の関係から求められる ξ= α ( η 1) = 1 (η=1) (3) 以上のデータ分析方法の詳細については Iida et al(212) を参照さ

森近泰匡

_{、飯田弘之}

_{、中川武夫}