ガイスターにおける相手駒色推定の有効性の研究

(1)

令和元年度学士学位論文梗概高知工科大学情報学群

ガイスターにおける相手駒色推定の有効性の研究

1200338 栃川純平【ゲーム情報学研究室】

1 はじめに

ガイスターは，相手の駒の色がわからない二人不完全情報ゲームである．ガイスターは

AI

大会が開かれるなど新たな研究対象として注目を集めている．

これまで，ゲーム

AI

を強くするために様々な研究が行われてきた．完全情報ゲームであるチェス，将棋，囲碁ではすでに人間のトッププレイヤーの実力を上回っている．ガイスターは，チェス，将棋などと不完全情報性を持つという違いがある．このようなゲームでは，不確定な情報の推定は有効な意思決定を可能にするとされている．しかし，推定と探索の精度のそれぞれにかけるコストのバランスが重要である．

本研究では，推定駒数による勝率の変化を調べ，ガイスターにおける相手駒色推定の有効性を示した．

2 不完全情報ゲームにおける推定

不完全情報ゲームは，ゲームの状態に不明な部分が存在するため，可能な状態集合からランダムに状態を仮定し，モンテカルロ木探索などの探索手法を行っている．

Long

らは，不完全情報ゲームをゲームが進行するにしたがって情報が増えるトリック型ゲームとポーカーのように最後まで明らかな情報が増えないゲームに分類

した

[1]．トリック型ゲームでは着手決定において，未

知の状態の推定を用いることで有効な意思決定が可能になると思われる．しかし，実験的には必ずしも有効であるとは言えないゲームも存在する

[2]．

ガイスターでは駒を取るという行動があるため，ゲームが進行するにつれて相手の駒の情報が増えることからトリック型ゲームに分類される．ガイスターは，各プレイヤーが青と赤の駒を各

4

個ずつ使用して行う．ガイスターでは未知の状態が最大でも

₈C₄

通りと大貧民などに比べて少ないため，未知の状態の推定は有効であると考えられる．相手に赤駒をすべて取らせるという勝利条件があり，赤駒が分かった方が有利に運ぶと予想できる．

3 実験

本実験では，初期盤面から相手の駒の情報が分かっているプレイヤーと通常のプレイヤーの対戦を行う．相手の駒の情報の取得は，対戦サーバから出力されるログから行っている．情報を取得する駒の数は，0〜7 個の

8

種類とした．駒の数が

8

個で情報を取得する数が

7

個まであるのは，7 個のときと

8

個のときに得ることができる駒の情報の量が同じであるからである．対戦は，先手後手

500

試合の計

1,000

試合行い，勝率で強さを評価する．今回は引き分けを

0.5

勝とした．

相手の駒の情報が分かるプレイヤーをモンテカルロ法を用いた

MC g

とモンテカルロ木探索を用いた

MCTS g

とした．対戦相手はモンテカルロ法を用いた

MC

である．

4 実験結果

実験結果は図

1

の通りである．図

1

の横軸は推定駒数，縦軸は勝率を示している．黒のグラフが

MC g

の勝率，斜線のグラフは

MCTS g

の勝率を表している．

推測を行った両プレイヤーとも推定駒数が増えるにしたがって勝率も増加し，約

90%

程度に勝率が収束した．

推定駒数が

1

〜

3

枚と少ない時でも十分強くなった．解析を行った結果，青の駒だけ分かっているときより赤の駒が分かっているときの方が勝率が良かった．

推定枚数

勝率

図

1

対戦結果

5 まとめ

本研究では，ガイスターにおける相手駒色の推定の有効性について調べた．その結果，ガイスターにおいて推定を行うことで勝率が向上するという結果が得られた．

さらに，解析により赤の駒が分かった方が勝率が良いという結果が得られた．本研究では，初期盤面から相手の駒の色が確定していると限定的であったため，相手の駒の色が確定していない状況や途中の局面からなども調べる必要がある．

参考文献

[1] Jeﬀrey Richard Long, Nathan R Sturtevant, Michael Buro, and Timothy Furtak. Understand- ing the success of perfect information monte carlo sampling in game tree search. In Twenty-Fourth AAAI Conference on Artificial Intelligence, 2010.

[2]

西野順二, 西野哲朗. 大貧民における相手手札推

定

.

研究報告数理モデル化と問題解決

, 2011-MPS- 85, 2011.

ガイスターにおける相手駒色推定の有効性の研究

令和元年度 学士学位論文梗概 高知工科大学 情報学群

ガイスターにおける相手駒色推定の有効性の研究

1200338 栃川純平 【 ゲーム情報学研究室 】

1 はじめに

ガイスターは，相手の駒の色がわからない二人不完全 情報ゲームである．ガイスターは

大会が開かれるな ど新たな研究対象として注目を集めている．

これまで，ゲーム

本研究では，推定駒数による勝率の変化を調べ，ガイ スターにおける相手駒色推定の有効性を示した．

2 不完全情報ゲームにおける推定

不完全情報ゲームは，ゲームの状態に不明な部分が存 在するため，可能な状態集合からランダムに状態を仮定 し，モンテカルロ木探索などの探索手法を行っている．

らは，不完全情報ゲームをゲームが進行するに したがって情報が増えるトリック型ゲームとポーカーの ように最後まで明らかな情報が増えないゲームに分類

した

知の状態の推定を用いることで有効な意思決定が可能 になると思われる．しかし，実験的には必ずしも有効で あるとは言えないゲームも存在する

ガイスターでは駒を取るという行動があるため，ゲー ムが進行するにつれて相手の駒の情報が増えることか らトリック型ゲームに分類される．ガイスターは，各プ レイヤーが青と赤の駒を各

個ずつ使用して行う．ガイ スターでは未知の状態が最大でも

通りと大貧民な どに比べて少ないため，未知の状態の推定は有効である と考えられる．相手に赤駒をすべて取らせるという勝 利条件があり，赤駒が分かった方が有利に運ぶと予想で きる．

3 実験

本実験では，初期盤面から相手の駒の情報が分かって いるプレイヤーと通常のプレイヤーの対戦を行う．相手 の駒の情報の取得は，対戦サーバから出力されるログ から行っている．情報を取得する駒の数は，0〜7 個の

種類とした．駒の数が

個で情報を取得する数が

個 まであるのは，7 個のときと

個のときに得ることがで きる駒の情報の量が同じであるからである．対戦は，先 手後手

試合の計

試合行い，勝率で強さを評価 する．今回は引き分けを

勝とした．

相手の駒の情報が分かるプレイヤーをモンテカルロ法 を用いた

とモンテカルロ木探索を用いた

とした．対戦相手はモンテカルロ法を用いた

である．

4 実験結果

実験結果は図

の通りである．図

の横軸は推定駒 数，縦軸は勝率を示している．黒のグラフが

の 勝率，斜線のグラフは

の勝率を表している．

推測を行った両プレイヤーとも推定駒数が増えるにし たがって勝率も増加し，約

程度に勝率が収束した．

推定駒数が

〜

枚と少ない時でも十分強くなった．解 析を行った結果，青の駒だけ分かっているときより赤の 駒が分かっているときの方が勝率が良かった．

図

対戦結果

5 まとめ

本研究では，ガイスターにおける相手駒色の推定の有 効性について調べた．その結果，ガイスターにおいて推 定を行うことで勝率が向上するという結果が得られた．

参考文献

西野順二, 西野哲朗. 大貧民における相手手札推

定

研究報告数理モデル化と問題解決

令和元年度学士学位論文梗概高知工科大学情報学群

1200338 栃川純平【ゲーム情報学研究室】

ガイスターは，相手の駒の色がわからない二人不完全情報ゲームである．ガイスターは

大会が開かれるなど新たな研究対象として注目を集めている．

本研究では，推定駒数による勝率の変化を調べ，ガイスターにおける相手駒色推定の有効性を示した．

不完全情報ゲームは，ゲームの状態に不明な部分が存在するため，可能な状態集合からランダムに状態を仮定し，モンテカルロ木探索などの探索手法を行っている．

らは，不完全情報ゲームをゲームが進行するにしたがって情報が増えるトリック型ゲームとポーカーのように最後まで明らかな情報が増えないゲームに分類

知の状態の推定を用いることで有効な意思決定が可能になると思われる．しかし，実験的には必ずしも有効であるとは言えないゲームも存在する

ガイスターでは駒を取るという行動があるため，ゲームが進行するにつれて相手の駒の情報が増えることからトリック型ゲームに分類される．ガイスターは，各プレイヤーが青と赤の駒を各

個ずつ使用して行う．ガイスターでは未知の状態が最大でも

通りと大貧民などに比べて少ないため，未知の状態の推定は有効であると考えられる．相手に赤駒をすべて取らせるという勝利条件があり，赤駒が分かった方が有利に運ぶと予想できる．

本実験では，初期盤面から相手の駒の情報が分かっているプレイヤーと通常のプレイヤーの対戦を行う．相手の駒の情報の取得は，対戦サーバから出力されるログから行っている．情報を取得する駒の数は，0〜7 個の

個まであるのは，7 個のときと

個のときに得ることができる駒の情報の量が同じであるからである．対戦は，先手後手

試合行い，勝率で強さを評価する．今回は引き分けを

相手の駒の情報が分かるプレイヤーをモンテカルロ法を用いた

の横軸は推定駒数，縦軸は勝率を示している．黒のグラフが

の勝率，斜線のグラフは

推測を行った両プレイヤーとも推定駒数が増えるにしたがって勝率も増加し，約

枚と少ない時でも十分強くなった．解析を行った結果，青の駒だけ分かっているときより赤の駒が分かっているときの方が勝率が良かった．

本研究では，ガイスターにおける相手駒色の推定の有効性について調べた．その結果，ガイスターにおいて推定を行うことで勝率が向上するという結果が得られた．