• 検索結果がありません。

ガイスターにおける相手駒色推定の有効性の研究

N/A
N/A
Protected

Academic year: 2021

シェア "ガイスターにおける相手駒色推定の有効性の研究"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

令和元年度 学士学位論文梗概 高知工科大学 情報学群

ガイスターにおける相手駒色推定の有効性の研究

1200338 栃川純平 【 ゲーム情報学研究室 】

1 はじめに

ガイスターは,相手の駒の色がわからない二人不完全 情報ゲームである.ガイスターは

AI

大会が開かれるな ど新たな研究対象として注目を集めている.

これまで,ゲーム

AI

を強くするために様々な研究が 行われてきた.完全情報ゲームであるチェス,将棋,囲 碁ではすでに人間のトッププレイヤーの実力を上回って いる.ガイスターは,チェス,将棋などと不完全情報性 を持つという違いがある.このようなゲームでは,不確 定な情報の推定は有効な意思決定を可能にするとされ ている.しかし,推定と探索の精度のそれぞれにかける コストのバランスが重要である.

本研究では,推定駒数による勝率の変化を調べ,ガイ スターにおける相手駒色推定の有効性を示した.

2 不完全情報ゲームにおける推定

不完全情報ゲームは,ゲームの状態に不明な部分が存 在するため,可能な状態集合からランダムに状態を仮定 し,モンテカルロ木探索などの探索手法を行っている.

Long

らは,不完全情報ゲームをゲームが進行するに したがって情報が増えるトリック型ゲームとポーカーの ように最後まで明らかな情報が増えないゲームに分類

した

[1].トリック型ゲームでは着手決定において,未

知の状態の推定を用いることで有効な意思決定が可能 になると思われる.しかし,実験的には必ずしも有効で あるとは言えないゲームも存在する

[2].

ガイスターでは駒を取るという行動があるため,ゲー ムが進行するにつれて相手の駒の情報が増えることか らトリック型ゲームに分類される.ガイスターは,各プ レイヤーが青と赤の駒を各

4

個ずつ使用して行う.ガイ スターでは未知の状態が最大でも

8C4

通りと大貧民な どに比べて少ないため,未知の状態の推定は有効である と考えられる.相手に赤駒をすべて取らせるという勝 利条件があり,赤駒が分かった方が有利に運ぶと予想で きる.

3 実験

本実験では,初期盤面から相手の駒の情報が分かって いるプレイヤーと通常のプレイヤーの対戦を行う.相手 の駒の情報の取得は,対戦サーバから出力されるログ から行っている.情報を取得する駒の数は,0〜7 個の

8

種類とした.駒の数が

8

個で情報を取得する数が

7

個 まであるのは,7 個のときと

8

個のときに得ることがで きる駒の情報の量が同じであるからである.対戦は,先 手後手

500

試合の計

1,000

試合行い,勝率で強さを評価 する.今回は引き分けを

0.5

勝とした.

相手の駒の情報が分かるプレイヤーをモンテカルロ法 を用いた

MC g

とモンテカルロ木探索を用いた

MCTS g

とした.対戦相手はモンテカルロ法を用いた

MC

である.

4 実験結果

実験結果は図

1

の通りである.図

1

の横軸は推定駒 数,縦軸は勝率を示している.黒のグラフが

MC g

の 勝率,斜線のグラフは

MCTS g

の勝率を表している.

推測を行った両プレイヤーとも推定駒数が増えるにし たがって勝率も増加し,約

90%

程度に勝率が収束した.

推定駒数が

1

3

枚と少ない時でも十分強くなった.解 析を行った結果,青の駒だけ分かっているときより赤の 駒が分かっているときの方が勝率が良かった.

推定枚数

勝率

1

対戦結果

5 まとめ

本研究では,ガイスターにおける相手駒色の推定の有 効性について調べた.その結果,ガイスターにおいて推 定を行うことで勝率が向上するという結果が得られた.

さらに,解析により赤の駒が分かった方が勝率が良いと いう結果が得られた.本研究では,初期盤面から相手の 駒の色が確定していると限定的であったため,相手の駒 の色が確定していない状況や途中の局面からなども調 べる必要がある.

参考文献

[1] Jeffrey Richard Long, Nathan R Sturtevant, Michael Buro, and Timothy Furtak. Understand- ing the success of perfect information monte carlo sampling in game tree search. In Twenty-Fourth AAAI Conference on Artificial Intelligence, 2010.

[2]

西野順二, 西野哲朗. 大貧民における相手手札推

.

研究報告数理モデル化と問題解決

, 2011-MPS- 85, 2011.

参照

関連したドキュメント

傾斜運動が反復的に行われる。さらに、エアロビクスや太極拳と同様に有酸素 運動であり、3 から 4 分程度の曲 1 曲の運動量は

プレイヤー A がプレイヤー

情報処理学会研究報告 IPSJ SIG Technical Report 全情報ゲームの

野外でのカミツキガメ情報は,飼育者の放棄や逃出するタイミングや場所が予測できないこと,主に水

情報処理学会研究報告 IPSJ SIG Technical

DNA データベースと情報自己決定権との関係を論じる上で最も中心的な 論点となるのは、やはり比例原則にもとづく衡量である。ここでも、81g 条

情報処理学会研究報告 IPSJ SIG Technical Report 全情報ゲームの

 非協力繰り返しゲームの戦略で問題となるの は,プレイヤーが協力的な戦略(必ずしもナッ