• 検索結果がありません。

要 旨 リバーシにおける モンテカルロ木探索手法の評価

N/A
N/A
Protected

Academic year: 2021

シェア "要 旨 リバーシにおける モンテカルロ木探索手法の評価"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

要 旨

リバーシにおける

モンテカルロ木探索手法の評価

徳永 勝也

モンテカルロ木探索は囲碁の分野で多く用いられており,ゲーム研究において注目されて いる探索手法の1つである.モンテカルロ木探索は,ランダムプレイによって結果を出し

(プレイアウト)それを繰り返した結果が良い場合が多い手を選択するモンテカルロ法と,

ゲームを木構造で表し探索を行う木探索を組み合わせた手法である.これにより,有望な手 を中心にプレイアウトを行い,さらに有望な手についてはゲーム木を展開して深く読む.

リバーシは,ルールが単純であるため,ゲーム研究において最初期から研究されてきた.

現状では,人間では勝つことが出来ないほど強くなっている.したがって,従来の手法によ る研究により,強さという面での研究は完結しているといえる.そのため,リバーシにおい てモンテカルロ木探索はほとんど研究されてこなかった.

本稿では,リバーシにおいて,モンテカルロ木探索のプレイヤを作成し,ランダムプレイ ヤに対しての対戦結果によって評価を行った.また,作成したプレイヤに対して,モンテカ ルロ木探索の改良手法である先頭打着緊急度およびプレイアウトの改良を行った.

モンテカルロ木探索を適用し,パラメータの最適化を行った結果,95部以上の勝率で あった.また,評価関数を用いて,プレイアウトの改良を行った結果,99部以上の勝率 であった.このことから,モンテカルロ木探索を利用することで,ランダムプレイヤに対し ては非常に高い勝率をあげることができるプレイヤを作成できると分かった.

キーワード リバーシ,モンテカルロ木探索,UCTアルゴリズム

i

(2)

Abstract

Evaluation of Monte-Carlo Tree Search in reversi

Katsuya TOKUNAGA

Monte Carlo Tree Search (MCTS), which is commonly used in the field of Go, is drawing keen attention in game research. MCTS combines Monte Carlo method and tree search techniques. In the Monte Carlo method, the games results are randomly played out (playout) and the move with the best results is chosen. In the tree search, the game is represented by a tree structure and a search is performed on the tree. By combining these methods, we do playouts mainly on promising moves, and investigate promising moves by developening the game tree.

Reversi has been studied from the earliest stage in game research. At present, it is strong enough that human beings cannot win. Only using conventional methods.

Therefore, MCTS has not been studied in deep for reversi.

In this paper, we created an MCTS players for reversi and evaluated it against random players. We also improved the player with the first play urgency technique and the playouts with an evolution function, which were used to improve MCTS players for Go.

The MCTS player with optimized parameters achived the winning percentage of 95% or more. Moreover, as a result of improving the playouts with an evaluation function, it achieved 99% winning percentage. We found that we can create MCTS players that are much stronger than random players.

key words reversiMonte-Carlo Tree SearchUCT algorithm

ii

参照

関連したドキュメント

Keywords: Monte-Carlo Tree Search, action evaluation function, bias, Progressive Widening, oversight.. の良さを評価する試みが 1993 年

In this study, an othello player based on the Monte Carlo method is created, and the performance of the Monte-Carlo player is investigated with respect to random-play player.

Keywords: Monte-Carlo Tree Search, action evaluation function, bias, Progressive Widening, oversight.. の良さを評価する試みが 1993 年

In this study, we have modified the source code of dlshogi to create a program that combines Monte Carlo softmax search and evaluation functions of neural network

We can make even game situation for whatever board positions using difference games and MCTS might find an optimal move.. We show some experimental results using endgame problems on

A new UCT search method using position evaluation function and its evaluation by Othello Shota Maehara,†1 Tsuyoshi Hashimoto†2 and Yasuyuki Kobayashi†1 The Monte Carlo

In this thesis, the existing research on games was surveyed, including Monte Carlo tree search (MCTS), which is a commonly used algorithm in game research, realized

In this thesis, the existing research on games was surveyed, including Monte Carlo tree search (MCTS), which is a commonly used algorithm in game research, realized