実験3で用いた手法を導入した囲碁プログラムRayの棋力をモンテカルロ木探索を用 いた最強クラスのオープンソースソフトウェアであるFuego [18]とPachi [19]を用いて測 定した.
5.5.1 対局の設定1
対局の条件は以下の通りである.
• 対局相手 : Fuego ver 1.1とPachi ver 11.00
• 中国ルール
• 9路, 13路, 19路
• コミ6.5目
• 黒白交互に入れ替えて1000局
• 1手1秒, 1手2秒, 1手4秒
• プログラムの使用するスレッド数を16個に固定
• 相手の思考時間中には思考しない
• 前の探索の結果を再利用する
5.5.2 対局結果1
Fuegoとの対局結果を表10, Pachiとの対局結果を表11に示す. 括弧内は対局結果が正
規分布に従うと近似したときの両裾2.5%点を表す(+が右裾2.5%点, - が左裾2.5%点).
表 10: 対局結果(対局相手Fuego ver 1.1)
1手あたりの思考時間 9x9 13x13 19x19 1秒 34.3%(±2.9%) 75.7%(±2.7%) 90.7%(±1.8%) 2秒 31.8%(±2.9%) 73.3%(±2.7%) 93.7%(±1.5%) 4秒 35.0%(±3.0%) 78.2%(±2.6%) 96.9%(±1.0%)
表 11: 対局結果(対局相手Pachi ver 11.00)
1手あたりの思考時間 9x9 13x13 19x19 1秒 53.5%(±3.1%) 70.6%(±2.8%) 88.7%(±2.0%) 2秒 52.7%(±3.1%) 63.4%(±3.0%) 88.3%(±2.0%) 4秒 49.0%(±3.1%) 62.8%(±3.0%) 87.1%(±2.0%)
5.5.3 対局の設定2
大会のレギュレーションを想定して, 対局の条件を次のように設定した.
• 対局相手 : Fuego ver 1.1とPachi ver 11.00
• 中国ルール
• 19路盤
• コミ6.5目
• 黒白交互に入れ替えて1000局
• 持ち時間10分
• プログラムの使用するスレッド数を8個に固定
• 相手の思考時間中にも思考する
• 前の探索結果を再利用する
5.5.4 対局結果2
対局結果を表12に示す. 括弧内は対局結果が正規分布に従うと近似したときの両裾 2.5%点を表す(+が右裾2.5%点, - が左裾2.5%点).
表 12: 対局結果
対局相手 Fuego Pachi
勝率 93.2%(±1.6%) 74.3%(±2.7%)
5.5.5 考察
表10と表11を見ると, 9路盤においては, Fuegoに有意に負け越しており, Pachiとは有 意な差が見られないため, 同じ程度の強さであるので, 9路盤ではオープンソースソフト ウェアより強くすることはできていないと言える. これは9路盤は盤の大きさが小さく, 対局実験1からもわかる通り, シミュレーションの実行速度の速さが強さに大きく影響す るからだと考えられる.
一方で, 13路盤や19路盤ではFuego, Pachiの両者に有意に勝ち越している. 13路盤や 19路盤では布石の段階があり,よりグローバルに着手を評価できる非決定論的シミュレー ションの利点が出やすいからだと考えられる.
9路盤では, シミュレーションの質よりも探索の速度が重要であり, 13路盤と19路盤で は探索の速度よりもシミュレーションの質が重要であると言える.
また表12を見ると, FuegoにもPachiにも有意に勝ち越しているので,持ち時間を固定
して,同じ環境で対局する場合には両者よりも強いと言える.
6 おわりに
6.1 全体のまとめ
本研究では,非決定論的シミュレーションを行う強い囲碁プログラムの設計と開発を行っ た. また, 設計にあたって, 木探索部に用いる学習手法の違い,シミュレーションに用いる パターンの大きさの違い, 各種ヒューリスティックの有無による棋力の変化を測定した.
木探索部に用いる学習手法については, 著しい変化は見られなかったが,
Minorization-Maximizationアルゴリズムよりも2つの特徴の組合せたときの特徴を考慮できるLatent
Factor Rankingアルゴリズムの方が優れていることがわかった.
シミュレーションに用いるパターンのサイズについては, 対局する盤の大きさが大きく なるほど, 大きなパターンを用いる棋力向上が明確になることがわかった.
各種ヒューリスティックについては, 全てのヒューリスティックについて, ヒューリス ティック無しよりも有意に強く,またヒューリスティックを組み合わせて使うことにより, 更なる棋力向上が得られることを確かめられた.