対局実験 4

実験3で用いた手法を導入した囲碁プログラムRayの棋力をモンテカルロ木探索を用いた最強クラスのオープンソースソフトウェアであるFuego [18]とPachi [19]を用いて測定した.

5.5.1 対局の設定1

対局の条件は以下の通りである.

• 対局相手 : Fuego ver 1.1とPachi ver 11.00

• 中国ルール

• 9路, 13路, 19路

• コミ6.5目

• 黒白交互に入れ替えて1000局

• 1手1秒, 1手2秒, 1手4秒

• プログラムの使用するスレッド数を16個に固定

• 相手の思考時間中には思考しない

• 前の探索の結果を再利用する

5.5.2 対局結果1

Fuegoとの対局結果を表10, Pachiとの対局結果を表11に示す. 括弧内は対局結果が正

規分布に従うと近似したときの両裾2.5%点を表す(＋が右裾2.5%点, - が左裾2.5%点).

表 10: 対局結果(対局相手Fuego ver 1.1)

1手あたりの思考時間 9x9 13x13 19x19 1秒 34.3%(±2.9%) 75.7%(±2.7%) 90.7%(±1.8%) 2秒 31.8%(±2.9%) 73.3%(±2.7%) 93.7%(±1.5%) 4秒 35.0%(±3.0%) 78.2%(±2.6%) 96.9%(±1.0%)

表 11: 対局結果(対局相手Pachi ver 11.00)

1手あたりの思考時間 9x9 13x13 19x19 1秒 53.5%(±3.1%) 70.6%(±2.8%) 88.7%(±2.0%) 2秒 52.7%(±3.1%) 63.4%(±3.0%) 88.3%(±2.0%) 4秒 49.0%(±3.1%) 62.8%(±3.0%) 87.1%(±2.0%)

5.5.3 対局の設定2

大会のレギュレーションを想定して, 対局の条件を次のように設定した.

• 対局相手 : Fuego ver 1.1とPachi ver 11.00

• 中国ルール

• 19路盤

• コミ6.5目

• 黒白交互に入れ替えて1000局

• 持ち時間10分

• プログラムの使用するスレッド数を8個に固定

• 相手の思考時間中にも思考する

• 前の探索結果を再利用する

5.5.4 対局結果2

対局結果を表12に示す. 括弧内は対局結果が正規分布に従うと近似したときの両裾 2.5%点を表す(＋が右裾2.5%点, - が左裾2.5%点).

表 12: 対局結果

対局相手 Fuego Pachi

勝率 93.2%(±1.6%) 74.3%(±2.7%)

5.5.5 考察

表10と表11を見ると, 9路盤においては, Fuegoに有意に負け越しており, Pachiとは有意な差が見られないため, 同じ程度の強さであるので, 9路盤ではオープンソースソフトウェアより強くすることはできていないと言える. これは9路盤は盤の大きさが小さく, 対局実験1からもわかる通り, シミュレーションの実行速度の速さが強さに大きく影響するからだと考えられる.

一方で, 13路盤や19路盤ではFuego, Pachiの両者に有意に勝ち越している. 13路盤や 19路盤では布石の段階があり,よりグローバルに着手を評価できる非決定論的シミュレーションの利点が出やすいからだと考えられる.

9路盤では, シミュレーションの質よりも探索の速度が重要であり, 13路盤と19路盤では探索の速度よりもシミュレーションの質が重要であると言える.

また表12を見ると, FuegoにもPachiにも有意に勝ち越しているので,持ち時間を固定

して,同じ環境で対局する場合には両者よりも強いと言える.

6 ^おわりに

6.1 全体のまとめ

本研究では,非決定論的シミュレーションを行う強い囲碁プログラムの設計と開発を行った. また, 設計にあたって, 木探索部に用いる学習手法の違い,シミュレーションに用いるパターンの大きさの違い, 各種ヒューリスティックの有無による棋力の変化を測定した.

木探索部に用いる学習手法については, 著しい変化は見られなかったが,

Minorization-Maximizationアルゴリズムよりも2つの特徴の組合せたときの特徴を考慮できるLatent

Factor Rankingアルゴリズムの方が優れていることがわかった.

シミュレーションに用いるパターンのサイズについては, 対局する盤の大きさが大きくなるほど, 大きなパターンを用いる棋力向上が明確になることがわかった.

各種ヒューリスティックについては, 全てのヒューリスティックについて, ヒューリスティック無しよりも有意に強く,またヒューリスティックを組み合わせて使うことにより, 更なる棋力向上が得られることを確かめられた.

ドキュメント内修士論文の和文要旨研究科・専攻 (ページ 54-57)

6 おわりに

6.1 全体のまとめ

6 ^おわりに