第 4 章 コラージュパターンの提案と評価
4.5 プレイアウト性能,強さに関する評価
4.5.2 結果
ことを示すことができた.また UCT用・MC 用など,用途に応じて目的関数を変えるこ とで同じパターンを使っても多様な特性を持たせることができることも示せた.
(a) N5 (b) N7
(c) N9 (d) CP
図 4.8 9 路の各パターンの最大マッチングサイズ
(a) N5 (b) N7
(c) N9 (d) CP
図 4.9 19路の各パターンの最大マッチングサイズ
上辺を見ると (6, 1) の周辺の値が N9 の方が高くなっている.ここは普通に打つと黒の 地にはならないので CP の方が良いといえる.
局面2 を見ると左上や左下は黒の地になりそうであるが,N9の方が若干値が高い.ま た右上の白は生きているが CP では 1% で取られてしまっているので N9 の方が良いと いえる.
本実験の 2 例だけからでは両者の優劣は言えないが,より曖昧又は複雑な局面を与え ることで問題点の発見ができると考えている.
表4.9 に 9路でのプレイアウト速度を示す(コア数は1).これはm手まで n 回のプレ イアウトを 1セットとし,これを12回行って最良と最悪の 2 回を除いた10 回の平均速 度から計算した 1 秒当たりのプレイアウト回数である.m と n の値は盤の大きさによっ て異なり,表4.10 の通り.表4.9 よりCPは N5の4割,N7の5〜 6割,N9の 8割程 度の速度になっていた.これは CP では 4つに分けて計算するため例えば 4つのパター ンが重なっている着手点の周囲 8点に石が置かれると 4 つのパターン全てを計算する必 要があるためからである.また現在プレイアウト速度に対するチューニングは不十分であ り,改善の余地はあるためこれらを修正することで良くなる可能性がある.
表 4.9 9 路でのプレイアウト速度
プレイアウト速度[po/sec]
9路 13 路 19路 N5 1297.9 545.5 238.0 N7 884.8 364.6 156.5 N9 625.6 246.5 103.6 CP 512.1 192.2 81.0
表 4.10 測定に用いた値
m n
9路 80 10000 13路 160 1000 19路 300 1000
(a) 局面1 N9 (b)局面1 CP
(c)局面2 N9 (d)局面2 CP
図 4.10 13 路での占有率の例
表 4.11 に自己対戦の結果を示す.表中の値は CP の勝率である.9 路は一手 5 秒で 500 対局,13路は一手 20秒で 200 対局行った.13 路盤用の係数を学習するための十分 な棋譜の入手は困難なため,19路盤用に学習した係数を流用するした.表より自己対戦 では CP は良い結果を示さなかった.この原因としては表 4.9 に示すようにプレイアウ ト速度が大幅に遅くなっていたことが考えられる.またN9に対しては他に比べて少し勝 率が高くなっており特に 13 路では他に比べて有意に勝率が高い.19 路での N9 の順位 項目,確率項目の結果は良いため N5,N7 と差があるとするとプレイアウト速度である.
表 4.9 より N9のプレイアウト速度はN5 の約 5割,N7の約 7 割となっている.このこ とからプレイアウト速度はプログラムの強さに大きく影響を与えると言える.
表 4.11 9 路と13 路の自己対戦の結果
9 路 13 路
N5 34.0±4.2 22.5±5.8 N7 34.8±4.2 21.5±5.7 N9 38.4±4.3 36.5±6.7