世界コンピュータ将棋選手権参加報告、及び、GPS 将棋の技術

(1)

世界コンピュータ将棋選手権参加報告

及び, GPS 将棋のアルゴリズム

JST ERATO 湊プロジェクト研究員

竹内聖悟

(2)

概観

 世界コンピュータ将棋選手権の紹介  今年はGPS将棋が優勝  上位5プログラムがプロ棋士と対局予定  コンピュータ将棋のアルゴリズム  GPS 将棋と、そのアルゴリズムを紹介  約800台のマシンで疎結合並列探索

(3)

あらためて自己紹介

 竹内聖悟

 JST ERATO 湊プロジェクト研究員（札

幌）

 GPS 将棋の開発メンバー

 GPS = Game Programming Seminar

 東大総合文化研究科の教員と学生が中心となって開催しているゼミ @駒場  コンピュータ将棋、囲碁やチェスの研究  性能評価、探索制御など  ERATO : Simpath アルゴリズムの並列化, 3

(4)

将棋

 インドのチャトランガが起源？  ヨーロッパ : チェス  アジア: 各国の将棋  中国・韓国・タイ・モンゴルなど他の将棋類との大きな違い  取った駒を再利用  終盤でも駒数が同じ : 分岐数も減らない駒の動きが弱い

(5)

コンピュータ将棋選手権の記事

 読売新聞  朝日新聞  週刊将棋  掲載予定?  将棋世界  情報処理学会誌出典: 朝日新聞 5

(6)

IBM Deep Blue

 チェスのスパコン  カスパロフに勝利してから15年  1997/5/12  (米国時間5/11)  誕生日じゃない  1秒間に1億局面探索

(7)

コンピュータ将棋への注目

 2010年10月情報処理学会の学会創立50周年記念事業にてあからが清水市代女流王将と対局、勝利  2012年1月電王戦にて、ボンクラーズが元名人の米長邦雄日本将棋連盟会長と対局、勝利出典: 情報処理学会出典: 産経ニュース 7

(8)

プロ棋士との対局

 将棋プログラムが強くなり、プロレベルに近づいている（諸説あり）  プロ棋士との対局イベント「電王戦」  プロ棋士とプログラム5対5の対局が予定  電王戦出場プログラムは、今年の世界コンピュータ将棋選手権の上位5プログラム

(9)

世界コンピュータ将棋選手権

 CSA 主催 (Computer Shogi Association)  コンピュータ将棋の強さを競う大会  ハードウェア: 制限なし  会場持込の場合、騒音と電源の制限あり  ソフトウェア: 公認の将棋ライブラリ  ライブラリ例: Bonanza, GPS将棋,  ライブラリは予選通過が2つまでと制限  一から作らないでも参加できる  強くするアイデアとその実装は必要 9

(10)

参加資格

 自作のプログラム1つ  機種は問わない（原則として持ち込み）  複数のプログラムには参加できない  思考部について、自力で十分な工夫を施したものであること  その他細かい点はルール参照  CSAプロトコルでのLAN対戦への対応など

(11)

対局時間

 25分切れ負け, 秒単位で消費  1手あたり1秒は消費  比較的短い参考:  プロの対局: 各3時間など, 1分単位で消費  2時間59分使ってもかならず1分は考えられる  タイトル戦には各8時間で2日制のものも  アマチュア: 1手1分や20分+1手30秒など 11

(12)

今大会の上位5プログラム

 GPS 将棋  Puella α （旧名ボンクラーズ）  ツツカナ  Ponanza  習甦

(13)

http://www.computer-スケジュール

12月 WCSC 参加募集 1月末 WCSC 参加締切 2月オープン戦 3月アピール文書など締切 4月オープン戦 4月末 - 5月マシン送付など 5月2日前日テスト 5月3日 - 5日選手権 WCSC = World Computer Shogi Championship 13

(14)

選手権に必要なもの

 参加申し込み  参加費1万円  将棋プログラム  マシン  アピール文書  当日参加できるスケジュール

(15)

将棋プログラムを作ろう

 CSA公認ライブラリのBonanza を使おう  強いし、GPS将棋よりも読みやすいと評判！  bonanza~/src/client/ 以下にソース  評価関数にはbonanza~/winbin/fv.bin が必要  Bonanza を改造する  探索を…  評価関数を… 15

(16)

次は？

 そういえば名前がない  Bonanza が元なのでHonanza と名付ける  カタカナなら「ホナンザ」  Honanza はちゃんと動くのか？  変なことがないか手元で確認したい → GUI を使って指し手の確認

 Windows かつBonanza ⇛ 付属のCSA将

(17)

GUI

 将棋所 : Windows

 読み筋や評価値のグラフがあって見やすい  Linux やMac ならwine やmono で頑張る?  自動対戦もしてくれる

 USI への対応が必要

 Universal Shogi Interface

 Bonanza : U2B 将棋所 http://www.geocities.jp/shogid okoro/ http://www.geocities.jp/shogi_dep ot/ 17

(18)

実力を試したい

 floodgate  自動対局場所  floodgate に接続  30分に一度、他のプレイヤと対戦  15分切れ負け  組み合わせはレーティングなどを元に決定  対局結果に応じてレーティングがつく  寝ている間に試せる  騒音・熱・電気代に注意

(19)

http://wdoor.c.u-floodgate

 決勝プログラムも参加  本番マシンでの参加も  予選通過の目安にも？  gps_normal (2150) が一次通過の目安とか  様々なプログラムが参加  手元では出にくいバグ, 弱点の発見に 19

(20)

情報収集・発信

 情報処理学会ゲーム情報学研究会(sig-gi)  ゲームプログラミングワークショップ(GPW)  研究会  CSA 例会  CG, ACG  Blog など  何となく、はてなダイアリーが多い?

(21)

ゲームプログラミングワーク

ショップ (GPW)

 毎年11月に箱根で開催  2012年11月9日(金)から11日(日)  研究発表がメイン  夜はナイトイベント, コンピュータ将棋や囲碁の大会  情報交換、交流 21 http://sig-gi.c.u-tokyo.ac.jp/gpw/2012/

(22)

選手権参加申込

 12月頃に募集、参加締切は1月いっぱい  何が必要?  将棋プログラム  マシン  参加費1万円  アピール文書  選手権当日の予定

(23)

申し込んだ、その後は？

 2月4月「オープン戦」が開催  接続テストを兼ねている  参加数は少ない. GPS将棋はできるだけ参加  floodgate は拡張プロトコル  本番で拡張のまま参加してうまくいかない、こともありえるので、ここで経験するのが吉  お弁当やパーティーの予約, 追加入場者  ホテルや航空券の予約（GW!）  マシンの送付 23

(24)

本番直前

 一次予選前日に、会場にて接続テスト  本番環境でのテスト  他の参加者との交流も  遅刻しないように適当な睡眠を  マシンを送付しているので、予選前はすることがない場合も

(25)

当日

 参加受付  本番  ログイン, 確認に返事, 対戦相手に挨拶  将棋を眺めながら雑談や情報交換  終局したら挨拶  以下, くり返し  対局が始まれば、離れてもOK  むしろ、触ってはいけない  プロ棋士やアマの強い人がコメントくれるかもしれない 25

(26)

参加後

 予選を通過したなら、点呼に答えること  マシンの送付  挨拶、片付け、帰宅  選手権参加記  関連blog や情報を追う  本番マシンでfloodgate に参加  などなど

(27)

スケジュール

12月 WCSC 参加募集 1月末 WCSC 参加締切 2月オープン戦 3月アピール文書など締切 4月オープン戦 4月末 - 5月マシン送付など 5月2日前日テスト 5月3日 - 5日選手権 WCSC = World Computer Shogi Championship 27

(28)

参加ハードウェア

 次の中で選手権に参加したことのあるハードウェアは？ 1. ファミコン 2. PS3 3. FPGA 4. iMac 788台

(29)

参加ハードウェア

 次の中で選手権に参加したことのあるハードウェアは？  全部！ 1. ファミコン（第1回）※招待プログラム 2. PS3（第18回） 3. FPGA（第18, 19回）ボンクラーズ開発者 4. iMac 788台（第22回）GPS将棋 29

(30)

今大会について

 日時: 5月3日から5月5日 (GW!)  場所: 電気通信大学  全42プログラムが参加  奇数だったため、1プログラムが招待参加  ここ10年ぐらいは40~50プログラム  今大会から決勝シードなし  上位者を電王戦へ推薦

(31)

第22回大会の主催・共催など

 主催  コンピュータ将棋協会 (CSA) 電気通信大学エンターテイメントと認知科学研究ステーション  共催  早稲田大学ゲームの科学研究所  特別協力  公益社団法人日本将棋連盟  協賛  富士通株式会社 株式会社ドワンゴ  後援  総務省 文部科学省 経済産業省 一般社団法人情報処理学会 一般社団法人情報サービス産業協会 電気通信大学 早稲田大学メディアネットワークセンター 31

(32)

予選と決勝

参加プログラム数試合数 選出一次予選 26 7 8 二次予選 24 （シード 16） 9 8 決勝 8 7 （総当り） (5) 予選では完全スイス式と変形スイス式で組み合わせ基本的に同じ成績のもの同士を当てる順位の決定は、勝ち数, ソルコフ, SB, MD, DB を見る強い相手と戦った方が有利

(33)

GPS将棋

 将棋プログラム

 GPS のメンバーが主体となって開発

 GPS = Game Programming Seminar

 東京大学大学院総合文化研究科の教員,学生が開催

 GPS将棋, OSL はCSA 公認ライブラリ

 OSL = Open Shogi Library

 選手権: GPS将棋としては10回参加

 成績: 2009年優勝 10年3位 12年優勝

(34)

GPS 将棋の特色

 コンピュータチェスやコンピュータ将棋の最新の研究を取り入れている  実現確率を用いた探索  評価関数の機械学習  （並列）df-pn による詰将棋探索  疎結合並列探索  オープンソース, フリーウェア  クラスタ : 約800台約3200コア

(35)

計算機群

 情報基盤センター教育用計算機を利用  東京大学駒場キャンパス情報教育棟  平日と土曜日は学生が利用  土曜日は一部演習室は閉鎖されている  日曜祝日しか利用できない！  利用申請が必要  申請者は離れられない http://gps.tanaka.ecc.u-tokyo.ac.jp/gpsshogi 35

(36)

GPS将棋の参加記

 5/2: 接続テスト, 駒場と会場  5/3: 一次予選, 駒場にて作業  5/4: 二次予選, 駒場と会場  5/5: 決勝, 駒場と会場  終了後に現地へ集合 / 表彰式など

(37)

5/2 : 前日

 夕方から会場へ  リモートのため、回線の接続テスト  ネットワーク越しに対局できるかテストなど  問題なく終了 37

(38)

5/3 : 一次予選

 シードなので参加しないで良い  情報教育棟にて作業  東大駒場キャンパス  GW に入ったので、iMac 全台を借りられた  1人で全台起動すると1時間半かかる  管理者がいないといけない  ログの読み方や作業の共有  おかしな点を発見するため  定跡のチェック変な指手がないかのチェック

(39)

5/4 : 二次予選

 朝は駒場  マシン起動の手伝いなど  起動の仕組みがうまくいったので不要だった  会場とskype で接続  中継を眺めるなど  午後から現地へ  予選通過後の作業  ルートでの分割数を増やす  定跡の一部変更  時間制御 / 切れ負けの反省 39

(40)

5/5 : 決勝

 駒場  中継を眺める  個人の感想: 今年は安心して見ていられた  最終戦を除く  全局終了後、マシンを落として現地へ  閉会式と表彰式に間に合った  懇親会

(41)

選手権の模様の紹介

 コンピュータ将棋選手権ネット中継  http://computer-shogi-live.cocolog-nifty.com/  情報交換しながら和気あいあい  本人同士が将棋を指すわけではない  でも胃が痛くなったりする  少しくだけたワークショップなどと雰囲気が似ているかも  発表はないが ₄₁

(42)

個人的なポイントなど

 一次予選  Selene の全勝, 新規参加組が多く予選通過  二次予選  決勝シードがないため、より厳しい戦い  クラスタ参加が6組?  去年の決勝8プログラム + ツツカナの争い  この9プログラムは10位以下のプログラムに負けていない  Bonanza が予選落ち  決勝  GPS将棋がラスト前で優勝を決めたかと思いきや  上位5位の争い新人賞と独創賞

(43)

報道

 一般紙  読売新聞, 朝日新聞  将棋専門誌  週刊将棋5/16号, 将棋世界7月号?  その他  情報処理学会学会誌  例年は、8月号にミニ小特集  Yahoo ニュースや/. 43

(44)

決勝8プログラム + 1 の紹介

 GPS 将棋  Puella α （旧名ボンクラーズ）  ツツカナ  Ponanza  習甦  激指  YSS  Blunder Bonanza

(45)

http://www.computer- 以上、選手権の紹介と参加報告でした

(46)

コンピュータ将棋

 入力: 局面（+ 時間, これまでの棋譜）  出力: 指し手

(47)

ゲーム木

 ゲームを木として表す  局面: ノード  手: 枝  展開すれば解ける！（必勝法） x o x o x x_xo x x o x o x o x x o x x o x o o x_xo x x x o x o x x x o x o x 47

(48)

ゲーム木サイズ

ゲーム ゲーム木サイズ チェッカー 10^30 解析済オセロ 10^60 人間より上チェス 10^120 人間のトップレベル中国象棋 10^150 人間のトップレベル? 将棋 10^220 トップにはまだ？囲碁(19路) 10^360 アマチュアレベル阿伽羅（あから） = 10^224 現実的には解けない

(49)

強いプログラムを作るには

 評価関数 (形勢判断)  探索 (先読み)  どちらかが完全 ⇒ 解析できる  現実的でない 49

(50)

1手読み

 1手進めてから選ぶ  1手で終わるゲームなら解析実際のゲーム:  1手では終わらない 1手先の勝ち負けを知りたい ⇒ 形勢判断勝分負 ? ? ? ◯ : 局面｜ : 手

(51)

1手読み + 形勢判断

1手進め、形勢が良い手を選ぶ  形勢判断が完璧なら解析実際のゲーム:  不正確 ⇒ 深い探索、正確な形勢判断が必要 51 +100 ₀ -90

(52)

評価関数

局面の良し悪しを数値化  評価項目/特徴とその重みからなる  例) 5*(駒得) + 10*(危険度) + ...  重みは機械学習で自動調整  特徴は人間が考える局面評価_関数 _評価値

(53)

評価関数ひとむかし

 特徴を考える  人間が考える, 将棋の知識が必要  駒の点数, 王の危険度…  重みをつける  人間が考える, 将棋の知識が必要  歩が100点として、香車は200?400?  パラメータ数に限界  せいぜい数百数千?

(54)

評価関数, 現在

 特徴をたくさん考える  人間が考える  駒の点数, 王の危険度…  重みをつける  機械学習による自動処理  棋譜の指し手を選ぶように重みを調整  パラメータ数は数百万, 数千万, 億?

(55)

GPS将棋の評価関数

 序盤, 中盤, 中盤2, 終盤の4種類  8,952,491 項目（重み0も含める）  2009年は約300万 : およそ3倍に  局面の進行度に基づき内分を取る  人間の知識で項目を選択  重みは棋譜から調整  調整後強くなったか対戦で確認, 採否 55

(56)

5 3 6 2 ₉ ₅ 1 4 1 2 3 Min-Player Max-Player Root 3 2 3 ₅ 2 3 2 1 3 Best Move 4 1 ₄ 5 2

Min-Max探索

数字は”評価値” 1 1 4 4 Max Player は最大値 Min Player は最小値を選ぶ

(57)

探索

 評価関数 + αβ探索  互いに最善を尽くす前提  深さ打ち切り探索  葉ノードで、評価関数による評価値を得る  一般に, 深く探索するほど強い  速度を上げる工夫 (7776FU, +300) 局面探索指し手, _評価値 57

(58)

αβ探索

 Min-Max を効率的に行い、同じ結果を得る  不要な探索を行わない : 枝刈  探索窓, alpha-beta window の導入  興味のある評価値の範囲  (alpha, beta) として表記  返り値V で更新

 Max : If (V > alpha) alpha = V

(59)

枝刈

 枝刈条件  Max : V >= beta  Min : V <= alpha 例:  ルートのMax ノードは5以上  矢印のノードに左の子ノードから3が返った ⇛ 値は3以下になる (∵ Min ノード)  ルートには3以下しか返らない ⇛ 選ばれない  それ以上探索するのは無駄 ⇛ 枝刈 Min Max 5 (5, ∞) 3 (5, ∞) Cut ! 59

(60)

5 3 6 2 9 5 1 2 Min-Player Max-Player Root 3 2 3 _≧₅ ≦2 3 ≦2 1 3 Best Move 5 ≦2 Cut Cut

αβ探索

数字は”評価値” Cut (-∞, ∞) (-∞, ∞) (3, ∞) (-∞, 3) (-∞, ∞) (3, ∞) (-∞, 3) (-∞, 3) (3, ∞) (3, 6) (-∞, ∞) (-∞,5) (3, ∞) (3, ∞) (3, ∞) (3, ∞)

(61)

5 3 6 2 ₉ ₅ 1 2 Root 3 2 3 _≧₅ ≦2 3 ≦2 1 3 5 ≦2

αβ探索の結果

枝刈されたノード _{枝刈されたノード} 61

(62)

αβ探索と効率

 探索の順序  良い手を先に探索すると枝刈の効率が良い  ハッシュ表  千日手や合流  76歩 34歩 66歩  66歩 34歩 76歩

(63)

4 1 5 4 ₂ 5 3 1 3 2 6 Min-Player Max-Player Root 1 4 4 3 2 ₃ 2 1 3 _{Best Move} 4 1 4 2 2

探索順序の重要性

3 1 4 4 Max で小さい値 Min で大きな値を先に探索 63 αβ探索で枝刈が起こらない！

(64)

効率的な探索

 Null-window search (NWS)

 V より大きいかを調べるなら(v, v+1) で探索  探索窓の幅がNull, 枝刈がすぐ起こるので高

速

 Principal Variation Search (PVS)

 一番左端は(-∞, ∞)で探索: 評価値v

 残りに、PV の結果を上回る手がないか調べ

る

 ⇛ v’ = Null-window search (v, v+1)

(65)

3 4 1 5 3 6 2 ₉ ₅ 1 2 Root 4 1 4

PVS

左端の探索結果は5. 5より大きくなるか調べたい (5,6) でNWS (5,6 ) (5,6 ) (5,6 ) 3 (5,6₎ 2 3 (5,6 ) (5,6 ) (5,6 ) 1 (5,6 ) 2 2 3 2 5 5 65

(66)

探索の効率化に重要な情報

 探索順序  枝刈が起こらないことも  探索窓の広さ  狭いほど枝刈は起こりやすい  ハッシュ表  探索結果の保持 : 同一局面の探索を行わない  手の並び替え: 浅い探索結果を元に

(67)

探索の工夫

 枝刈・探索延長  探索順序  探索窓  ハードウェア  専用ハードウェア (例: Deep Blue)  CPUのオーバークロック  マルチコア  クラスタ/疎結合 67

(68)

並列化の難しさ

 処理は並列に行える?  処理に順序依存性があると難しい  オーバヘッド  探索 : (逐次なら)枝刈されるノードの探索  同期 : 他のプロセッサの結果を待つ  通信 : 仕事の分割, 仕事を通信, 通信遅延

(69)

5 3 6 2 ₉ ₅ 1 2 Root 3 2 3 _≧₅ ≦2 3 ≦2 1 3 5 ≦2

αβ探索の結果

枝刈されたノード _{枝刈されたノード} 69 色のついた分を探索するのが、探索オーバヘッド

(70)

メモリ共有環境

 例: 最近のパソコン Nコア  プロセッサ間の通信は十分速い  通信オーバヘッドはあまりない  PV Split  PVS の並列化  左端を1人で展開

 残りのノードを並列にnull window search

 ハッシュ表を共有  ロックレスハッシュ

(71)

PVSplit

71 Min Max P2 P1 P 2 P 1 P1 P1 P2 1 P P2 2並列 Processor1,2 (P1,P2) 1 2 2 3 3 4 4 5 5

(72)

GPS将棋の疎結合並列探索

 2010年の第20回大会からクラスタ参加  順位: 3位 -> 6位 -> 1位!

 コア数: 666, 800, 3200

 情報教育棟のiMac, Amazon EC2 (2011)

 ネットワークで緩く接続されたマシン群

 通信速度はそんなに速くない

 情報のやり取りがあまり出来ない

(73)

単純なアイデア

 木を展開していき、台数分ノードができたら全ノードに1台ずつ割り振る ⇛ 無駄な探索がかなり多い  台数効果が出ない  将棋の平均合法手数は80  1手深く探索するには80台  2手深く探索するには6,400台必要！ 73

(74)

メモリ非共有環境

 情報のやり取りが通信となり、遅い  探索結果やハッシュ表  ハッシュ表については、local, global, ハッシュ値に応じて割り振る, hybrid などが考えられる  探索結果を使うには、他の人の仕事が終わるのを待つ必要がある

(75)

従来手法

 YBWC, APHID, TDSAB

 YBWC はPVSplit に近い手法  合議  将棋では実際に成功した例があまりない  チェスでもRybka がクラスタ探索をしているが、詳細は不明  他ではクラスタ探索を聞かない 75 http://cluster.rybkachess.com/

(76)

合議

 お手軽な（疎結合）並列探索  複数台で1台のマシンよりも強くなる  4, 8台で55%前後  逓減は速い準備:  異なるプログラムの用意 : 台数分  評価関数に乱数を入れるなど手順:  それぞれ同じ局面を探索  多数決で指手を選択

(77)

8台合議例

77 P1 Root P2 P3 P4 P5 P6 P7 P8 指手票 a P1, P2, P4, P8 b P3, P5 c P6, P7 手a が選ばれる左から手a,b,c と並ぶ

(78)

GPS将棋

 探索窓を共有しない  同期オーバヘッドと効率のトレードオフ  ハッシュ表は各自で持つ  割当て時に前回担当分に割当てられる  ここでは、通信オーバヘッドはない  並び替えは探索など  探索オーバヘッドはあるが、並び替えがうまくいけば、少なく抑えられる

(79)

GPS将棋のアプローチ（概要）

 ルートで手生成  上位N 手にマシンを割当  順位に応じて台数を変化  残りの手は1台で通常探索  それぞれ, 手を進めた局面で手生成  各手の台数が1台なら1台で通常探索  上位M手にマシンを割当, 残りは1台で探索  以下、繰り返し  「残りの手」が最善となったら探索時間延長 79

(80)

N=M=1

Min Max P8 P 7 P6 8並列 P 5 A P 4 P3 P2 P1 Root P8 と比較し, Aの子ノードは5手深く探索

(81)

N=2, M=1

81 Min Max P 1 1 A P 5 P1 4 P 11並列 Root P11 と比較し, Aの子ノードは3手深く探索 P3 P2 P 1 0 P6 _P7 _P8 P9

(82)

(83)

(84)

台数分割

 良い手には多く割当、良くない手にはあまり割当てたくない  “良い手”がわかれば探索する必要はない  順位付けが必要  1秒での探索や実現確率の上位の手を利用 (2010,2011)

(85)

上位を選ぶ (2012)

 前回その局面を探索した ⇛ 前回の探索結果の上位N手 (new)  探索していないが、5秒以上ある ⇛ 1秒で探索した結果の上位N手  実現確率の上位N手 85

(86)

探索時間延長

 「残りの手」が一番良い ⇛ 探索時間延長  他の手よりも浅い ∵ 1台で複数の手を担当  ⇛ 信用出来ない  「残りの手」以外での1位はそのまま探索  他は「残りの手」の最善の探索に再割当  「残りの手」を読んでいた1台は、新しい残りの手を探索（これは問題）

(87)

問題点

 「残りの手」を読んでいた1台は、新しい残りの手を探索  「新しい、残りの手」は1台で探索  やはり怪しい  浅い探索の結果が選ばれる可能性がある  本番でも起きていた様子  どうすべきだったか  「残りの手」で良い手  「残りの手」以外での1位の手  だけを探索すれば良い 87

(88)

探索時間延長（延長前）

P 11 P 5 P1 4 P Root P3 P2 P 1 0 P6 _P7 _P8 P9 手a 手b 手c 手d = best 手a, 手b に比べて3手浅い手d が最善評価値: d > a > b > c

(89)

探索時間延長（再割当後）

89 P11 P5 P1 ₄P Root P3 P2 P 1 0 P6 _P7 _P8 P9 手a 手b 手c 手d 上位N(=2)手の最善(a) : そのまま探索を続行上位N(=2)手の残り (b) : プロセッサ(6-10)を集め、最善手d を探索残りの手(c,d)の担当は新しい残りの手(b,c)を探索

(90)

GPS将棋のアプローチ（再掲）

 ルートで手生成  上位N 手にマシンを割当  順位に応じて台数を変化  残りの手は1台で通常探索  それぞれ, 手を進めた局面で手生成  各手の台数が1台なら1台で通常探索  上位M手にマシンを割当, 残りは1台で探索  以下、繰り返し「残りの手」が最善となったら探索時間延長

(91)

選手権での構成

 マスタ 1台  情報の統合など  スレーブ 792台  探索  詰将棋専用スレーブ 4台  詰将棋専用 91

(92)

今年のクラスタ差分

 Perl, ruby からC++ へ書き換え  速度向上  タスク分割方法  性能向上  探索時間延長  探索結果の信頼性を向上

(93)

マシンスペック

iMac Core 2 Duo iMac Core i 5 Amazon EC2 その他コア 数 2010 307 0 0 7 666 2011 208 0 40 15 832

2012 0 _CPU788 0 _{#core #cpu memory}9 3224

iMac Core 2 Duo 2.0GHz Intel Core 2 Duo 2 1 2GB iMac Core i 5 2.5GHz Intel Core i 5 4 1 4GB Amazon EC2 2.93GHz? Intel Xeon X5570 4 2 23GB 93

(94)

対戦実験

 今年も行なっていない参考記録:  金子, 田中「最善手の予測に基づくゲーム木探索の分散並列実行」 GPW2010  逐次よりも強い  8コアでメモリ共有探索4コアと同等 （勝,負,引分） メモリ共有型 1コア 2コア 4コアクラスタ8コア _{71 – 28 -} _{57 – 29 -} _{43 – 50 -}

(95)

計算機群（再掲）

 情報基盤センター教育用計算機を利用  東京大学駒場キャンパス情報教育棟  平日と土曜日は学生が利用  土曜日は一部演習室は閉鎖されている  日曜祝日しか利用できない！  利用申請が必要  申請者は離れられない http://gps.tanaka.ecc.u-tokyo.ac.jp/gpsshogi 95

(96)

他の部分の去年との違い

 評価関数  古いバージョンに勝ち越すものを採用  探索  チェスプログラムStockfish を将棋へ移植  gpsfish  今回探索のスレーブとして利用  チェスと将棋の違いに起因する問題が多々  稲庭対策がない / クラスタはあり  詰将棋がない / クラスタはあり (元)駒得少年の冒険

(97)

URL

 GPS将棋  http://gps.tanaka.ecc.u-tokyo.ac.jp/gpsshogi  http://twitter.com/gpsshogi  Floodgate （コンピュータ将棋対局道場）  http://wdoor.c.u-tokyo.ac.jp/shogi  第22回コンピュータ将棋選手権  http://www.computer-shogi.org/wcsc22/ 97

(98)

まとめ

 WCSC において, GPS 将棋が優勝  約800台での疎結合並列探索  注目の集まる電王戦への出場  コンピュータ将棋のアルゴリズムを紹介  GPS将棋の疎結合並列探索を簡単に紹介 