コンピュータ囲碁の最前線 ~九路盤囲碁のイベントから~:1. コンピュータ囲碁の最前線 -ゲーム情報学から見た九路盤囲碁-
4
0
0
全文
(2) 様であり,これが囲碁というゲームが他のゲームと. れは,囲碁に乱数近似計算のモンテカルロ法の手法. 決定的に異なる要因となっている.. を適用しようという考え方で,難しい局面評価を膨 大な乱数シミュレーションによる勝率で近似するこ. コンピュータ囲碁の現状. とで回避しようとするものである. しかし,もちろん単純にモンテカルロ法を適用す るだけでは強くならなかった.Rémi は,このモン. コ ン ピ ュ ー タ 囲 碁 に 関 す る 研 究 は,1963 年 の. テカルロ法に UCB(Upper Confidence Bound)と呼. 1). ばれる計算手法を組み合わせ,さらに比較的簡単な. 究が行われるが,1980 年代に入り,ING 杯世界コ. 石のパターンを使うことでシミュレーションの質を. ンピュータ囲碁大会が開催され,人間の名人に勝て. 高める手法を提案することで画期的な成功を収め. ば 4 千万台湾ドル(日本円で約 1 億 4 千万円)とい. た .UCB とは,N 本腕バンデッド問題を解くた. う賞金を出したことで話題になった.このような大. めの 1 つの最適化計算手法であるが,Rémi はこの. きなコンペティションが開催されながら,コンピュ. UCB をモンテカルロ・シミュレーションに応用し,. ータ囲碁の実力は思うように伸びず,2000 年まで開. 見込みのある手により多く深い計算資源を割り振る. 催された ING 杯の中で最も良い成績を残したのは,. 手法に昇華させたのだ.. 1997 年の Handtalk というプログラムで,9 子でアマ. この手法は,それまでのコンピュータ囲碁の手法. チュア有段者に勝利したのがやっとであった.. を駆逐するほどの大きなブレークスルーをもたらし,. 新しい技術であるニューラルネットワークやさま. 2006 年ころまでのコンピュータ囲碁プログラムの. ざまな機械学習の手法も試されたが,どれもコンピ. 棋力がアマチュア 5 級程度だったのに対して,数年. ュータ囲碁の進歩に画期的な貢献をもたらすことは. でアマチュア有段者の棋力に押し上げた .2012. なく,2005 年ごろまでのコンピュータ囲碁のプロ. 年 3 月には,世界トップクラスのプログラム「Zen」. グラムは,人間の思考過程を模倣するようなかたち. が,日本棋院のプロ棋士である武宮正樹九段に 5 子,. のものが主流であった.. 4 子で挑み,連勝を収めるなど,現在のプログラム. すなわち,まず石と石のつながりをもとに石の連. はアマチュア五段を超えるレベルに至っていると言. 結を調べ, 「点,連,群」などの階層構造で石の勢力. われている.. 2). 3). 範囲を認識し,定石や死活やヨセなどのパターンに よる知識を用いて膨大な合法手の中から 10 手程度 以下に候補手を絞り込み,局所的な先読みなどを駆. 対戦イベントと展望. 使して,それぞれの候補手を比較評価して,次の一. 電気通信大学では,エンターテイメントと認知科. 手を決めるというものであった.しかし,人間の持. 学研究ステーションを中心に UEC 杯コンピュータ. っている経験的知識をコンピュータに教えこむこと. 囲碁大会やさまざまなコンピュータ囲碁のイベント. は難しく,膨大な知識を入れて微調整を繰り返すだ. を行ってきた .. けでは,十分な強さのプログラムを作ることはでき. 2012 年 6 月には,日本棋院と電気通信大学は,. なかった.. コンピュータ囲碁の発展にかかわる覚書を交わし,. 4). 向こう 5 年間,コンピュータ囲碁の大会やプロ棋士. ●●モンテカルロ木探索の出現. とコンピュータ囲碁との(置碁)定期戦を開催する. 長い低迷が続いていたコンピュータ囲碁の分野で. ことを約束した.これは,コンピュータ囲碁が一定. あったが,2006 年に画期的な手法が出現する.そ. のレベルに達し,日本棋院もその技術に対して,一. れがモンテカルロ木探索と呼ばれる手法である.こ. 定の評価を示したことにほかならない.. 情報処理 Vol.54 No.3 Mar. 2013. 235. 〜九路盤囲碁のイベントから〜. Remus による論文に遡る .その後,さまざまな研. コ ン ピ ュ ー タ 囲 碁 の 最 前 線. ミニ特集. ●●コンピュータ囲碁の歴史.
(3) 対局. 対戦カード. 勝 敗. 第 1 局 一力遼二段(黒) vs. Zen(白) 一力二段 中押し勝ち 第 2 局 大橋拓文五段(白) vs. Zen(黒) 大橋五段 中押し勝ち 第 3 局 蘇耀国八段(黒) vs. Zen(白) 蘇 八段 中押し勝ち. コ ン ピ ュ ー タ 囲 碁 の 最 前 線. ミニ特集. 第 4 局 一力遼二段(白) vs. Zen(黒) 一力二段 中押し勝ち 第 5 局 大橋拓文五段(黒) vs. Zen(白) 大橋五段 中押し勝ち 第 6 局 蘇耀国八段(白) vs. Zen(黒) 蘇 八段 中押し勝ち 表 -2 九路盤囲碁のイベントの勝敗 図 -1 対局の様子:大橋拓文五段(右)と Zen 加藤英樹氏(左) . この小特集のもととなる 2012 年 11 月 25 日に開. と思われる局面を築いた.そこまで完璧とも思われ. 催された「コンピュータ囲碁がプロ棋士に挑戦∼九. る手を打っていた Zen が 18 手目に突然の疑問手を. 路盤ガチンコ対決∼第 2 弾」は,2012 年 3 月に開. 打ち,一力二段はそれを見逃さず,一気に逆転する. 催された 2 回目の九路盤のイベントという位置づ. こととなった.詳細は,加藤英樹さんの分析やプロ. けであった.3 月のイベントでは九路盤囲碁に造詣. 棋士の自戦記を読んでいただきたいが,この手でプ. の深い大橋拓文五段. ☆1. ひとりを相手に囲碁プログ. ロ棋士がコンピュータに対する見方を改めることと. 〜九路盤囲碁のイベントから〜. ラム「Zen」が手番を入れ替えて 2 局対戦し,1 勝. なり,流れが変わったのではないだろうか.. 1 敗という成績を収めたが,本当にコンピュータ囲. 我々人間がコンピュータに抱くイメージとして. 碁がプロ棋士に匹敵する実力に達したのか,もっと. は,「正確な読み」というものがあるのではないか. 色々なプロ棋士を相手に多くの対戦を行ったらどう. と思うが,コンピュータ囲碁では,ゲーム木探索を. なるかを確かめる目的があった.. 行うコンピュータ将棋などと異なる思考アルゴリズ. それを受けて,11 月 25 日に行われたこのイベン. ムで動いているため,必ずしもこのイメージが当て. トでは,日本棋院から推薦された蘇耀国八段,大橋. はまらないことがある.将棋のようにゲーム木探索. 拓文五段,一力遼二段の 3 名のプロ棋士と先後手番. の手法で強くなってきたプログラムは,終盤に行く. を変えて 2 局ずつ合計 6 局の対戦を行うこととし. ほど正確さが増していく傾向があるが,囲碁のモン. た.図 -1 は,その対戦の模様である.. テカルロ木探索のアルゴリズムでは,手の選択や評. 対局結果は,表 -2 に示すように,プロ棋士の圧. 価は,確率と勝率によって決まるので,選ばれた手. 勝となった.. がたまたま乱数のイタズラで次善手だった場合,そ. 結果だけを見るとかなり大差のように思われるか. れを否定するためには,最善手を見つけるために非. もしれないが,内容的には,コンピュータがかなり. 常に膨大なシミュレーションを必要とすることにな. プロ棋士を圧倒する場面も見られた.. り,正確性を欠く場合があるのだ.また,AMAF(All. 元々 7 目というコミでは黒番が少し苦しいのでは. Move As First)というモンテカルロ・シミュレーシ. ないかと言われていたが,その予測通り第 1 局の一. ョンを効率化するための手法が,終盤における手順. 力二段と Zen の対局では,途中まで Zen が大優勢. が重要となるヨセの判断を誤らせているといった問 5). 題点も指摘されている . ☆1. 236. 大橋拓文先生は,2013 年 1 月下旬に六段に昇進されましたが,イ ベントの行われた対局当時は五段でしたので,本文中では「五段」 と表記させていただきました.. 情報処理 Vol.54 No.3 Mar. 2013. 今回の対戦では,プロ棋士はこの弱点を敏感に察 知して,局面を複雑化する手を選択することで,巧.
(4) みにコンピュータのミスを誘って,全勝という一方 的な戦果を得たと考えられる. いずれにしても, プロ棋士の卓 越した能 力でな ければ,こういった問題点が明らかにならないほど, コンピュータ囲碁が強くなってきたことは事実である. い強くなっているが,今回の対戦で浮き彫りになっ てきたような重要な問題点もある.プロ棋士に勝つ 探索だけでは超えられない課題があるように思われ. コ ン ピ ュ ー タ 囲 碁 の 最 前 線. コンピュータ囲碁を作るためには,モンテカルロ木. In Proceedings of the International Federation of Information Processing Congress 1962, pp.428-432(1963). 2 ) Coulom, R. : Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search. In Proceedings of the 5th International Conference on Computer and Games, Vol.4630, pp.72-83(2007). 3)美添一樹,山下 宏:コンピュータ囲碁−モンテカルロ法の 理論と実践−,共立出版(2012). 4)エンターテイメントと認知科学研究ステーション,http:// entcog.c.ooco.jp/entcog/ 5) 伊藤毅志,高橋克吉,猪爪 歩,加藤英樹,村松正和,松原 仁:人間とコンピュータの思考の違い∼囲碁の次の一手問題 による考察∼,第 17 回ゲームプログラミングワークショップ, pp.9-16(2012). (2012 年 12 月 24 日受付). ミニ特集. コンピュータ囲碁はここ数年,毎年 1 子ずつぐら. 参考文献 1)Remus, H. : Simulation of a Learning Machine for Playing Go.. る.さらなるブレークスルーが期待されている. 電気通信大学では,来る 2013 年 3 月に,UEC 杯コンピュータ囲碁大会とプロ棋士との置碁定期公 式戦である「第 1 回電聖戦」を開催する運びとなっ た.定期的な大会とプロ棋士との対戦を続けること で,コンピュータ囲碁の発展にとって多くの知見が 得られることと思う.今後のコンピュータ囲碁イベ ントから目が離せない.. ●. ○ 伊藤毅志(正会員) [email protected]. 1994 年名古屋大学大学院工学研究科情報工学専攻博士課程修了 (工学博士).同年より電気通信大学情報工学科助手.2007 年より同 助教.電気通信大学エンターテイメントと認知科学研究ステーショ ン代表.UEC 杯コンピュータ囲碁大会実行委員長.ゲームを題材に した人間の思考過程,熟達化の過程に興味を持つ.著書に「先を読 む頭脳」(新潮社,共著)ほか.コンピュータ囲碁フォーラム理事.. 〜九路盤囲碁のイベントから〜. 情報処理 Vol.54 No.3 Mar. 2013. 237.
(5)
関連したドキュメント
ともわからず,この世のものともあの世のものとも鼠り知れないwitchesの出
BCI は脳から得られる情報を利用して,思考によりコ
全客室にはオープンテラスを完備し、270 度
現在入手可能な情報から得られたソニーの経営者の判断にもとづいています。実
ヒュームがこのような表現をとるのは当然の ことながら、「人間は理性によって感情を支配
オーディエンスの生徒も勝敗を考えながらディベートを観戦し、ディベートが終わると 挙手で Government が勝ったか
子どもたちは、全5回のプログラムで学習したこと を思い出しながら、 「昔の人は霧ヶ峰に何をしにきてい
と判示している︒更に︑最後に︑﹁本件が同法の範囲内にないとすれば︑