-60-
囲碁プログラムにおける戦術構築のための局面認識
菅原英一・増永良文*
RecognitionoftheCurrentBoardSituation fOrStrategicPlanninginGoProgram
EiichiSuGAwARAandYoshifumiMAsuNAGA
(1995年11月30日受理)
WearedevelopingacomputerGoprogramasasubjectofartificialintelligenceresearch.
InplayingGo,humanplayersdecideonthebestmoveinthefollowing4steps: (i)recognition ofthecurrentboardsituation, (ii)evaluationofthecurrentboardsituation, (iii)generatiOnof candidatemoves, (iv)selectionofthebestmove. InorderforacomputerGoprogramto performstep(i), itrequiresameasuretoaccessthecurrentboardsituation.Twoalternatives arethepattern‑basedandthevalue‑basedfactor. Inthisstudy,wetookthesecondalternative andintroduced"potentialvalue''torecognizethestrengthoflinkagebetween4@Rens''一一fully linkedformationsofthesamecolorstones.Anexperimentalresultshowedthatthepotential valueapproachispowerful inthesensethatthedecisionsbasedthisapproachandhuman playerscoincidewithabout80percentofpracticalGogames.
2.着点決定プロセス はじめに
1
我々は, これまで盤上に展開する双方の石に関し て【点】, 【連】, 【群】なる三つのオブジェクトを定 義し,局面の進行はこれらオブジェクト間における
メッセージパッシングの時系列であることを述べ た')。
局面の進行に際して手番のプレイヤの最大の関心 事は「石の死活」と「地合い」であるが, この情報 を属性として持っているのが【群】である。 したが って, 「敵の石を捕獲」したり「味方の石を補強」す る等の戦術を構築するためには,双方の【群】情報 をできるだけ正しく認識し, それぞれの場面に応じ
た的確な局面評価がなされなければならない。
本論文では,着点決定プロセスの中での局面認識 の位置付けと序盤・中盤・終盤における局面認識の 実際例について述べ,併せて局面を認識するための 認識因子について考察する。その中で認識因子の活 用例としてポテンシャル値による実際の局面認識を 試み,ある程度良好な結果を得ている。
人間う。レイヤは自分の手番になると,おおよそ図 1のようなプロセスを経て着点を決定している。
零着点候補の生成着点の絞り込み
( i)
(ii) (iii) (iv)
図1 着点決定プロセス
すなわち, 【群】の状態{"活",一 死", セキ", 不 明"}や地合い(確定地および模様)の大きさ, それ に未開拓領域の場所などを知る(i) 「現局面の認識」
に始まり,得られた情報から石の死活(敵石の捕獲 や味方石の補強)を含む地合いのバランス状況など
*図書館情報大学
秋田高専研究紀要第31号
−61−
囲碁プログラムにおける戦術構築のための局面認識
形勢判断とも言われる(ii) 「現局面の評価」をする。
次いで,形勢優劣の判断を基に, いくつかの6ij「着 点候補の生成」があり,各々の着点候補については 仮にその点に着手した場合の(i)「現局面の認識」, (ii)
「現局面の評価」を可能な限り繰り返すことによっ て最善と思われる6v) 「着点の絞り込み」が行われる ことになる。
なお,定石や手筋・基本的な詰碁などの知識ベー スの活用は㈹「着点候補の生成」で行われる。
域がほぼ安定状態になるヨセの段階では,「確定地の 大きさ」, 「随所に残されたヨセの箇所」, 「欠陥箇所 の有無」が現局面の認識項目となる。この場合の局 面は「双方の確定地の差」,「残されたヨセの大きさ」,
「欠陥を衝いたときの得失の差」によって評価され,
「確定地の差」によって劣勢と判断されれば「敵方 の欠陥を探し出して紛れを求める」着手を候補とし て生成し,優勢と判断されれば「自陣の安全を確か めつつ大きなヨセから順」に着点候補を生成するこ
とになる。
3.現局面の認識
4.局面認識因子
「現局面の認識」は形勢判断に代表される「現局 面の評価」と必ずしも明確に区別できない場合もあ るが,序盤(布石) ・中盤(戦い) ・終盤(ヨセ)に 分けて局面の認識と評価から着点候補の生成までを 概観してみる。
前項において,現局面は「大場の有無」, 「石の死 活」, 「模様や確定地の大きさ」, 「残されたヨセの大 きさ」, 「欠陥箇所の有無」などによって認識される ことを述べたが,局面の認識をコンピュータに委ね る場合には, それぞれの認識局面に応じた認識基準 を予め与えておくことが必要である。例えば, 「模様 や確定地の大きさ」を認識する局面では双方の概略 の勢力範囲を知る必要があるが, この場合には盤上 の勢力分野を定義できる何らかの因子の存在が必要 不可欠である。この因子は認識する局面によって異 なり, これらを総称して局面認識因子と呼ぶことに する。
局面認識因子は大別して,双方の石の接触によっ て現れる一定の形(パターン) と盤上の勢力分布を 表す数値(ポテンシャル値) とが考えられる。本稿 では知識ベースを伴うパターンについては概観する にとどめ,実際の対局における【連】同士の連結認 識にポテンシャル値を活用した例を示し,考察を加 える。
3. 1 序盤(布石)
石数の少ない布石の段階においては,「空き隅の有 無」, 「シマリやカカリの有無」, 「辺の大場の有無」
などが局面の認識項目に挙げられ, これを評価する のは, 「双方の地合いのバランス状況」である。すな わち,空き隅が有ればその場所を占拠し, シマリや カカリの箇所が有ればその場所に先着する。そして,
辺の大場が有れば石の方向や陣形による優先度を基 に最優先の大場に先着する。以上が着点候補の生成 であり,布石理論によれば上述の順に着点が絞り込 まれることになる。
3. 2 中盤(戦い)
双方の石が互いに競い合う中盤戦においては,石 の死活と地合いが最大の関心事である。したがって,
グローバルな意味では, 「石の死活」と「模様や確定 地の大きさ」が現局面の認識項目の双壁であり, 「死 活の価値(活きた場合と死んだ場合の出入りの目 数)」と「模様や確定地の差」によって局面が評価さ れる。そして, この評価によって劣勢と判断される ならば「敵石を捕獲する」あるいは「味方石を活か す」作戦を立てたり, 「自陣の拡大」や「敵陣の削減」
を計る着点候補が生成されることになる。 また,評 価によって優勢と判断されるならば「できるだけ簡 明に収束」を計る着点候補が生成される。
4. 1 パターン
囲碁というケームは元来パターン認識的な特質を 有している。例えば,石の効率に関する用語として
「好形/悪形」, 「コリ形(石数の多い割に効率の悪い 形)」などのパターンがあり, また双方の石が接触す る場面では「手筋」とか「定石」などと言われる一 定の手順に従った基本パターンがある。
このようなパターンを局面認識に活用するために は, 「好形/悪形」, 「コリ形」, 「手筋」などの見本パ ターンや手順を伴った定石形の見本パターンを知識 ベースとして備えていることが必要である。すなわ ち,知識ベース上の見本パターンとの照合によって,
直前に打たれた敵方の着手の善悪が判断できるなら 3. 3 終盤(ヨセ)
互いに攻撃を受けるような弱石もなく,双方の領
平成8年2月
−62−
菅原英一・増永良文
ば, これらのパターンは局面認識因子として十分活 用できると言える。
以下にポテンシャル値を活用して認識可能と思わ れる局面を列挙する。
(1) 【群】の認識
. 【連】同士の連結の度合いの数値化
・ 分断狙いに対する補強箇所の発見 (2) 「勢力」や「厚み」の認識
・ 未開拓方面の認知
・ ヒラキの限界の認知
・ 敵方模様への踏み込みの限界の認知
・ 双方の模様の接触面の認知 (3) 「地合い」の認識
・ 地模様の範囲の認知
・ 地合いの概算
ただし, ポテンシャル値はそれ程厳密なものでは ないので,他の認識因子との併用によってより精度 の高い認識を目指すべきである。
4. 2. 3 ポテンシャル値の活用例
死活の単位となる【群】は複数の【連】の集合で あり, これら【連】の連結の度合いを知ることは局 面を認識する上で重要である。以下に【連】同士の 連結認識にポテンシャル値を活用した例を示す。
我々は二つの【連】AとBとの連結を考えるとき,
その最短経路に沿ったポテンシャル値の平均(連結 に要する一手当たりのポテンシャル値) を求め, こ れを【連】A, B間の連結の度合いとした。
対象とした連結パターンは図3に示す6通りのパ ターンで,二つの黒【連】の近傍に白石が存在する 場合の黒【連】同士の連結の度合いをポテンシャル 値によって数値化することを試みた。
4. 2 ポテンシャル値
盤上に着手された石には原則として活力があり,
その活力が失われない限り周囲に対して何らかの影 響力を及ぼすと仮定する。この仮定は実際の対局を 念頭に置いても決して妥当性を欠くものではなく,
その影響力が石から離れる程に弱まるという特質も 全く自然な考え方である。
我々は, この影響力の及ぶ範囲をポテンシャルの 場と呼び, その影響力の大きさをポテンシャル値と 称する数値で表すことにした2)。
4. 2. 1 ポテンシャル値の設定
着手された石から離れる程にポテンシャル値が小 さくなるということは経験的には十分納得できる が, その最適値の設定は極めて困難である。現在設 定しているポテンシャル値を図2に示すが, これも 最適という訳ではなく,実際の対局に適用したとき 人間う。レイヤとの間に局面の認識を誤らせる程のギ ャップが生じた場合は設定値の変更もあり得る。
j 7 1U 7 3
7 234023 7
) 40●40 IC 7 234023 7
3 7 10 7 閏
図2 ポテンシャル値
( 1 )コスミ (2)一間トビ
1 1 1 1 l l l l l
− − Ⅱ■■■■■■■■
なお, ポテンシャルの場に他の石が存在するとき は, それらのポテンシャル値を加算して点のポテン シャル値とする。この場合, 白黒双方のポテンシャ ルの場が近接するときは互いに干渉し合って影響力 が相殺される局面もある。このため黒石のポテンシ ャル値は正の数値で表し,反対の影響力を及ぼす白 石のポテンシャル値は負の数値で表す。
双方の石が互いに干渉し合うポテンシャルの場の 例を[付録]に示す。
4. 2. 2 ポテンシャル値の活用
ポテンシャル値は数値そのものはそれ程厳密なも のではない。 したがって, 1目, 2目を争う終盤の ヨセの段階で活用されることはなく,序盤および中 盤においての活用に限定される。
−
− ■■■■■■■■■、 − −
− − − −
l l l l l
(4)大ケイマ
− −
1 1 1 1
l l l l l l
(3)ケイマ − −
l l l l l
一 − ■■■■■■■■■ −
− − − −
− − − −
I I I I I I
(6)ハザマトビ
− 一
l l l l l
l l l l l
(5)二間トビ − −
l l l ll l
− − − ■■■■■■■■■
− − ■■■■■■■■■ −
一 − ー 一
l l l l l l
− −
I I I I I
図3 【連】の連結パターン
秋田高専研究紀要第31号
↑↓ ー ー ●lI q■■■■ー ●lI ■■■■
ー
I
● I
一
1■■■■
I
● I
一
■■■■■
I
● I
一
q■■■■
I
● I
一
ー
l
● I
ー
ー
I
● I
■■■■
ー
l
● I
一
l
● I
一
−63−
囲碁プログラムにおける戦術構築のための局面認識
得られた結果は表1の通りであるが,我々の設定 したポテンシャル値を用いた場合は,二つの【連】
間の最短経路に沿ったポテンシャル値の平均が80以 上なら手抜きでも連結が保証され, 60以下なら連結 不備により補強を要すると判断された。また,80〜60 のときは連結の保証と連結不備による補強要求が状 況に応じて現れたが,ほぼ連結と認められた。
5.おわりに
局面認識因子としてのポテンシャル値を【連】同 士の連結認識に適用し,人間プレイヤの目から見た 判断と比較したところ,連結状態の認識では90%近 くが一致したが,連結不備の認識では70%程度の一 致にとどまった。 したがって,全体としての認識は 80%程度とみるのが妥当と思われ, 【連】同士の連結 状態の目安として用いるならば,ポテンシャル値の 活用は有効と考えられる。
【連】同士の連結に関して言えば,ポテンシャル 値は絶対的な指標を与えるものではなく,現在「基 本連結パターン」 との照合による連結認識も検討中 である。
ポテンシャル値については,前述した他の認識局 面への活用も考えられ, これも今後の検討課題であ
る。
表1 ポテンシャル値による連結の度合い
以上は前述の6通りのパターンについての結果で あるが,これを実際の対局についても適用してみた。
実際の対局数局を取り上げ, 【連】間の連結の度合い をポテンシャル値を活用しての判断と人間フ・レイヤ の目から見た判断を比較した。
表2にその結果を示す。この表から,ポテンシャ ル値が80以上ならば人間プレイヤの目から見ても90
%近くが完全に連結していると認められる。 また,
60以下ならば70%以上を人間プレイヤは連結不備と 指摘していることが分かる。
参考文献
1) 菅原英一,増永良文:囲碁プログラムのオブジ ェクト指向モデル,秋田工業高等専門学校研究 紀要,No.29,pp.32‑39, (1993)
2) 実近憲昭:囲碁のコンピュータ化,bit,Vol.20, No.7,p.761〜769, (1988)
表2 人間プレイヤとの連結認識の比較
なお,ポテンシャル値が80以上でも人間プレイヤ の目から見て連結不備と判断された例としては,① 切断が即「アタリ」,②二線の切り取り,③「シチョ
ウアタリ」が在る,④「形」の急所に迫る,などが あった。 また,ポテンシャル値が60以下であっても 人間プレイヤの目から見て連結と判断された例とし ては,①定石手順の途中,②切断されても敵石の捕 獲可能,③「シボリ」の状態,④「利き筋」が在る,
などがあった。
D ZO b D 38 1C J‑ijMU
6‑20‑3C
〔付録〕ポテンシャルの場の干渉例
平成8年2月
ポテンシャル値の平均 連結の状態 80以上 完全連結(手抜き可)
80〜60 ほぼ連結〈状況次第)
60以下 連結不備(要補強)
ボ フーー ンシャル値 80以上 80〜60 60以下 人
同
完全連結 ほぼ連結 連結不備
88.6%
7.6%
3.8%
66.7%
19.4%
13.9%
12.7%
15.5%
71.8%