• 検索結果がありません。

衝立将棋における王の存在確率分布を用いた評価関数設計

N/A
N/A
Protected

Academic year: 2021

シェア "衝立将棋における王の存在確率分布を用いた評価関数設計"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

衝立将棋における王の存在確率分布を用いた評価関数設計

柴原ー友 鈴木彰 乾伸雄 小谷善行 東京農工大学 概要 不完全情報ゲームの一つに、衝立将棋があるの相手の駒に関する情報を得られないこのグームは、 情報が乏しく、探索によって解を得ることが難しい。本稿では、王の存在確率分布を設定し、その 情報量を削減する手を評価する評価関数の設計を提案する。

E

v

a

l

u

a

t

i

o

n

F

u

n

c

t

i

o

n

D

e

s

i

g

n

w

i

t

h

P

r

o

b

a

b

i

l

i

t

y

D

i

s

t

r

i

b

u

t

i

o

n

o

f

Ki

n

g

'

s

L

o

c

a

t

i

o

n

i

n

T

s

u

i

t

a

t

e

-

s

h

o

g

i

Kazutomo SHIBAHARA Akir

a

SUZUKI Nobuo INUI Y

o

s

h

i

y

u

k

i

KOTANI

Tokyo U

n

i

v

e

r

s

i

t

y

o

f

A

g

r

i

c

u

l

t

u

r

e

and T

e

c

h

n

o

l

o

g

y

k-shiba@脳ry.ei.t咽t.ac担 akira-S@脳ry.ei.tuat.acお nobu勘c.t四t.ac.jp kota凶@∞.t田.t.ac.j

Abstract

One o

f

t

h

e

i

n

c

o

m

p

l

e

t

e

i

n

f

o

r

m

a

t

i

o

n

games i

s

T

s

u

i

t

a

t

e

-

s

h

o

g

i

.

S

i

n

c

e

t

h

e

r

e

i

s

no i

n

f

o

r

m

a

t

i

o

n

a

b

o

u

t

e

n

e

m

y

'

s

pieces

,

i

t

i

s

di血c叫t

t

o

d

e

c

i

d

e

a

move by s

e

a

r

c

h

.

I

n

t

h

i

s

paper

,

we p

r

o

p

o

s

e

a

e

v

a

l

u

a

t

i

o

n

f

u

n

c

t

i

o

n

which e

v

a

l

u

a

t

e

s

t

h

e

v

a

r

i

a

t

i

o

n

o

f

i

n

f

o

r

m

a

t

i

o

n

amount o

f

t

h

e

p

r

o

b

a

b

i

l

i

t

y

d

i

s

t

r

i

b

u

t

i

o

n

s

a

b

o

u

t

k

i

n

g

'

s

e

x

i

s

t

e

n

c

e

.

1.はじめに 不完全情報ゲ}ムのーっとして、衝立将棋がある。通常の探索によって解を求める事が難しいた め、衝立将棋を行う事ができるシステムはわずかしかない。本稿では、衝立将棋において、干.の存 在確率分布を用いて評価関数を設計する方法について示すn また、将来的に人聞に匹敵できるよう にするための方法について考察する。 2. 衝立将棋 衝立将棋は相手の駒が見えない将棋である。よって、合法でない手を指してしまうことがある。 この場合、反則となり指し直しとなる。反則は 8 固まで許されるの 衝立将棋は、作悶氏によってシステム[11[4] が開発された。そのシステムは探索を行わずに指し 手を評価し決定しており、それまでの手順を考慮して評価している。また、相手の王の位置を予想 する何らかの手法を用いているが、各駒の位置予想は行っていない [4]。 チェスにおける衝立将棋であるKriegspiel では、相手の行動の結果得られる局面をーまとめに したメタ局面を使用して探索する研究が行われている[針。しかし、探索量の増加は避けられず、相 手の駒を亨.だけとして、複数の駒を使用して勝利を得る方法についての実験がほとんどであるo Krieg叩iel を完全にプレイできるシステムは開発されていない。また、王を除く少数の駒だけが見 えないチ z スである Invisible Chess においては、見えない駒の平均情報量を用いた評価関数が設 計されている [9]0 3. 存在確率分布による候補手の評価関数の設計 衝立将棋では、王を詰められるかどうかが重要である。通常の将棋と異なり、衝立将棋では駒が 相手より少なくとも、相手を詰ませたり、反則で負かせたりすることが可能である。反則は王手を 解除するときに多く発生しやすいことからも、相手の王の位置を推定することは大変重要である。

(2)

-96-本稿では、これを実現させる方法として、王の存夜確率分布を使用する方法を提案するの

3. 1.

王の存在織率分布 王の存在確率分布とは、相手の王が存在する確率を各マスに設定したものである。確率が高いほ ど玉が存在する可能性が高い。よって、その場所に対して攻撃をかける手の評価を高くすることで、 王手がかけやすくなるの存在確率分布は、手が進むごとにその情報が更新されるの 確率分布の初期値には、相手の王の位置を 1 に、他のマスを 0 に設定したものを使用するの自分 の手番となったときのフローチャートを図 1 として示した。

3

.

2

.

王の存在確事分布の更新(自分の手番) 自分の手番が回ってくるごとに、存在確率分布を更新する。このとき、それまでの着手の結果に よって更新方法が異なる n 今回は簡略化のため、直前の自分の手が王手かどうか、相手が指した手 が駒を取る手かどうかの一つだけで分類した。この一.つの組み合わせによっても処理を変えること が望ましいが、今回は行っていないロまず、直前の自分の手の処理について次に示す。 図 1 手番のときのフローチャート -王手である〈処理1) 利きが生じた地点は 1 を、その他のマスの確率には 0 をかけるのこれは確率の計算に基づいたも

" ' ュ

n u

(3)

のであるのただし、飛び駒による利きのあるマスは、飛び駒による利きをかけている駒の距離に応 じて、表 1 に示す値を乗じて確率を誠少させるn ただし、飛び駒による利きをかけている駒がその マスへより近づいた場合に限定する。ここでいう飛び駒には桂は含まれない。

表 1 飛び駒による利きの距離に対する確率分布に乗じる値

|現ぴ臨による利きの距離

11

2

1

3

1

4

1

5

1

1

5

臨率分布に乗じる値

1

o

.

o

a

o

.

s

Q

0

.

6

a

0

.

7

a

o

.

s

a

O.釧 o.鋪 0.98 o.叫

-王手でない{処理 2) 手を指した後に利きや駒のあるマスの確率に O を、その他のマスは 1 をかける。飛び駒による利 きがあるマスは、王手である場合と同様である。 両者とも、最後に確率を正規化するa 次に、相手の手による主の存在確率分布の変化を計算する。 .・駒を取る手でない{処理 4) 全マスにおいて、留まる確率を定め、残りの確率を移動可能なマスで等分配する。留まる確率は 今回 80%で固定している。ただし飛び駒による利きの場合は異なる。 飛び駒による利きのないマスに分配される量(硲率)を 1 としたときの、飛び駒による利きのあ るマスに対する分配量を表 1 に示す値にしている。重複する飛び駒による利きがある場合は、乗算 した値を使用する。 ・駒を取る手である{処理的 干.の確率分布は駒を取る手でなかった場合の計算式を、駒が取られたマスの周囲に対してだけ実 行し、そのマスへの移動分だけを更新する。今回は、飛び駒による利きのある部分は駒を取る手で ない場合と同様の処理をしている。 両者とも、最後に確率を正規化して終了する。

3. 4.

評価関数の自建計 干.の存在確率分布を使用して手を決定する方法として、平均情報量を下げる手を高く評価する手 法を提案する。平均情報量は式 1 で定義される。これによって、王の存在位置を特定できる手であ ればあるほど、価値の高い手と評価できる。具体的には式 2 で求められた値 k にある任意の値 N を掛け合わせた値を、評価値として使用する。 H= ・1:

p

J

O

g

2

Pi

(

P

i

:

i 番目のマスにおける王の存在確率) 一式 1 k=l 一手を指した後の平均情報量/手を指す前の平均情報量 一式 2 その他の評価関数は、通常の将棋システムの評価関数に加えて、自分の利きがある場所への移動 や、駒打ちを高く評価したり、駒を取った駒を動かす手や、駒を取られた位置へと移動する手を高 く評価している。特に、相手の平均情報量を大幅に減じる手は、相手の王を詰める可能性があるた め逆に取られてしまう可飽性が高い。そこで、自分の利きがある場所に指すことを評価するために、 式 1 で計算された値 k が 0.9 を越える時、利きがある場所への駒移動や駒打ちを高く評価し、逆に 利きがない場所への移動は低く評価している。 4. 実行の結果と展望 実行の結果、まず目につくのは反則の量である。特に、相手からの王手をうまく解除できず、い たずらに反則を重ねる場合が多く見られた。現在のシステムは、相手の駒がどこから王手をかけて いるのかを推測せず、王手をかけられる方向への移動や駒打ちだけを調べているのしかし、それで も現実的な最まで反則数を減らすことは難し b 、。王手を回避するための方法が必要となるだろう。 駒の確率分布を用いた結果、相手の陣地へ持駒を打ち込む手が多く見られた。これは、相手の確

(4)

-98-率分布を大きく下げることが評価されるためと思われる。しかし、探索がないため先がなく、無駄 となる可能性が高い。探索などを使用したり、相手の駒の存在位置を予測したりすることで改善で きると思われる。 また、金を左右に動かすなどの、駒を行き来させる手も多く見受けられた。確率分布が常時培え 続けることや、探索をしていないことが原因であると考えられる。 今後の展望として何より重要なことは、反則の削減であろう。また、明らかに不利な応手をして しまう可能性も高い。例として図 2 のような場合が挙げられる。 始まって数手目に図 2 に至り、王手があった場合、人聞は王手の方法が 7 七角(成}であることを 容易に推測できる。しかし、現在のシステムでは簡単ではない。正確な応手の他、攻望書回避と同時 に、以降の攻墜を避けやすくなるようにした手を指せるようにすることも重要である。

987 8 S 4 321

.

.

三な 回し 豆 、 I

I

I歩 I歩

I I I I I

l六 参 時換 歩 歩歩4除歩歩 角 豆 書t 奇跡陣l 陣 l歩l歩l歩l歩捗l七

VI

I角 I I豆 I

I I

litlI八

4書

ー量

銀金 倉 銀錘曾九 【手放 =0 まで1 図 2 王手の攻撃予想 また、王の移動に関しては、一般に序盤や、王手 がかけられたときに動かそうとする傾向がむしろ強 い。これらの性質を取り入れることで、より効果的 に王の位置を推測できると恩われる。相手の行動を みて、その設定を代えるのもよい。 今回の実験は衝立将棋プログラム作成へ向けての 第一歩である。今回、探索を用いず手の評価で動か しているため、効率的に相手王を追い詰めるような 手や、成り駒を多く作成する手は発生しなかった。 深く探索するようにすることで、これらの手が指せ るようになるだろう。 また、他の駒の確率分布も保持することで、効率的な攻めが可能になると恩われる。反則回数の 減少のほか、探索の際に、得られる価値の期待値をより正確に求められると恩われる。さらに、飛 び駒による利きによる確率変化も、より正纏に表現可能になるだろう。 6. おわりに 衝立将棋のシステムを作成し、王の存在確率分布を用いて評価値を算出する方法について提案し た。探索や他の駒の確率分布の導入により、さらに高い性能をもっシステムの作成をしていきたいの 参考文献

[

1

]

作田誠衝立将棋システムの開発.ゲーム学会第 1 回合同研究会研究報告, pp.47・50, Oct.

2

0

0

3

.

[2] 奥地秀則:衝立将棋用組クライアントA!'Tl此ate の紹介ページ(まだ未公開 k ht旬:lIwww.k.mc.gr.jp/pr吋Ituitate/i凶/

[

3

]

京大マイコンクラプ衝立将棋ホ}ムページ、 http:伽7WW.k.mC.gr.jplproj/t叫同総/

[

4

]

作閑裁:不完全情報ゲームのクライアント・サーバ型ゲームシステムと人間用クライアント およびコンピュータクライアントの開発,

GPW2003

凶 作田誠、飯田弘之:不確定性を持つ問題を解くための AND/OR 木探索ー衝立詰将棋を題材と して情報処理学会論文誌, 43(1):1・ 10, 2002. 凶 作田誠:ゲーム情報学研究の事例:不完全情報ゲーム研究の現状,情報処理学会会誌 Vol.44

N

O

.

0

9

[7] 松原仁:コンピュータ将棋の進歩 4,共立出版, 2004

[

8

]

Andrea B

o

l

o

g

n

e

s

i

and Paolo

Cian但rini

:

S

e

a

r

c

h

i

n

g

o

v

e

r

Metap組出血 in

Kri

egspie

l,

Computer and Games 2004

[

9

]

A

.

Bud

,

D.

Al

bercht

,

A

.

Nicholson

,

and

I

.

Zukerman :

I

n

f

o

r

m

a

t

i

o

n

.

t

h

e

o

r

e

t

i

c

Ad叫同国 in

I

n

v

i

s

i

b

l

e

C

h

e

s

s

.

I

n

P

r

o

c

.

A此温.cial

I

n

t

e

l

l

i

g

e

n

c

e

and S

t

a

t

i

s

t

i

c

s

2

0

0

1

参照

関連したドキュメント

 私は,2 ,3 ,5 ,1 ,4 の順で手をつけたいと思った。私には立体図形を脳内で描くことが難

これはつまり十進法ではなく、一進法を用いて自然数を表記するということである。とは いえ数が大きくなると見にくくなるので、.. 0, 1,

在させていないような孤立的個人では決してない。もし、そのような存在で

「欲求とはけっしてある特定のモノへの欲求で はなくて、差異への欲求(社会的な意味への 欲望)であることを認めるなら、完全な満足な どというものは存在しない

   遠くに住んでいる、家に入られることに抵抗感があるなどの 療養中の子どもへの直接支援の難しさを、 IT という手段を使えば

としても極少数である︒そしてこのような区分は困難で相対的かつ不明確な区分となりがちである︒したがってその

第一の場合については︑同院はいわゆる留保付き合憲の手法を使い︑適用領域を限定した︒それに従うと︑将来に

能率競争の確保 競争者の競争単位としての存立の確保について︑述べる︒