• 検索結果がありません。

ニューラルネットワークを用いた詰将棋評価実験

N/A
N/A
Protected

Academic year: 2021

シェア "ニューラルネットワークを用いた詰将棋評価実験"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

ニューラルネットワークを用いた詰将棋評価実験

春日利文

k

a

s

u

g

a@

f

a

i

r

y

.

e

i

.

t

u

a

t

.

a

c

.

j

p

鈴木豪 go@failγ.ei.tuat.ac.jp 小谷善行

k

o

t

a

n

i

@

c

c

.

t

u

a

t

.

a

c

.

j

p

東京農工大学

概要

詰将棋は日本に古くから伝わるパズルゲームの一つで、それは問題としてだ けではなく、その芸術としても扱われている。本研究では、自動的に詰将棋の 芸術的な評価を行う方法を実験した。いくつかの静的な要素を定め、ニューラ ルネットワークを用いてその要素と詰将棋に付けられた評価との関係を学習 させ、未知の詰将棋を評価する。

E

v

a

l

u

a

t

i

o

n

o

f

T

s

u

m

e

-

s

h

o

g

i

w

i

t

h

t

h

e

N

e

u

r

a

l

Network

T

o

s

h

i

n

o

r

i

KASUGA

k

a

s

u

g

a

@

f

a

i

r

y

.

e

i

.

t

u

a

t

.

a

c

.

j

p

T

s

u

y

o

s

h

i

SUZUKI

g

o

@

f

a

i

r

y

.

e

i

.

t

u

a

t

.

a

c

.

j

p

N

・叩

1AM 品 I ・ O 刷

k

u

-E-F しW L 区 ap-­ HME 噌bJ 岬'以川 1 rhm e-M 宮山期

尚刷

T

o

k

y

o

U

n

i

v

.

o

f

A

g

r

a

.

i

n

d

T

e

c

h

.

2-24・ 16

Nakamachi

,

Koganei

,

T

o

k

y

o

.

JAPAN

A

b

s

t

r

a

c

t

We p

r

o

p

o

s

e

a

n

o

b

j

e

c

t

i

v

e

m

e

t

h

o

d

o

f

a

p

p

r

o

x

i

m

a

t

i

n

g

t

h

e

a

u

t

o

m

a

t

i

c

e

v

a

l

u

a

t

i

o

n

o

f

t

s

u

m

e

-

s

h

o

g

i

p

r

o

b

l

e

m

s

t

o

human s

e

n

s

e

.

We u

s

e

t

h

e

n

e

u

r

a

l

network

,

w

h

i

c

h

l

e

a

r

n

s

a

r

e

l

a

t

i

o

n

b

e

t

w

e

e

n

t

h

e

f

a

c

t

o

r

s

a

n

d

t

h

e

e

v

a

l

u

a

t

i

o

n

v

a

l

u

e

o

f

tsume・shogi.

We s

h

o

w

t

h

a

t

o

u

r

s

y

s

t

e

m

e

v

a

l

u

a

t

e

d

t

h

e

u

n

k

n

o

w

n

t

s

u

m

e

-

s

h

o

g

i

p

r

o

b

l

e

m

s

.

1 はじめに 詰将棋は日本に古くから伝わるパズルゲーム の一つである。詰将棋の作品は、パズルの問題 としてだけではなく、芸術として扱われている。 本稿では、システムが詰将棋を自動的に学 習・評価を行うことを目的としている。そのた めに、いくつかの静的な評価要素を決め、その 作品につけられた評価点との関係を求める必要 カfある。その手t支としてニューラルネットワー クを JlIし、た。学i押させる詰将棋の題材として、 「詰将棋パラダイス J (全日本詰将棋連盟機関 誌)を用いる。「詰将棋ノ f ラダイスJ では毎月多 くの投f剖乍品カf紹介されており、長手数な問題 や短手数だが難解な問題なと市首が広い。本研究 では短手数の問題とその問題につけられた評価 点を使用する。 n u

(2)

2 階層型ニューラルネットワーク

階層型ニューラルネットワークは 1958 年に 提案された学習アルゴリズムである。ネットワ ークはいくつかの層からなる階層的なものであ り、各層はいくつかのユニットから構成されて いる。層内での結合はなく、府と層の問の結合 は入力から出力に向けて結合されている。斤えj を入出力関数、院を前の層のj 番目のユニット と現在の層の i 番目の結合の重み、 (1; を現在の 層の I 番目のユニットのしきい値とすると、出 力 0,は次の式で求めることができる。

0

,

=

f

(

l

;

)

I,=ヱ門 0,

-

(

}

;

f

(

x

)

=

.

_ 1

1

+

e

x

p

(

-

x

)

学習をする方法として、パックプロパゲーシ ヨン(誤差逆伝捕法)を使用する。ネットワーク を実際に動かし、出力値と実際の差を求め、そ の差を小さくするように結合の重みを変えてい く学習方法である。 学習効果をあげるために、学習定数を E 、安 定化定数を σ として次の式で与えられる。 I は 修正の I'!I数をぷす。 ~W"

(

t

)

=

-

e

d

P

;

+ α企WiJ(t

-1)

d

;

=

/,(1,)エ d, w!i

入力I語 中 13jl沼 出力層

:〉小力値

図 l ニューラルネットワーク -102-本研究では、入力層には局面から計算された 評価要素が入札中間層を経て、出力層からは 局面の評価値を出力する全結合で 3 層からなる ニューラルネットワークを使用した(図 1 )。

3 評価要素

ネットワークの入力層に与える詰将棋の評価 要素として次のものを用意した。 -盤上の駒について .問題図での攻め方の各駒種の枚数 .問題図での玉方の各種駒の枚数 -詰上り図での攻め方の各駒種と枚数 .詰上り図での玉方の各駒種と枚数 ・問題陪lの攻め方の持駒である各駒植の枚数 .玉の1M りについて -問題凶の玉の八近傍にある駒の枚数 -詰上り図の玉の八近傍にある駒の枚数 .捨て駒 ・持駒を打って捨てた各駒種と回数 -駒を移動させ次の手で取られた各駒種 と回数 -聞き王手の回数 ・ IdljE 干の|叫数 -詰手数 ・不成りの同数 以上の要素のほかに、ニューラルネットワー クではしきい値 (1; のために、常に 1 をとるユニ ットがある。したがって、次の要素を用意した。 -定数 l

(3)

4 実験と結果

4.1 実験の目的 本研究の目的は線形和では表現できない評価 関数を実現することである。 4.2 使用した詰将棋 今回の実験で用いた詰将棋の教師用データは、 「詰将棋パラダイスj の幼稚園・小判交の部門 に掲載されていた作品 143 題と、その作品につ けられた評価点を使用した。また、テストデー タとして、「詰将棋パラダイス」の 1997.3月号 に掲載されている短編コンクールの結果より、 問題図 41 題とその評価点を使用した。ただ、し、 ここでm いた評価点は、読者のうち A(3 点)・ 二乗誤差 4 0.35t一一一一一一一一一一一一一一一一一一一一一一一一 且 3 t-一一一一一一一一一ー 0.25 0.2 二乗誤差 0.35 0.3 0.2 1001 2001 3001 4001 -ーー-UNITIO 学習回数 ーーー UNIT20 0.15

1-\一一

一一→

0.1 0.05 0 1001 2001 3001 4001 学習回数 図 2 ユニット数と誤差推移 8(2 点)・c( 1 点)と評価したそれぞれの人数を A'B'C としたとき、次の式で与えられたもの のことである。、

(

3

*

A

+

2

*

B

+

C)

Val=

3 本 (A+B+C) 4.3 誤蓋推移 学習する回数を 5000 回、中間ユニット数を 10 と 20 の二通りを用意して、誤差推移を調べ た(図 2)。学習後の教師用データとの標準偏差は、 中間層 10 のとき 0.024、中間層 20 のとき 0訓 5 であった。 4.4 最小二乗法との比較 ニューラルネットワークで使用した評価要 素・教Oili値データを用いて、最小二乗法で学習 させた。教師用データとの標準偏差は 0.01 であ った。 それぞれのアルゴリズムで学習した重みを用 いて未知l の詰将棋を評価する実験を行った(表 1)。未知のデータでの評価実験では、中間層の ユニット数が 10 のネットワークを用いたとき の標準偏差は 0.129、ユニット数が 20 のときの 標準偏差は 0.080 であった。また、最小二乗法 のときの標準偏差は 0.187 で、あった。 表 I 各アルゴリズムの出力と評価点の例

No

U

n

i

tl

O

U

n

it

2

0

最小一来i会 True

0

.

6

6

0

0

.

6

6

2

0

.

7

3

7

0

.

6

7

5

2

0

.

6

0

3

0

.

6

4

0

0

.

5

9

7

0

.

6

1

1

3

0

.

5

2

1

0

.

5

3

0

0

.

5

8

2

0

.

54

9

4

0

.

7

2

4

0

.

7

4

3

0

.

6

6

8

0

.

6

2

6

5

0

.

6

2

3

0

.

6

6

8

0

.

6

9

4

0

.

6

6

3

6

0

.

7

2

0

0

.

7

2

4

0

.

7

2

6

0

;

7

5

3

7

0

.

5

8

1

0

.

6

4

9

0

.

4

0

8

0

.

6

8

5

8

0

.

7

0

9

0

.

7

1

4

0

.

7

1

3

0

.

6

7

6

9

0

.

6

6

9

0

.

6

7

1

0

.

6

7

3

0

.

6

8

9

1

0

0

.

6

9

9

0

.

7

5

0

0

.

6

5

6

0

.

8

4

4

(4)

-103-5 考察

ニューラルネットワークを用いた詰将棋の評 価関数を作成し、中間層のユニット数を 10 と 20 で、学習実験を行ったが、ユニット 10 の学習 中で、誤差が大きく広がったが、最終的には誤 差は 0 に収束した。学習データとの誤差は最小 二乗法とあまり変わらなかった。 テストデータを用いて、未知の詰将棋を評価 する実験では、中間層のユニット数 10、ユニッ ト数 20 のニューラルネットワークの方が、最小 二乗法よりも標準偏差が小さくなったが、その 差はわずか 0.1 ほどなので、ニューラルネット ワークの方がいし、とは言い難い。

6 おわりに

本稿は、詰将棋の静的な嬰素を決め、 3 層か らなるニューラルネットワークを利用した自動 的に学習・評価を行うシステムを製作し、実験 を行った。

参考文献

[1] 松崎{仁,半田剣一,元吉文男."コンピュー タを用いた詰将棋の評価と分析第 32 回プログ ラミングシンポジウム, pp.155-164, 199 1. [2] 松原仁: f コンビュータ将棋の進歩j,共 立出版, 1996. [3] 小谷善行,吉川竹四郎,柿木義二森田 和郎: W コンビュータ将棋J ,サイエンス社, 1990.

[

4

]

T

o

s

h

i

n

o

r

i

KASUGA

,

T

s

u

y

o

s

h

i

SUZUK1

,

Y

o

s

h

i

y

u

k

i

KOTANI: "

E

v

a

l

u

a

t

i

o

n

o

f

T

s

u

m

e

-

s

h

o

g

i

w

i

t

h

t

h

e

Me出odofL伺st SquaJザ,

C

o

m

p

l

e

x

Games

L

a

b

Workshop

,

pp.22・27,

N

o

v

e

m

b

e

r

10

,

1998.

参照

関連したドキュメント

究機関で関係者の予想を遙かに上回るスピー ドで各大学で評価が行われ,それなりの成果

We traced surfaces of plural fabrics that differ in yarn, weave and yarn density with the tactile sensor, and measured variation of the friction coefficients with respect to the

Fig.5 The number of pulses of time series for 77 hours in each season in summer, spring and winter finally obtained by using the present image analysis... Fig.6 The number of pulses

これらの実証試験等の結果を踏まえて改良を重ね、安全性評価の結果も考慮し、図 4.13 に示すプロ トタイプ タイプ B

*Windows 10 を実行しているデバイスの場合、 Windows 10 Home 、Pro 、または Enterprise をご利用ください。S

本稿で取り上げる関西社会経済研究所の自治 体評価では、 以上のような観点を踏まえて評価 を試みている。 関西社会経済研究所は、 年

具体的な取組の 状況とその効果 に対する評価.

地形、地質の状況 を基に評価しました