• 検索結果がありません。

オセロでコンピュータが人間に勝つための思考アルゴリズムの研究

N/A
N/A
Protected

Academic year: 2021

シェア "オセロでコンピュータが人間に勝つための思考アルゴリズムの研究"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

オセロでコンピュータが人間に勝つための思考アルゴリズムの研究

知能機械システム工学科 環境機械・材料強度研究室 近藤 浩久

1.緒言

人間とコンピュータがなんらかの思考ゲームにおいて対 戦をする場合、人間はどのようにすれば、得をすることがで きるのか考えることができる。しかし、コンピュータは当然 のことながら、考え方のプログラムをあらかじめ設定してあ げなくてはならない。

本研究は、コンピュータが人間に、オセロゲームで勝つには どのような方法でプログラムを組めばいいのか、また、どの ような思考アルゴリズムを組めば、強いオセロプログラムを つくることができるのかを研究する。

2.思考アルゴリズムの考え

今回、私はオセロの思考プログラムを組むにあたって、ミ ニマックス法というやり方を使う事にした。この方法は、あ るものに評価を与え、それがプラスならば自分に有利、マイ ナスならば自分に不利とう考え方である。今回は、評価を数 字で表し数字が大きいほうが有利という考え方をしている。

イメージ図としては、図.1のようになる。

・探索方法

H-0

C-2

H-1-1 H-1-3

C-1

C-1-1-1 C-1-1-2 C-1-1-3 ・・・・・・・・・・・・・・・・・・・・

H-1-2 -2 H-人間

C-コンピュータ

-2 5 8

-8

-2

-8 -5

最小値を返す

最大値を返す

1.

探索方法

.1

の説明として、

H

枠が人間・

C

枠がコンピュータであ り、また、枠の外側にかいてある数字がその枠の評価値であ る。今回、気をつけなくてはならなのが、この枠の評価値は、

盤面全体の評価値ということである。

つまり、いくつも石が置けるマスがあり、そのあるマスに石 を置いたときにできる盤面全体の変化にともなう評価であ り、石を置くことができる各マスの評価では無いということ である。

次に、探索方法だが、縦型探索という考え方を使用し、盤面 全体の評価を5手先まで読むようにした。そこで、5手先ま で読み、それぞれの盤面で石を置いたときの盤面全体の評価 をだしたわけだが、その中でどの盤面が一番自分に有利なの か?というところで、ミニマックス法を用いた。

3.ミニマックス法

ミニマックス法の考え方をオセロゲームに使った場合、次 のような考え方になる。

図.1の枠外に書かれている数字は、人間から見た評価であ

り、数値が大きいほど人間にとって有利、数値が低いほど人 間にとって不利なわけである。この事から、相手が最善の手 をさしてくると想定すると、コンピュータから人間に返す場 合は、最小値(人間に不利な手)をとり、人間からコンピュ ータに返す場合は、最大値(人間に有利な手)をとるのであ る。

4.盤面全体の評価

盤面全体の評価の出しかただが、オセロの盤面は縦8列、横 8行の8列×8行の正方形でなりたっている。

その1マス1マスに、それぞれのマスに個別の評価値を与え る事にした。各マスの評価の与え方は表.1で示す。

表1

.

オセロ盤の各マスの評価

1

の評価の与え方としては、端をとると有利なので、その 部分の評価を、評価の最大値(50)を与える事にし、4隅に石 を置くためには、4隅の2つ隣に石を置いていると挟みやす いと考え、その枠には2番目に大きい評価(10)を与えた。

この評価を元にして、石を置いたときの盤面全体の評価をだ す。盤面全体評価の出し方は、黒石のとき

1、白石のとき-1、

何も置いてないときは

0

として以下の計算プログラムより 求めた。

(

計算式は、

for

分を使いすべてのマスにおいて計算している

)

V

= V + 黒石(1)or白石(-1) × マスの評価 -(1)

(V

:基盤全体の評価

)

これに加え、ゲーム終盤では石を多く取ったほうが有利とう 考えから、以下の計算式と置き換えた。

+

黒石

(1)or

白石

(-1)

(2) (Q:終盤時の基盤全体の評価) 5.結言

現在プログラムは、人間とコンピュータの対戦ができるま でには、完成している。

今後は、一般に発売されているオセロゲームと対戦をさせ、

評価盤の計算式やオセロのアルゴリズムを研究していきた いと考えている。

6.参考文献

省略

50 -10 10 -1 -1 10 -10 50

-10 -20 -1 -5 -5 -1 -20 -10

10 -1 5 -1 -1 5 -1 10

-1 -5 -1 0 0 -1 -5 -1

-1 -5 -1 0 0 -1 -5 -1

10 -1 5 -1 -1 5 -1 10

-10 -20 -1 -5 -5 -1 -20 -10

50 -10 10 -1 -1 10 -10 50

参照

関連したドキュメント

「ヨーロッパ人と異なり、彼らは悲嘆や不 平、あるいは窮状を語っても、感情に走らな

323 電聖戦でコンピュータと対戦して  人間はその場面での最善手を打とうとするのに対 し,Crazy

ケースバイケースな意思 Active 情 報_のプール & 活性化待機制御 ①意思 Active 情報のプール&最適配置

期利潤を制限しつつ,利潤を極大にするように・考慮されるからである0   

EM 法では暫定パラメータ $\theta’$ が与えられたもとで $Q$ 関数を算出す るステップ ( $E$ ステップ) と , それを最大にする

先にフントの場合「人間学」における身体および解剖学への関心は,もっぱら人間の

利益とが必ずしも‑致せず、しかも道舶用さの方が、人間にとって決定的に重要なことだとす

「食愛の心」を昧らひつつ仏活成就に努力してもそれが完全に満されると昧衰えられて