• 検索結果がありません。

研究内容 51 オセロにおけるライバル AI の作成

N/A
N/A
Protected

Academic year: 2021

シェア "研究内容 51 オセロにおけるライバル AI の作成"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

51 オセロにおけるライバル AI の作成

情報論理工学研究室 松村 憲樹

1.

オセロ

AI

は日々進歩しており,現在のオセロ

AI

は人間のトッププレイヤーでも太刀打ちできないレ ベルに達してる.このため,人間が対戦する場合は

AI

のレベルを下げて戦うことになる.このとき,自 分の実力に合わせてレベルを設定しないと,あっさ り勝ってしまうか,逆に手も足も出ずに負けてしま うかとなり,面白い勝負ができない.ある人が適切 なレベルを見つけるには数局対戦する必要があるた め,楽しめるまで時間がかかる.

そこで本研究では,対戦中に対戦相手の実力に応 じて強さを自動調整し,対戦相手と同程度の強さと なる

AI,通称“ライバル AI”を作成する.

2.

研究内容

本研究では

Java

言語を用いて、オセロのライバル

AI(以下 RvlAI

とする)を作成する.本研究で作成す るライバル

AI

は、対戦相手の打った手の評価値の高 さによって、自身の打つ手を変える

AI

である.

RvlAI

は,各候補手に評価値を設定し,相手が評価 値の高い手を打てば自分も評価値の高い手を打ち、

評価値の低い手ならば自分も評価値の低い手を選択 することにより,相手と同程度の強さになるように する.また候補手の評価方法は、数手先の局面を先 読みし,その局面の評価値を元にαβ法を用いて算出 する.

3.

結果・考察

RvlAI

が相手と同程度の実力であるならば、どん な相手とも勝率は

5

割前後になるはずである。本研 究では性能を検証するために、ランダムに手を打つ

AI(以下 RndAI

とする),常に最善手を打つ

AI(以下

AI

とする),常に最悪手を打つ

AI(以下弱 AI)と先

手後手

100

回ずつ対戦した.その対戦における勝利 数を表1に示す.

表1とから、先手後手に関わらず一定の勝率を得 た.このことから

RvlAI

において,先手後手の有利 はないと考えられる.RvlAI

RndAI

に対する勝率 が高いのは,打つ手に一貫性がないからと考えられ る.手の良し悪しに関わらず,ランダムに手を打つ

RndAI

は打った手の評価値が大きく変動することか ら,打つ手が安定せず,RvlAI に負けることが多く なったと考えられる.それに対し,RvlAI,強

AI,

AI

に対する勝率は

4

割から

6

割だったことから,

目標である勝率

5

割程度を達成していると考えられ る.候補手の先読みを行う RndAI以外の

AI

は打つ 手に一貫性ができるので,

RvlAI

は実力を把握する ことができたことから勝率が

5

割前後になったと考 えられる.

1 : AI

同士の対戦結果

1(

試行回数

100

) RvlAI RndAI RvlAI

AI

AI

先手

74 58 62 46

後手

80 43 44 46

4.

本研究では,相手の実力と同じような強さで戦う オセロのライバル

AI

を作成した.本研究で作成した

RvlAI

RndAI,強 AI,弱 AI

に対戦した結果,目 標である全ての対戦相手に対して,勝率5割程度に することはできなかった.よってプログラムに改善 する必要があると考えられる.改善点として,評価 基準をより人間の思考に寄せるために,人と対戦す ることでそこから学習させる機械学習の実装や,遺 伝的アルゴリズムの採用をすることで対戦相手によ ってより多彩な戦略を持たせることによる勝率の安 定などが挙げられる.また,定石のデータベースを 取り入れることや前半と後半で評価基準を変えるこ とも課題の一つである.

参考文献

1) Seal Software:リバーシのアルゴリズム,工学社

(2003)

2)

上田陽平,池田心:遺伝的アルゴリズムによる人間 のレベルに適応するオセロAIの生成,情報処理学会 研究報告 Vol.2012-GI-27, No.5 (2012)

参照

関連したドキュメント

看板,商品などのはみだしも歩行速度に影響をあたえて

そのため本研究では,数理的解析手法の一つである サポートベクタマシン 2) (Support Vector

詳細情報: 発がん物質, 「第 1 群」はヒトに対して発がん性があ ると判断できる物質である.この群に分類される物質は,疫学研 究からの十分な証拠がある.. TWA

 私は,2 ,3 ,5 ,1 ,4 の順で手をつけたいと思った。私には立体図形を脳内で描くことが難

と言っても、事例ごとに意味がかなり異なるのは、子どもの性格が異なることと同じである。その

 リスク研究の分野では、 「リスク」 を検証する際にその対になる言葉と して 「ベネフ ィッ ト」

FSIS が実施する HACCP の検証には、基本的検証と HACCP 運用に関する検証から構 成されている。基本的検証では、危害分析などの

   遠くに住んでいる、家に入られることに抵抗感があるなどの 療養中の子どもへの直接支援の難しさを、 IT という手段を使えば