オセロにおけるライバルＡＩの作成

(1)

オセロにおけるライバルＡＩの作成

情報論理工学研究室 13-1-037-0101

松村憲樹

(2)

発表の流れ

●

研究背景と研究目的

●

研究内容と実験

●

まとめと今後の課題

●

参考文献

(3)

研究背景と研究目的

研究背景

昨今のオセロＡＩは日々進化し，トッププレイヤーにも負けない強いＡＩの作成が可能なレベルになっている

↓

人と対戦するときは強さのレベルを下げる必要がある

が，レベルを調整するのは時間がかかる

(4)

研究背景と研究目的

研究目的

対戦相手との対戦中に相手のレベルと同じレベ

” ”

ルに調整するライバルＡＩを作成し，その性

能を検査する

(5)

研究内容

ライバルＡＩ

　自分と相手の打った手から 6 手先の盤面を評

価し，相手の打った手の強さによって自分の打

つ手の強さを変えるＡＩ

(6)

研究内容

例黒：対戦相手 ( 先手 ) 　白：ライバルＡＩ ( 後手 )

対戦相手が候補手の中から 1対戦相手が番目に評価が高い手を選択する1 番目に評価が高い手を打ってきたので，こちらも評価が 1 番高い手を打つ

(7)

研究内容

ライバル AI の性能を検査する実験目標：勝率 5 割程度

●

実験 1

– ライバル AI を含めた 4 つの AI と先手後手 100 局ずつ対戦し，勝率を確認する

●

実験 2

–

10 人の人間と先手後手 10 局ずつ対戦し，勝率を確認する

(8)

研究内容

実験結果 ( 対ＡＩ戦 )

実験 1

RvlAI( 手番 )

RndAI RvlAI 強 AI 弱 AI

先手７４５８６２４６

後手８０４３４４４６

RvlAI ：ライバルＡＩ

RndAI ：ランダムに手を打つＡＩ

強 AI ：常に最善手を打つＡＩ弱 AI ：常に最悪手を打つＡＩ

表１：

RvlAI

の各ＡＩに対しての勝利数

(

試行回数１００回

)

(9)

研究内容

実験結果 ( 対人戦 )

実験 2

^勝率が ^2~3 ^{勝に集中している} ^勝率が ^5~7 ^{勝に集中している}

(10)

まとめと今後の課題

まとめ

本研究では相手の手によって実力を変えるライ

バルＡＩを開発したが、ライバルＡＩは全ての

対戦相手に対して同じレベルの強さに合わせる

ことはできなかった

(11)

まとめと今後の課題

●

今後の課題

– 戦略の少なさ

– 人との評価基準の違い

●

改善方法

– 機械学習と遺伝的アルゴリズムの導入

– 定石データベースの導入

(12)

参考文献

●

Seal Software

：リバーシのアルゴリズム，工学社

　 (2003)

●上田陽平，池田心：遺伝的アルゴリズムによる人間のレベルに適応する多様なオセロ

AI

の生成，研究報告ゲーム情報学

, Vol.2012-GI- 27, No.5, pp.1-8,

情報処理学会

(2012)

http://id.nii.ac.jp/1001/00080933/

●大筆豊

,

オセロプログラムの評価関数の改善について

,

学会研究報告ゲーム情報学

, Vol.2004-GI-11, No.4, pp.15-20,

情報処理学会

(2004) http://id.nii.ac.jp/1001/00058554/

(13)

参考文献

●久保田悠司

,

佐藤佳州

,

高橋大介

　　 ,

マルチコアプロセスと

　 SIMD

演算によるモンテカルロ木探索を用いたオセロの実装

,

研究報告

ゲーム情報学

, Vol.2009-GI-22, No.7, pp.1-8,

情報処理学会

(2009) http://id.nii.ac.jp/1001/00062419/

●森田悠樹

,

橋本剛

　 ,

小林康幸

　 ,

オセロ求解に向けた

　

単純な

　

縦型探索をベースにする探索方法の研究 ,ゲームプログラミングワークショップ

2010

論文集

, Vol.2010, No.12, pp.36-41,

情報処理学

　

会

(2010) http://id.nii.ac.jp/1001/00071311/

●今田智大

,

橋本剛

,

オセロのハンディキャップに関する研究

,

ゲームプログラミングワークショップ

2012

論文集

, Vol.2012, No.

6, pp.151-154

情報処理学会

オセロにおけるライバルＡＩ の作成

オセロにおけるライバルＡＩ の作成

情報論理工学研究室 13-1-037-0101

松村憲樹

発表の流れ

研究背景と研究目的

研究内容と実験

まとめと今後の課題

参考文献

研究背景と研究目的

研究背景

昨今のオセロＡＩは日々進化し，トッププレイヤーにも 負けない強いＡＩの作成が可能なレベルになっている

↓

人と対戦するときは強さのレベルを下げる必要がある

が，レベルを調整するのは時間がかかる

研究背景と研究目的

研究目的

対戦相手との対戦中に相手のレベルと同じレベ

” ”

ルに調整する ライバルＡＩ を作成し，その性

能を検査する

研究内容

ライバルＡＩ

自分と相手の打った手から 6 手先の盤面を評

価し，相手の打った手の強さによって自分の打

つ手の強さを変えるＡＩ

研究内容

例 黒：対戦相手 ( 先手 ) 白：ライバルＡＩ ( 後手 )

研究内容

ライバル AI の性能を検査する実験 目標：勝率 5 割程度

実験 1

– ライバル AI を含めた 4 つの AI と先手後手 100 局ずつ対戦し，勝率を確認する

実験 2

10 人の人間と先手後手 10 局ずつ対戦し，勝率を確認する

研究内容

実験結果 ( 対ＡＩ戦 )

実験 1

RvlAI( 手 番 )

RndAI RvlAI 強 AI 弱 AI

先手 ７４ ５８ ６２ ４６

後手 ８０ ４３ ４４ ４６

RvlAI ：ライバルＡＩ

RndAI ：ランダムに手を打つＡＩ

強 AI ：常に最善手を打つＡＩ 弱 AI ：常に最悪手を打つＡＩ

RvlAI

(

)

研究内容

実験結果 ( 対人戦 )

実験 2

まとめと今後の課題

まとめ

本研究では相手の手によって実力を変えるライ

バルＡＩを開発したが、ライバルＡＩは全ての

対戦相手に対して同じレベルの強さに合わせる

ことはできなかった

まとめと今後の課題

今後の課題

– 戦略の少なさ

– 人との評価基準の違い

改善方法

– 機械学習と遺伝的アルゴリズムの導入

– 定石データベースの導入

参考文献

Seal Software

(2003)

AI

, Vol.2012-GI- 27, No.5, pp.1-8,

(2012)

http://id.nii.ac.jp/1001/00080933/

,

,

, Vol.2004-GI-11, No.4, pp.15-20,

(2004) http://id.nii.ac.jp/1001/00058554/

参考文献

,

,

,

SIMD

,

オセロにおけるライバルＡＩの作成

オセロにおけるライバルＡＩの作成

昨今のオセロＡＩは日々進化し，トッププレイヤーにも負けない強いＡＩの作成が可能なレベルになっている

ルに調整するライバルＡＩを作成し，その性

　自分と相手の打った手から 6 手先の盤面を評

例黒：対戦相手 ( 先手 ) 　白：ライバルＡＩ ( 後手 )

ライバル AI の性能を検査する実験目標：勝率 5 割程度

RvlAI( 手番 )

先手７４５８６２４６

後手８０４３４４４６

強 AI ：常に最善手を打つＡＩ弱 AI ：常に最悪手を打つＡＩ

　 (2003)

　　 ,

　 SIMD

　 ,

　 ,