オセロにおけるライバルAI の作成
情報論理工学研究室 13-1-037-0101
松村憲樹
発表の流れ
●
研究背景と研究目的
●
研究内容と実験
●
まとめと今後の課題
●
参考文献
研究背景と研究目的
研究背景
昨今のオセロAIは日々進化し,トッププレイヤーにも 負けない強いAIの作成が可能なレベルになっている
↓
人と対戦するときは強さのレベルを下げる必要がある
が,レベルを調整するのは時間がかかる
研究背景と研究目的
研究目的
対戦相手との対戦中に相手のレベルと同じレベ
” ”
ルに調整する ライバルAI を作成し,その性
能を検査する
研究内容
ライバルAI
自分と相手の打った手から 6 手先の盤面を評
価し,相手の打った手の強さによって自分の打
つ手の強さを変えるAI
研究内容
例 黒:対戦相手 ( 先手 ) 白:ライバルAI ( 後手 )
対戦相手が候補手の中から 1対戦相手が番目に評価が高い手を選択する1 番目に評価が高い手を打ってきたので,こちらも評価が 1 番高い手を打つ
研究内容
ライバル AI の性能を検査する実験 目標:勝率 5 割程度
●
実験 1
– ライバル AI を含めた 4 つの AI と先手後手 100 局ずつ対戦し,勝率を確認する
●
実験 2
–
10 人の人間と先手後手 10 局ずつ対戦し,勝率を確認する
研究内容
実験結果 ( 対AI戦 )
実験 1
RvlAI( 手 番 )
RndAI RvlAI 強 AI 弱 AI
先手 74 58 62 46
後手 80 43 44 46
RvlAI :ライバルAI
RndAI :ランダムに手を打つAI
強 AI :常に最善手を打つAI 弱 AI :常に最悪手を打つAI
表1:
RvlAI
の各AIに対しての勝利数(
試行回数100回)
研究内容
実験結果 ( 対人戦 )
実験 2
勝率が 2~3 勝に集中している 勝率が 5~7 勝に集中しているまとめと今後の課題
まとめ
本研究では相手の手によって実力を変えるライ
バルAIを開発したが、ライバルAIは全ての
対戦相手に対して同じレベルの強さに合わせる
ことはできなかった
まとめと今後の課題
●
今後の課題
– 戦略の少なさ
– 人との評価基準の違い
●
改善方法
– 機械学習と遺伝的アルゴリズムの導入
– 定石データベースの導入
参考文献
●
Seal Software
:リバーシのアルゴリズム,工学社(2003)
●上田陽平,池田心:遺伝的アルゴリズムによる人間のレベルに適応 する多様なオセロ
AI
の生成,研究報告ゲーム情報学, Vol.2012-GI- 27, No.5, pp.1-8,
情報処理学会(2012)
http://id.nii.ac.jp/1001/00080933/
●大筆豊
,
オセロプログラムの評価関数の改善について,
学会研究 報告ゲーム情報学, Vol.2004-GI-11, No.4, pp.15-20,
情報処理学 会(2004) http://id.nii.ac.jp/1001/00058554/
参考文献
●久保田悠司
,
佐藤佳州,
高 橋大 介,
マルチ コアプロセスとSIMD
演算によるモンテカルロ木探索を用いたオセロの実装,
研究報告ゲーム情報学
, Vol.2009-GI-22, No.7, pp.1-8,
情報処理学会(2009) http://id.nii.ac.jp/1001/00062419/
●森田悠樹
,
橋本 剛,
小 林康幸,
オセロ求解に向けた単純な
縦型 探索をベースにする探索方法の研究 ,ゲームプログラミングワーク ショップ
2010
論文集, Vol.2010, No.12, pp.36-41,
情報処理学会
(2010) http://id.nii.ac.jp/1001/00071311/
●今田智大
,
橋本剛,
オセロのハンディキャップに関する研究,
ゲームプログラミングワークショップ