• 検索結果がありません。

オセロにおけるライバルAI の作成

N/A
N/A
Protected

Academic year: 2021

シェア "オセロにおけるライバルAI の作成"

Copied!
13
0
0

読み込み中.... (全文を見る)

全文

(1)

オセロにおけるライバルAI の作成

情報論理工学研究室 13-1-037-0101

松村憲樹

(2)

発表の流れ

研究背景と研究目的

研究内容と実験

まとめと今後の課題

参考文献

(3)

研究背景と研究目的

研究背景

昨今のオセロAIは日々進化し,トッププレイヤーにも 負けない強いAIの作成が可能なレベルになっている

人と対戦するときは強さのレベルを下げる必要がある

が,レベルを調整するのは時間がかかる

(4)

研究背景と研究目的

研究目的

対戦相手との対戦中に相手のレベルと同じレベ

” ”

ルに調整する ライバルAI を作成し,その性

能を検査する

(5)

研究内容

ライバルAI

  自分と相手の打った手から 6 手先の盤面を評

価し,相手の打った手の強さによって自分の打

つ手の強さを変えるAI

(6)

研究内容

例 黒:対戦相手 ( 先手 )  白:ライバルAI ( 後手 )

対戦相手が候補手の中から 1対戦相手が番目に評価が高い手を選択する1 番目に評価が高い手を打ってきたので,こちらも評価が 1 番高い手を打つ

(7)

研究内容

ライバル AI の性能を検査する実験 目標:勝率 5 割程度

実験 1

– ライバル AI を含めた 4 つの AI と先手後手 100 局ずつ対戦し,勝率を確認する

実験 2

10 人の人間と先手後手 10 局ずつ対戦し,勝率を確認する

(8)

研究内容

実験結果 ( 対AI戦 )

実験 1

RvlAI( 手 番 )

RndAI RvlAIAIAI

先手 74 58 62 46

後手 80 43 44 46

RvlAI :ライバルAI

RndAI :ランダムに手を打つAI

強 AI :常に最善手を打つAI 弱 AI :常に最悪手を打つAI

表1:

RvlAI

の各AIに対しての勝利数

(

試行回数100回

)

(9)

研究内容

実験結果 ( 対人戦 )

実験 2

勝率が 2~3 勝に集中している 勝率が 5~7 勝に集中している

(10)

まとめと今後の課題

まとめ

本研究では相手の手によって実力を変えるライ

バルAIを開発したが、ライバルAIは全ての

対戦相手に対して同じレベルの強さに合わせる

ことはできなかった

(11)

まとめと今後の課題

今後の課題

– 戦略の少なさ

– 人との評価基準の違い

改善方法

– 機械学習と遺伝的アルゴリズムの導入

– 定石データベースの導入

(12)

参考文献

Seal Software

:リバーシのアルゴリズム,工学社

  (2003)

上田陽平,池田心:遺伝的アルゴリズムによる人間のレベルに適応 する多様なオセロ

AI

の生成,研究報告ゲーム情報学

, Vol.2012-GI- 27, No.5, pp.1-8,

情報処理学会

(2012)

http://id.nii.ac.jp/1001/00080933/

大筆豊

,

オセロプログラムの評価関数の改善について

,

学会研究 報告ゲーム情報学

, Vol.2004-GI-11, No.4, pp.15-20,

情報処理学 会

(2004) http://id.nii.ac.jp/1001/00058554/

(13)

参考文献

久保田悠司

,

佐藤佳州

,

高 橋大 介

    ,

マルチ コアプロセスと

  SIMD

演算によるモンテカルロ木探索を用いたオセロの実装

,

研究報告

ゲーム情報学

, Vol.2009-GI-22, No.7, pp.1-8,

情報処理学会

(2009) http://id.nii.ac.jp/1001/00062419/

森田悠樹

,

橋本 剛

  ,

小 林康幸

  ,

オセロ求解に向けた

 

単純な

 

縦型 探索をベースにする探索方法の研究 ,ゲームプログラミングワーク ショップ

2010

論文集

, Vol.2010, No.12, pp.36-41,

情報処理学

 

(2010) http://id.nii.ac.jp/1001/00071311/

今田智大

,

橋本剛

,

オセロのハンディキャップに関する研究

,

ゲームプログラミングワークショップ

2012

論文集

, Vol.2012, No.

6, pp.151-154

情報処理学会

(2012)

http://id.nii.ac.jp/1001/00091345/

参照

関連したドキュメント

は対戦相手などを固定した場合の例であるため将棋の普遍 的な有利不利を論じるものではないことを明記しておく.

(「信頼」や「ガバナンス」の確保)

が40.0%であったのに対して,対戦相手の制限

詰めようと重心を右前方に移動させながら右膝を畳に着い

概要:RoboCup サッカーシミュレーションリーグ 2D において、サンプルプログラムの

レィニー言語︽ノ○

立って理解するというよりも、

今回作成した RvlAI クラス , 定石データを用いたする方法に使った Joseki クラス , につい て説明する. 次に中盤戦 , 終盤戦においても