The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 1 -
人を楽
接待将棋
Entertainment Shogi AI Programs
仲
隆史
*1
伊藤
毅志
*1 Takafumi NAKAMICHI Takeshi ITO
*1
電気通信大学
情報理工学研究
情報
通信工学専攻
Department of Communication Engineering and Informatics, The University of Electro-Communications, Japan
Shogi AI programs have been increasing capable of matching professional players and too powerful for most amateur players. Human cannot feel agency from agents’ moves, when they are far from player’s level. We developed an entertainment shogi AI program that adapts it differently to each opponent by selecting a move whose evaluation is closest to zero. The experimental results showed that the proposed shogi AI is capable of adapting to each opponent and it is effective for reducing unreasonable moves and making the games fun.
1.
はじめに
HAI(Human Agent Interaction) い ,使用者 ソ
ン を感 使用感 向
報 告 い 一 方 タ い 対 戦 相
手 AI 人 間 を 見 出 あ ,FPS(First Person
Shooting 呼ば 一人称視 点 ン
ン ) い ,人間 を感 AI 対戦時 ,そう
いAI 比較 体験 楽 い いう
実験 示 い [Soni 2008]
人工知能 初期 強い AI を作成 研究
行わ ,近 タ 体験を 楽 い
,AI 人間 を実現 研究 対象
い 実 FPS,platformer( ンプ 動作を基
本 ン ン ), 碁 い AI
人間 を競う大会 行わ ,FPS い 2012 大
会 ,人間以 人間 い 評価 AI 出現
,近 将棋 AI 動向 ,2013 第2
回電王戦 プ 棋士5 対局 行わ ,将棋AI 3勝
1 敗 1 勝 越 結果 う ッププ 実力
接 近 い 言 わ ,強 研究 十 行 わ
次 チ を 対 象 熟 支 援 や ン タ
ン ン 将棋AIを応用 を考え ,将棋
い 対戦 人間を楽 AIや人間 いAI 研
究 必要
2012 行わ FPS 人間 を競うBotPrize 人間
均 あ 41.4%を超え,51.9% 人間 断 UT^2 ,
人間 操作 キ タ 置 相互作用を含 動作 記録
を 人 間 を実現 [Karpov 2012] 一方
将棋AI 強 を目的 ,2006 以来プ や
チ 高段者 棋譜を教師 学習 作成 評価
関数を用い 棋力を [保木 2006] 近 将棋 AI
選択 指 手 人間 考え 最善手 一致 多
, 棋 力 時代 比 較 人 間 言 わ
い , 複 雑 詰 を指 向 , 人 間 高 度
指 手 を指 , ン タ い指 手 呼
ば う 観測者 強 指 手 ,池
類 自然 指 手 含 ,特 チ プ
を 対 象 接 待 将 棋 実 現 い 害 [池
2013] , 将 棋 い チ 級 者 棋 譜 対 局
者 AI 人間 を 定 研究 い , チ 群
対 プ 棋士群 一致 指 手 自然 を言及
人間 い 評価 棋譜 確 ,逆 弱
プ 指 手を理解 人間 い 回答
あ [仲 2013] う 将棋 AI い 人間
振 舞 い 機 械学 習 人 間 を実 現 い い
人間 振 舞 いを模 ,人間 振 舞 い
対 知過 程 を考 慮 人間 い 感 機 構
必要 考え
人間 他者 振 舞い そ 性質 状態を理解 う
知過程 , そ 対象 対 ン を感 影
響を及 いう知見 有 他者 振 舞い理解 用
い ,そ 他者 心的状態 現 意
心的状態を帰属 意 タン ,物理的 法則性 帰属
物理 タン ,設計 基 法則性 帰属 設計 タン ,
複 雑 理 解 予測 い複雑 タン ,4
タン 存在 心理学的実験 示 い [寺 2012] 競
合 い ン 裏 戦略を 意
タ ン 用 意 推 定 思 考 変 化 発 生
確 , タ ン 対 戦 相 手 戦
略 推定 い 適用 [寺 2012]
棋 力 差 意 を 理 解 い指 手 を人
間 い 回 答 原 因 ,意 タン 解釈
考え 高度 複雑 手 指 手 ,観測
者 常識的 必然手を逃 指 手 ,そ 選択 意 を
理解 ,意思を持 い ン タ 手 断
う 考え AI 指 手を自然 手,人間 い手 断
, 理解 要 求 棋力 離 い い,
程度 棋力 指 手を返 考え そ 本研究 ,
棋 力 合 わ 単 純 手 法 を実 装 接 待 将 棋 AI
を用 い , 程度 調 整 指 手 自然 を軽 減 ,
楽 を実現 出来 い ,棋力を調整
ン を損 い, 自 然 感 指 手 存 在
場合,そ 指 手 う 要素を持 検討
2.
接待将棋システム
本研究 将棋 AI ン を持 を目的
, 棋力 合わ 接待将棋AIを作成 ,
連絡先:仲 隆史,電気通信大学情報 通信工学専攻,東京
都調 調 ヶ丘1-5-1,[email protected]
The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014
- 2 -
棋 力 調 整 自然 軽 減 や楽 出 来
検証 ,接待将棋 AIを国 ネッ 将棋対局場 81Dojo
,対局 ン 変動 い 対局用 bot
運 用を行 ,思考 時間 長短 や変化
ン 知覚 影響を え 指摘 い [池 2013]
指 手以外 ン 知覚 阻害を軽減 ,
81Dojo 一般的 設定 中 最 対局時間 短い,
持 時間5 , 読 30 設定
棋力 調整 次 変換式を利用 い 索 得
候補手 評価 を,0 近い指 手 高い
う 変 換 を 求 , 最 大 い 指 手 を ,
局面 評価 を最 0 近 着手 選択
= {− , , ≥ 0 < 0
3.
評価結果と考察
接 待 将 棋 運 用 伴 い , 接 待 将 棋 使 用
感 い ン を行 ン 評価 目 ,5段
階尺度 AI 対局 楽 感 AI 強 ,自 記
述 そ 評価理 , AI い, 自然
指 手 あ ,感想 を用意 , 棋力 合 わ
出来 い ,指 手 意味 い ン を損 う
原因 調査を行
を 定 47件 う 6件 一人 回答者
複 回 答 回 答 主 観的 強 評 価 , 均 3.0,
SD 1.0 3を中心 ン を算
出可能 45 回答( 均1463.6, SD317.9, 最小
759, 最大 2037) い 析を行う , ン 主
観的 強 評価 相関 数 -0.1941 相関 見
,楽 主観評価 強 を 3 評価 最 高
, 強 , 弱 評 価 い 楽 評 価
,楽 を1 評価 強 を1, 5 評価 回答
者 あ 5段階尺度 主観評価 ,本
幅 広 い 棋 力 合 わ 棋 力 を 調 整 , そ
楽 を実現 い ,
楽 い 評価 い い ,楽 を 1 評価
指 手 自然 い 言及 ,そ 楽
を損 う原 因 い 考 え そ 自 然 を
感 楽 を阻害 い , 自然 を感 層
法則 あ , 自然 う 種類 存在 を,
自然 指 手 目 い 回答者全体を 析 ,楽
を阻害 自然 そ 解決方法 い 考察を行
指 手 い 自然 無い 回答 割合 ,楽
主 観 評 価 高 い回 答 多 い傾 向 見 , 自然 指 手
を発 見 楽 を損 い 考 え
楽 2 評価 指 手 早 思考中 発色 勝手
退出 指 手 ,UIや指 手 表出方法
情報 楽 を損 複 数回挙 回答者 , 自
然 指 手 言 及 楽 評 価 い 指
手外 振 舞い い 複数 言及 ,
主観的 楽 影響 可能性 考え
指 手 い 自然 無い 回答 ,1477.6 ±341.8,最大 2037 最小 915 広い 層
い 自然 無い 回答 強 を3 答え 人 最 多
見 ,回答全体 強 主観評価 均 2.9 棋
力 程度 回答 自然 無い 最 多 回答
, 棋力 差 あ 指 手 自然 を感 いう結果
合致 い [仲 2013]
自 然 指 手 回 答 理 を大 , 形 を 損 手
一手 駒 損 手 詰 を逃 手 無駄 王 手を連続
挙 無意味 意味 明 いう単語
共 出現 あ , 自然 を知覚 ,損を
指 手 理 無 ば行わ い いう前提 存在 い
考え 一方 人間 いそう 自
然 指 手 言及 存在 , 回答時 楽 評価 4
自 然 知 覚 時 意 帰 属 を ば , 自 然
を言 及 楽 阻 害 い い 考 え 一 方 ,
勝 負 を長 引 う い いう う 設 計 帰 属
自 然 指 摘 , 理 妥 当 意 帰 属
い場合 自然 を え う 考え
4.
おわりに
本 研 究 簡 単 棋力 調 整方 法 接待 将棋
を作成 , 程度 棋力 調整 場合 主観的 楽
評価 高 , 自然 指 手 言及 少
検 証 を行 い, 本 手法 有 効性 を示 , 自 然 指
手 ン 知 覚を阻 害 要素 を 類 ,駒 得
や 詰 や い 利 得 を逃 指 手 自 然 原
因 ,そ 理 を帰属 い AI い指 手
可能性を示 今後 人間 い 理 ,意 を考慮
次善手を選択 , ン 知覚を
構築を目指
謝辞
本研究 い 国 ネッ 将棋対局場 81dojo Botを
置 頂 技術的 を頂い 川崎智秀氏 場
を借 御礼申 ネッ 対戦 ン
協 力頂 い 皆様 感 謝致 本 研究 JSPS
研費 基盤研究B 25280130 助成を受
参考文献
[Karpov 2012] Igor V. Karpov, Jacob Schrum and Risto Miikkulainen: Believable Bot Navigation via Playback of Human Traces, Believable Bots, Springer Berlin Heidelberg, pp.151-170(2012)
[Soni, 2008] Soni, B. and Hingston, P.: Bots traned to play like a human are more fun, Neural Networks, 2008. IJCNN 2008. (IEEE World Congress on Computational Intelligence). IEEE International Joint Conference on, pp. 363-369 (2008)
[池田 2013] 池田心: 楽しませる囲碁 将棋プ グ ング
(<特集>娯楽のOR),オペ ションズ サ チ:経営
の科学,pp.167-173(2013)
[仲道 2013] 仲道隆史,伊藤毅志: 機械学習を用いた棋力の
調整方法の提案と認知科学的評価,情報処理学会研究報告.
GI,[ゲ 情報学],pp.1-7(2013).
[保木 2006] 保木邦仁: 局面評価 学習を目指 索結果
最適制御,第11回 プ ン ワ ップ 2006,
pp.78-83(2006)
[寺 2012] 寺 和憲,岩瀬寛,伊藤昭: Denett 論考
タン 検証( ン ン,<特集>人
ン ンタ ン論文),電子情報通信 学会論文 A,
基礎 協会 J95-A(1),pp.117-127(2012)
[寺 2012] 寺 和憲,山 誠 ,伊藤昭: 付 ッチ
ン 人 間 ン 適 用 プ
セ 解 明 , 人 工 知 能 学 会 論 文 ,Vol. 27, No. 2, pp-73-81