• 検索結果がありません。

現在のコンピュータ将棋プログラムと人間の手筋との比較調査 1190392

N/A
N/A
Protected

Academic year: 2021

シェア "現在のコンピュータ将棋プログラムと人間の手筋との比較調査 1190392"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

平成30年度 学士学位論文梗概 高知工科大学 情報学群

 現在のコンピュータ将棋プログラムと人間の手筋との比較調査

1190392

山本健太 【 高度プログラミング研究室 】

1

はじめに

コンピュータ将棋プログラムは近年,急成長を遂げて いる. 2017年には,コンピュータ将棋プログラムpo-

nanzaが人間のトッププレイヤーである名人に勝利を

収めた. 2017年のコンピュータ将棋選手権においては

ponanzaを滝澤誠が開発したコンピュータ将棋プログラ

elmoが破り,2018年には,DeepMind社が開発した AlphaZeroelmo9割勝ち越していると報告され,

その棋譜が公開された[1]. 人間より強いコンピュータ 将棋を実現するという目標は達成されたといえるが,コ ンピュータ将棋に関する研究は引き続き行われており,

たとえば人間らしいコンピュータ将棋プログラムを作成 する研究も行われている[2].

本研究では,現在のコンピュータ将棋プログラムと人 間の棋譜の違いを検証する為,手筋に着目して,比較 調査を行う. 調査の結果から将棋というゲームの分野に おいての人工知能に対する理解を目的とする. 筆者の主 観とフリーソフトであるコンピュータ将棋プログラム

elmo[3]の読み筋を併用して,現在のコンピュータ将棋

プログラム同士の棋譜と人間同士の棋譜からどのよう な手筋が多いかを比較し,調査を行った. コンピュータ 将棋プレイヤの評価関数として,オープンソースプログ ラムのelmoのものを使用した. どのような手筋であ るかの評価を行うのは著者であり,著者の棋力は県代表 クラスである. 

2

調査

2.1 調査方法

2015年から2017年までのタイトル戦の一つである竜 王戦17局の棋譜からelmoを用いて一手10秒で棋譜解 析を行う. 解析の結果から評価値が0から500以上離 れた局面を指定局面として持ち時間一手10秒の設定で elmo同士で対局を行わせる. そして,手数や勝敗,受 けの手筋がみられる局面と攻めの手筋が見られる局面 を著者の目線で判断し,元の棋譜と比較して調査する. コンピュータ将棋プログラムの手筋の考え方として著者 が攻めの手筋を考える局面においてコンピュータ将棋プ ログラムが実際に指した手が受けの手筋とし,逆の場合 を攻めの手筋とする.

2.2 調査結果

調査において表1の結果が得られた. 棋譜の内容に より,片方の対局者が一方的に攻めの手筋を通して勝利 した対局を攻め潰した対局とし,片方の攻めの手筋を通 せず受けの手筋を通した対局を受け潰した対局とする.  評価値が500離れた局面において,プロ棋士同士の

対局においては優勢側が逆転した対局は0局だったが,

コンピュータ将棋プログラム同士の対局では優勢側が逆 転した対局は2局あった. 

1 調査2の分析結果

対局者 プロ棋士 コンピュータ 受けの手筋の合計 318手 攻めの手筋の合計  88手 攻め潰した対局  82局 受け潰した対局  01局 逆転した対局 02

3

考察

調査結果よりコンピュータ将棋プログラムの手筋と人 間の手筋を比較するとコンピュータ将棋プログラムでは 受けの手筋が多い結果であった. 著者は人間同士で見 られるお互いに攻め合いの将棋はコンピュータ将棋プロ グラムにおいては,攻め合いでどちらが有利なのかが明 白であり,その変化を選ばないため受ける手筋が多いと 考察する. また, コンピュータ将棋プログラムは敗勢 の際に受けが無くなるまで受けの手筋を着手する傾向 があるが,人間は敗勢の際に無理筋であろうとも対局相 手が間違える可能性を考慮し場合によって受けずに攻め の手筋を着手する傾向があると考察する. 

4

まとめ

本稿では,現在のコンピュータ将棋と人間の手筋の比 較の調査として,竜王戦の棋譜分析から評価値が500離 れた局面を指定局面とし,それ以降のコンピュータ将棋 プログラム同しに対局を行わせ,コンピュータ将棋プロ グラムの指した手筋と実際の人間の手筋を比較した.  そしてコンピュータ将棋プログラムと人間との手筋を比 較するとコンピュータ将棋プログラムは受けの手筋が多 いという結果を得ることができた.

参考文献

[1] DeepMind : https://deepmind.com/research/

alphago/alphazero-resources/

[2] 杵渕 哲彦,伊藤 毅志: “流れを考慮した将棋におけ る人間の指し手との一致率向上手法, 情報処理 学会論文誌, Vol. 58, No. 9, pp. 1549–1554, 2017.

[3] 滝澤 誠 : https://mk-takizawa.github.io/

elmo/howtouse_elmo.html

参照

関連したドキュメント

運営、環境、経済、財務評価などの面から、途上国の

ると︑上手から士人の娘︽腕に圧縮した小さい人間の首を下げて ペ贋︲ロ

l 「指定したスキャン速度以下でデータを要求」 : このモード では、 最大スキャン速度として設定されている値を指 定します。 有効な範囲は 10 から 99999990

共通点が多い 2 。そのようなことを考えあわせ ると、リードの因果論は結局、・ヒュームの因果

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

環境基準値を超過した測定局の状況をみると、区部南西部に位置する東糀谷局では一般局では最も早く 12 時から二酸化窒素が上昇し始め 24 時まで 0.06ppm

現在、本協会は、関東地区に 16 局の VHF 海岸局と、4 局の 400MHz 海岸局(VHF

者は買受人の所有権取得を争えるのではなかろうか︒執行停止の手続をとらなければ︑競売手続が進行して完結し︑