• 検索結果がありません。

初期盤面の差を考慮したレーティング手法のオセロを用いた評価

N/A
N/A
Protected

Academic year: 2021

シェア "初期盤面の差を考慮したレーティング手法のオセロを用いた評価"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

平成29年度 プロジェクト研究報告書 梗概 高知工科大学 情報学群

初期盤面の差を考慮したレーティング手法のオセロを用いた評価

1180294

今村 圭希 【 高度プログラミング研究室 】

1

はじめに

ゲームにおいて2プレイヤ間の強さを測る方法とし て,レーティングシステムがある.これは,各プレイヤ の強さを数値化して表すものである.オセロや将棋など のように,初期盤面に一方が有利である要素がない場 合,レーティング結果は信頼できるものになる.

しかし大富豪のように,初期盤面や手札によってプレ イヤごとに偏りがある場合,通常のレーティングシステ ムでは実際のプレイヤの強さとの差が出る場合がある と考えられる.そのため,プレイヤの初期盤面の有利差 によって,レーティング結果を修正したほうが良いと考 える.

この研究では,森田が提案した,初期盤面の差を考慮 したレーティング手法[?]を調査する.既存の研究では 大富豪を用いており,初期盤面の有利不利の要素以外に も,多人数性やゲーム間の依存関係など,多くの要素が 影響していた.そこで初期盤面の有利不利以外の要素を できるだけ除き適切に評価するため,初期盤面を変化さ せたオセロを対象にして調査することにした.

2

森田のレーティング 手法

イロレーティングは,Arpad E. Eloが提案したレー ティング手法[?]で,2プレイヤ間の実力を測る手段と して用いられている.これに対し,森田は初期盤面の勝 率差を考慮したレーティングを行う手法[?]を提案した.

二人のプレイヤABに対して試合前のプレイヤA レートをRa,プレイヤBのレートをRbとする.この 時,以下の式(??)を用いて,プレイヤ間のレートから プレイヤの勝率EaEbを求める.

Ea= 1

1 + 10((RaRb)/400)+log(pa/1pa) (1) Ebは式(??)を用いて同様に求めることができる.この (??)は,レート差を参照する部分に,初期盤面の勝 log(pa/1−pa)を考慮したものである.元々の盤面 を基準として,初期盤面の勝率に応じてレートに補正が かかる.

その後,求めた勝率から以下の式(??)を用いて,各 プレイヤの新しいレートRaRbを決定する.

Ra =Ra+K∗(Sab−Ea) (2) この式では,試合前のレートに,求めた勝率をK値で かけたものを足している.ここで,Kは定数で,主に 16または32が用いられる.また,点数Sabは勝ちの場 合に1,負けの場合に0を用いることが多い.

本稿では,この森田の式について,初期盤面の勝率が 反映されているかを調査する.

1 各プレイヤの初期盤面のレート(先攻)

プレイヤ レート プレイヤ レート

Random 1133.23 MCT 2 1480.53

Hyoka 1455.29 MCT 3 1367.46

Hyoka2 1504.16 MCT 4 1377.77

Monte Carlo 1533.45 MCT + CF 1790.66 Monte Carlo Tree 1372.24 MCT + CF 2 1747.41

3

実験内容

まず,10種類のプレイヤを用意し,それぞれの初期 盤面でのレートを求める.そして,オセロの初期盤面を ゲーム内の途中盤面に変更し,各プレイヤに対して,勝 率,初期盤面勝率,レート結果の3つについて求める.

この記録をもとに,通常のレート計算と森田の提案手法 とのレートの違いを調べる.

初期盤面勝率は,あるプレイヤ同士の対戦結果を元 にする.その後,途中盤面にかける補正を,初期盤面の 勝率を基準として求める.そして,プレイヤの勝率から 求めたレートに,補正値を加えたレートを求め,通常の 計算によるレート,補正値を加えたレート,初期盤面の レートをそれぞれ比較する.

4

実験結果

各プレイヤの先攻での初期レートは表??のようにな った.

すべての結果が出ているわけではないが,レート補 正によって,初期盤面のレートの値に近づいている場合 があることを確認した.しかし,元々レート値が近い場 合,レート補正によって元のレート値より離れることが あった.

5

まとめ

この論文では,森田が提案した,初期盤面の差を考慮 するレーティングについて,初期盤面を変更したオセロ による調査を行った.その結果,レート補正によって初 期盤面のレート値に近いレートを求めることができた.

参考文献

[1] 森田 茂彦,松崎 公紀: 「多人数不完全情報ゲーム におけるレーティングシステムに関する研究」, 知工科大学平成25年度修士論文, 2014.

[2] Arpad E. Elo: The Rating of Chessplayers Past&

Present. Ishi Press International, 2008.

参照

関連したドキュメント

最急降下法は単純なアルゴリズムでしたが、いろいろと面白かったです。NN

 毛髪の表面像に関しては,法医学的見地から進めら れた研究が多い.本邦においては,鈴木 i1930)が考

従って、こ こでは「嬉 しい」と「 楽しい」の 間にも差が あると考え られる。こ のような差 は語を区別 するために 決しておざ

既存の尺度の構成概念をほぼ網羅する多面的な評価が可能と考えられた。SFS‑Yと既存の

ü  modeling strategies and solution methods for optimization problems that are defined by uncertain inputs.. ü  proposed by Ben-Tal & Nemirovski

) ︑高等研

本稿で取り上げる関西社会経済研究所の自治 体評価では、 以上のような観点を踏まえて評価 を試みている。 関西社会経済研究所は、 年

利用者 の旅行 計画では、高齢 ・ 重度化 が進 む 中で、長 距離移動や体調 に考慮した調査を 実施 し20名 の利 用者から日帰