• 検索結果がありません。

初期盤面勝率を考慮したグリコレーティングの手法

N/A
N/A
Protected

Academic year: 2021

シェア "初期盤面勝率を考慮したグリコレーティングの手法"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

令和元年度 学士学位論文梗概 高知工科大学 情報学群

初期盤面勝率を考慮したグリコレーティングの手法

1200371

森 岡 尚 輝 【 高度プログラミング研究室 】

1

はじめに

勝敗の生じるゲームにおいて,レーティングによって 強さは数値化される.従来のレーティング手法では, 期状態における勝率が対等であると仮定し

,

レート算出 を行っている

.

しかし大富豪などのように初期状態にお ける勝率に差がある場合やハンディキャップを与え初期 勝率を変更した場合に従来のレーティングでは適切な レートを算出することが困難になる可能性がある. また レーティングの種類によっては,レーティングのインフ レやデフレが生じ, 1500を平均とする本来のレーティン グから乖離する可能性がある.

 本論文では森田ら

[1]

提案した初期局面の有利不利を 考慮したレート計算式の有効性をグリコレーティングに 適用できるのか検証する.

 実験では,通常の初期盤面の他にオセロの途中盤面を 初期盤面として用いる. 途中盤面を用いることにより先 攻後攻によって初期勝率に差を生じる

.

通常盤面からの レート

,

途中盤面からのレート

,

途中盤面から初期勝率 を考慮したレートを比較する

.

2

グリコレーティングによる拡張

グリコレーティング

[2]

とは,チェスや囲碁などの二 人用ゲームにおいてレートを算出するアルゴリズムで ある.既存のレーティングの問題点であったレーティン グのインフレ・デフレをレーティング偏差を用いること により解消している. グリコレーティングによるレート の算出方法は対戦結果と両者の持つレートとレーティン グ偏差よって決まる

.

プレイヤ

A

のレートを

R

a

,

プレ イヤ

B

のレートを

R

b

,

レーティング偏差を

RD

とする とプレイヤ

A

のプレイヤ

B

に対する勝率

E

abは以下の ように求められる.

E

ab

= 1 1 + 10

(

g(RD)(Ra−Rb)

−400

) (1)

この時,

g(RD)

は以下である.

g(RD) = 1

1 +

3q2(RDπ2 2)

(2)

q = log 10

400 = 0.00575646273 (3) E

ba

(1)

式を用いて同様に求めることができる. この 勝率に初期盤面勝率

P a

を加え,新たな勝率

E

ab を以下 のように求める.

E

ab

= 1 1 + 10

(

g(RD)(Ra−Rb)

−400

)

+log(1−P aP a )

(4)

 この新たな勝率

E

ab を用いて初期盤面を考慮したレー トを算出する

.

初期盤面勝率を加えたことにより

,

レー トの補正がかかる.

1

通常盤面のレート

プレイヤ レート プレイヤ レート

random 705.192 EPT-MCT8500 2036.833 Hyouka-0-100 1131.616 AlphaBeta1 1391.308 MCT 1280.516 AlphaBeta2 1770.304 EPT-MCT1730 1708.107 AlphaBeta4 1977.006

3

実験内容

9

種類のオセロプレイヤによる対戦を行い,その結果 をもとにレートの算出を行う. 初期盤面勝率はランダム 性のあるプレイヤの対戦によって決める. 通常盤面から のレートは対戦するプレイヤをランダムに選択し,レー トの算出を行う. また途中盤面をランダムに選択し, 戦するプレイヤをランダムに決め,初期盤面勝率を考慮 した場合と考慮しない場合のレートを算出する. またハ ンディキャップを設けた場合は初期盤面勝率に応じてプ レイヤの先攻後攻を操作することにより

,

一方のプレイ ヤに不利な状況を与え実現する

.

これらより算出された 複数のレートについて通常盤面からのレートと比較を する.

4

実験結果

通常盤面からのレーティングの結果が表1である。途 中盤面から初期盤面勝率を考慮した場合と考慮しない 場合のレートの実験結果は論文本体に掲載する.

5

まとめ

本論文では森田らが提案した初期局面の有利不利を 考慮したレート計算式の有効性をグリコレーティングに 適用できるのを確認した. 通常盤面からのレートにより 近づけるため初期勝率の算出方法や他のレーティング手 法でも検証すべきである.

参考文献

[1]

森田茂彦

,

松崎公紀

:

大貧民における初期手札の不均 等性を考慮したレーティングアルゴリズムの提案.

情報処理学会第

31

回ゲーム情報学研究会, 2014-

GI-31(14),2014.

[2] Dr.Mark E. Glickman:The Glicko system

参照

関連したドキュメント

(2)特定死因を除去した場合の平均余命の延び

点から見たときに、 債務者に、 複数債権者の有する債権額を考慮することなく弁済することを可能にしているものとしては、

オーディエンスの生徒も勝敗を考えながらディベートを観戦し、ディベートが終わると 挙手で Government が勝ったか

はありますが、これまでの 40 人から 35

手動のレバーを押して津波がどのようにして起きるかを観察 することができます。シミュレーターの前には、 「地図で見る日本

荒天の際に係留する場合は、1つのビットに 2 本(可能であれば 3

(自分で感じられ得る[もの])という用例は注目に値する(脚注 24 ).接頭辞の sam は「正しい」と

人の生涯を助ける。だからすべてこれを「貨物」という。また貨幣というのは、三種類の銭があ