セブンティーンポーカーにおける強い AI 開発

(1)

セブンティーンポーカーにおける強い AI 開発

情報論理工学研究室

17-1-037-0147 鈴木拓磨

(2)

発表の流れ

• 本研究の背景と目的

• ポーカーとは

• セブンティーンポーカーとは

• 実験内容

• 実験結果・考察

• 今後の課題

(3)

本研究の背景と目的

•

ポーカーは世界中でプレイされている。

•

不確定不完全情報ゲームなので

AI

作成が困難。

• 2017

年には

AI

がプロに大会で勝利した。

[1]

•

セブンティーンポーカー [2] は漫画に登場したゲーム

。

•

認知されておらず

AI

も開発されていない。

•

セブンティーンポーカーの強い AI 開発を目指す。

[1] B.Spice, Carnegie Mellon A.I. Beats Top Poker Pros, 2017 [2] 甲斐谷忍 , LAIR GAME 8, 2012

(4)

ポーカー ( ドローポーカー

)

•

ポーカー ( ドローポーカー ) とは

• 対戦人数は 2~6 人。

• カードは 52 枚使用。

• カード 5 枚で、揃った役の強さを競うゲーム。

• ゲームの流れ : 手札配布→ 1st ベット→手札交換→ 2nd ベット→勝敗判定

• 1st ベットと 2nd ベット

1. チェックかベットを選択

2. レイズかコールかフォルドを選択

LOS E

WI

VS N

(5)

セブンティーンポーカー

•

セブンティーンポーカーとは

• 対戦人数は 2 人。

• カードは各スートの A 、 J、 Q 、 K とジョーカーの合計 17 枚を使用

。

• 交換したカードは山札の下に入れる

• 10 ゲーム行い、所持チップ数が多い方が勝ち

(6)

実験方法

•

Java 言語を用いて 3 種類の AI を作成。

•

AI 同士を 1000 回対戦させ、各対戦の勝率と稼いだ

チップを調べる。

(7)

作成した AI の戦略

•

CP1

　基本的に勝負し、役が出れば出るほど賭け金を吊り上げる。

•

CP2

CP1

よりも評価基準が少なく、賭け金は控えめ。

　

•

RND

　完全にランダムに行動する。ブラフが発生する。

(8)

AI の手札交換方法

役確率

ファイブカード 0.04%

ロイヤルストレートフラッシュ 0.07%

フォーカード 3.9%

フルハウス

★8.21%

ストレート

★4.24%

スリーカード 31.11%

ツーペア 27.96%

ワンペア 24.47%

★

Wild Poker Paradox[3]

[3] S.Gadbois, Poker with wild cards - a paradox, 1996

(9)

AI の手札交換方法

役交換方法

ストレート以上の役交換しない

スリーカードトリオを残して交換ツーペア強い方のペアを残して交換ワンペアペアを残して交換

交換

(10)

実験結果・考察

CP1 CP2 RND

CP1 50%/-9115 62%/-

17913 CP2 50%/-

10468 71%/-

12359 RND 38%/-

49007 29%/-

58792

(11)

今後の課題

さらに勝率を上げるためには …

•

相手のブラフを対処しつつ使いこなす。

•

人間が対戦したときの行動選択を分析する。

(12)

参考文献

[1] Byron Spice, Carnegie Mellon Artificial Intelligence Beats Top

Poker Pros, Carnegie Mellon University, (2017/7/31) [2]

甲斐谷忍、

LAIR GAME 8

、集英社（

2012

）

[3] Stave Gadbois, "Poker with wild cards - a paradox?", Mathenatics Magazine, No,69, pp. 283-285 (1996)

セブンティーンポーカーに おける強い AI 開発

セブンティーンポーカーに おける強い AI 開発

情報論理工学研究室

17-1-037-0147 鈴木拓磨

発表の流れ

• 本研究の背景と目的

• ポーカーとは

• セブンティーンポーカーとは

• 実験内容

• 実験結果・考察

• 今後の課題

本研究の背景と目的

ポーカーは世界中でプレイされている。

不確定不完全情報ゲームなので

作成が困難。

年には

がプロに大会で勝利した。

セブンティーンポーカー [2] は漫画に登場したゲーム

。

認知されておらず

も開発されていない。

セブンティーンポーカーの強い AI 開発を目指す。

ポーカー ( ドローポーカー

ポーカー ( ドローポーカー ) とは

LOS E

WI

VS N

セブンティーンポーカー

セブンティーンポーカーとは

実験方法

Java 言語を用いて 3 種類の AI を作成。

AI 同士を 1000 回対戦させ、各対戦の勝率と稼いだ

チップを調べる。

作成した AI の戦略

CP1

基本的に勝負し、役が出れば出るほど賭け金を吊り上げる。

CP2

よりも評価基準が少なく、賭け金は控えめ。

RND

完全にランダムに行動する。ブラフが発生する。

AI の手札交換方法

役 確率

ファイブカード 0.04%

ロイヤルストレートフラッシュ 0.07%

フォーカード 3.9%

フルハウス

ストレート

スリーカード 31.11%

ツーペア 27.96%

ワンペア 24.47%

Wild Poker Paradox[3]

AI の手札交換方法

役 交換方法

ストレート以上の役 交換しない

スリーカード トリオを残して交換 ツーペア 強い方のペアを残して交換 ワンペア ペアを残して交換

交換

実験結果・考察

CP1 CP2 RND

CP1 50%/-9115 62%/-

17913 CP2 50%/-

10468 71%/-

12359 RND 38%/-

49007 29%/-

58792

今後の課題

さらに勝率を上げるためには …

相手のブラフを対処しつつ使いこなす。

人間が対戦したときの行動選択を分析する。

参考文献

甲斐谷忍、

、集英社（

）

セブンティーンポーカーにおける強い AI 開発

セブンティーンポーカーにおける強い AI 開発

　基本的に勝負し、役が出れば出るほど賭け金を吊り上げる。

　完全にランダムに行動する。ブラフが発生する。

役確率

役交換方法

ストレート以上の役交換しない

スリーカードトリオを残して交換ツーペア強い方のペアを残して交換ワンペアペアを残して交換