セブンティーンポーカーに おける強い AI 開発
情報論理工学研究室
17-1-037-0147 鈴木拓磨
発表の流れ
• 本研究の背景と目的
• ポーカーとは
• セブンティーンポーカーとは
• 実験内容
• 実験結果・考察
• 今後の課題
本研究の背景と目的
•
ポーカーは世界中でプレイされている。
•
不確定不完全情報ゲームなので
AI作成が困難。
• 2017
年には
AIがプロに大会で勝利した。
[1]•
セブンティーンポーカー [2] は漫画に登場したゲーム
。
•
認知されておらず
AIも開発されていない。
•
セブンティーンポーカーの強い AI 開発を目指す。
[1] B.Spice, Carnegie Mellon A.I. Beats Top Poker Pros, 2017 [2] 甲斐谷忍 , LAIR GAME 8, 2012
ポーカー ( ドローポーカー
)•
ポーカー ( ドローポーカー ) とは
• 対戦人数は 2~6 人。
• カードは 52 枚使用。
• カード 5 枚で、揃った役の強さを競うゲーム。
• ゲームの流れ : 手札配布→ 1st ベット→手札交換→ 2nd ベット→勝 敗判定
• 1st ベットと 2nd ベット
1. チェックかベットを選択
2. レイズかコールかフォルドを選択
LOS E
WI
VS N
セブンティーンポーカー
•
セブンティーンポーカーとは
• 対戦人数は 2 人。
• カードは各スートの A 、 J、 Q 、 K とジョーカーの合計 17 枚を使用
。
• 交換したカードは山札の下に入れる
• 10 ゲーム行い、所持チップ数が多い方が勝ち
実験方法
•
Java 言語を用いて 3 種類の AI を作成。
•
AI 同士を 1000 回対戦させ、各対戦の勝率と稼いだ
チップを調べる。
作成した AI の戦略
•
CP1
基本的に勝負し、役が出れば出るほど賭け金を吊り上げる。
•
CP2
CP1
よりも評価基準が少なく、賭け金は控えめ。
•
RND
完全にランダムに行動する。ブラフが発生する。
AI の手札交換方法
役 確率
ファイブカード 0.04%
ロイヤルストレートフラッシュ 0.07%
フォーカード 3.9%
フルハウス
★8.21%ストレート
★4.24%スリーカード 31.11%
ツーペア 27.96%
ワンペア 24.47%
★
Wild Poker Paradox[3]
[3] S.Gadbois, Poker with wild cards - a paradox, 1996
AI の手札交換方法
役 交換方法
ストレート以上の役 交換しない
スリーカード トリオを残して交換 ツーペア 強い方のペアを残して交換 ワンペア ペアを残して交換
交換
実験結果・考察
CP1 CP2 RND
CP1 50%/-9115 62%/-
17913 CP2 50%/-
10468 71%/-
12359 RND 38%/-
49007 29%/-
58792
今後の課題
さらに勝率を上げるためには …
•
相手のブラフを対処しつつ使いこなす。
•
人間が対戦したときの行動選択を分析する。
参考文献
[1] Byron Spice, Carnegie Mellon Artificial Intelligence Beats Top
Poker Pros, Carnegie Mellon University, (2017/7/31) [2]
甲斐谷忍、
LAIR GAME 8、集英社(
2012)
[3] Stave Gadbois, "Poker with wild cards - a paradox?", Mathenatics Magazine, No,69, pp. 283-285 (1996)