- 295 -
確率解析から導き出される最良攻略
ポーカーを題材として
教科・領域教育専攻 自然系コース(数学) 藤 里 悠 史1
概要
本研究では不確定な要素が多数存在するポ ーカーなどの不完全情報ゲームをゲーム場と し,最良戦略を導出するメソッドを確率解析 から研究することを目的とした. このゲームにおける決定基準のモデルは後 述するが,期待値を算出するために仮想の対 戦 相 手 に 以 下 の よ う な 典 型 的 戦 略 に 設 定 し た. ① high cardである場合 一枚を残し,4
枚をチェンジする. ② one pair, two pairである場合 ベア以外の残りをチェンジする ③ three cardである場合 トリオ以外の残りをチェンジする. ④ その他 チェンジなし. 上記の操作を行い,変化した 1次手札の手 役確率を条件付き確率として計算することで¥ 典型的戦略を行った結果を導き,その結果に 対する最良戦略を考察する.2 最良戦略
以下の計算式を用いて典型的戦略を行った諜 の 1次手札の手役確率を算出する. 4 て-, ( A B h ¥ P日 )I一一二一×一一」ニーl d合¥
52C5 全通り/ 次に,期待値の算出モデ、ノレを述べる. 初期定義 i) 1ゲームの勝ちの利得を+1,負けの利得 を 1とする. 指 導 教 員 宮 口 智 成 並) 1 次手札のそれぞれの手役確率を pl~P9 とし,相手の予想手役確率を ql~q9 とする.決 定基準としての期待値Expは Qn+ =I
q
i
p+=
工
時
Qn-エ
=
q
i
p
-
=
IPiQi-1=1 Exp=
p+ -Pーとなる いわゆるp+が勝率,Pーが敗率となり,期待値は 勝率と敗率の差で算出される. これまでの結果から最良戦略をO次手札の状 態ごとにまとめる.0次手役がhighcard以上 であるときは典型的戦略と同様の戦略が好ま しい.さらにhighcardに関して最良戦略の詳 細を以下に示す. ① 同 色 4枚以上 V2'""1Oの数字から始まる 4 連番の場合 flash→straightの順に優先度を置き,一枚 をチェンジする. ② 同 色 3枚以上八3'""10の数字から始まる 3連番〈連番が同色の場合 3連番かっ同色のカードを残し2枚をチ ェンジする ③ そ れ 以 外 のhighcardの場合 4枚をチェンジする.3 戦略予測と戦略変化
本研究でのゲーム環境は先攻と後攻という 概念が存在する展開型ゲームだといえる.同 時に行動する状況と交互に行動する状況では, ゲームの結果は異なることは多い.後攻のプ- 296 - - 295 - レイヤーについて展開型ゲームの観点を導入 することで,最良戦略を見直す. 具体的には棺手の捨てた枚数という情報を 元に相手が前章で述べた最良戦略をしてくる と仮定し,条件付き確率計算を用いて相手の 手役を予想、し.変化した環境に対応した最良 戦略を考察する.第2章では仮想、の相手とし て典型的戦略を用いた結果の 1次手札の手役 確率を用いたが,本章では先攻のプレイヤー の行動ごとに絞り込んだ手役確率を仮想の相 手として期待値を求めた.