コンピュータ大貧民における手札推定の有効性について

全文

(1)Vol.2013-GI-30 No.4 2013/6/28. 情報処理学会研究報告 IPSJ SIG Technical Report. コンピュータ大貧民における手札推定の有効性について吉原大夢1. 大久保誠也1. 概要：本研究の目的は，大貧民において，手札推定の成功率と得られる得点の間に，どのような関係があるかを明らかにすることである．そこで，2010 年度コンピュータ大貧民大会優勝プログラムである snowl を用いた計算機実験により，相手手札推定の有効性の検討を行った．まずはじめに，snowl ならびに大貧民サーバーの間でやり取りされる情報を変更することにより，相手手札推定の各成功率を模倣できる snowl を作成した．そして，相手手札推定の成功率を 0%，50%，100% とした各改造 snowl を通常 snowl 4 つと対戦させることにより，相手手札推定が得点にどの程度結び付くかを検討した．. 1. はじめにコンピュータにゲームをプレイさせる試みは数多く行われており，将棋や囲碁は人間のプロに迫る強さになりつつある．これらのゲームは完全情報ゲームであり，プレイヤは互いに同じだけの情報を手にいれることができる．. 偶然手番感度からの検討も行われている [4]．これらの研究では，手札推定の難しさや最前手を選択することに対する貢献度を明らかとしている．その一方で，得点の獲得に結びついているかはあまり検討なされていない．本研究の目的は，相手手札推定が得点にどの程度結び付いているのかを明らかとすることである．まずサーバー. 一方，一部の情報が伏せられているゲームは不完全情報. ならびに snowl の手札推定部分を変更することにより，相. ゲームと呼ばれる．不完全情報ゲームの研究も行われてお. 手手札推定の成功率を変更できるようにする．そして，成. り，マージャン等で大規模なデータ解析などが行われてい. 功率を変更させた場合，得られる得点にどのような変化が. る．このような不完全情報ゲームの一つとして，トランプ. 生じるかを調査する．これらの結果から，棋風や強さの要. ゲームの大貧民がある．この大貧民をコンピュータにプレ. 素等解析の検討も行う．. イさせるのがコンピュータ大貧民であり，大会が UEC コンピュータ大貧民大会（UECda）として，2006 年より開. 2. コンピュータ大貧民. 催されている [5]．また，不完全情報ゲームに対するアルゴ. コンピュータ大貧民は，大貧民を計算機上で行うゲーム. リズムの研究としても用いられており，強いアルゴリズム. である．また，電気通信大学において大会が開催されてお. の提案などが行われている [1][7][2]．. り，統一ルールや各種プログラムが公開されている．本研. 現在の強豪プログラムの多くは，モンテカルロシミュ. 究でもこの枠組みを利用する．UEC コンピュータ大貧民. レーションを用いている．不完全情報ゲームである大貧民. のゲームは，場と進行を管理するサーバーと，ゲームをプ. においては，相手の手札を知ることができないため，モン. レイする 5 つのクライアントからなる（図 1 参照）．. テカルロシミュレーションを実施する際に多くの分岐が. 大貧民には非常の数多くのローカル・ルールが存在して. 必要となる．そこで，相手手札推定により，より妥当なシ. いるが，UEC コンピュータ大貧民大会では主に次のよう. ミュレーションを限られた時間内で行うことが検討されて. なルールが採用されている．. いる．そのような機能を組み込んだプログラムとして 2010 年度優勝クライアントの snowl がある．また，相手手札推定の効果についての検討も行われており snowl の強さは相手手札推定ではなくモンテカルロ法に重きを置いていることや [3]，終盤においては相手手札全体を推定しなければ意味がなく，一方で序盤・中盤ではその後の展開が多いために最善手の推定が難しいこと等が示されている [6]．また， 1. 静岡県立大学経営情報学部. ⓒ 2013 Information Processing Society of Japan. 図 1 大貧民大会システム構成図. 1.

(2) Vol.2013-GI-30 No.4 2013/6/28. 情報処理学会研究報告 IPSJ SIG Technical Report. ゲームの流れ：ゲームは 5 人で行われる．カードは，ハート・クラブ・スペード・ダイヤの A∼K までの計 52 枚と，ジョーカー 1 枚の，計 53 枚を使用する．各ゲー. ランダムに推定する．. ( 2 ) UCB1-TUNED を用いたシミュレーションを行い，提出手を選択する．. ムの最初に，各プレイヤーには 10 枚もしくは 11 枚の. 相手の手札の推定において，fumiya は，モンテカルロシ. カードが配られる．そして手持ちのカードを時計回り. ミュレーションの際に使う相手手札をランダムに割り振っ. 順に場に出して早く手札をなくすことを競う．. ていたが，snowl は実際に近い手札を割り当てられるよう. ゲームの開始：ダイヤの 3 を持っている人から始める．. に，各プレイヤ毎にカードに対する重みテーブルを用意し，. カードの出し方：順番が回ってきたプレイヤーは，カー. 各カードを重みに比例した確率で割り当てるようにしてい. ドを場に出すか，パスを行なう．場にカードが無い場. る．この重みテーブルは，ゲームの初期状態においては全. 合は，好きなタイプ（単騎・ペア・階段）のカードを. ての持ち得るカードに対して等しい値に設定されている．. 出すことができる．場にカードが出ているときは，同. その後，ゲーム中に以下の情報を考慮してプレイヤの行動. じタイプでより強いカードを出すことができる．. によって重みの更新を行う．. 場の流れ方：全員がパスしたら場が流れ，最後にカードを出した人が場にカードがない状態からカードを出すことができる．パスについて：カードを出せない場合や出したくない場. 3.2 手札推定の効果大貧民は不完全情報多人数ゲームであり，相手の情報が伏せられてるゲームであるため何らかの手段で相手の情報. 合はパスをする．いったんパスすると，場が流れるま. を得ることは，合理的な着手をするためには有益である．. で自分に順番が回ってくることはない．. しかし，たとえ相手手札が完全にわかったとしても多人数. 8 切り： 8 を含んだ手を出した場合，場が流れる．. ゲームの特性として，ゲーム木探索を完全に行うことは難. スペードの 3：. しい．その一方で，確率的にゲーム木を探索するモンテカ. ジョーカーが単騎で場に出た場合，スペー. ドの 3 を出すことができる．出した場合，場が流れる．革命： 4 枚以上のペアもしくは 5 枚以上の階段で革命状態となり，カードの強さが逆転する．. ルロ探索は，不完全情報性と多人数ゲームの不確定性をもつゲームと相性がよく，2009 年・2010 年大会でそれぞれ成果を上げている．論文 [3] では，確率的手札推定の効果. しばり：場と同じマークが提出された場合 “しばり” 状. を明らかにするために，公開されている 2010 年のクライ. 態となり，場が流れるまで同じマークのカードしか出. アント (snowl) を基に相手手札推定パラメータを変更しな. すことができない．. がら相対的強度の変化について実験を行い検討している．. カードの交換：大富豪は，大貧民から 2 枚のカードを貰. 具体的には，snowl の手札推定のパラメータを. い，大貧民に 2 枚渡す．富豪は貧民と 1 枚交換する．. • 2010 年優勝時本来の推定パラメータ (snowl). 渡すカードの選び方は任意．逆に，大貧民は 2 枚，貧. • 基準クライアント (default) のみの試合で得られた推. 民は 1 枚一番強いカードを献上する．得点の獲得： 1 回のゲームが終わる毎に，各プレイヤは身分に応じて得点を獲得する．得る得点は，大富豪は. 定パラメータ (vsbase). • 比較ダミーとしてすべてのパラメータを 0.01 で同一としたモデル (dummy001). 5 点，富豪は 4 点，平民は 3 点，貧民は 2 点，大貧民. に変更したものをそれぞれ用意し，そして，2009 年優勝. は 1 点である．. クライアントと開発キッド付属の標準クライアントと対戦. 3. snowl と手札推定 3.1 snowl snowl は須藤郁弥氏が開発した，2009 年度の UEC コン. させ，全五種類のクライアントでの組み合わせ比較実験を行っている．そして，snowl の強さは手札推定の部分ではなく必勝手探索など他の部分によるところが多いのではないかと指摘している．. ピュータ大貧民大会優勝プログラムである．アルゴリズム. また，論文 [6] においては，相手手札として正しく推定. としては fumiya[7] と同様に UCB1-TUNED を採用して. できたカードとモンテカルロ法の評価値との関係を調べる. いるが，重みを細かく設定することにより強さを向上させ. ことにより，相手手札推定の影響を調査している．そして，. ている [2]．また，相手の手札の推定も行っている．snowl. ゲームの序盤においては弱いカードの推定が，終盤につい. のプログラムソースは公開されており，2011 年度以降の. ては強いカードの推定が，より有用であると指摘している．. UEC コンピュータ大貧民大会にも多くの派生プログラムが参加している．. snowl は，大きく分けて次の 2 つのステップにより提出. 4. 計算機実験本研究では，snowl を用いて手札推定が有効に働く場面. するカードを選択している．. とその効果を調べるために，UEC コンピュータ大貧民大. ( 1 ) 相手の手札の推定を行う．もしくは，相手のカードを. 会の枠組みを利用した計算機実験を行う．. ⓒ 2013 Information Processing Society of Japan. 2.

(3) Vol.2013-GI-30 No.4 2013/6/28. 情報処理学会研究報告 IPSJ SIG Technical Report. UEC コンピュータ大貧民では，場の管理を行うサーバー. 本正解率以上となる．これらの実験から得られた結果か. と 5 つのクライアントプログラムからゲームが構成され. ら，各正解率の改造版 snowl と snowl を比較することで手. る．そこで，サーバープログラムを書き換え，クライアン. 札推定がゲームにおよぼす影響を評価する．具体的には. ト 0 に対してのみ，他のプレイヤのカード情報をすべて通. • 手札推定の正解率と強さの関係. 信するようにした（図 2 参照）．また，クライアント 0 と. • どのような場面で手札情報が有効に働くか. して改造版 snowl を用いる．改造版 snowl は snowl の手札. などを評価する．今後，各成功率の snowl を snowl 成功率と表す．また，. 推定部分のアルゴリズムが変更されており，サーバープログラムから得られるすべてのカード情報を用いて，手札推. 対戦相手となるクライアント 1 から 4 としては，snowl の. 定の正解確率 0%から 100%までの手札推定を模倣する．. 手札割り当てには推測値を基に割り当てるもの 3 つ（通常. まず，通常の snowl が実際にはどの程度正確な手札を利. snowl と表す）と，推測値を使わずランダムに割り当てる. 用してシミュレーションを行っているかを調べるために以. もの 1 つ（snowlrand と表す）とした．また，1,000 試合の. 下の実験を行う．. ゲームを 10 回，席替えルールをなしにしてゲームを行っ. 実験 1：. ている．. 通常の snowl が推測した相手手札とサーバから. 受け取った手札を比較することで，何%程度の推測に正解しているのか明らかにする．そして，手札推定の正解率ならびに正解方法が，強さにど. 5. 実験結果 5.1 実験 1:通常の snowl の手札推定の正解率今回の実験で利用した snowl が実際にはどの程度の手札. のように影響を与えるかを明らかとするため，以下の各実. を正確に把握してシミュレーションを行っているのかを. 験を行う．実験 2：. 基本正解率 0%のとき. 実験 3-1：. 基本正解率 50%で，各プレイヤの弱い手札を. 正解する場合実験 3-2：. 基本正解率 50%で，各プレイヤの強い手札を. 正解する場合実験 4：. 調べる．具体的には，snowl にサーバからの正しい手札情報と snowl の内部で生成された推測の手札情報を比較した．なお，この実験で用いた改造版 snowl はカードの提出方法は snowl と同一であるが，snowl と区別するために. snowl n と表記する．本実験では. 正解率 100%のとき. snowl の手札正解率 = 正解した相手手札の総数 · 100 推測した相手手札の総枚数. 模倣は，. ( 1 ) サーバーから提供されたカード情報を元に，まだ場に提出されていないカードを，基本正解率を満たすように相手手札推定のテーブルに割り当てる．たとえば，. 50%の場合は，まだ場に提出されていないカードのうち半分を，正確に相手手札推定のテーブルに割り当てる．. ( 2 ) まだ割り当てていないカードを，ランダムに割り当てる．ことにより行う．したがって，最終的な推測成功率は，基. として算出した．それぞれのクライアントが獲得した勝ち点の平均と全勝ち点中どの程度の勝ち点を集めたのかの比率をまとめたものを表 2 の標準の欄に，それぞれのクライアントが獲得した勝ち点の合計を 1,000 試合ごと集計したグラフを図 4 に示す．10,000 試合の結果で，正解したカードの総数 1,192,419,651，推測した手札の総枚数. 3,620,303,085 で，約 33%の確率で正解していることが分かった．snowl が正解した手札の内訳を図 1 に，カードの 10 9 8. 割合 (%). 7 6 5 4 3 2 1 0 3. 図 2 本研究でのシステム概要. ⓒ 2013 Information Processing Society of Japan. 4. 5. 6. 7. 8. 9 10 カード. J. Q. K. A. 2 joker. 図 3 snowl が正解したカードの強さ別の集計. 3.

(4) Vol.2013-GI-30 No.4 2013/6/28. 情報処理学会研究報告 IPSJ SIG Technical Report 表 1 通常の snowl が正解した手札の分布 (%) suit. 3. 4. 5. 6. 7. 8. 9. 10. J. Q. K. A. 2. ♠. 1.7106. 2.0565. 1.9950. 1.8303. 1.8463. 1.8671. 1.7862. 1.7647. 1.7131. 1.7323. 1.7579. 1.8550. 1.9219. ♥. 1.7485. 2.0551. 2.0353. 1.9301. 1.8946. 1.8686. 1.8567. 1.8008. 1.7779. 1.7680. 1.7595. 1.8255. 1.6614. ♦. 2.9742. 2.1408. 2.1281. 1.9288. 1.9036. 1.9289. 1.9184. 1.8047. 1.7880. 1.7560. 1.7846. 1.8247. 1.5940. ♣. 1.9543. 2.3794. 2.2872. 2.1092. 2.0350. 2.0007. 2.0000. 1.9289. 1.8485. 1.8399. 1.8448. 1.8341. 1.6054. joker. 1.0387. 3400. 3400. 3200. 3200 得点（ポイント）. 得点（ポイント）. . 3000 2800 2600 2400. 2000 1. 2. 3. 2800 2600 2400. snowl n snowl snowl snowl snowl random. 2200. 3000. snowl 0 snowl snowl snowl snowl random. 2200 2000 4. 5. 6. 7. 8. 9. 10. 1. 2. 3. 4. 試合. 図 4 標準 snowl の場合. 強さごとに集計した結果を図 3 に示す．snowl は. 5. 6. 7. 8. 9. 10. 試合. 図 5 snowl の手札推測正解率を 0%にした場合. ことがわかる．. • 一番最初にカードを出した相手がダイヤの 3 を持っている．. • (スートの優先順位により) 大貧民はスペードの 2 を持っていない．. 5.3 実験 3-1:各プレイヤの弱い手札を正解する場合 snowl の手札推定において相手の弱い手札情報がどのような影響を与えるのかを調べるために弱い方半分の正しい. を考慮しているので，♦3 と ♠2 はそれぞれ 3 と 2 のカー. 手札情報を snowl に与える実験を行った (snowl 50w)．そ. ドのなかでは他のスートより高くなっている．また，図 3. れぞれのクライアントが獲得した勝ち点の平均と全勝ち点. から，各カードごとにそれほど大きな正解率の差は見られ. 中どの程度の勝ち点を集めたのかの比率をまとめたものを. ないがカードの強さが強くなっていくほど正解率が減少し. 表 2 の 0%の欄に，それぞれのクライアントが獲得した勝. ていく傾向が見られる．. ち点の合計を 1,000 試合ごと集計したグラフを図 6 に示す．. 5.2 実験 2:正解率 0%の場合. が 2949.0∼2981.5，snowlrand が 2937.6 となり勝ち越して. 表 2 の平均勝ち点を見ると，snowl 50w が 3168.9，snowl 手札情報の全くない状態での snowl の強さの変化をみ. いる．比率を考えると，snowl のうち一番勝ち越したもの. るために snowl の推測正解率 0%にして対戦させる実験を. と比べても 0.0125，全員の力が拮抗した場合である 0.2000. 行った (snowl 0)．snowl 0 は相手手札の割り当てを完全に. を基準と考えても 0.0113，つまり 1%程度勝ち越している．. 乱数のみで行う．snowlrand との違いは，最初に行動した. また，図 6 より，snowl 50w が全体を通して snowl に勝ち. プレイヤに ♦3 を割り当てたり，交換に出したカードは相. 越していることがわかる．. 手が持っている等のいくつかの推定をなくした点である．それぞれのクライアントが獲得した勝ち点の平均と全勝ち. 5.4 実験 3-2:各プレイヤの強い手札を正解する場合. 点中どの程度の勝ち点を集めたのかの比率をまとめたも. 強いカードの推定が大貧民における強さにどう影響を与. のを表 2 の 0%の欄に，それぞれのクライアントが獲得し. えるのかを見るために，実験 3-1 と同じ要領で強い方から. た勝ち点の合計を 1,000 試合ごと集計したグラフを図 5 に. 半分だけをシミュレーション用に手札に反映させるように. 示す．対戦相手は 3002.0∼3039.3 となっているのに対し. して実験を行った (snowl 50s)．それぞれのクライアント. て，snowl 0 は 2949.2 と一番弱かった．また，図 5 から，. が獲得した勝ち点の平均と全勝ち点中どの程度の勝ち点を. snowl 0 のグラフは他の snowl のグラフの中の下の方に埋. 集めたのかの比率をまとめたものを表 2 の 50%（強）の. もれていることから，標準の snowl より平均的にやや弱い. 欄に，それぞれのクライアントが獲得した勝ち点の合計を. ⓒ 2013 Information Processing Society of Japan. 4.

(5) Vol.2013-GI-30 No.4 2013/6/28. 情報処理学会研究報告 IPSJ SIG Technical Report 表 2 改造 snowl の手札推測正解率と得られた平均点標準. 50%（弱）. 50%（強）. 100%. 平均. 割合. 平均. 割合. 平均. 割合. 平均. 割合. 平均. 割合. クライアント 0（snowl x）. 2949.2. 0.1966. 3000.8. 0.2001. 3168.9. 0.2113. 3032.9. 0.2022. 2800.8. 0.1867. クライアント 1（snowl）. 3010.8. 0.2007. 3018.5. 0.2012. 2949.0. 0.1966. 2967.0. 0.1978. 2916.0. 0.1944. クライアント 2（snowl）. 2998.7. 0.1999. 3035.0. 0.2023. 2963.0. 0.1975. 3029.8. 0.2020. 3029.2. 0.2019. クライアント 3（snowl）. 3039.3. 0.2026. 2963.1. 0.1975. 2981.5. 0.1988. 3028.2. 0.2019. 3132.2. 0.2088. クライアント 4（snowlrandom）. 3002.0. 0.2001. 2982.6. 0.1988. 2937.6. 0.1958. 2942.8. 0.1962. 3120.5. 0.2080. 3400. 3400. 3200. 3200 得点（ポイント）. 得点（ポイント）. 0%. 3000 2800 2600 2400. 2000 1. 2. 3. 2800 2600 2400. snowl 50w snowl snowl snowl snowl random. 2200. 3000. snowl 100 snowl snowl snowl snowl random. 2200 2000 4. 5. 6. 7. 8. 9. 10. 1. 試合. 2. 3. 4. 5. 6. 7. 8. 9. 10. 試合. 図 6 各プレイヤの弱い手札 50%を正解する場合. 図 8 snowl の手札推測正解率を 100%にした場合. 験を行った．それぞれのクライアントが獲得した勝ち点の. 得点（ポイント）. 3400. 平均と全勝ち点中どの程度の勝ち点を集めたのかの比率を. 3200. まとめたものを表 2 の 100%の欄に，それぞれのクライア. 3000. ントが獲得した勝ち点の合計を 1,000 試合ごと集計したグ. 2800. ラフを図 8 に示す．通常の 3 つの snowl がそれぞれ 2916∼. 3132point，snowlrand が 3120point 獲得しているのに比. 2600. べ，snowl 100 は 2800point と約 100point から 300point 程 2400. 獲得 point が少なくなっている．表 2 の比率を見ると他の. snowl 50s snowl snowl snowl snowl random. 2200 2000 1. 2. 3. 4 つのクライアントに比べて，100%正解の手札を与えた 4. 5. 6. 7. 8. 9. 10. 試合. 図 7 各プレイヤの強い手札 50%を正解する場合. 1,000 試合ごと集計したグラフを図 7 に示す．. snowl は 1%程度獲得ポイントが少ないという結果が得られた．また，図 8 の snowl 100 のグラフを見ると，試合全体を通して snowl に負け越している．. 6. 考察. 表 2 の平均勝ち点より，snowl 50s が 3032.9 で他のクラ. 図 9 に獲得した勝ち点の比率をまとめて示す．ここで，. イアントに僅差で勝ち越している．また比率を見ても全ク. snowlkai はそれぞれの実験で用いた改造 snowl であり，. ライアントのが値が 0.20 に近い事から強さが拮抗している. snowlmax と snowlmin はそれぞれの試合で最大の得点を. と言える．また，図 7 の snowl 50s のグラフと他のクライ. 得た snowl と最低の得点を得た snowl である．. アントのグラフを比べると，最初の 1,000 試合での snowl. 図 9 の snowlkai のグラフを見ると，snowl 100 が最も獲. の勝ち点が最大，最少は 5000∼6000 試合では snowlrand. 得勝ち点の比率が少なく，弱くなったと言える．逆に弱い. の値であり，snowl 50s の値もこの中に納まっていること. 方の手札 50%を与えた snowl 50w は最も勝ち点の比率が高. がわかる．. くなった．この 2 つのクライアントの値を，snowlmax と. snowlmin のグラフと比較しても，大きく通常の snowl から 5.5 実験 4:正解率 100%の場合 snowl が 100%正しい手札推定を行った場合の計算機実 ⓒ 2013 Information Processing Society of Japan. 値が外れており確実に強さが変化していることがわかる．. snowlkai の値の幅は，図 9 と表 2 より最大が snowl 50w の. 5.

(6) Vol.2013-GI-30 No.4 2013/6/28. 情報処理学会研究報告 IPSJ SIG Technical Report. • 一番強くなるのは相手手札中の弱いカードを 50%正解. 得点（ポイント）. 3400. した場合である．. 3200. • 弱いカードの推定が強さに繋がっている可能性がある．. 3000. • 手札情報がランダムでも snowl の強さにはそれほど影響しない．. 2800. • 手札推定が強さに与える影響は ±1%程度である. 2600. という結論が得られた．今回の実験では，100%の手札情. 2400 2200. 報を渡すと snowl が弱くなってしまうという結果になっ snowl kaix snowl max snowl min snowl avr. 2000 snowl 0. normal. た．一方で図 9 から snowl 100 以外のクライアントは通常の snowl と同じかそれ以上という結果を出していることが snowl 50w client. snowl 50s. snowl 100. わかる．このことから，モンテカルロシミュレーションでは正確な値は良い結果をもたらさない可能性があること. 図 9 クライアント別獲得勝ち点比率. と，いくらかのランダム性のある手札を用いた方が選択肢が広がりよい選択をする可能性があることがわかった．. 0.2113, 最少が snowl 100 の 0.1867，0.2113∼0.1867 であ. snowl 100 が弱くなってしまったのは，モンテカルロシミュ. ることがわかる．全員が均等に取り合った値である 0.20 と. レーション中でゲーム木の枝狩りの際に余計な選択肢がな. の差として考えると+0.0113∼-0.0133 である．つまり，基. い分評価値のあまりよくない選択をしてしまっているから. 準 20%から ±1%程度の差が出ていることになる．つまり，. だと推測される．. snowl の手札推定に関しては ±1%程度の影響であると言え. 今回の実験では 100%·50%· 0%という少ない場合分けで. る．このことから，先行研究であげた「大貧民における相. しか行わかなったため，どの程度の手札を正確に推定する. 手手札推定」で西野氏が述べたとおり snowl の強さは手札. のが最もよい結果をもたらすのかはまだ不明である．また，. 推定よりも必勝手探索等の他の部分の要因が大きいと言え. 同じ正解確率でも 50%の例で見られたように推定するカー. る．しかし，確かに強さに影響したことから手札推定の正. ドによって結果が変わってくる場合がある．そこで，今後. 解率に関しては最適値があるとも考えられる．. の課題としてさらに詳細な場合分けをして実験を行うこと. また，snowl 50s と snowl 50w はシミュレーションの手. があげられる．さらに，各確率毎の snowl 同士の提出手を. 札に正確に渡しているカードが強いか弱いかの差しかない. 比較することで実際には手札情報の差がどのように強さと. が，図 9 から snowl 50w の方が明らかに勝ち越している. つながっているのかを明らかにできると期待できる．これ. ことがわかる．加えて図 3 から snowl は強いカードよりも. らの結果から，それらの情報解明することにより大貧民に. 弱いカードの方が正解率がわずかに高いことがわかってい. おける棋風や定石の解明につながることも期待される．. る．これらのことから手札推定をする際には，強いカードよりも弱いカードを推定する方が強さへの有効性が高いの. 参考文献. ではないかと推定される．これは大貧民プレイのゲーム木. [1]. を考えると，強い手札の推定が成功した場合よりも弱い手札の推定が成功した場合の方が，広く枝が展開されるため. [2]. ではないかと考えられる．例えば，相手が 5 のカード持っていることが推測でき，もし提出されたらその後に出せるカードは 6∼2 と joker とパスの全部で 12 通りの枝が考え. [3]. られるが，2 が推測できたとしてもその後の枝の広がりは. joker かパスしかない．そのため，その後の展開の広がり. [4]. に差が出てしまい推測するカードによって差が出たのではないかと考えられる．. 7. おわりに. [5]. [6]. 本研究では手札推定の効果を，手札推定の正解率が. 100%·50%·0% の snowl を用いることで検討した．その結果. • 100%正確な手札を推定すると，ランダムの場合より. [7]. 小沼啓, 本多武尊, 保木邦仁, 西野哲朗: コンピュータ大貧民に対する差分学習法の応用, 情報処理学会研究報告. GI, [ゲーム情報学], Vol. 2012-GI-27, No. 1 (2012). 須藤郁弥, 成澤和志, 篠原歩: UEC コンピュータ大貧民大会向けクライアント「snowl」の開発, 第 2 回 UEC コンピュータ大貧民シンポジウム (2010). 西野順二, 西野哲朗: 大貧民における相手手札推定, 情報処理学会研究報告. MPS, 数理モデル化と問題解決研究報告, Vol. 2011, No. 9, pp. 1–6 (2011). 西野順二, 西野哲朗: 大貧民における偶然手番感度, 情報処理学会研究報告. GI, [ゲーム情報学], Vol. 2013, No. 5, pp. 1–8 (2013). 西野哲朗, 大久保誠也: コンピュータ大貧民 (特集思考ゲーム), 人工知能学会誌, Vol. 24, No. 3, pp. 361–366 (20090501). 地曳隆将, 松崎公紀: 大貧民において不完全情報性がモンテカルロ法によるプレイヤに与える影響の調査, 情報処理学会研究報告. GI, [ゲーム情報学], Vol. 2012, No. 6, pp. 1–8 (2012). 藤藤郁弥, 篠原歩: モンテカルロ法を用いたコンピュータ大貧民の思考ルーチン設計, 第 1 回 UEC コンピュータ大貧民シンポジウム (2009).. も弱くなってしまう． ⓒ 2013 Information Processing Society of Japan. 6.

(7)