• 検索結果がありません。

プレイヤー側のキャラクター2種と敵側のキャラクター1種を戦わせ、敵側のキャラクターの ビヘイビアツリーの評価を行った。プレイヤー側のキャラクターはそれぞれP1P2 と表記し、

敵側のキャラクターはE と表記する。

P1 は物理攻撃を主体とし、P2は回復と魔法攻撃を行うようにした。Eは物理攻撃、魔法攻撃、

回復を平均的に使用するようにした。

P1 には5つのアクションがあり、弱物理攻撃、強物理攻撃、M P 回復、バフ、デバフの5つで ある。表4.2が上記のアクションをまとめた表である。

4.2 P1のアクション 名称 効果

弱物理攻撃 AT K の数値分の物理攻撃を行う

強物理攻撃 M P を5消費しAT Kの3倍の物理攻撃を行う M P 回復 M P を20回復する

バフ M P を10消費して自分のステータスを一時的に上げる デバフ M P を5消費して相手のステータスを一時的に下げる

P1 のビヘイビアツリーは開始となるrootノードから始まり、rootノードの下位に選択ルール が条件ルールの中間ノードがひとつある。この中間ノードをN11 とする。N11 の条件はM P

値によって分岐を行う。N11 は1 つの中間ノードと1つのアクションノードを持つ。M P の値 が5より大きい場合は下位の中間ノードを選択する。この中間ノードをN12とする。M P の値が 5より小さい場合は下位のアクションノードを選択する。このアクションノードに設定したアク ションはM P 回復である。

N12 の選択ルールは条件ルールである。N12 は1つのアクションノードと1つの中間ノードを 持つ。M P の値が10より大きく、現在自分にバフが掛かっていない場合は下位のアクションノー ドを選択する。このアクションノードに設定したアクションはバフである。上記の場合以外は下 位の中間ノードを選択する。この中間ノードをN13 とする。

N13 の選択ルールはランダムルールである。N13 は3つのアクションノードを持つ。N13 は3 つのアクションノードを等確率で選択する。各アクションノードに設定したアクションは弱物理 攻撃、強物理攻撃、デバフである。図4.1が上記の構造を表したビヘイビアツリーである。

4.1 P1のビヘイビアツリー

P2 には7つのアクションがあり、物理攻撃、弱魔法攻撃、強魔法攻撃、M P 回復、弱HP 復、強HP 回復、全体HP 回復の7つである。表4.3が上記のアクションをまとめた表である。

4.3 P2のアクション 名称 効果

物理攻撃 AT Kの数値分の物理攻撃を行い、M P を5回復 弱魔法攻撃 M P を3消費しM AT K の数値分の物理攻撃を行う 強魔法攻撃 M P を10消費しM AT K の3倍の物理攻撃を行う

M P 回復 M P を30回復する

HP 回復 M P を5消費し対象の味方キャラクターのHP を20回復 強HP 回復 M P を15消費し対象の味方キャラクターのHP を50回復 全体HP 回復 M P を20消費し味方キャラクター全員のHP を20ずつ回復

P2 のビヘイビアツリーは開始となるrootノードから始まり、rootノードの下位に選択ルール が条件ルールの中間ノードがひとつある。この中間ノードをN21 とする。N21は1つのアクショ ンノードと2つの中間ノードを持つ。M P の値が15より小さい場合は下位のアクションノード を選択する。このアクションノードに設定したアクションはをM P 回復である。M P の値が15 より大きく、1 キャラクターでもHP が半分以下の味方キャラクターがいる場合、または味方 キャラクター全体の合計HP が半分以下の場合は下位の中間ノードのひとつを選択する。この中 間ノードをN22 とする。上記の場合以外は下位にあるもうひとつの中間ノードを選択する。この 中間ノードをN23 とする。

N22 の選択ルールは条件ルールである。N22 は1つのアクションノードと1つの中間ノードを 持つ。M P の値が20より大きく、味方キャラクター全体の合計HP が半分以下の場合は下位の アクションノードを選択する。このアクションノードに設定したアクションはを全体HP 回復で ある。上記の場合以外は下位の中間ノードを選択する。この中間ノードをN24 とする。

N23 の選択ルールは条件ルールである。N23 は1つのアクションノードと1 つの中間ノード を持つ。M P の値が 30より小さい場合は下位のアクションノードを選択する。このアクション ノードに設定したアクションはを物理攻撃である。上記の場合以外は下位の中間ノードを選択す る。この中間ノードをN25とする。

N24 の選択ルールは条件ルールである。N24 は2つのアクションノードを持つ。M P の値が 15より小さい、または味方キャラクターのHP が25%より多い場合は下位の1つ目のアクショ ンノードを選択する。このアクションノードに設定したアクションはを弱HP 回復である。上記 の場合以外は下位にあるもうひとつのアクションノードを選択する。このアクションノードに設 定したアクションはを強HP 回復である。

N25の選択ルールは条件ルールである。N25は2つのアクションノードを持つ。M P の値が30 より小さい場合は下位の1つ目のアクションノードを選択する。このアクションノードに設定し たアクションはを弱魔法攻撃である。上記の場合以外は下位にあるもうひとつのアクションノー ドを選択する。このアクションノードに設定したアクションはを強魔法攻撃である。図4.2が上 記の構造を表したビヘイビアツリーである。

4.2 P2のビヘイビアツリー

Eには9つのアクションがあり、単体物理攻撃、単体魔法攻撃、全体物理攻撃、全体魔法攻撃、

ランダム物理攻撃、ランダム魔法攻撃、バフ、デバフ、HP 回復の9つである。表4.4が上記の アクションをまとめた表である。

4.4 Eのアクション

名称 効果

単体物理攻撃 AT Kの数値分の物理攻撃を行う 単体魔法攻撃 M AT Kの数値分の魔法攻撃を行う

全体物理攻撃 相手全員にAT Kの半分の数値分の物理攻撃を行う 全体魔法攻撃 相手全員にM AT K の半分の数値分の魔法攻撃を行う

ランダム物理攻撃 ランダムに相手へAT Kの半分の数値分の物理攻撃を3回行う ランダム魔法攻撃 ランダムに相手へAT Kの半分の数値分の魔法攻撃を3回行う

バフ 自分のステータスを一時的に上げる デバフ 相手のステータスを一時的に下げる

HP 回復 HP を回復

Eのビヘイビアツリーは開始となるrootノードから始まり、rootノードの下位に選択ルールが 順番ルールの中間ノードがひとつある。この中間ノードをN31 とする。N31 は3つの中間ノード を持ち、選択される順番から下位の3つの中間ノードをN32, N33, N34 とする。

N32 の選択ルールはランダムルールである。N32 は1つのアクションノードと1つの中間ノー ドを持つ。下位のアクションノードと中間ノードを等確率で選択する。アクションノードに設定 したアクションは単体物理攻撃であり、下位の中間ノードはN35とする。

N33 の選択ルールはランダムルールである。N33 は1つのアクションノードと1つの中間ノー ドを持つ。下位のアクションノードと中間ノードを等確率で選択する。アクションノードに設定 したアクションは単体魔法攻撃であり、下位の中間ノードはN36とする。

N34 の選択ルールはランダムルールである。N34 は1つのアクションノードと1つの中間ノー ドを持つ。下位のアクションノードと中間ノードを等確率で選択する。アクションノードに設定 したアクションはHP 回復であり、下位の中間ノードはN37とする。

N35 の選択ルールは順番ルールである。N35 は2つのアクションノードを持つ。下位にある2 つのアクションノードを順番に選び、設定したアクションはそれぞれ全体物理攻撃とランダム物

理攻撃である。

N36 の選択ルールは順番ルールである。N36 は2つのアクションノードを持つ。下位にある2 つのアクションノードを順番に選び、設定したアクションはそれぞれ全体魔法攻撃とランダム魔 法攻撃である。

N37 の選択ルールは条件ルールである。N37 は2つのアクションノードを持つ。自分にバフが 掛かっていない場合はバフを設定したアクションノードを選択し、既に自分にバフが掛かってい る場合はデバフを設定したアクションノードを選択する。図4.3が上記の構造を表したビヘイビ アツリーである。

4.3 Eのビヘイビアツリー

この上記の3キャラクターを戦わせ、E のビヘイビアツリーの評価を行った。本節の検証では 3キャラクターのステータスを下記の表4.5にある数値で検証を行った。

4.5 各キャラクターのステータス

キャラクター HP M P AT K M AT K DEF M DEF SP D

P1 300 100 10 0 4 1 10

P2 200 200 1 10 0 5 10

E 1000 – 10 10 1 1 5

本節の検証ではベイズ推定の結果が収束しやすいように比較的ターン数が多くなるように数値 を設定した。ランダムに行動を選択する中間ノードがあるため複数回評価を行い、ベイズ推定後 の確率分布を比較した。評価の結果は1回目からn回目を順にT1, T2, ...Tnとして表記する。

図4.4T1の評価結果を示したものである。

4.4 T1の評価結果

T1 では269ターンでプレイヤー側が勝利した。図の各曲線が確率分布を表し、中間ノードをそ れぞれ示している。T1 では図4.4から分かるように1つの分布の山が右側であるp= 1の近くに なった。この分布が指す中間ノードが悪い選択を起こしやすい中間ノードであると考えられる。

次にT2の評価結果である。図4.5がT2 の評価結果を示したものである。

関連したドキュメント