考察 - 生物学的制約に基づく人間的なゲーム AI の自律的構成 39 - 人間らしい振る舞いを自動獲得するゲームAIに関する研究

第 3 章生物学的制約に基づく人間的なゲーム AI の自律的構成 39

3.5 考察

第3章生物学的制約に基づく人間的なゲームAIの自律的構成

行錯誤）」を感じさせる要素として，『生物学的制約』を導入することの妥当性が示された．

[上級者]は人間プレイヤの操作であるにもかかわらず，人間らしくないと評価されている．また，ほぼ最適解である[探索,無し]は[上級者]よりもさらに人間らしくない（5%の有意水準で有意差あり）という評価である．自由記述質問では，人間らしくないと感じる理由として「敵や穴をギリギリまで避けない」，「無駄な行動が一切ない」，「動きが一定である」という回答があった．この結果は，「過度に最適化された振る舞いは人間らしくない」ことを意味し，強いエージェントを人間プレイヤの代替として扱うことができない根拠が示された．また，このことから，

[強化,導入]と[強化,無し]で有意差が認められていない理由も説明できる．[強化, 無し]は[上級者]や[探索,無し]のスコアに遠く及んでおらず（表3.3），最適化された振る舞いの獲得に至っていないためと考えられる．Q学習エージェントの改良には，3.2.4項で述べたゲーム局面sの観測情報を拡張する必要がある．

[強化,導入,挑戦のみ]は，生物学的制約を導入しているにもかかわらず，比較的人間らしくないという評価である．自由記述質問では「段差や土管にぶつかってからジャンプする振る舞いが人間らしくない」という回答があった．この動画は，

スコアがかなり低く，その「たどたどしい」振る舞いは，コントローラ操作やゲームルールに慣れていない，あたかもゲーム初心者の操作のようであった．この結果は，「初心者相当の下手すぎる振る舞いは人間らしくない」ことを意味する．また，「訓練と挑戦のバランス」を変化させることで，人間の熟達過程を再現できる可能性が示された．

[初級者]は，人間プレイヤの動画であり，スコアもあまり高くないにもかかわ

らず，人間らしいという評価を得ていない．その理由として，動画を録画した際の初級者プレイヤが，極力キー操作を減らして安全に進むために「十字ボタンの右キーは押しっぱなしで，タイミング良くジャンプをすることに注力する」というプレイスタイルであったこと，また，ダッシュボタンとジャンプボタンを同時に押すことができないコントローラの持ち方（中級者以上は右手親指を両ボタンの上に被せる持ち方が多い）であったことが分かった．そのため，「ジャンプの高さや進むスピードが一定で人間らしくない」という評価が多かったと考えられる．

一方，「初級者はダッシュを使えないから自然にみえる」という評価も一部あった．

図3.4と図3.5の結果の差異から，マリオのスピードは人間らしさの評価基準の１つであり，実験参加者によって人間らしいと感じるスピードが異なることが示唆された．速さと相関ありの実験参加者5名を除いた15名にとっては，生物学的制約の導入がエージェントの振る舞いの人間らしさを向上させる要因の１つであると考えられる．また，速さと相関ありの実験参加者のマリオの累計プレイ時間が平均46時間，スピードと相関なしの実験参加者は平均36時間，速さと逆相関

3.5 考察ありの実験参加者は平均25時間であることから，実験参加者のゲームへの熟練度が人間らしさの評価基準を決定づけている可能性も示唆された．

人間は誰しも，身体的な制約を生得的に持っており，また，生きていくためには訓練や挑戦といった自己実現の欲求が必要不可欠である．人間は，これらの制約や欲求が考慮された振る舞いからは，「ためらい」や「余裕」，「熟慮（試行錯誤）」

といった感情を想起し，その結果，人間らしい振る舞いであると解釈していると言える．逆に，それらの制約や欲求を無視した「過度に最適化された振る舞い」からは，情緒的な反応が惹起されることがなく，人間らしさも感じないのであろう．

本章の主観評価実験において浮き彫りとなった重要な課題として，「人間らしさの評価基準は実験参加者間で異なるのではないか」という問題が挙げられる．[初級者]の動画のように，動画の操作者のプレイスタイルを実験参加者が想像できるかどうかによって，主観評価の結果に大きな差異がでる事例もある．また，マリオの攻略スピードと人間らしさの相関からも，速い振る舞いの方が人間らしいと感じる人，逆に，遅い振る舞いの方が人間らしいと感じる人が存在することが分かる．実験参加者の横スクロール型マリオの熟練度や，ゲームに対する知識やプレイスタイルを知っているかどうかが，人間らしさの評価に影響している可能性も十分にある．実験参加者を群分けすることで，実験参加者間の評価基準の差異を検証する必要があり，また，人間が人間らしさを解釈するための評価基準の策定も必要となってくる．

『人間らしい』という感覚は，未だ形式知化されていないものの，確かに人間が感じる感覚である．認知心理学的見地では，人間が目前で起こっている事象を理解し認知する際，スキーマと呼ばれる一般化された「知識の枠組み」を利用して，

複雑な情報認識の効率化を図ると考えられている[58]．マリオの振る舞いが人間らしいかどうか判断できるということは，人間は『人間らしさのスキーマ』を後天的に獲得しており，その振る舞いが人間らしさのスキーマにどの程度一致しているか（典型性が高い事例かどうか）を判断しているといえる[59]．スキーマの形成（体制化）には，常識，物理法則などの知識に加えて，自身の過去経験，自己スキーマ（自分はどういう人間であるか），固定観念（ステレオタイプ）も影響を

与える[60, 61]．人間らしさのスキーマは個人個人で異なるため，マリオのスピー

ドと人間らしさの評価点数の相関に実験参加者間で差があったと考えられる．

人間の心的活動を機械で扱えるようモデル化した例として，Minskyは心の6階層モデルを提唱している[62]．1)本能的反応，2)学習反応，3)熟考，4)内省的思考，5)自己内省的思考，6)自意識の内省，の6階層から構成され，生得的・本能的欲動を扱う低次の層から，価値観や理想を扱う高次の層の順に分類されている．

機械学習手法や経路探索手法で獲得された強いエージェントは，ゲームにおける行動の評価値を学習する「2)学習反応」，どの行動が有効か熟考し判断する「3)熟

第3章生物学的制約に基づく人間的なゲームAIの自律的構成

考」，を実施していると考えることもできる．しかし，人間が生得的に持っている

「1)本能的反応」を無視した結果，強いエージェントの振る舞いは機械的になるのであろう．本研究で提案したエージェントは，「1)本能的反応」として『生物学的制約』を導入することで，「1)本能的反応」「2)学習反応」「3)熟考」を実施することが可能となり，その結果人間らしい振る舞いを表出することができたといえる．

エージェントの人間らしさを主観評価する場合，人間は「4)内省的思考」「5)自己内省的思考」「6)自意識の内省」の階層で，自身の過去経験，自己スキーマ，固定観念から人間らしさのスキーマを形成し，エージェントの振る舞いが人間らしいかどうか判断しているといえる．

ドキュメント内人間らしい振る舞いを自動獲得するゲームAIに関する研究 (ページ 64-67)

考察

第 3 章 生物学的制約に基づく人間的なゲーム AI の自律的構成 39

3.5 考察

第 3 章生物学的制約に基づく人間的なゲーム AI の自律的構成 39