第 3 章 生物学的制約に基づく人間的なゲーム AI の自律的構成 39
3.5 考察
第3章 生物学的制約に基づく人間的なゲームAIの自律的構成
行錯誤)」を感じさせる要素として,『生物学的制約』を導入することの妥当性が示 された.
[上級者]は人間プレイヤの操作であるにもかかわらず,人間らしくないと評価さ れている.また,ほぼ最適解である[探索,無し]は[上級者]よりもさらに人間らし くない(5%の有意水準で有意差あり)という評価である.自由記述質問では,人 間らしくないと感じる理由として「敵や穴をギリギリまで避けない」,「無駄な行動 が一切ない」,「動きが一定である」という回答があった.この結果は,「過度に最 適化された振る舞いは人間らしくない」ことを意味し,強いエージェントを人間 プレイヤの代替として扱うことができない根拠が示された.また,このことから,
[強化,導入]と[強化,無し]で有意差が認められていない理由も説明できる.[強化, 無し]は[上級者]や[探索,無し]のスコアに遠く及んでおらず(表3.3),最適化さ れた振る舞いの獲得に至っていないためと考えられる.Q学習エージェントの改 良には,3.2.4項で述べたゲーム局面sの観測情報を拡張する必要がある.
[強化,導入,挑戦のみ]は,生物学的制約を導入しているにもかかわらず,比較的 人間らしくないという評価である.自由記述質問では「段差や土管にぶつかって からジャンプする振る舞いが人間らしくない」という回答があった.この動画は,
スコアがかなり低く,その「たどたどしい」振る舞いは,コントローラ操作やゲー ムルールに慣れていない,あたかもゲーム初心者の操作のようであった.この結 果は,「初心者相当の下手すぎる振る舞いは人間らしくない」ことを意味する.ま た,「訓練と挑戦のバランス」を変化させることで,人間の熟達過程を再現できる 可能性が示された.
[初級者]は,人間プレイヤの動画であり,スコアもあまり高くないにもかかわ
らず,人間らしいという評価を得ていない.その理由として,動画を録画した際 の初級者プレイヤが,極力キー操作を減らして安全に進むために「十字ボタンの 右キーは押しっぱなしで,タイミング良くジャンプをすることに注力する」とい うプレイスタイルであったこと,また,ダッシュボタンとジャンプボタンを同時 に押すことができないコントローラの持ち方(中級者以上は右手親指を両ボタン の上に被せる持ち方が多い)であったことが分かった.そのため,「ジャンプの高 さや進むスピードが一定で人間らしくない」という評価が多かったと考えられる.
一方,「初級者はダッシュを使えないから自然にみえる」という評価も一部あった.
図3.4と図3.5の結果の差異から,マリオのスピードは人間らしさの評価基準の 1つであり,実験参加者によって人間らしいと感じるスピードが異なることが示 唆された.速さと相関ありの実験参加者5名を除いた15名にとっては,生物学的 制約の導入がエージェントの振る舞いの人間らしさを向上させる要因の1つであ ると考えられる.また,速さと相関ありの実験参加者のマリオの累計プレイ時間 が平均46時間,スピードと相関なしの実験参加者は平均36時間,速さと逆相関
3.5 考察 ありの実験参加者は平均25時間であることから,実験参加者のゲームへの熟練度 が人間らしさの評価基準を決定づけている可能性も示唆された.
人間は誰しも,身体的な制約を生得的に持っており,また,生きていくためには 訓練や挑戦といった自己実現の欲求が必要不可欠である.人間は,これらの制約 や欲求が考慮された振る舞いからは,「ためらい」や「余裕」,「熟慮(試行錯誤)」
といった感情を想起し,その結果,人間らしい振る舞いであると解釈していると 言える.逆に,それらの制約や欲求を無視した「過度に最適化された振る舞い」か らは,情緒的な反応が惹起されることがなく,人間らしさも感じないのであろう.
本章の主観評価実験において浮き彫りとなった重要な課題として,「人間らしさ の評価基準は実験参加者間で異なるのではないか」という問題が挙げられる.[初 級者]の動画のように,動画の操作者のプレイスタイルを実験参加者が想像できる かどうかによって,主観評価の結果に大きな差異がでる事例もある.また,マリ オの攻略スピードと人間らしさの相関からも,速い振る舞いの方が人間らしいと 感じる人,逆に,遅い振る舞いの方が人間らしいと感じる人が存在することが分 かる.実験参加者の横スクロール型マリオの熟練度や,ゲームに対する知識やプ レイスタイルを知っているかどうかが,人間らしさの評価に影響している可能性 も十分にある.実験参加者を群分けすることで,実験参加者間の評価基準の差異 を検証する必要があり,また,人間が人間らしさを解釈するための評価基準の策 定も必要となってくる.
『人間らしい』という感覚は,未だ形式知化されていないものの,確かに人間が 感じる感覚である.認知心理学的見地では,人間が目前で起こっている事象を理 解し認知する際,スキーマと呼ばれる一般化された「知識の枠組み」を利用して,
複雑な情報認識の効率化を図ると考えられている[58].マリオの振る舞いが人間 らしいかどうか判断できるということは,人間は『人間らしさのスキーマ』を後 天的に獲得しており,その振る舞いが人間らしさのスキーマにどの程度一致して いるか(典型性が高い事例かどうか)を判断しているといえる[59].スキーマの 形成(体制化)には,常識,物理法則などの知識に加えて,自身の過去経験,自己 スキーマ(自分はどういう人間であるか),固定観念(ステレオタイプ)も影響を
与える[60, 61].人間らしさのスキーマは個人個人で異なるため,マリオのスピー
ドと人間らしさの評価点数の相関に実験参加者間で差があったと考えられる.
人間の心的活動を機械で扱えるようモデル化した例として,Minskyは心の6階 層モデルを提唱している[62].1)本能的反応,2)学習反応,3)熟考,4)内省的思 考,5)自己内省的思考,6)自意識の内省,の6階層から構成され,生得的・本能 的欲動を扱う低次の層から,価値観や理想を扱う高次の層の順に分類されている.
機械学習手法や経路探索手法で獲得された強いエージェントは,ゲームにおける 行動の評価値を学習する「2)学習反応」,どの行動が有効か熟考し判断する「3)熟
第3章 生物学的制約に基づく人間的なゲームAIの自律的構成
考」,を実施していると考えることもできる.しかし,人間が生得的に持っている
「1)本能的反応」を無視した結果,強いエージェントの振る舞いは機械的になるの であろう.本研究で提案したエージェントは,「1)本能的反応」として『生物学的 制約』を導入することで,「1)本能的反応」「2)学習反応」「3)熟考」を実施するこ とが可能となり,その結果人間らしい振る舞いを表出することができたといえる.
エージェントの人間らしさを主観評価する場合,人間は「4)内省的思考」「5)自己 内省的思考」「6)自意識の内省」の階層で,自身の過去経験,自己スキーマ,固定 観念から人間らしさのスキーマを形成し,エージェントの振る舞いが人間らしい かどうか判断しているといえる.