人間レベルの汎用人工知能の実現に向けた展望(<特集>汎用人工知能(AGI)への招待)

(1)

人間レベルの汎用人工知能の

実現に向けた展望

＊1

Mapping the Landscape of Human-Level Artificial General Intelligence

アダムズサム S.

IBM Research

Sam S. Adams IBM Research.

アレルイタマール

テネシー大学

Itamar Arel University of Tennessee.

バッハヨシャ

フンボルト大学

Joscha Bach Humboldt University of Berlin.

クープロバート

テネシー大学

Robert Coop University of Tennessee．

ファーランロッド

シンギュラリティ大学

Rob Furlan Singularity University.

ゲーツェルベン

ノバメンテ LLC ＆厦門大学

Ben Goertzel Novamente LLC and Xiamen University．

ホールジョシュストアズ

Institute for Molecular Manufacturing

J. Storrs Hall Institute for Molecular Manufacturing.

サムソノヴィッチアレクセイ

ジョージメイソン大学

Alexei Samsonovich George Mason University.

ショイツマティアス

インディアナ大学

Matthias Scheutz University of Indiana.

シュレジンガーマシュー

南イリノイ大学

Matthew Schlesinger South Illinois University.

シャピロスチュアート

ニューヨーク州立大学バッファロー校

Stuart C. Shapiro SUNY Buffalo.

ソワジョン

Vivomind

John Sowa Vivomind.

「汎用人工知能（AGI）への招待」

＊1 Copyright 2012 by the Association for the Advancement of Artificial Intelligence （AAAI）．Reprinted in Japanese ─ May 2014, 3200 copies by the Japanese Society for Artificial Intelligence （publisher）．

(2)

概　要

本論文では人間レベルの汎用人工知能（Artificial General Intelligence：以下 AGI）の実現に向けたロードマップの概要を述べる．AGI 一般に関する議論から始め，実現への現実的な目標および特性と必要条件に関して基本的な定義を行い，AGI が備えるべき能力の起点となる展望（全体図）を示す．具体的には，発達心理学から AGI の主要テーマを導出し，数学的・生理学的・情報処理的観点から実装に必要な知見を得る．AGI の性能評価に適したタスクと環境を同定し，AGI の全体図上のロードマップを構成するマイルストーンとして七つのシナリオを示すことで，さらなる AGI 研究や連携の方向性を提示する．

1．は　じ　め　に

本論文では，準備段階となる 2009 年 10 月にテネシー大学ノックスビル校での「AGI ロードマップワークショップ」の共著者らとの議論共同作業の成果を紹介する．いくつかのアイディアは，John Laird と Pat Langley が開催した 2 回のワークショップ（2008 年後半にアナーバー，2009 年前半にテンピで開催）で議題とした「人間レベルの AI のための評価と計測法」での議論にまでさかのぼる．なお，アナーバーでのワークショップの議論は [Laird 09] にまとめられている．そして本稿の着想の源となったのは，Itamar Arel の発表「AGI ロードマップ」[Arel 09a] を契機として開催された AGI 国際会議 2009 の併設ワークショップ「AGI の将来」での議論，および AGI ロードマップ作成についての先行論文 [Arel 09b] である．言うまでもなく，こうした取組みは人間レベルの AGI への道筋を示す初の試みではないだろう．なぜならば AGIの実現は 1950 年代の AI 分野の創立からの目標である．それ以降の期間では，より狭い目標の実現（特定のサブゴール）に主要な AI 研究の関心が集まってはいたとはいえ，AI 研究者らが絶え間なく追い求めてきた目標が AGI なのである．よって本論文で示すアイディアは，さまざまな先人のアイディアの上に築かれている．しかし AI の歴史を振り返り，先行研究の文脈の上に我々の取組みを位置付けるには，本稿では紙面が足りない．そこで残念ながら，数多くの先行研究に関わる研究者らに謝意を示しつつ，AGI ロードマップの議論成果のみを述べることにする．近年の AI システムの評価を行う先行研究の参考文献としては [Laird 09] や [Goertzel 09] を本稿の前提として参考にされたい． AGIを実現するまでの進捗の程度を測定するには，一般論とそれを反映した現実的な目標の両方が必要である．そこで議論の暫定的な出発点としては，[Laird 10] 監訳：

篠田　孝祐

電気通信大学

Kosuke Shinoda University of Electro-Communications. [email protected]

共訳：

市瀬　龍太郎

国立情報学研究所

Ryutaro Ichise National Institute of Informatics． [email protected]

ジェプカラファウ

北海道大学

Rafal Rzepka Hokkaido University．

[email protected]

寺尾　　敦

青山学院大学

Atsushi Terao Aoyama Gakuin University． [email protected]

船越　孝太郎

株式会社ホンダ・リサーチ・インスティチュート・ジャパン

Kotaro Funakoshi Honda Research Institute Japan Co., Ltd. [email protected]

松島　裕康

産業技術総合研究所

Hiroyasu Matsushima National Institute of Advanced Industrial Science and Technology． [email protected]

山川　　宏

株式会社富士通研究所

Hiroshi Yamakawa Fujitsu Laboratories Ltd. [email protected]

(3)

が提案した AGI が備えるべき特性と必要条件に多少手を加えたものを採用し，引き続く AGI の達成度評価に用いる複数の具体的なシナリオを議論する際の基盤とする．初期的な試みとして，AGI の能力を展望する方法として発達心理学から主要なテーマを用い，それらについての意義を数学的・生理学的・情報処理的な観点から明らかにする．こうして特定のタスクと環境で能力を評価しながら AGI の構築に挑戦することが可能になる．いくつかのシナリオが，AGI の実現に向けたロードマップを形づくるマイルストーンとして提示される．そして将来研究における方向性を示すとともに共同研究の必要性を指摘して，本論文の結論とする．

2．目標：人間レベルの汎用知能

ここで検討する AGI 研究の目標を一言で言えば，人間が備える広範な汎用知能を，システムとして開発し実証することである．これは黎明期の人工知能研究で想定された目標の繰返しともいえるが，それ以降の AI 研究においては，多くの努力は「弱い AI」システムに注がれ，それらシステムは特定のタスクでは時に人間以上の能力を示せても，その能力をほかのタスクや問題領域に汎化できなかった．チェスにおいて当時世界チャンピオンであったカスパロフを破った IBM の DeepBlue [Campbell 02] は「弱い AI」の代表例である．DeepBlue は人間が相当の再実装を行わなければ，別の問題領域でその能力を生かすことはできない．同様に IBM の問題応答システムの WATSON [Ferrucci 10]は 2011 年前半に，クイズ番組「Jeopardy!」で二人の最強クイズ王から劇的な勝利を得た．しかし，「自分自身で」シカゴのオヘア空港からミッドウェイ空港へと乗り換えた経験はなく，それゆえ，米国内でよく飛行機を利用する人間なら誰しも答えられるような質問に口ごもる結果となった．この WATSON の基礎技術を，ヘルスケアやコールセンタ支援など別の領域で用いるには，単に AI システムを教育するだけでは事足りない．大幅な再実装や関連データの人間による再評価を必要とすることは明らかである．これを人間に例えるならば，新しいタスクに直面するごとに脳外科手術をして脳を入れ替えるようなものである．これらの特化した AI システムは，限定された役割において優秀である反面，きちんと教育された成人のもつ専門知識はもちろん 5 歳児程度の基本的な認知能力や常識をもち合わせていない． AGIの創成に関わるタスク領域の広がりを踏まえるならば，複数の研究グループ間の協力や協調が，長期的には成功への近道となるだろう．それゆえ，AGI の実現を成功させるには，共通の目標やその展望への理解が要であり，そうした方向に向けて着実に前進することが我々のワークショップの目標であった． 2･1　AGI のための現実的な目標人間における汎用知能が多才であるがゆえに，包括的かつ粒度の細かい AGI 評価システムを具体的に開発することは困難を極めている．個別の能力について詳細な評価指標を定めることで AGI を目指す研究は推奨するが，現段階で実際に合意できる目標としては抽象的なレベルに留まらざるを得ない．黎明期からの AI 研究の第一人者である Nils Nilsson はこうした目標に関して，2005 年の AI Magazine の記事「人間レベルの人工知能だって？　冗談でしょ！」 [Nilsson 05]の中で次のように語っている．「真に人間レベルの人工知能が実現されるとは，必然的に，現状では人間が報酬を得て行っているタスクの多くを自動化できることを意味するだろう．こうした自動化を目標とするならば，特殊な用途のシステムを構築するよりも，人間がこなせるさまざまな業務を学習したり教育されたりする汎用的な学習システムを開発する方法に賛成する．同様の提案はしばしば見られるが，つくり込みは最小限に抑えられつつも，獲得し得る能力は膨大であるようなシステムから始めるべきであろう．そして学習を通して成長する能力が，さまざまな能力とともに組み込まれている必要がある．」 AIおよび AGI のコミュニティでは，包括的な AGI システムの実現に向けて達成され，いずれは統合されるべき無数の部分目標に対して数十年にわたって取り組んできた．これら取組みに対する技術的・理論的な課題はさておき，研究の歩みを妨げている一番の要因は協力や成果の比較のための共通の枠組みがないことであろう．そこで AGI のコミュニティでは，この数年をかけて AGI 研究の共通基盤となる枠組みの構築に取り組んできた．繰返しになるが，この AGI ロードマップを作成する試みは，多くの先行研究の上に築かれている． 2･2　AGI の特性と必要条件ロードマップ作成の出発点として，Laird と Wray による「AGI 実現のための認知アーキテクチャに求める要件」の修正版を用いる．Laird らの素案では，AGI システムを評価するシナリオ同士を比較可能とするための基準として八つの「環境」，「タスク」，「エージェント」に関する特性（Laird-Wray 特性）と，12 個の一般認知アーキテクチャの必要条件（Laird-Wray 必要条件）を定めている．これらは議論や研究協力のための取掛かりとして用いるべきであり，確定した最終版ではない．研究の進展につれて AGI への認識も深まれば，自ずと関連する必要条件への理解も深まるだろう．現存する研究のパラダイムごとに，少しずつ異なる要件リストをつくるよりも，一つの出発点を示すことが，コミュニティとして進展を促すために重要である． AGIシステムの能力を評価するには，知的エージェントが活動する文脈となる環境と，そこで与えられるタ

(4)

スクの特性を明確化する必要がある．そうしておかないと，仮に特定の条件下では説得性の高いデモンストレーションが行えても，ほかの研究者による再現や異なるアプローチ・実装との比較・検討が難しくなる（図 1）．この図 1 で示した特性は，「弱い AI」を排除するように，必ずしも十分ではないが一定のダイナミズムと複雑性を項目として加えている．これにより挑戦的な研究者であれば，サブシステムや個別の能力に関連する研究を行いつつも，AGI という大きな目標を検討できるようにとなっている．著者らが加えた（C2）環境の開放性が意味することは，エージェントはオブジェクトや関係性，イベントを記述した固定ライブラリに依存してはならないということである．また環境の特性（C1）として，オブジェクトが複雑で柔軟な表象を必要とする内部構造をもつことも加えた．研究者の数だけ AGI アーキテクチャがあるこの分野では，それら統合はさておき比較・対比を行いたい．そのためには，アーキテクチャを特徴付ける共通集合を用いて比較基準とすべきである． AGIの基礎となる枠組みを提示する図 2 は，Laird と Wrayの一般認知アーキテクチャの必要条件をほぼ再掲したものである．しかし R0 については，彼らは「すべてのタスクに対する固定的な構造」を前提としていた．ここでは，システム自身も時間とともに発展し，大きく構造が変化し得ることを強調するための変更を加えた．もちろん，その構造の変化は，人がプログラミングして得られるものではなく，エージェント自身が獲得しなければならない．さまざまな認知アーキテクチャや AGI システムにおける研究経験を通じて，このリストは追加や変更を受けつつ，しだいに収しゅう斂れんしていくであろう．しかしまずは，コミュニティとして，幅広く共有された目標に向けて前進する必要があり，そのために，この必要条件を採用した． 2･3　現段階での課題

Lairdと Wray は，各研究者が協力して AGI 研究を進めるための枠組みを提供する以外に，解決すべき二つの重要な課題を提示している [Laird 10]．これらの必要条件と特性の集合を改良し拡張する最良の方法の一つは，これらすべての十分条件と必要条件（さらにはリアルワールドタスクにおけるほかのさまざまな特性と必要条件）をテストできるエージェントを，認知アーキテクチャを用いて開発することである．そこで生ずる一つ目の課題は，すべての特性を含んだタスクと環境を見いだすことである．そして二つ目の課題は，これらの必要条件の一部を満たせるあるアーキテクチャが存在しても，それらを満たしつつほかの必要条件まで満たせるように，そのアーキテクチャが拡張できるとは限らないということである． 2009年の AGI ロードマップ作成に向けたワークショップでは，二つ目の課題は，各研究者がおのおのの研究の中で取り組むこととし，一つ目の課題である， AGIシステムの評価に適したタスクと環境の同定に取り組んだ．我々は，さらに三つ目の課題として，数年来進めている AGI ロードマップ作成に資する AGI の展望を示すことにした．本論文ではこの後，まず AGI の展望を取り上げ，次にタスクと環境のシナリオについて述べることにする．まず，発達心理学を基礎として，数学的・生理学的・情報処理的観点から裏付けられた AGI の能力に関する暫定的な展望に関して記述する．次に，AGI の評価に適切なタスクや環境を選ぶ際の論点を議論し，最後に，いくつかのシナリオと将来の研究協力のための方向性を示す．図 1　AGI の環境，タスクおよびエージェントの特性 C1：環境は複雑であり，多様で相互に作用しあう複雑な構造をもつオブジェクトで構成される． C2：環境は動的かつ開放的である． C3：タスクに関連する規則性が時間のスケールごとに存在する． C4：他のエージェントの行動が自身の行動に影響を及ぼす． C5：タスクは複雑，多様，かつエージェントが事前知識としてもっていない新規なものであり得る． C6：エージェントと環境，タスクとの相互作用は，複雑であるが有限である． C7：エージェントの計算リソースは有限である． C8：エージェントは長期間・連続的に存在する．図 2　AGI 認知アーキテクチャの必要条件 R0 ：新しいタスクに対するエージェントの再実装不要 R1 ：シンボルシステムの実現以下の提示と，効率的に活用 R2：（知覚）モダリティ特有の知識 R3：大規模で多様な知識 R4：さまざまなレベルの普遍性を備えた知識 R5：多様なレベルの知識 R6：現状の知覚と無関係な信念 R7：複雑かつ階層的な制御知識 R8：メタ認知知識 R9 ：（非）限定的合理思考の支援 R10 ：多様かつ包括的な学習のサポート R11 ：インクリメンタルオンライン学習のサポート

(5)

3．課題：AGI 実現に向けた展望の作成

AGIロードマップのワークショップでは，その準備段階からロードマップ作成の過程に関して多くの議論が行われてきた．ロードマップの表現として一般的に用いられるハイウェイロードマップとは，都市や町，川や山などの自然の地物，国境や州境などの政治的な地物からなる全体図の中に複数のドライブルートが描かれるものである．一般的な技術ロードマップでは，既知の出発点から目標とする結果に向かう 1 本のルートが描かれ，そのルート上にマイルストーンが置かれる．しかし AGI の実現に向けたロードマップ作成においては，明確に定義された出発点も，合意した目標もないことが問題となる． AIおよび AGI の研究史に頻繁に生ずるこの問題の根深さは，人間の知性および計算機技術の双方が何れも底深くかつ幅広いことを考えれば，理解し得るものである．そこで，我々は，ハイウェイロードマップから多くのメタファを借用し，まず AGI の実現までの展望を定める．そこに，さまざまな進展の可能性が考えられるマイルストーンを付与することで AGI の展望の全容を示す．まず最終的な目標としては，完全に人間レベルの汎用人工知能の実現を想定する，そのためには認知能力・知的能力全般に関して人間レベルの行動を学習，再現し，さらには超越さえもするシステムが求められる．一方で， AGIの実現を目指している多くの現状アプローチが，おのおのに異なる初期状態を仮定しているため，出発点の設定に問題が生ずる．そこで，誕生してから成人になるまでの人間の認知発達をなぞるような AGI の発達過程をロードマップとして最終的に採用した．関係者からワークショップ前に提出された AGI の評価に資するさまざまなシナリオが，誕生と成人という二つの端点間に位置するマイルストーンとして配置された．ここでは人間が発達を通じて認知レベルを向上させるという緩やかな制約を指定する以外，ルートを限定しなかった． 3･1 トップダウンアプローチ：人間の認知発達の特徴付け心理学において，知能とは，統一的な視点から整理できるモノではなく，多種多様なサブアプローチから構成されたモノとして捉えられている．人間の知能の概念化，定義，計測といった研究への取組みは，歴史的に見ると明らかに，一般から特殊へという流れを示しており [Gregory 96]，それは AI の歴史でも同様である．知能の測定と定義に関する初期の研究に大きな影響を与えたのがスピアマンである．1904 年に心理的要因 g （general intelligence の「g」）を提唱したスピアマンは， gが生物学的に決定されたものであり，個人の知的技能レベル全般を示したものだと主張した．これに関連して， 1905年に Binet と Simon がフランスの学童の一般知能を測る新しい手法を開発した．Binet-Simon 基準の特徴は，総合的な年齢基準を定めたことで，学童の年齢と知的能力水準をほかの学童と比較できるようにしたことである．1916 年に Terman は，受験者の精神年齢（年相応の能力レベルなど）を身体年齢もしくは実年齢で割ることで求める知能指数（IQ）の概念を導入した．その後，心理学者らは，知能の概念を，単一で未分化な能力とみなすことに疑念をもち始めた．そこには主に二つの問題があった．一つ目は，一個人の能力は，複数の知識領域から構成され，それぞれの能力はある程度相関があるものの，ある領域の能力が秀でていても別の領域の能力が非常に劣ること（個体内変動）がよくある．二つ目は，能力の成長過程が同じ二人であっても，ある能力領域で明らかな能力の差が生じること（個体間変動）がある．これらの論点からほかの多くの理論や，定義，計測のアプローチが提案されたが，それらは知能が多面的であり内面的にも外面的にも変化するという考えを共有していた．これらのアプローチのうち，特によく知られているものはガードナーの多重知能理論 [Gardner 99, Gardner 01]である．この理論では，八つの異なる知能の種類・形態，すなわち（1）言語的知能，（2）論理・数学的知能，（3）音楽的知能，（4）身体運動的知能，（5）空間的知能，（6）対人的知能，（7）内省的知能，（8）博物学的知能，を提案している．そして，個々人の知的技能は八つの知能形態の寄せ集め，もしくは組合せとして示される．ガードナーの理論は成人の知能の分野に大きな影響を与えた一方で，子供の知能発達研究へは比較的小さかった．一方で，認知発達分野の研究者らは，（1）知性の変化プロセスの記述や（2）変化を可能とする（生物学的・環境的な）基本メカニズムの同定と説明を試みた．認知発達の最新理論は非常に多様であり，単純な体系化を嫌う．その分野の詳細な紹介はここでの関心からはずれたものとなる．しかし以下では，ピアジェとヴィゴツキーに由来する二つの主流学派を AGI 全体図の軸として用いることにする．〔1〕　ピアジェの理論ピアジェは，認知発達科学の起源となった著名な研究において，人間は四つの質的に異なる発達段階を経て成長すると提唱した [Piaget 53, Piaget 78]．はじめに，出生～ 2 歳児までの感覚運動期の幼児は，さまざまな感覚や運動能力の豊富なレパートリー（伸ばす，握る，はいはいする，歩くなど）を身に付ける．この段階には，隠れたものを探す能力や単純な道具としてものを扱う能力などといった重要なマイルストーンがいくつも含まれている．次の，2 ～ 6 歳の幼児は前操作期へ移行し，自身の体

(6)

験を感情として表現する能力（記憶，心的イメージ，絵を描く，言語など）を獲得するが，論理的な一貫性をもってそれらの表現を体系的に連携させる能力が欠けている．次の段階（6 歳～思春期）の具体的操作期の子供は，論理的や数学的思考の初歩を習得する．そこには，数値演算や論理的関係と共に，クラスやカテゴリーについて推論する能力も含まれる．最後の思春期からの発達段階，すなわち形式的操作期では，演繹的論理や組合せ推論や仮説を利用した出来事の推論能力が習得される．〔2〕　ヴィゴツキーの理論ピアジェの個人に着目した視座に対し，ヴィゴツキーの認知発達の代表的理論は社会文化的観点を重視している [Vygotsky 86, Vygotsky 01]．ヴィゴツキーの理論は，社会的環境の影響を強調するだけでなく，個々の文化が子供にユニークな発育の文脈をもたらすということも主張している．この理論における基本概念とは，（1）内面化，（2）最近接発達領域（ZPD），（3）知育道具の三つである．（1）思考力は発話を獲得する（声に出して考える）ことから始まり，それが徐々に内面化する．（2）両親，教師，有能な友人などが，子供が一人で行えることから少し先のレベルに手が届くよう手助けすることで発達を促すことを強調している．この認知スペースのことを最近接発達領域とした．（3）子供は，学習を促すモノやアイディア，伝統から知能を「継承」する．例えば，本や電卓，計算機などがそれにあたる．これら知育道具は，認知発達のパターンに影響を及ぼすだけでなく，発達の速度や広がりに制約を与える．〔3〕　人間知能の全貌調査ピアジェとヴィゴツキーの見解は，着目点が異なるため対立するものとみなす向きも多いが，それらは同じ発達プロセスの相補的かつ部分的な記述である．ピアジェのアプローチが個々の子供の認知発達の段階に着目している一方，ヴィゴツキーは同じ発達プロセスを，道具や言語，本，共有環境などの文化的産物を手にして利用の仕方を身に付けている他者との社会的相互作用の文脈で考えた．それぞれの理論の発達段階を対立軸として置く（図 3）ことで，人間の認知発達の全体図の輪郭を描き， AGIに至る道にマイルストーンを配置するための構造を提供することができる． 3･2　ボトムアップアプローチ：AGI 全体図の基層 AGIコミュニティの最終的な目標は，人間レベルの汎用知能を，実際に機能するシステムとして構築することである．この高い目標を達成するには，先に述べた認知的な行動や発達を深く理解することと同時に，その理解を非生物学的な基質，すなわちディジタルコンピュータに実装することが求められる．これを遂行するため，著者らは図 4 に示すような多くの異なる学問領域からのインスピレーションや視点を受け入れる．生理学からは人間の知能の生物学的な実装についての知見を求め，数学からは実装によらない情報と知能の本質，情報処理からはそれらで得た知見など AGI の実装に直接的につながる計算機科学のメタファと対応付ける．本節では，ロー図 3　人間の認知発達の全体図（6 歳〜思春期）（思春期〜大人）（2 〜 6 歳）（出生〜 2 歳）図 4　AGI 全体図の基層

(7)

ドマップ作成のための基本的要素について述べる．〔1〕　生理学的視点生命科学の進歩により，遺伝学，生化学，神経メカニズムなどを取り込み，認知発達に関して包括的な視点から解釈できるようになりつつある．生物学的思考から見た認知理論の特徴は，一貫したパターンとしてさまざまな文化，物理環境，歴史的過程を越えて存在する発達の普遍的側面（例えば，運動技能の発達，モノの認識，言語獲得など）を説明できることにある．生理学的アプローチは，発達の典型的パターンと非典型的パターン（例えば，自閉症，注意欠陥多動性障害（ADHD），学習障害（LD），身体障害など）の違いの説明にも重要な役割を果たす．生理学的視点と情報処理的な視点のどちらも認知発達においてモジュール的な説明を用いる．これは，脳を特定の処理タスクに特化した入出力システムとして分割可能であるという考え方によるものである．〔2〕　数学的視点数学的視点は，汎用知能の形式的定義を Solomonoff-Levin 分布に基づいて定めた Marcus Hutter, Shane Legg らの最近の研究に代表される [Legg 07]．おおまかにいえば，彼らは知能をシステムの平均報酬獲得能力（すべての報酬加算可能な環境における平均）として定義した．そこでは，個々の環境において，よりコンパクトに記述されたプログラムの得点が高くなるように重み付けされている．この定義の亜種として，知能が特定の種類の環境に偏る可能性やすべての知的システムが明示的に報酬を求めていないことを踏まえた提案もある [Goertzel 10]．知能を情報の圧縮という観念で理解することは有益である．しかし，こうした汎用知能の数学的な定義について完全な同意がなされたとしても，それは AGI における「人間レベル」に対応するものではない．人間の知能は， AIXI（Hutter の「最適に知的なエージェント」[Hutter 04]＊2_{）のような理論的な AGI という意味で完全に汎用} でもなく，今日の AI ソフトウェアという意味で高度に特化したものでもない．それは，高度に汎用的な能力ではあるが，人間の知能は，発育環境の階級に偏向している（その環境の階級の詳細な形式化は大半が未解決な問題である）ためである．〔3〕　情報処理的視点認知科学では，心を表すメタファとして計算機を用いることが多い．この視点は，ピアジェやヴィゴツキーのシステム理論的なアイディアとは異なるが，同時に AGI システムが目標とする実装へのより直接的な対応付けを与える．情報処理的な観点からすると，幼児や子供の認知発達は「ハードウェア」（例えばシナプスの形成や神経プルーニングなどの神経の成熟）と「ソフトウェア」（例えば情報の獲得と処理のための戦略獲得）の両方の変化によるものである．この情報処理の視点は，多くの場合，発達を段階的なアプローチとしてよりも，緩やかな連続的な変化の過程を重視する．例えば，短期記憶能力は，しばしばランダムな文字や数字の列を記憶する方法で測定されるが，その成績は幼児期の間は線形的に向上する [Dempster 81]．

4．課題：タスクと環境の発見

次に取り組む課題は，すべての Laird-Wray 特性は有用とみなし，それらすべての要件を満たしたうえで AGI 研究の進捗評価に適したタスクと環境の定義を示すことである．この課題の本質は，あるタスクや環境が，アプローチやアーキテクチャを相互に比較する際の有用な基となるかにある．さらに，タスクと環境はどちらも，互いの状況を踏まえつつ適切に設計しなければならない．例として，大まかに指定された砂漠のコースを自律的に走破する自動車を開発する競技会＊3_{をあげると，そこで} 用いられたアーキテクチャや実装の多くは後日行われた都市環境での自律的走行競技会＊4_{でも役に立ちそうな} ものであった．だが，実際には環境が変わったことでタスクやサブタスク自体についてかなりの再考を必要とした．それゆえ，タスクにとっては文脈が非常に重要であり， AGI自身の「身体性」も含めた環境はタスクの定義と合わせて考える必要がある．そこで我々はタスクとそれに必要な環境を組み合わせてシナリオを定義する．さらに，多数のアプローチやアーキテクチャとともに複数のシナリオを考えるうえで，異なるシナリオに含まれるタスク同士で比較・関連付けができることも重要である．これを念頭に，まず人間の知的能力の概要的かつ試行的なリスト（図 5）を作成した．大雑把にいえば，タスクは環境においての能力を評価するための手段である．しかし，より完全かつ厳密，洗練された知的能力リストとするための指針を与えるには，現在の認知科学は不十分である．著者らがここで示すものは，タスク生成のための厳密な手法というより，現実的にタスク生成を考えるための直感的手法といえる． 4･1　AGI のための環境と身体化人間の汎用知能は，身体という文脈のもとで発達する．＊2 本特集の小林・相澤記事（pp. 234-238）を参照．

＊3 DARPA Grand Challenge rulebook, http://www.darpa. mil/grandchallenge05/Rules_8oct04.pdf

＊4 DARPA Urban Challenge Rules, http://www.darpa.mil/ grandchallenge/rules.asp

(8)

その身体は何千という入出力器官を備えており，養育者や教師・協力者・アドバイサーなどの多くの人に囲まれ非常にリアクティブな環境の中に置かれている．人の入力感覚は，温度と接触に反応する皮膚センサから，鼻と口のにおいと味のセンサ，耳と目の音と光のセンサ，重力の方向や身体の関節の方向などの情報を得る内部の固有感覚センサまで多岐にわたる．人間の出力器官には，周囲の物理環境に影響を与えるさまざまな方法が含まれる．例えば，筋肉を使って体を動かす，体動や声帯の振動で音を出す，などがある．視線の方向や焦点を制御する筋肉のような器官も環境センシングに直接的に影響を与える．ゆえに，AGI の実現に関わる特有の課題の一つとは，いかにして感覚・運動の性能の違いを説明するかということである．AI の歴史には，Gray Walter の Tortoise [Walter 53]からホンダの ASIMO まで，ロボットの身体に関する幾多の試みであふれている．さらに，仮想身体化技術も利用されつつあり，Steve Grand の Creature [Grand 01]のように仮想環境で身体をシミュレートするソフトウェアシステムもある．現実世界もしくは仮想世界において身体や環境を設計するために，身体の精巧さや環境の複雑さの適切なレベルを定めるには多くの課題がある．残念ながら，身体性に取り組んできたほとんどすべての AI や AGI のプロジェクトは，さまざまな点で独自性が強く，ほかのシステムと相容れない再利用性に貧弱なシステムである．これに当てはまらない特筆すべき事例として，複数のリーグからなる RoboCup [Kitano 97] がある．そこでは，ソニーの AIBO や Aldebaran の Nao などの商用ハードウェアプラットフォームが指定され，参加者にはロボットのソフトウェアの改造のみが許されている．ただ残念なことに，RoboCup タスクはサッカーを模したゲームでしかなく，AGI のベンチマークとして使うには狭すぎる＊ 5_． 4･2　人間の能力の広さ直感的には，環境や身体が物理的か仮想的かにかかわらず，人間と同等の AGI とみなされるために備えておくべきいくつかの能力が存在する．例えば，ある AI システムが既知のモノや概念に関わる質問に IBM の WATSONよりもはるかに賢く答えられたとしても，状況によって新しい概念をつくり出せないのであれば，人間と同等の知性をもつとはいえないであろう．人間レベルの汎用知能に求められる能力の的確なリストを示すことは，本論文はもちろん，現代科学の限界を超えている．だが，それでも，実際に活動する AGI シ図 5　人間レベルの汎用知能に関連する主要な能力域の例知覚記憶注意社会的相互作用計画動機付け視覚作業記憶視覚コミュニケーション戦術的サブゴール生成嗅覚エピソード記憶聴覚適切さ戦略的情動による動機付け触覚暗黙的社会的社会的推論身体的満足遅延味覚意味的行為的協力社会的利他行為聴覚手続き的競争人間関係クロスモダリティコミュニケーション自他のモデリング固有感覚ジェスチャ自己意識言語他者意識推論音楽情動人間関係運動帰納絵画学習知覚自己制御身体スキル演繹図式模倣表現心の理論道具使用アブダクション言語獲得強化制御共感移動身体的クロスモーダル対話的理解エンパシー固有感覚因果的メディア指向共感連想的実験エンパシー制作・創作数量モノを使った構築観察対象の数え上げ新規概念の生成少数の外界事物を用いた算数言語的な創作観察対象の数量比較社会組織簡単な道具を使った計測＊5 2014 年現在の RoboCup では，ほかに災害救助や室内での作業を対象としたリーグもある．

(9)

ステムが対応するタスク生成のためのヒューリスティックな指針を与えるという目的で，人間の能力範囲を調査することは有益である．ロードマップ作成作業のワークショップにおいて検討した一連の広範な能力を図 5 にリストとして示す．このリストは，14 の高次能力領域とそれぞれに関連するいくつかの重要な下位領域からなる．これら下位領域の一つ一つに関する詳細な議論には，長いレビュー論文と数十の参考文献を必要とするが，本論文ではこのリストを示すことで十分としたい．これらの能力について十分に検討することは重要である．さもなければ，テスト環境を，安易に環境の制限にバイアスを与える過度に制限されたタスク群で構成してしまう．我々が提唱しているのは，特定の能力リストではなく，むしろさまざまな能力領域の探索の手法であり，ひいては特定の環境内における一つ以上の領域の能力の発現を評価するためのタスクをつくり出す手法である．少なくとも人間の認知的発達の見地からすると，リストにある能力のいくつかは，直感的にほかの能力よりも簡単で，「初期段階」のものに見えるかもしれない．この論文の冒頭で述べた発達理論は，それぞれ人間が獲得するさまざまな能力が発達する順番に関する仮説をもっている．一方，熟慮の結果，我々は AGI 能力のロードマップには能力の順序付けは不要であると結論付けた．既存の AGI アプローチの多くは，同じ能力の集合を全く異なる順序で研究を進めている．そのため，能力の順位を付けることは，ロードマップ作成作業を特定の AGI アプローチに偏向させることになってしまい，現時点の AGI開発で切望されている研究者同士の協調・協力とは反する．例えば，発達ロボティクス [Lungarella 03] や深層学習（Deep Learning）[Bengio 09] のような AGI アプローチではしばしば，知覚能力や運動能力が言語能力や推論能力の前に発達すべきものと仮定する．一方，論理に焦点を置いた AGI アプローチでは，言語能力や推論能力から始め，後になってより複雑な環境での知覚や動作へと進める傾向がある．シナリオや能力タスクを対象としても，それらの具体的な順位付けは行わないことで，既存手法に親切でありながら，新しいアプローチの発展にも間口を広げた知的能力のロードマップを示せる． 4･3　多様な同時並行的研究活動の支援我々は，さまざまな研究や開発の努力を支援しつつ， AGIコミュニティにとって必要である協調的な進展のバランスをとりながら，全体図におけるさまざまな領域での同時並行的な活動を可能にしなければならない．このためには，さまざまなシナリオを「うまく」解決に導く視覚処理や運動制御などの未解決である「低次」な側面を，我々が共通の研究基盤として十分にリッチなシステムを用意できるまで，高次な実装や人間の代用品で置き換える必要がある．人間の知性は，先天的能力に非常に恵まれた複雑な身体の中で生まれ，発達するので，AGI も同様の身体の中で同じ過程を経ることでのみ実現できるとする意見もある．しかし，そのようなシステムを理解し，構築する能力をもつ以前の段階において望み得る最善の方策は，同時並行的で最終的には協力的となる研究の場を育てることである．

5．AGI 評価シナリオ

人間レベルの汎用人工知能の実現に向けたロードマップを作成するには，まず具体的なシナリオをつくるところから始める必要がある．ここで「シナリオ」とは，特定の環境において遂行される一連のタスクおよび，静止物やほかのエージェントを含む環境と AGI システムとの相互作用に関する前提からなる集合を指す．基本となるシナリオを決められれば，サブタスクを具体化して，それらを順序付け，性能評価についても議論できるようになる． AGIに関わるシナリオは多種多様だが，ここでは七つのシナリオを紹介する．これらは AGI ロードマップワークショップの参加者から特に意義のあるシナリオとされたものである．それぞれのシナリオについてはさらに詳細を述べることもできるが，本章では概要のみを示す．いくつかのシナリオの詳細については参考文献を参照されたい． 5･1　汎用ビデオゲーム学習このシナリオでは，一度に多くの課題に取り組む必要がある．すなわち，AGI 研究のための標準的かつ適切な身体，AGI 能力を徐々に開発し，その能力の測定・評価するために感覚・運動に関する要件を追加すること，学習能力の一般性をテストするための多様な環境構築すること，多くの人々の経験を活用してさまざまなビデオゲームのプレイに関する非専門家でも容易に AGI 能力の有無を評価できる説得力のある提示方法，といったことの提供が課題となる．このシナリオの目標は，ある特定のビデオゲームで人間レベルのプレイをすることではなく，AGI 開発者が競技会の事前には知らされていない新しいゲームを含む多種多様なビデオゲームを AGI システム（競技者）が学習し，うまくプレイできる能力を実現することである．競技用システムは，ゲームへの知覚・運動インタフェースがビデオ・オーディオ出力とコントローラ入力という規格化されたものに限られ，ゲーム実装内部のプログラムや状態へのいかなるアクセスも遮断されているものとする．ゲームへの動機付けのための一般的なフィードバックとして得点の出力があり，これが競技者の感情（痛み・喜び）インタフェースに対応付けられる．競技者は，ゲームコントローラを操作し結果を見ることで，経験と観測を通してゲームの特性を学んでいかなければならな

(10)

い．各種ゲームにおいて，プログラムされた対戦者やゲームの進行状況から得られる得点は，ゲームの学習や勝利・進行に要した時間とともに達成度の評価基準となる．このシナリオでテストに用いられるビデオゲームの範囲に関しては，単純さと精巧さのどちらにも制限はない． Pongのような黎明期のゲームでも出発点としてはハードルが高すぎるかもしれず，さらに簡単なゲームを選択したり開発したりするかもしれない．大多数のビデオゲームをうまくプレイするには一定の視覚知能を必要とするため，汎用ビデオゲーム学習（GVL）はコンピュータビジョン技術の良いテストになる．例えば，Pong における比較的簡単な二次元のオブジェクトの同定・追跡から，最も難しい場合では Tomb Raider や Half-Life のようなゲームにおける完全な三次元の知覚・認識といったことまでが試される．初期の横スクロール型ゲーム（スーパーマリオブラザーズなど）から一人称視点射撃ゲーム（Doom, Half-Life など），さらにフライトシミュレータ（Microsoft フライトシミュレータ，スターウォーズ X ウィングなど）に至るまで，幅広いジャンルのビデオゲームがあり，さまざまな研究者が，おのおのの研究の対象として，得意とするニッチなゲームが見つかるはずである．一方，インタフェースが共通していることで，学習した技能をほかのジャンルに適用することを可能にする．とりわけ，多くのビデオゲームをうまくプレイするためには，かなりの戦略的思考が実現されなければならない．そのためには，行動選択にあたって，短期的のみならず長期的な影響を考慮しつつ状況に対応して行動する能力が要求される．しばしば貢献度分配問題と関連付けられる能力はスケーラブルな形ではいまだ実現されていない．GVL はこうした能力の実現のために有用なプラットフォームとなる．このシナリオは，AGI の適切なテストの仕様策定と開発に取り組む研究コミュニティの醸成の支援にも有用である．そうしたコミュニティでは，多くの場合元々のゲームの制作会社と協力してビデオゲームのテストを作成し，SPEC＊6_{スタイルのシステム性能報告サイトに似} たインターネットフォーラムを通じて，テストの管理と結果の報告を行うことになるだろう． 5･2　幼　児　教　育名著である「人生に必要な知恵はすべて幼稚園の砂場で学んだ」[Fulghum 89, Fulghum 96] を参考にするなら，AGI システムを教育したりテストしたりするシナリオのために保育園や幼稚園で行われている幼児教育にヒントを求めるという考えは魅力的である．このシナリオは [Goertzel 09] で詳しく説明されている．もちろんこのシナリオには，ロボットを含む物理空間での設定と仮想エージェントによる仮想空間での設定という二つバージョンが考えられる．このシナリオの目標は，子供の行動を正確にまねることではなく，定性的に幼児に似た認知的挙動を示すロボットもしくは仮想エージェントを実現するということである．このアイディアは AI の分野では由緒あるもので，アラン・チューリングは，有名な「チューリングテスト」を提案した 1950 年の人工知能に関する論文で「大人の心ではなく子供の心をシミュレートするプログラムの作成を試みてはどうか」と提案している [Turing 50]．この「小児的認知」に基づくアプローチはさまざまな理由で有望であるが，一つの理由はその包括性，すなわち子供が行うことは，知覚，運動，言語や絵を用いたコミュニケーション，社会的なやり取り，概念的問題解決，創造的想像が組み合わさったものであるということである．人間の知能は複雑なやり取りを要求する環境に応じて発達し，幼児教育は多様な精神的成長を刺激することができるような環境であるように設計される．幼児教育の環境の複雑さは，ロボット工学からのアプローチに多大な寄与をもたらすことを示しているが，現在の仮想空間技術の境界を広げるだけでも多くのことが実現できる．「小児的認知」に注目するもう一つの理由には，児童心理学者らによって開発されているさまざまな子供の知能発達の測定手法の存在がある．幼児教育の文脈において，通常は幼児の知能を測定するのに使われるタスクを変更すれば AGI システムに与えることができる．仮想エージェントもしくはロボットへの幼児教育として，人間の幼児教育を正確にまねしてみても現時点では意味をなさない．その理由は，現在のロボットや仮想身体が幼児とはやや異なる能力を備えているためである．AGI 用幼児教育環境構築の狙いは，一般的な人間用幼児教育の基本的な多様性と教育的特徴を模倣することにある．人間用幼児教育の一般的な特徴を模倣するには，仮想幼児教育もしくはロボット幼児教育にいくつかの「学習センタ」を設置するべきである．詳細な仕組みは経験を積み重ねることで，適したものになっていくだろうが，初期の学習センタには下記を含めることが考えられる． ● _{ブロックセンタ：テーブルがあり，その上にさまざ} まなサイズや形のブロックがある． ● 言語センタ：AGI を囲んで話すために環状に配置した椅子がある． ● _{操作センタ：さまざまな視覚・運動技術を教えるこ} とを目的とする形やサイズの異なるさまざまな種類のものから構成される． ● 球技センタ：ボールが棚の中に保管され，AGI が一人もしくは他者とボールを蹴ったり投げたりするスペースがある． ● 演劇センタ：AGI がさまざまな動きや役割を見たり

＊6 Standard Performance Evaluation Corporation. http:// www.spec.org（2011）

(11)

演じたりすることができる． 5･3　文　章　理　解次のシナリオは前の幼児教育シナリオと密接に関連している．だが，仮想世界における身体は必要とせず，特定のカリキュラムと深い関わりをもつ．このシナリオでは，AGI の卵は小学校での読解カリキュラムをこなし，人間の子供の能力評価に用いられる試験を受けて合格しなければならない．当然ながら，これには自然言語で書かれたテキストを理解し，それに関する質問に答えられることが必要である．しかし，それほど自明ではない能力もまた必要である．幼い時期の読み物は，一般的に絵と文章が密接に結び付いた絵本である．本によっては物語の大半を絵を通して伝える．物語を理解するためには，自然言語の文章のみならず，絵も理解しなければならない．それは，登場人物とその登場人物が行っていることを認識する必要がある．文中で言及され絵の中で描かれている登場人物および出来事の間の参照解決が必要となる．ビデオから得られるフレーム列を通じた行為認識とは異なり，登場人物の行動は「スナップショット」のポーズから認識しなければならない．次の段階の読み物は挿絵の入った「児童文学」である．そこでは物語は主に文章を通して進められるが，理解のためには，絵を用いた参照解決がまだ重要である．読書の教師は「読者の四つの役割」を認識しているという．すなわち「意味理解者，コード解読者，文章の利用者，文章の批評者である……意味理解者とは理解のために読書する者である……それぞれの役割で求められる（探求する）能力とは，文字理解，推論的理解，批判的思考である」[Sundance 01]．コード解読者は書かれた文章と発話を相互に翻訳する．文章の利用者は文章がフィクションかどうかを識別する．「本に書かれていることが事実なら，読者は情報を求めて読み込む．文章がフィクションなら，読者は物語の筋書，登場人物，メッセージを理解するように読む……文章の批評家は，情報の提示方法に関して筆者の目的と筆者の判断を評価し，……社会的および文化的公平性をチェックし，… …そしてその本に対する自分自身の反応について考え，その本があり得る最高の形であるかどうかを考える」 [Sundance 01]．すべてではないが，意味理解者，コード解読者，文章の利用者の役割のほとんどは，自然言語理解に従事する人々に知られている．しかし，文章の批評家の役割は知られておらず，単に文章中の情報についての推論を行うだけでなく，文章の質，筆者の意図，読者の社会および文化と文章との関連，読者自身の文章への反応についてのメタレベルの推論を必要とする．このシナリオは，Laird-Wray 基準の大半を十分に満たし，十分ではないが残りの基準も満たす．このシナリオでの AGI の環境は直接的な意味では動的ではないが（C2），AGI は課題を遂行するためには物語の動的な状況の移り変わりを推論しなければならない．ある意味で作業課題は新規（C5）というより定型的なものであるが，タスクを遂行するにつれて AGI にとって新規なものとなる．カリキュラムに集団作業が含まれる場合（実際にあり得る）には，ほかのエージェントの活動が作業の結果に影響を与える（C4）．このシナリオで必要とされるいくつかの能力は次のシナリオでも議論される． 5･4　物語・シーン理解シーンと物語の理解に焦点を当てたこのシナリオでは，幼児教育および文章理解のシナリオと共通する側面が多い．文章理解シナリオと同様に幼児・少年期の活動の一部に対象を絞っているが，文章理解シナリオとは異なり外界とのより広い関わりを含む活動を対象としている．ここでいう「シーン理解」は，挿し絵のようなものに限らず，さまざまな粒度，媒体，複雑さをもって表される現実世界におけるシーン（漫画，映画，演劇など）を対象としている．このアプローチが文章理解シナリオと異なる点は，より直接的に動的な環境を対象としているという点である．グループ作業が含まれる場合には， Laird-Wray 基準のすべてが直接的かつ明白な形で満たされる．物語・シーン理解シナリオにおいては，知覚，心的表象，そして自然言語の間の関係を重視する．ここで AGI システムには物語が提示され，その意味を理解し，別の形（例えば映画のシーンの並びや言換えなど）で再現することが求められる．あるいは，システムは映画や漫画の一部を見せられ，それを理解して言葉で改めて表現しなくてはならない．このアプローチはさまざまな標準化可能なテストシナリオの作成に役立ち，競合する AGI アーキテクチャ同士，さらに子供との間で同じ入力を用いることで成績を直接比べることができるようになる．留意すべきは，これらのテストでは，システムと環境の相互作用およびシステム自身がもつ欲求を考慮していない点にある．つまり欲求ベースの相互作用システムとして汎用知能を実現しようとする議論は多いが，このシナリオではあえてそうした包括的な処理を目指さず処理志向的アーキテクチャとの比較を可能としている． AGIシステムの物語理解の能力とシーン理解の能力はおそらく独立した能力ではなくお互いに関連している．なぜならどちらのタスクも，知覚・言語・思考の関係をモデル化しようとするものであり，それらの関係は一方向的なものではないからである．表現することと理解することを組み合わせることで，これらの領域の間の相互の影響に着目した別のタスクを考えることもできるかもしれない．これは（先生に答えなければならないようなシステムを設計することによる）完全にインタラクティブなやり方や，（2 体のエージェントが環境を共有しな

(12)

がら互いにコミュニケーションすることを学ぶ）自己相互作用によって行うことができる．自己相互作用のシナリオのデザイン例としては [Steels 10] を参照されたい． 5･5　学　校　教　育「仮想生徒」のシナリオは，前述した仮想の幼児教育シナリオの続きである．低レベルの技能は問題なくこなせると仮定し，より高度な認知能力の発育を重点的に取り組む．特に，エージェントとのインタフェースのすべては記号のレベルで実装されているものとする．エージェントには，動画を処理したり，会話やジェスチャを認識したり，身体のバランスを取ったり，空間移動の際に障害物を回避したりなどすることは求められない．これらの能力はすべて後で課題に追加できるが，このシナリオのポイントは，そうした能力の初期の研究を許しつつ，ほかのシステム開発を待たずに「なんとかしてしまう」ということである．一方，このシナリオにとって極めて重要なのは，エージェントが人間の生徒のレベルで学力を向上させ，人間の心理を理解し，自らを取り巻く教室内での人間関係を理解するということである．このシナリオにおいて，エージェントは仮想現実ベースのインタフェースを通して実際の高校の教室に組み込まれる．エージェントは，教室内の大きなスクリーンに切れ目なく映し出される記号的な仮想世界に住んでいる．仮想世界には記号レベルで表現される仮想の教室があり，そこには簡単なアバターとして表現される人間の教師や人間の生徒がいる．エージェント自身は，この仮想教室にいるアバターとして表現される．記号的な仮想世界は，シーン解析・会話認識，言語理解，ジェスチャ認識などを担う知的なモニタ・記録機器を通じて，物理的現実世界と「同期」される（必要であれば，これらの活動の一部またはすべてはテストを実施している人間の担当者によって隠れて実行されるが，エージェントである生徒にはその存在を気付かれないようにする）．生徒用の教科書そのほかのカリキュラム教材を含めた教材は電子化され，エージェントが記号レベルで利用できるようにする．このシナリオの特に難しいところは，エージェントが自身の学習や問題解決の実行においてのみでなく，生徒や教師とのやり取りを通した問題解決のアプローチでも評価されることである．ここでは自己調整学習のための一般的な指標が用いられる [Winne 00]．加えて，エージェントの社会的な挙動は生徒へのアンケートや標準的な心理学的測定基準に基づいて評価できる．ほかに重要とされる評価基準としては，エージェントが一緒に学ぶことで人間に与える影響がどうかということである． 5･6　ウォズニアックテストアップルコンピュータのスティーヴ・ウォズニアックは，あるインタビューで，なじみのない家の中に入ってコーヒーをいれるようなロボットの実現性について疑問を呈した [Wozniak 07]．このタスクは身体をもつ AGI にとって「チューリングテスト」と同程度に難しい．ウォズニアックテストは，Nils Nilsson が示した人間レベルの AI に対する一般的な「雇用試験」[Nilsson 05] の特殊な場合であることに注意されたい．一般的な家かアパートの戸口の前に立ったロボットは，まずドアベルかノッカーを見つけるか，もしくはドアをノックして家主を呼び出す必要がある．応答があった場合，次に家主に対して自分が何者かを戸口で説明し，招き入れられたならすぐに入らなくてはならない（このテストにおける家主は，ロボットを招き入れてテストを行うことについて同意しているが，それ以外については実験チームの行うことや実験との関わりを一切もたず，人工知能やロボット工学についての特段の知識をもっていないことを前提とする）．ロボットのなすべきことは，家に入り，台所を見つけ，コーヒーをつくる材料と器具を探し出し，家主の好みのコーヒーをつくり，別の部屋でそれを出すということである．ロボットは，家主に質問をすることが許されている（設定によっては要求されている）ものの，いかなる物理的な支援も許されない．現状のロボット工学はさまざまな点で上記の機能を実現するにはほど遠い．ロボットは，移動し，物体を識別し，場合によっては（「コーヒーはあそこのキャビネットにあるよ」といった）視覚情報でジェスチャを認識することや，複雑な操作を統合しなければならない．例えば，なじみのないポットからなじみのないカップにコーヒーを注ぐような場合には，強いフィードバック学習ループで操作と物理モデリングを結ぶ必要があるかもしれない．音声認識および自然言語の理解と生成が必要になる．また，マニピュレータの動線に始まり，コーヒーを入れる手順にわたるさまざまなプランも必要である．コーヒーをいれるロボットに必要な AGI の主な進歩は，これらの機能のすべてが全体の目標達成に向けて協調的であり，適切かつ全般にわたって使用されなければならないという点である．これらのすべての領域で，いわゆる弱い AI における問題の定式化からデフォルトの設定やタスクの定義などが欠けており，ロボットは問題を解決するだけでなく，問題の発見もしなければならない．こうしたことから，初めて訪れた家でコーヒーを入れるタスクは，システムの適応能力や常識の適用能力をためす困難なテストといえる．あらゆるコーヒーメーカに関するデータベースを組み込んでおくという対処も考えられるが，各オブジェクトに対する実際の操作を事前にプログラムしておくということは，特に作業空間の配置やレギュラーコーヒーの入れ物などに変化があることを考えるとあり得ない．このシステムを実現するには，転移学習，一般化，類推，特に事例や訓練から学習する能力がほぼ確実に必要になる．コーヒーをいれるタスクは多少の経験を積めば 10 歳

(13)

の子供でも確実にこなせる．1 週間ほどさまざまな家でさまざまな方法でコーヒーを入れる方法を見て練習すれば，ウォズニアックテストでたいていの家においてコーヒーを入れるのに十分な一般的能力を得られるだろう．このテストのもう一つの長所は「ずる」をすることが非常に難しいということである．なぜなら，このタスクにアプローチする唯一の経済的で合理的な方法は，汎用学習能力を開発し，コーヒーをいれるだけでなく似た家事を学ぶことができるロボットをつくること以外にはない． 5･7　AGI 実現のための初期のロードマップ以上の七つのシナリオの説明により，先に定義した AGIの全体図（図 3）にそれらを配置することができるようになった．図 6 にこの配置の結果を示す．汎用ビデオゲーム学習，シーン・物語理解シナリオは，内容の複雑さと認知的な難しさの程度に応じて，全体図の大部分にわたって分布している．著者らは，Laird-Wray 必要条件を現実的な開始点，上記のシナリオをより大きなものとするための，ひとまず代表的な事例と考えており，この初期のロードマップが AGI に関する全体としての経験が増すにつれて拡張され修正されることを期待している． 5･8　残された空白上記のシナリオは AGI の全体図を満たすための重要な一歩であるが，多くの代替シナリオが考えられ，我々が十分に検討できていないか，全く言及しなかった範囲をカバーすることもあり得る．注目すべき領域として，審美眼と芸術的行為，構造化された社会的相互作用，および高度な認知的機能・統合を必要とするスキルがある．審美眼と芸術的行為には，作曲，創作，芸術的描写，ダンスなどが含まれる．審美眼を分析するには，動機付けの仕組みや心的表象，そしてメタ認知への理解を深めなくてはならない．さらに美術作品の創作活動においては，物理的あるいは想像されたものの操作，作成や脚色，心の理論や社会的側面など多くのことが加わる．構造化された社会的相互作用には，目標の選択や協力，競争と搾取，交渉，談話や共同意思決定，グループ形成，リーダーシップなどが含まれる．社会的領域のシナリオでは，社会的設定や個々人の心理状態，エージェント自身の目標への影響の可能性についての表象や評価が求められる．高度な認知的機能・統合を必要とするスキルには，複雑な救出シナリオ，実環境での買い物，熟達した介助などがある．これらのタスク領域ではそれぞれ，相互作用，探索，評価，プランニングの間で複雑な調整が必要となるであろう．著者らはさらなるシナリオの提案を歓迎するが，それらは AGI のアプローチにしっかりと根ざしているべきである．すなわち，各シナリオは，単に限られたタスクに対して転用の効かない工学的な解決法をもたらすのではなく，人間のような汎用知能への理解を深めるべきものである．

6．シナリオからタスク，評価，課題へ

本章で示す，能力域とシナリオの対応付けを用いれば，原理的には，特定のタスクを通じて AGI の実現に向けての進捗を評価できるようになる．すでに検討したシナリオ（もしくはそのほかの類似したシナリオ）ごとに，特定のタスク集合を定義できるかもしれない．その場合，個々のタスクはシナリオの文脈の中で一つ以上の能力域に対応する．一連の AGI のテストあるいは AGI の課題全体の妥当な近似を構成するには，シナリオにおけるタスク集合が能力域全体をカバーする必要がある．個々のタスクには具体的な性能基準を関連付ける必要もある．性能基準は数量化されたものであることが望ましいが，タスクの性質によっては定性的なものになることもあるだろう．長いタスクリストにより AGI を評価する手法で生じる明らかなリスクとして「big switch statement」アプローチによる解決法に陥りやすいことがある．すなわち，図 6　AGI 全体図上のシナリオのマイルストーン（6 歳〜思春期）（思春期〜大人）（2 〜 6 歳）（出生〜 2 歳）

人間レベルの汎用人工知能の実現に向けた展望(<特集>汎用人工知能(AGI)への招待)