人間レベルの汎用人工知能の
実現に向けた展望
*1
Mapping the Landscape of Human-Level Artificial General Intelligence
アダムズ サム S.
IBM ResearchSam S. Adams IBM Research.
アレル イタマール
テネシー大学Itamar Arel University of Tennessee.
バッハ ヨシャ
フンボルト大学Joscha Bach Humboldt University of Berlin.
クープ ロバート
テネシー大学Robert Coop University of Tennessee.
ファーラン ロッド
シンギュラリティ大学Rob Furlan Singularity University.
ゲーツェル ベン
ノバメンテ LLC &厦門大学Ben Goertzel Novamente LLC and Xiamen University.
ホール ジョシュ ストアズ
Institute for Molecular ManufacturingJ. Storrs Hall Institute for Molecular Manufacturing.
サムソノヴィッチ アレクセイ
ジョージメイソン大学Alexei Samsonovich George Mason University.
ショイツ マティアス
インディアナ大学Matthias Scheutz University of Indiana.
シュレジンガー マシュー
南イリノイ大学Matthew Schlesinger South Illinois University.
シャピロ スチュアート
ニューヨーク州立大学バッファロー校Stuart C. Shapiro SUNY Buffalo.
ソワ ジョン
VivomindJohn Sowa Vivomind.
「汎用人工知能(AGI)への招待」
*1 Copyright 2012 by the Association for the Advancement of Artificial Intelligence (AAAI).Reprinted in Japanese ─ May 2014, 3200 copies by the Japanese Society for Artificial Intelligence (publisher).
概 要
本論文では人間レベルの汎用人工知能(Artificial General Intelligence:以下 AGI)の実現に向けたロー ドマップの概要を述べる.AGI 一般に関する議論から始 め,実現への現実的な目標および特性と必要条件に関し て基本的な定義を行い,AGI が備えるべき能力の起点と なる展望(全体図)を示す.具体的には,発達心理学か ら AGI の主要テーマを導出し,数学的・生理学的・情 報処理的観点から実装に必要な知見を得る.AGI の性能 評価に適したタスクと環境を同定し,AGI の全体図上の ロードマップを構成するマイルストーンとして七つのシ ナリオを示すことで,さらなる AGI 研究や連携の方向 性を提示する.
1.は じ め に
本論文では,準備段階となる 2009 年 10 月にテネ シー大学ノックスビル校での「AGI ロードマップワー クショップ」の共著者らとの議論共同作業の成果を紹 介する.いくつかのアイディアは,John Laird と Pat Langley が開催した 2 回のワークショップ(2008 年後 半にアナーバー,2009 年前半にテンピで開催)で議題 とした「人間レベルの AI のための評価と計測法」での 議論にまでさかのぼる.なお,アナーバーでのワーク ショップの議論は [Laird 09] にまとめられている.そ して本稿の着想の源となったのは,Itamar Arel の発表 「AGI ロードマップ」[Arel 09a] を契機として開催され た AGI 国際会議 2009 の併設ワークショップ「AGI の将 来」での議論,および AGI ロードマップ作成について の先行論文 [Arel 09b] である. 言うまでもなく,こうした取組みは人間レベルの AGI への道筋を示す初の試みではないだろう.なぜならば AGIの実現は 1950 年代の AI 分野の創立からの目標で ある.それ以降の期間では,より狭い目標の実現(特定 のサブゴール)に主要な AI 研究の関心が集まってはい たとはいえ,AI 研究者らが絶え間なく追い求めてきた 目標が AGI なのである.よって本論文で示すアイディ アは,さまざまな先人のアイディアの上に築かれている. しかし AI の歴史を振り返り,先行研究の文脈の上に我々 の取組みを位置付けるには,本稿では紙面が足りない. そこで残念ながら,数多くの先行研究に関わる研究者ら に謝意を示しつつ,AGI ロードマップの議論成果のみを 述べることにする.近年の AI システムの評価を行う先 行研究の参考文献としては [Laird 09] や [Goertzel 09] を本稿の前提として参考にされたい. AGIを実現するまでの進捗の程度を測定するには,一 般論とそれを反映した現実的な目標の両方が必要であ る.そこで議論の暫定的な出発点としては,[Laird 10] 監訳:篠田 孝祐
電気通信大学Kosuke Shinoda University of Electro-Communications. [email protected]
共訳:
市瀬 龍太郎
国立情報学研究所Ryutaro Ichise National Institute of Informatics. [email protected]
ジェプカ ラファウ
北海道大学Rafal Rzepka Hokkaido University.
寺尾 敦
青山学院大学Atsushi Terao Aoyama Gakuin University. [email protected]
船越 孝太郎
株式会社ホンダ・リサーチ・インスティチュート・ジャパンKotaro Funakoshi Honda Research Institute Japan Co., Ltd. [email protected]
松島 裕康
産業技術総合研究所Hiroyasu Matsushima National Institute of Advanced Industrial Science and Technology. [email protected]
山川 宏
株式会社富士通研究所Hiroshi Yamakawa Fujitsu Laboratories Ltd. [email protected]
が提案した AGI が備えるべき特性と必要条件に多少手 を加えたものを採用し,引き続く AGI の達成度評価に 用いる複数の具体的なシナリオを議論する際の基盤とす る.初期的な試みとして,AGI の能力を展望する方法と して発達心理学から主要なテーマを用い,それらについ ての意義を数学的・生理学的・情報処理的な観点から明 らかにする.こうして特定のタスクと環境で能力を評価 しながら AGI の構築に挑戦することが可能になる.い くつかのシナリオが,AGI の実現に向けたロードマップ を形づくるマイルストーンとして提示される.そして将 来研究における方向性を示すとともに共同研究の必要性 を指摘して,本論文の結論とする.
2.目標:人間レベルの汎用知能
ここで検討する AGI 研究の目標を一言で言えば,人 間が備える広範な汎用知能を,システムとして開発し実 証することである.これは黎明期の人工知能研究で想定 された目標の繰返しともいえるが,それ以降の AI 研究 においては,多くの努力は「弱い AI」システムに注がれ, それらシステムは特定のタスクでは時に人間以上の能力 を示せても,その能力をほかのタスクや問題領域に汎化 できなかった. チェスにおいて当時世界チャンピオンであったカスパ ロフを破った IBM の DeepBlue [Campbell 02] は「弱 い AI」の代表例である.DeepBlue は人間が相当の再 実装を行わなければ,別の問題領域でその能力を生か すことはできない.同様に IBM の問題応答システムの WATSON [Ferrucci 10]は 2011 年前半に,クイズ番組 「Jeopardy!」で二人の最強クイズ王から劇的な勝利を得 た.しかし,「自分自身で」シカゴのオヘア空港からミッ ドウェイ空港へと乗り換えた経験はなく,それゆえ,米 国内でよく飛行機を利用する人間なら誰しも答えられる ような質問に口ごもる結果となった.この WATSON の 基礎技術を,ヘルスケアやコールセンタ支援など別の領 域で用いるには,単に AI システムを教育するだけでは 事足りない.大幅な再実装や関連データの人間による再 評価を必要とすることは明らかである.これを人間に例 えるならば,新しいタスクに直面するごとに脳外科手術 をして脳を入れ替えるようなものである.これらの特化 した AI システムは,限定された役割において優秀であ る反面,きちんと教育された成人のもつ専門知識はもち ろん 5 歳児程度の基本的な認知能力や常識をもち合わせ ていない. AGIの創成に関わるタスク領域の広がりを踏まえるな らば,複数の研究グループ間の協力や協調が,長期的に は成功への近道となるだろう.それゆえ,AGI の実現を 成功させるには,共通の目標やその展望への理解が要で あり,そうした方向に向けて着実に前進することが我々 のワークショップの目標であった. 2・1 AGI のための現実的な目標 人間における汎用知能が多才であるがゆえに,包括的 かつ粒度の細かい AGI 評価システムを具体的に開発す ることは困難を極めている.個別の能力について詳細な 評価指標を定めることで AGI を目指す研究は推奨する が,現段階で実際に合意できる目標としては抽象的なレ ベルに留まらざるを得ない. 黎明期からの AI 研究の第一人者である Nils Nilsson はこうした目標に関して,2005 年の AI Magazine の 記事「人間レベルの人工知能だって? 冗談でしょ!」 [Nilsson 05]の中で次のように語っている. 「真に人間レベルの人工知能が実現されるとは,必然 的に,現状では人間が報酬を得て行っているタスクの多 くを自動化できることを意味するだろう.こうした自動 化を目標とするならば,特殊な用途のシステムを構築す るよりも,人間がこなせるさまざまな業務を学習したり 教育されたりする汎用的な学習システムを開発する方法 に賛成する.同様の提案はしばしば見られるが,つくり 込みは最小限に抑えられつつも,獲得し得る能力は膨大 であるようなシステムから始めるべきであろう.そして 学習を通して成長する能力が,さまざまな能力とともに 組み込まれている必要がある.」 AIおよび AGI のコミュニティでは,包括的な AGI シ ステムの実現に向けて達成され,いずれは統合されるべ き無数の部分目標に対して数十年にわたって取り組んで きた.これら取組みに対する技術的・理論的な課題はさ ておき,研究の歩みを妨げている一番の要因は協力や成 果の比較のための共通の枠組みがないことであろう.そ こで AGI のコミュニティでは,この数年をかけて AGI 研究の共通基盤となる枠組みの構築に取り組んできた. 繰返しになるが,この AGI ロードマップを作成する試 みは,多くの先行研究の上に築かれている. 2・2 AGI の特性と必要条件 ロードマップ作成の出発点として,Laird と Wray に よる「AGI 実現のための認知アーキテクチャに求める要 件」の修正版を用いる.Laird らの素案では,AGI シス テムを評価するシナリオ同士を比較可能とするための基 準として八つの「環境」,「タスク」,「エージェント」に 関する特性(Laird-Wray 特性)と,12 個の一般認知アー キテクチャの必要条件(Laird-Wray 必要条件)を定め ている.これらは議論や研究協力のための取掛かりとし て用いるべきであり,確定した最終版ではない.研究の 進展につれて AGI への認識も深まれば,自ずと関連す る必要条件への理解も深まるだろう.現存する研究のパ ラダイムごとに,少しずつ異なる要件リストをつくるよ りも,一つの出発点を示すことが,コミュニティとして 進展を促すために重要である. AGIシステムの能力を評価するには,知的エージェ ントが活動する文脈となる環境と,そこで与えられるタスクの特性を明確化する必要がある.そうしておかない と,仮に特定の条件下では説得性の高いデモンストレー ションが行えても,ほかの研究者による再現や異なるア プローチ・実装との比較・検討が難しくなる(図 1). この図 1 で示した特性は,「弱い AI」を排除するよう に,必ずしも十分ではないが一定のダイナミズムと複雑 性を項目として加えている.これにより挑戦的な研究者 であれば,サブシステムや個別の能力に関連する研究を 行いつつも,AGI という大きな目標を検討できるように となっている.著者らが加えた(C2)環境の開放性が意 味することは,エージェントはオブジェクトや関係性, イベントを記述した固定ライブラリに依存してはならな いということである.また環境の特性(C1)として,オ ブジェクトが複雑で柔軟な表象を必要とする内部構造を もつことも加えた. 研究者の数だけ AGI アーキテクチャがあるこの分野 では,それら統合はさておき比較・対比を行いたい.そ のためには,アーキテクチャを特徴付ける共通集合を用 いて比較基準とすべきである. AGIの基礎となる枠組みを提示する図 2 は,Laird と Wrayの一般認知アーキテクチャの必要条件をほぼ再掲 したものである.しかし R0 については,彼らは「すべ てのタスクに対する固定的な構造」を前提としていた. ここでは,システム自身も時間とともに発展し,大きく 構造が変化し得ることを強調するための変更を加えた. もちろん,その構造の変化は,人がプログラミングして 得られるものではなく,エージェント自身が獲得しなけ ればならない. さまざまな認知アーキテクチャや AGI システムにお ける研究経験を通じて,このリストは追加や変更を受け つつ,しだいに収しゅう斂れんしていくであろう.しかしまずは, コミュニティとして,幅広く共有された目標に向けて前 進する必要があり,そのために,この必要条件を採用し た. 2・3 現段階での課題
Lairdと Wray は,各研究者が協力して AGI 研究を進 めるための枠組みを提供する以外に,解決すべき二つの 重要な課題を提示している [Laird 10]. これらの必要条件と特性の集合を改良し拡張する最良 の方法の一つは,これらすべての十分条件と必要条件(さ らにはリアルワールドタスクにおけるほかのさまざまな 特性と必要条件)をテストできるエージェントを,認知 アーキテクチャを用いて開発することである.そこで生 ずる一つ目の課題は,すべての特性を含んだタスクと環 境を見いだすことである.そして二つ目の課題は,これ らの必要条件の一部を満たせるあるアーキテクチャが存 在しても,それらを満たしつつほかの必要条件まで満た せるように,そのアーキテクチャが拡張できるとは限ら ないということである. 2009年 の AGI ロ ー ド マ ッ プ 作 成 に 向 け た ワ ー ク ショップでは,二つ目の課題は,各研究者がおのおの の研究の中で取り組むこととし,一つ目の課題である, AGIシステムの評価に適したタスクと環境の同定に取り 組んだ.我々は,さらに三つ目の課題として,数年来進 めている AGI ロードマップ作成に資する AGI の展望を 示すことにした. 本論文ではこの後,まず AGI の展望を取り上げ,次に タスクと環境のシナリオについて述べることにする.ま ず,発達心理学を基礎として,数学的・生理学的・情報 処理的観点から裏付けられた AGI の能力に関する暫定 的な展望に関して記述する.次に,AGI の評価に適切な タスクや環境を選ぶ際の論点を議論し,最後に,いくつ かのシナリオと将来の研究協力のための方向性を示す. 図 1 AGI の環境,タスクおよびエージェントの特性 C1: 環境は複雑であり,多様で相互に作用しあう複雑な 構造をもつオブジェクトで構成される. C2: 環境は動的かつ開放的である. C3: タスクに関連する規則性が時間のスケールごとに存 在する. C4: 他のエージェントの行動が自身の行動に影響を及ぼ す. C5: タスクは複雑,多様,かつエージェントが事前知識 としてもっていない新規なものであり得る. C6: エージェントと環境,タスクとの相互作用は,複雑 であるが有限である. C7: エージェントの計算リソースは有限である. C8: エージェントは長期間・連続的に存在する. 図 2 AGI 認知アーキテクチャの必要条件 R0 :新しいタスクに対するエージェントの再実装不要 R1 :シンボルシステムの実現 以下の提示と,効率的に活用 R2:(知覚)モダリティ特有の知識 R3:大規模で多様な知識 R4:さまざまなレベルの普遍性を備えた知識 R5:多様なレベルの知識 R6:現状の知覚と無関係な信念 R7:複雑かつ階層的な制御知識 R8:メタ認知知識 R9 :(非)限定的合理思考の支援 R10 :多様かつ包括的な学習のサポート R11 :インクリメンタルオンライン学習のサポート
3.課題:AGI 実現に向けた展望の作成
AGIロードマップのワークショップでは,その準備段 階からロードマップ作成の過程に関して多くの議論が行 われてきた.ロードマップの表現として一般的に用いら れるハイウェイロードマップとは,都市や町,川や山な どの自然の地物,国境や州境などの政治的な地物からな る全体図の中に複数のドライブルートが描かれるもので ある.一般的な技術ロードマップでは,既知の出発点か ら目標とする結果に向かう 1 本のルートが描かれ,その ルート上にマイルストーンが置かれる.しかし AGI の 実現に向けたロードマップ作成においては,明確に定義 された出発点も,合意した目標もないことが問題となる. AIおよび AGI の研究史に頻繁に生ずるこの問題の根深 さは,人間の知性および計算機技術の双方が何れも底深 くかつ幅広いことを考えれば,理解し得るものである. そこで,我々は,ハイウェイロードマップから多くのメ タファを借用し,まず AGI の実現までの展望を定める. そこに,さまざまな進展の可能性が考えられるマイルス トーンを付与することで AGI の展望の全容を示す. まず最終的な目標としては,完全に人間レベルの汎用 人工知能の実現を想定する,そのためには認知能力・知 的能力全般に関して人間レベルの行動を学習,再現し, さらには超越さえもするシステムが求められる.一方で, AGIの実現を目指している多くの現状アプローチが,お のおのに異なる初期状態を仮定しているため,出発点の 設定に問題が生ずる.そこで,誕生してから成人になる までの人間の認知発達をなぞるような AGI の発達過程 をロードマップとして最終的に採用した. 関係者からワークショップ前に提出された AGI の評 価に資するさまざまなシナリオが,誕生と成人という二 つの端点間に位置するマイルストーンとして配置され た.ここでは人間が発達を通じて認知レベルを向上させ るという緩やかな制約を指定する以外,ルートを限定し なかった. 3・1 トップダウンアプローチ:人間の認知発達の特徴 付け 心理学において,知能とは,統一的な視点から整理 できるモノではなく,多種多様なサブアプローチから構 成されたモノとして捉えられている.人間の知能の概念 化,定義,計測といった研究への取組みは,歴史的に見 ると明らかに,一般から特殊へという流れを示しており [Gregory 96],それは AI の歴史でも同様である. 知能の測定と定義に関する初期の研究に大きな影響を 与えたのがスピアマンである.1904 年に心理的要因 g (general intelligence の「g」)を提唱したスピアマンは, gが生物学的に決定されたものであり,個人の知的技能 レベル全般を示したものだと主張した.これに関連して, 1905年に Binet と Simon がフランスの学童の一般知能 を測る新しい手法を開発した.Binet-Simon 基準の特徴 は,総合的な年齢基準を定めたことで,学童の年齢と知 的能力水準をほかの学童と比較できるようにしたことで ある.1916 年に Terman は,受験者の精神年齢(年相 応の能力レベルなど)を身体年齢もしくは実年齢で割る ことで求める知能指数(IQ)の概念を導入した. その後,心理学者らは,知能の概念を,単一で未分化 な能力とみなすことに疑念をもち始めた.そこには主に 二つの問題があった.一つ目は,一個人の能力は,複数 の知識領域から構成され,それぞれの能力はある程度相 関があるものの,ある領域の能力が秀でていても別の領 域の能力が非常に劣ること(個体内変動)がよくある. 二つ目は,能力の成長過程が同じ二人であっても,ある 能力領域で明らかな能力の差が生じること(個体間変動) がある. これらの論点からほかの多くの理論や,定義,計測 のアプローチが提案されたが,それらは知能が多面的で あり内面的にも外面的にも変化するという考えを共有し ていた.これらのアプローチのうち,特によく知られ ているものはガードナーの多重知能理論 [Gardner 99, Gardner 01]である.この理論では,八つの異なる知能 の種類・形態,すなわち(1)言語的知能,(2)論理・ 数学的知能,(3)音楽的知能,(4)身体運動的知能,(5) 空間的知能,(6)対人的知能,(7)内省的知能,(8)博 物学的知能,を提案している.そして,個々人の知的技 能は八つの知能形態の寄せ集め,もしくは組合せとして 示される. ガードナーの理論は成人の知能の分野に大きな影響を 与えた一方で,子供の知能発達研究へは比較的小さかっ た.一方で,認知発達分野の研究者らは,(1)知性の変 化プロセスの記述や(2)変化を可能とする(生物学的・ 環境的な)基本メカニズムの同定と説明を試みた.認知 発達の最新理論は非常に多様であり,単純な体系化を嫌 う.その分野の詳細な紹介はここでの関心からはずれた ものとなる.しかし以下では,ピアジェとヴィゴツキー に由来する二つの主流学派を AGI 全体図の軸として用 いることにする. 〔1〕 ピアジェの理論 ピアジェは,認知発達科学の起源となった著名な研究 において,人間は四つの質的に異なる発達段階を経て成 長すると提唱した [Piaget 53, Piaget 78]. はじめに,出生~ 2 歳児までの感覚運動期の幼児は, さまざまな感覚や運動能力の豊富なレパートリー(伸ば す,握る,はいはいする,歩くなど)を身に付ける.こ の段階には,隠れたものを探す能力や単純な道具として ものを扱う能力などといった重要なマイルストーンがい くつも含まれている. 次の,2 ~ 6 歳の幼児は前操作期へ移行し,自身の体験を感情として表現する能力(記憶,心的イメージ,絵 を描く,言語など)を獲得するが,論理的な一貫性をもっ てそれらの表現を体系的に連携させる能力が欠けてい る. 次の段階(6 歳~思春期)の具体的操作期の子供は, 論理的や数学的思考の初歩を習得する.そこには,数値 演算や論理的関係と共に,クラスやカテゴリーについて 推論する能力も含まれる. 最後の思春期からの発達段階,すなわち形式的操作期 では,演繹的論理や組合せ推論や仮説を利用した出来事 の推論能力が習得される. 〔2〕 ヴィゴツキーの理論 ピアジェの個人に着目した視座に対し,ヴィゴツキー の認知発達の代表的理論は社会文化的観点を重視してい る [Vygotsky 86, Vygotsky 01].ヴィゴツキーの理論は, 社会的環境の影響を強調するだけでなく,個々の文化が 子供にユニークな発育の文脈をもたらすということも主 張している.この理論における基本概念とは,(1)内面化, (2)最近接発達領域(ZPD),(3)知育道具の三つである. (1)思考力は発話を獲得する(声に出して考える)こ とから始まり,それが徐々に内面化する. (2)両親,教師,有能な友人などが,子供が一人で行 えることから少し先のレベルに手が届くよう手助け することで発達を促すことを強調している.この認 知スペースのことを最近接発達領域とした. (3)子供は,学習を促すモノやアイディア,伝統から 知能を「継承」する.例えば,本や電卓,計算機な どがそれにあたる.これら知育道具は,認知発達の パターンに影響を及ぼすだけでなく,発達の速度や 広がりに制約を与える. 〔3〕 人間知能の全貌調査 ピアジェとヴィゴツキーの見解は,着目点が異なるた め対立するものとみなす向きも多いが,それらは同じ発 達プロセスの相補的かつ部分的な記述である.ピアジェ のアプローチが個々の子供の認知発達の段階に着目して いる一方,ヴィゴツキーは同じ発達プロセスを,道具や 言語,本,共有環境などの文化的産物を手にして利用の 仕方を身に付けている他者との社会的相互作用の文脈で 考えた.それぞれの理論の発達段階を対立軸として置く (図 3)ことで,人間の認知発達の全体図の輪郭を描き, AGIに至る道にマイルストーンを配置するための構造を 提供することができる. 3・2 ボトムアップアプローチ:AGI 全体図の基層 AGIコミュニティの最終的な目標は,人間レベルの汎 用知能を,実際に機能するシステムとして構築すること である.この高い目標を達成するには,先に述べた認知 的な行動や発達を深く理解することと同時に,その理解 を非生物学的な基質,すなわちディジタルコンピュータ に実装することが求められる.これを遂行するため,著 者らは図 4 に示すような多くの異なる学問領域からのイ ンスピレーションや視点を受け入れる.生理学からは人 間の知能の生物学的な実装についての知見を求め,数学 からは実装によらない情報と知能の本質,情報処理から はそれらで得た知見など AGI の実装に直接的につなが る計算機科学のメタファと対応付ける.本節では,ロー 図 3 人間の認知発達の全体図 (6 歳〜思春期) (思春期〜大人) (2 〜 6 歳) (出生〜 2 歳) 図 4 AGI 全体図の基層
ドマップ作成のための基本的要素について述べる. 〔1〕 生理学的視点 生命科学の進歩により,遺伝学,生化学,神経メカニ ズムなどを取り込み,認知発達に関して包括的な視点か ら解釈できるようになりつつある.生物学的思考から見 た認知理論の特徴は,一貫したパターンとしてさまざま な文化,物理環境,歴史的過程を越えて存在する発達の 普遍的側面(例えば,運動技能の発達,モノの認識,言 語獲得など)を説明できることにある.生理学的アプロー チは,発達の典型的パターンと非典型的パターン(例え ば,自閉症,注意欠陥多動性障害(ADHD),学習障害 (LD),身体障害など)の違いの説明にも重要な役割を 果たす.生理学的視点と情報処理的な視点のどちらも認 知発達においてモジュール的な説明を用いる.これは, 脳を特定の処理タスクに特化した入出力システムとして 分割可能であるという考え方によるものである. 〔2〕 数学的視点 数学的視点は,汎用知能の形式的定義を Solomonoff-Levin 分布に基づいて定めた Marcus Hutter, Shane Legg らの最近の研究に代表される [Legg 07].おおま かにいえば,彼らは知能をシステムの平均報酬獲得能 力(すべての報酬加算可能な環境における平均)として 定義した.そこでは,個々の環境において,よりコン パクトに記述されたプログラムの得点が高くなるように 重み付けされている.この定義の亜種として,知能が特 定の種類の環境に偏る可能性やすべての知的システムが 明示的に報酬を求めていないことを踏まえた提案もある [Goertzel 10]. 知能を情報の圧縮という観念で理解することは有益で ある.しかし,こうした汎用知能の数学的な定義につい て完全な同意がなされたとしても,それは AGI におけ る「人間レベル」に対応するものではない.人間の知能は, AIXI(Hutter の「最適に知的なエージェント」[Hutter 04]*2)のような理論的な AGI という意味で完全に汎用 でもなく,今日の AI ソフトウェアという意味で高度に 特化したものでもない.それは,高度に汎用的な能力で はあるが,人間の知能は,発育環境の階級に偏向してい る(その環境の階級の詳細な形式化は大半が未解決な問 題である)ためである. 〔3〕 情報処理的視点 認知科学では,心を表すメタファとして計算機を用い ることが多い.この視点は,ピアジェやヴィゴツキーの システム理論的なアイディアとは異なるが,同時に AGI システムが目標とする実装へのより直接的な対応付けを 与える. 情報処理的な観点からすると,幼児や子供の認知発達 は「ハードウェア」(例えばシナプスの形成や神経プルー ニングなどの神経の成熟)と 「ソフトウェア」(例えば 情報の獲得と処理のための戦略獲得)の両方の変化によ るものである.この情報処理の視点は,多くの場合,発 達を段階的なアプローチとしてよりも,緩やかな連続的 な変化の過程を重視する.例えば,短期記憶能力は,し ばしばランダムな文字や数字の列を記憶する方法で測定 されるが,その成績は幼児期の間は線形的に向上する [Dempster 81].
4.課題:タスクと環境の発見
次に取り組む課題は,すべての Laird-Wray 特性は有 用とみなし,それらすべての要件を満たしたうえで AGI 研究の進捗評価に適したタスクと環境の定義を示すこと である.この課題の本質は,あるタスクや環境が,アプ ローチやアーキテクチャを相互に比較する際の有用な基 となるかにある.さらに,タスクと環境はどちらも,互 いの状況を踏まえつつ適切に設計しなければならない. 例として,大まかに指定された砂漠のコースを自律的に 走破する自動車を開発する競技会*3をあげると,そこで 用いられたアーキテクチャや実装の多くは後日行われた 都市環境での自律的走行競技会*4でも役に立ちそうな ものであった.だが,実際には環境が変わったことでタ スクやサブタスク自体についてかなりの再考を必要とし た. それゆえ,タスクにとっては文脈が非常に重要であり, AGI自身の「身体性」も含めた環境はタスクの定義と合 わせて考える必要がある.そこで我々はタスクとそれに 必要な環境を組み合わせてシナリオを定義する. さらに,多数のアプローチやアーキテクチャとともに 複数のシナリオを考えるうえで,異なるシナリオに含ま れるタスク同士で比較・関連付けができることも重要で ある.これを念頭に,まず人間の知的能力の概要的かつ 試行的なリスト(図 5)を作成した.大雑把にいえば, タスクは環境においての能力を評価するための手段であ る.しかし,より完全かつ厳密,洗練された知的能力リ ストとするための指針を与えるには,現在の認知科学は 不十分である.著者らがここで示すものは,タスク生成 のための厳密な手法というより,現実的にタスク生成を 考えるための直感的手法といえる. 4・1 AGI のための環境と身体化 人間の汎用知能は,身体という文脈のもとで発達する. *2 本特集の小林・相澤記事(pp. 234-238)を参照.*3 DARPA Grand Challenge rulebook, http://www.darpa. mil/grandchallenge05/Rules_8oct04.pdf
*4 DARPA Urban Challenge Rules, http://www.darpa.mil/ grandchallenge/rules.asp
その身体は何千という入出力器官を備えており,養育者 や教師・協力者・アドバイサーなどの多くの人に囲まれ 非常にリアクティブな環境の中に置かれている.人の入 力感覚は,温度と接触に反応する皮膚センサから,鼻と 口のにおいと味のセンサ,耳と目の音と光のセンサ,重 力の方向や身体の関節の方向などの情報を得る内部の固 有感覚センサまで多岐にわたる.人間の出力器官には, 周囲の物理環境に影響を与えるさまざまな方法が含まれ る.例えば,筋肉を使って体を動かす,体動や声帯の振 動で音を出す,などがある.視線の方向や焦点を制御す る筋肉のような器官も環境センシングに直接的に影響を 与える. ゆえに,AGI の実現に関わる特有の課題の一つとは, いかにして感覚・運動の性能の違いを説明するかという ことである.AI の歴史には,Gray Walter の Tortoise [Walter 53]からホンダの ASIMO まで,ロボットの身体 に関する幾多の試みであふれている.さらに,仮想身体 化技術も利用されつつあり,Steve Grand の Creature [Grand 01]のように仮想環境で身体をシミュレートする ソフトウェアシステムもある. 現実世界もしくは仮想世界において身体や環境を設計 するために,身体の精巧さや環境の複雑さの適切なレベ ルを定めるには多くの課題がある.残念ながら,身体性 に取り組んできたほとんどすべての AI や AGI のプロ ジェクトは,さまざまな点で独自性が強く,ほかのシス テムと相容れない再利用性に貧弱なシステムである.こ れに当てはまらない特筆すべき事例として,複数のリー グからなる RoboCup [Kitano 97] がある.そこでは,ソ ニーの AIBO や Aldebaran の Nao などの商用ハードウェ アプラットフォームが指定され,参加者にはロボットの ソフトウェアの改造のみが許されている.ただ残念なこ とに,RoboCup タスクはサッカーを模したゲームでし かなく,AGI のベンチマークとして使うには狭すぎる* 5. 4・2 人間の能力の広さ 直感的には,環境や身体が物理的か仮想的かにかか わらず,人間と同等の AGI とみなされるために備えて おくべきいくつかの能力が存在する.例えば,ある AI システムが既知のモノや概念に関わる質問に IBM の WATSONよりもはるかに賢く答えられたとしても,状 況によって新しい概念をつくり出せないのであれば,人 間と同等の知性をもつとはいえないであろう. 人間レベルの汎用知能に求められる能力の的確なリス トを示すことは,本論文はもちろん,現代科学の限界を 超えている.だが,それでも,実際に活動する AGI シ 図 5 人間レベルの汎用知能に関連する主要な能力域の例 知覚 記憶 注意 社会的相互作用 計画 動機付け 視覚 作業記憶 視覚 コミュニケーション 戦術的 サブゴール生成 嗅覚 エピソード記憶 聴覚 適切さ 戦略的 情動による動機付け 触覚 暗黙的 社会的 社会的推論 身体的 満足遅延 味覚 意味的 行為的 協力 社会的 利他行為 聴覚 手続き的 競争 人間関係 クロスモダリティ コミュニケーション 自他のモデリング 固有感覚 ジェスチャ 自己意識 言語 他者意識 推論 音楽 情動 人間関係 運動 帰納 絵画 学習 知覚 自己制御 身体スキル 演繹 図式 模倣 表現 心の理論 道具使用 アブダクション 言語獲得 強化 制御 共感 移動 身体的 クロスモーダル 対話的 理解 エンパシー 固有感覚 因果的 メディア指向 共感 連想的 実験 エンパシー 制作・創作 数量 モノを使った構築 観察対象の数え上げ 新規概念の生成 少数の外界事物を用いた算数 言語的な創作 観察対象の数量比較 社会組織 簡単な道具を使った計測 *5 2014 年現在の RoboCup では,ほかに災害救助や室内での作 業を対象としたリーグもある.
ステムが対応するタスク生成のためのヒューリスティッ クな指針を与えるという目的で,人間の能力範囲を調査 することは有益である.ロードマップ作成作業のワーク ショップにおいて検討した一連の広範な能力を図 5 に リストとして示す.このリストは,14 の高次能力領域 とそれぞれに関連するいくつかの重要な下位領域からな る.これら下位領域の一つ一つに関する詳細な議論には, 長いレビュー論文と数十の参考文献を必要とするが,本 論文ではこのリストを示すことで十分としたい. これらの能力について十分に検討することは重要であ る.さもなければ,テスト環境を,安易に環境の制限に バイアスを与える過度に制限されたタスク群で構成して しまう.我々が提唱しているのは,特定の能力リストで はなく,むしろさまざまな能力領域の探索の手法であり, ひいては特定の環境内における一つ以上の領域の能力の 発現を評価するためのタスクをつくり出す手法である. 少なくとも人間の認知的発達の見地からすると,リス トにある能力のいくつかは,直感的にほかの能力よりも 簡単で,「初期段階」のものに見えるかもしれない.こ の論文の冒頭で述べた発達理論は,それぞれ人間が獲得 するさまざまな能力が発達する順番に関する仮説をもっ ている.一方,熟慮の結果,我々は AGI 能力のロード マップには能力の順序付けは不要であると結論付けた. 既存の AGI アプローチの多くは,同じ能力の集合を全 く異なる順序で研究を進めている.そのため,能力の順 位を付けることは,ロードマップ作成作業を特定の AGI アプローチに偏向させることになってしまい,現時点の AGI開発で切望されている研究者同士の協調・協力とは 反する. 例えば,発達ロボティクス [Lungarella 03] や深層学 習(Deep Learning)[Bengio 09] のような AGI アプロー チではしばしば,知覚能力や運動能力が言語能力や推論 能力の前に発達すべきものと仮定する.一方,論理に焦 点を置いた AGI アプローチでは,言語能力や推論能力 から始め,後になってより複雑な環境での知覚や動作へ と進める傾向がある.シナリオや能力タスクを対象とし ても,それらの具体的な順位付けは行わないことで,既 存手法に親切でありながら,新しいアプローチの発展に も間口を広げた知的能力のロードマップを示せる. 4・3 多様な同時並行的研究活動の支援 我々は,さまざまな研究や開発の努力を支援しつつ, AGIコミュニティにとって必要である協調的な進展のバ ランスをとりながら,全体図におけるさまざまな領域で の同時並行的な活動を可能にしなければならない.この ためには,さまざまなシナリオを「うまく」解決に導く 視覚処理や運動制御などの未解決である「低次」な側面 を,我々が共通の研究基盤として十分にリッチなシステ ムを用意できるまで,高次な実装や人間の代用品で置き 換える必要がある.人間の知性は,先天的能力に非常に 恵まれた複雑な身体の中で生まれ,発達するので,AGI も同様の身体の中で同じ過程を経ることでのみ実現でき るとする意見もある.しかし,そのようなシステムを理 解し,構築する能力をもつ以前の段階において望み得る 最善の方策は,同時並行的で最終的には協力的となる研 究の場を育てることである.
5.AGI 評価シナリオ
人間レベルの汎用人工知能の実現に向けたロードマッ プを作成するには,まず具体的なシナリオをつくるとこ ろから始める必要がある.ここで「シナリオ」とは,特 定の環境において遂行される一連のタスクおよび,静止 物やほかのエージェントを含む環境と AGI システムと の相互作用に関する前提からなる集合を指す.基本とな るシナリオを決められれば,サブタスクを具体化して, それらを順序付け,性能評価についても議論できるよう になる. AGIに関わるシナリオは多種多様だが,ここでは七つ のシナリオを紹介する.これらは AGI ロードマップワー クショップの参加者から特に意義のあるシナリオとされ たものである.それぞれのシナリオについてはさらに詳 細を述べることもできるが,本章では概要のみを示す. いくつかのシナリオの詳細については参考文献を参照さ れたい. 5・1 汎用ビデオゲーム学習 このシナリオでは,一度に多くの課題に取り組む必要 がある.すなわち,AGI 研究のための標準的かつ適切な 身体,AGI 能力を徐々に開発し,その能力の測定・評価 するために感覚・運動に関する要件を追加すること,学 習能力の一般性をテストするための多様な環境構築す ること,多くの人々の経験を活用してさまざまなビデオ ゲームのプレイに関する非専門家でも容易に AGI 能力 の有無を評価できる説得力のある提示方法,といったこ との提供が課題となる. このシナリオの目標は,ある特定のビデオゲームで人 間レベルのプレイをすることではなく,AGI 開発者が競 技会の事前には知らされていない新しいゲームを含む多 種多様なビデオゲームを AGI システム(競技者)が学 習し,うまくプレイできる能力を実現することである. 競技用システムは,ゲームへの知覚・運動インタフェー スがビデオ・オーディオ出力とコントローラ入力という 規格化されたものに限られ,ゲーム実装内部のプログラ ムや状態へのいかなるアクセスも遮断されているものと する.ゲームへの動機付けのための一般的なフィード バックとして得点の出力があり,これが競技者の感情(痛 み・喜び)インタフェースに対応付けられる.競技者は, ゲームコントローラを操作し結果を見ることで,経験と 観測を通してゲームの特性を学んでいかなければならない.各種ゲームにおいて,プログラムされた対戦者やゲー ムの進行状況から得られる得点は,ゲームの学習や勝利・ 進行に要した時間とともに達成度の評価基準となる. このシナリオでテストに用いられるビデオゲームの範 囲に関しては,単純さと精巧さのどちらにも制限はない. Pongのような黎明期のゲームでも出発点としてはハー ドルが高すぎるかもしれず,さらに簡単なゲームを選択 したり開発したりするかもしれない.大多数のビデオ ゲームをうまくプレイするには一定の視覚知能を必要と するため,汎用ビデオゲーム学習(GVL)はコンピュー タビジョン技術の良いテストになる.例えば,Pong に おける比較的簡単な二次元のオブジェクトの同定・追跡 から,最も難しい場合では Tomb Raider や Half-Life の ようなゲームにおける完全な三次元の知覚・認識といっ たことまでが試される.初期の横スクロール型ゲーム (スーパーマリオブラザーズなど)から一人称視点射撃 ゲーム(Doom, Half-Life など),さらにフライトシミュ レータ(Microsoft フライトシミュレータ,スターウォー ズ X ウィングなど)に至るまで,幅広いジャンルのビデ オゲームがあり,さまざまな研究者が,おのおのの研究 の対象として,得意とするニッチなゲームが見つかるは ずである.一方,インタフェースが共通していることで, 学習した技能をほかのジャンルに適用することを可能に する. とりわけ,多くのビデオゲームをうまくプレイするた めには,かなりの戦略的思考が実現されなければならな い.そのためには,行動選択にあたって,短期的のみな らず長期的な影響を考慮しつつ状況に対応して行動する 能力が要求される.しばしば貢献度分配問題と関連付け られる能力はスケーラブルな形ではいまだ実現されてい ない.GVL はこうした能力の実現のために有用なプラッ トフォームとなる. このシナリオは,AGI の適切なテストの仕様策定と 開発に取り組む研究コミュニティの醸成の支援にも有用 である.そうしたコミュニティでは,多くの場合元々の ゲームの制作会社と協力してビデオゲームのテストを作 成し,SPEC*6 スタイルのシステム性能報告サイトに似 たインターネットフォーラムを通じて,テストの管理と 結果の報告を行うことになるだろう. 5・2 幼 児 教 育 名著である「人生に必要な知恵はすべて幼稚園の砂場 で学んだ」[Fulghum 89, Fulghum 96] を参考にするな ら,AGI システムを教育したりテストしたりするシナリ オのために保育園や幼稚園で行われている幼児教育にヒ ントを求めるという考えは魅力的である.このシナリオ は [Goertzel 09] で詳しく説明されている. もちろんこのシナリオには,ロボットを含む物理空間 での設定と仮想エージェントによる仮想空間での設定と いう二つバージョンが考えられる.このシナリオの目標 は,子供の行動を正確にまねることではなく,定性的に 幼児に似た認知的挙動を示すロボットもしくは仮想エー ジェントを実現するということである.このアイディア は AI の分野では由緒あるもので,アラン・チューリン グは,有名な「チューリングテスト」を提案した 1950 年の人工知能に関する論文で「大人の心ではなく子供の 心をシミュレートするプログラムの作成を試みてはどう か」と提案している [Turing 50]. この「小児的認知」に基づくアプローチはさまざまな 理由で有望であるが,一つの理由はその包括性,すなわ ち子供が行うことは,知覚,運動,言語や絵を用いたコ ミュニケーション,社会的なやり取り,概念的問題解決, 創造的想像が組み合わさったものであるということであ る.人間の知能は複雑なやり取りを要求する環境に応じ て発達し,幼児教育は多様な精神的成長を刺激すること ができるような環境であるように設計される.幼児教育 の環境の複雑さは,ロボット工学からのアプローチに多 大な寄与をもたらすことを示しているが,現在の仮想空 間技術の境界を広げるだけでも多くのことが実現でき る. 「小児的認知」に注目するもう一つの理由には,児童 心理学者らによって開発されているさまざまな子供の知 能発達の測定手法の存在がある.幼児教育の文脈におい て,通常は幼児の知能を測定するのに使われるタスクを 変更すれば AGI システムに与えることができる. 仮想エージェントもしくはロボットへの幼児教育とし て,人間の幼児教育を正確にまねしてみても現時点では 意味をなさない.その理由は,現在のロボットや仮想身体 が幼児とはやや異なる能力を備えているためである.AGI 用幼児教育環境構築の狙いは,一般的な人間用幼児教育 の基本的な多様性と教育的特徴を模倣することにある. 人間用幼児教育の一般的な特徴を模倣するには,仮想 幼児教育もしくはロボット幼児教育にいくつかの「学習 センタ」を設置するべきである.詳細な仕組みは経験を 積み重ねることで,適したものになっていくだろうが, 初期の学習センタには下記を含めることが考えられる. ● ブロックセンタ:テーブルがあり,その上にさまざ まなサイズや形のブロックがある. ● 言語センタ:AGI を囲んで話すために環状に配置し た椅子がある. ● 操作センタ:さまざまな視覚・運動技術を教えるこ とを目的とする形やサイズの異なるさまざまな種類 のものから構成される. ● 球技センタ:ボールが棚の中に保管され,AGI が一 人もしくは他者とボールを蹴ったり投げたりするス ペースがある. ● 演劇センタ:AGI がさまざまな動きや役割を見たり
*6 Standard Performance Evaluation Corporation. http:// www.spec.org(2011)
演じたりすることができる. 5・3 文 章 理 解 次のシナリオは前の幼児教育シナリオと密接に関連し ている.だが,仮想世界における身体は必要とせず,特 定のカリキュラムと深い関わりをもつ.このシナリオで は,AGI の卵は小学校での読解カリキュラムをこなし, 人間の子供の能力評価に用いられる試験を受けて合格し なければならない.当然ながら,これには自然言語で書 かれたテキストを理解し,それに関する質問に答えられ ることが必要である.しかし,それほど自明ではない能 力もまた必要である. 幼い時期の読み物は,一般的に絵と文章が密接に結び 付いた絵本である.本によっては物語の大半を絵を通し て伝える.物語を理解するためには,自然言語の文章の みならず,絵も理解しなければならない.それは,登場 人物とその登場人物が行っていることを認識する必要が ある.文中で言及され絵の中で描かれている登場人物お よび出来事の間の参照解決が必要となる.ビデオから得 られるフレーム列を通じた行為認識とは異なり,登場人 物の行動は「スナップショット」のポーズから認識しな ければならない.次の段階の読み物は挿絵の入った「児 童文学」である.そこでは物語は主に文章を通して進め られるが,理解のためには,絵を用いた参照解決がまだ 重要である. 読書の教師は「読者の四つの役割」を認識している という.すなわち「意味理解者,コード解読者,文章の 利用者,文章の批評者である……意味理解者とは理解の ために読書する者である……それぞれの役割で求められ る(探求する)能力とは,文字理解,推論的理解,批判 的思考である」[Sundance 01].コード解読者は書かれ た文章と発話を相互に翻訳する.文章の利用者は文章が フィクションかどうかを識別する.「本に書かれている ことが事実なら,読者は情報を求めて読み込む.文章が フィクションなら,読者は物語の筋書,登場人物,メッ セージを理解するように読む……文章の批評家は,情 報の提示方法に関して筆者の目的と筆者の判断を評価 し,……社会的および文化的公平性をチェックし,… …そしてその本に対する自分自身の反応について考え, その本があり得る最高の形であるかどうかを考える」 [Sundance 01]. すべてではないが,意味理解者,コード解読者,文章 の利用者の役割のほとんどは,自然言語理解に従事する 人々に知られている.しかし,文章の批評家の役割は知 られておらず,単に文章中の情報についての推論を行う だけでなく,文章の質,筆者の意図,読者の社会および 文化と文章との関連,読者自身の文章への反応について のメタレベルの推論を必要とする. このシナリオは,Laird-Wray 基準の大半を十分に満 たし,十分ではないが残りの基準も満たす.このシナリ オでの AGI の環境は直接的な意味では動的ではないが (C2),AGI は課題を遂行するためには物語の動的な状 況の移り変わりを推論しなければならない.ある意味で 作業課題は新規(C5)というより定型的なものであるが, タスクを遂行するにつれて AGI にとって新規なものと なる.カリキュラムに集団作業が含まれる場合(実際に あり得る)には,ほかのエージェントの活動が作業の結 果に影響を与える(C4).このシナリオで必要とされる いくつかの能力は次のシナリオでも議論される. 5・4 物語・シーン理解 シーンと物語の理解に焦点を当てたこのシナリオで は,幼児教育および文章理解のシナリオと共通する側面 が多い.文章理解シナリオと同様に幼児・少年期の活動 の一部に対象を絞っているが,文章理解シナリオとは異 なり外界とのより広い関わりを含む活動を対象としてい る.ここでいう「シーン理解」は,挿し絵のようなもの に限らず,さまざまな粒度,媒体,複雑さをもって表さ れる現実世界におけるシーン(漫画,映画,演劇など) を対象としている.このアプローチが文章理解シナリオ と異なる点は,より直接的に動的な環境を対象としてい るという点である.グループ作業が含まれる場合には, Laird-Wray 基準のすべてが直接的かつ明白な形で満た される. 物語・シーン理解シナリオにおいては,知覚,心的表 象,そして自然言語の間の関係を重視する.ここで AGI システムには物語が提示され,その意味を理解し,別の 形(例えば映画のシーンの並びや言換えなど)で再現す ることが求められる.あるいは,システムは映画や漫画 の一部を見せられ,それを理解して言葉で改めて表現し なくてはならない.このアプローチはさまざまな標準化 可能なテストシナリオの作成に役立ち,競合する AGI アーキテクチャ同士,さらに子供との間で同じ入力を用 いることで成績を直接比べることができるようになる. 留意すべきは,これらのテストでは,システムと環境 の相互作用およびシステム自身がもつ欲求を考慮してい ない点にある.つまり欲求ベースの相互作用システムと して汎用知能を実現しようとする議論は多いが,このシ ナリオではあえてそうした包括的な処理を目指さず処理 志向的アーキテクチャとの比較を可能としている. AGIシステムの物語理解の能力とシーン理解の能力は おそらく独立した能力ではなくお互いに関連している. なぜならどちらのタスクも,知覚・言語・思考の関係を モデル化しようとするものであり,それらの関係は一方 向的なものではないからである.表現することと理解す ることを組み合わせることで,これらの領域の間の相互 の影響に着目した別のタスクを考えることもできるかも しれない.これは(先生に答えなければならないような システムを設計することによる)完全にインタラクティ ブなやり方や,(2 体のエージェントが環境を共有しな
がら互いにコミュニケーションすることを学ぶ)自己相 互作用によって行うことができる.自己相互作用のシナ リオのデザイン例としては [Steels 10] を参照されたい. 5・5 学 校 教 育 「仮想生徒」のシナリオは,前述した仮想の幼児教育 シナリオの続きである.低レベルの技能は問題なくこな せると仮定し,より高度な認知能力の発育を重点的に取 り組む.特に,エージェントとのインタフェースのすべ ては記号のレベルで実装されているものとする.エー ジェントには,動画を処理したり,会話やジェスチャを 認識したり,身体のバランスを取ったり,空間移動の際 に障害物を回避したりなどすることは求められない.こ れらの能力はすべて後で課題に追加できるが,このシナ リオのポイントは,そうした能力の初期の研究を許しつ つ,ほかのシステム開発を待たずに「なんとかしてしま う」ということである.一方,このシナリオにとって極 めて重要なのは,エージェントが人間の生徒のレベルで 学力を向上させ,人間の心理を理解し,自らを取り巻く 教室内での人間関係を理解するということである. このシナリオにおいて,エージェントは仮想現実ベー スのインタフェースを通して実際の高校の教室に組み込 まれる.エージェントは,教室内の大きなスクリーン に切れ目なく映し出される記号的な仮想世界に住んでい る.仮想世界には記号レベルで表現される仮想の教室が あり,そこには簡単なアバターとして表現される人間の 教師や人間の生徒がいる.エージェント自身は,この仮 想教室にいるアバターとして表現される.記号的な仮想 世界は,シーン解析・会話認識,言語理解,ジェスチャ 認識などを担う知的なモニタ・記録機器を通じて,物理 的現実世界と「同期」される(必要であれば,これらの 活動の一部またはすべてはテストを実施している人間の 担当者によって隠れて実行されるが,エージェントであ る生徒にはその存在を気付かれないようにする).生徒 用の教科書そのほかのカリキュラム教材を含めた教材は 電子化され,エージェントが記号レベルで利用できるよ うにする. このシナリオの特に難しいところは,エージェントが 自身の学習や問題解決の実行においてのみでなく,生徒 や教師とのやり取りを通した問題解決のアプローチでも 評価されることである.ここでは自己調整学習のための 一般的な指標が用いられる [Winne 00].加えて,エージェ ントの社会的な挙動は生徒へのアンケートや標準的な心 理学的測定基準に基づいて評価できる.ほかに重要とさ れる評価基準としては,エージェントが一緒に学ぶこと で人間に与える影響がどうかということである. 5・6 ウォズニアックテスト アップルコンピュータのスティーヴ・ウォズニアック は,あるインタビューで,なじみのない家の中に入って コーヒーをいれるようなロボットの実現性について疑問 を呈した [Wozniak 07].このタスクは身体をもつ AGI にとって「チューリングテスト」と同程度に難しい.ウォ ズニアックテストは,Nils Nilsson が示した人間レベル の AI に対する一般的な「雇用試験」[Nilsson 05] の特 殊な場合であることに注意されたい. 一般的な家かアパートの戸口の前に立ったロボット は,まずドアベルかノッカーを見つけるか,もしくはド アをノックして家主を呼び出す必要がある.応答があっ た場合,次に家主に対して自分が何者かを戸口で説明し, 招き入れられたならすぐに入らなくてはならない(この テストにおける家主は,ロボットを招き入れてテストを 行うことについて同意しているが,それ以外については 実験チームの行うことや実験との関わりを一切もたず, 人工知能やロボット工学についての特段の知識をもって いないことを前提とする).ロボットのなすべきことは, 家に入り,台所を見つけ,コーヒーをつくる材料と器具 を探し出し,家主の好みのコーヒーをつくり,別の部屋 でそれを出すということである.ロボットは,家主に質 問をすることが許されている(設定によっては要求され ている)ものの,いかなる物理的な支援も許されない. 現状のロボット工学はさまざまな点で上記の機能を実 現するにはほど遠い.ロボットは,移動し,物体を識別 し,場合によっては(「コーヒーはあそこのキャビネッ トにあるよ」といった)視覚情報でジェスチャを認識す ることや,複雑な操作を統合しなければならない.例え ば,なじみのないポットからなじみのないカップにコー ヒーを注ぐような場合には,強いフィードバック学習 ループで操作と物理モデリングを結ぶ必要があるかもし れない.音声認識および自然言語の理解と生成が必要に なる.また,マニピュレータの動線に始まり,コーヒー を入れる手順にわたるさまざまなプランも必要である. コーヒーをいれるロボットに必要な AGI の主な進歩 は,これらの機能のすべてが全体の目標達成に向けて協 調的であり,適切かつ全般にわたって使用されなければ ならないという点である.これらのすべての領域で,い わゆる弱い AI における問題の定式化からデフォルトの 設定やタスクの定義などが欠けており,ロボットは問題 を解決するだけでなく,問題の発見もしなければならな い.こうしたことから,初めて訪れた家でコーヒーを入 れるタスクは,システムの適応能力や常識の適用能力を ためす困難なテストといえる. あらゆるコーヒーメーカに関するデータベースを組み 込んでおくという対処も考えられるが,各オブジェクト に対する実際の操作を事前にプログラムしておくという ことは,特に作業空間の配置やレギュラーコーヒーの入 れ物などに変化があることを考えるとあり得ない.この システムを実現するには,転移学習,一般化,類推,特 に事例や訓練から学習する能力がほぼ確実に必要になる. コーヒーをいれるタスクは多少の経験を積めば 10 歳
の子供でも確実にこなせる.1 週間ほどさまざまな家で さまざまな方法でコーヒーを入れる方法を見て練習すれ ば,ウォズニアックテストでたいていの家においてコー ヒーを入れるのに十分な一般的能力を得られるだろう. このテストのもう一つの長所は「ずる」をすることが非 常に難しいということである.なぜなら,このタスクに アプローチする唯一の経済的で合理的な方法は,汎用学 習能力を開発し,コーヒーをいれるだけでなく似た家事 を学ぶことができるロボットをつくること以外にはない. 5・7 AGI 実現のための初期のロードマップ 以上の七つのシナリオの説明により,先に定義した AGIの全体図(図 3)にそれらを配置することができる ようになった.図 6 にこの配置の結果を示す.汎用ビデ オゲーム学習,シーン・物語理解シナリオは,内容の複 雑さと認知的な難しさの程度に応じて,全体図の大部分 にわたって分布している.著者らは,Laird-Wray 必要 条件を現実的な開始点,上記のシナリオをより大きなも のとするための,ひとまず代表的な事例と考えており, この初期のロードマップが AGI に関する全体としての 経験が増すにつれて拡張され修正されることを期待して いる. 5・8 残 さ れ た 空 白 上記のシナリオは AGI の全体図を満たすための重要 な一歩であるが,多くの代替シナリオが考えられ,我々 が十分に検討できていないか,全く言及しなかった範囲 をカバーすることもあり得る. 注目すべき領域として,審美眼と芸術的行為,構造化 された社会的相互作用,および高度な認知的機能・統合 を必要とするスキルがある. 審美眼と芸術的行為には,作曲,創作,芸術的描写, ダンスなどが含まれる.審美眼を分析するには,動機付 けの仕組みや心的表象,そしてメタ認知への理解を深め なくてはならない.さらに美術作品の創作活動において は,物理的あるいは想像されたものの操作,作成や脚色, 心の理論や社会的側面など多くのことが加わる. 構造化された社会的相互作用には,目標の選択や協力, 競争と搾取,交渉,談話や共同意思決定,グループ形成, リーダーシップなどが含まれる.社会的領域のシナリオ では,社会的設定や個々人の心理状態,エージェント自 身の目標への影響の可能性についての表象や評価が求め られる.高度な認知的機能・統合を必要とするスキルに は,複雑な救出シナリオ,実環境での買い物,熟達した 介助などがある.これらのタスク領域ではそれぞれ,相 互作用,探索,評価,プランニングの間で複雑な調整が 必要となるであろう. 著者らはさらなるシナリオの提案を歓迎するが,それ らは AGI のアプローチにしっかりと根ざしているべき である.すなわち,各シナリオは,単に限られたタスク に対して転用の効かない工学的な解決法をもたらすので はなく,人間のような汎用知能への理解を深めるべきも のである.