人工知能学会研究会資料 SIG-AGI-013-03
1
AGI のデザインに向けた人間機能の一考察
A study of the human functions for the AGI design
岡谷 基弘
1Motohiro Okaya
11
フリー
1Freelance
Abstract: “How to make the AGI (Artificial General Intelligence)” is a fundamental and difficult problem. The AGI
may be made referring to human intelligence. I introduce a study of human intelligence as functions. There are three functions in human intelligence. The first is “the symbolization of the world”. The second is “the desire which make us aim to realize the desirable world”. The third is “the decision system based on prediction”. This way of thinking allows us to consider the AGI design as approximation of human intelligence.
.
1. 背景
近年 AGI(Artificial General Intelligence)の実現に対 する期待が高まりつつある。そのため、各種の分野 で精力的に研究が行われているが、既存の研究は個 別具体的な原理解明や学習方法についての提案が多 く[1]、どのように AGI を構築するのかという根本的 な視点はあまり見られない。そこで本考察では、AGI の根本的なデザインを念頭に、人間知能の機能とし ての側面について論ずる。
2. 人間知能の機能
人間には大きな 3 つの根本的機能があると考える。 1 つ目は、「世界の記号化」、2 つ目は「望ましい世界 を求め続ける広義の欲求」、3 つ目は「予測に基づく 方策決定」である。「世界の記号化」は、記号創発ロ ボティクス[2]で述べられているように、人間の感覚 器官情報を脳内で処理し、「認知的に閉じた」状態で 概念を形成することである。「望ましい世界を求め続 ける広義の欲求」は「人がなぜ生きるのか」を表現 したもので、本稿で筆者が定義する。「予測に基づく 方策決定」は、「世界の記号化」と「欲求」に基づい て予測を行い、将来の行動を決定する機能である。 以下にそれぞれについて述べる。2.1.
世界の記号化
人間は生まれてから様々な刺激を受ける。これは、 視覚を通じた画像の時系列的刺激や、聴覚を通じた 音響の時系列的刺激、皮膚を通じた圧力・温度の時 系列的刺激、内受容感覚による種々の時系列的刺激 などである。人間は、生まれてから「一定のルール」 に基づいて、これらの時系列刺激を教師なしクラス タリングしていると推定している。そして、声や身 体を通じて世界に影響を与え、さらに時系列刺激を 受けて新たな概念を形成していく。記号創発ロボテ ィクスの分野では、ロボットに画像や触覚アレイセ ンサの情報をクラスタリングさせることで概念形成 [2]を実現している。人間は、現在のロボットよりも はるかに多くの画像情報、触覚情報等を扱えるが、 それらの情報量を適宜削減しクラスタリングするこ とで概念を形成しているのである。 ここで、概念形成について一つの仮説を提案する。 人間が受け取る時系列刺激は、脳内ではニューロン の発火パターンとなっているが、この「流れ方」は 各感覚器官を次元(またはそれをさらに抽象化した 次元)とする多次元空間の超立体として表現可能で あるという仮説である。図 1 は、時系列データが多 次元の超立体として表現される概念図を表している。 人間がある言葉に対して感じる「意味」とは、この 多次元の超立体を参照していると考える。例えば、 「りんご」という言葉の意味は、赤くて甘い果物で、 噛むとシャリシャリして美味しく、空気中で放って おくとだんだん色が変わるといったものだが、これ は、視覚刺激、触覚刺激、味覚刺激等を次元とする 超立体で表現されると考える。果物の「なし」は「り んご」と似た超立体になるが、視覚刺激軸、味覚刺 激軸の値(カテゴリ)が異なるといった具合である。人工知能学会研究会資料 SIG-AGI-013-03 2 time Int e ns it y ・ ・ ・ ・・・ 時系列刺激 ニューロンの伝達 刺激種を軸とする多次元超立体 部分的に取り出して クラスタリング 図 1. 時系列データの脳内処理と多次元記号仮説 この仮説を用いると、ロボットの物体概念形成に おいて見通しが良くなる。つまり、各センサー情報 を元にした次元を使用し、物体概念をテンソルで表 現できる。さらに具体的にいうと、プログラミング 言語の Python の numpy でテンソルを作り、その中 の値を決めることで「意味」を定義できる。 人間が世界を記号化する際は、「自分自身がある世 界の対象をどう記号化しているか」自体も記号化の 対象となる。この機能は、新たな次元を追加するこ とで実現可能と推定している。この自己認識の記号 化機能は、人間が他の生物と異なり、他の人間と「虚 構」を共有[3]でき、複雑な言語を操ることができる 基盤となっていると考える。
2.2.
人はなぜ生きるのか
古代から「人はなぜ生きるのか」という問いを人 間は抱いてきたが、決定的な答えを見つけるに至っ ていない。「人はなぜ生きるのか」という問いに対し、 見方を変えて、「人が生きる上で何が『価値あるもの』 なのか」という観点で考察する。 人が価値あるものとみなすのは、自身の欲求が満 たされるものである。マズローの欲求段階説では、 自己実現の欲求 (Self-actualization)、承認(尊重)の 欲 求 (Esteem) 、 社 会 的 欲 求 / 所 属 と 愛 の 欲 求 (Social needs / Love and belonging) 、 安 全 の 欲 求 (Safety needs)、生理的欲求 (Physiological needs)があ ると言われている。これらの欲求に対し、筆者が持 つ仮説は以下のようなものである。人間の欲求はあ る種の「報酬関数」として表現可能であり、その報 酬関数は大別すると、生理的感覚による報酬関数と 好奇心に代表される知的な報酬関数である。図 2 に それぞれの報酬関数の概念図を示す。マズローの欲 求段階説でいうと、ほぼ自己実現欲求のみが知的な 報酬関数で、それ以外は生理的感覚による報酬関数 だと考えている。生理的感覚による報酬関数の例を 挙げる。人間の赤子は空腹になると不愉快になる。 母乳かミルクを飲むと空腹がなくなり不愉快な気分 がなくなる。また、甘みを好ましいと感じ、触れ合 いにより安心する。これによって、空腹という不快 感を避けるために、または望ましいと感じる感覚を 得るために、母乳やミルクを飲むという方策が取ら れるようになる。このとき、「空腹になると不愉快に なる」、「お腹が満たされると満足する」などが一種 の報酬関数と考えられる。一方、知的な報酬関数に ついては、筆者の仮説だが、外界全てを記号化した 「世界認識」の『拡張』と『保全』両方に対して正 の報酬が得られると考える。「世界認識」の拡張とは 要するに新たな知識を得るということであり、別の 言い方をすると、「生理的に不愉快でない身体感覚刺 激及びそれをクラスタリングする概念の計算」であ る。すなわち、好奇心による知識獲得である。これ は、「楽しい」という感情を引き起こす。一方、「世 界認識」の保全とはこれまで経験したことを繰り返 すことであり、同様に別の言い方をすると、「すでに 経験した身体感覚刺激の再現」となる。これによっ て「安心する」と考える。 こうした仮説に基づくと、人間は、生理的感覚に 基づき生存を確実にし、他の人間からの承認を得る ことを保証するように動きつつ、自らの保持したこ とのない情報(身体感覚刺激)を常に求め続け、保全 し続ける機能を持つ。これが、人が生きる理由であ る。つまり、ロボットを連続稼働させ、他の人間・ ロボットからの承認を得ることを求めるように動か し、自らの保持したことのない時系列センサー情報 を常に求め続け、保全し続ける機能を持たせると AGI となる可能性がある。ただし、人間がそうであ るように、人間によるインタラクションは必須であ る。そうでないと共有信念[2]を記号として持つこと ができず、少なくとも人間と円滑なコミュニケーシ ョンを行うことができない。 ・承認(尊重)の欲求 ・社会的欲求 / 所属と愛の欲求 ・安全の欲求 ・生理的欲求 ・自己実現欲求 ・安全の欲求? 生理的感覚という報酬関数 知的好奇心、再現という報酬関数 生理的感覚による動機づけ 知的好奇心による動機づけ 図 2 報酬関数としての人間の欲求の概念図人工知能学会研究会資料 SIG-AGI-013-03 3
2.3.
予測に基づく方策決定及び感情
本節では予測に基づく方策決定について述べる。 ただし、この方策決定には感情が深く関わっている と考えており、方策決定の概要を述べた後、それが どのような感情を想起させているかについて議論す る。 これまで「意味」とは、身体感覚のクラスタリン グによって得られた多次元の超立体として表現され るという仮説を述べた。この意味の次元には、さら に「時間」と「価値」の 2 つの次元も存在している と考える。図 3 に概念図を示す。人間は「意味」を 計算する際に時間情報と価値を計算しており、これ によって、「予測」が可能になっているのである。人 間は、どのような方策を選択するとどれだけの「価 値」が得られるかを「予測」し、最も大きな「価値」 を得られる方策を選択しているのである。 身体感覚種の次元 時間 価値 例) 1.お腹が減る(価値:負) 2.ミルクを飲む 3.おいしい、お腹が満たされる(価値:正) 以上、一連の時系列的情報全体を概念としてクラ スタリングしたとき、価値増大をもたらす時間的 かつ意味的(身体感覚的)な概念が計算できて、 これによって価値増大方向の方策を取ることがで き、かつ「予測」が可能になる。 1.お腹が減る 2.ミルクを飲む 3.おいしい、お腹 が満たされる 図 3 時間と価値次元を考慮した意味の超立体 方策の選択においては、過去の経験に基づき未来 の行動を選択するが、ここに感情が関係する。感情 とはなにかという問いに対し、これまで様々な考察 がなされてきた[4]が、これまでの私の仮説を前提と して、考察を続ける。 感情が想起されるのは次の 3 つの場合であると考 える。1 つ目は「未来についての予測を行い、価値 の予測を行ったとき」、2 つ目は「過去の経験を思い 出して価値の想起を行ったとき」、3 つ目は「過去に 行った予測に対する誤差を認識したとき」である。 図 4 に感情想起の概念図を示す。1 つ目の「未来に ついての予測を行い、価値の予測を行ったとき」に おいては、未来の価値増大確度が高ければ幸福感を 感じ、価値減少確度が高ければ悲壮感を感じる。ま た、「過去に行った予測に対する誤差を認識したと き」では、予測に対して価値が高ければ喜び、価値 が低ければ悲しみや苦痛を感じる。ここで、人間に とって他の「人間」が特別であるということを考察 する必要がある。また筆者の仮説だが、人間は、外 界全てを記号化した「世界認識」の価値増大予測を 他の「人間」に投影して考える機能がある。強い価 値増大予測の投影は「愛」と呼ばれ、予測に対する 実現の誤差が正であればさらに「愛」が増強される が、予測に対する実現の誤差が著しく負になった場 合「怒り」や「憎しみ」となる。「怒り」は基本的に 人間を対象として想起されることが多く、こうした 生理機能は人間にルールベースで組み込まれている と推定している。 こうした人間の行動の方策決定において、他の人 間に対し強く影響する機能を得た人類だけが、社会 を構築し今日まで生き延びてきたのだろう。 T h e V al ue Time Present Prediction T h e V al u e Time Present Prediction happy unhappy T h e V al u e Time Past Recognition Present prediction realization T h e V al u e Time Past Recognition Present prediction realization pleasant unpleasant 未来価値予測と想起される感情 過去の価値予測とその誤差と想起される感情 図 4 未来価値予測と価値予測の誤差認識と感情 身体感覚種の次元 価値 他の人間に投影 図 5 意味の超立体の価値増大予測を 他の人間に投影する概念図人工知能学会研究会資料 SIG-AGI-013-03 4