AGI のデザインに向けた人間機能の一考察

(1)

人工知能学会研究会資料 SIG-AGI-013-03

1

AGI のデザインに向けた人間機能の一考察

A study of the human functions for the AGI design

岡谷基弘

1

Motohiro Okaya

1

_フリー

1

_Freelance

Abstract: “How to make the AGI (Artificial General Intelligence)” is a fundamental and difficult problem. The AGI

may be made referring to human intelligence. I introduce a study of human intelligence as functions. There are three functions in human intelligence. The first is “the symbolization of the world”. The second is “the desire which make us aim to realize the desirable world”. The third is “the decision system based on prediction”. This way of thinking allows us to consider the AGI design as approximation of human intelligence.

.

1. 背景

近年 AGI(Artificial General Intelligence)の実現に対する期待が高まりつつある。そのため、各種の分野で精力的に研究が行われているが、既存の研究は個別具体的な原理解明や学習方法についての提案が多く[1]、どのように AGI を構築するのかという根本的な視点はあまり見られない。そこで本考察では、AGI の根本的なデザインを念頭に、人間知能の機能としての側面について論ずる。

2. 人間知能の機能

人間には大きな 3 つの根本的機能があると考える。 1 つ目は、「世界の記号化」、2 つ目は「望ましい世界を求め続ける広義の欲求」、3 つ目は「予測に基づく方策決定」である。「世界の記号化」は、記号創発ロボティクス[2]で述べられているように、人間の感覚器官情報を脳内で処理し、「認知的に閉じた」状態で概念を形成することである。「望ましい世界を求め続ける広義の欲求」は「人がなぜ生きるのか」を表現したもので、本稿で筆者が定義する。「予測に基づく方策決定」は、「世界の記号化」と「欲求」に基づいて予測を行い、将来の行動を決定する機能である。以下にそれぞれについて述べる。

2.1. 世界の記号化

人間は生まれてから様々な刺激を受ける。これは、視覚を通じた画像の時系列的刺激や、聴覚を通じた音響の時系列的刺激、皮膚を通じた圧力・温度の時系列的刺激、内受容感覚による種々の時系列的刺激などである。人間は、生まれてから「一定のルール」に基づいて、これらの時系列刺激を教師なしクラスタリングしていると推定している。そして、声や身体を通じて世界に影響を与え、さらに時系列刺激を受けて新たな概念を形成していく。記号創発ロボティクスの分野では、ロボットに画像や触覚アレイセンサの情報をクラスタリングさせることで概念形成 [2]を実現している。人間は、現在のロボットよりもはるかに多くの画像情報、触覚情報等を扱えるが、それらの情報量を適宜削減しクラスタリングすることで概念を形成しているのである。ここで、概念形成について一つの仮説を提案する。人間が受け取る時系列刺激は、脳内ではニューロンの発火パターンとなっているが、この「流れ方」は各感覚器官を次元（またはそれをさらに抽象化した次元）とする多次元空間の超立体として表現可能であるという仮説である。図 1 は、時系列データが多次元の超立体として表現される概念図を表している。人間がある言葉に対して感じる「意味」とは、この多次元の超立体を参照していると考える。例えば、「りんご」という言葉の意味は、赤くて甘い果物で、噛むとシャリシャリして美味しく、空気中で放っておくとだんだん色が変わるといったものだが、これは、視覚刺激、触覚刺激、味覚刺激等を次元とする超立体で表現されると考える。果物の「なし」は「りんご」と似た超立体になるが、視覚刺激軸、味覚刺激軸の値（カテゴリ）が異なるといった具合である。

(2)

人工知能学会研究会資料 SIG-AGI-013-03 2 time Int e ns it y ・・・・・・時系列刺激ニューロンの伝達刺激種を軸とする多次元超立体部分的に取り出してクラスタリング図 1. 時系列データの脳内処理と多次元記号仮説この仮説を用いると、ロボットの物体概念形成において見通しが良くなる。つまり、各センサー情報を元にした次元を使用し、物体概念をテンソルで表現できる。さらに具体的にいうと、プログラミング言語の Python の numpy でテンソルを作り、その中の値を決めることで「意味」を定義できる。人間が世界を記号化する際は、「自分自身がある世界の対象をどう記号化しているか」自体も記号化の対象となる。この機能は、新たな次元を追加することで実現可能と推定している。この自己認識の記号化機能は、人間が他の生物と異なり、他の人間と「虚構」を共有[3]でき、複雑な言語を操ることができる基盤となっていると考える。

2.2. 人はなぜ生きるのか

古代から「人はなぜ生きるのか」という問いを人間は抱いてきたが、決定的な答えを見つけるに至っていない。「人はなぜ生きるのか」という問いに対し、見方を変えて、「人が生きる上で何が『価値あるもの』なのか」という観点で考察する。人が価値あるものとみなすのは、自身の欲求が満たされるものである。マズローの欲求段階説では、自己実現の欲求 (Self-actualization)、承認（尊重）の欲求 (Esteem) 、社会的欲求 / 所属と愛の欲求 (Social needs / Love and belonging) 、安全の欲求 (Safety needs)、生理的欲求 (Physiological needs)があると言われている。これらの欲求に対し、筆者が持つ仮説は以下のようなものである。人間の欲求はある種の「報酬関数」として表現可能であり、その報酬関数は大別すると、生理的感覚による報酬関数と好奇心に代表される知的な報酬関数である。図 2 にそれぞれの報酬関数の概念図を示す。マズローの欲求段階説でいうと、ほぼ自己実現欲求のみが知的な報酬関数で、それ以外は生理的感覚による報酬関数だと考えている。生理的感覚による報酬関数の例を挙げる。人間の赤子は空腹になると不愉快になる。母乳かミルクを飲むと空腹がなくなり不愉快な気分がなくなる。また、甘みを好ましいと感じ、触れ合いにより安心する。これによって、空腹という不快感を避けるために、または望ましいと感じる感覚を得るために、母乳やミルクを飲むという方策が取られるようになる。このとき、「空腹になると不愉快になる」、「お腹が満たされると満足する」などが一種の報酬関数と考えられる。一方、知的な報酬関数については、筆者の仮説だが、外界全てを記号化した「世界認識」の『拡張』と『保全』両方に対して正の報酬が得られると考える。「世界認識」の拡張とは要するに新たな知識を得るということであり、別の言い方をすると、「生理的に不愉快でない身体感覚刺激及びそれをクラスタリングする概念の計算」である。すなわち、好奇心による知識獲得である。これは、「楽しい」という感情を引き起こす。一方、「世界認識」の保全とはこれまで経験したことを繰り返すことであり、同様に別の言い方をすると、「すでに経験した身体感覚刺激の再現」となる。これによって「安心する」と考える。こうした仮説に基づくと、人間は、生理的感覚に基づき生存を確実にし、他の人間からの承認を得ることを保証するように動きつつ、自らの保持したことのない情報(身体感覚刺激)を常に求め続け、保全し続ける機能を持つ。これが、人が生きる理由である。つまり、ロボットを連続稼働させ、他の人間・ロボットからの承認を得ることを求めるように動かし、自らの保持したことのない時系列センサー情報を常に求め続け、保全し続ける機能を持たせると AGI となる可能性がある。ただし、人間がそうであるように、人間によるインタラクションは必須である。そうでないと共有信念[2]を記号として持つことができず、少なくとも人間と円滑なコミュニケーションを行うことができない。・承認（尊重）の欲求・社会的欲求 / 所属と愛の欲求・安全の欲求・生理的欲求・自己実現欲求・安全の欲求？ 生理的感覚という報酬関数 知的好奇心、再現という報酬関数 生理的感覚による動機づけ 知的好奇心による動機づけ 図 2 報酬関数としての人間の欲求の概念図

(3)

人工知能学会研究会資料 SIG-AGI-013-03 3

2.3. 予測に基づく方策決定及び感情

本節では予測に基づく方策決定について述べる。ただし、この方策決定には感情が深く関わっていると考えており、方策決定の概要を述べた後、それがどのような感情を想起させているかについて議論する。これまで「意味」とは、身体感覚のクラスタリングによって得られた多次元の超立体として表現されるという仮説を述べた。この意味の次元には、さらに「時間」と「価値」の 2 つの次元も存在していると考える。図 3 に概念図を示す。人間は「意味」を計算する際に時間情報と価値を計算しており、これによって、「予測」が可能になっているのである。人間は、どのような方策を選択するとどれだけの「価値」が得られるかを「予測」し、最も大きな「価値」を得られる方策を選択しているのである。身体感覚種の次元時間価値例）１．お腹が減る（価値：負）２．ミルクを飲む３．おいしい、お腹が満たされる（価値：正）以上、一連の時系列的情報全体を概念としてクラスタリングしたとき、価値増大をもたらす時間的かつ意味的（身体感覚的）な概念が計算できて、これによって価値増大方向の方策を取ることができ、かつ「予測」が可能になる。１．お腹が減る２．ミルクを飲む３．おいしい、お腹が満たされる図 3 時間と価値次元を考慮した意味の超立体方策の選択においては、過去の経験に基づき未来の行動を選択するが、ここに感情が関係する。感情とはなにかという問いに対し、これまで様々な考察がなされてきた[4]が、これまでの私の仮説を前提として、考察を続ける。感情が想起されるのは次の 3 つの場合であると考える。1 つ目は「未来についての予測を行い、価値の予測を行ったとき」、2 つ目は「過去の経験を思い出して価値の想起を行ったとき」、3 つ目は「過去に行った予測に対する誤差を認識したとき」である。図 4 に感情想起の概念図を示す。1 つ目の「未来についての予測を行い、価値の予測を行ったとき」においては、未来の価値増大確度が高ければ幸福感を感じ、価値減少確度が高ければ悲壮感を感じる。また、「過去に行った予測に対する誤差を認識したとき」では、予測に対して価値が高ければ喜び、価値が低ければ悲しみや苦痛を感じる。ここで、人間にとって他の「人間」が特別であるということを考察する必要がある。また筆者の仮説だが、人間は、外界全てを記号化した「世界認識」の価値増大予測を他の「人間」に投影して考える機能がある。強い価値増大予測の投影は「愛」と呼ばれ、予測に対する実現の誤差が正であればさらに「愛」が増強されるが、予測に対する実現の誤差が著しく負になった場合「怒り」や「憎しみ」となる。「怒り」は基本的に人間を対象として想起されることが多く、こうした生理機能は人間にルールベースで組み込まれていると推定している。こうした人間の行動の方策決定において、他の人間に対し強く影響する機能を得た人類だけが、社会を構築し今日まで生き延びてきたのだろう。 T h e V al ue Time Present Prediction T h e V al u e Time Present Prediction happy unhappy T h e V al u e Time Past Recognition Present prediction realization T h e V al u e Time Past Recognition Present prediction realization pleasant unpleasant 未来価値予測と想起される感情過去の価値予測とその誤差と想起される感情図 4 未来価値予測と価値予測の誤差認識と感情身体感覚種の次元価値他の人間に投影図 5 意味の超立体の価値増大予測を他の人間に投影する概念図

(4)

人工知能学会研究会資料 SIG-AGI-013-03 4

3. 人間を参考にした AGI の設計指針

AGI の前提として、人間とコミュニケーションを取る機能が必要である。そのため、人間の感覚器官をある程度再現できるセンサー系を搭載する必要がある。また、ソフトウェアとして、前述した人間の機能を再現する必要がある。さらに、人間は生まれてから演算を止めることがないため、AGI においても、稼働開始後は一切シャットダウンしないことが求められる可能性がある。以下に必要なものをまとめる。１）ハードウェアとして必要なもの・動画像取得機構、音響取得機構、多数の圧力センサー、多数の温度センサー、各種アクチュエータのセンサー、ロボット内部パラメータ（電流値等）の取得機構２）ソフトウェアとして必要なもの・画像、音、圧力、温度、アクチュエータ等の多次元時系列センサー情報等を教師なしでクラスタリングし、超立体として「意味」を定義する機構（自己認識を軸として表現する必要あり）・人間の報酬関数を模した報酬関数設計（生理的感覚模倣、好奇心、経験再現）・予測し方策決定を行う機構３）その他に必要なもの・人間とのコミュニケーションによる常識の理解計算機構を除くハードウェアは、現代であれば入手可能である。課題となるのはソフトウェアである。多次元時系列情報を教師なしで分節化しクラスタリングすることについては手法が提案[5]されているが、計算コストが問題と述べられている。人間の認知の機構をロボティクスにより解明しようとする認知ロボティクス（発達ロボティクス[6]）や「好奇心」を用いて学習させる手法[7]などの分野で精力的に研究が行われており、今後の発展が期待される。

4. おわりに

AGI のデザインに向け、人間の機能について考察した。感覚器官等を次元とする多次元の超立体として「意味」が定義されるという仮説を提案した。さらに、この「意味超空間」に時間軸と価値軸を追加し、人間にとっての価値あるものとは、生理的な快・不快によるもののみならず、未知の感覚情報の取得と過去に経験した感覚情報の再現が含まれると提案した。また、価値予測による方策決定と感情についての仮説を提案した。 AGI の構築に向け、大きな方向性の一つを提案したと考えているが、具体的なアルゴリズムや「内分泌物質のないロボットに感情の定義は可能か」など多数の課題があると考える。近年はオープンソースのソフトウェアが充実していることから、個人で簡単なロボットを構築し、AGI を実現しうるアルゴリズムの研究を進めていきたい。

参考文献

[１] 松森匠哉，妹尾卓磨，大澤正彦，山川宏, 会議報告 2018 the Joint Multi-Conference on Human-Level Artificial Intelligence(HLAI 2018) 人工知能学会誌 , Vol.33, No.6, (2018)、 [２] 谷口忠大, 記号創発ロボティクス知能のメカニズム入門, 講談社選書メチエ,（2014） [３] ユヴァル・ノア・ハラリ(著), 柴田裕之 (翻訳), サピエンス全史, 河出書房新社, (2016) [４] 福田正治: 感情階層説―「感情とはなにか」への試論 ―, 研究紀要富山大学杉谷キャンパス一般教育第 40 号（2012） [５] 長野匡隼、中村友昭、長井隆行、持橋大地、小林一郎、高野渉、: HVGH:高次元時系列データの深層圧縮と教師なし分節化 , 人工知能学会 , [1L3-J-11-01], (2019) [６] カンジェロシ・アンジェロ(著)、シュレシンジャー・マシュー(著)、岡田浩之(翻訳)、谷口忠大(翻訳): 発達ロボティクスハンドブックロボットで探る認知発達の仕組み, 福村出版(2019) [７] 疋田聡: 好奇心で動機付けされた強化学習の実験, 人工知能学会研究会資料, SIG-AGI-006-09, (2017)

AGI のデザインに向けた人間機能の一考察