人工頭脳における音声情報処理 (音声情報のイメージングによる視覚化と理解)

(1)

人工頭脳における音声情報処理

（音声情報のイメージングによる視覚化と理解）

Ｖｏｉｃｅ Information Processing in Artificial Brains

江村憲夫

Norio Emura

Abstract：

"Listening to speech for an artificial brain" means "to image a sentence as much as possible from its words, content, and background",

and introduce the concept of the means of realization (below). ➀Image the contents of a sentence in a virtual field of view space

based on the storage information of the middle and upper concepts of hierarchically stored images (recognition, cognitive information, etc.) for words,

including "shared information with the other party" and "the situation around the conversation".

➁Understand the will of the other party from words/emotions/tones and perform the actions you need.

➂Acquire words and meanings for cognitive objects. Acquire the concept of time, and respond to them.

概要

「人工頭脳にとって(音声を)聞く」とは「文章をその言葉と内容と背景（文章、相手との共有情報）から限りなくイメージすること」であり、その実現手段(下記)の概念を紹介する。 [ 音声－イメージ変換実現手段 ] ➀「相手との共有情報、会話の周囲の状況を含め言葉 (単語：階層的抽象化ＷＯＲＤ空間)」に対応し(記憶素子：階層記憶化されたイメージ子同士の接続)、「（認識、認知情報他：記憶アドレス＆実体空間（連想/階層記憶））の中・上位概念の記憶情報」を基に文章内容を仮想視野空間にイメージ（視覚化）する。 ➁相手の話、話し方（文章中の単語、感情、トーン）から意志（実行ストーリィ）把握し、必要なＡｃｔｉｏｎ（受答え、行動、思考等）を実行する。＊このＡｃｔｉｏｎが適切であれば、相手の話を理解したと判断できる。 ➂会話のスキルを向上する上で「認知対象に対する言葉の意味とその意味の習得」と「時間の概念の獲得とその対応」は必須である。注記１：本論文での音声情報処理は、「空気振動で伝わってきた音声情報を電圧信号に変換し、更に文章化された情報」を使った情報処理である。注記 2: 本論文の図面で使用するヒューマノイドロボット“アシモ”の写真は、本田技研工業株式会社* （以下、ホンダ様と称す）の許可を戴いてホンダ様のホームページから引用させて頂いていますが、本論文記載の人工頭脳に関し、ホンダ様との協力関係は一切、ございません。ご承知おき願います。＊：Ｈｏｎｄａウェルカムプラザ青山. １ / 1６

(2)

１.はじめに

人工頭脳は人の脳の振る舞いを模倣した有機的情報処理によって、自律・自発的Ａｃｔｉｏｎが可能。究極的には、鉄腕アトムの頭脳を創ることにある。最大の特徴は、上記人工頭脳をヒューマノイドロボットに搭載し、自らの意思で自発･自律的なＡｃｔｉｏｎ（思考/ 会話/行動）を実行することにある。つまり、外部（視野、音声、音源、媒体等）や内部（記憶の活性化）に対し、倫理･危機感覚、常識等の範囲内で、人工頭脳の意志を生成し、具体的な実行ストーリィに落とし、Ａｃｔｉｏｎ（行動、会話、思考）を行うことにある。本論文では、コア機能である「聞く-仮想視野空間制御」(但し、音声情報の文章化を除く、話し言葉の文章に対する情報処理)の検討内容を紹介する。但し、人工頭脳は有機的情報処理であり、複数の機能が連携して処理を遂行するので、「聞く-仮想視野空間制御」の人工頭脳における情報処理の位置付けを述べ、次に思考アルゴリズムの概要を紹介する。

２.人工頭脳における位置付け

これまで、人工頭脳を検討してきた中で遭遇した大きなブレークスルーは以下の通りである。Ａ）記憶制御（人の視野の狭さが記憶形成に関与。連想/階層記憶。記憶素子ベースの情報処理） *記憶素子：リンク接続で連想/階層記憶を形成. 記憶素子の活性化伝播、階層的抽象化制御と自在な抽象度制御を実現Ｂ）思考アルゴリズム（意思が関与し、意思の意向を反映） *外部/内部情報に対し、人工頭脳の意思、連想/階層記憶が活性化することで意思ベースの課題と解決手段（人工頭脳の意志）を生成Ｃ）仮想視野空間制御（実際の物理空間と若干異なる） ①ＡＷ（認知情報）一体化制御・実視野/音声･音源/感触情報を仮想視野上で可視化 &合成&一体化、欠落情報は連想/階層記憶で補充・視野系情報(視野/音源/感触）は実仮想視野、音声情報は仮想視野で存在も、視野系との混合あり ②仮想ＡＷパレット機能・視線生成/実行ストーリィ描画/視線誘導/ＡＷ合成・実（仮想）視野情報に対し思考/状況判断し仮想視野上で A)実行ストーリィを書き、B)視線誘導/行動 ③経験/学習、”知識&他人工頭脳_スキル”の習得このようにして形成した「人工頭脳の機能ブロック図」を図２に示す。次に、人工頭脳の基本的な情報処理における機能ブロック図、及び機能ブロック間の主な情報処理の連携を図３「人の脳の振舞いを模倣した人工頭脳”の有機的情報処理」に示す。記憶制御は共通コア機能として動作する。音声情報処理は、「聞く（音声）」＋「仮想視野空間制御」において実行される。 2 / 1６図３“人の脳の振舞いを模倣した人工頭脳”の有機的情報処理 *参考文献：項#7 論文（２）SIG-AGI-011-02 他 SIG-AGI-014-0１図１人工頭脳搭載ロボットは自分の意思でケースバイケースに対応 *参考文献：項#7 論文（２）SIG-AGI-011-02 他図２人工頭脳の機能ブロック図 *参考文献：項#7 論文（２）SIG-AGI-011-02 他

(3)

[ 音声情報処理における留意点 ]

（１）本論文での音声情報処理「空気振動で伝わってきた音声情報を電圧信号に変換し、更に文章化された情報」（但し、ＷＯＲＤ間の “間“、トーン情報も含む）に対し、視野情報と同様、イメージ情報（見た結果：認識、認知情報）に変換すること。（2）音声情報への補充？？なお、音声情報（文章）は、視野情報と異なり、相手との共有情報、話の流れ・背景が含まれていないことが多く、連想/階層記憶を駆使して補うことが要求される。但し、人工頭脳（人も同じ）のＡｃｔｉｏｎ原理「全体把握と個別処理：全体を把握しつつ、注目した対象にフォーカスしてＡｃｔｉｏｎする」は見る、聞く、思考、行動、発話等全てに共通する。会話での相手の発話内容（文章）は「注目した対象」のみであることが多く、全体把握である会話の背景（バックグラウンド情報（会話の流れも含む）、共有情報、対人関係等）は省略される為、あらかじめお互いに共有していることが、会話が成立する必須条件である。先ず、会話では上記背景をイメージし、その中に発話内容のイメージを上書きすることが要求される。更に会話の内容を理解したか否かは次のプロセスで分かる。会話でイメージした内容を基に思考アルゴリズムにおいて、課題を抽出、解決手段(意志)を見出し、具体的Ａｃｔｉｏｎ生成・実行する。このＡｃｔｉｏｎが適切であれば、話の内容を理解したといえる。例えば、５Ｗ１Ｈ (when,where,who,what,why,how）に回答する様に要求された場合、質問に沿った答えを返せるか否かで判断できる。＊会話のイメージ事例 *１麦わら帽子をかぶった小さな女の子が公園のベンチに座ってシャボン玉を吹いています。 (注釈なし。風景全体がイメージ出来る。) *１：書籍（１）山中恵美子筆瞬読より引用 A 氏：昨日の夕方、車で公園に行った。 B 氏：誰と？ A 氏：C 子さんと（注釈：Ｂ氏の対応は、Ｃ子さんとの関係によってかなり変わってきます。Ｃ子さんが意中の人であれば、公園は市内唯一のデートスポッット、シーサイドパーク!!!!をイメージし穏やかではいられない。）（3）相手(話し手)の意志の把握個々の話し言葉の文章には、ＷＯＲＤ間の“間“、トーン情報も含め、相手（話し手）の意志（実行ストーリィ）*1 が含まれており、単に文章のみでなく、これらも情報処理に取り込むことが求められる。また、対人関係によって、同じ文章でも、お願い/要望であったり、命令であったりするので注意を要す。（4）認知対象に対する言葉の獲得言葉とその意味は、最初から分かっているわけではなく、生活（物理空間）の中で、獲得していく必要がある。例えば、スイカ（果物）に関し、認識、認知情報、バックグランドは理解していても言葉（例えば英語）が分からない場合、「このスイカはおいしい。食べてみて。」と言われた場合、スイカの認識・認知情報とＷＯＲＤが一致できた場合、単に単語のみならず、単語の意味、背景まで理解することが出来る。この辺の「認知対象に対する言葉の獲得」スキル（興味津々）も必須である。＊事例：トム、そこのグイメ(果物)を持ってきて！背景：お母さんはキッチンでクッキング。トムはリビングにいる、テーブルの上のバスケットに何か小さな赤い実が沢山ある。トムはリビングにいて、お母さんの指先の方向は、視線で辿っていくと小さな赤い実に辿り着く。小さな赤い実がグイメと分かる。 →WORD 空間のグイメと実体空間のグイメが結合。（5）時間の概念の獲得視覚情報では表現されず、文章で表現される“時間の概念”の獲得も必須である。時間にもＡ）視覚的要因「朝・昼・夕方・夜」「季節：春夏秋冬、梅雨」、Ｂ）時計的時間、Ｃ）カレンダー的時間、Ｄ）（厄介な）感覚的時間「さっき、ちょっと、すぐ等」があり、必須要因である。（6）その他言葉には、視覚化できる言葉と、視覚化できない言葉もあるが本論文では対象外とする。（愛、限界、始める/終わる等）以上を基に、本論文では、音声情報処理の実現手段の概念を以下の目次に従い紹介していく。 3 / 1６グイメの実グイメの木と果実

(4)

３.人工頭脳の音声情報処理

3-1.会話文章のイメージ化ポイント

（１）バックグラウンド（連想/階層記憶）を駆使

したイメージング

小説のような文章であれば、使われている言葉より情景がリアルにイメージできる。一方、会話では、共通のバックグラウンド、会話の流れに基づき、相手も分かっていることは話さない。これは、人が車を運転するのに、運転に必要なエリア、対象しか見ない（全体は把握済み：交差点の右折ライン、信号は青であれば、時間をかけて注視するのは、対向直進/左折車と横断歩道の人の動き）のと同様である。但し、会話文章をイメージするには、この省略された部分も必要であり、連想/階層記憶を駆使してバックグラウンドを形成する必要がある。

（２）階層的抽象化の連携による中位-上位概

念（記憶階層）の情報処理

「思考」と「会話の理解」は抽象度の高い階層記憶情報を用いて実施される。「！？ではなく、必須！！」階層記憶では、下位階層にいくほど、全体の一部にフォーカス、詳細になり、上位階層*2 にいくほど下位階層の記憶を総括し全体を捉えるようになっている。(少ない情報量で全体把握が可能。) なので、下位概念・階層で会話・思考を行うと、情報処理が膨大になり、全体が捉えにくくなり混乱をきたす為、ある程度、上位概念･階層での情報処理は必須条件となる。例えば、. ベランダに洗濯物が干してあって、雨が降り出したら危機感覚が作用し（過去の経験）、洗濯物を直ちに取り込む。抽象度が低いと、・服、下着、タオルがハンガーにかけてある、・ハンガーは物干し棒にかけてある、・水滴が衣類、タオルに当たっている ..と聞いても、脳は危機感覚が活性化しない →「君は、何が言いたいの？？」（雨-洗濯物- 取り込むは抽象度の高い状態で階層記憶されている）為、洗濯物は放置されズブ濡れになる。

（３）会話の伝えたいこと（相手の意志表示）の

見極め

Ａ）文章中の直接表示

質問（５Ｗ１Ｈ）、確認、回答/報告/説明/発表、誘い/ 勧め（場合によっては命令）、命令（お願い、要求）

Ｂ）間接モード

相手のＳｔａｔｕｓ：相手の表情、ｼﾞｪｽﾁｬｰ、相手の声（ﾄｰﾝ、大小、ﾎﾟｰｽﾞ）、対人関係、会話の流れ、場/雰囲気（空気を読む）会話（文章）の中に相手の意志が含まれる言葉が含まれており、相手の言いたいことが、質問・確認なのか、お願い・要望なのか、命令・誘いなのか、単なる説明なのか把握できる。と共に、対人関係、その場の空気、声のトーンによって、同じ文章でも相手の意志が（微妙に）変わってくる。例えば、同じ名前（ヒロシ）でも*3 Ａ）恋人同士が１年ぶりに空港ロビーで再開約束、ヒロシを見つけた彼女が「ヒロシ❤」と言うのと、Ｂ）子供がふざけて食器を割ってしまったのを見たお母さんが「ヒロシ!!」と言うのとＣ）妻がトイレの中から「ヒロシ～」と言うのでは、同じ「ヒロシ」でも、相手の意志、言いたいこと(内容) は、まるで違ってくる。部長が部下に「教えて」と言って言い方はソフトでも実際には命令である。これらを処理する為、連想階層記憶、学習結果を駆使する必要あり *３：事例 A)B)C):書籍（２）苫米地英人筆一瞬で相手をオトす洗脳術より引用。 SIG-AGI-014-0＃ *2 上位階層：“１記憶素子”であっても上位概念の情報であれば、下位階層の強制活性化でＡＷ一体化制御ＴＢＬにて活性化伝播の範囲が広がる →連想記憶（ﾊﾞｯｸｸﾞﾗｳﾝﾄﾞ）を駆使し、ｹｰｽﾊﾞｲｹｰｽにフォーカスした活性化伝播が可能なため、的を得た（イメージ情報）が作成可能。 4 / 1６図 4 会話文章のイメージ化ポイント

(5)

３-２文章のイメージング技術の概念

本章では図＃音声情報のイメージ変換（アルゴリズム概要）により、音声情報のイメージング情報処理について図６「音声情報のイメージ変換（アルゴリズム概要）」を用いて説明する。なお、イメージは映像ではなく見た結果である。

(1)音声情報の文章化

事例：今度の週末、スキーに行きませんか？ *会話の流れから、スキー場は“山形蔵王”

(2)文章の文節分割

今度の／週末／スキーに／行き／ませんか？なお、音声情報の文章化、及び文章の文節分割は本論文の処理の対象外とする。また、後述の文節制御により、（図５参照）・今度の週末：修飾的結合により時間的要因が確立・スキーに行く：意味的結合と（経験的）階層記憶で具体的なＡｃｔｉｏｎが確定し「山形蔵王スキー場に行く」＆「スキーを楽しむ」となる。・（行き）ませんか：意志的結合で、相手の意志 (誘い)となる。

(3)ＷＯＲＤ⇔イメージ Like 変換

各種シーンで認識、認知した対象と言葉が一致した場合、当該対象の「言葉」を獲得でき、その言葉を聞くだけで、言葉の当該対象、意味（記憶の範囲内での実態）が分かる。（活性化する）ＷＯＲＤ⇔イメージ Like 変換とは、ＷＯＲＤ（階層的抽象化）空間の言葉と、記憶空間（記憶素子-実体情報）の当該対象がリンク接続されており、言葉が活性化すると、当該対象の記憶素子-実体情報が活性化し（活性化伝搬による）、言葉や文章をイメージ（可視化）することができる。なお、このリンク接続は、人工頭脳が言葉の指す対象と意味を一致させた際、連想記憶と同様に形成される記憶素子の結合である。 *論文（３）江村憲夫「人工頭脳における記憶制御」参照図６音声情報のイメージ変換（ｱﾙｺﾞﾘｽﾞﾑ概要）図５音声文章（事例）の文節分割５ / 1６

(6)

今回は文章化され、文節分割された音声情報により A)今度の週末、B)スキーに行く、C)～ませんかが階層的抽象化（WORD）空間内で活性化し、リンク接続されている記憶アドレス＆実体空間の該当する記憶素子とその実体情報（“ＡＷ一体化制御ＴＢＬ” 形式）が活性化する。こうして、ＷＯＲＤ⇔イメージ Like 変換によって音声情報の文節単位で獲得したイメージ情報を連想記憶によって１つに纏め、記憶アドレス空間には当該記憶素子を新規作成し、実体記憶空間には上記イメージ情報を WR（記憶）する。但し、“誘い”は、相手の意志情報であり、イメージの構成は階層記憶を成している。

注記

ＷＯＲＤ⇔イメージ Like 変換によって得られた音声情報のイメージ情報の WR(記憶)形態には幾つかのモード＆組合せがある。 ➀上記事例の様に幾つかの異なる形態のイメージ情報を持つ場合 ➁全て同一のバックグラウンド情報を持つ場合 ➂イベント情報、各々のシーンが時間情報を持ち、時間軸に並べることが出来る場合 SIG-AGI-014-0１図７ＷＯＲＤ⇔イメージ Like 変換図９記憶制御空間の構成と機能図８音性情報→イメージ情報の格納状況６ / 1６図１１動的連続シーン（連想記憶）図１０ＡＷ一体化制御ＴＢＬの階層構成群

(7)

3-３.「音声情報(会話の文章)の理解」

の考え方

（１）会話文章にバックグラウンド情報（階層/連想記憶）を追加し文章をイメージ（ＡＷ一体化制御ＴＢＬの作成）する。（２）会話文章（質問、確認、説明、誘い、命令等、相手の意志がが文章に含まれる/否の両方あり）、及びバックグラウンド情報（対人関係、会話の流れ、トーン、表情）から相手の意志（質問、確認、説明、誘い、命令等）を把握する。また、「限界を感じる」等、イメージできない言葉にもバックグラウンドを含め、相手の“意志”埋め込まれているので、配慮が必要である。

（３）「相手の会話文章」の理解

A)単なる仮想視野情報の場合

視野情報、記憶情報、人工頭脳の意思から課題生成→解決手段（人工頭脳の意志）→実行ストーリィ生成＆Action

Ｂ）会話（相手の意志が“有る”）場合

音声情報等、記憶情報、

相手の意志

から課題生成→解決手段（相手の意志に沿った解決手段）（相手の会話に対する自分の意志、Action ）を生成、・（質問）誰と公園に行ったの？→ 「A さんと行った」と答えるべく実行ストーリィを生成・（命令/要望）リンゴを持って来て!!→「自分がリンゴを相手に持っていく」をイメージ

Ｃ）会話（相手の意志が“無い“）場合

音声情報等、記憶情報、自分の意思から課題生成→解決手段（自分の意思に沿った解決手段）（相手の会話に対する自分の意志、Action ）を生成、・（説明）昨日、映画を見たよ。（意志がない）→思考には、通常の人工頭脳の意思（興味津々）→相手がポップコーンを見ながら楽しそうに映画を見ている姿をイメージして「どんな映画を見たの？（人工頭脳の意思：興味津々）」と尋るべく実行ストーリィを生成

（４）相手の会話に対する自分のＡｃｔｉｏｎの

可否判断

Ａ）会話文章に相手の意志が有る場合、相手の意志に沿ってイメージした解決手段＆実行ストーリィが適切か否か、自分の意思（危機感覚、一般常識、倫理感覚）をベースに判断する →銀行窓口業務で凶器を持ったお客が「金を出せ！」自分「いくらですか」と聞いてお金を渡したらＮＧ!! Ｂ）会話文章に相手の意志が無い場合、自分の意志＆イメージした実行ストーリィが適切か否か、自分の意思（危機感覚、一般常識、倫理感覚）等で判断する。

（５）理解の判定

会話に対する人工頭脳の受答え、行動が適切であれば「相手の話を理解した」とする。但し、相手の会話を理解するには、時間をかけた実生活空間での特訓が必要である。７ / 1６

(8)

3-4.音声情報(会話の文章)の思考を

通した理解

項#３-２「文章のイメージング技術の概念」によって、音声情報(文章)をイメージ情報に変換、連想（階層）記憶したものを人工頭脳が理解するには、・相手の音声情報（文章）のイメージ情報を実現する、もしくはリアルに表現し、それが適切か否か、人工頭脳の意思 Active 情報（一般常識、倫理感覚、危機感覚）によって判断*#し対応する。この対応が相手、もしくは周囲によって適切であると判断されれば、人工頭脳はケースバイケースな音声情報を理解したといえる。本章では、項＃3-３「音声情報(会話の文章)の理解の考え方」に基づき、音声情報を理解するプロセスを開示する。

（１）音声情報に相手の意志が“有る”場合

・音声情報等、記憶情報、相手の意志から課題生成。更に解決手段（相手の意志に沿った解決手段）（相手を優先した実行ストーリィ）を生成し、それを意思Ａｃｔｉｖｅ情報（一般常識、倫理感覚、危機感覚他）で適正か否かを判断＆Ａｃｔｉｏｎする。これを実現するのに、思考アルゴリズム論文（２）江村憲夫「人工頭脳における思考アルゴリズムと意思の関与」に準拠した図１２「思考アルゴリズム（相手の意志を含む文章の理解と Action）」を用い概略を説明する。 ①活性化伝搬項#３-２で音声情報から生成したイメージ情報（今度の週末、スキー場に行く、スキーを楽しむ）と相手の意志（スキーに誘う）に対し、連想/階層記憶の・今週末、彼女とデートの約束（八景島水族館）・彼女は、この前、スキーに行きたいと話していたが活性化する。 ②相手の意志ベースの課題抽出・会話文章のイメージ情報相手･自分：今週末 / スキーを楽しむ・連想/階層記憶自分：今週末 / 彼女とデートの約束・相手の意志相手：スキーに誘う →自分が選択できるのはスキーもしくはデートのいずれか１つ ③-1 解決手段（相手の意志に沿った解決手段）項#②で抽出した課題を基に機能グラフを作成し各種ヒントを生成。例えば、A（〇）「今週末、彼女とデートの約束」、B(〇)「山形蔵王でスキーを楽しむ」共に強化する方法を探す。 → 「スキーを楽しむ＆山形蔵王で彼女とデート」 → 「彼女をスキーに誘う」＊注記：実際には連想/階層記憶で活性化伝搬を多発させ、上記答えに導かれます。 ③-2 解決手段の適正判定「デートの場所の急変」で危機感覚が活性化（急に言われても無理!!）が活性化するも、「彼女は、この前、スキーに行きたいと話していた」で中和され問題なし。 ④⑤実行ストーリィ生成＆Action（発話）「彼女をスキーに誘っていいなら OK」と回答し、ボールを相手に投げる。 SIG-AGI-014-０１８ / 1６

(9)

図１２思考アルゴリズム（相手の意志を含む文章の理解と Action）

(10)

（２）音声情報に相手の意志が“無い“場合

音声情報等、記憶情報、自分の意思から課題生成→解決手段（自分の意思に沿った解決手段）（相手の会話に対する自分の意志、Action ）を生成、これを実現するのに、本ケースは思考アルゴリズム論文（２）江村憲夫「人工頭脳における思考アルゴリズムと意思の関与」を用い、図１３「思考アルゴリズム（相手の意志のない文章の理解と Action）」を用い概略を説明する。 ①活性化伝搬本ケースの事例としてベランダで遊んでいた子供がお手伝いのロボットに「雨が降り出した。」と言って室内に駆け込んだ。これを聞いて・朝､ベランダに洗濯物を干した・雨でベランダの洗濯物が濡れてしまう・このままでは大変なことになる（危機感覚）が活性化する。 ②自分の意思ベースの課題抽出項#➀で活性化した情報が課題そのもの。 ③-1 解決手段（相手の意志に沿った解決手段）項#②で抽出した課題を基に機能グラフを作成し各種ヒントを生成。例えば、A（〇）「ベランダに洗濯物が干す」を使わない条件下で、Ｂ（〇）「洗濯物を乾かす」方法を考える。→連想/下記層記憶の検索で「洗濯物を取込んで室内に干して乾かす」が導かれる。 ③-2 解決手段の適正判定小さい子供に頼むことはできないので、自分が洗濯物を取込むことにする。 ④⑤実行ストーリィ生成＆Action（行動）ベランダに出て洗濯物を取込み、室内の梁にかけて洗濯物を乾かす。１０ / 1６図１３思考アルゴリズム（相手の意志を含む文章の理解と Action） SIG-AGI-014-0１

(11)

3-５文章の構成対応 with ＷＯＲＤ

、文節、意志

(1)文章で使う言葉（WORD）はイメージする

のに、Σ文節（WORD+接続詞）=文章の順

番は関係ない

少なくとも日本語の場合、文節単位であれば順番を入れ換えても、話の内容は理解できる。例：①「今日」+「彼女と」+「公園に」+「行った」 ②「行った」+「公園に」+「彼女と」+「今日」 ③I went to the park with her today. 言葉は脳に input さればイメージするのに順番は関係ない。これは、少なくとも日本語では、文章は文節分割され、ＷＯＲＤ→イメージＬｉｋｅ変換されたのち、下図のようにしてイメージ情報に変換されるので、文章内での順番はない人工頭脳の音声情報処理と似ていると思われる。

(2) 文節制御によるイメージング（複数の文

節の結合による意味付け）

単語そのものでは何も具体的なイメージはできないが、複数の単語が結合することで具体的なイメージが可能になる。更に、バックグラウンドがつくことで、より鮮明にイメージできる。以下、一例を図１４「文節制御によるイメージング」を用いて説明する。 ①修飾的結合 “家“では漠然としてイメージできないが”家“の前に” 私“がついて”私の家“となれば、対象が１つに固定され、連想/階層記憶上、膨大な情報の上位概念になりうる。 ②意味的結合 “スキーに行く”の＃＃（イベント）に行く”は、＃＃（イベント）の実施される場所に行って＃＃（イベント）を実施する。＃＃には、釣り、コンサート、運動会等。逆に目的を省略することもある。 “自動車教習所に行く”の＃＃（場所）に行く”は、＃＃（場所）に行って、目的のイベントを実施する。＃＃には、図書館、空港、プール、学校等これら文節の結合では、必ず省略された場所や目的をイメージすることが必要である。 ③意志的結合この文節の結合は、この中に相手の意志が埋め込まれている。日本語では、文章の最初、最後によくみられる。事例：・スキーに行きませんか（誘い）・誰と公園に行ったの（質問）・彼はパイロットですか。（確認）・持ってきなさい。（命令）・貸して戴けませんか。（要望）・～することになりました。（説明）・５Ｗ1Ｈ:Where?,What?,Who?When?, Why? How?（質問）また、「限界を感じる。」の様に意志表示を埋め込んでいることもある。図１４文節制御によるイメージング１１ / 1６図１０ＡＷ一体化制御ＴＢＬの階層構成群

(12)

（3）会話の伝えたいこと（意志表示）の見極め

①会話での相手の意志の抽出会話における相手の意志は、会話文章、相手の status（表情、声のトーン･大小、対人関係）等の中に埋め込まれている。これら、相手の意志情報の抽出について、図１５「相手の意志情報一覧(一部)」を用いて説明する。 A)直接モード会話文章に表示されているア）相手の指示に従うことを求める（命令/要求）（誘い/勧め）、イ）発話を要求（５W1H：質問/教えて）（確認： YES/NO の答えを求める）ウ）回答/報告/説明/発表他 B)組合せモードエ）教える/説得するどうして～するの？（～をしてはいけない!!）オ）意志表示（会話文章にダイレクトに表示）好き/嫌い、～したい、他 C)間接モード相手の status に含まれており、“空気を読む” ことが求められる。（経験、学習が必須）エ）相手の表情（喜怒哀楽、他）オ）イントネーション、トーン ②人工頭脳による相手の意志情報への対応相手の意志情報への対応は、図１６「人工頭脳による相手の意志情報への対応」に示す様に基本的には思考アルゴリズムと情報処理は同じである、会話文章（イメージ情報）、相手の意志情報他を思考アルゴリズムに入力されると、“人工頭脳の意思 Active 情報”にかわって“相手の意志情報”の意向に沿った課題抽出、解決手段が生成される。これに対し、人工頭脳の意思 Active 情報（一般常識、倫理感覚、危機感覚他）によって“相手の意志情報”の意向に沿った解決手段”が適正か否か判断し、問題がなければ相手の意向に沿った対応を行う。なお、思考アルゴリズム（会話対応）に形成される“相手の意志情報”は、意思 Active 情報（図１７）と同様、階層記憶の形態を持つ。 SIG-AGI-014-0１図１５相手の意志情報一覧(一部) 図１７階層記憶における意思 Active 情報（の形成）図１６人工頭脳による相手の意志情報への対応１２/ 1６

(13)

音声情報（会話文章）に使われる言葉は階層記憶において抽象度の上位（中位）概念の領域に存在することが多い。そして、言葉の存在する「階層的抽象化（ＷＯＲＤ）空間」はＷＯＲＤ⇔イメージＬｉｋｅ変換によってとその実体である「記憶アドレス＆実体空間」と連携（リンク接続）している。ゆえに、言葉では一語（１word）でも、膨大な情報量を持たせることが出来る。例：日本政府、金融システム、オリンピック～リンゴ（栽培-収穫-店頭販売-レシピ・・）例えば、青森県出身のＡ氏が「実家でリンゴの収穫を手伝って来た。」といえば、「一面のリンゴ畑の中で赤く熟れた林檎の果実が木に沢山ぶら下がっており、リンゴをハサミで茎から切り取り、籠の中に入れていく様子!?」をイメージできる。これは、「実家（青森）-農家」「リンゴ」「収穫＆手伝い」からＷＯＲＤ ⇔イメージＬｉｋｅ変換によって、連想/階層記憶と活性化伝搬を駆使して活性化した「記憶アドレス＆実体空間」の記憶素子とその実体（イメージ：ＡＷ一体化制御ＴＢＬ）をかき集め、１つ/複数のイメージ（ＡＷ一体化制御ＴＢＬ）の中に、背景とフォーカスした対象の静的/動的 status を描いていることになる。そして、この収穫のイメージをよりリアルにするには、階層記憶を下位概念の方向に活性化伝搬することで可能になる。以上が可能なのは、階層記憶が図１９「階層記憶-基本構成」を示す構成を持っており、実際には図９「記憶制御空間の構成と機能」（シート６）に示す様に ①記憶素子で構成され、これらのリンク接続により、連想記憶、階層記憶を形成する「記憶アドレス空間」空間で活性化ルールに基づき自在に行われ、任意の記憶素子が活性化したのち、同期して活性化した当該実体記憶情報を取り出すことが出来る。更に、同一の階層記憶でも上位階層に行くほど抽象度も高く全体を総括でき、僅かな情報で目的の処理を達成できる。細かいことを知りたければ、ケースバイケースに上位階層から下位階層に活性化伝搬することで目的の情報を獲得できる。人の脳が僅か十数Ｗで高速に情報処理することが出来るのは上記の理由によると思われる。１３ / 1６図１９階層記憶-基本構成

(14)

３-８．認知対象の言葉＆意味の獲得

人工頭脳にとって、言葉が何を指すのか、その対象と意味がわかる。つまり、言葉の対象と意味を獲得するのは次の３つの方法がある。図２１「認知対象に対する言葉の獲得」を用いて説明する。

（１）未知の言葉に対する認知情報の絞込み

当該する言葉と周辺の文章、言葉から連想記憶を駆使し、言葉が指す対象のイメージ、意味を推測する。

（２）認知対象に名付けられた言葉の獲得

会話/媒体の文章（言葉）とそれが示唆する視覚空間の認知対象から、言葉と認知対象をそれらが定義された A)階層的抽象化 WORD)空間と B)記憶アドレス-実体空間でリンク接続する。 *言葉を獲得していない認知対象に「これ、何に？」「何をしているの？」と質問し、回答を得ることで認知対象の言葉を獲得する。

（３）未知の言葉の対象を視覚空間で捉える

未知の言葉の該当する対象を視覚空間上で捉える。仮想視野空間（実視野、仮想空間）の言葉を獲得していない認知（認識）対象と音声（文章）の中の未知の言葉が文章の周囲の言葉、当該シーンのイメージから一致した場合、未知の言葉の対象、意味を獲得したことになる。＊注記事項言葉を獲得していない認知対象の連想/階層記憶が広く形成されていれば、その対象の言葉を獲得した瞬間、言葉の意味(性質、特性)を知ることになる。１４ / 1６図２１認知対象に対する言葉の獲得 SIG-AGI-014-0１

(15)

3-７.時間の概念の獲得

人工頭脳が扱う時間は、①何時（Ｗｈｅｎ）、②現在/ 過去/未来の２つの概念が存在する。 ①Ｗｈｅｎ（時間を特定：厳密～ｱﾊﾞｳﾄ） ⅰ）年、月、日、曜日 ⅱ）午前/午後＆時刻##：## ⅲ）朝/昼/夕方/夜 ⅳ）季節：春夏秋冬 ②現在/過去/未来. ⅵ）さっき/今/後で ⅴ）一昨日/昨日/今日/明日/明後日＆曜日 Ⅵ）先週/今週/来週-先月/今月/来月 Ⅶ）-先年/今年/来年本章では時間の概念：４つにグループ分け(視覚時計、デジタル／アナログ時計、感覚時計、カレンダーとスケジュール、イベントへの対応)、取得に向けた考え方を紹介する。 ①視覚時計（季節：春夏秋冬、一日：朝、昼、夕、夜）視野情報の特徴的なシーンの連想/階層記憶を形成し、上位概念から順に言葉を付与していく。 ②デジタル/アナログ時計瞬間的な時間ではあるが、帯域を感覚的に捉えると共に、イベントと連携することでシュケジュールの概念を獲得していく。 ③カレンダー時計：年月日＆曜日年月日＆曜日は、視覚的（位置情報も含む）にカレンダーを捉えると共に、現時点の前後：昨日今日/明日等の概念も獲得していく。イベントとも連携し、スケジュールの概念をデジタル/アナログ時計とセットで獲得していく。更に、現時点を基準とした現在/過去/ 未来の概念も獲得する。 ④感覚時計（ちょっと、さっき、後で、先に、今..）ケースバイケースなシーンや個人的な捉え方で時間の幅が出てくる。１５ / 1６図 22 時間の概念-連想/階層記憶との連携で意識

(16)

4.纏め

本論文において、“聞く”（音声情報処理）（話の内容の文章化と文節区切りしたものが入力情報）という情報処理を脳機能工学の視点から分析し、 ①話の内容（文章）にバックグラウンド情報、お互いの共通情報を加え、視覚的にイメージすると共に、 ②「話の内容」、及び「文章・相手の status に含まれる相手の伝えたい事（意志表示）」を汲み取り相手の話を理解すべく思案を開示した。更に ③認知対象の言葉とその意味の獲得、時間の概念の獲得を実現すべく課題を明示した。

5．参考文献

*以下の論文は全て汎用人工知能研究会 SIG-AGI 予稿集：AI 書庫をご参考論文（１）江村憲夫人工頭脳ＯＳ実現に向けて -人の脳の振舞いを模倣した有機的情報処理第 9 回人工知能学会汎用人工知能研究会 SIG-AGI-009-01 (2018 年 8 月 30 日) 論文（２）江村憲夫「人工頭脳における思考アルゴリズムと意思の関与」第 11 回人工知能学会汎用人工知能研究会 SIG-AGI-011-02(2019 年 3 月 15 日) 論文（３）江村憲夫「人工頭脳における記憶制御（記憶素子ベースの連想/階層記憶と活性化伝搬と階層的抽象化制御）」第 12 回人工知能学会汎用人工知能研究会 SIG-AGI-012-02(2019 年 8 月 30 日) 論文（４）江村憲夫「思考アルゴリズムの強化に向けて」第 13 回人工知能学会汎用人工知能研究会 SIG-AGI-13-002 (2019 年 11 月 22 日) 書籍（１）山中恵美子瞬読ＳＢクリエイティブ（2018）書籍（２）苫米地英人一瞬で相手をオトす洗脳術マキノ出版（2009）１６/ 1６ SIG-AGI-014-0１

人工頭脳における音声情報処理 (音声情報のイメージングによる視覚化と理解)