• 検索結果がありません。

人工頭脳における音声情報処理 (音声情報のイメージングによる視覚化と理解)

N/A
N/A
Protected

Academic year: 2021

シェア "人工頭脳における音声情報処理 (音声情報のイメージングによる視覚化と理解)"

Copied!
16
0
0

読み込み中.... (全文を見る)

全文

(1)

人工頭脳における音声情報処理

(音声情報のイメージングによる視覚化と理解)

Voice Information Processing in Artificial Brains

江村憲夫

Norio Emura

Abstract:

"Listening to speech for an artificial brain" means "to image a sentence as much as possible from its words, content, and background",

and introduce the concept of the means of realization (below). ➀Image the contents of a sentence in a virtual field of view space

based on the storage information of the middle and upper concepts of hierarchically stored images (recognition, cognitive information, etc.) for words,

including "shared information with the other party" and "the situation around the conversation".

➁Understand the will of the other party from words/emotions/tones and perform the actions you need.

➂Acquire words and meanings for cognitive objects. Acquire the concept of time, and respond to them.

概要

「人工頭脳にとって(音声を)聞く」とは「文章をその言葉 と内容と背景(文章、相手との共有情報)から限りなくイ メージすること」であり、その実現手段(下記)の概念を 紹介する。 [ 音声-イメージ変換実現手段 ] ➀「相手との共有情報、会話の周囲の状況を含め言葉 (単語:階層的抽象化WORD空間)」に対応し(記憶素 子:階層記憶化されたイメージ子同士の接続)、「(認識、 認知情報他:記憶アドレス&実体空間(連想/階層記 憶))の中・上位概念の記憶情報」を基に文章内容を仮 想視野空間にイメージ(視覚化)する。 ➁相手の話、話し方(文章中の単語、感情、トーン)から 意志(実行ストーリィ)把握し、必要なAction(受答え、 行動、思考等)を実行する。 *このActionが適切であれば、相手の話を理解したと 判断できる。 ➂会話のスキルを向上する上で「認知対象に対する言 葉の意味とその意味の習得」と「時間の概念の獲得とそ の対応」は必須である。 注記1: 本論文での音声情報処理は、「空気振動で伝わってき た音声情報を電圧信号に変換し、更に文章化された情 報」を使った情報処理である。 注記 2: 本論文の図面で使用するヒューマノイドロボット“アシモ”の写真は、本田技研工業株式会社* (以下、ホンダ様と称す)の許可を戴いてホンダ様のホームページから引用させて頂いていますが、 本論文記載の人工頭脳に関し、ホンダ様との協力関係は一切、ございません。ご承知おき願います。 *:Hondaウェルカムプラザ青山. 1 / 16

(2)

1.はじめに

人工頭脳は人の脳の振る舞いを模倣した有機的情報 処理によって、自律・自発的Actionが可能。究極的に は、鉄腕アトムの頭脳を創ることにある。 最大の特徴は、上記人工頭脳をヒューマノイドロボット に搭載し、自らの意思で自発・自律的なAction(思考/ 会話/行動)を実行することにある。つまり、外部(視野、 音声、音源、媒体等)や内部(記憶の活性化)に対し、倫 理・危機感覚、常識等の範囲内で、人工頭脳の意志を 生成し、具体的な実行ストーリィに落とし、Action(行 動、会話、思考)を行うことにある。 本論文では、コア機能である「聞く-仮想視野空間制 御」(但し、音声情報の文章化を除く、話し言葉の文章 に対する情報処理)の検討内容を紹介する。但し、人工 頭脳は有機的情報処理であり、複数の機能が連携して 処理を遂行するので、「聞く-仮想視野空間制御」の人 工頭脳における情報処理の位置付けを述べ、次に思考 アルゴリズムの概要を紹介する。

2.人工頭脳における位置付け

これまで、人工頭脳を検討してきた中で遭遇した大きな ブレークスルーは以下の通りである。 A)記憶制御 (人の視野の狭さが記憶形成に関与。 連想/階層記憶。記憶素子ベースの情報処理 ) *記憶素子:リンク接続で連想/階層記憶を形成. 記憶素子の活性化伝播、階層的抽象化制御と自在な 抽象度制御を実現 B)思考アルゴリズム ( 意思が関与し、意思の意向を反映 ) *外部/内部情報に対し、人工頭脳の意思、連想/階層 記憶が活性化することで意思ベースの課題と解決手 段(人工頭脳の意志)を生成 C)仮想視野空間制御 ( 実際の物理空間と若干異なる ) ①AW(認知情報)一体化制御 ・実視野/音声・音源/感触情報を仮想視野上で可視化 &合成&一体化、欠落情報は連想/階層記憶で補充 ・視野系情報(視野/音源/感触)は実仮想視野、音声情 報は仮想視野で存在も、視野系との混合あり ②仮想AWパレット機能 ・視線生成/実行ストーリィ描画/視線誘導/AW合成 ・実(仮想)視野情報に対し思考/状況判断し仮想視野 上で A)実行ストーリィを書き、B)視線誘導/行動 ③経験/学習、”知識&他人工頭脳_スキル”の習得 このようにして形成した「人工頭脳の機能ブロック図」 を図2に示す。 次に、人工頭脳の基本的な情報処理における機能ブロ ック図、及び機能ブロック間の主な情報処理の連携を 図3「人の脳の振舞いを模倣した人工頭脳”の有機 的情報処理」に示す。記憶制御は共通コア機能として 動作する。音声情報処理は、「聞く(音声)」+「仮想視 野空間制御」において実行される。 2 / 16 図3“人の脳の振舞いを模倣した人工頭脳”の有機的情報処理 *参考文献:項#7 論文(2)SIG-AGI-011-02 他 SIG-AGI-014-01 図1 人工頭脳搭載ロボットは自分の意思でケースバイ ケースに対応 *参考文献:項#7 論文(2)SIG-AGI-011-02 他 図2 人工頭脳の機能ブロック図 *参考文献:項#7 論文(2)SIG-AGI-011-02 他

(3)

[ 音声情報処理における留意点 ]

(1)本論文での音声情報処理 「空気振動で伝わってきた音声情報を電圧信号に変換 し、更に文章化された情報」(但し、WORD間の “間“、トーン情報も含む)に対し、視野情報と同様、イメ ージ情報(見た結果:認識、認知情報)に変換すること。 (2)音声情報への補充?? なお、音声情報(文章)は、視野情報と異なり、相手との 共有情報、話の流れ・背景が含まれていないことが多 く、連想/階層記憶を駆使して補うことが要求される。 但し、人工頭脳(人も同じ)のAction原理「全体把握と 個別処理:全体を把握しつつ、注目した対象にフォーカ スしてActionする」は見る、聞く、思考、行動、発話等 全てに共通する。 会話での相手の発話内容(文章)は「注目した対象」の みであることが多く、全体把握である会話の背景(バッ クグラウンド情報(会話の流れも含む)、共有情報、対人 関係等)は省略される為、あらかじめお互いに共有して いることが、会話が成立する必須条件である。 先ず、会話では上記背景をイメージし、その中に発話内 容のイメージを上書きすることが要求される。 更に会話の内容を理解したか否かは次のプロセスで分 かる。 会話でイメージした内容を基に思考アルゴリズムにお いて、課題を抽出、解決手段(意志)を見出し、具体的 Action生成・実行する。このActionが適切であれば、 話の内容を理解したといえる。 例えば、5W1H (when,where,who,what,why,how)に回答する 様に要求された場合、質問に沿った答えを返せるか否 かで判断できる。 *会話のイメージ事例 *1 麦わら帽子をかぶった小さな女の子が公園のベンチに 座ってシャボン玉を吹いています。 (注釈なし。風景全体がイメージ出来る。) *1:書籍(1)山中恵美子筆瞬読より引用 A 氏:昨日の夕方、車で公園に行った。 B 氏:誰と? A 氏:C 子さんと (注釈:B氏の対応は、C子さんとの関係によってかなり 変わってきます。C子さんが意中の人であれば、公園は 市内唯一のデートスポッット、シーサイドパーク!!!!をイ メージし穏やかではいられない。) (3)相手(話し手)の意志の把握 個々の話し言葉の文章には、WORD間の“間“、トーン 情報も含め、相手(話し手)の意志(実行ストーリィ)*1 が含まれており、単に文章のみでなく、これらも情報処 理に取り込むことが求められる。 また、対人関係によって、同じ文章でも、お願い/要望 であったり、命令であったりするので注意を要す。 (4)認知対象に対する言葉の獲得 言葉とその意味は、最初から分かっているわけではな く、生活(物理空間)の中で、獲得していく必要がある。 例えば、スイカ(果物)に関し、認識、認知情報、バック グランドは理解していても言葉(例えば英語)が分から ない場合、「このスイカはおいしい。食べてみて。」と言 われた場合、スイカの認識・認知情報とWORDが一致 できた場合、単に単語のみならず、単語の意味、背景ま で理解することが出来る。この辺の「認知対象に対する 言葉の獲得」スキル(興味津々)も必須である。 *事例:トム、そこのグイメ(果物)を持ってきて! 背景:お母さんはキッチンでクッキング。トムはリビング にいる、テーブルの上のバスケットに何か小さな赤い実 が沢山ある。トムはリビングにいて、お母さんの指先の 方向は、視線で辿っていくと小さな赤い実に辿り着く。 小さな赤い実がグイメと分かる。 →WORD 空間のグイメと実体空間のグイメが結合。 (5)時間の概念の獲得 視覚情報では表現されず、文章で表現される“時間の 概念”の獲得も必須である。時間にもA)視覚的要因 「朝・昼・夕方・夜」「季節:春夏秋冬、梅雨」、B)時計的 時間、C)カレンダー的時間、D)(厄介な)感覚的時間 「さっき、ちょっと、すぐ等」があり、必須要因である。 (6)その他 言葉には、視覚化できる言葉と、視覚化できない言葉 もあるが本論文では対象外とする。 (愛、限界、始める/終わる等) 以上を基に、本論文では、音声情報処理の実現手段の 概念を以下の目次に従い紹介していく。 3 / 16 グイメの実 グイメの 木と果実

(4)

3.人工頭脳の音声情報処理

3-1.会話文章のイメージ化ポイント

(1)バックグラウンド(連想/階層記憶)を駆使

したイメージング

小説のような文章であれば、使われている言葉より 情景がリアルにイメージできる。一方、会話では、共 通のバックグラウンド、会話の流れに基づき、相手も 分かっていることは話さない。 これは、人が車を運転するのに、運転に必要なエリ ア、対象しか見ない(全体は把握済み:交差点の右 折ライン、信号は青であれば、時間をかけて注視す るのは、対向直進/左折車と横断歩道の人の動き)の と同様である。但し、会話文章をイメージするには、 この省略された部分も必要であり、連想/階層記憶 を駆使してバックグラウンドを形成する必要がある。

(2)階層的抽象化の連携による中位-上位概

念(記憶階層)の情報処理

「思考」と「会話の理解」は抽象度の高い階層記憶情 報を用いて実施される。「!?ではなく、必須!!」 階層記憶では、下位階層にいくほど、全体の一部に フォーカス、詳細になり、上位階層*2 にいくほど下 位階層の記憶を総括し全体を捉えるようになってい る。(少ない情報量で全体把握が可能。) なので、下 位概念・階層で会話・思考を行うと、情報処理が膨 大になり、全体が捉えにくくなり混乱をきたす為、あ る程度、上位概念・階層での情報処理は必須条件と なる。 例えば、. ベランダに洗濯物が干してあって、雨が降り出したら 危機感覚が作用し (過去の経験)、洗濯物を直ちに 取り込む。 抽象度が低いと、 ・服、下着、タオルがハンガーにかけてある、 ・ハンガーは物干し棒にかけてある、 ・水滴が 衣類、タオルに当たっている ..と聞いても、脳は危機感覚が活性化しない →「君は、何が言いたいの??」 (雨-洗濯物- 取り込むは抽象度の高い状態で階層記 憶されている)為、洗濯物は放置されズブ濡れになる。

(3)会話の伝えたいこと(相手の意志表示)の

見極め

A)文章中の直接表示

質問(5W1H)、確認、回答/報告/説明/発表、誘い/ 勧め(場合によっては命令)、命令(お願い、要求)

B)間接モード

相手のStatus:相手の表情、ジェスチャー、相手の声(トー ン、大小、ポーズ)、対人関係、会話の流れ、場/雰囲気 (空気を読む) 会話(文章)の中に相手の意志が含まれる言葉が含 まれており、相手の言いたいことが、質問・確認なの か、お願い・要望なのか、命令・誘いなのか、単なる 説明なのか把握できる。と共に、対人関係、その場の 空気、声のトーンによって、同じ文章でも相手の意志 が(微妙に)変わってくる。 例えば、同じ名前(ヒロシ)でも*3 A)恋人同士が1年ぶりに空港ロビーで再開約束、 ヒロシを見つけた彼女が「ヒロシ❤」と言うのと、 B)子供がふざけて食器を割ってしまったのを見た お母さんが「ヒロシ!!」と言うのと C)妻がトイレの中から「ヒロシ~」と言うのでは、 同じ「ヒロシ」でも、相手の意志、言いたいこと(内容) は、まるで違ってくる。部長が部下に「教えて」と言って 言い方はソフトでも実際には命令である。これらを処理 する為、連想階層記憶、学習結果を駆使する必要あり *3:事例 A)B)C):書籍(2)苫米地英人筆一瞬で相手をオトす 洗脳術より引用。 SIG-AGI-014-0# *2 上位階層:“1記憶素子”であっても上位概念の情報 であれば、下位階層の強制活性化でAW一体化制御 TBLにて活性化伝播の範囲が広がる →連想記憶(バックグラウンド)を駆使し、ケースバイケースに フォーカスした活性化伝播が可能なため、的を得た (イメージ情報)が作成可能。 4 / 16 図 4 会話文章のイメージ化ポイント

(5)

3-2 文章のイメージング技術の概念

本章では図# 音声情報のイメージ変換(アルゴリズ ム概要)により、音声情報のイメージング情報処理に ついて図6「音声情報のイメージ変換(アルゴリズム 概要)」を用いて説明する。 なお、イメージは映像ではなく見た結果である。

(1)音声情報の文章化

事例:今度の週末、スキーに行きませんか? *会話の流れから、スキー場は“山形蔵王”

(2)文章の文節分割

今度の/週末/スキーに/行き/ませんか? なお、音声情報の文章化、及び文章の文節分割は 本論文の処理の対象外とする。 また、後述の文節制御により、(図5参照) ・今度の週末:修飾的結合により時間的要因が確立 ・スキーに行く:意味的結合と(経験的)階層記憶で 具体的なActionが確定し「山形蔵王スキー場に 行く」&「スキーを楽しむ」となる。 ・(行き)ませんか:意志的結合で、相手の意志 (誘い)となる。

(3)WORD⇔イメージ Like 変換

各種シーンで認識、認知した対象と言葉が一致した 場合、当該対象の「言葉」を獲得でき、その言葉を聞 くだけで、言葉の当該対象、意味(記憶の範囲内で の実態)が分かる。(活性化する) WORD⇔イメージ Like 変換とは、WORD(階層的 抽象化)空間の言葉と、記憶空間(記憶素子-実体情 報)の当該対象がリンク接続されており、言葉が活性 化すると、当該対象の記憶素子-実体情報が活性化 し(活性化伝搬による)、言葉や文章をイメージ(可視 化)することができる。 なお、このリンク接続は、人工頭脳が言葉の指す対 象と意味を一致させた際、連想記憶と同様に形成さ れる記憶素子の結合である。 *論文(3)江村憲夫 「人工頭脳における記憶制御」 参照 図6 音声情報のイメージ変換(アルゴリズム概要) 図5 音声文章(事例)の文節分割 5 / 16

(6)

今回は文章化され、文節分割された音声情報により A)今度の週末、B)スキーに行く、C)~ませんかが 階層的抽象化(WORD)空間内で活性化し、リンク 接続されている記憶アドレス&実体空間の該当する 記憶素子とその実体情報(“AW一体化制御TBL” 形式)が活性化する。 こうして、WORD⇔イメージ Like 変換によって音 声情報の文節単位で獲得したイメージ情報を連想 記憶によって1つに纏め、記憶アドレス空間には当該 記憶素子を新規作成し、実体記憶空間には上記イメ ージ情報を WR(記憶)する。 但し、“誘い”は、相手の意志情報であり、イメージの 構成は階層記憶を成している。

注記

WORD⇔イメージ Like 変換によって得られた音声 情報のイメージ情報の WR(記憶)形態には幾つか のモード&組合せがある。 ➀上記事例の様に幾つかの異なる形態のイメージ 情報を持つ場合 ➁全て同一のバックグラウンド情報を持つ場合 ➂イベント情報、各々のシーンが時間情報を持ち、 時間軸に並べることが出来る場合 SIG-AGI-014-01 図7 WORD⇔イメージ Like 変換 図9 記憶制御空間の構成と機能 図8 音性情報→イメージ情報の格納状況 6 / 16 図11 動的連続シーン(連想記憶) 図10 AW一体化制御TBLの階層構成群

(7)

3-3.「音声情報(会話の文章)の理解」

の考え方

(1)会話文章にバックグラウンド情報(階層/連想記 憶)を追加し文章をイメージ(AW一体化制御TBLの 作成)する。 (2)会話文章(質問、確認、説明、誘い、命令等、相 手の意志がが文章に含まれる/否の両方あり)、及び バックグラウンド情報(対人関係、会話の流れ、トー ン、表情)から相手の意志(質問、確認、説明、誘い、 命令等)を把握する。 また、「限界を感じる」等、イメージできない言葉にも バックグラウンドを含め、相手の“意志”埋め込まれ ているので、配慮が必要である。

(3)「相手の会話文章」の理解

A)単なる仮想視野情報の場合

視野情報、記憶情報、人工頭脳の意思から課題 生成→解決手段(人工頭脳の意志)→実行ストー リィ生成&Action

B)会話(相手の意志が“有る”)場合

音声情報等、記憶情報、

相手の意志

から課題生 成→解決手段(相手の意志に沿った解決手段) (相手の会話に対する自分の意志、Action )を 生成、 ・(質問)誰と公園に行ったの?→ 「A さんと行っ た」と答えるべく実行ストーリィを生成 ・(命令/要望)リンゴを持って来て!!→「自分がリン ゴを相手に持っていく」をイメージ

C)会話(相手の意志が“無い“)場合

音声情報等、記憶情報、自分の意思から課題生 成→解決手段(自分の意思に沿った解決手段) (相手の会話に対する自分の意志、Action )を 生成、 ・(説明)昨日、映画を見たよ。(意志がない)→思 考には、通常の人工頭脳の意思(興味津々)→相 手がポップコーンを見ながら楽しそうに映画を見 ている姿をイメージして「どんな映画を見たの? (人工頭脳の意思:興味津々)」と尋るべく実行スト ーリィを生成

(4)相手の会話に対する自分のActionの

可否判断

A)会話文章に相手の意志が有る場合、 相手の意志に沿ってイメージした解決手段&実行 ストーリィが適切か否か、自分の意思 (危機感覚、一般常識、倫理感覚)をベースに判断 する →銀行窓口業務で凶器を持ったお客が「金を出 せ!」自分「いくらですか」と聞いてお金を渡した らNG!! B)会話文章に相手の意志が無い場合、 自分の意志&イメージした実行ストーリィが適切 か否か、自分の意思(危機感覚、一般常識、 倫理感覚)等で判断する。

(5)理解の判定

会話に対する人工頭脳の受答え、行動が適切で あれば「相手の話を理解した」とする。 但し、相手の会話を理解するには、時間をかけた 実生活空間での特訓が必要である。 7 / 16

(8)

3-4.音声情報(会話の文章)の思考を

通した理解

項#3-2「文章のイメージング技術の概念」によっ て、音声情報(文章)をイメージ情報に変換、連想(階 層)記憶したものを人工頭脳が理解するには、 ・相手の音声情報(文章)のイメージ情報を実現す る、もしくはリアルに表現し、それが適切か否か、人 工頭脳の意思 Active 情報(一般常識、倫理感覚、 危機感覚)によって判断*#し対応する。この対応が 相手、もしくは周囲によって適切であると判断されれ ば、人工頭脳はケースバイケースな音声情報を理解 したといえる。 本章では、項#3-3「音声情報(会話の文章)の理解 の考え方」に基づき、音声情報を理解するプロセスを 開示する。

(1)音声情報に相手の意志が“有る”場合

・音声情報等、記憶情報、相手の意志から課題 生成。更に解決手段(相手の意志に沿った解決手 段)(相手を優先した実行ストーリィ)を生成し、それ を意思Active情報(一般常識、倫理感覚、危機感 覚他)で適正か否かを判断&Actionする。 これを実現するのに、思考アルゴリズム 論文(2) 江村憲夫 「人工頭脳における思考アルゴリズムと意思の関与」 に準拠した図12「思考アルゴリズム(相手の意志を 含む文章の理解と Action)」 を用い概略を説明する。 ①活性化伝搬 項#3-2で音声情報から生成したイメージ情報(今 度の週末、スキー場に行く、スキーを楽しむ)と相手 の意志(スキーに誘う)に対し、連想/階層記憶の ・今週末、彼女とデートの約束(八景島水族館) ・彼女は、この前、スキーに行きたいと話していた が活性化する。 ②相手の意志ベースの課題抽出 ・会話文章のイメージ情報 相手・自分:今週末 / スキーを楽しむ ・連想/階層記憶 自分:今週末 / 彼女とデートの約束 ・相手の意志 相手:スキーに誘う →自分が選択できるのはスキーもしくはデートの いずれか1つ ③-1 解決手段(相手の意志に沿った解決手段) 項#②で抽出した課題を基に機能グラフを作成し各 種ヒントを生成。例えば、A(〇)「今週末、彼女とデ ートの約束」、B(〇)「山形蔵王でスキーを楽しむ」共 に強化する方法を探す。 → 「スキーを楽しむ&山 形蔵王で彼女とデート」 → 「彼女をスキーに誘う」 *注記:実際には連想/階層記憶で活性化伝搬を多 発させ、上記答えに導かれます。 ③-2 解決手段の適正判定 「デートの場所の急変」で危機感覚が活性化(急に言 われても無理!!)が活性化するも、「彼女は、この前、 スキーに行きたいと話していた」で中和され問題な し。 ④⑤実行ストーリィ生成&Action(発話) 「彼女をスキーに誘っていいなら OK」と回答し、 ボールを相手に投げる。 SIG-AGI-014-01 8 / 16

(9)

図12 思考アルゴリズム(相手の意志を含む文章の理解と Action)

(10)

(2)音声情報に相手の意志が“無い“場合

音声情報等、記憶情報、自分の意思から課題生 成→解決手段(自分の意思に沿った解決手段) (相手の会話に対する自分の意志、Action )を 生成、 これを実現するのに、本ケースは思考アルゴリズム 論文(2) 江村憲夫 「人工頭脳における思考アルゴリズムと意思の関与」 を用い、図13「思考アルゴリズム(相手の意志のない 文章の理解と Action)」を用い概略を説明する。 ①活性化伝搬 本ケースの事例として ベランダで遊んでいた子供がお手伝いのロボットに 「雨が降り出した。」と言って室内に駆け込んだ。 これを聞いて ・朝、ベランダに洗濯物を干した ・雨でベランダの洗濯物が濡れてしまう ・このままでは大変なことになる(危機感覚) が活性化する。 ②自分の意思ベースの課題抽出 項#➀で活性化した情報が課題そのもの。 ③-1 解決手段(相手の意志に沿った解決手段) 項#②で抽出した課題を基に機能グラフを作成し各 種ヒントを生成。例えば、A(〇)「ベランダに洗濯物 が干す」を使わない条件下で、B(〇)「洗濯物を乾か す」方法を考える。→連想/下記層記憶の検索で 「洗濯物を取込んで室内に干して乾かす」が導かれ る。 ③-2 解決手段の適正判定 小さい子供に頼むことはできないので、自分が洗濯 物を取込むことにする。 ④⑤実行ストーリィ生成&Action(行動) ベランダに出て洗濯物を取込み、室内の梁にかけて 洗濯物を乾かす。 10 / 16 図13 思考アルゴリズム(相手の意志を含む文章の理解と Action) SIG-AGI-014-01

(11)

3-5 文章の構成対応 with WORD

、文節、意志

(1)文章で使う言葉(WORD)はイメージする

のに、Σ文節(WORD+接続詞)=文章の順

番は関係ない

少なくとも日本語の場合、文節単位であれば順番を 入れ換えても、話の内容は理解できる。 例:①「今日」+「彼女と」+「公園に」+「行った」 ②「行った」+「公園に」+「彼女と」+「今日」 ③I went to the park with her today. 言葉は脳に input さればイメージするのに順番は関 係ない。これは、少なくとも日本語では、文章は文節 分割され、WORD→イメージLike変換されたのち、 下図のようにしてイメージ情報に変換されるので、文 章内での順番はない人工頭脳の音声情報処理と似 ていると思われる。

(2) 文節制御によるイメージング(複数の文

節の結合による意味付け)

単語そのものでは何も具体的なイメージはできない が、複数の単語が結合することで具体的なイメージ が可能になる。更に、バックグラウンドがつくことで、 より鮮明にイメージできる。以下、一例を図14「文節 制御によるイメージング」を用いて説明する。 ①修飾的結合 “家“では漠然としてイメージできないが”家“の前に” 私“がついて”私の家“となれば、対象が1つに固定さ れ、連想/階層記憶上、膨大な情報の上位概念にな りうる。 ②意味的結合 “スキーに行く”の##(イベント)に行く”は、## (イベント)の実施される場所に行って##(イベント) を実施する。##には、釣り、コンサート、運動会等。 逆に目的を省略することもある。 “自動車教習所に行く”の##(場所)に行く”は、 ##(場所)に行って、目的のイベントを実施する。 ##には、図書館、空港、プール、学校等 これら文節の結合では、必ず省略された場所や目的 をイメージすることが必要である。 ③意志的結合 この文節の結合は、この中に相手の意志が埋め込ま れている。日本語では、文章の最初、最後によくみら れる。 事例: ・スキーに行きませんか(誘い) ・誰と公園に行ったの(質問) ・彼はパイロットですか。(確認) ・持ってきなさい。(命令) ・貸して戴けませんか。(要望) ・~することになりました。(説明) ・5W1H:Where?,What?,Who?When?, Why? How?(質問) また、「限界を感じる。」の様に意志表示を埋め込ん でいることもある。 図14 文節制御によるイメージング 11 / 16 図10 AW一体化制御TBLの階層構成群

(12)

(3)会話の伝えたいこと(意志表示)の見極め

①会話での相手の意志の抽出 会話における相手の意志は、会話文章、相手の status(表情、声のトーン・大小、対人関係)等の中 に埋め込まれている。これら、相手の意志情報の抽 出について、図15「相手の意志情報 一覧(一部)」を 用いて説明する。 A)直接モード 会話文章に表示されている ア)相手の指示に従うことを求める(命令/要求) (誘い/勧め)、 イ)発話を要求(5W1H:質問/教えて)(確認: YES/NO の答えを求める) ウ)回答/報告/説明/発表 他 B)組合せモード エ)教える/説得する どうして~するの?(~をしてはいけない!!) オ)意志表示(会話文章にダイレクトに表示) 好き/嫌い、~したい、他 C)間接モード 相手の status に含まれており、“空気を読む” ことが求められる。(経験、学習が必須) エ)相手の表情(喜怒哀楽、他) オ)イントネーション、トーン ②人工頭脳による相手の意志情報への対応 相手の意志情報への対応は、図16「人工頭脳による 相手の意志情報への対応」に示す様に基本的には 思考アルゴリズムと情報処理は同じである、会話文 章(イメージ情報)、相手の意志情報他を思考アルゴ リズムに入力されると、“人工頭脳の意思 Active 情 報”にかわって“相手の意志情報”の意向に沿った課 題抽出、解決手段が生成される。これに対し、人工頭 脳の意思 Active 情報(一般常識、倫理感覚、危機 感覚他)によって“相手の意志情報”の意向に沿った 解決手段”が適正か否か判断し、問題がなければ相 手の意向に沿った対応を行う。 なお、思考アルゴリズム(会話対応)に形成される“相 手の意志情報”は、意思 Active 情報(図17)と同 様、階層記憶の形態を持つ。 SIG-AGI-014-01 図15 相手の意志情報 一覧(一部) 図17 階層記憶における意思 Active 情報(の形成) 図16 人工頭脳による相手の意志情報への対応 12/ 16

(13)

音声情報(会話文章)に使われる言葉は階層記憶に おいて抽象度の上位(中位)概念の領域に存在する ことが多い。そして、言葉の存在する「階層的抽象化 (WORD)空間」はWORD⇔イメージLike変換によ ってとその実体である「記憶アドレス&実体空間」と 連携(リンク接続)している。 ゆえに、言葉では一語(1word)でも、膨大な情報量 を持たせることが出来る。例:日本政府、金融システ ム、オリンピック~リンゴ(栽培-収穫-店頭販売-レシ ピ・・) 例えば、青森県出身のA氏が「実家でリンゴの収 穫を手伝って来た。」といえば、「一面のリンゴ畑の 中で赤く熟れた林檎の果実が木に沢山ぶら下がって おり、リンゴをハサミで茎から切り取り、籠の中に入 れていく様子!?」をイメージできる。これは、「実家 (青森)-農家」「リンゴ」「収穫&手伝い」からWORD ⇔イメージLike変換によって、連想/階層記憶と活 性化伝搬を駆使して活性化した「記憶アドレス&実 体空間」の記憶素子とその実体(イメージ:AW一体 化制御TBL)をかき集め、1つ/複数のイメージ(AW 一体化制御TBL)の中に、背景とフォーカスした対象 の静的/動的 status を描いていることになる。そし て、この収穫のイメージをよりリアルにするには、階 層記憶を下位概念の方向に活性化伝搬することで 可能になる。 以上が可能なのは、階層記憶が図19「階層記憶-基 本構成」を示す構成を持っており、実際には図9「記 憶制御空間の構成と機能」(シート6)に示す様に ①記憶素子で構成され、これらのリンク接続により、 連想記憶、階層記憶を形成する「記憶アドレス空間」 空間で活性化ルールに基づき自在に行われ、任意の 記憶素子が活性化したのち、同期して活性化した当 該実体記憶情報を取り出すことが出来る。 更に、同一の階層記憶でも上位階層に行くほど抽象 度も高く全体を総括でき、僅かな情報で目的の処理 を達成できる。細かいことを知りたければ、ケースバ イケースに上位階層から下位階層に活性化伝搬す ることで目的の情報を獲得できる。人の脳が僅か十 数Wで高速に情報処理することが出来るのは上記 の理由によると思われる。 13 / 16 図19 階層記憶-基本構成

(14)

3-8.認知対象の言葉&意味の獲得

人工頭脳にとって、言葉が何を指すのか、その対象 と意味がわかる。つまり、言葉の対象と意味を獲得 するのは次の3つの方法がある。図21「認知対象に 対する言葉の獲得」を用いて説明する。

(1)未知の言葉に対する認知情報の絞込み

当該する言葉と周辺の文章、言葉から連想記憶を 駆使し、言葉が指す対象のイメージ、意味を推測す る。

(2)認知対象に名付けられた言葉の獲得

会話/媒体の文章(言葉)とそれが示唆する視覚空間 の認知対象から、言葉と認知対象をそれらが定義さ れた A)階層的抽象化 WORD)空間と B)記憶アド レス-実体空間でリンク接続する。 *言葉を獲得していない認知対象に「これ、何に?」 「何をしているの?」と質問し、回答を得ることで認知 対象の言葉を獲得する。

(3)未知の言葉の対象を視覚空間で捉える

未知の言葉の該当する対象を視覚空間上で捉える。 仮想視野空間(実視野、仮想空間)の言葉を獲得し ていない認知(認識)対象と音声(文章)の中の未知 の言葉が文章の周囲の言葉、当該シーンのイメージ から一致した場合、未知の言葉の対象、意味を獲得 したことになる。 *注記事項 言葉を獲得していない認知対象の連想/階層記憶が 広く形成されていれば、その対象の言葉を獲得した 瞬間、言葉の意味(性質、特性)を知ることになる。 14 / 16 図21 認知対象に対する言葉の獲得 SIG-AGI-014-01

(15)

3-7.時間の概念の獲得

人工頭脳が扱う時間は、①何時(When)、②現在/ 過去/未来の2つの概念が存在する。 ①When (時間を特定:厳密~アバウト) ⅰ)年、月、日、曜日 ⅱ)午前/午後&時刻##:## ⅲ)朝/昼/夕方/夜 ⅳ)季節:春夏秋冬 ②現在/過去/未来. ⅵ)さっき/今/後で ⅴ)一昨日/昨日/今日/明日/明後日&曜日 Ⅵ)先週/今週/来週-先月/今月/来月 Ⅶ)-先年/今年/来年 本章では時間の概念:4つにグループ分け(視覚時 計、デジタル/アナログ時計、感覚時計、カレンダー とスケジュール、イベントへの対応)、取得に向けた考 え方を紹介する。 ①視覚時計(季節:春夏秋冬、一日:朝、昼、夕、夜) 視野情報の特徴的なシーンの連想/階層記憶を 形成し、上位概念から順に言葉を付与していく。 ②デジタル/アナログ時計 瞬間的な時間ではあるが、帯域を感覚的に捉えると 共に、イベントと連携することでシュケジュールの概 念を獲得していく。 ③カレンダー時計:年月日&曜日 年月日&曜日は、視覚的(位置情報も含む)にカレン ダーを捉えると共に、現時点の前後:昨日今日/明日 等の概念も獲得していく。イベントとも連携し、スケ ジュールの概念をデジタル/アナログ時計とセットで 獲得していく。更に、現時点を基準とした現在/過去/ 未来の概念も獲得する。 ④感覚時計(ちょっと、さっき、後で、先に、今..) ケースバイケースなシーンや個人的な捉え方で時間 の幅が出てくる。 15 / 16 図 22 時間の概念-連想/階層記憶との連携で意識

(16)

4.纏め

本論文において、“聞く”(音声情報処理)(話の内容 の文章化と文節区切りしたものが入力情報)という 情報処理を脳機能工学の視点から分析し、 ①話の内容(文章)にバックグラウンド情報、お互い の共通情報を加え、視覚的にイメージすると共に、 ②「話の内容」、及び「文章・相手の status に含まれ る相手の伝えたい事(意志表示)」を汲み取り相手 の話を理解 すべく思案を開示した。 更に ③認知対象の言葉とその意味の獲得、時間の概念 の獲得を実現すべく課題を明示した。

5.参考文献

*以下の論文は全て汎用人工知能研究会 SIG-AGI 予稿集:AI 書庫をご参考 論文(1) 江村憲夫 人工頭脳OS実現に向けて -人の脳の振舞いを 模倣した有機的情報処理 第 9 回 人工知能学会 汎用人工知能研究会 SIG-AGI-009-01 (2018 年 8 月 30 日) 論文(2) 江村憲夫 「人工頭脳における思考アルゴリズムと意思の関与」 第 11 回 人工知能学会 汎用人工知能研究会 SIG-AGI-011-02(2019 年 3 月 15 日) 論文(3) 江村憲夫 「人工頭脳における記憶制御(記憶素子ベースの 連想/階層記憶と活性化伝搬と階層的抽象化制御)」 第 12 回 人工知能学会 汎用人工知能研究会 SIG-AGI-012-02(2019 年 8 月 30 日) 論文(4) 江村憲夫 「思考アルゴリズムの強化に向けて」 第 13 回 人工知能学会 汎用人工知能研究会 SIG-AGI-13-002 (2019 年 11 月 22 日) 書籍(1) 山中恵美子 瞬読 SBクリエイティブ (2018) 書籍(2) 苫米地英人 一瞬で相手をオトす洗脳術 マキノ出版 (2009) 16/ 16 SIG-AGI-014-01

参照

関連したドキュメント

【原因】 自装置の手動鍵送信用 IPsec 情報のセキュリティプロトコルと相手装置の手動鍵受信用 IPsec

具体音出現パターン パターン パターンからみた パターン からみた からみた音声置換 からみた 音声置換 音声置換の 音声置換 の の考察

Google マップ上で誰もがその情報を閲覧することが可能となる。Google マイマップは、Google マップの情報を基に作成されるため、Google

しかしながら、世の中には相当情報がはんらんしておりまして、中には怪しいような情 報もあります。先ほど芳住先生からお話があったのは

(ECシステム提供会社等) 同上 有り PSPが、加盟店のカード情報を 含む決済情報を処理し、アクワ

(今後の展望 1) 苦情解決の仕組みの活用.

By the method I, emotional recognition rate is 60% for close data, and 50% for open data(8 sentence speech of another speaker).The method II improves drastically the recognition

2 保健及び医療分野においては、ろう 者は保健及び医療に関する情報及び自己