4 . 講 演 会 か ら
計 算 機 に よ る 動 図 形 の 言 語 的 理 解
大 分 大 学 工 学 部 教 授 岡 田 直 之
近年,人工知能,とりわけ図形や自然言語の計算機処理に関する研究がきわめて活発となり,処 理のレベルも取り扱う分野を限定すると,人間の知的処理と比較し得るまでに向上しつつある。乙 のような高いレベルでの計算機処理にお
いては,人間自身の行っている知的活動 が大いに参考とされる。人間の知的活動 は,①意味理解・知的認識,②思考・推 論,@意図表現・知的行動,という
3
つ の側面をもつが,それらにおいては概念 ないしは知識の系が,本質的に重要な役 割を果している。概念は外界情報との結 び、つきによって形成される部分が基礎を なすと見られるが,その形成概念の構造 は自然言語の構文的,意味的構造とも密 接ζ l
結びついている。筆者は
ζ
の2 0
年近く,外界情報と自然 言語を対応づけて両者に共通な概念の系 を把握し,主として①,②l乙.関する問題 を解決することに取組んできた。具体的 にはrSUPPJ
と呼ばれるシステムの開発 で,乙のシステムは,時間的に変化する 図形パターンを読み取り,その中で生じ ている変化の意味内容を言語的に理解し,個々の変化の間の類似性を推論し,その 結果を日本語および英語で記述するもの であるJ1)
SUPP
の原型は昭和5 0
年に完成 した。入出力の1
例を図1 1 [
示す。Supp
は,図形ノf
ターンの系列をオンラインのテレビカメラで読み取ると,まず個々の要素的図 形(・家¥ 男'など)をそれが何であるか「認識l
し,次いで図形パターン内およひ 図形ノf
ターン聞 の静的構造( 家の中の男'など)並びに動的構造(重心の移動など)を分析する。構造的特徴が抽出 されると,それらの組合せとして 出る 降りる'などの事象が「理解」され,同時に事象聞の類似 性が「推論J
される。最後に理解された出来事が日本語および英語文で表現される。SUPP
の開発において問題となった乙とは,構造的特徴を抽出したり,文を生成したりするため のプログラミング技術も勿論の乙とであるが,とりわけ, 出る'とか 降りる'などの事象の理解には,図形パターンのどのような構造的特徴に注目すればよいか,ということである。この問題は自然言 語の側から見ると,文を構文的かつ,意味的に支配する動詞の意味を明確にする乙とであり,図形ノ
f
ターンの側から見ると,現実世界で生じている事象の構造を的確に把握する乙とである。人聞は,
乙のようなデータの蓄積並びに処理を暗々裡のうちに行っているため,それを明確にして符号化,
プログラム化を行いにくいという点が,人工知能全般に共通な,かっ最大の問題点なのである。
そこでまず,事象概念の系を解明することが第一の課題となり,日常の言語生活で一応十分とさ れる約
5
干の動詞を対象として,それらの概念の分析,分類を行った J2)その結果,事象概念は大き く,それ以上要素的事象概念 lζ 分解できない「単純事象概念J
と,分解する乙とのできる「非単純 事象概念J
ζ分けられる乙とが判った。更に,単純事象概念の中には「基準概念IJ
(類似概念に対 する)が約1
,200
あることも明らかとなった。乙の乙とは,人聞が言語的に思考する場合,約1
,200
の思考単位をもっているとも解釈できる。又基準概念の中では,物体の移動に関するものが最も多く
300
を越える,という乙とも興味深い。次lζ ,上記概念分析に基づいて機械辞書および処理プログラムを作成する乙とになったが,特に 工夫を要するのは,符号化した事象概念データと構造的特徴を抽出するためのプログラム(サフソレ ーチンパッケージ)との整合である。最終的には,各サブルーチンに与えた名称、を符号と考え,そ れらの符号を用いて事象概念データを表現する,というごく単純で,いわば当然な方法で,効率的 な整合を行う乙とができた
J 3 )
との考えは,人工知能においてしばしば用いられるプログラミング言 語LISP
の中の,FUNCALL
の機能(静的データに起動をかけて対応するプログラムを走らせるもの)とも相ずる。更に乙の手法は,人間のもつ知識を計算機の中に組み込む場合,宣言的
( d e c l a r a t i v e )
な形を取るか,手続的( p r o c e d u r a
l)な形を取るか,という問いかけに対しても,両者の融合が必 要な乙とを示している。かくして
SUPP
の原型が完成したが,基礎となった概念の系に対する理論 および処理の手法は,ほぼ閉じ頃に
MIT
のMinsky ( r
人工知能」としづ分野を初めて明確にした先駆者)によって人閣の 知的処理を総合的に把握すべく提案された,r
フレーム理論 J(4)と多くの共通点をもっと共に,それ を具現化した一つのシステムにもなっている。今後も,更に
SUPP
を発展させたいと考えている。‑49‑
( 1 ) N . Okada : 唱 UPP U n d e r s t a n d i n g Moving P i c t u r e P a t t e r n s B a s e d on L i n g u i s t i c Knowledge
,"P r o c . 6 t h I n t ' l J o i n t Con f . A r t . I n t .
,Tokyo
,1 9 7 9 .
( 2 )
岡田,田町: 自然語および図形解釈のための単純事象概念の分析および分類電子通信学 会論文副D)
,56 ‑ D
,9
,p . 5 2 3 ( 昭 4 8 ‑ 0 9 ) .
( 3 )
岡田,田町: 動図形の意味解釈とその自然語記述一怠味分析電子通信学会論文誌(D),J59‑D , 5 , p . 3 3 1 (
昭51‑05).
( 4 ) M. Minsky : A Framework f o r R e p r e s e n t i n g Knowledge , " i n P . H. W i n s t o n ( e d )
:The P s y c h o l o g y o f Computer V i s i o n
,"p . 2 8 2
,M cG r a w ‑ H i l l . I n c .
,( 1 9 7 5 ) .
‑50
計算機による図形や音声情報の処理
九 州 大 学 大 学 院 総 合 理 工 学 研 究 科 助 教 授 河
口 英 一
1 .
はじめに計算機ユーザーと 図形や音声"との具体的な関連は次のような場合に出てくるであろう。
a .
計算結果をグラフや図形に表わし 見やすいものにするとき。b
論文や報告書などに用いる清書図形を計算機で編集するとき。C.
実用化されているシステムではないが,手書き文字によるオンラインテキストエディタを使 用するとき。d . T S S
端末への音声によるメッセージ出力。e .
プログラム開発時における音声によるデーターセットの作成。以上のうち
a .
及びb .
の一部の機能については既に多くのユーザーになじみの深いものであ る。C.
以下については今後実用化の可能性のあるものである。以上のような場合以外にも図形(画像)や音声情報の具体的な処理システムが望まれているもの として,写真に撮影したデーター(土石流の速度や流量,微粒子写真データ,リモートセンジング,
その他)や,大量の画像データーベースシステム
(X
線写真,地図,天気図など) ,音声入力によ る装置の動作確認などがあげられる。このような図形や画像,音声情報の処理システムは完成されれば非常に応用範囲の広いものであ るが,現在はまだまだ研究段階のものが殆んどである。
2 .
図形情報処理研究の一例図形情報処理に関する研究の一例として,現在我々が行っている研究の概要を紹介する。まず,
我々が研究のテーマとしているものを列挙すれば次の
3
つになる。( 1 )
図形(画像)情報の圧縮( 2 )
図形情報の自動認識( 3 )
図形データーベースの蓄積と検索システム2 . 1
図形(画像)情報の圧縮図形情報を取扱う場合,そのデータの性格から二つの場合に分けられる。一つは図形を描くた めの数値やそれらを計算機で扱うためのコマンド群からなるデータの場合である。例えば,円を 描くためには, 中心点の座標値 半径の大きさ及び 線の太さや計算機への指示データ"な
Fh u
ータが乙れにあたる。
他の場合の図形データとは,画面上の一点一点(絵素)毎1[, 白,黒,黒,白,白,・・
のように取扱う場合であり,乙れは白黒からなる パターンデータ"とも言える。当然のことなが ら,このようなパターンデータの方がより一般的な図形を表現するものであり,更に濃淡情報や 色情報をも扱えば 図形"と 画像"の区別はなくなってくる。但し,乙の場合はデータ量の大きさ に悩まされる乙とになり,計算機を用いてこれらのデータを蓄積保存する際は効率のよい情報圧 縮技術が不可欠である。
2 . 2 DF
符号化方式による情報圧縮と応用DF
符号化方式とは最近我々が考案し,普及を提唱している一つの画像情報の圧縮方式である。白黒データ(白→0,黒→1)からなる正方形図形の場合の例を図 1IC示す。 (a)が原図形であり,
(a)
E I F I 1 C I 0 I G
...~...I...
. , . . .
(b )
︒
→
M O
→L O
→K
噌 ︐
AAllyEd
〆'
t
︑
τ i A l E τ i
I
→H O
→G
fl
︑
︒
→
F O
→E O
→D l
→c
f t
‑
→
B O
→A
ft
↓
︑ ︑
符
ロ ぢ
F A
D
図
1
。図形の例とそのDF
符号( b )
は部分図形に記号A,B
,C
,…,M
を付してDF
符号との対応を解り易くしたものである。こ の例でも解るように,乙の符号化方式は原理が簡単で, 符号器"や 復号機"を容易にプログラム で実現でき,しかも圧縮率の高い符号化方式である。‑5 2
乙の
DF
符号化方式は多値画像(濃淡凶形)や 類似凶形の州"に対しても効率よく情報圧縮がで きる乙とが分った。図2
は,静止した背景を持ち,凶の一部分だけが次々に変化している線画の帳│帳 l 喋│閣法│
l t l q l l 歌4{
r 1 ~rZ rZ~r3 r3~ 九 九<D r S
図
2 .
線画の列とEOR
演算列であるが,乙の場合では隣接図形相互の 排他的論理和
(EOR
演算)"をDF
符号上で行うこと で,一枚一枚を単純にDF
符号化する場合に比べ2
倍の圧縮効果が得られることが知られた。DF
符号化方式のその他の応用として,類似図形の検索システムへの応用がある。これは符号中 の 0"や 1"の構成割合や, 次数"に注目して 素面スペクトラム"という概念を定め,各々の図 形のスペクトラム情報により図形の大まかな一致不一致を判断する技法である。2 . 3
天気図認識システムの試作図形情報の自動認識システムも計算機に期待されている処理の一つである。乙乙では天気図を 対象とする試作システムの様子を紹介する。本研究の意図は,対象を具体的に限定することによ り,図形認識問題に生ずる一般的な問題を具体的な形で把握し,その解決策を基にして,逆に一 般問題解決のための指針を得るところにある。
図
3 .
日本式天気図53
図
3 ,
ζ示す天気図は日本気象協会発行の「天気図集成J
様式の日本式天気図の例である。試作 システムは乙のような天気図を入力とし, 各地の天気(15
地点)"〆風向・風力"ブ前線の種類 と 通 過 地 点 高 気 圧 ・ 低 気 圧 の 中 心 地 気 圧 値 台 風 等 圧 線 情 報 " 等 々 を 読 み 取 り , 総合的な気象状況を理解するシステムとして構成したものである。具体的な認識の手順は(1) 各地の天気記号,風記号の認識(パタンマッチング技法)
(2) 高気圧 (H).低気圧 (L).台風 (T)などや気圧値(数字)の認識(細線化と方向ベ クトル列の処理技法)
( 3 )
前線の種別と通過地点の認識(パタンマッチングと座標変換)( 4 )
等圧線の認識(線分追跡技法)( 5 )
総合的な気象状況の認識(気象に関する知識の活用技法)のように行なっている。このうち
( 1 ) ‑ ( 4 )
については処理時間(小規模のミニコンで一枚の天気図 が約一時間)を問題にしなければ一応の成果が得られている。今後の問題点は( 5 )
の具体化と,全 体的な動作の高速化であろう。2 . 4
天気図検索システムの試作大量の図形データの中から特定の条件を満たすものを短時間で自動的に探し出すシステムが出 来ればその応用範囲は限りなく広がっていくと思われる。指紋の照合システムは最近国内で開発 され,実用lと供される日も近いと思われる。指紋の場合は,原理的にはノ
f
タンとしての一致,不 一致がかなり一意的に決定できると思われるが,天気図のような場合, 今日の天気図と一致する 過去の天気図"は原則として存在しないとの前提が必要である。乙の場合は 気象状況がよく似て いる"天気図を探し出すととが問題である。試作システムは
2 . 3
で述べた天気図のデータ中より,入力天気図に類似した天気図を探し出 すζとを目的とするシステムである。検索は二段階に分れるが,まず第一段階では,天気図を・白 黒のパタン"と見たときの素画スペクトラムの類似度を基に候補天気図を抽出し,二段階では2 .3
の認識システムを利用した気象状況の類似性を判定するようにした。第一段階の処理については 既に一応の成果が得られており,人目で見ても確かに似ていると思われる天気図を摘出できるよ うになった。第二段階の処理については2 . 3
のシステムの応用であるので,部分的には完成し ているが全体を一つのシステムにまとめるまでには至っていない。3 .
音声情報処理研究の一例音声合成や音声認識の研究も既に可成りの歴史を持つ時代になってしまった。音声合成の分野で は