計算機による図形や音声情報の処理

(1)

計算機による図形や音声情報の処理

九州大学大学院総合理工学研究科助教授河口英一

1. はじめに

計算機ユーザーと図形や音声"との具体的な関連は次のような場合に出てくるであろう。

a.計算結果をグラフや図形に表わし見やすいものにするとき。

b 論文や報告書などに用いる清書図形を計算機で編集するとき。

C. 実用化されているシステムではないが，手書き文字によるオンラインテキストエディタを使用するとき。

d. TSS端末への音声によるメッセージ出力。

e.プログラム開発時における音声によるデーターセットの作成。

以上のうち a.及び b.の一部の機能については既に多くのユーザーになじみの深いものである。 C.以下については今後実用化の可能性のあるものである。

以上のような場合以外にも図形(画像)や音声情報の具体的な処理システムが望まれているものとして，写真に撮影したデーター(土石流の速度や流量，微粒子写真データ，リモートセンジング，

その他)や，大量の画像データーベースシステム (X線写真，地図，天気図など) ，音声入力による装置の動作確認などがあげられる。

このような図形や画像，音声情報の処理システムは完成されれば非常に応用範囲の広いものであるが，現在はまだまだ研究段階のものが殆んどである。

2. 図形情報処理研究の一例

図形情報処理に関する研究の一例として，現在我々が行っている研究の概要を紹介する。まず，

我々が研究のテーマとしているものを列挙すれば次の3つになる。

(1) 図形(画像)情報の圧縮 (2) 図形情報の自動認識

(3) 図形データーベースの蓄積と検索システム

2. 1 図形(画像)情報の圧縮

図形情報を取扱う場合，そのデータの性格から二つの場合に分けられる。一つは図形を描くための数値やそれらを計算機で扱うためのコマンド群からなるデータの場合である。例えば，円を描くためには，中心点の座標値半径の大きさ及び線の太さや計算機への指示データ"な

(2)

どからなるデータである。通常の計算機ユーザーがグラフの出力，作図，図形編集などで扱うデータが乙れにあたる。

他の場合の図形データとは，画面上の一点一点(絵素)毎1[，白，黒，黒，白，白，・・

のように取扱う場合であり，乙れは白黒からなるパターンデータ"とも言える。当然のことながら，このようなパターンデータの方がより一般的な図形を表現するものであり，更に濃淡情報や色情報をも扱えば図形"と画像"の区別はなくなってくる。但し，乙の場合はデータ量の大きさに悩まされる乙とになり，計算機を用いてこれらのデータを蓄積保存する際は効率のよい情報圧縮技術が不可欠である。

2. 2 DF符号化方式による情報圧縮と応用

DF符号化方式とは最近我々が考案し，普及を提唱している一つの画像情報の圧縮方式である。

白黒データ(白→0，黒→1)からなる正方形図形の場合の例を図 1IC示す。 (a)が原図形であり，

(a)

E I F I 1 C I 0 I G

...~...I... .，...

(b )

︒

→ MO→L O→K

噌 ︐

AAllyEd

〆'

t︑

τ i A l E τ i

I→H O→G

fl︑

︒

→

FO→E O→D l→c

ft

‑

→

B O→A

ft

↓ ︑ ︑

符ロぢ

FA

D

図1。図形の例とそのDF符号

(b)は部分図形に記号A，B， C，…， Mを付してDF符号との対応を解り易くしたものである。この例でも解るように，乙の符号化方式は原理が簡単で，符号器"や復号機"を容易にプログラムで実現でき，しかも圧縮率の高い符号化方式である。

‑52

(3)

乙のDF符号化方式は多値画像(濃淡凶形)や類似凶形の州"に対しても効率よく情報圧縮ができる乙とが分った。図2は，静止した背景を持ち，凶の一部分だけが次々に変化している線画の

帳￨帳 l 喋￨閣法￨

l t l ^q l l

^歌4{

r₁~rZ rZ~r3 r3~ 九九<DrS

図2. 線画の列と EOR演算

列であるが，乙の場合では隣接図形相互の排他的論理和(EOR演算)"をDF符号上で行うことで，一枚一枚を単純にDF符号化する場合に比べ2倍の圧縮効果が得られることが知られた。

DF符号化方式のその他の応用として，類似図形の検索システムへの応用がある。これは符号中の 0"や 1"の構成割合や，次数"に注目して素面スペクトラム"という概念を定め，各々の図形のスペクトラム情報により図形の大まかな一致不一致を判断する技法である。

2. 3 天気図認識システムの試作

図形情報の自動認識システムも計算機に期待されている処理の一つである。乙乙では天気図を対象とする試作システムの様子を紹介する。本研究の意図は，対象を具体的に限定することにより，図形認識問題に生ずる一般的な問題を具体的な形で把握し，その解決策を基にして，逆に一般問題解決のための指針を得るところにある。

図3. 日本式天気図

(4)

図3，^ζ示す天気図は日本気象協会発行の「天気図集成J様式の日本式天気図の例である。試作システムは乙のような天気図を入力とし，各地の天気(15地点)"〆風向・風力"ブ前線の種類と通過地点高気圧・低気圧の中心地気圧値台風等圧線情報 " 等々を読み取り，総合的な気象状況を理解するシステムとして構成したものである。具体的な認識の手順は

(1) 各地の天気記号，風記号の認識(パタンマッチング技法)

(2) 高気圧 (H).低気圧 (L).台風 (T)などや気圧値(数字)の認識(細線化と方向ベクトル列の処理技法)

(3) 前線の種別と通過地点の認識(パタンマッチングと座標変換) (4) 等圧線の認識(線分追跡技法)

(5) 総合的な気象状況の認識(気象に関する知識の活用技法)

のように行なっている。このうち(1)‑(4)については処理時間(小規模のミニコンで一枚の天気図が約一時間)を問題にしなければ一応の成果が得られている。今後の問題点は(5)の具体化と，全体的な動作の高速化であろう。

2. 4 天気図検索システムの試作

大量の図形データの中から特定の条件を満たすものを短時間で自動的に探し出すシステムが出来ればその応用範囲は限りなく広がっていくと思われる。指紋の照合システムは最近国内で開発され，実用lと供される日も近いと思われる。指紋の場合は，原理的にはノfタンとしての一致，不一致がかなり一意的に決定できると思われるが，天気図のような場合，今日の天気図と一致する過去の天気図"は原則として存在しないとの前提が必要である。乙の場合は気象状況がよく似ている"天気図を探し出すととが問題である。

試作システムは2. 3で述べた天気図のデータ中より，入力天気図に類似した天気図を探し出すζとを目的とするシステムである。検索は二段階に分れるが，まず第一段階では，天気図を・白黒のパタン"と見たときの素画スペクトラムの類似度を基に候補天気図を抽出し，二段階では2.3 の認識システムを利用した気象状況の類似性を判定するようにした。第一段階の処理については既に一応の成果が得られており，人目で見ても確かに似ていると思われる天気図を摘出できるようになった。第二段階の処理については2. 3のシステムの応用であるので，部分的には完成しているが全体を一つのシステムにまとめるまでには至っていない。

3. 音声情報処理研究の一例

音声合成や音声認識の研究も既に可成りの歴史を持つ時代になってしまった。音声合成の分野ではPARCOR型の合成技術がLSIチップになって市場に出まわり，認識システムも既ζl商品化され実用化されている。乙とでは我々が試作している汎用ミニコンによる音声認識・合成実験システムを紹介する。

3. 1 音声入力による気象情報応答システム

54‑

(5)

乙の実験システムは，単語音声認識システムと録音編集型音声合成システムを入出力のサブシステムとし，全体を気象情報に関する質問応答システムの形にまとめたものである。例えばf長崎県(ナガサキケン) "と言えば，長崎県，今日は北の風，くもり時々晴，ところによっては…

い"という音声出力が現われるものである。認識方式はいわゆるDPマッチング方式とよばれるものを基本にしており，実際のシステムは小さな汎用ミニコンで実現している。システム内に蓄えておくデータを特定の個人用に設定しておくと約150単語位で95%以上の認識能力を持つもの

として実現した。処理時間は約 10秒程度である。

音声出力の方式は単語音声(適当な長さに区切った音声データ)を出力文に応じて組合わせるもので，合成音の質は良好なものである。乙の場合，計算機内に蓄えておくデータ量を減らすために，母音区間の音声データの周期性に注目したデータ圧縮技法を活用している。尚，質問応答の内容に関するデータ構成，アルゴリズム等については説明を省略する。

3. 2 音声出力機能を付加したTSS端末

最後に汎用計算機ユーザーにとって最も身近なTSS端末に於ける音声出力の応用の一例を紹介する。

乙のシステムは解り易く言えば.TSSセッション中にホストからの種々のメッセージ(普通は文字列で端末 lζ 表示されるが)を音声に変換するものである。試作システムではミニコンシステム(CPUを2台)でTSS端末と音声合成システムを構成した。ホストからのメッセージには，普通メッセージ番号が付いているが，端末側では乙れを検知し，あらかじめ用意した日本語文の音声を出力する方式とした。現在既に音声合成用LSIチップが市販されており，いわゆるインテリジェント型の端末に組込む乙とは容易であるのでこのような音声出力端末が実用化される時期も遠くないであろう。音声出力の例は次のようなものである。

l まもなくセッションの打切り時間です。

2. 該当コマンドが見つかりません

3. 行番号の指定に誤りがあります

4. まもなく計算機は停止します

5. まもなくセッションの打切時間です

乙のようなメッセージの音声出力がTSSユーザーにとって有用なものであるか否かについては，

今後使用経験を蓄積してみなければ分らないが，幾つかのメッセージ，例えば上の例における4. 5などは確かに有用であると思われた。

4. おわりに

計算機の使用目的の多くはいわゆる計算"であるが，計算機で処理できる情報は広範なものであり，特に限定した使用目的で計算機に対処する乙とはよくない。今日は図形や音声情報の処理に関連して，現在我々の研究クーループで取組んでいる話題について紹介した。その中には，一般の計算

(6)

機ユーザーにとっては，あまり関心のない部分も含まれていたと思われるが，幾つかの話題については，多少興味をもっていただけたのではないかと思う。今回の話が幾分かでも皆犠に益するものであればと念願する次第である。

FO

Fh u

計算機による図形や音声情報の処理

帳￨帳 l 喋￨閣法￨

l t l q l l

l t l ^q l l