• 検索結果がありません。

計算機による図形や音声情報の処理

N/A
N/A
Protected

Academic year: 2021

シェア "計算機による図形や音声情報の処理"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

計算機による図形や音声情報の処理

九 州 大 学 大 学 院 総 合 理 工 学 研 究 科 助 教 授 河 英 一

1.  はじめに

計算機ユーザーと 図形や音声"との具体的な関連は次のような場合に出てくるであろう。

a.計算結果をグラフや図形に表わし 見やすいものにするとき。

b 論文や報告書などに用いる清書図形を計算機で編集するとき。

C. 実用化されているシステムではないが,手書き文字によるオンラインテキストエディタを使 用するとき。

d.  TSS端末への音声によるメッセージ出力。

e.プログラム開発時における音声によるデーターセットの作成。

以上のうち a.及び b.の一部の機能については既に多くのユーザーになじみの深いものであ C.以下については今後実用化の可能性のあるものである。

以上のような場合以外にも図形(画像)や音声情報の具体的な処理システムが望まれているもの として,写真に撮影したデーター(土石流の速度や流量,微粒子写真データ,リモートセンジング,

その他)や,大量の画像データーベースシステム (X線写真,地図,天気図など) ,音声入力によ る装置の動作確認などがあげられる。

このような図形や画像,音声情報の処理システムは完成されれば非常に応用範囲の広いものであ るが,現在はまだまだ研究段階のものが殆んどである。

2.  図形情報処理研究の一例

図形情報処理に関する研究の一例として,現在我々が行っている研究の概要を紹介する。まず,

我々が研究のテーマとしているものを列挙すれば次の3つになる。

(1)  図形(画像)情報の圧縮 (2)  図形情報の自動認識

(3)  図形データーベースの蓄積と検索システム

2.  1 図形(画像)情報の圧縮

図形情報を取扱う場合,そのデータの性格から二つの場合に分けられる。一つは図形を描くた めの数値やそれらを計算機で扱うためのコマンド群からなるデータの場合である。例えば,円を 描くためには, 中心点の座標値 半径の大きさ及び 線の太さや計算機への指示データ"な

(2)

どからなるデータである。通常の計算機ユーザーがグラフの出力,作図,図形編集などで扱うデ ータが乙れにあたる。

他の場合の図形データとは,画面上の一点一点(絵素)毎1[, 白,黒,黒,白,白,・・

のように取扱う場合であり,乙れは白黒からなる パターンデータ"とも言える。当然のことなが ら,このようなパターンデータの方がより一般的な図形を表現するものであり,更に濃淡情報や 色情報をも扱えば 図形"と 画像"の区別はなくなってくる。但し,乙の場合はデータ量の大きさ に悩まされる乙とになり,計算機を用いてこれらのデータを蓄積保存する際は効率のよい情報圧 縮技術が不可欠である。

2.  2 DF符号化方式による情報圧縮と応用

DF符号化方式とは最近我々が考案し,普及を提唱している一つの画像情報の圧縮方式である。

白黒データ(白→0,黒→1)からなる正方形図形の場合の例を図 1IC示す。 (a)が原図形であり,

(a) 

E I F I 

...~...I... .... 

(b ) 

MOO

AAllyEd

'

t

τ i A l E τ i  

IO

fl

FOOl

ft  

O

ft

↓  ︑ ︑

ロ ぢ

FA  

1。図形の例とそのDF符号

(b)は部分図形に記号A,B, C,…, Mを付してDF符号との対応を解り易くしたものである。こ の例でも解るように,乙の符号化方式は原理が簡単で, 符号器"や 復号機"を容易にプログラム で実現でき,しかも圧縮率の高い符号化方式である。

‑52 

(3)

乙のDF符号化方式は多値画像(濃淡凶形)や 類似凶形の州"に対しても効率よく情報圧縮がで きる乙とが分った。図2は,静止した背景を持ち,凶の一部分だけが次々に変化している線画の

帳│帳 l 喋│閣法│

l t l   l l

歌4{

r~rZ rZ~r3 r3~ 九 九<DrS 

2. 線画の列と EOR演算

列であるが,乙の場合では隣接図形相互の 排他的論理和(EOR演算)"DF符号上で行うこと で,一枚一枚を単純にDF符号化する場合に比べ2倍の圧縮効果が得られることが知られた。

DF符号化方式のその他の応用として,類似図形の検索システムへの応用がある。これは符号中 0" 1"の構成割合や, 次数"に注目して 素面スペクトラム"という概念を定め,各々の図 形のスペクトラム情報により図形の大まかな一致不一致を判断する技法である。

2.  3 天気図認識システムの試作

図形情報の自動認識システムも計算機に期待されている処理の一つである。乙乙では天気図を 対象とする試作システムの様子を紹介する。本研究の意図は,対象を具体的に限定することによ り,図形認識問題に生ずる一般的な問題を具体的な形で把握し,その解決策を基にして,逆に一 般問題解決のための指針を得るところにある。

3. 日本式天気図

(4)

3ζ示す天気図は日本気象協会発行の「天気図集成J様式の日本式天気図の例である。試作 システムは乙のような天気図を入力とし, 各地の天気(15地点)"〆風向・風力"ブ前線の種類 と 通 過 地 点 高 気 圧 ・ 低 気 圧 の 中 心 地 気 圧 値 台 風 等 圧 線 情 報 " 等 々 を 読 み 取 り , 総合的な気象状況を理解するシステムとして構成したものである。具体的な認識の手順は

(1)  各地の天気記号,風記号の認識(パタンマッチング技法)

(2)  高気圧 (H).低気圧 (L).台風 (T)などや気圧値(数字)の認識(細線化と方向ベ クトル列の処理技法)

(3)  前線の種別と通過地点の認識(パタンマッチングと座標変換) (4)  等圧線の認識(線分追跡技法)

(5)  総合的な気象状況の認識(気象に関する知識の活用技法)

のように行なっている。このうち(1)(4)については処理時間(小規模のミニコンで一枚の天気図 が約一時間)を問題にしなければ一応の成果が得られている。今後の問題点は(5)の具体化と,全 体的な動作の高速化であろう。

2.  4 天気図検索システムの試作

大量の図形データの中から特定の条件を満たすものを短時間で自動的に探し出すシステムが出 来ればその応用範囲は限りなく広がっていくと思われる。指紋の照合システムは最近国内で開発 され,実用lと供される日も近いと思われる。指紋の場合は,原理的にはノfタンとしての一致,不 一致がかなり一意的に決定できると思われるが,天気図のような場合, 今日の天気図と一致する 過去の天気図"は原則として存在しないとの前提が必要である。乙の場合は 気象状況がよく似て いる"天気図を探し出すととが問題である。

試作システムは2. 3で述べた天気図のデータ中より,入力天気図に類似した天気図を探し出 ζとを目的とするシステムである。検索は二段階に分れるが,まず第一段階では,天気図を・白 黒のパタン"と見たときの素画スペクトラムの類似度を基に候補天気図を抽出し,二段階では2.3  の認識システムを利用した気象状況の類似性を判定するようにした。第一段階の処理については 既に一応の成果が得られており,人目で見ても確かに似ていると思われる天気図を摘出できるよ うになった。第二段階の処理については2. 3のシステムの応用であるので,部分的には完成し ているが全体を一つのシステムにまとめるまでには至っていない。

3.  音声情報処理研究の一例

音声合成や音声認識の研究も既に可成りの歴史を持つ時代になってしまった。音声合成の分野で PARCOR型の合成技術がLSIチップになって市場に出まわり,認識システムも既ζl商品化され実 用化されている。乙とでは我々が試作している汎用ミニコンによる音声認識・合成実験システムを 紹介する。

3.  1 音声入力による気象情報応答システム

54‑

(5)

乙の実験システムは,単語音声認識システムと録音編集型音声合成システムを入出力のサブシ ステムとし,全体を気象情報に関する質問応答システムの形にまとめたものである。例えばf 崎県(ナガサキケン) "と言えば, 長崎県,今日は北の風,くもり時々晴,ところによっては…

い"という音声出力が現われるものである。認識方式はいわゆるDPマッチング方式とよばれるも のを基本にしており,実際のシステムは小さな汎用ミニコンで実現している。システム内に蓄え ておくデータを特定の個人用に設定しておくと 150単語位で95%以上の認識能力を持つもの

として実現した。処理時間は約 10秒程度である。

音声出力の方式は単語音声(適当な長さに区切った音声データ)を出力文に応じて組合わせる もので,合成音の質は良好なものである。乙の場合,計算機内に蓄えておくデータ量を減らすた めに,母音区間の音声データの周期性に注目したデータ圧縮技法を活用している。尚,質問応答 の内容に関するデータ構成,アルゴリズム等については説明を省略する。

3.  2 音声出力機能を付加したTSS端末

最後に汎用計算機ユーザーにとって最も身近なTSS端末に於ける音声出力の応用の一例を紹介 する。

乙のシステムは解り易く言えば.TSSセッション中にホストからの種々のメッセージ(普通は 文字列で端末 lζ 表示されるが)を音声に変換するものである。試作システムではミニコンシステ ム(CPU2台)でTSS端末と音声合成システムを構成した。ホストからのメッセージには,普 通メッセージ番号が付いているが,端末側では乙れを検知し,あらかじめ用意した日本語文の音 声を出力する方式とした。現在既に音声合成用LSIチップが市販されており,いわゆるインテリジ ェント型の端末に組込む乙とは容易であるのでこのような音声出力端末が実用化される時期も遠 くないであろう。音声出力の例は次のようなものである。

まもなく セ ッ シ ョ ン の 打 切 り 時 間 で す 。

2. 該当 コ マ ン ド が 見 つ か り ま せ ん

3. 行 番 号 の 指 定 に 誤 り が あ り ま す

4. まもなく 計 算 機 は 停 止 し ま す

5.  まもなく セ ッ シ ョ ン の 打 切 時 間 で す

乙のようなメッセージの音声出力がTSSユーザーにとって有用なものであるか否かについては,

今後使用経験を蓄積してみなければ分らないが,幾つかのメッセージ,例えば上の例における4. 5などは確かに有用であると思われた。

4.  おわりに

計算機の使用目的の多くはいわゆる 計算"であるが,計算機で処理できる情報は広範なものであ り,特に限定した使用目的で計算機に対処する乙とはよくない。今日は図形や音声情報の処理に関 連して,現在我々の研究クーループで取組んでいる話題について紹介した。その中には,一般の計算

(6)

機ユーザーにとっては,あまり関心のない部分も含まれていたと思われるが,幾つかの話題につい ては,多少興味をもっていただけたのではないかと思う。今回の話が幾分かでも皆犠に益するもの であればと念願する次第である。

FO

 

Fh u 

参照

関連したドキュメント

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

口腔の持つ,種々の働き ( 機能)が障害された場 合,これらの働きがより健全に機能するよう手当

ヒュームがこのような表現をとるのは当然の ことながら、「人間は理性によって感情を支配

と言っても、事例ごとに意味がかなり異なるのは、子どもの性格が異なることと同じである。その

このような情念の側面を取り扱わないことには それなりの理由がある。しかし、リードもまた

であり、最終的にどのような被害に繋がるか(どのようなウイルスに追加で感染させられる

わかりやすい解説により、今言われているデジタル化の変革と

とディグナーガが考えていると Pind は言うのである(このような見解はダルマキールティなら十分に 可能である). Pind [1999:327]: “The underlying argument seems to be