• 検索結果がありません。

学位論文内容の要旨

N/A
N/A
Protected

Academic year: 2021

シェア "学位論文内容の要旨"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

博 士 ( 工 学 ) イ ス ラ ム ラ フ イ ク ル

学 位 論 文 題 名

Multi‑clustering Network for Speech Recognition on Parallel Processor

(並列プロセッサによる音声認識のための多層クラスタリングネットワークに関する研究)

学位論文内容の要旨

  マルチメデイア時代の到来と共に、その重要な要素のひとっとして、音声情報処理に関す る研究がますます盛んに行われている。本論文では、全く新しい音声認識システムを提案 する。音声認識の分野では認識率と処理時間が特に重要であり、本論文でもこの二点につ いて特に綿密に議論を行う。

  本論文の音声認識システムにおいては、音声認識のための中核となる技術として自己組 織化クラスタリング手法が用いられている。このクラスタリング手法は、音声スペクトル の分布から、音声信号を適切なクラスタ集合に分類するものである。忘却係数を用いた適 応化の技術を導入することにより、時間と共にクラスタ分布が変化するようなデータに対 しても、クラスタ集合を適切に再構築でき、分布の変化に追従することが可能である。各 クラスタは神経回路網におけるノードとして表現され、丿ード融合の規則を導入すること により、ノード総数は最少に保たれる。本クラスタリング手法はKohonenのそれより速く 収束する特徴を持つ。

  一方、時間遅れニューラルネットワーク(Time‑Delay Neural Network: TDNN)は音声認識 研究における強カな手法のーっである。TDNNの認識性能は優れているが、その三層構造 に起因する処理速度の遅さには問題が残っている。本論文における最初の実験システムと して 、従来のTDNNよりも 高い処理 速度を持つ、二層構造のTDNNを提案する。自己組 織化クラスタリングにより生成された時間遅れ類似度ベクトルテーブルが、二層単純パー セプトロンに入カされ、最終的な出カを得る。提案する二層構造TDNNは、同一のテスト データを用いた従来の(三層)TDNNに比べて約10倍の処理速度を持っが、認識性能はご くわずか低下する。

  処理速度と認識率の双方を向上させるため、本論文では新しく多層クラスタリングネッ トワークを提案する。多層クラスタリングネットワークはニつの異なったクラスタリング層 を持ち、それぞれのクラスタリングアルゴリズムは効率的に並列化することが可能である。

第一層では並列化自己組織化クラスタリングが用いられ、第二層では新しく提案される制 限付クラスタリングネットワークが用いられる。

  並列マルチプロセッサシステムに第一層の自己組織化クラスタリングを導入する際に重 要となるのは、各プロセッサ間の通信コストをなくするために、いかにして各ノードを独立 にするかという問題である。提案する手法では、クラスタリングされるべき全ての入カベ クトルが、それぞれのノードに一度に、独立に入カされる。各入カベクト´レに対する類似 度を各ノードに内において比較し、類似度があらかじめ決められたしきい値以上となる入 カベクトルを、類似度値の高い順番に最大N個選択し、そのノードに属するものとする。

こ の よう に 全 ての ノ ー ドは 他 の ノー ド と は独 立 に 内部 パ ラ メー タを更新 する。

  第二層である制限付クラスタリング層においては、一つのノードにーつのカテゴリラベ ルを割り当てる代わりに、いくっかのノード(近傍丿ードグループ)に同一のラベルを割り

607

(2)

当てる 。最適な 並列処 理を行 うため 、各近 傍ノー ドグル ープに おける処理は、それぞれ別 個のプ ロセッサ に割り当てられる。「制限付クラスタリング」の名称は、第二層におけるク ラス夕 形成が、 選択さ れた近 傍ノー ドグル ープの 中のみ で行わ れることに由来する。特定 の入カ に対して どの近 傍ノー ドグル ープが 選択さ れるぺ きかを 決定するために、規範ベク トルが 導入され る。これにより、制限付クラスタリング層は、バックプロパゲーションのよ うな学 習をする ことな しに、 学習済 みパー セプト ロンの ように 動作する。加えて、この制 限 付 ク ラ ス タ リ ン グ 層 は 従 来 の パ ー セ プ ト ロ ン よ り も 効 率 良 く 並 列 化 で き る 。   複数の 並列プ ロセッサを使用することにより、本論文で提案するシステムは従来のネット ワーク と比較し て最小 の計算 時間で 実現す ること ができ る。例 えば、15個のプロセッサを 持つ並 列計算シ ステム では、 単ープ ロセッ サのシ ステム に比較 して学習時間を12における 認識率 は、日本 語の有 声破裂 子音で97.50が示され、マルチプロセッサを用いることにより 処理速度の向上が確認された。

  提案さ れた多 層クラ スタリン グネッ トワー クは、 将来的 に連続 音声に対しても適用でき ると考え.らlれる。異なる音韻セットのための多層クラスタリングネットワークを用いた、大 語彙音 声単語認 識が将 来の課 題であ る。本 ネット ワーク は並列 処理が有効であることが示 されたことから、実時間にせまる認識が可能であると考えられる。

  本 論 文 は6章で 構 成 さ れてい る。第1章では 本研究 の概要 を述ベ 、音声 認識に おける 従 来の研究を概説し、本研究との関連を述べる。

  第2章 では、 本論文で 議論さ れる音 声認識 システ ムの中 核とな る自己 組織化ク ラスタ ル ング手法について述べる。

  3章 で は 、音 声 認 識 に適 し た 、 二層 構 造 の 時間 遅れ ニュー ラルネ ットワー ク(TDNN) を 新 し く 提 案 す る 。 本 論 文 で 提 案 す る 二 層 構 造 のTDNNは、 従 来 のTDNNよ りも 処 理 速 度を 向 上 す るも の で あ る。 いくっ かの実 験によ り、提 案する二 層TDNNの 有効性 が示さ れ ている。

  本論文 の音声 認識シ ステムで は自己 組織化 クラス タリン グ手法 が用いられているため、

高速な 認識を 行うに は高速 なクラ スタリ ングが 必要であ る。こ のこと から第4章では 、自 己組織 化クラス タリン グの並 列処理 化につ いて述 べる。 この並 列化の効果は実験によって 確認さ れる。第 ー層に自己組織化クラスタリング層、第二層に単純パーセプトロンを持つ、

ハイブ リッド型 二層ネットワークの音声認識システムが構築され、実験により高い認識率と 高速な 処理が実 現され ること を示さ れる。 これに より本 実験で の認識システム、とりわけ 並列化された自己組織化クラスタリング手法の有効性が示される。

  第5章 では、 音声認識 のため の全く 新しい 多層ク ラスタ リング システ ムを提案 する。 こ のシス テムは並 列化手 法を巧 みに導 入した ニつの クラス タリン グ手法を用いている。実験 により 、提案す る新しい多層クラスタリングシステムは、より高い認識率を達成し、より高 速な動 作をする ことが示される。これに加えて、本論文で提案する多層クラスタリングネッ トワー クシステ ムの将 来の方 向性に ついて も議論 する。 音素認 識システムから連続音声認 識シス テムヘの 拡張の 可能性 と、並 列処理 による 実時間 にせま る認識処理の可能性につい て論ずる。

  最後 に第6章 では、本 論文で 提案さ れたい くっか の新し い音声 認識シ ステムに ついて 、 従来シ ステムと 比較し ながら 詳細に 議論し 、提案 する多 層クラ スタリングシステムが最も 優れたもののーつであることを結論する。

608−

(3)

学位論文審査の要旨 主査

副査 副査 副査

教 授

  

栃 教 授

  

新 教 授

  

青 助 教 授

  

内香次 保    勝 木由直 永喜一

学 位 論 文 題 名

Multi‑clustering Network for Speech Recognition on Parallel Processor

(並列プロセッサによる音声認識のための多層クラスタリングネットワークに関する研究)

  

実用的な音声認識システムの実現を目指し、高速かっ高精度な音声認識手法が求めらて いる。本論文は、このための有カな手法のーっとして知られている自己組織化クラスタリ ング手法を中核とし、クラスタリングネットワークの構成法、ならびに高速化のための並 列計算機へのインプリメントなどの新しい手法を提案し、実験を行なって手法の有効性を 確認したもので、その主要な成果は以下に要約される。

  

1

) 自 己 組 織 化 ク ラ スタ リ ン グ 層 と 単 純パ ーセ プ卜 口ン から なる

2

層構 造の

TDNN (TimeDelay Neural Network)

によ る認 識手法を提案し、従来の3 層構造TDNN と比較し、

認 識性 能は わず かに 低下 する もの の、 約10 倍の 処理速 度が 得ら れる ことを確認した。

  (2)

上の 手法を発展させ、認識性能を向上させる手法として、第2 層にもクラスタリン グネッ卜ワークを用いる多層クラスタリングネッ卜ワークを提案した。さらに、この第2 層 の ネ ッ 卜 ワ ー ク 構 成 法 と し て 、 制 限 付 クラ スタ リン グネ ット ヮーク を提 案し た。

  (3)

上記、多層クラスタリングネットワークを並列計算機上に実現するための並列化法

の検討を行ない、まず第1 層の自己組織化クラスタリングネットワークにおいては、各ノ

ードが他のノードとは独立に内部パラメータを更新することにより、並列各プ口セッサ間

の通信コストを最小にする方法を提案した。また、第2 層の制限付クラスタリングネット

ワークにおぃては、各近傍ノードグループにおける処理は、それぞれ別個のプ口セッサに

割 り 当 て ら れ る よ う に し て 最 適 な 並 列 処 理 を 可 能 に す る 方 法 を 提 案 し た 。

  (4)

これを実際に並列計算機上にインプリメントし、実音声データを用いて認識実験を

行 なっ た。 その結果、例えばプロセッサを15 個とした場合、単一プロセッサのシステム

に 比較 して 学習 時間 を12 %に 削減 でき 、日 本語 有声破 裂子 音で

97. 50

%、無声摩擦子

音 で

98. 75

% の 認 識 率 が 得 ら れ 、 本 手 法 の 有 効 性 が 確 認 さ れ た 。

(4)

  

これを要するに、著者は、並列処理に適した新しい多層クラスタリングネットヮーク構 成による音声認識手法を提案して実際に並列計算機上に実験システムを構築し、実音声デ ータによる認識実験を行なってその有効性を確認したもので、音声情報処理工学ならびに 信号処理工学の発展に寄与するところ大である。

  

よ って著者は、北海道大学博士(工学)の学位を授与される資格あるものと認める。

参照

関連したドキュメント

図2に実験装置の概略を,表1に主な実験条件を示す.実

などに名を残す数学者であるが、「ガロア理論 (Galois theory)」の教科書を

これは基礎論的研究に端を発しつつ、計算機科学寄りの論理学の中で発展してきたもので ある。広義の構成主義者は、哲学思想や基礎論的な立場に縛られず、それどころかいわゆ

 

① 新株予約権行使時にお いて、当社または当社 子会社の取締役または 従業員その他これに準 ずる地位にあることを

それに対して現行民法では︑要素の錯誤が発生した場合には錯誤による無効を承認している︒ここでいう要素の錯

①配慮義務の内容として︑どの程度の措置をとる必要があるかについては︑粘り強い議論が行なわれた︒メンガー