• 検索結果がありません。

博士(工学)中垣 学位論文題名

N/A
N/A
Protected

Academic year: 2021

シェア "博士(工学)中垣 学位論文題名"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

     博士(工学)中垣 学位論文題名

音声の特徴抽出のための適応ラァイス分析と スベクトル制御に関する研究

学位論文内容の要旨

Z

  現在,音声情報処理の分野では,線形予測分析法が主流となっており,それを技術的な基盤と して,音声認識,合成,低ビット符号化などのシステムが構築されている。しかし,音声認識の 現状を考えると,特定話者あるいは有限語彙など機能を限定した小規模なシステムが実用化され ているにすぎな い。これにはいくっかの原因が考えられるが,そのーっに一括型ARモデルに 基づく線形予測分析法の分析精度の限界が指摘されている。

  本論文は,音声信号から正確でかつ音声認識に適した特徴を抽出する音声分析システムの構築 を行い,それらの有効性を実験により検証したものである。

  本論文ではま ず,従来の一括型ARモデルに基づく線形予測分析法と比べて高精度な分析が 可能なラティス 型ARMAモデルを用いた適応的 分析手法の開発を行ってい る。次に,適応的 分析手法の問題点を改善するために,非線形処理を用いた推定スペクトルの平滑化手法の開発を 行っている。最後に,実用の音声認識システムを構築するときに問題となる環境雑音の影響を軽 減することを目的とした音声認識向きスペクトル制御法を開発し,様々な条件下での実験,評価 を行っている。

  論文は全8章からなる。以下に,各章の概略を述べる。

  第1章では,本研究の背景および目的,従来の関連する研究の概要と当面する課題,本論文の 構成にっいて述べる。

  第2章と第3章では,高精度な音声分析システムを構築することを目的として,従来の一括型 ARモデ ルに よる 線形 予 測分 析法 を拡張 し,ラティス型ARMAモデルを 用いた適応的分析手 法を提案する。

  第2章 では ,ARMAモデ ルの 性 質を ラテ ィス 型ARMAモデ ルを中心に して述べる。はじめ に,最小二乗法 による推定ARMA係数と相関関数は,その対応が一意ではナょいことを示す。

こ の性 質に より ,ARMAモデ ルか ら低次 元ノモデルを求めるとき,同 じARMAモデルから異

(2)

な る 低次 元 モ デ ル が得 ら れ る こ とを 示 す 。 次 に ,3っ の予測 モデル に基づ くラテ ィス 型ARI¥4A モ デ ル の 構 造 と , 分 析 ア ル ゴ リズ ム を 示 す 。提 案 す る ラ ティ ス 型ARMAモ デ ル は ,規 格 化 に より 任意次 数のラ ティス モデ ルを最 小個数 のパラ メ一 夕で設 計でき ,非冗 長な特 徴表現が可能で あ る 。 次 に ラ テ ィ ス 型ARMAモ デ ル の 性 質 を 知 る た め ,3っ の 予 測 モ デ ル の う ち2っ の 後 向 き予 測モデ ルで得 られる 伝達 関数を 調ベ, その結 果, 後向き モデル の違い により ,モデルの伝達 関 数 が 等 し く て も , 係 数 が 異 な る ラ テ ィ ス 型ARMAモ デ ル が 設 計 さ れ る こ と を 示 す 。   第3章 で は , 第2章 で 示 さ れ た ラ テ ィ ス 型ARMAモ デ ル を 拡 張 し , 音 声 信 号 を 適 応 的 に分 析 す る手 法 を 提 案 する 。ARMAモ デ ル を 用 いて 音 声 信 号 の時 変 ス ペ ク トル を 推定す るため に必 要 な 規 範 モ デ ル の 入 カ の 推 定 法と ラ テ ィ ス 型ARMAモデ ル の 係 数 を 回帰 的 に 計 算 する 時 間 更 新式 を示す 。また ,従来 の適 応型ラ ティス 分析で は, アルゴ リズム の制約 上評価 関数に導入した 重み 係数を 動的に 設定す るこ とがで きず, 急峻な 変化 への追 従性に 問題が あった 。提案する手法 では ,分析 に用い る信号 に直 接重み 付けを する新 しい 重み係 数を導 入した ため, 信号の変化に合 わせ て重み 係数を 設定す るこ とが可 能であ る。重 み係 数の値 は規範 モデル の変化 の度合に対応し て 設 定ふ る 必 要 が ある 。 本 手 法 では , 固 定 重 み 係数 を 用 い たAR分 析 を 同 時に行 い,そ れを基 準に して規 範モデ ルの変 化点 を検出 する。 実音声 を用 いた分 析実験 により ,本手 法が従来の固定 重 み 係 数 を 用 い た 分 析 法 よ り 高 精 度 な 推 定 ス ペ ク ト ル が 得 ら れ る こ と を 示 す 。   第4章 と 第5章 で は , 適 応分 析手 法で 得られ る推定 スペク トルは 時間 依存性 が高く ,平滑 化処 理 が 必 要 で あ る こ と を の べ , 非 線 形 処 理 を 用 い た 平 滑 化 に っ い て 検 討 す る 。   第4章 では, 従来 の線形 フアル タによ る平滑 化で は,ス ペクト ルの時 間特 性が損 なわれ る問題 点が あるこ とを述 べ,非 線形 フアル 夕一の ーっで ある メディ アンフ アルタ を用い た平滑化を検討 する 。また ,特徴 パラメ ―夕 を独立 と見な した平 滑化 では, 元のス ペクト ル時系 列中に存在しな いス ペクト ルが得 られる 。そ のため ,スペ クトル に歪 みが生 じる可 能性が あるこ とを述べ,特徴 パラ メ一夕 と平滑 化フア ルタ を組み 合わせ た実験 をも とに, 歪みの 生じな い平滑 化にっいて考察 する 。その 結果, ラティ ス係 数を対 象とし,メディアンフアルタを用いて平滑化することにより,

時 間 追 従 性 を 損 な わ ず に 歪 み の 少 な い 平 滑 化 ス ペ ク ト ル が 得 ら れ る こ と を 示 す 。   第5章 では, 平滑 化によ り失わ れたス ペクト ルの 時間特 性を, 非線形 時間 伸縮す ること で回復 する 手法を 提案す る。平 滑化 によル スペク トル時 系列 にある 程度の 時間遅 れが生 じたとしても,

平滑 化後に 元のス ペクト ルの 時間パ 夕一ン を参照 して ,平滑 化スペ クトル を時間 伸縮すれば時間

(3)

トル時系列の時間特性を最も良く近似するように伸縮される。実音声による実験結果から,本手 法で はス ペ クト ルに 時間 的な乱れが生じる ことなく時間特性が改善さ れることを示す。

  第6章と第7章では,実用的な音声認識システムを構築するとき問題となる環境雑音や伝送路 の周波数特性の影響を軽減するため,音声認識に適したスペクトル制御法にっいて述べる。

  第6章では,拡張軸外スペクトルを用いたスペクトル制御法を提案する。環境雑音の影響はス ペクトルに均一に表れるものではなく,雑音の影響を受け易い部分と受けにくい部分があり,雑 音に影響を受けにくい部分を重み付けすることそ,雑音の影響を軽減できる。拡張軸外スペクト ルは ,制 御 対象 とな るARモデルをARMAモデ ルに拡張し,周波数領域で のーっのピークを 一組の極と零で制御する。そのため,スペクトルピークの鋭さとすそ野の傾きを同時に制御でき る。また,実音声に対するモデルの安定性を保証した制御パラメータの設定法に示し,白色雑音 を付加した音声や,周波数特性をもつフアルタに通した音声に対する音声認識実験から,提案す る手法の有効性を検証する。

  第7章では,音声分析の段階で,推定スペクトルから雑音成分を除去する方法を検討する。音 声信号をAR過程と仮定し,白色雑音が付加された場合のスペクトルの影響を考察し,白色雑 音が付加された音声信 号のスペクトルを正確に近 似するにはARMAモデルを用いる必要があ るこ とを 示 す。 その とき ,推 定 され たARMAモ デ ルで は,AR部 で信 号 成分 をMA部で雑音 成分を近似していると 考えられる。提案する手法では,第2章で示された,ARMAモデルの性 質を 利用 し て,ARMAモデ ルか らARモ デル に変 換 する とき ,AR部に 重 み付 けしてりダク ションすることにより,雑音成分を除去する。本手法を第6章で提案した拡張軸外スペクトルと 組み 合わ せ て使 用す るこ とにより,低SN比 の雑音環境下での認識性能 の改善をはかる。

  第8章 は 結 論 と し て , 本 論 文 に 述 べ た 研 究 を 総 括 し , 今 後 の 課 題 を 述 べ る 。

(4)

学位論文審査の要旨

  本論 文は, 音声の 自動 認識シ ステム の構築 を目 的し, その基 礎研究 として 音声信号の高精度な 分析 法なら びに音 声認識 に適 したス ペクト ル制御 法を提 案し ,それ らの有 効性を実験により検証 した もので ,全8章か ら構成 されて いる 。

  第1章 で は , 本 研 究 の 背 景 お よ び 目 的 , 本 論 文 の 構 成 に っ い て 述 べ て い る 。   第2章 で は , 最 小 二 乗 法 に よ るARMAモ デ ル の 係 数 推 定 法 と 推 定ARMAモ デ ル の 性 質 に っ い て 述 べ て い る 。 ま た , 最 小個 数 の 係 数 で設 計 さ れ る 最小 次 元 実 現 ラ ティ ス 型ARMAモ デ ルの 構成法 を示し ている 。

  第3章 で は , 第2章 で 示 さ れ た ラ テ ィ ス 型ARMAモ デ ル の 適 応 的 係 数 推 定法 を 提 案 し ,音 声 分 析 に 適 用 し て い る 。 こ の ラテ ィ ス 型ARMA分 析 手法 で は , 分 析 に用 い る 信 号 に直 接 重 み 付け をする 新しい 重み係 数を 導入し ており ,評価 関数に 導入 した従 来の重 み係数ではアルゴリズ ム の制約 上不可 能で あった 重み係 数の動 的な 設定を 可能に してい る。重 み係 数の設 定では1次 の 適 応AR係 数 の 値を 基 に 有 声 音 声と 無 声 音 声 の分 離 を 行 い ,別 個 の ル ール を適用 して重 み係数 の値 を変化 させて いる。 実音 声を対 象とし た分析 実験の 結果 より, 本手法 が従来の固定重み係数 を 用 い た 分 析 法 よ り 高 精 度 な 推 定 ス ペ ク ト ル が 得 ら れ る こ と が 示 さ れ て い る 。   第4章 では, 従来 の線形 フアル タによ るスペ クト ル平滑 化では ,スペ クト ル時系 列のも つ時変 特性 が損な われる 問題点 があ ること を述べ ,非線 形フア ルタ のーっ である メディアンフアルタに よる 平滑化 を検討 してい る。 また, 特徴パ ラメ― 夕を各 々独 立と見 なした 平滑化では,スペクト ルに 歪みが 生じる 可能性 があ ること を示し ,平滑 化の対 象と なる特 徴パラ メータと平滑化フィル タを 組み合 わせた実験により,歪みの生じなL.、平滑化にっいて考察を行っている。その結果,ラ ティ ス係数 を対象 とし, メデ ィアン フアル タで平 滑化す るこ とによ り,時 間追従性を損なわずに

次 彦

夫 勝

香 吉

信  

  喜

栃 小

永 新

授 授

授 授

   

   

(5)

す る 手 法 を 提案 し て い る 。提 案 手法で は,DPマッチ ングを 利用し て参照 スペ クトル 時系列 の時 間 特性を 最も良 く近 似する ように 平滑化 スペ クトル 時系列 の非線 形時間 伸縮 が行われる。時間伸 縮 は,個 々のパ ラメ 一夕時 系列を 独立に 時間 伸縮す る方法 と,パ ラメー タベ クトル毎にまとめて 時 間 伸 縮す る方 法の2っの 方法を 検討し ており ,実験 によ り平滑 化スペ クトル に時 間的な 乱れが 生 じるこ となく ,時 間特性 を改善 できる こと を示し ている 。

  第6章で は,環 境雑 音によ る認識 率の低 下を 防ぐた めに, 音声認 識の前 処理 として 拡張軸 外モ デ ル を 用 い たス ペ ク ト ル 制御 を 提 案 し てい る 。 提 案 する 手 法 で は , 制御 対 象と なるARモ デル をARMAモ デ ル に 拡 張し , 周 波 数 領域 で の ー っ のピ ー ク を 一 組 の極 と 零 で 制御 するた め,ピ ー ク の鋭さ とすそ 野の 傾きを 同時に 制御で きる 。更に ,実音 声に対 するモ デル の安定性を保証した 制 御パラ メ一夕 の設 定法を 示し, 白色雑 音を 付加し た音声 や,周 波数特 性を もつフアルタに通し だ 音 声 に 対 す る 音 声 認 識 実 験 か ら , 提 案 す る 手 法 の 有 効 性 を 確 認 し て い る 。   第7章で は,推 定ス ペクト ルから 雑音成 分を 除去す る方法 を検討 してい る。 白色雑 音が付 加さ れ た 音 声 信 号 の ス ペ ク ト ル を 正 確 に 近 似す る に はARMAモ デ ル を用 い る 必 要 があ り , そ の 場 合AR部 で 音 声 信 号 成 分 をMA部 で 雑音 成 分 を 近 似し て い る こ と を示 し て い ろ 。提 案 す る 手 法 で は , そ の 性 質 を 利 用 し てARMAモ デ ル か らARモ デ ル に 変 換 す る と き ,A!t部 に 重み 付 け を するこ とによ り, 雑音成 分の除 去を行 っている。本手法を拡張軸外スペクトルと組み合わせて,

低SN比の 雑音環 境下で の認識 性能の 改善 を行っ ている 。

  第8章 は 結 論 で , 本 論 文 に 述 べ た 研 究 を 総 括 し , 今 後 の 課 題 を 述 べ て い る 。   本 論文 の成果 は以下 のよう に要約 され る。

  (1) 従来 の 線 形 予 測分 析 法 と 比 べ て高 精 度 な 分 析が 可 能 な ラ ティ ス 型ARMAモ デ ル を 用い     た適応 分析手 法を提 案し た。

  (2) 適応分 析手 法の問 題点を 改善す るため に, 非線形 処理を用いたスペクトル平滑化手法を提     案した 。

  (3) 環 境 雑 音 の 影 響 を 軽 減 す る た め に , 音 声 認 識 向 き ス ペ ク ト ル 制 御 法 を 提 案 し た 。   こ れを 要する に本論 文は, 音声の 新し い分析 手法の 提案を 行い ,その 有効性 を理論ならびに実 験 の両面 にわた って 示した もので ,ディ ジタ ル信号 処理工 学なら びに音 声情 報処理工学に対して 貢 献する ところ 大な るもの がある 。

  よ っ て 著 者 は , 博 士 ( 工 学 ) の 学 位 を 授 与 さ れ る 資 格 あ る も の と 認 め る 。

参照

関連したドキュメント

   第6 章はコミューター航空の運用計画、スケジ ューリングについて論じた。理想的な運 航 スケ ジュ

   第 2 章で は、磁気 共鳴スペク トル分析 ( ESR , NMR )を 応用する

   第 2 章 はメカニ カルシ ステム一 般に見 られる構 造を利用 する方 法を統一的に述べたもの で ,力学 的エネル ギとい う巨視的

   第3 章 から第6 章は、コリャークの 自然環境に対する認識と適応対処のありようを民俗

   第 4 章で は,第2 章,および第3 章によ り得られた単一管内の振動

本論文はこれらの実験結果を解析し、それに基づぃて変態機構を考察した結果をま と め た も の で あり 、第 1 章 から 第6 章で 構成 される 。以 下に 各章を 要約 する 。

   第6 章では、 次世代型製 鉄プロセスの主要課題である、スクラップリサイクル につ いて述ぺている。熱効率、プロセス効率の良いシャフト炉について数学モデ

処理が可能であると述ぺるとともに,本研究て得られた知見を基礎に開発されたク