• 検索結果がありません。

学位論文題名Speech dereverberation based on multi―channel linear prediction

N/A
N/A
Protected

Academic year: 2021

シェア "学位論文題名Speech dereverberation based on multi―channel linear prediction"

Copied!
3
0
0

読み込み中.... (全文を見る)

全文

(1)

博 士 ( 情 報 科 学 ) デル ク ロア マ ーク

     学位論文題名

Speech dereverberation based on   multi ―channel linear prediction

(多チャネル線形予測を用いる音声残響除去)

学 位 論 文 内 容 の 要 旨

話 者か ら離 れた位置にある マイクロホンで収音した音声 は,室内残響の影響を受け て歪んだ信 号 にな る. この様な残響歪 みは,音声の特性や明瞭性を 劣化させ,自動音声認識や 電話会議な ど ,音 声処 理を用いるサー ビスの妨げになる,残響歪み を収音音声から取り除く方 法のーっに ブ ライ ンド 残響除去方法が ある.本論文では,多チャネ ル線形予測を用いる新しい 残響除去方 法LIME (Linearーpredictive Multi−input Equalization)につい て述べる,線形予測を用いる だ けで は, 従来技術と同様 に,残響歪みだけでなく音声 特性まで等化してしまう, いわゆる,

白 色化 問題 を生じる,LIMEの特徴は,音声特性を複数マ イクロホンの出力信号に共 通な特性と し て抽 出し ,抽出した特性 を一旦白色化された音声に付 与する事で,残響歪みの低 減された原 音声を回復 する点にある.

前 書き と用 語 説明 (第1章 )に 続き ,第2章 では 上記 音 声特 性の計算原理を 述べる,音声特性 は ,多 チャ ネ ル線 形予 測を 元に 得 られる射影行 列の特性多項式に一致する事 を示す.第3章で は ,室 の残 響時間が 長くぬると射影行列のサイズ も大きくなり,特性多項式 の計算精度が劣化 す る問 題を 取り上げ ,計算方法の簡略化を検討す る,残響時間O.3秒程度の 室を用いたシミュ レ ーシ ョン 実 験で は,2つ のマ イク ロホンを用い る方法で,20dB以上の残響 低減効果を得た.

第4章 では ,よ り長 い残 響 時間 に対 処するため, (3,4以上の)多数マイク ロホンを用いる方 法 を検 討す る.少数 のマイクロホンを使う場合, 各マイクロホンと音源との 間の信号伝達特性 の 類似 性は 高くなり (すべての伝達関数に共通な 非最小位相零点を生じ), 音声特性の推定精 度 は劣 化す る.この 問題は,多数のマイクロホン を利用し,伝達特性のばら っきを大きくする 事 によ って 回避・軽 減出来る.残響時間O:5秒程 度の室を用いたシミュレー ション実験では,

4つ 以 上の マイ クロ ホン を 用い る事 で,20dB以 上の 残響 低減 効果を得た.第5章では,残響と 雑 音源 のあ る環境へLIMEを適用する.単純に適用 すると,雑音を低減する事 は出来るが,音声 特性の推定 値に雑音特性が重畳し,周波数特性を持つ有色雑音の影響を取り除く事は出来なレ、,

音 声の 含ま れなぃ雑 音区間を検出し,雑音特性を 求め,上記の雑音特性の重 畳された特性から 差 し引 く事 に より 音声 特性 を求 め る処 理を 追加 した . 残響 時間O.2秒 ,SN比0dBの 室を用い た シ ミ ュ レ ー シ ョ ン 実 験 で は ,20dBの 残 響 低 減 効 果 と ,18dBの 雑 音 抑 圧 効 果 を 得 た . 本論文で述 べたLIMEは,(従来法では 回避する事が難しかった)音声の白色化歪みを起こすこと な く, 雑音 源の存在 する場合にも,遠隔収音され た音声に含まれる残響歪み を高精度に取り除 く方法であ る.残響や雑音のため適用 が難しかった環境(分野)へ,自動音声認識などの利用範 囲を拡大す る礎を成す計算原理と期待 される.

‑ 1491

(2)

学 位 論 文 審 査 の 要 旨 主 査

副 査 副 査 副 査 副 査

助教授 教授 教授 教授 教授

三好 荒木 長谷川 山本 宮永

正人 健治 美紀     強 喜一

     学位論文題名

Speech dereverberation based on   multi ーchannel linear prediction

( 多 チ ャ ネ ル 線 形 予 測 を 用 い る 音 声残 響 除 去)

  話者から離れた位置にあるマイクロホンで収音した音声は,室内残響の影響を受けて歪んだ 信号になる.この様な残響歪みは,音声の特徴や明瞭陸を劣化させ,自動音声認識や電話会議 など,音声処理を用いるサービスの妨げになる事が知られている,残響歪みを収音音声から取 り除く方法のーっにブラインド残響除去方法がある.本論文は,多チャネル線形予灘を用いる 新しい残響除去方法LIMEくLInealr‑predictive Multiーinput Equalization)について述べてい る.線形予測を用いるだけでは,従来技術と同様に,残響歪みだけでなく音声特性まで等化し てしまう,いわゆる,白色化問題を生じる. LIMEの特徴は,音声特性を複数マイクロホンの出 力信号に共通な特性として抽出し,抽出した特性を一旦白色化された音声に付与する事で,残 響歪みの低減された原音声を回復する点にある,

  前書きと用語説明(第1章)に続き,第2章では上記音声特性の計算原理を述べている.音 声特性は,多チャネル線形予測を元に得られる射影行列の特性多項式に一致する事が示されて いる,第3章では,室の残響時間が長くなると射影行列のサイズも大きくなり,特性多項式の 計算精度が劣化する問題を取り上げ,計算方法の簡略化を検討している,残響時間O.3秒程度 の室を用いたシミュレーション実験では,2つのマイクロホンを用いる方法で,20dB以上の残 響低減効果を得ている.第4章では,より長い残響時間に対処するため,(3,4以上の)多数 マイクロホンを用いる方法を検討しているー少数のマイクロホンを使う場合,各マイクロホン と音源との間の信号伝達特性の類似性は高くなり(すべての伝達関数に共通な零点を生じ),

音声特性の推定精度は劣化する.この問題は,多数のマイクロホンを利用し,伝達特性のばら っきを大きくする事によって回避・軽減されている.残響時間0.5秒程度の室を用いたシミュ レーション実験では,4つ以上のマイクロホンを用いる事で,20dB以上の残響低減効果が得ら れている..第5章では,残響と雑音源のある環境へLIMEを適用している.単純に適用すると,

雑音を低減する事は出来るが,音声特性の推定値に雑音特性が重畳し,周波数特性を持つ有色 雑音の影響を取り除く事は出来ない.この点に鑑み,音声の含まれない雑音区間を検出し,雑 音特性を求め,上記の雑音特性の重畳された特性から差し引く事により音声特性を求める処理 を追加している.残響時間O,2秒,SN比OdBの室を用いたシミュレーション実験では,20dB

1492

(3)

の残響低減効果と,18dBの雑音抑圧効果を得ている.

  本論文で述べたLIMEは,(従来法では回避する事が難しかった)音声の白色化歪みを起こすこ の残響低減効果と,18dBの雑音抑圧効果を得ている,

  本論文で述べたLIMEは,(従来法では回避する事が難しかった)音声の白色化歪みを起こすこ となく,雑音源の存在する場合にも,遠隔収音された音声に含まれる残響歪みを高精度に取り 除く方法である.残響や雑音のため適用が難しかった環境(分野)へ,自動音声認識などの利用 範囲を拡大する礎を成す計算原理と期待される.

これを要するに,著者は音声信号処理における残響除去手法に関する新知見を得たものであり,

その効果は音質改善にとどまらず,自動音声認識の認識率改善をはじめとして多岐にわたるも のである.よって著者は北海道大学博士(情報科学)の学位を授与される資格あるものと認め る.

1493

参照

関連したドキュメント

では,フランクファートを支持する論者は,以上の反論に対してどのように応答するこ

従来より論じられることが少なかった財務状況の

 この論文の構成は次のようになっている。第2章では銅酸化物超伝導体に対する今までの研

する議論を欠落させたことで生じた問題をいくつか挙げて

などに名を残す数学者であるが、「ガロア理論 (Galois theory)」の教科書を

Scival Topic Prominence

子どもの学習従事時間を Fig.1 に示した。BL 期には学習への注意喚起が 2 回あり,強 化子があっても学習従事時間が 30

自閉症の人達は、「~かもしれ ない 」という予測を立てて行動 することが難しく、これから起 こる事も予測出来ず 不安で混乱