• 検索結果がありません。

今後の課題

ドキュメント内 U055-3 (ページ 78-83)

第 6 章 結論と今後の課題 69

6.2 今後の課題

携帯端末の音声インターフェイスやハンズフリー電話等への搭載等の実用化に 向けたうえで考えられる課題を挙げる.

まず,目的音声はマイクロホンアレイ平面の垂直方向から到来するという仮定 の妥当性が挙げられる.本論文で提案した手法は,この仮定が成り立つとした上 で,その条件を最大限に活用した手法であるが,使用者によっては端末の斜め方 向から発話することや,使用者が複数いて,必ずしも正面方向からの音声が目的 音声と成り得ないことが考えられる.これに対しては,マイク間に伴う位相差を 利用して音声の到来方向を推定し,その方向に対して空間フィルタを形成すると いう方法が考えられるが,逐次到来方向を推定する枠組は処理量を増やすことに なるためトレードオフとなる.これに近い問題として,マイクロホンアレイ平面

をはさんで目的音声方向とちょうど反対の方向から到来する雑音は除去できない 点が挙げられる.提案手法によって,マイクロホンアレイ平面の垂直な成分のみ を抽出することが可能となるが,ちょうどアレイ平面の反対の方向からの雑音に は対応できない.通常の携帯電話の使用では,端末の背面は床に向けれていると 考えられるが,この条件は常に満たされるとは限らない.

次に,提案手法は非線型処理を加えることで,雑音抑圧性能を大幅に向上させ ているが,これによって生じる目的音声成分の欠損などの歪の問題が挙げられる.

欠損が大きくなるにつれて,処理後の音声はやせた音になってしまう.さらに,ノ イズの成分の消し残し成分はmusical noiseとなってしまい,人間の聴き心地を大 きく劣化させる.これに対しては,雑音抑圧処理の時点でmusical noiseを発生さ せないか,処理後の音声に対し,後処理として欠損した部分やmusical noiseを除 去する枠組を導入することが考えられる.さらに,musical noiseは音声認識の際 にはほとんど影響が無く,PESQにおいてもあまり影響は無い.しかし,人間に よる主観的な評価には顕著な影響を与える.したがって,musical noiseの度合を 計る客観的な評価尺度を提案することが重要である.

付 録 A 拡散性雑音のコヒーレンス 関数の導出

ここでは,2個の無指向性マイクロホンと,指向性マイクロホンに到達する拡散性 雑音のコヒーレンス関数の理論値の式を導出する.(※)導出は基本的に文献 [27]

の付録1に基づいた.

A.1 無指向性マイクロホン

図A.1に示すような2個の無指向性マイクロホンを設置した場合を考える.θ方

x d y

d c os

図 A.1 無指向性マイクロホンに到達する信号

74 付 録A 拡散性雑音のコヒーレンス関数の導出 向から波が到達するとすると,

y(t) =x(t−d

ccosθ) (A.1)

ここで,cは音速,dはマイク間距離である.したがって,信号x,yの相互相関 の周波数領域表現はSx(ω),Sy(ω)をそれぞれx,yの自己相関の周波数領域表現,

もしくはパワースペクトルとすると,

Sx(ω) =Sy(ω) (A.2)

であることから,

Sxy(ω) =Sx(ω)ej(ωdc ) cosθ (A.3) と表せる.したがって,コヒーレンス関数は以下のように表せる.

γxy(ω) = Sx(ω) E{ej(ωdc ) cosθ}

[Sx(ω) Sx(ω) ]2 (A.4)

= E{ej(ωdc ) cosθ} (A.5)

E{·}は期待値である.ここで,拡散性雑音を考慮しているため,球平面上で全て のθ方向とφ方向から等しい成分が到来すると仮定し,球積分を行う.

E{ej(ωdc ) cosθ}= 1 4π

Z φ=0

Z π θ=0

ej(ωdc ) cosθsinθ dθ dφ (A.6) ここでx= ωdc cosθと置換することで,

= 1

2ωd/c

Z ωd/c x=ωd/c

ejxdx (A.7)

= sin ( ωd/c )

ωd/c (A.8)

と求まる.これは一般的に良く知られている,拡散性雑音場でのマイク間隔dの 無指向性マイクロホン観測信号のコヒーレンス関数である.

x

y z

1 d

r

r 0

r 2

図 A.2 指向性マイクロホンに到達する信号

ドキュメント内 U055-3 (ページ 78-83)