• 検索結果がありません。

BGNEstimator

ドキュメント内 HARK Document (ページ 136-140)

第 6 章 ノードリファレンス 45

6.3 Separation カテゴリ

6.3.1 BGNEstimator

表6.33:BGNEstimatorのパラメータ表 パラメータ名 型 デフォルト値 単位 説明

DELTA float 3.0 パワー比閾値

L int 150 [frame] 検出時間幅

ALPHA S float 0.7 入力信号の平滑化係数

NOISE COMPENS float 1.0 定常ノイズの混入率

ALPHA D MIN float 0.05 平滑化係数の最小値

NUM INIT FRAME int 100 [frame] 初期化フレーム数

出力

NOISE POWER :Matrix<float>型. 推定された定常ノイズのパワースペクトル.

パラメータ

DELTA :float型.3.0がデフォルト値. パワースペクトルの周波数ビンに音声などの目的音が含まれてい るかどうかの閾値.大きい値にすると,より多くのパワーを定常ノイズとみなす.

L :int型.150がデフォルト値. 目的音が含まれるかの判断基準となる,過去最もパワーの小さいスペクト ル(定常ノイズ成分)を保持する時間.AudioStreamFromWaveノードなどで指定されるADVANCEパラ メータ分のシフトが行われる回数として指定する.

ALPHA S : float型.0.7がデフォルト値. 入力信号を時間方向に平滑化する際の係数. 値が大きいほど,

過去のフレームの値の重みを大きく平滑化する.

NOISE COMPENS :float型.1.0がデフォルト値. 目的音が含まれないと判断されたフレームを,定常ノ イズとして重みづけして加算する(定常ノイズの平滑化)ときの重み.

ALPHA D MIN :float型.0.05がデフォルト値. 定常ノイズの平滑化処理で,目的音が含まれたと判断さ れたフレームのパワースペクトルを加える際の最小重み.

NUM INIT FRAME :int型.100がデフォルト値. 処理を開始した際,このフレーム数だけ目的音の有無 判定を行わず,全て定常ノイズとみなす.

ノードの詳細

以下では,定常ノイズを導出する過程を示す.時間,周波数,チャネルインデックスは 表6.1に準拠する.

導出のフローは,図6.45の通り.

1. 時間方向,周波数方向平滑化: 時間方向の平滑化は,入力パワースペクトルS(f,ki)と,前フレームの定 常ノイズパワースペクトルλ(f −1,ki)の内分により行う.

Smsmo,t(f,ki) = αsλm(f −1,ki)+(1−αs)Sm(f,ki) (6.19) 周波数方向の平滑化は,時間平滑化されたSmsmo,t(f,ki)に対して行う.

Ssmom (f,ki) = 0.25Smsmo(f,ki1)+0.5Smsmo(f,ki)+0.25Ssmom (f,ki+1) (6.20)

表6.34:変数表

変数名 対応パラメータ,または,説明

S(f,ki)=[S1(f,ki), ...,SM(f,ki)]T 時間フレーム f,周波数ビンkiの入力パワースペクトル λ(f,ki)=[λ1(f,ki), ..., λM(f,ki)]T 推定されたノイズスペクトル

δ DELTA,デフォルト0.3

L L,デフォルト150

αs ALPHA S,デフォルト0.7

θ NOISE COMPENS,デフォルト1.0

αmind ALPHA D MIN,デフォルト0.05

N NUM INIT FRAME,デフォルト100

BGNEstimator module

1. Time, Frequency Smoothing

2. Update Minimum Energy

3. Background Noise Estimation

S (f, k

i

): INPUT

λ ( f, k

i

): OUTPUT S

smo

(f, k

i

)

S

min

(f, k

i

)

図6.45:定常ノイズ推定の流れ

2. 最小エネルギーーの更新: 目的音の有無を判定するため,処理を開始してからの各チャネル,周波数ビン についての最小のエネルギーーSminを計算する.Sminは,各チャネル,周波数ビンごとの,処理を開始して からの最小エネルギーーで,Stmpは,Lフレームごとに更新される暫定最小エネルギーーである.

Stmpm (f,ki) = 

 Smsmo(f,ki), if f =nL

min{Stmpm (f−1,ki),Smsmo(f,ki)}, if f ,nL (6.21) Sminm (f,ki) = 

 min{Stmpm (f−1,ki),Smsmo(f,ki)}, if f =nL

min{Sminm (f −1,ki),Smsmo(f,ki)}, if f ,nL (6.22) ただし,nは任意の整数である.

3. 定常ノイズ推定:

1. 目的音有無の判定

以下にいずれかが成り立つ場合,該当する時間,周波数に目的音のパワーは存在せず,ノイズのみがあ るとみなされる.

Smsmo(f,ki) < δSminm (f,ki)または (6.23)

f < Nまたは (6.24)

Smsmo(f,ki) < λm(f −1,ki) (6.25)

2. 平滑化係数の算出

定常ノイズのパワーを計算する際に用いられる平滑化係数αdは,

αd = 



1

f+1, if (f1+1 ≥αmind ) αmind , if (t+11 < αmind )

0 (目的音が含まれるとき)

(6.26)

として計算する.定常ノイズは以下の式によって求める.

λm(f,ki) = (1−αdm(f −1,ki)+αdθSm(f,ki) (6.27)

ドキュメント内 HARK Document (ページ 136-140)