第 6 章 ノードリファレンス 45
6.3 Separation カテゴリ
6.3.1 BGNEstimator
表6.33:BGNEstimatorのパラメータ表 パラメータ名 型 デフォルト値 単位 説明
DELTA float 3.0 パワー比閾値
L int 150 [frame] 検出時間幅
ALPHA S float 0.7 入力信号の平滑化係数
NOISE COMPENS float 1.0 定常ノイズの混入率
ALPHA D MIN float 0.05 平滑化係数の最小値
NUM INIT FRAME int 100 [frame] 初期化フレーム数
出力
NOISE POWER :Matrix<float>型. 推定された定常ノイズのパワースペクトル.
パラメータ
DELTA :float型.3.0がデフォルト値. パワースペクトルの周波数ビンに音声などの目的音が含まれてい るかどうかの閾値.大きい値にすると,より多くのパワーを定常ノイズとみなす.
L :int型.150がデフォルト値. 目的音が含まれるかの判断基準となる,過去最もパワーの小さいスペクト ル(定常ノイズ成分)を保持する時間.AudioStreamFromWaveノードなどで指定されるADVANCEパラ メータ分のシフトが行われる回数として指定する.
ALPHA S : float型.0.7がデフォルト値. 入力信号を時間方向に平滑化する際の係数. 値が大きいほど,
過去のフレームの値の重みを大きく平滑化する.
NOISE COMPENS :float型.1.0がデフォルト値. 目的音が含まれないと判断されたフレームを,定常ノ イズとして重みづけして加算する(定常ノイズの平滑化)ときの重み.
ALPHA D MIN :float型.0.05がデフォルト値. 定常ノイズの平滑化処理で,目的音が含まれたと判断さ れたフレームのパワースペクトルを加える際の最小重み.
NUM INIT FRAME :int型.100がデフォルト値. 処理を開始した際,このフレーム数だけ目的音の有無 判定を行わず,全て定常ノイズとみなす.
ノードの詳細
以下では,定常ノイズを導出する過程を示す.時間,周波数,チャネルインデックスは 表6.1に準拠する.
導出のフローは,図6.45の通り.
1. 時間方向,周波数方向平滑化: 時間方向の平滑化は,入力パワースペクトルS(f,ki)と,前フレームの定 常ノイズパワースペクトルλ(f −1,ki)の内分により行う.
Smsmo,t(f,ki) = αsλm(f −1,ki)+(1−αs)Sm(f,ki) (6.19) 周波数方向の平滑化は,時間平滑化されたSmsmo,t(f,ki)に対して行う.
Ssmom (f,ki) = 0.25Smsmo(f,ki−1)+0.5Smsmo(f,ki)+0.25Ssmom (f,ki+1) (6.20)
表6.34:変数表
変数名 対応パラメータ,または,説明
S(f,ki)=[S1(f,ki), ...,SM(f,ki)]T 時間フレーム f,周波数ビンkiの入力パワースペクトル λ(f,ki)=[λ1(f,ki), ..., λM(f,ki)]T 推定されたノイズスペクトル
δ DELTA,デフォルト0.3
L L,デフォルト150
αs ALPHA S,デフォルト0.7
θ NOISE COMPENS,デフォルト1.0
αmind ALPHA D MIN,デフォルト0.05
N NUM INIT FRAME,デフォルト100
BGNEstimator module
1. Time, Frequency Smoothing
2. Update Minimum Energy
3. Background Noise Estimation
S (f, k
i): INPUT
λ ( f, k
i): OUTPUT S
smo(f, k
i)
S
min(f, k
i)
図6.45:定常ノイズ推定の流れ
2. 最小エネルギーーの更新: 目的音の有無を判定するため,処理を開始してからの各チャネル,周波数ビン についての最小のエネルギーーSminを計算する.Sminは,各チャネル,周波数ビンごとの,処理を開始して からの最小エネルギーーで,Stmpは,Lフレームごとに更新される暫定最小エネルギーーである.
Stmpm (f,ki) =
Smsmo(f,ki), if f =nL
min{Stmpm (f−1,ki),Smsmo(f,ki)}, if f ,nL (6.21) Sminm (f,ki) =
min{Stmpm (f−1,ki),Smsmo(f,ki)}, if f =nL
min{Sminm (f −1,ki),Smsmo(f,ki)}, if f ,nL (6.22) ただし,nは任意の整数である.
3. 定常ノイズ推定:
1. 目的音有無の判定
以下にいずれかが成り立つ場合,該当する時間,周波数に目的音のパワーは存在せず,ノイズのみがあ るとみなされる.
Smsmo(f,ki) < δSminm (f,ki)または (6.23)
f < Nまたは (6.24)
Smsmo(f,ki) < λm(f −1,ki) (6.25)
2. 平滑化係数の算出
定常ノイズのパワーを計算する際に用いられる平滑化係数αdは,
αd =
1
f+1, if (f1+1 ≥αmind ) αmind , if (t+11 < αmind )
0 (目的音が含まれるとき)
(6.26)
として計算する.定常ノイズは以下の式によって求める.
λm(f,ki) = (1−αd)λm(f −1,ki)+αdθSm(f,ki) (6.27)