谷口亜紀子* 坂井良広**
A study on the time domain blind source separation considering multiple sources Akiko Taniguchi Yoshihiro Sakai*
The study tries the generalization of Jutten s algorithm to get the performance of separation in the presence of multiple sources. We construct the separation circuit with 3 input and output for the mixing field with 3 sources, and evaiuate the ciTcuit. The circuit is constructed in the time domain, and the structure is recursive type without the requirment of post−processing. And the circuit adopts the correlatioll as the separation criteria.
Key words: blind source separation,adaptive signa1 processing
1 はじめに
人間は複数の人の話声の中から、特定の人の話だ けに聞き耳をたてることを自然に行うことができ
る。カクテルパーーティー効果と呼ばれる聴覚のこの 機能を工学的に実現させることは、例えば音声処理 の応用分野における音声認識の点で極めて有効であ る。工学的な実現は、人間の耳により近づいた音声 認識センサを実現することになる。例えば機械論が 著しく大きな工場内において人の声をマイクで拾う 際、人の声を機械音と分離さぜて録音したり、会議 における録音などにも適応できる。他に電気通信や 医療信号処理、人間型ロボットの耳となる音声認識 システム等応用範囲も広く、信号分離問題は現在も 様々な方面から様々な方法が研究されている。
信号分離を実現する際、その対象すなわち信号や それが混合される環境に関する知識を必要としない ほうが融通性が高い。このような条件で実現する分 離をブラインド信号分離と呼ぶ1)。Juももenらは図 1に示すように、ブラインド信号分離法に基づき時 間領域における再帰型構造の分離回路を構成し、高 次統計量を分離の規範として回路を適応的に学習さ せる方法を提案し、音源数が2の場合において分離 の効果を示した3)。図でX1,X2は音源、 Yl,Y2は マイクで集音した信号、51,52は分離された信号、
.412,A21は混合の特性を表す。臨検:討では、音源が 多数存在する場合においても分離効果が得られるよ う、Jutt,enらの検討の一般化を試みる。その第一
平成13年8月31日受付
*情報工学科卒業生
(現在NECフィールディング株式会社)
**情報工学科
段階として音源の数が3の場合に対応可能な回路を 構成し、動作の評価および、それに基づいて一般化 に向けた課題の検討を行なう。本検討で用いる分離
rm m友什口‡巨日定石十台「忍繍丁田フし身午ナM,》 弟名加浮田k,Tソ、亜>1 りのゴロホドす よかミハなこ ロ ホて へ みノしニゆしス ハね り
ない再帰型構造とし、分離規範として計算量、デー タ量の点で優位な相関を使用する。
2ミXL一
2ξ磐
図1:音源分離の概念図
Y■ S1
7
Fi且ter C(z)
Y2 S2
2 信号分離の原理
2.1 畳み込み混合モデル
Source X,(n) ]t(n> Yl(n) Xぎ(の
A,,(z)
Sじ国Bsor艮
↓匂 叢ぢ
Sense[2
亀ぢ
図2:単純化された混合モデル
Y玉(n)
Sensor 1
Serisor 2
71個の未知信号源を要素とする71次ベクトルを x(t)とし、センサアレイへの伝達を考える。ノイ ズは発生しないものとし、線形の動作を仮定する
と、センサ出力すなわち観測ベクトルy(t)は次式
となる。
Y(t)= A(t)*X(t) (1)
ここでA(t)は未知の線形ブイルタによる混合行列 である。*は畳み込みを示す。
津山高専紀要第43号 (2001)
フィルタA(t)がFIRフィルタによりモデル化 できると仮定すると、2領域において
Y(の=川2)x(の (2)
2.2 分離回路の構成
ここで信号源およびマイクの数を2に限定して考 える。厳密には図2左側にあるように音源X1と近 接マイク聞にも伝達関数Anが存在するが、これ を含めた音源xrを仮定すれば図右側にあるような 単純化されたモデルとなり、混合は
陽(の=瓦(z)+ムゴ(のXブ(の (3)
と表される(i≠ブ,∀卯∈{1,2})。
目的は観測y(のの線形フィルタリングにより原信 号を推定することであり、その出力は
5ゴ(之):=Yi.(2:)一←・Gゴ(之)}1・(■) (4)
と表せ(i≠ゴ,∀ i,ブ∈{1,2})、次式を得る。
S(g) =C(:・ )A(;・ )X(z) = H(:・ )X(x) (5)
XI Yエ Sユ
A(z) 1 1 C(z)
X2 一 Y:, 一 S2
信号源 観測信号 推定信号
#t, H(Z) g.,,
図3:信号分離の原理
ec 3に示すようにH(のは原信号から出力までの 全体を表したフィルタ行列で∬(の=C(の双ので
ある。
H(z)一 i幽晦( ))(ん}♂11(2))
一(1+0・2(のん、(9C2i(:・ ) 十 AL,i(z))鵡塊舗)
(6)
フィルタ且頭のが1と等しいと考えたのと同様に、
ここで(%(のも1と等しいと仮定している。
にあたり、出力信号がL次のFIRフィルタを通過 し入力に加算される特徴を持つ。この回路の出力は ゐ
5幽幽(・)一Σ ・i」 (L )5}・ (n−k)(7)
た=0 で表され、全体の伝達関数は
R「(之)=0(9)A(z) (8)
なので、砧2,C21を用いて表すと次のようになる。
1
∬(の ;
1−0・2(の02・(の
・(1 一 Cl ・一一.,〈2・ )AL)1(zん・(z)一〇2・(の)か㌫潔))
(9)
この式とqゴ(⇒= Aij(のより、
012(之)= A12(之),σ2・(の=ん1(勾 (10)
が得られる。これが再帰型での分離解である3)。
H{z}
畿・も
魚£
■︐■■躍︐■■︐︐■︐︐■■︐﹁︐O■■■・■■・....顧■幽.馳曜︐ 十●﹁﹁
㈲
②
1Y︑・
十3︐8︸﹁..・■・︐.■︐︐・8︐︐︐︐︐﹁︐暫● ■■■■.. ︐︐
12
21
A
A
燭ムダ琴・婆 ■②量髄竃●︐.◎﹂■■■.■.8︐置︐︐響..・・︐■︐.=.罵噸噸・⁝⁝⁝⁝⁝⁝⁝i・⁝・⁝⁝露︑ .︐仁
図4:分離の基本概念(再帰的構造)
2.32 0次項の例外処理
以上の検討ではフィルタの各次数について同じ扱 いであるが、実現上0次項だけは別計算を要する。
例えば図5においてS1(0)を求めたいとき、つま り最初に算出される0次項の出力信号は、52(0)と Cl 2(0)との畳み込みの結果を必要とする。このと
Y,(o)
十
S i(O)
Filter Ci2(O)
Filter C2i(O)
2.3 再帰的構造を持つ分離回路
信号分離は後処理不要な再帰型構成で実現した。
2.3.1 再帰型分離回路および分離解
Jutitenらの提案による再帰型構城の分離回路と 分離解について述べる。これは図4のC(:)の部分
十Y,(o)V S,(o)
図5:分離部での0次項計算
き52(0)も同じく算出前であり、やはり5 1(O)と C12(0)の畳み込みの結果を必要としている。つま り、これでは出力はどちらも求めることができない。
1次項以降はこの問題は関係なくなるが、このよ うに0次項だけは別方法の例外処理を考える必要が
ある。そこで、分離部の構成と等価になるように0 次項の計算を次の2つの式で表す。
Yi (O) 一 Ci 2(O)S2 (O) = Si(O)
︷
Y2(O) 一 C2 i(O)Si(O) = S2(O)
(11)
最大3の場合に対応可能な回路を構成した。Jutten らの検討の構成で、音源が2を越える多数となった 場合は、3番目以降の音源が係数更新の妨害となっ て、分離性能が低下する。そこで多信号に対応する 一般化の第一段階として次節で述べる3信号での混 合、分離について検討を行うことにした。
3 分離基準
出力信号は(10)式の条件を用いることで求めら れる。しかしブラインド分離では伝達関数は未知 なので、それを推定する方法または基準が必要とな る。Jut七ellらは分離の規範として独立基準を用い たが、本研究では演算量等の観点から2次統計量
(相関)を用いた。以下これについて述べる。
3.1 独立基準
伝達関数の推定が完全であれば推定出力信号Si,5ゴ は互いに独立となり、そのクロスキュムラントも 0となる。Jut,tenらは下記に示すように4次クロ スキュムラントσ・UM3/が0になることを分離の 基準に用いた3)。ここで亀,5ゴを平均0の信号、
.Mlm個,5ゴ)=E(lnmsr・sL・tvj)をく1十m)次のクロスモー メントとする。
C。m31(s・iJ5ゴ)=M3・(5ゼ,5ゴ)
一3M2・(s・i,5ゴ)M・・極8ゴ)
:O (12)
3.2 無相関基準
演算量や評価値の安定性の観点から、本検討では 2次統計量に基づく分離基準を用いた。乞≠」に対 する信号源蝋孟)とのゴ(t)が無相関な定常ランダム 過程で平均が0であると仮定すると、系の推定が完 全であれば、推定された信号は統計的に無相関であ り、次の様になる。下記でE{・}は期待値を表す。
E{si(t)s2(t 一 T)} = O
4 多信号化の検討
4.1 3入力分離回路の必要性
VT
4.2 3信号への対応
ミ
②分 Y,
二︑璽
泓
雑令
Y,
Filter C(z)
り
図6:3信号2入力の概念図
Si
制
s,
婦
図6に示す様に通常室内では雑音が混入し、出力 された音声に雑音が残ってしまう。図7にあるよう に信号数に対応した入出力をそなえ、雑音を一つの 入力と考え分離することによって、音声に含まれる 雑音を分離出来ると考えられる。また分離回路の実 現のためには回路構成と係数更新の2つについて検 討する必要がある。
S、
Y、
、
wユQをX2
2縮一フ
@ C
@ d
@ e
@ f
Y2 趨肚erC(z)
舟Sz舟S3
レ
X3
Y3
嚇
(13) 図7:3信号3入力の概念図 4.3 分離回路の構成
従来の研究においては音源が2つであると考え2 次ベクトルで演算していたため、センサ(マイク)の 数が2である場合に対応していた。しかし音源は必 ずしも2つであるとは限らない。そのため、本検討 では、音源が多数存在する場合においても分離機能 が得られる様、Jut,tenらの検討をベースとしてそ の一般化を試みた。その第一段階として音源の数が
図8に分離回路の構成を示す。各Cは各畳み込 み経路がもつ係数である。係数については次で述
べる。
式(7)と同様に出力は以下のようになる。
4
︵1
71 ¢ 勘 @ 吻NΣ周
研 頭 ラ n 一 α た 渉 @ 鰯NΣ属 紛≠
.フ≠
.β3 1 〜
=
た
・あ︵
=
ラα
52
津山高専紀要第43号 (2001)
フィルタ部分(遅延≧1)の計算は通常の畳み込 み演算となるが、2.32に示す様に遅延=0の項は 例外処理を必要とし、別に考える必要がある。
lft alを加算し、信号が極端に小さい時の不安定を防 止した。d値の設定については後述する。なお、 k一 は分離回路フィルタ係数のタップ位置、μは逐次更 新の速度を決定する係数である。
5ゼ(t)= yi(孟)一%(0)5ゴ(の一。鼠0)5k,(t)
毒聯+齢嚇回舳囲)一卿)+〃継継)}(16)
れニユ れニユ
( i,ブ,k=!〜3,ゼ≠ゴ≠k) (15)
同時刻の出力は確定しないので等価回路に置き換え て計算した。等価回路に置き換えるには各信号の出 力を求める式で表現し、それを代入することにより 得ることができる。得られた計算式を付録に示す。
この式により、同時刻の他の出力を用いないで表す ことができるので矛盾が発生しない。
坊㈹ Si{t)
C12
C13
C21
S2{t)
このアルゴリズムを図8に示した分離回路に適用 し、逐次的に分離解に至る過程を観測し動作を確認 した。また更新式単独で簡単な検証も行なった。こ れは混合系の係数をα12(1)=0、5に設定して混合系 と分離回路を稼働させ、対応すべき分離回路の係数 c12(1)の値を変化させた場合の評価量nzll(1,2);
E{s, (n)5ゴ(η一た)}の変化を求めた。これを図9に
示す。図に見られるように係数c12(1)に対して単 調減少し評価量nτ11(1,2)が零になる点は分離解と 一致するので、この評価量は更新量として妥当で
ある。
h(O
ぬ㈹
C23
C31
C32
S3{t)
噂・2】[1]
xle
le
s 6 4 2 0
−2
図8:3信号の分離
4.4 係数更新
前節で信号分離の基準について述べたが、これに 基づく推定系の解は互いに推定系、自身を含んでいる ため、混合系が全く未知の場合は解が得られない。
.}uttenは解に到達する方法として、分離回路の係 数更新による逐次推定アルゴリズムを提案した3)。
係数更新には独立基準そのものを用い、入力信号数 は2であった。これは一般の適応フィルタにおける 逐次推定2)と同様に、解に到達すれば独立基準が 0になって係数更新が止まる性質を持ち、実験的に 動作が確認された。なお時間領域での逐次処理のた め推定対象の変動に対応可能である。
本検討では文献3)の逐次推定アルゴリズムから 類推して式(16)の逐次推定アルゴリズムを用いる ことにする。式(16)は本検討の目的に合わせ、3入 力への拡張および独立基準から相関基準への 変更を 行なったものである。3入力への対応は、3信号中 の2信号Si,場の相互相関を求め、』その2信号に関 与するフィルタqゴの係数を更新することとした。
更に信号レベル変動に対する更新安定化のため、対 象信号の自己相関で正規化した。その際に微小な定
5
一e
−10
a,s
おssh
図9:c12(1)と相関との関係
シミュレーション
\㌔
e12[il
シミュレーションには前節で述べた構成法で分離 回路を構成し、係数更新を行なった。
各パラメータは更新速度係数μ=0.0001、混合
係数吻[1]=O.5, aij [2].・ O.3,α碗31;0.1、分母加
算:項は何も指定がない場合d=10−10を用いた。混 合系のシミュレーションは他信号がフィルタを通過
したものと自信号の和で表す。音声サンプルは女声 でch1.フランス語、 ch2.英語で、長さは882000サ
ンプル、サンプリング周波数は44.1kHzである。
雑音にはレベルが一定である白色雑音を用いた。プ ログラム中では乱数によって発生させた。評価に は出力信号への洩れこみである残留クロストーク
「Sn xn i2、係数更新時に発生する係数誤差、試聴、
各信号波形を用いた。
実音環境を把握するために、シミュレーションに 用いた音声サンプルを平均的と思われるレベルで スピーカーで再生し、騒音計で信号レベルを測定し
た。音声レベルa11=63[d.BA],z 2=62[clBA]、計 算機のノイズの騒音レベル:: :3=47[dBA]となり、
SN比は15[dB]であった。一般に例えば図書館にお ける騒音レベルは40〜45[dBA]といわれており、
今回測定した騒音レベルは妥当である。次に実音環 境に対応させるために音声サンプルのレベルを計 算した。まず音声サンプルth 、1,x2の各最大値を求 め、その1/1000以上のレベルの信号を有音区間と した。有音区間の平均値を計算によって求めると、
xl=4.3×10『2,¢2==2.4×10−2であった。また 実音環境のSN比に対応させるためシミュレーショ ン上でのSN比を17.7[dB]とし、その結果雑音の 平均値をx 3=5.5×10−4に設定した。
5.1 3信号3入力と2入力の比較
5.3 3入力が2回忌と1雑音の場合
音声入力時の概略評価を行なった。更新速度係数 μは0.0001とした。そのときの各信号の波形を図 12に示す。上が音源信号z・1、中が観測信号Y1、下 が出力信号S1である。 MlとY1を比較すると、音
40
︻ロ蕊一こ⑪∈婁Oこ∈層
30
20
X x
O improvement X TerfuDe rate
o x 1σ6 1σ5 to4
れめ うねが
図11ニパラメータ依存性
冒2董︒ミ宥︼
①駕﹂Ooコ℃o﹂
0 6
50
前節で述べた様に、3入力分離回路の必要性を裏 付けるために、3つの信号が存在する場合、2入力と 3入力ではどのような違いが生じるかを検討した。
雑音が重畳した観測信号は各場合において同じ波形 になっていた。白色雑音入力時のクロストークを図 10に示す。縦軸のクvストークは(5i(り一卿))2
O.OOI
捌=
40
響系での混合のため信号がなかった時刻にも信号が 発生している。Y1とs1を比較すると、洩れこみが あった時刻での信号がほぼなくなっている。そして zエと51はほぼ同じ波形となり、信号の分離はおお むね動作していると言える。ただ試聴の結果、若
臼︸一 ココしコ 兀へ︑﹂ 脚…э
酬 σo
σ
te・Oア
:、昌昌晒耀幅
らゆロ て む ぬ まロ とき ヨ
図10:3信号2入が智3入力の比較
報■ヨ言E昭召⊇一五E冊弾η3鴇αE噂
1 1
5Dり lnl二11「1 「5CIO 200D 250D 30n口
sanlple:
D 5LbC]
IDOU 150U :arnpCes
2〔ICJ〔」 251旧 30〔1〔L
を計算したもので、単位は振旦の2乗に相当する。
これからわかるように2入力と3入力のクロストー クは大きく違い、2入力はクロストークが殆んど減 少しないので、分離性能は低いと考えられる。3入 力の方は2入力の!/100程度まで減少し安定した レベルに収束している。このことから3入力にした 効果が示された。
5.2 3入力がすべて雑音の場合
更新速度係数μ=0.0001、相関平均長は4、分母 加算項d=10『loという各パラメータでシミュレー ションを行なった。μの値により残留クmストーク が変化することから、パラメータ依存性を調査し た。調査にはμの変化における改善量と減少速度 を用いた。これを図11に示す。大まかな傾向とし て改善量はμが大きくなると少なくなり、減少速度 はμが大きくなると速くなる。このことから更新 速度係数μには最適値があることがわかった。
Mimu:Jlilan]
500 10F)u 15udll 2000 2500 ・i Oclbd)
sarrTp es
図12:音声を入力した場合の波形 干のクロストークが感じられた。700〜800では英 語が混入しているのがわかった。また、2300では ゴボッという大きな雑音が混入していた。全体的に ザーという雑音が混入している。
そこでこの場合の残留クロストークを観測した。
その変化を図13に示す。図13からわかるように、
残留クロストークは多くの箇所で減少し、1/100以 下のレベルに収束する傾向があるが、時々増大があ
り不安定な動作を示している。この増大の時刻は試 聴時に雑音が多く混入している時刻と対応してい る。遠心にこの原因調査を述べる。また、入力波形 と出力波形を比較すると1500辺りがひどく違う。
津山高専紀要第43号 (2001)
入力波形では自信号の音声データがある、ないに関 わらずクmストークが変動せず大きいのに対し、出 力波形には自信号を考慮した係数更新を行なうの で、音声データがない時刻のクロストークは小さい ということがわかる。全体的に入力クロストークよ りも残留クロストークの方が小さいので、分離でき ていると言える。2入力と3入力を残留クロストー クで比較してみると、初期状態、通常状態どちらに おいても一桁程度違い、3入力の方が分離性能が高 い。波形の変動はほぼ同じ動きをしている。係数
t
.﹇銑
一}
国朧
団団PP㎞頃
0 一.屡鰯α研邑轟
一孟ーーー..⁝iIーー員ーーー 幣⁝ーー1一⁝ 二二川月膠冒塚1選﹁
︐︐ヤ
回路の係数。を。=η×αで与え、nは0.7〜0.99 の問で設定した。完全に分離される状態は7}=1 であり、A;Cである。各llにおけるクロストー クと試聴によって許容範囲を調査した。その結果、
71.=0.99では入力信号と出力信号の波形がほぼ完 壁に一致し、クロストークもπニ0,98より安定し ていた。試聴しても出力信号は完壁に分離されてい た。雑音の出力もほぼ一定レベルで音声が混入して いなかった。以上のことから1α一c12で定義される 係数誤差の許容範囲は、0.0001ということになる。
r
o宅
。.ot
o.oot
OOOOI
ie−oS
le−06
一轡轄摂員︐ 冒
1e−07
む らサロ れロむ ヨき むむむ ヨニ き
図13:音声を入力した場誉あ入出力クロストーク
寸い
15 x
1il白h9_1u7δ 翼
05 F一
o
x . 1
ぬ .遜
冒険.
Xs xX
屑ξ、
X幣
・轟〆蓼一溜一x
一〇 r」 F・
lx
ゲ1.ξΨ . x E
・・ヤ
翼 x》〆
口試、、.
聯1憂「』 藁 1i
賢鉾
欺叛旗.一一×,
ド
更新式は2入力の場合を単純に3入力にしただけで は、残留クロストークが変動し不安定になる。この ため係数誤差も不安定になる。この場合の出力信号 を試聴すると分離しきれず雑音が残っているのがわ かる。これは係数誤差が充分に減少しないことが、
クロストークー時増大の原因になっていると考えら れる。入力クロストークより残留クロストークの方 が大きくなる箇所は自分自身の入力信号レベルが大 きい。対策として、係数誤差を減少し、クロストー クを減らすことが必要である。
5.4 クロストーク増大の原因調査
前節にあるようにこのアルゴリズムは雑音入力に 比べて音声入力では分離性能の劣化が見られる。特 性改善の検討のため、音声入力時の分離回路動作と 係数更新式に要求される精度を調査した。
5.4.1 音声信号に対する分離回路動作の検証 分離回路に混合系と同一係数を与えると完全な 分離動作が期待される。図14にその際の出力信号
s P,.s2のデータ散布図を示す。これからわかるよう に、信号は互いに独立し、無相関になっている。以 上のことから分離回路自体は音声入力に対しても特
に問題なく動作していることがわかる。
5.4.2 係数誤差
係数誤差改善を検討する際に要求量がわかれば指 標となるので誤差許容値を調査した。ここでは分離
■ 纂 .
・1
−1、C. ・1 ・0.5 e O.5
さモ
図14:Slとs2のデータ散布図
5.4.3 自信号のクロストークへの影響
上にも述べたように、図13の残留クロストーク が入力クロストークを越える時刻の出力信号は雑音 が多大に混入され、非常に聞きとりづらい。試聴に よれば、その時刻には遅延した自信号が雑音として 混入されている。更に3入力残留クロストークが2 入力残留クロストークを越える時刻では、多くの雑 音が混入されている。
そこで残留クロストークの分析を行なった。入力 信号z 1以外の入力信号を0とし、クロストークを 調査した。図15は自信号のクロストークへの影響 を調べたものである。実線が自信号からのクロス トーク、破線が全体からのクロストークである。図 15からわかるようにクロストークは入力信号と同 じ動きをしているので、自信号の回り込みが大きな 影響を及ぼしていることがわかった。
5.5 改良検討
前節の検討から、分離回路自体は動作しながら雑 音が残ってしまうのは係数更新に問題があると考え られる。そこで係数更新式の改良検討を行なうこと
にした。
その方法として係数更新式に用いられる各パラ メータの最適化、正しく正規化が行なわれるよう
に分母の固定化、2因子化を検討した。また、更新 部分に用いられる相関の平均長を変化させ、クロス
トークを安定させることを検討した。
cros$talk 一 ・ Inp畦Powerマ,謄一一幽
e.1
o,el
Z一@彰ののO﹂O一幅コO﹇のΦ﹂
10000
100
1
O.Ol O.OOOI ie−06 1e−08 1e−IQ
隷1繍酷、 6 .議d
鰍
墓
t6 o.eoi蓉
。.ooel
β卜
constant 一normal 一一一一一一
ロロvし
O 500 1000 1500 2000 2500 300 iteration
leLos
o sDo IDoo lsoo 200e 2soo 300
iteration
図16:分母固定化と通常の場合との比較
図15:自信号への影響
5。5.1 更新速度係数
更新の特性を調整するのに更新速度係数μを用い る。μを大きくするとクロストL・・一一クの減少速度は速 いがクロストークの定常値が大きくなる。逆に小 さくすると減少速度は遅いが定常値が小さくなり、
ある時刻以降は非常に良好に分離できる。μの値を 変化させ、クmストークと係数誤差が小さく安定す るかどうか調査した。実験の結果、μ;6×10−5が 最適値であった。雑音入力時の雑音の出力も音声が ほぼ混入されていなかった。しかし、クロストーク にはやや突発的箇所が見受けられた。
5.5.2 更新式分母固定化
係数更新式には相関を用い、各クUスモーメン トの定常値を分母に代入することによって、更新 式の分母を固定し、係数更新が安定できないか
と考えた。まず、分母に用いるべき定常値を調査 した。調査の結果、各クロスモーメントの定常
値η}20(1,2) = m20(1,3) = 0.01,n}20(2,1) ; m20(2,3) = O.008, m20(3, 1) = m20(3,2) = O.OOO3
を得た。これらの定常値を分母に用いた場合の係数 誤差を図16に示す。図16からわかるように、通常 の更新式を用いた場合と比較してみると、固定化し た場合は係数誤差が安定しており、一定の効果が見 られた。一方で更新を進めても誤差が下げ止まる傾 向があるが、これについては更にパラメータを調整 する余地がある。
5.5.3 更新式分母2因子化
係数更新式の分母は出力信号のパワーで正規化 を行なっている。きちんと正規化が行なわれていれ ば、係数誤差も少なく、出力信号も安定する。しか し、調査によれば、これらはそのようになっていな い。その原因は分母が1因子のためその値が小さい ときにきちんと正規化できないからではないかと考 え、他信号を考慮し分母を2因子化し対応しようと 考えた。そのため係数更新式を
cl L,(k)(n + 1) = CIL(k:)(?Z)
ptE{si(n)s2(n 一 k)}
十 7n20(1,2)(n)7n20(2,1)(n)
(i7)
というように変更した。
51とs2のパワー波形を観測すると、一方が小さ い時に他方が大きくなる時刻があるが、うまく正規 化することが期待される。この場合と通常との係数 誤差を図17に示す。図17からわかる様に変動は少
なく安定しているが、係数誤差の数値は以前より大 きい。残留クロストークは通常の更新式より小さく はなるが局所的に増加する箇所は残った。試聴して みると適応が収束するまでの間、音量が小さく尾を 引く音が残る。これは2つの信号のタイミングに依 存する箇所が残っているものと考えられる。この方 法もパラメータ調整の余地が残っている。
5.5.4 分母加算項
係数更新式(16)の分母加算項dは信号レベル小の 時に更新が過大になって精度が劣化することを防止 する。この値の最適化を図ったところd=10}9を 得たが、μとdを個別に最適化した値の組合せは必 ずしも良い分離特性を得られなかった。μ最適値の 場合にはクmストークが突発的に大きくなり、重た めの雑音が混入する。(1最適値のほうがより分離機 能が高いが、音声の入力がない時刻の雑音が通常時
津:山高専紀要第43号 (2001)
ori
OOI
t// OOOI
ooeol
「w巳:脚1eGtリr − nt/irrnal 一一
、距・
le−OC
o f,oo looo lc.oo 2 ooo t.c,oo roo
1「》旧tト1:/n
図17:分母2因子化と通常の場合との比較
より大きいという弱点も見られた。そこでd=IO−qL 優先として、μの最適化を行ない、μ=2×10−5を 得た。この場合、初期状態は雑音・音声相互に混入 が大きかったが、定常状態では雑音の混入がほとん どなく、完壁に分離されていた。初期状態での分離 が今後の課題となる。
自信号へのクロストークに対する自信号の影響が大 きいのは係数更新式にも改善の必要があると考えら
れる。
参考文献
1)平山信朗:信号分離手法による雑音除去に関す る検討,津山工業高専情報工学科卒業研究報告 書(1999)1−5
5.5.5 平均長
更新式(16)には計fi E{・}の平均長がパラメータ として存在する。その値と分離特性との関係を簡単 に調査した。入力がすべて雑音の場合は平均長が長 ければ長いほど、クロストークの減少速度も速く、
定常値も低かった。平均長が100の場合は4の場 合に比べ、クロストークが5[(IB]程度減少し、良い 傾向を示した。一方、音声の場合は平均長が100以 上はクロストークがあまり変わらなかった。小さい ほうも同様であるが突発的に大きくなる現象があっ た。音声入力0)場合においては平均長の調整をして
も効果が少ないと言える。
6 おわりに
本研究ではJuttenらの検討の一般化として、3 信号の場合の信号の分離、係数更新を検討した。計 算機シミュレーションにより、雑音時と音声時の比 較を行なった。クロストークの比較からわかるよう に、雑音入力時にはほぼ完全に分離できているが、
音声入力時には分離に問題点が残った。
評価の結果から音声入力時における分離性能の改 善が課題となり、原因調査として係数誤差の改善と
自信号のクロストークへの影響の減少について検討 した。係数誤差の改善のため各パラメータμ,dの最 適化、平均長などのパラメータの調査を行なった。
今後の課題としては実音環境で分離を行なうこ と、自信号のクWストークへの影響の減少がある。
2)酒井英昭:信号処理.オーム社,(1998)103−HO 3) Blind source separat,ion fo1 convoiution niix−
t・ures, H.N.Thi, C.Jut,t,en, g, ignal Processing,
45(1995), 209−229.
4)谷口亜紀子:多数音源を考慮した時間領域ブラ インド信号分離の検討,電子情報通信学会2001 年総合大会講演論文集(基礎・境界)(2001)219
付録
分離回路における0次項の計算を下記に示す。こ こでは31(t)について示すが、他の信号の計算も同 様である4)。
(1, =
b =
ロ 5・(り;万
(!−023(0)σ32(0))}三
+(σ12(0)032(0)一〇・2(0))YL・
+(C、2(0)σ23(0)一〇13(0))Y3
ガ
+(012(0)一σ13(0)α・2(0))Σσ21(の5・(トの
炉1
+(σ・3(0)一〇・2(0)0・3(0))Σ(]31( i)Sl(t一の
『
+(σ1・(0)一〇・2(0)σ・3(0))Σ0・・(の5・(ト1)
炉1
+(σ12(0)一〇・・(嘱・(0))Σ023嚇(孟一の
N i=1
+(0・・(0)G32(0)一1)(Σ0・2(i)邸一 i)
ゴ=1 ガ+Σσ・3ω5・(t一・ i))
曇;1
1−023(0)032(0)
一〇・2(0)(02・(0)一〇23(0)03・(0))
一C13(0)(σ3・(0)一〇2・(0)σ32(0))