• 検索結果がありません。

声道一区間のディジタルフィルタモデルの構成

ドキュメント内 母音の音声生成の音響モデルに関する研究 (ページ 83-88)

提案する声道一区間のディジタルフィルタモデルの構成は伝搬定数がARMAフィルタ

(次数 分子5次:分母5次),反射係数がFIRフィルタ(次数 511次)で構成される.

ブロック図を図4.19に示す.

4.7.1 近似精度の検証

この章では我々のディジタルフィルタモデルの近似精度を駆動点インピーダンスと伝達 関数の周波数特性の観点から評価する.

以下の議論では我々のモデルの近似精度を評価するために,声道の伝達関数H(jω)と 駆動点インピーダンスZv(jω)の真値は回路モデルの縦続行列を用いて計算される.一方 で,我々のモデルにおける伝達関数 H(jω)ˆ と駆動点インピーダンスZˆv(jω)において,

その縦続行列は近似した反射係数と伝搬定数から計算される.さらに,口唇部における放 射インピーダンスは無限バッフルの近似モデルZL(s)を用いた[a12].ZL(s)は次式で与 えられる.

ZL(s) = (ρc/(πa2))(sLrRr/(Rr+sLr)) (4.54)

Rr= 128/(9π2) (4.55)

Lr= 8a/(3πc) (4.56)

ここで,aは開口部の半径である.また,口唇部におけるディジタルフィルタモデルµˆL(z) はデルタ変換を用いて実現される.口唇部における反射係数µL(s)は

µL(s) = ZN(s)−ZL(s)

ZN(s) +ZL(s) (4.57)

で与えられる.ここで,ZN(s)は口唇部に一番近い声道の区間の特性インピーダンスで ある.簡単のために,この区間は損失なしとした.そのためZN(s)は周波数特性を持た ず定数として扱うことができる.つまり,ZN(s) =ρc/(πa2)である.この場合反射係数 µL(s)は

µL(s) =gL

s+σ1L

s+σ2L

(4.58) として与えられる.ここで,係数gL1Lおよびσ2Lは次式で与えられる.

gL= (1−Rr)/(1 +Rr) (4.59) σ1L=Rr/((1−Rr)Lr) (4.60) σ2L=Rr/((1 +Rr)Lr) (4.61) 次に,デルタ変換後の反射係数µL(γ)は

µL(γ) =gL

+

1 + aL

γ−bL

3

(4.62) となる.ここで,係数aL,bLはそれぞれ

aL =(σ1L−σ2L)(1−eσ2LTs) σ2LTs

(4.63) bL =eσ2LTs−1

Ts

(4.64)

で与えられる.

さらに,z領域における反射係数µˆL(z)はγ= (z−1)/Tsを式(4.62)へ代入すること で得られる.

以下ではHˆ(jω)とZˆv(jω)の近似精度の評価を示す.

体積速度伝達特性の近似精度

我々の提案方法をディジタルフィルタモデルの近似の用いた場合, 我々の近似は0–

6 kHzにおいて真値に対し非常によい一致を見せた.2–6 kHzにおいては近似誤差がほぼ

0であり,0–2 kHzにおいて微少な誤差が生じたため,0–2 kHzにおける体積速度伝達関

数の周波数特性を図4.20に示す.図4.20に示したように,日本語男性母音/u/,/i/,/a/

において,従来のディジタルフィルタモデル[b7]と比較して,第1,第2フォルマント周 辺における近似精度の向上がみられる.

従来のディジタルフィルタモデルにおいて,低周波領域で大きな近似誤差がみられる.

これは反射係数と伝搬定数に対して周波数依存特性が特に低い周波数で大きく現れ,その 一方で,高周波領域における周波数依存特性はほぼ一定で定数として扱うことができるこ とによる.

声門における駆動点インピーダンスの近似精度

回路モデルの近似において,駆動点インピーダンスの近似を高精度に行うことは重要で あるため,ここでは我々のディジタルフィルタモデルの駆動点インピーダンスの近似精度 を評価する.

駆動点インピーダンスZv(jω)は縦続行列のABCDパラメータを用いて以下のように 計算される.

Zv(jω) = A(jω)ZL(jω) +B(jω)

C(jω)ZL(jω) +D(jω). (4.65) 体積速度伝達関数の近似結果と同様に,駆動点インピーダンスの近似においても我々の

近似法は0–6 kHzにおいて真値に対し,非常によい一致が得られる.ここでは,日本語男

性母音/u/,/i/,/a/について,図4.21に0–6 kHzにおける駆動点インピーダンスを示 す.図4.21において,最も低い周波数の共振点において近似精度の向上が顕著にみられ る.本研究における数値実験においては,この共振点付近の帯域にはピッチ周波数が含ま れてはいないものの,two-mass modelの非線形効果により生じるピッチ周波数の高調波 成分を含む.したがって,この高調波成分および駆動点インピーダンス,時変の声門イン ピーダンス間の相互作用が予想される.

−10 0 10 20

Power [ dB]

proposed

conventional

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0

−4

−2 0 2 4

Frequency [kHz]

P h a s e [ ra d ]

/u/

/u/

−20

−10 0 10 20

Power [ dB ]

true

proposed conventional

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0

−4

−2 0 2 4

Frequency [kHz]

P h a s e [ ra d ]

/i/

/i/

−10 0 10 20 30

Power [ dB ]

true

proposed conventional

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0

−4

−2 0 2 4

Frequency [kHz]

P h a s e [ ra d ]

/a/

/a/

図4.20 日本語男性母音/u/,/i/,/a/に対する体積速度伝達関数.

0 100 200 300 400

[g/(c m

4

sec )]

true

proposed conventional

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0

−200

−100 0 100 200

Frequency [kHz]

[g /( cm

4

s e c )] Re a c ta n c e Res is tanc e /a/

/a/

0 40 80 120

[g/(c m

4

sec )]

true

proposed conventional

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0

−80

−40 0 40

Frequency [kHz]

[g /( cm

4

s e c )] Re a c ta n c e Res is tanc e /i/

/i/

0 50 100 150 200 250

[g/(cm

4

sec )]

true

proposed conventional

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0

−150

−100

−50 0 50 100 150

Frequency [kHz]

[g /( cm

4

s e c )] Re a c ta n c e Resi s tanc e

/u/

/u/

図4.21 日本語男性母音/u/,/i/,/a/に対する駆動点インピーダンス.

図4.22 声門下のBranching network model.

ドキュメント内 母音の音声生成の音響モデルに関する研究 (ページ 83-88)