実現したディジタルフィルタによる合成の結果と声門流に関する評価に関する評価

図4.29 声門下のディジタルフィルタモデル（声門下インピーダンスあり）．

図4.30 声門下のディジタルフィルタモデル（声門下インピーダンスなし）．

4.9 実現したディジタルフィルタによる合成の結果と声門流

Vocal Tract Section 0Vocal Tract Section 1Vocal Tract Section N

Vocal TractLips -1propagetion constant

propagetion constant refrec coeﬃci

Subglottal SystemTwo-Mass Model

図4.31 音声合成時の各ブロックの接続図（声門下インピーダンスあり）．

図4.32 音声合成時の各ブロックの接続図（声門化下インピーダンスなし）．

まず始めに，声門下インピーダンスを考慮しない場合におけるug(t)をみる．日本語男性母音/u/，/a/の両方の場合において，我々のディジタルフィルタモデルを用いた際には従来のディジタルフィルタモデルによる合成と比較してリップル成分が減少することが見て取れる．さらに，我々のディジタルフィルタモデルでは，声門の開区間がより長くなり，ピッチ周期が増加することが声門流の波形から見て取れる．これらの傾向は日本語男性母音/i/を用いた際にも同様にみられる．

0 200 400 600 CL

0 1 2 3 4 5 6 7

−400 0 400

0 200 400 CL

0 1 2 3 4 5 6 7

−800

−400 0 400

Time [msec]

0 200 400

600 C

0 1 2 3 4 5 6 7

−400 0 400 800

0 200 400

600 C

0 1 2 3 4 5 6 7

−800

−400 0 400 800

Time [msec]

with subglottal impedance without subglottal impedance

Glottal source flowVolume velocity at the lipsGlottal source flowVolume velocity at the lips

/u/ /u/

/a/ /a/

of /u/

of /a/

[cm3 / sec][cm3 / sec][cm3 / sec][cm3 / sec]

図4.33 日本語男性母音/u/，/a/に対する合成波形．（P: 提案方法–声門下インピーダンス無し．C:従来法–声門下インピーダンス無し．PL:提案方法–声門下インピーダンス有り．CL:従来法–声門下インピーダンス有り）

図4.21に示したように，従来のディジタルフィルタモデルと比較して，我々のモデルでは駆動点インピーダンスが低く，より短絡に近い．そのため，我々のモデルでは図4.27 の境界(c)における反射が強くなり，声門における体積速度は減少する．その結果，声門におけるベルヌーイ効果を減少させピッチ周期の増加を招くと考えられる．

また，声門下インピーダンスを考慮した場合の我々のモデルにおけるug(t)をみると，

声門下インピーダンスを考慮しない場合と同様に，リップル成分の減少および，声門の開区間，ピッチ周期の増加がみられる．

日本語男性母音/u/，/a/について合成した声門流ug(t)のスペクトルを図4.34に示す．

図4.34に示すように，我々のモデルでは従来モデルと比較して，第1フォルマント周辺の振幅の平均レベルが減少していることが見て取れる．

以上より，声門下インピーダンスの考慮の有無に関わらず，我々のモデルでは従来モデルと比較してリップル成分が減少し，ピッチ周期が増加することが示された．

0.0 0.5 1.0 1.5 2.0 2.5 3.0 30

40 50 60 70 80 90 100 110

Power [dB]

C P

0.0 0.5 1.0 1.5 2.0 2.5 3.0

50 60 70 80 90 100 110

Frequency [kHz]

Power [dB]

C P

0.0 0.5 1.0 1.5 2.0 2.5 3.0

50 60 70 80 90 100 110

Frequency [kHz]

CL PL

0.0 0.5 1.0 1.5 2.0 2.5 3.0

40 50 60 70 80 90 100

110 CL

/u/ PL

/a/ /a/

/u/

CL P

PL CL

P C

図4.34 日本語男性母音/u/，/a/に対する声門流のスペクトル．（P: 提案方法–声門下インピーダンス無し．C:従来法–声門下インピーダンス無し．PL:提案方法–声門下インピーダンス有り．CL:従来法–声門下インピーダンス有り．水平棒はF1±200 Hz の範囲を示す）

4.10 _まとめ

本章では，声道アナログ·モデルをディジタルフィルタにより実現する際に，従来方法における問題点を述べた．従来方法では伝搬定数および反射係数に相当する部分を，ある周波数での振幅値をもって定数として近似していた．しかし，実際には周波数依存特性を持つため，特に周波数依存性の強い低周波数帯（1kHz以下）において近似精度が低下する問題があった．提案方法では伝搬定数および反射係数に相当する部分の近似精度を向上するために，それぞれ低次のARMAフィルタと高次のMAフィルタを用いてその周波数特性を近似した．まずは周波数特性上での近似精度を検証し，従来のディジタルフィルタモデルと比較して，提案方法では極めて高精度なディジタルフィルタモデルを実現することが出来ることを示した．さらに，従来方法および提案方法を用いて音声を合成し，声門部における体積速度波形を比較した．その結果として，声門下インピーダンスの考慮の有無に関わらず，提案方法では従来方法と比較して体積速度波形に重畳するリップル成分が減少し，ピッチ周期が増加することが示された．

第 5 _章

声道の 3 次元形状を考慮した合成モ

ドキュメント内母音の音声生成の音響モデルに関する研究 (ページ 93-97)

実現したディジタルフィルタによる合成の結果と声門流 に関する評価に関する評価

4.9 実現したディジタルフィルタによる合成の結果と声門流

4.10 まとめ

第 5 章

声道の 3 次元形状を考慮した合成モ

実現したディジタルフィルタによる合成の結果と声門流に関する評価に関する評価

4.10 _まとめ

第 5 _章