図4.29 声門下のディジタルフィルタモデル(声門下インピーダンスあり).
図4.30 声門下のディジタルフィルタモデル(声門下インピーダンスなし).
4.9 実現したディジタルフィルタによる合成の結果と声門流
Vocal Tract Section 0Vocal Tract Section 1Vocal Tract Section N
Vocal TractLips -1propagetion constant
propagetion constant refrec coeffici
Subglottal SystemTwo-Mass Model
図4.31 音声合成時の各ブロックの接続 図(声門下インピーダンスあり).
図4.32 音声合成時の各ブロックの接続 図(声門化下インピーダンスなし).
まず始めに, 声門下インピーダンスを考慮しない場合におけるug(t)をみる.日本語男 性母音/u/,/a/の両方の場合において,我々のディジタルフィルタモデルを用いた際に は従来のディジタルフィルタモデルによる合成と比較してリップル成分が減少することが 見て取れる.さらに,我々のディジタルフィルタモデルでは,声門の開区間がより長くな り,ピッチ周期が増加することが声門流の波形から見て取れる.これらの傾向は日本語男 性母音/i/を用いた際にも同様にみられる.
0 200 400 600 CL
PL
0 1 2 3 4 5 6 7
−400 0 400
0 200 400 CL
PL
0 1 2 3 4 5 6 7
−800
−400 0 400
Time [msec]
0 200 400
600 C
P
0 1 2 3 4 5 6 7
−400 0 400 800
0 200 400
600 C
P
0 1 2 3 4 5 6 7
−800
−400 0 400 800
Time [msec]
with subglottal impedance without subglottal impedance
Glottal source flowVolume velocity at the lipsGlottal source flowVolume velocity at the lips
/u/ /u/
/a/ /a/
of /u/
of /u/
of /a/
of /a/
[cm3 / sec][cm3 / sec][cm3 / sec][cm3 / sec]
図4.33 日本語男性母音/u/,/a/に対する合成波形.(P: 提案方法–声門下インピー ダンス無し.C:従来法–声門下インピーダンス無し.PL:提案方法–声門下インピーダ ンス有り.CL:従来法–声門下インピーダンス有り)
図4.21に示したように,従来のディジタルフィルタモデルと比較して,我々のモデル では駆動点インピーダンスが低く,より短絡に近い.そのため,我々のモデルでは図4.27 の境界(c)における反射が強くなり,声門における体積速度は減少する.その結果,声門 におけるベルヌーイ効果を減少させピッチ周期の増加を招くと考えられる.
また,声門下インピーダンスを考慮した場合の我々のモデルにおけるug(t)をみると,
声門下インピーダンスを考慮しない場合と同様に,リップル成分の減少および,声門の開 区間,ピッチ周期の増加がみられる.
日本語男性母音/u/,/a/について合成した声門流ug(t)のスペクトルを図4.34に示す.
図4.34に示すように,我々のモデルでは従来モデルと比較して,第1フォルマント周辺 の振幅の平均レベルが減少していることが見て取れる.
以上より,声門下インピーダンスの考慮の有無に関わらず,我々のモデルでは従来モデ ルと比較してリップル成分が減少し,ピッチ周期が増加することが示された.
0.0 0.5 1.0 1.5 2.0 2.5 3.0 30
40 50 60 70 80 90 100 110
Power [dB]
C P
0.0 0.5 1.0 1.5 2.0 2.5 3.0
50 60 70 80 90 100 110
Frequency [kHz]
Power [dB]
C P
0.0 0.5 1.0 1.5 2.0 2.5 3.0
50 60 70 80 90 100 110
Frequency [kHz]
CL PL
0.0 0.5 1.0 1.5 2.0 2.5 3.0
40 50 60 70 80 90 100
110 CL
/u/ PL
/a/ /a/
/u/
CL P
C
PL CL
P C
PL
図4.34 日本語男性母音/u/,/a/に対する声門流のスペクトル.(P: 提案方法–声門 下インピーダンス無し.C:従来法–声門下インピーダンス無し.PL:提案方法–声門下 インピーダンス有り.CL:従来法–声門下インピーダンス有り.水平棒はF1±200 Hz の範囲を示す)
4.10 まとめ
本章では,声道アナログ·モデルをディジタルフィルタにより実現する際に,従来方法 における問題点を述べた.従来方法では伝搬定数および反射係数に相当する部分を,ある 周波数での振幅値をもって定数として近似していた.しかし,実際には周波数依存特性を 持つため,特に周波数依存性の強い低周波数帯(1kHz以下)において近似精度が低下す る問題があった.提案方法では伝搬定数および反射係数に相当する部分の近似精度を向上 するために,それぞれ低次のARMAフィルタと高次のMAフィルタを用いてその周波 数特性を近似した.まずは周波数特性上での近似精度を検証し,従来のディジタルフィル タモデルと比較して,提案方法では極めて高精度なディジタルフィルタモデルを実現する ことが出来ることを示した.さらに,従来方法および提案方法を用いて音声を合成し,声 門部における体積速度波形を比較した.その結果として,声門下インピーダンスの考慮の 有無に関わらず,提案方法では従来方法と比較して体積速度波形に重畳するリップル成分 が減少し,ピッチ周期が増加することが示された.