拘束線形予測分析による音声の極周波数推定
著者 三好 義昭, 角所 収
雑誌名 電子情報通信学会論文誌. A 基礎・境界
巻 74
号 11
ページ 1682‑1685
発行年 1991‑11‑01
URL http://hdl.handle.net/2297/3351
′ 三−・: −−:、・
今ラ1+勘Z ̄1十∂iZ▲2=0の根をz∫とすると抜巨イ訂 より,
拘束線形予測分析による竃声の極周波数推定 正 員 三好 義昭† 正 員 角所 収††
PoleFTeqlユenCyEstimationofSpeeehbyaRestrictedLinear Predi亡tionMethod
YoshiakiMIYOSHl†andOsarnuKAKUS710††,肋血s
/)ヱ=l
(3)
但し,才=1,2,3,…,カ/2
のとき,ガ(g)の極はすべてz平面の単位円上に存在 する。このとき,式(2)の分母は,
♪/2
m(1+αiZ▼1+z ̄2)=1十CIZ−1+c2Z ̄2十。・ ∫=1
+c2Z▼♪+2+c.g▲帥十オイ(4)
但し,Cと=/(αノ),オ=1,2,…,カ/2
と,g ̄〜の係数cざとz ̄押の係数cかイが等しくなるこ とより9 式(1)において,
α〜=勒■ざ (5)
但し,助=1,才=0,1,2,…,カ/2
となれば,すなわち,(亀),才=1,2,3,…,カがカ/2番目 の予測係数鉛/2を中心とした対称形となれば,声道伝
達特性〝(g)の極はすべてz平面の単位円上に存在す ることになる。このとき,
♪
1+∑α諺 ̄烏=0
た=1
(6)
は式(5)より相反方程式となり,式(6)を解くことは
∬=Z+z ̄1に関するカ/2方程式を解くことと,Zに関 する2次方程式g2−J言+1=0を解くことに帰着す る(2)。そして,予測係数(α≠)も式(5)のもとで,分析フ レーム内のⅣ−カ個の音声標本値(ぶ乃),紹=カ+1,♪+2,
…,Ⅳに対する予測誤差の2栗平均最小の条件より,
♪/2.Ⅳ
∑β烏∑(ぶ乃_烏+∫乃+員▼タ)(∫乃_と+5侶ト♪)
々=1 7〜=♪+1
†金沢大学教育学部,金沢市
FacultyofEducation.Ka11aZaWaUniversity,Kanazawa−Shi920Japan
††龍谷大学理工学弘 大津市
FacultyofScienceandTeehno]ogy,RyukokuUniversity.Otsu・Shi,520−21 ねpan
あらまし 極の位置をz平面の単位円上に拘束す ることにより,極の周波数のみを推定する拘束線形予 測法の定式化を行い,本方法の正規方程式の次元なら びに高次方程式の次数が通常の線形予測法の1/2に半 減することを示す。そして,合成音の極周波数推定に 適用し,本方法の特徴ならびに有効性を実験的に示す。
且.まえがき
今臥 音声の重要な特徴パラメータであるホルマン トの推定手法として,線形予測分析が広く活用されて いる。しかしながら,通常の線形予測分析では,ホル マント帯域幅の正確な推定が一般に困難であり9 音声 認識におけるホルマント帯域幅の有用性はまだ検討段 階でもあることから9 線形予測分析により得られる帯 域幅の情報はホルマントに対応する極の選定程度にし か使用されていないのが現状である。
本論文では,極の周波数のみを推定する一手段とし て,極の位置をz平面の単位円上に拘束した拘束線形 予測法の定式化を行い,本方法を合成音の極周波数推 定に適用し,そのホルマント周波数推定精度の検討な
らびに線スペクトル対(LSP)(1)との比較を行った結 果について述べる。
望.極の位置を拘束した線形予測分析
通常の線形予測法では,周知のようにぅ 声道伝達特 性ガ(g)を,
〃 =−∑(ぶ乃+∫乃_p)(∫乃_∫+5乃.トタ) 乃=p+1
(7)勒=&,鞄/2=2鮎/2
但し,g=1,2,3,…,β/2 ノ=1,2,3,・・■,カ/2−1
なる連立1次方程式の解として,カ/2個の予測係数(仇,
勉,=・,鞄′2)のみを求めればよいことになる。
以上のように,極の位置をz平面の単位円上に拘束 することにより,極の帯域幅の情報は得られないが,
正規方程式の次元ならびに高次方程式の次数をそれぞ れ半減することができる。この拘束がホルマント周波 数推定精度にどの様に影響するかを解析的に明らかに するのは困難であるため,以下,合成音によるシミュ
lノ_〜ノ1\ノIサ ト n _ヱ.′T\臨書7亡っヒク=iス r }− コ ′ Yし一 ロー、ソ, し Vノ′lアミP
.1」 ユ_l」 ノや
乱 合成音によるシミュレーション結果 乱且 ホルマント周波数推定精度
標本化周波数10kHz,励振源:ピッチ周期8msの
ガ(z)=
(1)
♪ 1+ヨ蝕g ̄点
々=1
但し,α々:第点予測係数
なる全極型で記述できるものと仮定している。ここで,
次数カが偶数の場合,式(1)は,
ガ(ヱ)= ♪/2
(2)
m(1+αiZ ̄1+∂ざZ▼2) i=1
と共役複素極の積の形で記述できる。
レ タ ー
肯60
巨]
1b50
40 30 20 10
6 8 】0 12 14. 16 0
Jl
10 20 30 4.0 50 co
g/Ⅳ(dB)
図2 桓周波数推定値の平均標準偏差のSN比依存性 Fig.2 The S仰−dependency ofthe averagestandard
deviationofestimatedpolefrequencies.
分析次数をカ>加としても,ホルマント周波数推定精 度が急激に悪くなることばないのに対し,本方法では すべての極の位置がz平面の単位円上に拘束されて いるため,擬似ホルマントの存在が大きく影響し,カ>
加となるとホルマント周波数推定精度が急激に悪く なると言える。
乱望 極周波数推定値の頑健性
通常の線形予測分析において分析次数カをカ>加と した場合,母音定常部においても分析位置により,特 に擬似ホルマントの位置が大きく変動するため,得ら れる極のすべてを音声の特徴パラメータとして利用する ことができず,ホルマントに対応する極の選定が必要 となる(4)。一方9本方法は極の位置がz平面の単位円上 に拘束されていることより,定性的には推定極の位置 の変動が予測誤差に大きく反映するため9 予測誤差の 2栗平均最小の条件よりタ 母音定常部のようなホルマ ント周波数がほぼ一定とみなせる音声区間において は9 ♪>如の場合でもホルマントに対応しない極を含 めて極周波数推定値が分析位置等の影響で大きく変動 することはないと考えられる。
前述の合成母音/a/において,♪次分析により得られ るカ/2個の極周波数各々の標準偏差を平均した式(8)
で定義する極周波数推定値の平均標準偏差房のSN 比依存性を図2に示す。但し,分析次数カ=12とし,
その他の分析条件ならびに図中の記号等は図1と同じ である。なお9 極の対応関係も含めた変動度合を評価 するため,式(8)のf㌔は第ノ分析フレームで得られ る極周波数を単に周波数の小さい順に番号付けしたも
且683 図1ホルマント周波数推定誤差の分析次数か依存性
Fig.1The p.dependency of the formant estimatiorl error E.
Rosenberg波(3),ホルマント周波数:昂=812.5‡iz,
昂=1312.5Hz,昂=2687.5Hz,凡=3437.5Hz,F;=
4437.5日z,放射特性:6dB/octとして作成した合成 母音/a/における第1〜第3ホルマント周波数推定誤 差ガの分析次数か依存性を図1に示す。但し,前処理
として1階差分後,分析窓長7も=25.6ms,フレームシ フト間隔0.2msで1周期に渡って分析した計40フ レームの平均値である。そして,○印:本方法,△印:
通常の線形予測法(共分散法)の結果である。
今の場合,上記5偶のホ/レマントを用いて声道特性 を設定しているので,声道伝達特性の次数加=10とな る。従って,図1に示されているように,分析次数カ<
10(=加)ではぅ ホルマント周波数推定誤差は両方法と も大きくなるがタ カ=10(=か)の場合,通常の線形予 測分析による誤差は0.4%であるのに対して,本方法
による誤差は0.7%と若干劣るが,本方法でも通常の 線形予測分析とほぼ同等の精度でホルマント周波数が 精度良く推定可能であると言える。しかしながら9 通 常の線形予測分析はカ≧14においてホルマント周波 数推定誤差が若干増大してはいるが,カ≧加であれば,
ホルマント周波数推定誤差に及ぼす分析次数依存性は ほとんどないのに対して,本方法はカ>10において,
ホルマント周波数推定誤差が分析次数に依存して増大 し9 通常の線形予測分析とは大きく異なった特性とな る。すなわち,カ>加の場合には,ホルマントに対応し ない極,いわゆる擬似ホルマントが生じるが,通常の 線形予測分析では擬似ホルマントの帯域幅が一般に大 きいため9ホルマントに対応する極への影響が小さく,
のである。そしてタ通常の線形予測分析の房算出には 極周波数推定値がOHzまたは5000喜まzとなる分析フ レーム(5仰=20dBでは7フレーム,5仰=30,40,
50dBおよび∝〉ではそれぞれ各1フレーム)は除外し たので,例えば,5/Ⅳ=20dBでの式(8)の分析フレー ム数は』グ=33と他のS因比より若干少なくなってい るが,本方法では,そのような分析フレームは生じな かったので,各SN比とも朋=40である。
析を行い♪偶のPÅRCOR係数抽),才=1,2,…,♪を 求め,々恒1=±1とした2種類の♪/2次の高次方程式 の解より,計少本の線スペクトルを得ている(1)。それに 対してゥ 本方法は式(5)の拘束の基に,式(7)に示す 少/2次元の正規方程式の解として,カ/2個の予測係数の みを求め,カ/2次の高次方程式の解として,カ/2本の線 スペクトルを得ている。
すなわちタLSPは通常の線形予測分析(自己相関法)
を行った後に線スペクトル化の操作を行っているのに 対し,本方法は線形予測分析(共分散法)をする段階 で線スペクトル化を行っているため,2乗誤差最小基 準の線スペクトルが得られ,かつ高次方程式の次数の みならず正規方程式の次元もカ/2に半減している点が 従来のLSP法とは大きく異なる。この違いによる両者 の性能の差を解析的に明らかにするのは困難であるの
百= 志豊(軋一郎
(8)
但しゥ眞=志雛ソ
薫ブ:第ノ分析フレームの第才極周波数 戯「∵分析フレーム数
カ:分析次数
図2より,通常の線形予測分析により得られる極周 波数はぎ/Ⅳ=∞の場合でも分析位置により変動し,平 均標準偏差庁=15.3Hzとなるのに対し,本方法では 3.4日zと極周波数推定値の分析位置依存性が大幅に 改善することがわかる。そして,通常の線形予測分析 の極周波数推定値の変動はS】珂比が減少すると共に増 大し,S/Ⅳ=20dBにおいて百=52.9壬izと特に大きく なるが,これは分析位置により擬似ホルマントが,今 の場合,第3〜第4ホルマント間に生じたり,第4〜第
5ホルマント間に生じたりするため,いわゆる極周波 数推定値の順序関係が乱れているためである。そして,
5伊=10dBではこのような順序関係の乱れはなく ∂
=21.3Hzと,S/Ⅳ=30dBの23.OHzよりも若干なが らむしろ改善する結果となっている匂 一方,本方法の 極周波数推定値の変動はS/Ⅳ≦20dBにおいて若干増 大しているがヶいずれのぶ/Ⅳにおいても通常の線形予 測分析よりも大幅に改善すると共に,30dB≦5/Ⅳ≦50 dBでは房=3.5Hzと,5伊=∞の3.4Hzとほぼ同 じ小さな値となっていることより,本方法では順序関 係を保持した安定な極周波数が推定できていると言え る。このことは,本方法によi)得られる極のすべてを 音声の特徴パラメータとして利用できることを意味し,
本方法は分析次数を少し多めに設定した場合でもホル マントの真偽判定が不要な分析法と言える。
乱3 スペクトル対(乱S㌘)との比較
本方法は音声の線スペクトル表現肋(5)・(6)の一方式
と言える。以下争 線スペクトル化方式の代表例と言え る周知の線スペクトル対(LSP)との比較を行う。
LSPは,周知のようにいったん通常のPARCOR分
p= 8
富0 ■ロ
ー10
−2ロ
ー30
︵
0 1 2 3 4 5
(kHこ1I
ヨ
2
0 & 5
(駄Hz)
ダ=10
古0 ■て
−10
−20
−30
古0 守
一10
−20
−30
0 † 2 3 A 5
(k罰k)
ご
nV O nV 爪V ︵国王T ■2 づ
0 ▲nU O O ︵肉巧︶T−2−3
& 5
(k}Il:l
3 ウ﹂
0 0 】 2 3 息 5
1kH::)
′_ヽ 電7___】▲___▲ _1L____▲▲_ ′1ヽ 1r▲1 ▲】▲▲▲ 〈L_、−▲._∧ム._L,..
lくり ▼ヽ′、・くt▲ ■ユーロいし■ しIl亡uく1ヽl−亡l ̄ lLリ YUlこll■lく1ヽl■ ヽ」uh口1 、、−t=一 ̄
isもicandl量mespecもどⅦ㌍lp別官 主sも呈ca皿d亀i払eSpeCもr岨mby も臨e卵OpOSedme地od 図3 線スペクトル表現の比較(合成母音/a/)
Fig.3 Aeomparison ofline spectrum repreSentation
forsyntheticvowel/a/.
レ タ ー
で,以下,合成音の線スペクトル化に適用することに より,主としてホルマント周波数との対応関係の観点 から両方式の違いを実験的に示す。
前述の合成母音/a/に適用して得られる線スペクト ルの比較を図3に示すや 但し9 前処理として1階差分 後,分析窓長 ㍍=25.6msとし,(a)にLSP法による 線スペクトル,(b)に本方法による線スペクトルを示 し,図3の上段,中段および下段はそれぞれ分析次数 を♪=8,10および12とした場合の結果であり,図中 のスペクトル包絡は本台成育の声道伝達特性である。
今の場合,前述のように本合成音の声道伝達特性の 次数は加=10であるので,分析次数カ=8(<如)の場 合,図3(a),(b)上段の結果より,両方法とも得ら れる線スペクトルとホルマント周波数との間には特に 明確な対応関係は見られないと言える。
分析次数少=10(=加)の場合,図3(a),(b)中段の 結果より,LSPでは周知のように線スペクトルがホル マントを挟む形で互いに接近して,ホルマントの位置 を間接的に示しているのに対して,本方法では5(=
β/2)本の線スペクトルが得られ,各線スペクトルはホ ルマント周波数にほぼ一致し,ホルマントの位置を直 才妾的に示していると言える。
分析次数カ=12(>加)の場合,図3(a),(b)下段の 結果より,LSPでは1.7kHzと3.1kHz付近にホル マントに対応しない線スペクトルが生じるが,他の線 スペクトルはホルマントを挟む形で互いに接近した1 対の組を形成しているのに対して,本方法では2.2 kHz付近のホルマントに対応しない線スペクトルの 影響により,特に第3,第4ホルマントに対応すると 考えられる線スペクトルがホルマント周波数に対して それぞれ高域にシフトしたものとなることがわかる。
4。む す び
極の位置をg平面の単位円上に拘束した拘束線形
予測法の定式化を行い,本方法のホルマント周波数推 定精度ならびに線スペクトル対との比較を合成音によ り検討した。その結果,本方法は正規方程式の次元な らびに高次方程式の次数を通常の線形予測法の1/2に 半減することができ,かつ分析次数を適切に設定する 必要があるが,通常の線形予測法とほぼ同等の精度で ホルマント周波数推定が可能であること,ならびに線 スペクトル対と比較してホルマントとの対応関係がよ り明確な線スペクトルが得られることが明らかとなっ た。更に,極の位置の拘束が極周波数推定値の頑健性 にも大きく寄与することが実験的に示された。このこ とは音声のホルマント構造の情報を担った安定した線 スペクトルが得られることを意味し,本方法により得 られる線スペクトルは音声認識等における有効な特徴 パラメータとなり得ると思われるが,この点について は現在検討中である。
文 献
(1)菅村 昇,板倉文忠: 線スペクトル対(LSP)音声分析 合成方式による音声情報圧縮 ,信学論(A),J64−A,8,
Pp.599−606(1981−08).
(2)日本数学会編: 岩波数学辞典(第3版) ,p.7帆岩波書
店(1990)。
(3)RosenbergA,E.: Effectofglottalpulseshapeonthe
qualityofnaturalvowels ,J.Acoust.Soc.Am.,49,pp.
583−590(1971).
(4)粕谷英樹,和田充弘,岡田美智男: 線形予測分析法で得 られる極周波数からのホルマント周波数選択アルゴリズ ム ,信学論(A),』66−A,11,pP.1144−1145(1983−11).
(5)嵯峨山茂樹,板倉文忠: 複合正弦波モデルによる音声ス ペクトルの分析 ,信学論(A),J64−A,2,pp.105−112(1981
−02)。
(6)菅村 昇,板倉文忠: 線形予測係数の線スペクトル表現 とその統計的性質 ,信芋論(A),J64−A,4,pp.323−
330(198ト04).
(平成3年6月12日,7月15日再受付)
1685