• 検索結果がありません。

拘束線形予測分析による音声の極周波数推定

N/A
N/A
Protected

Academic year: 2022

シェア "拘束線形予測分析による音声の極周波数推定"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

拘束線形予測分析による音声の極周波数推定

著者 三好 義昭, 角所 収

雑誌名 電子情報通信学会論文誌. A 基礎・境界

巻 74

号 11

ページ 1682‑1685

発行年 1991‑11‑01

URL http://hdl.handle.net/2297/3351

(2)

′ 三−・: −−:、・  

今ラ1+勘Z ̄1十∂iZ▲2=0の根をz∫とすると抜巨イ訂   より,  

拘束線形予測分析による竃声の極周波数推定   正 員 三好 義昭† 正 員 角所 収††  

PoleFTeqlユenCyEstimationofSpeeehbyaRestrictedLinear   Predi亡tionMethod  

YoshiakiMIYOSHl†andOsarnuKAKUS710††,肋血s   

/)ヱ=l  

(3)   

但し,才=1,2,3,…,カ/2  

のとき,ガ(g)の極はすべてz平面の単位円上に存在   する。このとき,式(2)の分母は,  

♪/2   

m(1+αiZ▼1+z ̄2)=1十CIZ−1+c2Z ̄2十。・ ∫=1  

+c2Z▼♪+2+c.g▲帥十オイ(4)   

但し,Cと=/(αノ),オ=1,2,…,カ/2  

と,g ̄〜の係数cざとz ̄押の係数cかイが等しくなるこ   とより9 式(1)において,   

α〜=勒■ざ   (5)   

但し,助=1,才=0,1,2,…,カ/2  

となれば,すなわち,(亀),才=1,2,3,…,カがカ/2番目   の予測係数鉛/2を中心とした対称形となれば,声道伝  

達特性〝(g)の極はすべてz平面の単位円上に存在す   ることになる。このとき,  

♪  

1+∑α諺 ̄烏=0  

た=1  

(6)   

は式(5)より相反方程式となり,式(6)を解くことは  

∬=Z+z ̄1に関するカ/2方程式を解くことと,Zに関   する2次方程式g2−J言+1=0を解くことに帰着す   る(2)。そして,予測係数(α≠)も式(5)のもとで,分析フ   レーム内のⅣ−カ個の音声標本値(ぶ乃),紹=カ+1,♪+2,  

…,Ⅳに対する予測誤差の2栗平均最小の条件より,  

♪/2.Ⅳ   

∑β烏∑(ぶ乃_烏+∫乃+員▼タ)(∫乃_と+5侶ト♪)  

々=1  7〜=♪+1  

†金沢大学教育学部,金沢市  

FacultyofEducation.Ka11aZaWaUniversity,Kanazawa−Shi920Japan  

††龍谷大学理工学弘 大津市  

FacultyofScienceandTeehno]ogy,RyukokuUniversity.Otsu・Shi,520−21   ねpan  

あらまし 極の位置をz平面の単位円上に拘束す   ることにより,極の周波数のみを推定する拘束線形予   測法の定式化を行い,本方法の正規方程式の次元なら   びに高次方程式の次数が通常の線形予測法の1/2に半   減することを示す。そして,合成音の極周波数推定に   適用し,本方法の特徴ならびに有効性を実験的に示す。   

且.まえがき   

今臥 音声の重要な特徴パラメータであるホルマン   トの推定手法として,線形予測分析が広く活用されて   いる。しかしながら,通常の線形予測分析では,ホル   マント帯域幅の正確な推定が一般に困難であり9 音声   認識におけるホルマント帯域幅の有用性はまだ検討段   階でもあることから9 線形予測分析により得られる帯   域幅の情報はホルマントに対応する極の選定程度にし   か使用されていないのが現状である。   

本論文では,極の周波数のみを推定する一手段とし   て,極の位置をz平面の単位円上に拘束した拘束線形   予測法の定式化を行い,本方法を合成音の極周波数推   定に適用し,そのホルマント周波数推定精度の検討な  

らびに線スペクトル対(LSP)(1)との比較を行った結   果について述べる。   

望.極の位置を拘束した線形予測分析   

通常の線形予測法では,周知のようにぅ 声道伝達特   性ガ(g)を,  

〃 =−∑(ぶ乃+∫乃_p)(∫乃_∫+5乃.トタ)     乃=p+1  

(7)   

勒=&,鞄/2=2鮎/2   

但し,g=1,2,3,…,β/2   ノ=1,2,3,・・■,カ/2−1  

なる連立1次方程式の解として,カ/2個の予測係数(仇,  

勉,=・,鞄′2)のみを求めればよいことになる。   

以上のように,極の位置をz平面の単位円上に拘束   することにより,極の帯域幅の情報は得られないが,  

正規方程式の次元ならびに高次方程式の次数をそれぞ   れ半減することができる。この拘束がホルマント周波   数推定精度にどの様に影響するかを解析的に明らかに   するのは困難であるため,以下,合成音によるシミュ  

lノ_〜ノ1\ノIサ ト n  _ヱ.′T\臨書7亡っヒク=iス r    }− コ ′ Yし一 ロー、ソ,  し Vノ′lアミP 

.1」 ユ_l」 ノや   

乱 合成音によるシミュレーション結果    乱且 ホルマント周波数推定精度   

標本化周波数10kHz,励振源:ピッチ周期8msの  

ガ(z)=  

(1)   

♪ 1+ヨ蝕g ̄点  

々=1  

但し,α々:第点予測係数  

なる全極型で記述できるものと仮定している。ここで,  

次数カが偶数の場合,式(1)は,  

ガ(ヱ)=   ♪/2  

(2)  

m(1+αiZ ̄1+∂ざZ▼2) i=1  

と共役複素極の積の形で記述できる。  

(3)

レ タ ー  

肯60  

巨]  

1b50  

40   30   20   10  

6   8  】0  12  14. 16   0  

Jl  

10  20  30  4.0  50  co  

g/Ⅳ(dB)  

図2 桓周波数推定値の平均標準偏差のSN比依存性    Fig.2 The S仰−dependency ofthe averagestandard  

deviationofestimatedpolefrequencies.  

分析次数をカ>加としても,ホルマント周波数推定精   度が急激に悪くなることばないのに対し,本方法では   すべての極の位置がz平面の単位円上に拘束されて   いるため,擬似ホルマントの存在が大きく影響し,カ>  

加となるとホルマント周波数推定精度が急激に悪く   なると言える。   

乱望 極周波数推定値の頑健性   

通常の線形予測分析において分析次数カをカ>加と   した場合,母音定常部においても分析位置により,特   に擬似ホルマントの位置が大きく変動するため,得ら   れる極のすべてを音声の特徴パラメータとして利用する   ことができず,ホルマントに対応する極の選定が必要   となる(4)。一方9本方法は極の位置がz平面の単位円上   に拘束されていることより,定性的には推定極の位置   の変動が予測誤差に大きく反映するため9 予測誤差の   2栗平均最小の条件よりタ 母音定常部のようなホルマ   ント周波数がほぼ一定とみなせる音声区間において   は9 ♪>如の場合でもホルマントに対応しない極を含   めて極周波数推定値が分析位置等の影響で大きく変動   することはないと考えられる。   

前述の合成母音/a/において,♪次分析により得られ   るカ/2個の極周波数各々の標準偏差を平均した式(8)  

で定義する極周波数推定値の平均標準偏差房のSN   比依存性を図2に示す。但し,分析次数カ=12とし,  

その他の分析条件ならびに図中の記号等は図1と同じ   である。なお9 極の対応関係も含めた変動度合を評価   するため,式(8)のf㌔は第ノ分析フレームで得られ   る極周波数を単に周波数の小さい順に番号付けしたも  

且683    図1ホルマント周波数推定誤差の分析次数か依存性   

Fig.1The p.dependency of the formant estimatiorl   error E.  

Rosenberg波(3),ホルマント周波数:昂=812.5‡iz,  

昂=1312.5Hz,昂=2687.5Hz,凡=3437.5Hz,F;=  

4437.5日z,放射特性:6dB/octとして作成した合成   母音/a/における第1〜第3ホルマント周波数推定誤   差ガの分析次数か依存性を図1に示す。但し,前処理  

として1階差分後,分析窓長7も=25.6ms,フレームシ   フト間隔0.2msで1周期に渡って分析した計40フ   レームの平均値である。そして,○印:本方法,△印:  

通常の線形予測法(共分散法)の結果である。   

今の場合,上記5偶のホ/レマントを用いて声道特性   を設定しているので,声道伝達特性の次数加=10とな   る。従って,図1に示されているように,分析次数カ<  

10(=加)ではぅ ホルマント周波数推定誤差は両方法と   も大きくなるがタ カ=10(=か)の場合,通常の線形予   測分析による誤差は0.4%であるのに対して,本方法  

による誤差は0.7%と若干劣るが,本方法でも通常の   線形予測分析とほぼ同等の精度でホルマント周波数が   精度良く推定可能であると言える。しかしながら9 通   常の線形予測分析はカ≧14においてホルマント周波   数推定誤差が若干増大してはいるが,カ≧加であれば,  

ホルマント周波数推定誤差に及ぼす分析次数依存性は   ほとんどないのに対して,本方法はカ>10において,  

ホルマント周波数推定誤差が分析次数に依存して増大   し9 通常の線形予測分析とは大きく異なった特性とな   る。すなわち,カ>加の場合には,ホルマントに対応し   ない極,いわゆる擬似ホルマントが生じるが,通常の   線形予測分析では擬似ホルマントの帯域幅が一般に大   きいため9ホルマントに対応する極への影響が小さく,  

(4)

のである。そしてタ通常の線形予測分析の房算出には   極周波数推定値がOHzまたは5000喜まzとなる分析フ   レーム(5仰=20dBでは7フレーム,5仰=30,40,  

50dBおよび∝〉ではそれぞれ各1フレーム)は除外し   たので,例えば,5/Ⅳ=20dBでの式(8)の分析フレー   ム数は』グ=33と他のS因比より若干少なくなってい   るが,本方法では,そのような分析フレームは生じな   かったので,各SN比とも朋=40である。  

析を行い♪偶のPÅRCOR係数抽),才=1,2,…,♪を   求め,々恒1=±1とした2種類の♪/2次の高次方程式   の解より,計少本の線スペクトルを得ている(1)。それに   対してゥ 本方法は式(5)の拘束の基に,式(7)に示す   少/2次元の正規方程式の解として,カ/2個の予測係数の   みを求め,カ/2次の高次方程式の解として,カ/2本の線   スペクトルを得ている。   

すなわちタLSPは通常の線形予測分析(自己相関法)  

を行った後に線スペクトル化の操作を行っているのに   対し,本方法は線形予測分析(共分散法)をする段階   で線スペクトル化を行っているため,2乗誤差最小基   準の線スペクトルが得られ,かつ高次方程式の次数の   みならず正規方程式の次元もカ/2に半減している点が   従来のLSP法とは大きく異なる。この違いによる両者   の性能の差を解析的に明らかにするのは困難であるの  

百=   志豊(軋一郎  

(8)  

但しゥ眞=志雛ソ  

薫ブ:第ノ分析フレームの第才極周波数   戯「∵分析フレーム数  

カ:分析次数   

図2より,通常の線形予測分析により得られる極周   波数はぎ/Ⅳ=∞の場合でも分析位置により変動し,平   均標準偏差庁=15.3Hzとなるのに対し,本方法では   3.4日zと極周波数推定値の分析位置依存性が大幅に   改善することがわかる。そして,通常の線形予測分析   の極周波数推定値の変動はS】珂比が減少すると共に増   大し,S/Ⅳ=20dBにおいて百=52.9壬izと特に大きく   なるが,これは分析位置により擬似ホルマントが,今   の場合,第3〜第4ホルマント間に生じたり,第4〜第  

5ホルマント間に生じたりするため,いわゆる極周波   数推定値の順序関係が乱れているためである。そして,  

5伊=10dBではこのような順序関係の乱れはなく ∂  

=21.3Hzと,S/Ⅳ=30dBの23.OHzよりも若干なが   らむしろ改善する結果となっている匂 一方,本方法の   極周波数推定値の変動はS/Ⅳ≦20dBにおいて若干増   大しているがヶいずれのぶ/Ⅳにおいても通常の線形予   測分析よりも大幅に改善すると共に,30dB≦5/Ⅳ≦50   dBでは房=3.5Hzと,5伊=∞の3.4Hzとほぼ同   じ小さな値となっていることより,本方法では順序関   係を保持した安定な極周波数が推定できていると言え   る。このことは,本方法によi)得られる極のすべてを   音声の特徴パラメータとして利用できることを意味し,  

本方法は分析次数を少し多めに設定した場合でもホル   マントの真偽判定が不要な分析法と言える。   

乱3 スペクトル対(乱S㌘)との比較   

本方法は音声の線スペクトル表現肋(5)・(6)の一方式  

と言える。以下争 線スペクトル化方式の代表例と言え   る周知の線スペクトル対(LSP)との比較を行う。   

LSPは,周知のようにいったん通常のPARCOR分  

p= 8  

富0 ■ロ  

ー10   

−2ロ   

ー30  

︵  

0 1 2  3  4  5  

(kHこ1I  

ヨ  

2  

0   &  5  

(駄Hz)  

ダ=10  

古0 ■て  

−10  

−20   

−30  

古0 守  

一10   

−20   

−30  

0 † 2  3  A  5  

(k罰k)  

ご  

nV O nV   爪V ︵国王T ■2 づ  

0   ▲nU O O  ︵肉巧︶T−2−3  

&  5  

(k}Il:l  

3  ウ﹂  

0  0 】 2  3  息 5  

1kH::)  

′_ヽ 電7___】▲___▲ _1L____▲▲_   ′1ヽ 1r▲1 ▲】▲▲▲ 〈L_、−▲._∧ム._L,..  

lくり ▼ヽ′、・くt▲ ■ユーロいし■ しIl亡uく1ヽl−亡l ̄   lLリ YUlこll■lく1ヽl■ ヽ」uh口1 、、−t=一 ̄  

isもicandl量mespecもどⅦ㌍lp別官 主sも呈ca皿d亀i払eSpeCもr岨mby   も臨e卵OpOSedme地od   図3 線スペクトル表現の比較(合成母音/a/)   

Fig.3 Aeomparison ofline spectrum repreSentation  

forsyntheticvowel/a/.   

(5)

レ タ ー  

で,以下,合成音の線スペクトル化に適用することに   より,主としてホルマント周波数との対応関係の観点   から両方式の違いを実験的に示す。   

前述の合成母音/a/に適用して得られる線スペクト   ルの比較を図3に示すや 但し9 前処理として1階差分   後,分析窓長 ㍍=25.6msとし,(a)にLSP法による   線スペクトル,(b)に本方法による線スペクトルを示   し,図3の上段,中段および下段はそれぞれ分析次数   を♪=8,10および12とした場合の結果であり,図中   のスペクトル包絡は本台成育の声道伝達特性である。   

今の場合,前述のように本合成音の声道伝達特性の   次数は加=10であるので,分析次数カ=8(<如)の場   合,図3(a),(b)上段の結果より,両方法とも得ら   れる線スペクトルとホルマント周波数との間には特に   明確な対応関係は見られないと言える。   

分析次数少=10(=加)の場合,図3(a),(b)中段の   結果より,LSPでは周知のように線スペクトルがホル   マントを挟む形で互いに接近して,ホルマントの位置   を間接的に示しているのに対して,本方法では5(=  

β/2)本の線スペクトルが得られ,各線スペクトルはホ   ルマント周波数にほぼ一致し,ホルマントの位置を直   才妾的に示していると言える。   

分析次数カ=12(>加)の場合,図3(a),(b)下段の   結果より,LSPでは1.7kHzと3.1kHz付近にホル   マントに対応しない線スペクトルが生じるが,他の線   スペクトルはホルマントを挟む形で互いに接近した1   対の組を形成しているのに対して,本方法では2.2   kHz付近のホルマントに対応しない線スペクトルの   影響により,特に第3,第4ホルマントに対応すると   考えられる線スペクトルがホルマント周波数に対して   それぞれ高域にシフトしたものとなることがわかる。   

4。む す び   

極の位置をg平面の単位円上に拘束した拘束線形  

予測法の定式化を行い,本方法のホルマント周波数推   定精度ならびに線スペクトル対との比較を合成音によ   り検討した。その結果,本方法は正規方程式の次元な   らびに高次方程式の次数を通常の線形予測法の1/2に   半減することができ,かつ分析次数を適切に設定する   必要があるが,通常の線形予測法とほぼ同等の精度で   ホルマント周波数推定が可能であること,ならびに線   スペクトル対と比較してホルマントとの対応関係がよ   り明確な線スペクトルが得られることが明らかとなっ   た。更に,極の位置の拘束が極周波数推定値の頑健性   にも大きく寄与することが実験的に示された。このこ   とは音声のホルマント構造の情報を担った安定した線   スペクトルが得られることを意味し,本方法により得   られる線スペクトルは音声認識等における有効な特徴   パラメータとなり得ると思われるが,この点について   は現在検討中である。  

文   献  

(1)菅村 昇,板倉文忠: 線スペクトル対(LSP)音声分析   合成方式による音声情報圧縮 ,信学論(A),J64−A,8,  

Pp.599−606(1981−08).  

(2)日本数学会編: 岩波数学辞典(第3版) ,p.7帆岩波書  

店(1990)。  

(3)RosenbergA,E.: Effectofglottalpulseshapeonthe  

qualityofnaturalvowels ,J.Acoust.Soc.Am.,49,pp.  

583−590(1971).  

(4)粕谷英樹,和田充弘,岡田美智男: 線形予測分析法で得   られる極周波数からのホルマント周波数選択アルゴリズ   ム ,信学論(A),』66−A,11,pP.1144−1145(1983−11).  

(5)嵯峨山茂樹,板倉文忠: 複合正弦波モデルによる音声ス   ペクトルの分析 ,信学論(A),J64−A,2,pp.105−112(1981  

−02)。  

(6)菅村 昇,板倉文忠: 線形予測係数の線スペクトル表現   とその統計的性質 ,信芋論(A),J64−A,4,pp.323−  

330(198ト04).  

(平成3年6月12日,7月15日再受付)  

1685   

参照

関連したドキュメント

C =>/ 法において式 %3;( のように閾値を設定し て原音付加を行ない,雑音抑圧音声を聞いてみたところ あまり音質の改善がなかった.図 ;

このように,先行研究において日・中両母語話

averaging 後の値)も試験片中央の測定点「11」を含むように選択した.In-plane averaging に用いる測定点の位置の影響を測定点数 3 と

標準法測定値(参考値)は公益財団法人日本乳業技術協会により以下の方法にて測定した。 乳脂肪分 ゲルベル法 全乳固形分 常圧乾燥法

   騒音:伝播 ぱ

 分析実施の際にバックグラウンド( BG )として既知の Al 板を用 いている。 Al 板には微量の Fe と Cu が含まれている。.  測定で得られる

(1)  研究課題に関して、 資料を収集し、 実験、 測定、 調査、 実践を行い、 分析する能力を身につけて いる.

 千葉 春希 家賃分布の要因についての分析  冨田 祥吾 家賃分布の要因についての分析  村田 瑞希 家賃相場と生活環境の関係性  安部 俊貴