• 検索結果がありません。

修 士 論 文 概 要 書

N/A
N/A
Protected

Academic year: 2022

シェア "修 士 論 文 概 要 書"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

修 士 論 文 概 要 書

2010年 2月提出 専攻名

(専門分野) 情報理工学専攻 氏 名 峰村今朝明 研究指導名 ヒューマンインタフェ

ース 学籍番号 5108B122-1 CD

指 導 教 員

白井 克彦 印

研 究

題 目 べき級数展開による音声信号表現

1.はじめに

単母音におけるスペクトルの微分係数に着目し,音声 スペクトルのべき級数展開を行った.インパルス応答のz 変換は,中心点を 0 とした場合のべき級数展開と考える ことができ,中心点を任意に定めるべき級数展開への拡 張を試みた.あわせて,べき級数展開によるスペクトル 表現の次数と周波数帯域を確認した.べき級数展開を 行った多項式近似を用いて零点を導出し,単母音音声 スペクトルにおける特徴分析を行った. 

 

2.研究背景及び目的

周波数領域の微分を用いた分析では,位相特性の局 部的な変化として位相の微分により群遅延の導出をおこ なうことができる.周波数領域の微分と信号処理との関 連については高橋らの提唱する Cumultive  Harmonic  Analysis(C.H.A)により明らかにされている.周波数領域 の微分は,時間波形(インパルス応答)を時間窓による重 み付けと考えることができ,スペクトル高次微分はインパ ルス応答での遅延情報の強調である.また,単母音音 声に関してスペクトルの形状は音声知覚と関連付けられ,

特に音声了解性で用いられる狭帯域波形包絡線と関係 する.また,スペクトルの微分は,狭帯域波形包絡線の 形状を示すものとなる. 

  以上のことから本研究においては,スペクトルの微分 係数に着目しべき級数展開により多項式近似としてスペ クトルを表現することを試みる.また,多項式表現を行う ことにより零点の導出が可能となり,スペクトルの形状と 話者特徴といった話者特徴分析への応用および、スペ クトル欠損区間の復元を試みる. 

 

3.単母音スペクトルにおけるべき級数 展開

  単母音スペクトルのべき級数展開を行い,単母音スペ クトルにおいてべき級数表現に必要なスペクトル次数及 びべき級数展開近似次数と基点数,および表現周波数 帯域を分析する. 

3.1 手順

  単母音スペクトル表現に必要なべき級数展開次数と周 波数帯域を解析する.以下に手順を示す. 

(1) 単母音音声を無響室にて収録する. 

(2) 単母音音声波形の 1 フレーム長を自己相関により行 い 1 フレーム毎に切り出す.窓関数は,ハミング窓を 用いる. 

(3) 単母音スペクトルに対し,式(1)による微分係数を用

いてべき級数展開を行う.離散フーリエ変換は,零 点付加を含む 44100 点により行う. 

 

  (1)   

(4) べき級数展開近似次数と周波数帯域を評価する. 

3.2 実験結果及び考察

図1は,単母音”a”における中心点を 1000Hz としたス ペクトルのべき級数展開例である.次数を 6 次から 30 次 へと増加させることにつれて周波数帯域が拡大する.図 2 は,3 人の話者による同一母音音声 0Hz から 3600Hz までを 6 次までのべき級数展開によって表現した例であ る.スペクトルをおよそ 120Hz 毎に分割していくことにより 6次関数として表現できることを確認した.図 3 は,図 2 より得られた 3 人の話者によるべき級数展開近似式の次 数と原スペクトルとの差分を示している.図 3 より次数を 増やすことによって原スペクトルとの差が減少していくこ とが確認された. 

 

  図 1  単母音“a”のスペクトルにおけるべき級数展開 

近似次数 k 

  図 2  3 人の話者による単母音“a”のべき級数展開 6 次 多項式表現 

(2)

  図 3  べき級数展開式と原スペクトルとの誤差   

4. べき級数展開の応用

    べき級数展開における音声信号表現への応用として,

単母音スペクトルのべき級数展開多項式を用いた零点 導出による話者特徴分析およびフォルマント欠損からの 復元を検討する. 

4.1 話者特徴分析への応用

べき級数展開による多項式近似を用いて零点の導出 を行い話者毎の零点分析を行う. 

4.1.1 実験結果及び考察

    図 4 は図 2 によって得られた帯域別 6 次多項式によ る 1800〜3600Hz 帯域の零点分布,図 5 は,図 2 によっ て得られた多項式において 1 次の項を除いた 1800〜

3600Hz 帯域の零点分布である.話者毎に零点分布の 違いが確認される. 

  図4 単母音“a”6次近似スペクトルの零点

図5 単母音”a”のスペクトルにおける1次の項を除 いた多項式近似の零点

 

4.2フォルマント欠損からの復元

  べき級数展開が微分係数のみに依存することを利用し フォルマント欠損区間からの復元を検討する.微分係数 の導出には数値微分法を用いることとする.べき級数展 開の打ち切り次数については,6 次とする. 

4.2.1 実験結果及び考察

  図 6 は,フォルマント欠損区間からのフォルマント復元 例である.周波数欠損区間の低域が真値である場合,

原スペクトルに近い予測が可能となることを確認した. 

 

      図 6  フォルマント欠損区間復元   

5.まとめと今後の展望

    母音のスペクトルをおよそ 120Hz 程度に分割すること によって 6 次のべき級数展開による多項式表現で表され る.また,べき級数展開において近似次数を増加させる ことにより原スペクトルとの差が減少していくことを確認し た.表現次数については,話者によらずほぼ一定である ことをあわせて確認された.べき級数展開により得た多 項式からの零点について,話者毎に分布の差がみられ る.特に,1 次微分を除いて導出して得た零点について,

話者毎の違いがより顕著に出現している.零点のもつ物 理的特徴および微分係数の次数と話者特徴の関係に ついて追求していくことが今後の課題となる. 

  文献 

[1]峰村今朝明,村上真,東山三樹夫,白井克彦,“べき 級数展開によるスペクトル予測推定手法の検討,”電子 情報通信学会総合大会,2008 

[2]峰村今朝明,後藤理,東山三樹夫,白井克彦,“べき 級数展開によるフォルマント表現,”,電子情報通信学 会ソサイエティ大会 

[3]KesaakiMinemura,SatoruGotoh,MikioTohyama,Katsu hikoShirai,”Reconstruction  of  Missing  Formants  based  on  Spectral  Power  Series  Expansion”,156th  Meeting  Acoustical Society of America,2008   

復元区間

Frequency

参照

関連したドキュメント

Wireless Communications Networking and Mobile Computing (WiCOM), 2010 6th International

どがあくまで IP マルチキャストの拡張・発展形といった のものが多い。ネットワーク層で動作する IP

入力アプリケーションに対する,各手法の低電圧と面 積を表 1 に示す.演算器における電力消費量を図 2 に 示す.図 3

本稿では、有線ネットワークにボトルネックがあり、仕様

k周目までエリアにおいて,各円形エリア間に隙間 が生じていないかを調査し,隙間がある場合はk周

全試行回数 974 回中、正解数 867 回という結果 から、錯視 Captcha の正解率は 89.0% 、平均回答 時間は 5.78 秒だった。 Captcha

[r]

図 3 に,単語あたりの学習データ数に対する単語誤り 率を示す.これより, 75 発話のように比較的多くの単語 発話を学習に用いた場合は, LLP を用いた手法 (LLP-