第 4 章 縦アレイ NAM マイクロフォン による韻律表現
4.5 結果
4.5.1 BTOS の Up/Dp パワー比
まずF0曲線との比較が容易なBTOS音よりステレオ収録を行った.もし BTOS音でF0とUp/Dpパワー比との間に相関が全くなければ,この上下ス テレオ収録のパワー比をとる方法で,喉頭の上下動を推定し,その結果ピッ チが推定できるという仮説そのものが誤りであったことになる.
最初のサンプルはBTOS発声にて,すべて同音韻で,連続的に有声音ばか りで読み上げたものである.「ド,レ,ミ,ファ,ソ,ラ,シ,ド」の8音階 を同音韻「a」で途切れなく発声した.図4.6がその上下BTOS音である.
図4.7は左上がBTOS音のF0曲線と(上部NAMマイクロフォンのもの), 左下がステレオ収録により得られた Up/Dp パワー比曲線である.右の図は 横軸に F0 基本周波数(ピッチ),縦軸に Up/Dp パワー比をとったときの散 布図である.相関係数は0.869であり,強い相関を認めた.
図4.6 BTOSにて同音韻「a」の8音階発声
図4.7 F0とUp/Dpパワー比の相関
次にBTOSによる読み上げ文収録を行った.収録内容は最初にCalibration として「a」の音韻で「ド,ミ,ソ,1オクターブ上のド」を発声し,その後 音素バランス文「一週間ばかり,ニューヨークを取材した」を読み上げた.
図 4.8は収録した上 NAMマイクロフォン(U)と下NAM マイクロフォ ン(D)のBTOS音信号,スペクトラムとパワー曲線である.
NAMの通常音声化の際に,F0に代わるパラメータとしてアクセント情報 のパワー曲線を用いてはどうかという考えもあるが,図 4.8 のキャリブレー ションのパワー曲線を見てわかるように,パワーのみでは1オクターブも高 さの異なる音声が,ほぼ同じ値で表されてしまうことになる.
図4.8 縦アレイNAMマイクロフォンでステレオ収録した上下BTOS音
上部NAMマイクロフォンでサンプリングされた今の単独信号を,再度F0 曲線も加えて表示する.BTOSは肉伝導音であるが,通常音声の気導音収録 と同様に基本周波数が抽出され,図 4.9 のごとく F0 曲線が描出される.キ ャリブレーションで発声した「ド」と「1 オクターブ高いド」はその基本周 波数においてほぼ倍になっていて,正しく音階は発声されていることが観察 される.F0曲線は有声音部のみに現れ,無声音部や無音部は描出されない.
図4.9 上部NAMマイクロフォン収録BTOSのF0曲線
図4.10に上部NAMマイクロフォンでサンプリングされた信号のパワーを Up,下部NAMマイクロフォンでサンプリングされた信号のパワーをDpと したときの Up/Dp パワー比を折れ線グラフ化したものを掲げる.同時に単 独 NAM マイクロフォンの音信号より得られた前図の F0 曲線の部分を,比 較のために時間軸を重ねて下に並べてみた.
まずわかることは,無音部では小さなノイズのため Up/Dp パワー比は極 端値をとって大きく上下に変動するということ.また F0 のとぎれの部分に 応じた位置が,比率1からはみ出して音素によって特定の特異値をとってい ることもわかる.これは舌先や舌背など声門以外のところで音源の最強点を 持つ無声子音に相当すると考えられる.例えば「sh」などの摩擦性の無声子 音は口唇近くで発声するため Uのパワーが相対的に高くなり,図 4.10 の矢 印のように特異値をとる.
Up/Dpパワー比曲線から,これらの極端値,特異値を除いたものが,有声
音部の喉頭の上下動を表す曲線に当たると考えられる.キャリブレーション 部では相対的にF0の高さに応じて,Up/Dpパワー比曲線が階段状に上昇し ているのがわかる.発話時の Up/Dp パワー比曲線は特異値が多く,そのま ま比較して見ただけでは有声音部のF0との相関が読み取りにくい.
図4.10 BTOSのUp/Dp パワー比曲線とF0曲線との対比
そこで図 4.11 に単独サンプルのF0 値をもとに Up/Dp パワー比曲線の有 声音部区間だけを取り出し,F0とUp/Dpパワー比の散布図を描き,相関係 数を求めてみた.相関係数は0.683であり高い相関を示した.
図4.11 BTOSにおけるF0とUp/Dpパワー比の相関
BTOSについてはSOL 法によるUp/Dp 曲線は有声音部においてF0と相 関の高いパラメータであり,どれくらい高さの声を出そうとしているかを表 現する別の指標となりうると言える.