• 検索結果がありません。

NAM の Up/Dp パワー比

ドキュメント内 博士論文表紙 (ページ 133-139)

第 4 章  縦アレイ NAM マイクロフォン による韻律表現

4.5   結果

4.5.2   NAM の Up/Dp パワー比

 そこで図 4.11 に単独サンプルのF0 値をもとに Up/Dp パワー比曲線の有 声音部区間だけを取り出し,F0とUp/Dpパワー比の散布図を描き,相関係 数を求めてみた.相関係数は0.683であり高い相関を示した.

図4.11  BTOSにおけるF0とUp/Dpパワー比の相関

  BTOSについてはSOL 法によるUp/Dp 曲線は有声音部においてF0と相 関の高いパラメータであり,どれくらい高さの声を出そうとしているかを表 現する別の指標となりうると言える.

音声は同時録音ができないため,基準となる F0 が得られない.別に収録し た必ずしも同じ発話でない通常音声のF0と比較せねばならない.

図4.12 縦アレイNAMマイクロフォンでステレオ収録した上下NAM音

 先程のBTOSと同内容の文章「一週間ばかりニューヨークを取材した」を NAM 発話で読み上げ,縦アレイ NAM マイクロフォンで上下ステレオ同期 収録を行った.BTOS 音と NAM 音ではパワーがかなり異なるため,NAM 音サンプリングに適した出力レベルに調節した.図4.12は上下NAMマイク ロフォン(UとD)で収録したNAM音のスペクトラムとパワーである.

  図 4.13は,NAMの Up/Dpパワー比曲線である.上部 NAMマイクロフ ォンから得られたNAM音のスペクトラム,パワー,F0プロットと同期させ

て表示した.当然のことながらNAMではF0曲線は描出不能である.

図4.14に先程のBTOSでの同内容発話のUp/Dpパワー比曲線を比較のた めに再掲する.NAMとBTOSで,同内容発話時に極端値,特異値も含めて ほぼ同じパターンの曲線が描けているのがわかる.

図4.13  NAMのUp/Dpパワー比曲線

図4.14 同内容発話のBTOSのUp/Dpパワー比曲線

NAMのUp/Dpパワー比曲線において無音部の極端値や無声子音の特異値 はBTOSのそれと同様であるが,NAMでは「z」のような有声子音にあたる 音素でも特異値をとっている.「sh」や「k」等の無声子音はそれぞれ再現性 をもって特異値をとっていることがわかる.これらの有声・無声子音による 特異値や,ポーズや促音による極端値が,従来の「F0のとぎれ」の部分に相 当し,これらをのぞいたUp / Dpパワー比曲線が,喉頭部上下動の相対的位 置,すなわちNAM発話時のピッチ準備状態,韻律意図,もしくは同内容を BTOS発話したときの喉頭上下動の「クセ」を表現しているものと考えられ,

これを元にしてNAM発話のピッチ予測が可能ではないかと思われる.

図4.15  NAMのUp/Dpパワー比のドット表示とBTOSのF0との比較

図4.15にこのUp/Dpパワー比をドットでプロットしたものも掲げるが,

有声音に当たる部分はドットが集約しているため,擬似 F0 曲線として見や すいものとなる.図4.15の下段のBTOSでの同内容発話のF0曲線の形状と

比較して,この例ではその相似を視認できる.ただしNAMとBTOSは同時 発話ができないため,同内容発話とはいっても時間伸縮の問題があり,意識 的に同じスピードで読み上げてはいるが,単純に相関を数値的に表すことは 難しい.

 通常音声での読み上げとNAMでの読み上げは,話速を一致させることは 不可能であり,また単独NAM音情報からのでのピッチ情報がなく,また本 当に通常音声発話時と同じ韻律,同じ喉頭の上下動で読み上げているかを判 別できないため,ここでは単純に相関をとることをやめ,同じ音素バランス 文 4 個ずつを,二人の男性が NAM と通常音声で読み上げたものを用いて,

通常音声のF0とNAMのUp/Dpをプロット表示で比較した例を掲げるに止 めることにする.たまたまうまく行った例で数値的相関をひねり出すよりも,

できるだけ多くの例を見てもらう方が,この手法の将来のために大切である と考えたからである.

図4.16 がF0とUp/Dp プロットの計8個の比較であるが,上は通常音声 のF0,下がUp/Dpである.話者はNAM発声のベテランである筆者N(左 列)とNAM発話収録経験のない男性話者H(右列)である.なおNAM発 話収録内容をリアルタイムでヘッドフォン聴取せず,発声に明確なフィード バックがかからぬようにした.その方がむしろ通常音声発話時の喉頭部上下 動のクセが反映されると考えたからである.NAM マイクロフォンは上を最 適装着位置に固定し,マイク間隔は二人ともマイク中心の間隔で3cm,同じ NAM マイクロフォンセットを用いて実験を行った.比較的通常音声との形 が似ていると感じられるUp/Dpプロットもあるが,そうでないものもある.

極端値や特異値は収録の条件によって大きく異なるが,無音部が極端値,

子音相当部は極端値の原則はほぼ再現されている.むしろ有声音部のプロッ トが散らばって特異値に見えてしまう部分もある.有声音部にあまりばらつ きが多いと視認では曲線としての上下動がわからなくなる.いずれにせよ,

NAMのピッチ予測が,SOL法で可能かということに関して,今の段階で結 論めいたことは言えない.

図4.16 男性二話者による通常音声のF0とUp/Dp比

ドキュメント内 博士論文表紙 (ページ 133-139)