5.1 明らかにしたこと
本研究では残響環境下でのヒトの発話変形を先行研究での得られた特徴と音声 の変調スペクトルに着目した上で調査した.母音のF 1,F 2に着目し,変調スペ クトルを分析した結果,ヒトは残響時間が長いときの発話において変調スペクト ルの変調周数成分を増幅させていることが分かり,なかでも変調周波数10 Hz付 近での増幅が顕著であったことから10 Hz付近に了解度向上の手掛かりがあるこ とを示唆した.また,F 2よりもF 1の方が変調周波数成分が大きく増幅している ことからF 1の方が残響環境下での了解度向上に関係している可能性があること がわかった.
発話変形を分析することで得られた特徴量を用いて実験刺激を作成し,残響環 境下での了解度調査を行った.この調査により,残響時間3sの残響環境において 特定の変調周波数成分を引き上げることは了解度向上に有意であることを示した.
また,ヒトは残響時間の長い残響環境での発話において変調周波数成分を引き上 げる補償運動を行い,了解度向上を図っていることを明らかにした.
この研究の波及効果として,残響が存在し,音が聞き取り難い室内公共空間に おいても正確な情報を伝達することができるようになり,駅ホームなどでの災害 時の避難誘導音声のような正確な情報が求められる状況にも役立てることができ ると考えられる.
5.2 残された課題
今回,母音のF 1,F 2両方の周波数帯域から出力されたパワーエンベロープに 対して変調周波数成分の引き上げを行ったが,F 1に該当する変調周波数成分のみ を引き上げた音声とF 2に該当する変調周波数成分のみを引き上げた音声を用い て了解度調査を行い,比較,検討することで了解度に大きく関わっている情報を 特定する必要がある.また,先行研究で報告されている母音のF 1,F 2の成分と 本研究で得られた変調周波数成分の両方を変化させた音声を合成し,了解度調査 を行うことで了解度向上に最も有意である音響特徴量の検討する必要がある.
謝辞
本研究を進めるにあたり,ご指導して頂いた赤木教授に心から御礼申し上げます.
研究室会議において多くの助言を下さった鵜木教授に心から感謝致します.
研究計画を進めるうえで多く助言をしてくださり、本研究に必要なデータの提 供をしてくださった脳情報通信融合研究センター研究技術員の久保 理恵子氏に心 から感謝いたします.
日頃から助言をして頂き,ご協力してくださった研究室の皆様に心から感謝致 します.
最後に本学での研究活動を支え,温かく見守ってくれた家族に心から感謝致し ます.
参考文献
[1] Cooke, M., King, S., Garnier, M., Aubanel, V., “The listening talker: A review of human and algorithmic context-induced modifications of speech,
”Comput. Speech Lang, vol. 28, no. 2, pp. 543–571, 2014.
[2] Lombard, E., “Le signe de I elevation de la voix, Ann. Mal. De L, ”Oreille et du Larynx, vol. 37, pp. 101–119, 1911.
[3] T.V. Ngo, R. Kubo, D. Morikawa, and M. Akagi, “Acoustical analyses of tendencies of intelligibility in lombard speech with different background noise levels, ”Journal of Signal Processing, vol. 21, no. 4, pp.171—174, 2017.
[4] A.K. Nabelek, T.R. Letowski, F.M. Tucker, “Reverberant overlap- and self-masking in consonant identfication, ” J. Acoust. Soc. Am., vol. 86, no. 4, pp.
1259—1265, 1989.
[5] 程島奈緒, 荒井隆行, 栗栖清浩, “雑音・残響下の発話による音声の明瞭度改 善,”日本音響学会 2010年秋季研究発表会講演論文集, pp.521–524, 2010.
[6] 程島奈緒, 荒井隆行,栗栖清浩, “「はっきり」と発話した音声の明瞭度と聴覚 印象評価〜残響下を想定した発話の場合〜,”日本音響学会2008年秋季研究発 表会講演論文集, pp.345–346, 2008.
[7] N. Hodoshima, T. Arai, and K. Kurisu, “Effects of training, style, and rate of speaking on s peech perception of young people in reverberation, ” Proc.
Acoustics 08, pp. 2393–2397, 2008.
[8] 荒井隆行, 木下慶介, 程島奈緒, 楠本亜希子, 喜田村朋子, “音声の定常部抑圧 処理の残響に対する効果,” 日本音響学会研究発表会講演論文集, vol. 1, pp.
449–450, 2001.
[9] T. Arai, K. Kinoshita, N. Hodoshima, A. Kusumoto and T. Kitamura, ”effects on suppressing steady-state portions of speech on intelligibility in reverberant environments” Acoust. Sci. & Tech., 23, pp. 229–232 2002.
[10] 辻美咲,荒井隆行, 安啓一, “残響環境における音声明瞭度改善を目的とした子 音強調・母音抑圧による前処理,”日本音響学会誌, vol. 69, no. 4, pp. 179–183, 2013.
[11] 久保理恵子, 森川大輔, 赤木正人, “発話時の残響時間の違いが 残響下での 音声了解度に与える影響,” 日本音響学会2017年秋季研究発表会講演論文集, pp.369–370, 2017.
[12] 久保理恵子,赤木正人, “発話時の残響時間によるフォルマント周波数の変化と 残響下における了解度, ” IEICE technical report, vol. 117, no. 515pp.39–44, 2018.
[13] R. M. Uchanski, D. B. Pisoni, R. E. Remez, “The Handbook of Speech Per-ception(Clear speech),” Blackwell Publishing, chapter9, 2008.
[14] Schroeder, M. R., “Modulation transfer functions: definition and measure-ment,” Acustica, Vol. 49, pp. 179–182, 1981.
[15] Atlas, L., Greenberg, S., and Hermansky, H., “The Modulation Spectrum and Its Application to Speech Science and Technology,” Interspeech Tutorial, Antwerp, Belgium, 2007.
[16] M. Komatsu, T. Arai, ”Modulation Spectrum and Rhythmic Units of Japanese,” Journal of the Phonetic Society of Japan, vol.13, no.3, pp85–99, 2009.
[17] 近藤公久, 天野成昭, “親密度別単語了解度試験用音声データセット 2007 (FW07),” NTT音声資源コンソーシアム, 2007.
[18] 桑原尚尾, 匂坂芳典, 武田一哉,阿部匡伸, ”研究用ATR 日本語音声データベー スの作成(別冊II 不特定話者テキスト
) ,” ATR Technical Report, pp.26–47, 1989.
[19] L. Milic, “Multirate Filtering for Digital Signal Processing: MATLAB Appli-cations,” University of Belgrade, 2009.
[20] Houtgast, T. and Steeneken, H. J. M., “The Modulation Transfer Function in Room Acoustics as a Predictor of Speech Intelligibility,” Acustica., vol. 28, pp. 66–73, 1973. 98
[21] R. Drullman, J. M. Festen, and R. Plomp, “Effect of reducing slow temporal modulations on speech reception, ” J. Acoust. Sco. Am., vol. 95, no. 5, pp.
2670–2680, 1994.