( 第 6 回 ) 音響工学
情報学部 情報学科 西宏之
今日学ぶこと ~ 音声
• 音声の特徴をザックリと
• 音声の器官
• ソースフィルター理論
• 声帯音源
• 声道
• F1-F2 ダイアグラム
• 声紋
• 広帯域スペクトログラム
• 狭帯域スペクトログラム
• 有声音と無声音
• 音声合成
• 音声の圧縮
• ボコーダ
• 人工喉頭
• ヘリウムボイス
• http://floor13.sakura.ne.jp/book07/book07.html
音声の特徴をザックリと
• 「音響工学」における「音声工学」
• 音声も音のうち
• しかし,音声の特徴から,取り扱う技術がやや特殊
• 音の 3 要素に相当する者が音声にもある.ただし,,,
• 大きさ → 声のパワー情報 ( 声の大きさ )
• 高さ → 声のピッチ情報 ( 声の高さ )
• 音色 → 声の持つ言語情報 ( 音韻 )
音声の器官 ( 発声器官 )
• 声帯 → 音源となる
• ブザーのような音
• 声道 → 声の内容を決める
• 音の調子を調節して,出したい声に変化させる
• 例えば,「ア」は口腔の全体を広げる
• 「イ」は口腔の全体を扁平にする
• 「オ」は前方を少しすぼめる
• etc
• 教科書 WEB サイトのデモページで音を確認
鼻腔 口腔
口唇
ソースフィルター理論
• 声帯が周期的に震えるなら声も周期的 になる → 倍音構造に
• Audacity で音の周期性を確認しよう
• → 「ア」「イ」「ウ」「エ」「オ」
• 右図のように,音源をある種のフィル ターに通すことで人の声が作られると いう考え方に基づく理論を「ソース フィルター理論」という.
• フィルターは特定の周波数成分を強調 する役目がある
音源の周波数特性
声道の周波数特性
音声全体の周波数特性
声帯
基本周波数は声帯の振動数
• 成人男性 70 ~ 150Hz
• 成人女性 200 ~ 400Hz
• 子供 300 ~ 500Hz
• みくりさんは何 Hz ?
• ひらまささんは何 Hz ?
• ピッチシフターとは
• 教科書 WEB サイトで確認
声道
• 共鳴によって特定の周波数を強調する一種のフィルター
• 協調される周波数を「フォルマント」という
• フォルマントには低い周波数から順に...
• 第1フォルマント (F1)
• 第2フォルマント (F2)
• 第3フォルマント (F3)
• ア
• イ
• ウ
• エ
• オ
F1 - F2 ダイアグラム
成人男性の F1-F2 ダイアグラム F1-F2 ダイアグラムの年齢・性差
声紋 ~ 音声のスペクトログラムのこと
広帯域スペクトログラム 狭帯域スペクトログラム
有声音と無声音
• 声帯振動を伴う音声を有声音
• 母音,有声子音 (b d g)
• 声帯振動を伴わない音声を無声音
• (p t k s)
• 破裂音 (p t k) ,摩擦音 (s)
音声合成
• 有声音の音源:声帯音源 ( 三角波 )
• 無声音の音源:白色雑音
• 上記に声道フィルターを通して合成する技術を音声合成という
人工喉頭
• 喉頭がんや事故などで喉頭を失った人に声帯音源となる信号を 提供する装置
• 声道は本人のものを従来通り使う.
ヘリウムボイス
• ヘリウムを吸ってから発話すると,甲高い声に変化する現象
• ヘリウムは軽いので同じ力で話しても共振周波数が異なるため フォルマントが移動する