歯を介した骨導に着目した音声取得
Recording Voice focused on Tooth Vibration during Phonation
5113E012-3
鳥飼 雄亮 指導教員 及川 靖広 教授TORIKAI Yusuke Prof. OIKAWA Yasuhiro
概要:本研究では,歯を介した新たな相互音コミュニケー ションの実現を目的とし,マウスピース型歯骨導マイクロ ホンにより取得された歯骨導音声に対して分析・明瞭度評価を行う.明瞭度評価には主観的評価法として単音節明瞭 度試験,客観的評価法としてLPCケプストラム距離による評価を用いた.その結果,明瞭な歯骨導音声が取得可能 であり,騒音下でも音声取得が可能であることが確認された.またBluetoothを用いた歯骨導マイクロホンの無線化 を行い,歯骨導音声の近距離無線伝送が可能であることを確認した.
キーワード:音声取得,歯骨導音声,骨導音声,コミュニケーションエイド
Keywords: recording voice, tooth-conducted speech, bone-conducted speech, communication aid
1. ま え が き
音声取得では,目的の音声を明瞭に取得することが重 要である.一般的な音声取得手法にマイクロホンがあげ られるが,音声明瞭度が収録状況に左右される難点があ る.これに対し,骨導音声は発話時の音声が話者の頭骨 や皮膚組織などを伝搬し振動として検出されるものであ り,音声取得の方法として周囲の騒音が影響しにくい特 徴を有する.また皮膚に覆われていない歯から音声を取 得することで,皮膚などの影響を受けることなく効率良く 音声取得できることが考えられ研究を行ってきた[1] [2].
本研究では,マウスピース型歯骨導アクチュエータか ら取得された歯骨導音声の明瞭度を評価した.単音節明 瞭度試験では被験者による歯骨導音声の書き取りを行い,
その正答率から明瞭度を評価した.またLPCケプスト ラム距離を用い,同期収録した歯骨導音声と気導音声の 比較を行った.更にBluetoothによる無線化を行い,相 互音コミュニケーションに向けたデバイスの提案をする.
2. マウスピース型歯骨導マイクロホン
本研究で使用したマウスピース型歯骨導マイクロホン を図―1に示す.音声ピックアップには圧電素子を用い,
発話時に歯に伝わる振動を歯骨導音声として取得した.
圧電素子は中切歯,犬歯,第二大臼歯に接するように設 置し,取得される音声の設置場所による違いについて考 察を行った.
図―1 マウスピース型歯骨導マイクロホン
3. 歯を介した骨導に着目した音声取得
本研究では静寂・騒音下の2条件下にて歯骨導音声の 取得を行った.歯骨導音声の比較のため,騒音計による 気導音声を同時収録した.図―2に静寂下(発話内容: 5 母音),図―3に騒音下(発話内容: /waseda/)における 歯骨導音声(中切歯)および同時収録した気導音声のス ペクトログラムを示す.図中のカラーバーは音圧レベル である.
図―2から,各5母音の共鳴周波数の構成が確認でき る.また図―3から,気導音声では騒音の混入により発 話内容の共鳴周波数が確認できないが,歯骨導音声から は確認することができ騒音に対して頑健であると考えら れる.
Frequency [Hz]
1 2 3 4 5 6 7 8 9 10
0 1000 2000 3000 4000
SPL [dB]
0 20 40 60 80
Frequency [Hz]
1 2 3 4 5 6 7 8 9 10
0 1000 2000 3000 4000
SPL [dB]
0 20 40 60 80
Time [s]
Air-conducted Sound
Central Incisor
図―2 収録音声のスペクトログラム(静寂下)
Frequency [Hz]
0.1 0.2 0.3 0.4 0.5 0.6 0.7
0 1000 2000 3000 4000
SPL [dB]
0 20 40 60 80
Frequency [Hz]
0.1 0.2 0.3 0.4 0.5 0.6 0.7
0 1000 2000 3000 4000
SPL [dB]
0 20 40 60 80
Time [s]
Air-conducted sound
Central Incisor
図―3 収録音声のスペクトログラム(騒音下)
Air-conducted sound
Central Incisor Canine Tooth Second Molor 0
20 40 60 80 100
Accuracy rate[%]
Mono-sylable Articulation
subject A subject B
図―4 単音節明瞭度(静寂下)
Air-conducted sound
Central Incisor Canine Tooth Second Molor 0
20 40 60 80 100
Accuracy rate[%]
Mono-sylable Articulation
under 90dB - subject A under 80dB - subject B
図―5 単音節明瞭度(騒音下)
4. 歯骨導音声の明瞭度評価 4. 1 単音節明瞭度評価
歯骨導音声の主観的評価として単音節明瞭度評価を 行った.静寂・騒音下の2条件下で同時収録された歯骨 導音声および気導音声を被験者に聴取してもらい,その 正答率から明瞭度を評価した.
試験音声は,発話者を2名(talker A,B)用意し,67-S 語表の20単音節を話者の口元から約30 cmの位置に設 置した騒音計にて75〜85 dBの音圧レベルで読み上げ,
気導音声および歯骨導音声を同時録音した.また,ホワ イトノイズによる外部雑音無し・有り(騒音計位置にて 80 dB,90 dB)の3種類の条件下で録音を行い,騒音下 にて取得された音声についても評価及び考察を行った.
聴取実験には,20〜24歳までの男女11名の被験者が参 加し,単音節の書き取りを行った.被験者は密閉式ヘッ ドホンから試験音声を聴取し,音声が聞こえた通りに答 案用紙への回答の書き取りを行った.図―4に静寂下で 収録した音声,図―5に80および90 dB騒音下で収録 した音声に対する単音節明瞭度の結果を示す.
4. 2 LPCケプストラム距離
歯骨導音声の客観的評価としてLPC(Linear Predic- tiveCoding)ケプストラム距離(LCD)を用いた.LCD は,音声の元信号(気導音声)と比較音声信号(歯骨導・
骨導音声),それぞれのLPCケプストラム係数の距離を 計算したものであり,
LCD= 10 log 10
vu ut2
∑M
i=1
[cx(i)−c′x(i)]2 (1)
と定義される.ここでcx(i)は音声の元信号,c′x(i)は比 較音声信号のLPCケプストラム係数,MはLPC次数 である.このときLCDの値が0に近いほど,収録され た比較音声信号が音声の元信号に近くなると考えられる.
本実験におけるLCDは,被験者Aが5母音を発話した 時の気導・骨導および歯骨導音声から計測を行った.算
/a/ /i/ /u/ /e/ /o/
0 1 2 3 4 5 6 7
LPC Cepstrum Distance
Bone-conducted sound Central Incisor Canine Tooth Second Molor
図―6 5母音のLPCケプストラム距離平均値
図―7 無線化された歯骨導マイクロホン
出区間は母音の定常部分から0.5秒間,LPC次数は16, 512サンプル毎にLCDを計算、その時間平均を求めた.
図―6にLPCケプストラム距離の時間平均値を示す.こ の結果から,/a/,/i/,/e/において骨導音声に対し歯骨 導音声の方がLCDが小さく,より気導音声に近いこと が確認できる.
5. 歯骨導マイクロホンの無線化
本研究の目的である歯を介した相互音コミュニケー ションの実現には,様々な状況での音声信号の入出力に 対応するために無線化が必要である.そこで近距離無線 規格であるBluetoothを用いた歯骨導マイクロホンの無 線化を行った.無線化された歯骨導マイクロホンを図―
7に示す.
6. む す び
本研究では,歯骨導音声の取得およびその明瞭度評価,
無線化の検討を行った.マウスピース型歯骨導マイクロ ホンによる歯骨導音声の取得では,静寂・騒音下どちら においても,波形,スペクトログラムおよび明瞭度試験 による評価から明瞭な音声を取得することができると考 えられる.また歯骨導マイクロホンの無線化により音声 送信が可能であることを確認し,相互コミュニケーショ ンにむけたデバイスに向けた応用の可能性を示した.
今後,歯骨導マイクロホンによって取得された音声を 歯骨導アクチュエータにより受聴を行い,その明瞭度を 測定するなど,より効率的な歯骨導音声による相互コ ミュニケーションデバイスの開発に向けた研究を行う所 存である.
参 考 文 献
[1] 鳥飼雄亮,久世大,村松未輝雄,黒澤潤子,及川靖広,山 崎芳男, マウスピース型歯骨伝導アクチュエータを用い た音声取得 ,音講論集,pp.1337–1378, 2013.9.
[2] 鳥飼雄亮,久世大,黒澤潤子,及川靖広,山崎芳男, 歯骨 導音声の明瞭度評価 ,音講論集,pp.1479–1480, 2014.9.