• 検索結果がありません。

博 士 ( 工 学 ) 神 山 直 久 学 位 論 文 題 名

N/A
N/A
Protected

Academic year: 2021

シェア "博 士 ( 工 学 ) 神 山 直 久 学 位 論 文 題 名"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

博 士 ( 工 学 ) 神 山 直 久

学 位 論 文 題 名

音 声 生 成 過 程 に お け る 音 響 特 徴 量抽 出 と 実 体 的 声 道 モ デ ル に 関 す る 研 究

学 位 論 文 内 容 の 要 旨

  我々 が,音声合成の高品質にっいて考える時,そのファクタとして,「了解性」,「自然性」,「個 人 性」 , 「情 緒性」と いったものが挙げ られる。前者の2っは,主に 韻質に関係するもの で,いわ ゆ る「 聴 き易 い」 音 声を 指す も ので ある 。 一方 ,後 者 の2っは音質 に関係している。音 声には,

誰 の声 で ある のか と いう こと , どの ような心的状 態であるのかとい った情報をも含むこ とが可能 で あ り , こ の よ う な 大 き な 利 点 を 十分 生 かし てこ そ 高品 質の 音 声合 成が 実 現す ると 言 える 。   人間 の 音声 は, ア クセ ント や イン トネーション といったことを論 じる以前の,単なる 発声の段 階 で既 に 個人 性は 生 じて いる 。 発声 は,基本的に は音波の伝搬とい った物理現象である から,発 声 の過 程 を追 って い く際 に出 会 う, 例えば声帯の 振動状態,あるい は声道形状,声道長 といった 要素が そのまま個人の特 徴パラメー夕量と なり得るわけである 。

  声道 ア ナグ ロ・ モ デル は, 人 間の 発声器官であ る声道を模擬する もので,音声の生成 機構を声 道 内の 音 波の 伝搬 ま でさ かの ば って シミュレート することで,合成 音が得られるモデル として知 ら れて い る。 このモデ ルは,音響管の伝 搬問題を1次元の分布定数線 路もしくはディジタ ル・フィ ル タ で 近 似 表 現 す る こ と で , コ ン ピ ュ 一 夕 に よ る 音 声 合 成 器 が 実 現 さ れ る 。   しか し なが ら, 声 道ア ナグ 口 ・モ デルが実体的 モデルであると言 っても,近似モデル である以 上 ,い く っか の現 象 にっ いて は 簡単 化がなされて いる。現在,簡単 化のため近似,ある いは考慮 さ れて い ない 現象 の いく っか は ,合 成音のより高 品質化への重要な 特徴量となり得ると いう指摘 が なさ れ るよ うに な った 。例 え ば, 口唇部の境界 条件もしくは音源 生成部においての空 力学的な 考 察が な され てい な いこ とに よ って ,高周波数に おいて物理モデル との整合性がとれな いこと,

ま たは 鼻 腔を 単に 音 響管 モデ ル とし て扱うのみで は鼻音の実測結果 をうまく説明できな いことな ど が挙 げ られ る。 本 研究 で主 に 取り 扱う「声道壁 インピーダンス」 もそのひとっであり ,声道壁 の 振動 に よっ て起 こ る声 道中 音 波の 伝搬損失が, 音声生成過程に複 雑かつ効果的に影響 している と 考え ら れ, 十分 な 検討 を必 要 とす るテーマであ る。本論文では, この声道壁振動にっ いて,従

(2)

来の 音響 管モデ ルの簡 単化に よって 高品 質化の 妨げと なって いる 諸問題 点を挙 げるとともに,改 良を 行う ために 必要な 人間の 物理的 音響 特徴量 の取得 を試み る。

  本 論 文 は9章 よ り 構 成 さ れ て い る 。1章 の 緒 論 に 続 く 各 章 の 概 要 を 以 下 に 述 べ る 。   第2章 で は,人 間の 音声生 成機構 にっい ての 概説と ,声道 アナロ グモデ ルの 概説を 行う。 音声 生成 機構 モデル を「音 源部」 ,「声 道部 」,「放射部」に分離し,それぞれにっいて「物理的モデ ル」 ,「 電気的 モデル」,「ディジタル・モデル」と移行していく段階を示す。また,3章以後の考 察で 多く 使用さ れる声 道伝達 特性の 計算 法にっ いても 述べる 。

  第3章 で は,本 論文 の全般 に渡っ て考察 され る声道 壁イン ピーダ ンスに っい ての概 説を行 う。

ここ では ,従来 より研 究され ている 声道 壁イン ピーダ ンスの 報告 例を示 し,そ れらがどのように して 得ら れたか を解説 する。 また, 声道 壁から の放射 を考慮 した 声道モ デルの ,電気的等価回路 にっ いて 述べる 。

  第4章 で は,人 間の 頬を音 圧で駆 動する こと でその 音圧反 射特性 を実測 し, そこか ら頬の 音響 イン ピー ダンス を導出 する。 音響管 法を 用いれ ば,そ の音響 管を □唇部 より口 腔内に挿入するこ とに よっ て,声 道壁を 直接測 定試料 とし て用い ること が可能 であ る。実 験で得 られた頬の音圧反 射 係 数 の周 波 数 特 性 から , 声 道 壁イン ピーダ ンスを 導出 する際 ,単純 なRL素 子によ るパラ メー タ で 同 定す るこ とは困 難であ ること を示し ,測 定周波 数の低 滅,高 域で 異なっ た値を 持つ2種類 のイ ンピ ーダン スによ って近 似を行 う。

  第5章 で は,弾 性体 を壁と する均 一音響 管を 用いて ,管内 の音圧 分布の 測定 結果か ら減衰 定数 の同 定を 行う。 管壁を 粘弾性 体モデ ルに よって 表現し ,この 時得 られる インピ ーダンスを壁イン ピ ー ダ ンス とし て音響 管モデ ルヘ導 入すれ ば, 管壁の 共振に よる伝 達特 性の変 化も1次元 の伝搬 モデ ルに よって 十分近 似可能 となる こと を示す 。

  第6章 で は ,MRI・CTを用 い て 声 道 形状 の 抽 出 を 行い , そ こ か ら得 ら れ る 断面 積関数 ,周長 関数 およ び声道 形状の 潰れ度 のファ クタ から, 母音に よる特 徴量 の比較 検討を 行う。実際の声道 形状 デ一 夕の取 得は, 音声生 成過程 にお ける個 人性の パラメ ータ を獲得 すると いう点で有効であ り , 第4,5章 で 得 られ た 結 果 にっ いて, より 実体的 な考察 が可能 となる 。こ こで得 られる 「潰 れ度 関数 」は, 声道断 面積関 数と同 様に 非常に 特徴的 な概形 を持 っこと を示す 。また,ここでは 同 時 に 鼻 腔 の 断 面 積 関 数 の 抽 出 も 行 い , 鼻 腔 を 考 慮 し た 声 道 伝 達 特 性 を 求 め る 。   第7章 で は,声 道壁 インピ ーダン スの粘 弾性 体モデ ルによ る表現 と,声 道モ デルヘ の導入 につ い て 述 べる 。 第3,4章 で 得 ら れ た声 道 壁 イ ン ピー ダ ン スの結 果を 参照し ,さら に第5章で 議論 した 粘弾 性体モ デルを 声道壁 に適応 させ て,実 測結果 を近似 する ことが 可能な 声道壁モデルを構

463

(3)

築する。このモデルfま,壁の軟らかさを壁厚のパラメ一夕を変化させることによって調節するこ とが 可能である。第6章で抽出し た声道断面積関数を用い,さらにMR画像から声道内の壁厚 分布を視察することで,より実体的な声道内減衰特性を持つ声道モデルとしての検討が可能とな る。得られた声道伝達特性は,実音声スペクトルとほぼ同様な特性を示し,良好な近似が可能と なることを述べる。声道内で声道壁インピーダンスが様々な値で分布している場合,最も軟らか い,すなわち影響の大きい部分がどこに位置するかによって声道伝達特性は変化し,またその影 響の度合は母音の調音状態によって異なることが確認できる。

  第8章で扱うのは,これまでの議論とは多少異な、る現象にっいてである。第7章までは,声道 内の音圧によって生じる声道壁振動にっいての諸問題を取り扱った。ここでは,声道壁振動の影 響を考える時もうひとつ重要となる声帯振動によって直接引き起こされる壁の 機会的 振動に っいて考察する。この章では,合成音の実験として声帯振動の変位が振動波として声道の壁部分 を伝搬してゆくような声道シミュレータを構築する。振動波の影響は,定常母音においても分析 スペクトルのホルマントの時間的なばらっきが確認される。またこの現象も,/i/で最も大き いといった,調音状態による明確な違いがあることを示す。

  第9章は,本論文全体の総括として,本研究で得られた成果を要約する。また,残された課題 にっいての記述を行う。

  本研究で得られた音響特徴量のいくっかは,出力端で観測される音声時系列波形を観測するだ けでは十分な説明ができない,いくっかの複雑な現象の解明にっながり,声道内で起こる多くの

(4)

学位論文審査の要旨

  音 声には ,誰の 声であ るの かとい うこと ,どの よう な心的 状態で あるの かとい った情報をも含 むこ とが 可能で あり, このよ うな 大きな 利点を 十分生 かして こそ 高品質 の音声 合成が実現すると 言え る。 個人性 に関し てtま,ア クセン トや イント ネーシ ョンといったことを論じる以前の,単な る発 声の 段階で 既に生 じてい ると 言える 。発声 は,基 本的に は音 波の伝 搬とい った物理現象であ るか ら, 発声の 過程を 追って いく 際に出 会う, 例えば 声帯の 振動 状態, あるい は声道形状,声道 長 と い っ た 要 素 が そ の ま ま 個 人 の 特 徴 パ ラ メ 一 夕 量 と な り 得 る わ け で あ る 。   本 研究で 主に取 り扱う 「声 道壁イ ンピー ダンス 」も そのひ とっで あり, 声道壁 の振動によって 起こ る声 道中音 波の伝 搬損失 が, 音声生 成過程 に複雑 かつ効 果的 に影響 してい ると考えられ,十 分な 検討 を必要 とする テーマ であ る。本 論文で は,こ の声道 壁振 動にっ いて, 従来の音響管モデ ルの 簡単 化によ って高 品質化 の妨 げとナょっている諸問題点を挙げるとともに,改良を行うために 必要 ナょ 人間の 物理的 音響特 徴量 の取得 を試み る。本 論文は9章 より構 成さ れている。1章の緒論 に続 く各 章の概 要を以 下に述 べる 。

  第2章 で は,人 間の音 声生成 機構 にっい ての概 説と, 声道ア ナグ ロモデ ルの概 説を行 う。 音声 生成 機構 モデル を「音 源部」 ,「 声道部」,「放射部」に分離し,それぞれにっいて「物理的モデ ル 」 , 「 電 気 的 モ デ ル 」 , 「 デ ィ ジ タ ル ・ モ デ ル 」 と 移 行 し て い く 段 階 を 示 す 。   第3章 で は,本 論文の 全般に 渡っ て考察 される 声道壁 インピ ーダ ンスに っいて の概説 を行 う。

ここ では ,従来 より研 究され てい る声道 壁イン ピーダ ンスの 報告 例を示 し,そ れがどのようにし て得 られ たかを 解説す る。

  第4章 で は,人 間の頬 を音圧 駆動 するこ とでそ の音圧 反射特 性を 実測し ,そこ から頬 の音 響イ ンピ ーダ ンスを 導出し た。音 響管 法を用 いれば ,その 音響管 をロ 唇部よ り口腔 内に挿入すること によ り, 声道壁 を直接 測定試 料と して用 いるこ とが可 能であ る。 結果よ り,声 道壁インピーダン ス は 単 純なRL素 子 によ っ て 同 定 する こ と は 困 難 であ る こ と を 示し , 測 定 周波 数の低 減, 高域

465

夫 彦

次 則

信 吉

香 正

永 小

栃 小

授 授

授 授

   

   

(5)

で異 なっ た値を 持つ2種類 のイン ピーダ ンス によっ て近似 を行っ た。

  第5章 で は ,弾性 体を壁 とす る均一 音響管 を用い て,管 内の 音圧分 布の測 定結果 から 減衰定 数 の同 定を 行った 。管壁 を粘弾 性体 モデル によっ て表現 し,こ の時 得られ るイン ピーダ ンスを壁イ ン ピ ー ダン ス として 音響管 モデ ルヘ導 入すれ ば,管 壁の 共振に よる伝 達特性 の変化 も1次元の 伝 搬モ デル によっ て十分 近似可 能と なるこ とを検 証した 。

  第6章 で は ,MRI一CTを用 い て 声 道 形状 の 抽 出 を 行い , そ こ か ら 得ら れ る 断 面積関 数, 周長 関数 およ び声道 形状の 潰れ度 のフ ァクタ から, 母音に よる特 徴量 の比較 検討を 行った 。実際の声 道形 状デ ータの 取得は ,音声 生成 過程に おける 個人性 のパラ メ一 夕を獲 得する という 点で有効で あり ,よ り実体 的な考 察が可 能と なる。

  第7章 で は ,声道 壁イン ピー ダンス の粘弾 性体モ デルに よる 表現と ,声道 モデル への 導入に つ いて 述べ た。こ のモデ ルは, 壁の 軟らか さを壁 厚のパ ラメ一 夕を 変化さ せるこ とによ って調節す るこ とが 可能で ある。 得られ た声 道伝達 特性は ,実音 声スペ クト ルとほ ぼ同様 な特性 を示し,良 好な 近似 が可能 となる 。声道 内で 声道壁 インピ ーダン スが様 々な 値で分 布して いる場 合,最も軟 らか い部 分がど こに位 置する かに よって 声道伝 達特性 は変化 し, またそ の影響 の度合 は母音の調 音状 態に よって 異なる ことを 示し た。

  第8章 て は ,声道 壁振動 の影 響を考 える時 もうひ とつ重 要と なる声 帯振動 によっ て直 接引き 起 こさ れる 壁の 機械的 振動 にっ いて考 察した 。ここ では合 成音 の実験 として 声帯振 動の変位が 振動 波と して声 道の壁 部分を 伝搬 してゆ くような声道シミュレ一夕を構築した。振動波の影響は,

定常 母音 におい ても分 析スペ クト ルのホ ルマン トの時 間的な ばら っきが 確認さ れた。 またこの現 象も ,調 音状態 による 明確な 違い がある ことが 示され た。

  第9章 は , 本論文 全体の 総括 として ,本研 究で得 られた 成果 を要約 する。 また, 残さ れた課 題 にっ いて の記述 を行う 。

  以 上のよ うに本 論文で は, 音声合 成モデ ルを発 声の 物理現 象とよ り整合 のとれ たレベルで構築 を試 み, この段 階で得 られた 種々 の特徴 量は音 声の生 成過程 に重 要なフ ァクタ となる 新所見が得 られ てい る。こ れらは ,高品 質音 声合成 器構築 のため のディ ジタ ル信号 処理お よび電 子工学に寄 与 す る と こ ろ が 大 き い 。 よ っ て 本 論 文 は 学 位 論 文 と し て 受 理 に 値 す る も の と 認 め る 。

参照