• 検索結果がありません。

言語特徴量の各属性と対数基本周波数の関連性

4. 頑健な音声特徴量の予測を可能にする言語特徴量の正規化法

4.6. 言語特徴量の各属性と対数基本周波数の関連性

50

表 4.5 Tukey-Kramer法による各正規化法の𝔼(𝕋,𝕌e)の平均値の比較結果 表中の数値はスチューデント化された範囲分布のq値とp 値である.群数は4,自由度

は396,信頼区間は95%である.「Conv」は従来法,「Extra」は広範囲版の従来法,「Clip」

はクリッピング版の従来法,「Prop」は提案法を表す.

𝕌100 𝕌200 𝕌300 𝕌400 𝕌500 𝕌1000 𝕌2000

Conv – Extra q値 4.21 1.39 2.13 0.29 2.15 3.18 0.03 p値 0.016 0.732 0.435 0.900 0.429 0.112 0.900 Conv – Clip q値 6.98 4.13 3.90 2.64 5.85 4.40 2.91 p値 0.001 0.019 0.031 0.245 0.001 0.011 0.170 Conv – Prop q値 8.57 4.72 4.92 1.76 8.53 6.63 3.22 p値 0.001 0.005 0.003 0.587 0.001 0.001 0.106 Extra – Clip q値 2.78 2.74 1.77 2.93 3.71 1.23 2.88 p値 0.204 0.215 0.585 0.164 0.045 0.799 0.177 Extra – Prop q値 4.36 3.32 2.79 2.05 6.38 3.45 3.19 p値 0.012 0.089 0.201 0.468 0.001 0.072 0.111 Clip – Prop q値 1.59 0.58 1.02 0.88 2.68 2.23 0.31 p値 0.656 0.900 0.880 0.900 0.233 0.396 0.900

51 4.6.2. 実験結果

LIME法による対数基本周波数の予測誤差を図 4.5と図 4.6に示す.右端の「reference」

の箱ひげ図はLIME法を適用しない場合の対数基本周波数の予測誤差である.LIME法に よる対数基本周波数の予測誤差が大きいほど,下端の言語特徴量の属性名と対数基本周波 数の関連性が強いことを表す.どちらの正規化法も対数基本周波数と言語的に関連する属 性が上位を占めた.学習時に明示的な規則を定義しなくても,モデルパラメータが対数基本 周波数と対数基本周波数に関連性の高い言語特徴量の属性を関連付けるように学習される ことが確認できた.また,アクセントの下降位置については,「fall:org」よりも「fall:mod」

の方が対数基本周波数との関連性が強かった.この結果は,文献 [28]と一致した.

また,従来法と提案法の対数基本周波数との関連性が高い属性の上位 6 つは,どちらも

「fall」,「fall:mod」,「fall:mod:cur」,「ph_art」,「m_mora:acc:fwd」,「rise」でり,いずれ も共通していた.これらの属性のLIME法による予測誤差の平均値と「reference」の予測 誤差の平均値を両側検定の t 検定した.その結果,従来法も提案法も,上位 6 つの属性の LIME 法による予測誤差の平均値は「reference」の予測誤差の平均値よりも有意に大きか った(表 4.6).以上より,上位6つの属性は対数基本周波数と関連性が高いといえる.

さらに,従来法と提案法で,上位6つの属性のLIMEによる予測誤差の平均値を両側検 定のt検定した.その結果,「fall」,「fall:mod」,「fall:mod:cur」,「ph_art」,「m_mora:acc:fwd」

の5つの属性については,提案法のLIME法による予測誤差の平均値は,従来法のLIME 法による予測誤差の平均値よりも有意に大きかった(表 4.7).以上より,提案法で正規化 された言語特徴量は従来法で正規化された言語特徴量よりも対数基本周波数との関連性が 高く,対数基本周波数をモデル化するのに適しているといえる.

52

図 4.5 従来法のLIME法による対数基本周波数の予測誤差 0

0.05 0.1 0.15 0.2 0.25

fall:mod fall ph_art fall:mod:cur rise m_mora:acc:fwd dur m_mora:acc ph_id t:acc:fwd n_mora:acc n_mora:acc:cur fall:mod:prv m_mora:acc:bwd rise:cur t:ph:bwd ph_art:nxt1 ph_art:prv2 t:acc ph_art:nxt2 fall:org ph_art:prv1 eos_id t:acc:bwd eos_id:cur m_mora:bre:bwd m_mora:utt:bwd m_mora:utt m_acc:utt:fwd reference

𝔼(𝕌2000,𝕌c)

53

図 4.6 提案法のLIME法による対数基本周波数の予測誤差 0

0.05 0.1 0.15 0.2 0.25

fall fall:mod fall:mod:cur ph_art m_mora:acc:fwd rise m_mora:acc:bwd m_mora:acc t:acc:fwd fall:mod:prv ph_id t:acc:bwd ph_art:nxt1 rise:cur t:acc ph_art:cur ph_art:nxt2 ph_art:prv1 fall:org ph_art:prv2 dur m_mora:bre:fwd eos_id t:ph:bwd eos_id:cur m_acc:bre:bwd m_mora:bre t:bre:fwd t:ph:fwd reference

𝔼(𝕌2000,𝕌c)

54

表 4.6 「reference」の予測誤差の平均値と各属性のLIME法による予測誤差の平均値 の両側検定のt検定による比較

属性名 従来法 提案法

自由度 t値 p値 自由度 t値 p値 fall 127.5 21.02 p < 0.001 117.3 28.81 p < 0.001 fall:mod 125.1 21.24 p < 0.001 116.1 26.04 p < 0.001 fall:mod:cur 129.0 18.97 p < 0.001 126.4 27.71 p < 0.001 ph_art 150.7 24.88 p < 0.001 135.1 29.64 p < 0.001 m_mora:acc:fwd 156.8 20.76 p < 0.001 143.9 29.75 p < 0.001 rise 154.0 24.53 p < 0.001 143.2 21.42 p < 0.001

表 4.7 従来法と提案法の各属性のLIME法による予測誤差の平均値の両側検定のt検 定による比較

属性名 自由度 t値 p値

fall 189.6 9.13 p < 0.001

fall:mod 190.2 6.56 p < 0.001

fall:mod:cur 194.0 7.34 p < 0.001

ph_art 190.4 7.11 p < 0.001

m_mora:acc:fwd 192.5 9.70 p < 0.001

rise 193.1 0.46 0.648