第 4 章 第ニ層と第三層の関係の分析 19
4.4 スペクトルに関する特徴量
4.4.1 抽出した特徴量
抑揚に対応して,スペクトルも変化している可能性があるため,スペクトルに関する特 徴量を抽出した.また,スペクトルからさらに,フォルマント周波数(F1〜F3)とスペ クトルの傾斜を抽出した.以下に,抽出した音響特徴量の詳細について記述する.同様 に,下線を引かれている音響特徴量は時間的に変動する特徴量を表していることから,動
• スペクトルの時間変化に関する音響特徴量
– 変化量: 各音素間でのスペクトル変化量の平均
– 変化の傾き : 各音素間でのスペクトル変化の傾きの平均
• フォルマントに関する音響特徴量
– 平均値: 文章全体におけるフォルマント周波数の平均 – 変化量: 各音素間でのフォルマント周波数の変化量
• スペクトルの傾斜に関する音響特徴量
– 平均値: 文章全体におけるスペクトルの傾きの平均 – 最大値: 文章全体におけるスペクトルの傾きの最大値 – 最小値: 文章全体におけるスペクトルの傾きの最小値 – 変動幅: 文章全体におけるスペクトルの傾きの変動幅
スペクトルの変化量は隣接する音素間のスペクトル距離を表す.各音素における音素中
心点のSTRAIGHTスペクトルから求めた,STRAIGHTケプストラム係数(30次)を用
いて,以下の式から音素間の距離を算出した.
DSP =
vu ut∑30
n=1
(Cn(t1)−Cn(t2))2 (4.1) ここで,DSPはスペクトルの変化量,t1, t2は連続する2つの音素の時間的位置,Nは音
素数,CはSTRAIGHTケプストラム係数を表している.
スペクトルの変化速度は隣接する音素間のスペクトル変化の傾きを表し,以下の式から 求めた.
SSP =
√∑30
n=1(Cn(t1)−Cn(t2))2
t2−t1 (4.2)
ここで,DSPはスペクトルの変化の傾きを表している.
4.4.2 結果と考察
相関分析の結果を表4.3に示す.表4.3より,聴取印象「はきはき」はスペクトルの変
化量(r = 0.66)と変化の傾き(r = 0.61),スペクトルの傾斜の最大値(r = 0.78)と変
動幅(r = 0.82)と相関があることが示された.スペクトルの変化量と変化の傾きに相関
が認められたのは,スペクトルの傾斜が相関があることによる間接的な相関であることが 考えられる.また,スペクトルの傾斜の変動幅に伴い,スペクトルの傾斜の平均値,最大
表 4.3: 「はきはき」とスペクトルの傾斜との関係 音響特徴量 相関係数
スペクトルの時間変化 変化量 0.66 変化の傾き 0.61
フォルマント 平均値(F1) 0.11 変化量(F1) 0.49
平均値(F2) -0.15
変化量(F2) 0.39 平均値(F3) 0.24 変化量(F3) 0.48
スペクトルの傾斜 平均値 0.58 最大値 0.78
最小値 -0.29
変動幅 0.82
値は影響を受ける.そのため,スペクトルの傾斜の最大値に相関が見られたのは,変動幅 が相関していることによる間接的な相関だと考えられる.スペクトルの傾斜の平均値は,
やや相関がみられた(r = 0.58).
Fant [34]の音源–フィルタ理論に基づけば,スペクトルの傾斜は.声帯の振動特性,口
唇からの放射特性と対応している.「はきはき」とスペクトルの傾斜の変動幅が相関があっ たことから,F0の変化に対応して,声帯の振動特性が変化し,さらに,口唇の開閉を大 きくしていることに放射特性が変化が大きくなっていると考えられる.「はきはき」とス ペクトルの傾斜の変動幅の関係を図4.3に示す.
-3 -2 -1 0 1 2 3 0.1
0.12 0.14 0.16 0.18 0.2 0.22
Degrees of briskness Dynamic range of spectral slope [dB/kHz]
r = 0.82
図 4.3: 聴取印象「はきはき」とスペクトルの傾斜の変動幅の関係
表 4.4: 「はきはき」と時間長の関係 音響特徴量 相関係数
時間長 0.05 子音長 0.15