キーワード:アクセント,首都圏,音響的分析,下降幅,相対ピーク位置,Web聞かせ る調査,同音異義語
要 旨
アクセント型の「らしさ」にかかわる音声的特徴を明らかにするため,合成音声を使 用したアクセントの聞かせる調査を行った。本報告では,このうち同音異義語の結果に ついて述べる。
本報告で分析するのは,アクセント型によって意味の対立がある同音異義語のペアで ある。選出した同音異義語のペアは,「ハナ」(平板型「鼻」−尾高型「花」),「アメ」(平 板型「飴」−頭高型「雨」),「ウミ」(尾高型「膿」−頭高型「海」)の三つである。
調査の際には,下降幅・相対ピーク位置という二つの音声的特徴を段階的に操作した,
30パターンの合成音声を提示することとした。この音声を用いて,首都圏に生育した 20代〜60代を対象に,聞き取った音声がどのような意味かを判定してもらうWeb調査 を実施した。本報告では,このうち784人分のデータを分析する。
調査の結果,「ハナ」のペアでは,下降幅が小さいほど「鼻」,大きいほど「花」と判定 された。「アメ」のペアでは,下降幅が小さいほど「飴」,下降幅が大きく,かつ相対ピー ク位置が小さい(前寄りでピークが実現する)ほど「雨」と判定された。「ウミ」のペア では,下降幅が小さい音声では「どちらでもない」が多いものの,下降幅が大きい場合は,
相対ピーク位置が小さい(前寄りでピークが実現する)ほど「海」,相対ピーク位置が大 きい(後寄りでピークが実現する)ほど「膿」と判定された。
以上の結果から,本調査においては,下降幅と相対ピーク位置が同音異義語の区別に 寄与していることがうかがえた。この結果に基づき,音声的特徴と弁別的特徴の関連に ついて考察を加えた。
1
.研究の背景本稿執筆者は,あいまいアクセント(金田一春彦,1942;1948)とされてきた首都圏
同音異義語 の 区別 にかかわる 音声的特徴
―下降幅・相対ピーク位置を指標とした
Web
聞かせる調査結果から―林 直 樹
〈論文〉
東部域音調の実態解明を目的として,これまで研究を進めてきた(林直樹,2017)。
あいまいアクセントは,以下のような特徴を有する。
1)型が共通語アクセントや東京中心部アクセントと異なる。
2)個人間・個人内における型の異同が大きい。
3)発話形式によって出現型がゆれる。
4)実現音調における音声の高低差があいまい。実現音調を「○・◎・●(低・中・高)」
の3段階で記述する例もある。
5)聞き取りが困難である。
6)当該地域方言話者の型知覚があいまい。同音異義語の弁別などが不明瞭で,言い分 け・聞き分けが難しい。
本稿執筆者によるこれまでの研究では,主に発話面にのみ注目してきたため,上記6 で挙げたような聞き取り・知覚面の検討が不十分であった。そのため,あいまいアクセ ント話者の聞き取りについて検討する必要があった。
あいまいアクセント地域の話者の知覚・聞き取りにかんしては,都染直也(1987)で 合成音声に基づく調査・分析がなされている。また,大橋純一(1996)でも,同音異義 語をアクセント型によって区別しているかどうか,話者の意識を尋ねる調査がなされて いる。
以上のようにあいまいアクセント話者の聞き取り・知覚の分析はなされているもの の,その方法論は十分に検討がなされているとは言い難い。そこで,本稿では将来的に あいまいアクセント話者に対して「聞かせる調査」を行うための試行的調査の概要,な らびにその結果を記述し,調査の妥当性や問題点を整理していく。林直樹(2019)では 同音異義語以外の事例について報告したため,本稿では同音異義語に焦点を絞った報告 を行う。
2
.聞かせる調査で提示する音声聞かせる調査においては,まず提示音声の検討を行う必要がある。本研究では,柴 田実氏の発話を元音声として使用した。柴田氏は,東京都練馬区で0〜18歳まで生育 しており,NHKに1970年入局した後,アナウンサーや放送文化研究所での所員を務め た経験がある。これらのことから,聞かせる調査の提示音声として最適だと考えた。
音声を録音する際には,デジタル録音器(ZOOM H4n)を用い,サンプリング周波数 44.1Khz,量子化ビット数16bitで行った。マイクは,卓上スタンドKIKUTANI MH-5に 固定したAKG1000Sを使用した1)。録音は防音室で行った。
2.1
.同音異義語の元音声まずは,本報告で調査語とした音声が,どのような音声的特徴を有するのかを確認す る。音声をピッチ曲線として示したのが以下である。○を付したのが合成するために使 用した音声である。y軸のSemitoneはセミトーン(半音値)で,50Hzを底とした2)。図中 の縦線は分節音境界を表している。
提示音声として準備した同音異義語は2拍名詞の3つのペア,計6語3)となる。いずれ も有声音で構成されており,音響的指標の操作にも適しているといえる。
「ハナ」(○平板型・LHH「鼻」−尾高型・LHL「花」)
8 12 16 20 24
0 0.1 0.2 0.3 0.4 0.5
Semitone
sec
「鼻が」
8 12 16 20 24
0 0.1 0.2 0.3 0.4
Semitone
sec
「花が」
8 12 16 20 24
0 0.1 0.2 0.3 0.4
Semitone
sec
「膿が」
8 12 16 20 24
0 0.1 0.2 0.3 0.4
Semitone
sec
「海が」
8 12 16 20 24
0 0.1 0.2 0.3 0.4 0.5
Semitone
sec
「飴が」
8 12 16 20 24
0 0.1 0.2 0.3 0.4
Semitone
sec
「雨が」
ハ ナ ガ ハ ナ ガ
ウ ミ ガ ウ ミ ガ
ア メ ガ ア メ
ガ
図
1
:同音異義語のピッチ曲線「アメ」(○平板型・LHH「飴」−頭高型・HLL「雨」)
「ウミ」(尾高型・LHL「膿」−○頭高型・HLL「海」)
それぞれのペアで,下がり目の指標である急激な下降があるかどうか,あるいは急激 な下降がどこで生じているのか,ということが異なっている。それぞれのペアのアクセ ント型の違いは,聴覚印象上もはっきりと聞き分けることができた。
2.2
.合成音声のパターン上記で示したとおり,各ペアの発話のうち,○を付けた音声の特徴を少しずつ変えた 合成音声を作成し,提示音声とすることとした。合成音声は,発話開始時点を18stに固 定し,一つの音声につき,下降幅5つ×相対ピーク位置6つ,計30パターンを作成した。
まず,下降幅を変化させる際は,ピークを24stとして,そこから文節末の助詞「ガ」
終端部までの下降幅を2st・4st・6st・8st・10stと2stずつ変化させた,5段階の下降幅を 設定した。
10 12 14 16 18 20 22 24
0.0 1.0 2.0 3.0
Semitone
相対ピーク位置 下降幅2st
10 12 14 16 18 20 22 24
0.0 1.0 2.0 3.0
Semitone
相対ピーク位置 下降幅4st
10 12 14 16 18 20 22 24
0.0 1.0 2.0 3.0
Semitone
相対ピーク位置 下降幅6st
10 12 14 16 18 20 22 24
0.0 1.0 2.0 3.0
Semitone
相対ピーク位置 下降幅8st
10 12 14 16 18 20 22 24
0.0 1.0 2.0 3.0
Semitone
相対ピーク位置 下降幅10st
ア メ
ハ ナ ガ
ウ ミ
ガ ガ
ア メ
ガ
ハ ナ
ウ ミ
ガ ガ
ア メ
ハ ナ ガ
ウ ミ
ガ ガ
ア メ
ハ ナ ガ
ウ ミ
ガ ガ
ア メ
ハ ナ ガ
ウ ミ
ガ ガ
図
2
:音声合成パターンの模式図相対ピーク位置は,林直樹(2017)で勘案した指標で,ピークの位置,すなわち下が り目の位置が拍内のどこで生じたのか相対的な位置関係として把握できるようにしたも のである。本調査に際しては,1.0・1.2・1.4・1.6・1.8・2.0までの6パターン,すなわ ち 1拍目終了時点(2拍目開始時点)から 2拍目終了時点(3拍目開始時点)まで等間隔 で変わるような段階を設定した。以上を模式図として示したのが,図2である。
音声の合成にはPraat(ver5.2.22)4)を使用し,PSOLA音声により行った。この際,Praat の「To Manipulation...」コマンドを使用した。タイムステップは10ms,ボトムは75,ピー クは300を指定した。
3
.聞かせる調査の概要上記のように調査用の音声を準備し,聞かせる調査を実施した。本研究では,この聞 かせる調査をWeb経由で行うこととした。これは,一箇所に調査協力者を集めて音声 を聞かせることが難しく,多人数に対して調査を行うにはWebを用いることが最適と 判断したためである。調査委託会社はマイボイスコムで,マイボイスコムモニター登録 者から協力を募った。
3.1
.調査対象聞かせる調査の調査対象は,生育地を埼玉県・千葉県・東京都・神奈川県の1都3県
(中学校卒業まで最も長く生育,かつ現在も1都3県内に居住5),かつ年代を20代〜60代, 男女に対して行うこととした。調査の際,人口比による割り付けは行わず,年代・性が おおむね同じ程度の人数になるように調査依頼を行った。
3.2
.調査手順本調査では,大きく二つの段階に分けて調査を行った。
まず,調査協力の可否を尋ねるスクリーニング調査を36,628人対象に行った。その結 果,13,669人から調査可という回答を得た。有効回答率は37.3%である。
次に,スクリーニング調査で調査可と回答した調査協力者に対して,本調査依頼を送 付した。この本調査依頼は1,349人対象に行い,その結果,896人から回答を得た。有効 回答率66.4%である。
3.3
.分析データ本分析では,896人のうち有効回答とみなした784人分のデータを用いる。有効回答は,
896人を基準とすると87.5%となる。
なお,「ほとんどの質問で同じ選択肢番号を選んでいる(中略)調査票は分析には使え ない」(妻木進吾,2014)と考え,このような回答は無効とした。そのため,例えば「水」
「山」の2語できちんと回答したようにみなせるサンプルであっても,「窓」のみすべて 同一の選択肢を選んでいるような場合は,すべての語の回答を無効とし,分析に含めな かった。
回答者の属性内訳は,次のとおりである。
表1:分析データの属性別人数内訳
年代 男性 女性 計
20代 66 82 148
30代 82 81 163
40代 79 82 161
50代 74 83 157
60代 76 79 155
計 377 407 784
平均年齢は44.9歳となった。20代男性の有効回答数が他の年代・性に比べて少ないの は,上述のエディティングによって回答が多く除外されたためである。
3.4
.調査方法聞かせる調査は,2018年12月17日〜20日に行った。この調査では,大きく7つのステッ プを踏んだ。
1. 調査協力者がWeb上のURLにアクセス 2. 協力者情報の入力
3. 説明文の提示
「問7. 今から,「ハナガ」という音声を流します。「ハナガ」の部分が色々なパ ターンになっていますので,どのような意味として聞き取ったか,該当する語に チェックを付けてください。」
4. 音声ファイルの再生(音声はランダムに並べ変えた音声ファイルとして提示。た だし全員同じ音声ファイルを聴取したため,聴いた音声の順序は同じ)
5. 流れてくる音声に対して,「意味1」「意味2」「どちらでもない」「わからない」の うち,いずれかを選択(単一選択式)
6. 30パターンの音声が一つの語につき一つの音声ファイルとして流れ,それが終 わると次のページに遷移
7. 3~6の繰り返し(同音異義語は計3語,調査全体では計6語)
なお,実際の調査画面例は以下のようなものである。再生ボタンを押すと音声の再生
が始まり,同画面下部のラジオボタンを押していく仕様となっている。
4
.調査結果以下,聞かせる調査の結果を記述していく。結果を提示する際は,下降幅ごとに別の 図を示していく。
図
3
:調査画面例4.1
.「ハナ」まず,「ハナ」の結果を図4に示す。
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅2st
鼻 花
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅4st
鼻 花
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅6st
鼻 花
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅8st
鼻 花
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅10st
鼻 花
どちらでもない わからない
図
4
:「ハナ」判定結果図4から,2st〜4stでは「鼻」の判定がほぼ70%以上となっていることがわかる。相 対ピーク位置による回答の変動はほとんどないといえる。6stではすべての回答で「鼻」 の判定が50%を超えるものの,相対ピーク位置によっては回答率に違いが生じ,1.4〜1.6 といった2拍目の中央時点でピークが実現する音声は相対的に「鼻」の判定割合が高い。
8stになると相対ピーク位置が1.8〜2.0と2拍目の後半時点で実現する音声では「花」の 判定が40%を超える。また,相対ピーク位置が1.0の音声では「どちらでもない」も最 も多い回答となっている。下降幅が最も大きい10stでは,相対ピーク位置1.4〜2.0で「花」 の判定が60%を超え,1.0〜1.2では「どちらでもない」が40%近くに昇ることがわかっ た。
4.2
.「ウミ」次に,「ウミ」の結果を図5に示す。
図5から,下降幅が2stの音声では「膿」か「どちらでもない」の判定が多く,どちら の回答も30%〜50%程度みられることがわかった。4stでは2stに比べ全体的に「膿」の 判定が増え相対ピーク位置が1.6〜2.0と2拍目の後半時点に位置する場合,「膿」の判 定が50%を超える。6stになると相対ピーク位置が1.0〜1.2と2拍目の前半時点で実現 する場合,「海」の判定が40%〜60%程度になり,1.6〜2.0と2拍目の後半時点で実現す る場合,「膿」の判定が60%〜70%となる。この傾向は8st〜10stでも観察されるものの,
下降幅が大きくなるほど,相対ピーク位置が2拍目の前半時点で実現する音声は「海」,
後半時点で実現する音声は「膿」と判定される傾向がより明確になっている。
4.3. 「アメ」
最後に,「アメ」の結果を図6に示す。
図6から,「アメ」では,2stの場合ほとんどの音声で「飴」の判定が90%になることが わかった。4stでもその傾向はおおむね変わらない。6stになると,相対ピーク位置が1.0 と最も前寄りで実現した場合,「雨」の判定が50%近くになる。8st〜10stでは相対ピー ク位置が1.0〜1.2と2拍目の前半時点で実現した場合70%程度が「雨」と判定され,後 半時点で実現された場合40%程度が「どちらでもない」と判定される傾向がみられた。
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅2st
海 膿
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅4st 海
膿
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅6st
海 膿
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅8st
海 膿
どちらでもない わからない
0 10 20 3040 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅10st
海 膿
どちらでもない わからない
図
5
:「ウミ」判定結果0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅2st
飴 雨
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅4st
飴 雨
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅6st
飴 雨
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅8st
飴 雨
どちらでもない わからない
0 10 20 30 40 50 60 70 80 90
1.0 1.2 1.4 1.6 1.8 2.0
%
相対ピーク位置 下降幅10st
飴 雨
どちらでもない わからない
図
6
:「アメ」判定結果5
.まとめと考察以上の調査の結果をまとめると,本研究で指標とした下降幅・相対ピーク位置という 二つの音声的特徴と同音異義語の判定には,以下のような関係性が確認されたといえ る。違いが確認された部分はゴシックで示す。
ハナ 下降幅小・相対ピーク位置後→「鼻」 下降幅大・相対ピーク位置後 →「花」
ウミ 下降幅大・相対ピーク位置前 →「海」 下降幅大・相対ピーク位置後→「膿」
アメ 下降幅小・相対ピーク位置後 →「飴」 下降幅大・相対ピーク位置前 →「雨」
以上から,本調査協力者は,下降幅・相対ピーク位置という音声的特徴によって同音 異義語の意味を区別していることが確認されたといえる。このうち,「ハナ」の関係は アクセントの弁別性における「下がり目の有無」,「ウミ」の関係は「下がり目の位置」,
「アメ」の関係は「下がり目の有無・位置」の現れと考えられるため,今回合成音声を作 成する際に操作した音声的特徴は,従来東京中心部・共通語アクセントの弁別性として 指摘されてきた「下がり目の有無」と「下がり目の位置」を測るものとしておおむね妥当 なものといえそうである。なお,同様の結果は同音異義語だけでなく,「水」「山」「窓」 といった語でも確認された(林直樹,2019)ため,同音異義語にかかわらずアクセント 型の判定にはこの二つの指標を用いることができそうである。
さらに,本結果のうち,相対ピーク位置による回答傾向に注目すると,下降幅が小さ いと相対ピーク位置による語の判定はほとんど変わらないことが三つの語それぞれでみ られた。続いて,下降幅が6st程度になると相対ピーク位置による違いがおおむね10ポ イント〜20ポイントずつみられるようになった。そして,下降幅が10stになるとある 時点を境に40ポイント程度判定が変化する結果が示された。
これは,下がり目の位置による同音異義語の区別は,下がり目の大きさにも影響を受 けていることがうかがえる結果と解釈できる。すなわち,アクセントの弁別に寄与する と指摘されてきた「下がり目の有無」・「下がり目の位置」は,片方の要素が明瞭になる ともう片方の要素も明瞭になる可能性があるということである。東京中心部・共通語ア クセントは「下がり目の有無」と「下がり目の位置」という二つの弁別特徴によりアクセ ントを弁別していることは広く指摘されてきたものの,このような特徴間の関係性はあ まり注目されてこなかったようである。
6
.今後の課題本分析では,合成音声を使用した調査のうち同音異義語の結果について報告したもの の,全体傾向の把握に留まった。今後は,年代別分析を進めて,本稿で報告した傾向に 年代差があるのかどうかを確認していきたい。
また,本調査を実施した目的であるあいまいアクセントとの比較・対照のため,「聞 かせる調査」を首都圏東部域のあいまいアクセント地域でも実施し,アクセントの「あ いまい性」「明瞭性」とは何かを引き続き探っていきたい。
[付記]
本研究はJSPS科研費16K16846,18H00673,19K13203の助成を受けたものです。また,音声 の録音に快くご協力くださった柴田実氏に,厚く御礼申し上げます。なお,本稿は2019年度日 本大学国文学会大会の発表に基づくものです。ご質問やコメントをくださった皆さまに,感謝 申し上げます。
注
1) 調査機器の選定にあたっては,郡史郎(2013)を参考にした。
2) Semitoneの算出方法は,郡史郎(2004)を参考にした。
3) それぞれのペアの金田一語類(金田一春彦,1974)は,「鼻」:Ⅰ類,「花」:Ⅲ類,膿:Ⅲ類,
「海」:Ⅳ類,「飴」:Ⅰ類,「雨」:Ⅴ類である。
4) アムステルダム大学のPaul Boersma,David Weeninkが開発した音響分析用ソフト。http://
www.fon.hum.uva.nl/praat/よりダウンロードして使用した。
5) この中には,金田一春彦(1942)で「埼玉特殊アクセント」やそれに準ずると指摘された地 域の協力者,59名(7.5%)が含まれている。このうち,生育地を埼玉県とした協力者が28 人(越谷市6人・加須市4人・久喜市2人・三郷市2人・春日部市9人・草加市3人・白岡市 1人・八潮市1人),千葉県とした協力者が4人(浦安市3人・野田市1人),東京都とした協 力者が27人(葛飾区13人・江戸川区9人・足立区5人)いた。林直樹(2017)の調査において,
埼玉特殊アクセントと指摘された地域にも個人差・地域差があり,当該地域の話者でも共 通語的な特徴を有する可能性もあるため,本分析に含めることとした。ただし,以上の理 由により,本調査の結果を首都圏方言アクセントの実態や,東京中心部アクセント・共通 語アクセントの実態が現れたものとして一般化することはできない。
参考文献
井上史雄(1984)「アクセントの生成と知覚―関東における地域差と年齢差―」金田一春彦博士 古稀記念論文集編集委員会編『金田一春彦博士古稀記念論文集 第2巻 言語学編』pp.119-153.
大橋純一(1996)「埼玉特殊アクセントの個人差と地域差―三領域間における二拍名詞の体系的 変化動向を比較しつつ―」『国語学』187,pp.77-90.
金田一春彦(1942)「関東地方に於けるアクセントの分布」日本方言学会編『日本語のアクセン ト』中央公論社.
金田一春彦(1948)「埼玉県下に分布する特殊アクセントの考察」私家版 [金田一春彦(2005)『金 田一春彦著作集 第九巻』pp.552-620,玉川大学出版部による].
金田一春彦(1974)「国語アクセントの史的研究―原理と方法―」塙書房 [金田一春彦(2005)『金 田一春彦著作集 第七巻』pp.11-310,玉川大学出版部による].
郡史郎(2004)「東京っぽい発音と大阪っぽい発音の音声的特徴―東京・大阪方言とも頭高アク セントの語だけから成る文を素材として―」『音声研究』8(3),pp.41-56.
郡史郎(2013)「音声データの作成・分析」『日本語学 特集ことば研究の道具2013』32(14),
pp.118-130.
佐藤和之・篠木れい子(1991)「無型アクセントの音相実態と共通語化―栃木県氏家町方言アク セントを例として―」『東日本の音声―論文編―(1)』pp.25-48.
杉藤美代子(1979)「東京アクセントにおける『花と鼻』の発話と知覚について」『日本言語学会 第79回大会発表資料』 [杉藤美代子(1998)『日本語音声の研究5 「花」と「鼻」』pp.23-37,
和泉書店による].
杉藤美代子・藤崎博也・森川博由・三井康義(1974)「単語アクセントの生成及び知覚に於ける 音素及び音調的特徴の関連について」『日本音響学会研究発表会講演論文集 昭和49年度秋 季』 [杉藤美代子(1998)『日本語音声の研究5 「花」と「鼻」』pp.103-122,和泉書店による].
都染直也(1983)「合成音声によるアクセント研究―埼玉県東南部付近におけるアクセントの発 話型と知覚型の比較―」『待兼山論叢』17,pp.21-42.
妻木進吾(2014)「データの整理 エディティング」『社会調査事典』pp.184-185,丸善出版.
林直樹(2017)『首都圏東部域音調の研究』笠間書院.
林直樹(2019)「アクセントの自然さにかかわる音声的特徴―首都圏生育者を対象とした聞かせ る調査から―」『方言の研究』5,pp.141-159.
(はやし なおき、本学専任講師)