What does "a fluent speaker" mean for non- native listeners?
- Perception of L2 listeners
Author
Tsurutani, Chiharu, Tsukada, Kimiko, Ishihara, Shunichi
Published
2010
Conference Title
Proceedings of the 24th General Meeting of the Phonetic Society of Japan
Copyright Statement
© 2010 Phonetic Society of Japan. The attached file is reproduced here in accordance with the copyright policy of the publisher. For information about this conference please refer to the conference's website or contact the authors.
Downloaded from
http://hdl.handle.net/10072/37417Link to published version
http://www.psj.gr.jp/eng/annual-convention/2010
Griffith Research Online
ペラペラになりたい? -第二言語学習者の知覚-
What does “a fluent speaker” mean for non-native listeners? Perception of L2 Japanese listeners
鶴谷千春(グリフィス大学)、塚田公子(マコーリー大学)、石原俊一(豪州国立大学)
[email protected]
1. はじめに 成人母語話者の知覚評価基準は比較的安定しており、一貫性がある。母語の音韻体系 がしっかりと刻み込まれているためであろう。話し手がネイティブであるかどうかを、 母語話者はほんの一言一句で聞き分けられると言われる。(Flege:1998)これは何か一 瞬のうちに明らかになる手がかりが発話の中にあるものと思われる。一般的に音素の習 得よりも韻律の習得の方が、学習者の発話の聞き取りやすさに影響することが知られて いる。言語のタイプによる差はあるが、母語話者の知覚は特に音の時間長の逸脱に比較 的敏感だと言う報告がある。(Tajima et al.:1997、Tsurutani:2010)その上、外国語訛 りの強さの採点基準は母語話者が行う場合、第二言語話者の発音に触れる機会の多さに左右されない(Warren et al.: 1993)。Tsurutani(2010)は英語話者の話す日本語の
発話を使い、日本在住で外国人との接触があまりない80 名の大学生の知覚を調査した。 その結果、被験者の日本人大学生の知覚は、海外在住で日本語教育経験の長い日本人の 知覚と差がないことがわかった。日本語母語話者の知覚の判断基準は、各モーラの長さ を均等に保とうとするモーラ時間の制約に基づき、ゆるぎないものになっていると考え られる。日本語はピッチアクセントを持ち、アクセント型によって意味の違いを持つ語 もある。また、地域や年齢によってアクセント型に違いがあることから、発音評価にお けるピッチの重要性は疑問視されてきた(Tsurutani:2010)。
社会言語学の研究では(Fayer and Krasinski: 1987, Riches and Foddy: 1989)非母語話 者の方が母語話者より外国語訛りに対して厳しい評価を出すことが報告されている。 しかし、これらの研究では被験者の態度や価値観以外、評価に対する音声学的な要因 は提示されていない。第二言語話者は、発音練習や聞き取りを繰り返すうちに対象言 語の音韻体系に近づき、発音の良し悪しを聞き分ける能力を体得してゆく。この学習 言語における知覚の発達は母語話者の知覚に比べて、研究例が極めて少ない。事実、第 二言語学習者が何を基準に発音の良し悪しを聞き分け、学習レベルの向上につれ、その 判断基準がどう変わっていくか、明確にされていない。したがって、本研究では第二言 語の知覚について以下のような研究課題に取り組むことにした。 ― 外国語訛りに対して、第二言語学習者も母語話者と同じような評価基準を持つか、 より厳しいまたは寛容な評価をするのか。 ― 上級学習者の基準は初級学習者より母語話者のものに近いか。
2.実験 2.1.刺激文 刺激文はオーストラリア英語話者で日本語を大学で 160 時間程度学習した学生の録 音した文から選ばれた。録音は自主学習用に作られたコンピューターの読み上げ・発音 判定のプログラムから取られたものである。多くのサンプルの中から、次の4 タイプの 発話が抽出された。 1. 正しいピッチ、正しい長さ ○ 3.正しいピッチ、間違った長さ Tx 2. 間違ったピッチ、正しい長さPx 4.間違ったピッチ、間違った長さ X これら4 タイプの発話には明らかな音素の間違いは含まれていない。誤りの判断は第一 筆者と日本語教育経験の長い2人のネイティブによってなされ、3 人のうち 2 人が同意 した記述が取られた。80 人の母語話者がこれらの刺激文を判断した際も 4 つのタイプ は明らかに違うものとして知覚されている(Tsurutani: 2010)。6 つの異なった文が 4 つのタイプごとに用意され、合計24 文が本実験の刺激文として使われた。同じ文の 4 タイプが続けて流されたが、4 タイプの提示順は各文ごとにランダムになっている。刺 激文には自然発話を用いたため、間違いの度合いまではコントロールできていないが、 似通った発話速度と誤りの数を持つ発話を選ぶよう注意が払われた。誤りの数は単語レ ベルとフレーズレベルの合計で数えられたが、フレーズ末のピッチの上昇は自然発話行 動とされた(井上: 1993)。どの発話も300ms以上の長いポーズは含まず、スムー ズに聞こえるものだった。文のリストは以下に、エラーのリストは表1 に記されている。
1) Shachoo-no kekkonshiki-ni okyakusan-ga sennin kita. 2) Tsugi-no jugyoo-no suugaku-wa chotto muzukashii desu.
3) Watashi-no kookoo-de isshoni shashin-o torimashoo. 4) Otooto-no okusan-wa ryokoo-ni ikuno-ga suki-desu-yo. 5) Tanjoobi-ni tomodachi-kara kireena hana-o moratta.
6) Shuumatsu-kara futarino hito-to shigoto-o suru yotee desu.
ピッチの幅を計るためのF0 の抽出には Snack Sound Toolkit の Get_F0 機能が用い
られ、その後知覚された領域として表すためにメルスケールに換算された。測定結果で は女性話者で93-284.6Hz、男性話者で 59-137.8Hz の領域であった。 2.2.被験者 2 つのグループの英語を母語とする日本語学習者が実験に参加した。(初級 15 名、上 級11 名)初級学習者は大学で日本語を 170 時間程度学習しており、上級
学習者は日
本 在住期間も含め、4-18 年の学習暦を持つ。上級者は全員、日本語能力試験 1 級保持者、 あるいはそれと同等の能力を持つと第三筆者によって判断された者たちである。 2.3.実験方法 2 グループの被験者に第二学習者の発話した 24 文を聞いてもらい、自然さの度合いを 1(ネイティブレベル)から 7(全くネイティブではない)までの段階で示すよう表1:刺激文のエラータイプとピッチの領域 指示した。同一刺激文内の比 較を容易にするため、それぞ れの 4 パターンが続けて流 された。刺激文は4 秒間隔で 2 回流され、次の刺激文への 間は8 秒置かれた。タスクの 始めに 3 名の学習レベルが 異なる話者の発話を聞かせ る練習を設けた。タスクはイ ンストラクションを含め、約 15 分かかった。 3.結果 2 グループの 4 タイプのエラ ーパターンに対する評価を 先行研究で求めた母語話者 に よ る 評 価 ( Tsurutani: 2010)と比較してみた。図 1 は 4 タイプのエラーパター ンに対する3 グループ(初級、 上級、ネイティブ)の被験者 の平均値を示したものであ る。Y 軸は発音の自然さのス コアを示し、高い得点は不自 然さを表している。この図か らわかるように、Px,Tx,X に関しては3グループの評 価は Px<Tx<X の順で同 じである。殊に3グループと もTx(時間長のみの誤り)
*L=Lengthening, SFL= Sentence Final Lengthening の評価が Px(ピッチのみの
誤り)よりも悪い 点を考慮すると、時間長の方がピッチよりも自然度への貢献が高い ことが伺える。しかし、誤りのないパターン、タイプ○の場合、学習者は声色、抑揚の 大きさ、発話速度、自信のありそうな読み方など、発話の自然さの判断に無関係な非言 語的要素に気を取られ、評価が母語話者と大きく異なっていた。3グループの評価はタ ID & Gen Error types Number of errors f0 range Mel/Hz Dura tion (sec) Word Timing Word pitch Phrase final 1F Px 2 1 133.7 4.35 2F X 3 1 176.0 5.61 3M O 1 82.4 4.86 4F Tx 1 1 L* 205.9 4.17 5F X 4 3 1 L 238.3 5.99 6M O 137.8 3.72 7M Tx 1 L 113.4 4.08 8F Px 2 174.0 3.88 9F Px 2 1 SFL 284.6 3.91 10M O 1 102.5 3.11 11F X 2 1 206.6 3.43 12F Tx 2 1 162.0 3.66 13F X 4 3 175.8 4.54 14M Px 1 4 115.2 3.51 15M O 125.3 4.58 16M Tx 2 116.4 4.57 17M O 73.2 3.31 18F Px 3 193.1 4.78 19M Tx 3 L 59.0 3.92 20F X 1 3 147.0 4.76 21F Tx 3 93,0 5.61 22M O 1 106.7 5.64 23F X 3 2 2 146.7 5.47 24F Px 4 1 180.1 4.24
評価をしている。 図1:4タイプの文への3グループの評価 の平均 4 タイプのスピーチサンプル(○、Px、 Tx、X)に対する評価をさらにタイプ別 に図示したのが以下の図2~5である。 Y 軸は 3 被験者グループの判断の平均値 でX 軸は文章の ID 番号を示している。 特に興味深いのは、タイプ○に関しては学習者の評価は母語話者の評価よりもずっと手 厳しいという点である。タイプ○の6文はみな男性話者によって読まれたため、それら の文のピッチ領域は24 文の平均値(147.9Hz)よりもずっと狭く(平均 104.7 Hz)、 これが学習者の評価に影響した要因の一つだと思われる。 図 2:タイプ○(正しい発話)に対する 平均値 図3 はピッチだけの誤りがある6文に限 ってその評価をまとめて示したものある。 初級学習者の評価は、母語話者や上級学 習者とは違い、非常に肯定的である。こ れは、図1 でも明らかであるが、初級学 習者がピッチの誤りを余り考慮に入れていないことを意味する。例えば文番号24 はピ ッチの領域が広く(180.1Hz)、とてもきびきびとした話し方であった。このようなパ ラ言語情報の影響はタイプTx の文にも見られる (図 4 参照)。 図3:タイプ Px(ピッチのみ間違った発話) 図 4:タイプ Tx(時間長のみ間違った発話) 文番号19 は男性話者による単調な発話で(ピッチ領域 59Hz)、3 つのフレーズ末に引 き伸ばしが聞こえ、おそらく怠惰な印象を与えたと思われる。 図5:タイプ X(間違った時間長とピッ チを持つ発話) 図 5 はピッチと時間長の両方の誤りが ある6 文に対する評価である。このタイ プにおいては 3 グループの評価は極め 1 2 3 4 5 6 O P x Tx X
Natives A dvanc ed B eginners
1 2 3 4 5 6 7 3 6 10 15 17 22
N a tives Adva nced B eg inners
1 2 3 4 5 6 7 4 7 12 16 19 21
Natives Advanced B eg inners
1 2 3 4 5 6 7 2 5 11 13 20 23
N a tives Adva nced B eg inners
1 2 3 4 5 6 7 1 8 9 14 18 24
て似通っており、明らかな誤りを含む発話に対する評価は母語話者と非母語話者の間で 差がないことを示している。 4. 考察 先行研究では母語話者は、発話の自然さの評価においてピッチよりも時間長の情報を 重視することが報告されている(Tsurutani:2010)。本研究の第二言語学習者も、時 間長の情報を使い、誤りのある文に対しては母語話者と同じような評価を出すことがわ かった。母語話者と非母語話者の判断の相違は、ピッチのみの誤りがある文と誤りのな い文において、はっきりと見られた。2 つの学習者グループは共に、声色や流暢さなど に気を取られ、ややゆっくりな読み方や静かな読み方に悪い評価を下した。逆に、きび きびとした自信に満ちた女性の発話(ピッチのみの誤りの文の大半を占める)には良い 得点を与えていた。その傾向は特に初級学習者に強く出ていた。 全般的に、上級学習者の評価は初級学習者よりも厳しく、全ての文のタイプにおいて 母語話者よりも厳しいものであった。この傾向は社会言語学の分野での研究結果 (Fayer et al.:1987)と一致している。学習者の言語習得が進むと、間違った発話を聞 き分けられる耳を持つようになり、それがさらなる習得の促進に役立っていると考えら れる。しかし、全体的な評価のパターンは上級と初級学習者の間で、Px>○>Tx>X の 順で同じであった。初級学習者の評価が○とTx でほぼ同じ(3.8 と 3.7)であることだ けが上級学習者と違う点である。この結果は、上級レベルに達しても学習者の知覚はパ ラ言語情報に左右されやすく、正しい時間長に対する間違った評価も起こりかねないこ とを示唆する。この点を教師は日本語教育の現場で考慮にいれ、学習者に正しい発音に 欠かせない要素である時間長とピッチに注意を払うよう指導する必要がある。 5. 結論 母語話者も非母語話者も時間長の情報を認識していることが確認された。しかし、非 母語話者の知覚には以下のような特徴が顕著であった。 ―上級学習者は一般的に学習者の発話を批判的に聞く)に対して否定的な評価を下す。 ―初級学習者はピッチの誤りに余り注意を払わない。 ―双方のレベルの学習者とも音域や個人的な声の質などパラ言語情報に惑わされる。 学習者の判断の誤りには、パラ言語情報以外の要因も関与しているのかもしれないが、 学習者が言語の教室でモデルとして聞くのは、大抵、自信に満ちた元気な発話である。 学習者の知覚の訓練のためには多くの違うタイプの話者の発話を聞かせ、発話のバリエ ーションに慣れさせることも重要なのではないだろうか。「初級学習者は発音の良し悪 しなんてわからない。ただ当てずっぽうで判断するだけだろう。」という一般的な概念 に反し、学習者は意外にも母語話者と同じような手掛かりを基に発話の評価をしていた。 しかし、彼らの知覚はパラ言語情報に左右されやすい、不安定なものであった。本研究 の結果は第二言語教育、言語科学、特に第二言語発話の特徴同定、音声合成に役立つ情
非言語要素の統一が徹底していなかった。この点は今後の研究での合成音を用いた刺激 文による聴覚実験が必要とされる。 本研究ではオーストラリア英語を母語とする学習者の知覚を調査した。目標言語の音 韻体系の習得が不完全であるにもかかわらず、初級学習者も時間長の情報を知覚判断に 用いていることがわかった。日本語の時間長の情報は明確で聞き取りやすく、ピッチの 情報よりも習得しやすいことがその理由であろう。あるいは、この結果は時間長の情報
がとりわけ重要な役割を果たす(Harrington and Cassidy:1994)オーストラリア英語
話者に限られるのかもしれない。学習者による日本語のピッチと時間長の情報の使い方 をより明確に理解するためにも、次回の調査では他言語を母語とする学習者の知覚を調 査する必要がある。
参考文献
Fayer, J. M. & Krasinski, E. K. (1987) “Native and nonnative judgment of intelligibility and irritation”, Language, 37, 311-326.
Flege, J, E. (1988) “Factors affecting degree of perceived foreign accent in English sentences”, Journal of Acoustic Society of America 84 (1), 70-79.
Harrington, J. and Cassidy, S. (1994) “Dynamic and target theories of vowel classification: evidence from monophthongs and diphthongs in Australian” English, Language and Speech, 37, 357-373.
Hirata, Y. (2004). “Effects of speaking rate on the vowel length distinction in Japanese”, Journal of Phonetics, 32, 565-589.
Inoue, F (1993) “The significance of new dialects" Dialectologia et Geolinguistica (SIDG) 1 pp.3-27.
Riches, P. and Foddy, M. (1989) “Ethic accent as a status cue” Social Phychology Quarterly Vol 52, No. 3.197-206.
Sato, T (1995) “A comparison of phonemes and prosody in the evaluation of spoken Japanese” Japanese language education around the globe, vol.5, 139-154
Sjölander, Kåre. (2006). The Snack Sound Toolkit. http://www.speech.kth.se/snack/. Tajima, et al. (1997) “Effects of temporal correction on intelligibility of foreign-accented
English”, Journal of Phonetics, 25, 1-24
Talkin, David. (1995). “A robust algorithm for pitch tracking (RAPT)”. In Bastiaan Klejin & Kuldip K. Paliwal (eds.), Speech Coding and Synthesis, 495‑518.
Tsurutani, C. (2010) “Foreign accent matters only when timing is wrong” Intersppech 2010 Warren, P. , Elgort,I. and Crabbe,D.(2009) “Comprehensibility and prosody ratings for
pronunciation software development” Language Learning & Technology Vol. 13, No 3 87-102