九州大学学術情報リポジトリ
Kyushu University Institutional Repository
日本語圏の乳幼児の音声の音響的特徴と時間構造 : 英語圏の乳幼児との比較
山下, 友子
https://doi.org/10.15017/1398382
出版情報:Kyushu University, 2013, 博士(芸術工学), 課程博士 バージョン:
権利関係:Fulltext available.
日本語圏の乳幼児の音声の音響的特徴 と時間構造:英語圏の乳幼児との比較
Acoustic characteristics and temporal structures of speech sounds in Japanese-learning infants: Comparison
with English-learning infants
2013 年 9 月
山下 友子
Yuko Yamashita
1
目次
第1章 序論...1
1.1 はじめに...1
1.2 本研究の背景...1
1.2.1 音声生成に関わる器官の発達と音響的特徴の変化...1
1.2.2 乳幼児音声の発達的変化...4
1.2.3 乳幼児音声の時間構造...6
1.3 本研究の目的...9
1.4 倫理の順守...10
1.5 本論文の構成...10
第2章 成人日本語母語話者と成人英語母語話者との音声の音響的特徴と 時間構造...12
2.1 目的...12
2.2 音声データ...12
2.3 分析...12
2.3.1 臨界帯域フィルターを用いた因子分析...12
2.3.2 自己相関関数を用いた分析...15
2.4 結果と考察...16
2.4.1 成人日本語母語話者と成人英語母語話者との音声の音響的 特徴……….……….16
2.4.2 成人日本語母語話者と成人英語母語話者との音声の時間 構造………...20
2.5 まとめ...26
第3章 日本語圏の乳幼児の音声の聴きとりによる観測...27
3.1 目的...27
3.2 対象...27
3.3 音声データ...29
3.4 観測方法...31
3.5 観測結果...33
3.6 まとめ...34
2
第4章 日本語圏と英語圏との乳幼児の音声の音響的特徴...35
4.1 目的...35
4.2 対象...35
4.3 音声データ...37
4.4 分析...38
4.5 結果と考察...39
4.5.1 日本語圏の乳幼児...39
4.5.2 英語圏の乳幼児...48
4.5.3 成人音声と乳幼児音声との比較...54
4.6 まとめ...56
第5章 日本語圏と英語圏との乳幼児の音声の時間構造...57
5.1 目的...57
5.2 音声データ...57
5.3 分析...60
5.4 結果と考察...61
5.4.1 日本語圏と英語圏との乳幼児音声...61
5.5 まとめ...68
第6章 総合考察...69
6.1 得られた知見の概要...69
6.2 日本語圏および英語圏の乳幼児の音声のスペクトル変動の発達的 変化と言語環境の影響...70
6.3 日本語圏および英語圏の乳幼児の音声の時間構造の発達的変化 と言語環境の影響...72
6.4 今後の展望...73
6.5 英語教育への提言...74
第7章 まとめ...75
文献...78
謝辞...83
3
第 1 章 序論
1.1 はじめに
日本語と英語は,音韻や韻律などの音声構造の特徴が異なる言語であるため,
第二言語として日本語母語話者が英語を身につけることは,難しいと言われて いる。日本に住み,第一言語を日本語とする日本人が,日常生活で第二言語と しての英語をコミュニケーションの道具として使う機会もほとんどない。その ような不利な条件を克服して,日本人の若者がその言語環境を前提としながら も英語力を高めていくためには,日本人の言語習得過程を科学的に分析して行 くことが大切である。そこで,第二言語として英語を習得するために実践的な 考察を進めるには,まずは,日本語および英語を第一言語とする乳幼児の言語 習得の過程を比較して検証することが,効果的に第二言語を習得するための手 がかりになる。
本研究では,日本語もしくは英語を母語とする月齢3ヶ月から24ヶ月の乳幼 児の音声の音響的特徴およびリズムを調べる。それらが,音声生成に関わる器 官の発達と共にどのように変化するのか,また乳幼児の属する言語共同体にど のように影響を受けるのか,音響的測定方法を用いて調べることによって,音 声生成の発達に関する知見を得ることが,本研究の目的である。
1.2 本研究の背景
1.2.1 音声生成に関わる器官の発達と音響的特徴の変化
生まれたばかりの新生児の声道の構造は,喉頭が高い位置にあり,口腔と咽 頭腔がつながっている特徴を持っている。そのため,他の霊長類と同様に,声 帯の振動に共鳴を与えて言語音を発声することができない(Negus, 1949)。ま た,新生児の舌は前方に位置しており,口腔いっぱいに舌が広がっており,可 動性がなく,発声することができる音声の種類は極端に限られている。月齢 4 ヶ月を過ぎると,喉頭の位置が下がり,軟口蓋と分離し,声道が共鳴するよう になり,長い咽頭腔を持つ成人の声道構造へと変化していく。新生児の声道の 長さは,約6 cmから約8 cm であり,最終的には,約15 cm(成人女性)から
約18 cm(成人男性)までに成長する(Fant, 1960)。声道を形成する口部や咽
頭部などの各組織は,成長速度や成長パターンが異なり,7歳から18歳までの
4
間に,各組織は成人と同程度の大きさへと変化する(e.g., Liberman et al., 2001;
Vorperian et al., 1999)。
とりわけ,生後2年間で声道の長さや形状は急激に成長する。核磁気共鳴画 像法を用いたVorperian et al.(2005)の英語圏の乳幼児を対象にした研究によ り,月齢 18ヶ月までに声道長の平均値は8.3 cmにまで成長し,これは,成人 の声道長の約55% に相当することが示された。また,口腔を代表とする水平方 向の成分と,咽頭腔を代表とする垂直方向の成分を比較すると,水平方向の成 分の方がより早く成人の大きさへと成長することも示された。声道を構成する 各部位は,月齢18ヶ月までに,サイズのうえで成人の声道の構造の各部位の約 55% から 80% にまで,急激に成長することも報告されている(表 1.1)。
表 1.1. 月齢 18 ヶ月における声道の各構造のサイズの成人のサイズに対する 比率
各構造 長さ・下降・深さ・厚さ (cm) 成人に対する比率 (%)
舌長 咽頭の長さ 喉頭の下降 舌骨の下降 硬口蓋の長さ 軟口蓋の長さ 下顎の長さ 下顎の深さ 上顎の舌の厚さ 下顎の舌の厚さ
6.9 6.5 4.5 4 3.5 2.5 4.4 5 0.95
0.7
58 65 55 55 80 65 59 65 58 75
(Vorperian et al., 2005)
声道の発達に伴い,乳幼児音声の音響的特徴も変化していく。これまでにも,
音響的分析方法を用いて,声道の長さや形状が乳幼児音声の音響的特徴に与え る影響について調べる研究は盛んに行われている(たとえば,Bond et al., 1982;
Buhr, 1980; Gilbert et al., 1997; Ishizuka et al., 2007; Kent & Murray, 1982;
Lieberman, 1980; Rvachew et al., 2006)。乳幼児の声道は、成人の声道よりも
短く,形状も異なるため,乳幼児音声の音響的特徴は,成人音声の音響的特徴 とは異なるといわれている。乳幼児音声の基本周波数は,月齢が上がると共に,
低 下 す る こ と が い く つ か の 研 究 で 示 さ れ て い る (Amano et al., 2006 ;
5
McRoberts & Best, 1997)。Robb et al.(1989)による音響的研究では,月齢8 ヶ月から26ヶ月の乳幼児の基本周波数の平均値は約400 Hz であることを示し た。しかし,乳幼児の基本周波数の範囲は広く,1000 Hz 以上の値に達するこ ともある(Kent & Read, 2002)。これにはいくつかの理由が考えられる。1つ 目は,乳幼児は,語彙の獲得段階初期において,調音器官を上手く使って発話 することができず,基本周波数が安定しないことである。例えば,Amano et al.
(2006)は,月齢16ヶ月以前の乳幼児は発話間の基本周波数の値のばらつきが 大きかったが,月齢17ヶ月頃を過ぎ語彙が急激に増えるに伴い,基本周波数の ばらつきが減っていくことを示した。2つ目は,乳児は多様な発声形式を持つこ とである(Kent & Read,2002)。例えば,Kent and Murray(1982)および Kent
and Bauer(1985)による音響的研究では,倍音の二重化(harmonic doubling),
二重発声(biphonation),声のふるえ(vocal tremor)などの多様な発声形式が 観察されている。よって,乳幼児は調音器官を上手くコントロールできず,多 様な発声形式が観察されるため正確な基本周波数を測定することが難しいと考 えられる。
乳幼児音声の第1フォルマント周波数(F1)と第2フォルマント周波数(F2)
とについては,音響的な推定を行うことができる。成人男性の平均的な声道の
長さが17.5 cm であると仮定すると,F1の平均値は約500 Hz,F2の平均値は
約1500 Hz であると推定される(Kent & Read, 2002)。声道の長さが2倍にな
ればこの値は1/2倍になる。よって,乳幼児の声道の長さは8.75 cm であると 仮定すると,乳幼児音声のF1の平均値は約1000 Hz, F2 の平均値は約3000 Hz であると推定される。
乳幼児音声の F1 と F2 を音響的に分析する研究も盛んに行われている
(Gilbert et al., 1997; Kent & Murray, 1982)。例えば,Kent and Murray
(1982)は,月齢3, 6, 9ヶ月の乳児の,フォルマントの変化を音響的に分析し た。その結果,F1の平均値は約1000 Hz, F2 の平均値は約3000 Hz であるこ とが示された。Kent and Murray(1982)は,月齢が高くなるにつれてF1, F2 の範囲は広がるが,F1-F2 平面における母音分布の中心はほとんど変わらない ことを示した。Gilbert et al.(1997)は,初語の時期から短い文を発話するよ うになる時期にある,月齢15ヶ月から36ヶ月の英語圏の乳幼児4名の,F1と F2とを調べた。その結果,月齢24ヶ月まではF1とF2は比較的変化しないが,
月齢24ヶ月から36ヶ月までの間に,F1とF2 の平均は急激に低下することを 示した。F1と F2 の値を,舌の高さや位置によってカテゴリー化すると,急激 な変化は,舌の位置が高く後部で調音される母音に関係することが明らかにな った。 Ishizuka et al.(2007)は,男女各1名の日本人乳幼児(生後4ヶ月か ら 60 ヶ月)における,母音のフォルマント周波数の変化を縦断的に調査した。
6
その結果,月齢18ヶ月頃までに,乳幼児の母音空間に占める各母音カテゴリー が分化し,月齢24ヶ月頃までに,乳幼児の母音空間は急激に拡大することを示 した。
まとめると,生後2年間で,声道の長さや形状は急激に成長する。成人音声 の音響的分析と同様に,基本周波数およびフォルマント周波数を測定する手法 を用いて,乳幼児音声の音響的特徴がどのように変化するかについて研究が行 われてきた。しかし,乳幼児の音声には,多様な発声形式が観察されるため,
正確な基本周波数やフォルマント周波数を測定することが難しい。よって,乳 幼児の声道の発達に伴う,音響的特徴に関する研究がさらに必要であると考え られる。
1.2.2 乳幼児音声の発達的変化
調音器官の発達に伴い,乳幼児は,調音器官を自分で上手くコントロールし ながら,音声言語を獲得していく。月齢 0 ヶ月から 1 ヶ月は,生理的欲求に基 づいた泣き声などがほとんどである。月齢 2 ヶ月から 3 ヶ月頃には,機嫌が良 い時に,喉の奥をクーあるいはグーと鳴らすクーイングや,笑いに伴う発声が 現れる(江尻, 1999 ; Oller, 1980)。この時期の音声は,母音的音声(核)に子 音的音声が伴う(Oller, 1986)。声道の共鳴は十分ではないが,通常の声帯振動 と調音を同時に行うことができるようになる。月齢 4 ヶ月から 6 ヶ月は,拡張 期(expansion stage)と呼ばれる(Oller, 1980)。軟口蓋と喉頭蓋とが分離し,
舌の可動範囲は広がり,声道の共鳴が認められ,音声の生成が可能になる。甲 高い声(squealing),金切り声(yelling),唇を震わせて鳴らす声(raspberry), 唸り声(growing)など様々な音声が出現する(江尻, 1999)。それは,まるで 乳幼児が声を出して楽しんでいるかのようであり,声遊び音声(vocal play)と も呼ばれる(Oller, 1980)。
月齢7ヶ月から10ヶ月には,規準喃語(canonical babbling)と呼ばれる,
リズミカルな子音+母音の組み合わせを持つ音節(たとえば,da-da, ba-ba)か ら成り立つ音声が現れる(Oller, 1980)。月齢8ヶ月頃までには,どの言語圏に おいても,約 70% の乳児は,喃語を発するようになることが報告されている
(Koopmans-van Beinum & van der Stelt, 1986)。喃語期の音声は,約1年以 上続き,2語発話の時期にも,喃語と言語が並存している。
規準喃語は,言語の最小基本単位である音節から成り立っている。 世界中の 言語のほぼ全てにおいて,複数の「子音+母音」の音節を組み合わせて単語が作 られることを考えると,規準喃語は,言語を生み出すための地ならしの期間で あり,非常に重要な役割を果たしていると言えるだろう。規準喃語の特徴とし て,重複音節(たとえば,da-da-da)の出現が非常に多い傾向がある。特に,
7
初期の段階では,2 音節繰返し型(たとえば,bago-bago)よりも,1 音節繰返 し型(たとえば,da-da-da)がより多く出現することが報告されている(たと えば,Oller, 1980; Stark, 1980)。後期の段階では,音節構造が複雑になり,2 音節繰返し型が増えるが,音節間隔はばらつきが少なくなる(河野, 2001)。ま た,Oller(1986)は,音響的特徴として,音節のピークからピークの持続時間 は,100-500 ms の範囲内であり,ダイナミック・レンジは約30 dB 以下,フ ォルマント遷移の持続時間は25-125 ms の範囲内であることを,規準喃語を取 り出すための基準として設けた。
月齢12ヶ月を過ぎた頃に,「マンマ」や「バーバ」といった意味を伴う,「初 語」(first word)が出現する。これまでに,規準喃語や初期の語を構成する母 音や子音の種類やパターンに関する研究は,盛んに行われている(たとえば,
Davis et al., 2002; de Boysson-Bardies & Vihman, 1991; Kern et al., 2010; Locke, 1983; MacNeilage et al., 2000; Rvachew et al., 2006)。研究方法としては,国際音声 記号(International Phonetic Alphabet)による表記法や,成人による聴取・識別法 が用いられることが多い。
今までの研究で,規準喃語や初期の語において,多くの言語に観察される子 音は,閉鎖音(例. [b], [t], [k])と鼻音(例. [m], [n])であることが明らかになっ ている(たとえば,Davis et al., 2000 ; 河野, 2001)。 閉鎖音と鼻音の両方とも,
唇や舌による口の声道の閉鎖を伴う音であり,鼻音は,鼻の通気のみを開放し て出す音である。また,母音では,舌の位置が中程度か低い前舌母音および中 舌母音が,多くの言語に観察される(Locke, 1983)。Davis et al.(1995, 2000, 2002)
による代表的な研究では,閉鎖音と鼻音の調音の場所,および母音の舌の位置 に着目して,規準喃語と初期の語を構成する音節の種類を調べた。その結果,
多くの言語に共通する3種類の音節:(1)唇音(例. [p], [b], [m])+中舌母音(例.
[ә]),(2)舌頂音 (例. [t], [d], [n])+前舌母音(例. [i], [a]),(3)舌背音 (例.
[k], [g])+後舌母音(例. [ʌ], [о]),が明らかになった。各音節型は,顎が開く
と,音節の母音が発話される。よって,喃語と初期の語を構成する音節のパタ ーンには,連続性があることが明らかになった。また多くの言語に共通する喃 語の音節の種類は,主として下顎の開閉の動きによることを説明した。
月齢12ヶ月から18ヶ月は,50単語段階(50-word stage)(MacNeilage et al.,
2000)と呼ばれ,少なくとも意味のある単語を,約50個発話することが可能に
なる。語彙のカテゴリーは,子どもの生活に密着した物の名前が中心で,ヒト,
動物,食べ物,乗り物,挨拶などの語彙が多い(小林と佐々木, 2008)。例えば,
乳幼児は,母親を指して「ママ」と呼んだり,ご飯が欲しい時に,「マンマ」と 言う。月齢18ヶ月を過ぎると,語彙の獲得の速度は急激に早くなる。乳幼児が 急激に語彙を獲得する時期は「語彙の爆発的増加」(word explosion)期と呼ば
8
れている。これ以前は,1週間に3語程度獲得しているのに対し,「語彙の爆発 的増加」期には,1日に8語から10語獲得していると言われている(小山, 2008)。
Bates, et al.(1994)は,英語を母語とする乳幼児(月齢8ヶ月から2歳6ヶ月),
約1800人を対象に,語彙の獲得に関する調査を行った。その結果,産出語数が 100語までは,一般名詞(common nouns)が増加,100語から400語までは,
動詞の増加,400 語から 680 語までは,利用頻度の少ない「閉ざされた類」の 語彙 (closed-class vocabulary)が増加することを示した。また,Kern et al.
(2010) は,フランス語,ルーマニア語,オランダ語,アラビア語を母語とす る15名の乳幼児(月齢8ヶ月から25ヶ月)を対象に,喃語の段階,50単語段 階以前と以後の 3 段階に分けて,調査を行った。その結果,どの言語を母語と する乳幼児も,調音の仕方に関しては,どの段階においても,閉鎖音と渡り音 を最も多く使っていた。また,調音の場所に関しては,唇と,舌頂をよく使っ ていた。50単語段階以後には,摩擦音,破擦音,流音や,舌背,喉の調音場所 を含む音が出現し,また,母音空間の拡大により,母音や子音の種類が,爆発 的に多様化することも明らかになった。
まとめると,乳幼児は,月齢 2 ヶ月頃,喉の奥をクーと鳴らすクーイングを 発するようになり,月齢 4 ヶ月頃には,金切り声,唇を震わせて鳴らす声,唸 り声など様々な音声を発するようになる。月齢 7 ヶ月頃から,子音+母音の音 節で成り立つ規準喃語,そして月齢12ヶ月頃から,意味を伴った初語が出現し,
月齢18ヶ月頃から語彙が爆発的に増え,2歳頃には,短い文を発話するように なる。このように,生後 2 年間の乳幼児の音声獲得は目覚ましく,乳幼児は,
いわば「言語習得の達人」といえる。事象関連電位(event-related potential)
や,近赤外分光法(near-infrared spectroscopy)などの非侵襲技術を用いた脳 活動計測の目覚ましい進歩により,ここ数十年で発達した脳科学の研究からも,
この時期の乳幼児は,脳の言語中枢のメカニズムの目覚ましい発達に伴って,
言葉を獲得していることが明らかになっている(Kuhl, 2010)。
1.2.3 乳幼児音声の時間構造
人が音声言語を用いてコミュニケーションを行う場合,周波数特性などの音 響的特徴だけでなく,音声の時間構造も,非常に重要な要素の一つである。例 えば,「おはし」を,「おーはし」と時間構造を変化させて発音すると,お箸か ら,地名へと単語の意味が変わる。音声言語は,時間軸上に知覚される形であ るリズムを持っている。世界の音声言語は,リズムに基づいて 3 種類に大別す ることができる(たとえば,Abercrombie, 1967; Bolinger, 1965) :(1)「強勢 拍リズム」(stress-timed rhythm) : 強勢のある音節が等間隔に繰り返される
9
(例. 英語, オランダ語,ドイツ語),(2)「音節拍リズム」(syllable-timed
rhythm):各音節が等間隔で現れる(例. スペイン語,フランス語),(3)「モー
ラ拍リズム」(mora-timed rhythm):モーラ(拍)を基本的な時間の単位とす る (日本語)。
本論文では,モーラ拍リズムの日本語および強勢拍リズムの英語について扱
う。Greenberg and Arai(2004) は,英語と日本語の1音節あたりの長さを分
析した結果,音節の長さの範囲は英語の場合約 0.05-0.5 s,日本語の場合約
0.05-0.3 s であることを示した。このように,時間構造が異なる日本語もしくは
英語を母語とする乳幼児の音声が, 調音器官の発達に伴ってどのように変化す るのか,また日本語のモーラ拍リズムおよび英語の強勢拍リズムがどのように,
乳幼児の音声に影響を与えるのかについて扱った。
月齢7ヶ月頃から発する子音+母音の音節から成る喃語は,「da da da da da」
などのように,リズミカルな性質を持っており,各音節は規則性を持っている ように知覚される(Oller, 2000)。これは,喃語が下顎の開閉振動によって決定 されるためであると考えられている(Davis & MacNeilage, 1995)。 これまで に,喃語を構成する音節の長さを調べる研究は,盛んに行われている(たとえ ば,Dolata et al., 2008)。Dolata et al.(2008) は,英語を母語とする乳幼児
(生後7ヶ月から16ヶ月)の喃語を構成する子音+母音の重複した音節と,成 人英語母語話者の重複音節を調べた。その結果,喃語の平均音節時間は,約0.33 s で,総発話数の約 95% は,音節の長さの範囲が,0.25-0.42 s の間にあった ことが示された。成人音声の平均音節時間は,乳幼児音声の音節時間よりも短
く0.18 s であった。また,河野(2002)は,日本語を母語とする乳幼児の喃語
の音節間隔を,voice onset point の間隔で測定し,音節間隔は,月齢20ヶ月頃 までには,約0.42 s 以内に収まることを示した。
乳幼児音声の喃語における時間構造を調べる研究において,聴覚障害を持つ 乳幼児や,言語音声ではなく手話を獲得する聴覚正常児などを対象に,喃語の リズミカルな構造を調べる研究も盛んに行われている。乳幼児の聴覚の発達と 言語の発達は密接に関係しており,リズミカルなパターンが,外界の音にどの ように影響されるのかを調べるのに有効な方法であると言える であろう。
Petitto et al.(2004) は,言語音声または手話を獲得している聴覚正常児 (月
齢6, 10, 12 ヶ月) の2つのグループを対象に3-D 運動追跡技術を用いて,観
測を行った。その結果,両グループは,約2.5-3.0 Hz の周期を持つ非言語的な 手の動きをしていた。また,手話を獲得している聴覚正常児のグループのみ,
約 1 Hz の周期を持つリズミカルな手の動きである,いわゆる,「手話の喃語
(manual babbling)」を行っていたことを示した。Petitto et al.(2004) は,
喃語は,言語的活動であり,全ての乳幼児は,人間の言語の根源であるリズミ
10
カルなパターンに敏感であると述べている。Nathani et al.(2003) は,健聴 児と,聴覚障害児の喃語について調査した結果,健聴児では,音節の長さは,
発達と共に短くなったのに対し,聴覚障害児では,音節の長さは一定であった。
これらの研究から,乳幼児は,人間の言語音声の基盤であるリズムを知覚し,
口や手などの身体の一部を用いて,リズムを表現していると考えられる。
乳幼児音声の時間構造の研究において,乳幼児が言語音声のリズムをどのよ うに知覚しているか調べるために,音声リズムの知覚実験も多く行われている
(たとえば,Nazzi & Ramus, 2003 ; Ramus, 2002)。また,Ramus(2002)は,
日本語とオランダ語を,母語であるか否かに関わらず,生後間もない乳児でも,
リズムやイントネーションなどの韻律的特徴を手掛かりに,区別していること を示した。このことから,乳児が,リズムなどの韻律的特徴を手がかりに,世 界中の様々な音声言語を弁別する聴覚機能を有していることが示唆される。言 語音声のリズムの知覚は,発達と共に変化していく。生後 5 ヶ月頃になると,
母語のリズムを差別化して知覚することができるようになる(Nazzi, Jusczyk,
& Johnson, 2000)。Nazzi and Ramus(2003)は,乳幼児が,強勢拍リズムの
言語(英語,オランダ語)とモーラ拍リズムの言語(日本語)とを弁別して知 覚していることを明らかにした。Nazzi and Ramus(2003)は,乳幼児は,母 語のリズム構造の特徴をつかみ,その特徴にもとづいて,音声の分節化を行う ようになると述べている。
音声の知覚は,音声生成の機能と密接に結びついて発達すると考えられてい る。音声生成の過程において,母語の音声リズムがどのように影響を与えるか についての研究も行われている(たとえば,Halle et al., 1991; Vihman et al.,
1998)。Vihman et al.(1998)は,英語およびフランス語を母語とする乳幼児
(月齢 13 ヶ月から 20 ヶ月)の初期の語における,2 音節語を調べた結果,フ ランス語を母語とする乳幼児においては,2番目の母音の長さは,最初の母音の 長さよりも長く,フランス語に特有の時間構造の見られることが明らかになっ た。一方,英語を母語とする乳幼児に関しては,それぞれの音節の長さには,
多様性があり,個人間の差も大きかった。 英語を母語とする乳幼児の個人間の 差が大きかった結果に関しては,乳幼児が,異なる学習方略を持っており,そ れぞれの乳幼児は,言語を入力し,フィルターにかけ,好みの単語生成の枠組 みを用いて,言語を生成するためであると考えられる(Vihman et al., 1998)。 また,Halle et al.(1991)は,日本語もしくはフランス語を母語とする乳幼児
(月齢18ヶ月まで)の喃語および初期の語の2音節の語の1音節あたりの長さ のパターンを調べた。その結果,フランス語を母語とする乳幼児においては,
フランス語に特有の最終音節の長さが他の音節の長さより長くなっていること を示した。この傾向は,日本語を母語とする乳幼児には見られなかった。
11
このように,従来の研究では,月齢 7 ヶ月頃から発する子音+母音の音節か ら成る喃語の時間構造に関する研究が盛んに行われてきた。喃語は 1 音節あた りの長さは,約0.4 s 以下に収まっているといえそうである。しかし,初期の語 が出現してからの時間構造については,音節構造が複雑化し,音響的測定が困 難であるため,未だ,明らかではない。また,乳幼児の音声リズム知覚の研究 から,乳幼児が母語の音声リズムの特徴を差別化して知覚していることが明ら かになっているが,音声生成発達の過程において,母語の音声リズムが,乳幼 児音声の時間構造に影響を与えるかどうかに関しては,未だ,明らかではない。
1.3 本研究の目的
日本語と英語は韻律的特徴が非常に異なるため,言語の切り替えがうまくで きないことが多く,日本語母語話者が,第二言語として英語を身につけること が難しいと言われている(Leeming, 2011)。乳幼児が,どういう仕組みで第一 言語の韻律的特徴を学ぶのかということがわかれば,効果的に第二言語として の英語を習得するための手がかりとなる。日本語もしくは英語を,母語とする 乳幼児の音声獲得の過程を比較することで,音声生成の発達が乳幼児の聞く言 語に関係なく同じ成長段階をたどるのか,もしくは,言語の影響を受けるのか を検証することにより,言語理解の基礎となる音声獲得の解明につながると考 える。本研究の目的は,月齢3ヶ月から24ヶ月までにおける,日本語もしくは 英語を,母語とする乳幼児の音声の音響的特徴や時間構造が,発達に伴ってど のように変化するのかを調べることであった。
月齢18ヶ月頃までに,乳幼児の声道を構成する各部位は,長さの次元で,成 人の声道の対応する部位の,55-80% にまで成長する。声道の成長に伴い,乳幼 児は調音器官のコントロールの仕方を獲得し,月齢 3 ヶ月頃には喉の奥をなら すクーイング,月齢 8 ヶ月頃から,子音+母音の音節で成り立つ規準喃語,そ して月齢 12 ヶ月頃から,意味を伴った初期の語を発するようになる。月齢 18 ヶ月を過ぎる頃,語彙が急激に増え,月齢24ヶ月頃には,短い文を発話するよ うになる。
このような成長過程において,日本語圏および英語圏の乳幼児の音声の音響 的特徴がどのように変化するのか調べるために,聴覚系末梢の働きに近似する と考えられる,臨界帯域フィルターを用いた分析を行った。本研究ではまず,
Ueda et al.(2010)の先行研究と同様に,成人音声を対象に,音響的特徴を調 べるために,因子分析を行う。また,因子分析で取り出した因子得点の自己相 関関数を算出し,成人音声の時間構造を調べる。そして,成人音声と同様の分 析方法を用いて,月齢3ヶ月から24ヶ月までの日本語圏および英語圏の乳幼児
12
の音声の音響的特徴と時間構造を調べ,成人音声の音響的特徴や時間構造が,
乳幼児音声の発達段階のどこで現れるのか,また乳幼児の属する言語環境に影 響を受けるのかどうかを調べることを目的とする。
1.4 倫理の順守
本研究の対象者は,乳幼児であるため,人権に関して最大限に配慮した。九 州大学大学院芸術工学研究院実験倫理委員会の承認を得た後,研究を開始した。
各家庭内での録音の開始前に,乳幼児の養育者に対して,研究説明を行い,問 題がないかを確認した。各養育者に対し,参加者説明書を用いて,「本研究の目 的と方法」,「参加しない場合でも不利益を受けないこと」,「参加をいつでも取 りやめることが出来ること」「個人に関する情報は,特別な同意がある場合を除 いて秘密にされること」について十分な説明を行った。また,この研究によっ て得られたデータは,研究目的以外では利用されないということも十分に説明 を行った。その後,研究協力に関する承諾を同意書にて得てから,録音を開始 した。
1.5 本論文の構成
第 1 章では,本論文の背景として,乳幼児の調音器官の発達,乳幼児音声の 発達,乳幼児音声の時間構造に関する先行研究を紹介した。その中で,問題点 を整理し,本研究の目的を述べた。
第2章では,成人日本語母語話者と成人英語母語話者との音声を,Ueda et al.
(2010)の先行研究と同様に,臨界帯域フィルター群に通し,出力パワーの時 間的な変化に対して因子分析を行い,成人音声の音響的特徴を調べた。また,
因子分析で取り出した因子得点の自己相関関数を算出し,成人音声の時間構造 を調べた。その結果,両言語圏に共通する3つの因子が得られた。日本語と英 語との間には言語上の違いが存在するにも関わらず,非常に似通った分析結果 が得られる。成人音声の時間構造に関しては,日本語と英語とでは,時間間隔 が異なることが明らかになった。
第3章では,月齢 3, 8, 15, 20, 24ヶ月の日本語圏の乳幼児の音声に対して聴 きとりによる観測を行なった。その結果,月齢20ヶ月以上では,全体の約9割 以上の音声は,音節を持っていることが明らかになった。つまり,月齢20ヶ月 頃になると,乳幼児は,調音器官を上手くコントロールして発話することが可 能になり,音節を持った発話が増加することを示した。
第4章では,日本語圏の乳幼児(月齢3ヶ月から24ヶ月)および英語圏の乳
13
幼児(月齢 15ヶ月から24ヶ月)の音声について,第2 章で行った成人音声の 音響的分析方法と同様に,臨界帯域フィルター群に通し,出力パワーの時間的 な変化に対して因子分析を行った。その結果,月齢24ヶ月では,両言語圏にお いて,成人音声と類似する3つの因子を抽出し,4帯域に音声の帯域を分割でき ることが明らかになった。また境界周波数に着目すると,日本語圏の乳幼児音 声では約1.7倍,英語圏の乳幼児音声では約1.8倍,高いことが示された。
第 5章では,月齢15ヶ月から24ヶ月の,日本語圏および英語圏の乳幼児の 音声の時間構造について調べた。第 2 章で行った成人音声の音響的分析方法と 同様に,時間的な周期を探るために,第 4 章で因子分析により求められた,因 子得点の自己相関関数を算出した。その結果,月齢が上がると共に,時間周期 は短くなり,0.4 s 以下に収まる発話が増えることが明らかになった。この傾向 は,とくに,日本語圏の乳幼児に,顕著に見られた。
第 6 章では,日本語および英語を母語とする乳幼児の音声の音響的特徴とリ ズムについて,総合的な考察を行った。月齢が上がるとともに,乳幼児の調音 器官の発達やコントロールの仕方が,どのように日本語圏および英語圏の乳幼 児の音声のスペクトル変動に影響したかを考察した。日本語圏および英語圏の 乳幼児の音声の時間周期性の発達的変化と言語環境の影響について考察した。
第 7 章では,本論文で得られた知見をまとめた。音響的な分析を用いて,乳 幼児の母語習得過程を探る研究は,効果的な早期英語教育や,日本人学生の英 語の会話能力習得の開発と結びつくことができる可能性を示し,本論文の結び とした。
14
第2章 成人日本語母語話者と成人英 語母語話者との音声の音響的特徴と時 間構造
2.1 目的
乳幼児音声と成人音声とを比較するために,本章では,まず,成人音声を用 いて,音声の音響的特徴と時間構造を分析した。成人日本語母語話者と成人英 語母語話者との音声を,Ueda et al.(2010)の先行研究と同様の方法を用いて,
臨界帯域フィルター群に通し,出力パワーの変化に対して因子分析を行い,成 人音声の音響的特徴を調べた。また成人音声の時間構造を調べるために,因子 分析で取り出した因子得点の自己相関関数を算出した。
2.2 音声データ
「NTT-AT 多言語音声データベース」に含まれている日本語および英語の音声
(16 kHz サンプリング, 16 ビット量子化)を利用した。このデータベースに は,新聞,雑誌等の文章をもとに作られた 200 文を,一般人の母語話者,男女 各5名,計10名が発話したものが収録されている。本研究では,日本語母語話 者 10名および英語母語話者 10 名が発話する音声を利用した。各話者からラン ダムに2文ずつ選び,計20文をまとめて,因子分析による結果を比較した。成 人日本語母語話者の総発話時間は46 s, 平均発話時間は 2.3 s(1.7-3.3 sの範囲)
であった。 成人英語母語話者の総発話時間は 54 s, 平均発話時間は 2.7s
(2.1-3.9 sの範囲)であった。
2.3 分析
2.3.1 臨界帯域フィルターを用いた因子分析
Ueda et al.(2010)の分析方法と同様に,臨界帯域フィルターを用いて因子 分析を行った(図2.1)。臨界帯域フィルターの概念は,Fletcher(1940) によ って,蝸牛内の 基底膜における励起パターンと対応する聴覚末梢系の粗い周波
15
数分析機能を反映したものとして最初に提唱された。 Plompら(1967)は,オ ランダ語の15母音定常部を,臨界帯域を模擬したフィルターで分割し,各フィ ルター出力のレベル変動に対して主成分分析を行った。その結果,4つの主成分
で全体の80%の分散が説明され,母音識別に重要であるとされるF1,F2周波
数平面を用いた母音の布置と非常によく対応する布置を得ることが示された。
20個の臨界帯域フィルターが使われた各フィルターの中心周波数および遮断 周波数は,Fastl and Zwicker(2007)を参照して設定した(表2.1)。各フィル ターの傾斜は,96 dB/oct. 以上であり,フィルターの中心周波数の範囲は,
75-5800 Hz, 全フィルターの通過周波数帯域は,50-6400 Hz であった。各帯域
の出力を2乗してパワー変化を求めた。 Ueda et al.(2010)では,σ = 5 ms のガウス窓による移動平均をかけて平滑化されたが,本研究では,σ = 5, 10, 20,
40 ms のガウス窓による移動平均をかけ,σ= 20 ms のガウス窓による移動平
均をかけたときが最適であったので,σ= 20 msのガウス窓を用いた。1 ms ご とに値を取り出し,臨界帯域間の相関係数行列を計算し,第 2 および第 3 主成 分まで算出し,バリマックス回転をかけ,因子得点係数を求めた。
図 2.1 因子分析手順を示したブロックダイアグラム。臨界帯域フィルター群を 使って,その出力を 2 乗し平滑化することでパワー変動を求め,帯域同士のパ ワー変化の相関係数を基に,因子分析を行った。 Ueda et al.(2010)からの抜 粋。
16
表 2.1 帯域通過フィルターの設定。フィルターバンクの周波数は,概ね Fastl and Zwicker(2007)に従った。
Band number Critical Band
Center frequency (Hz) Passband (Hz)
1 75 50-100
2 150 100-200
3 250 200-300
4 350 300-400
5 450 400-510
6 570 510-630
7 700 630-770
8 840 770-920
9 1000 920-1080
10 1170 1080-1270
11 1370 1270-1480
12 1600 1480-1720
13 1850 1720-2000
14 15
2150 2500
2000-2320 2320-2700 16
17
2900 3400
2700-3150 3150-3700 18
19
4000 4800
3700-4400 4400-5300
20 5800 5300-6400
17
2.3.2 自己相関関数を用いた分析
時間的な周期を探るために,因子分析で 1 ms ごとに取り出した因子得点の 自己相関関数を算出した。N サンプルの時間において,n番目と,(n + k) 番 目の相関は,以下のように計算した
𝑟(𝑘) = ∑𝑁−𝑘𝑛=1(𝑥𝑛− 𝑥̅1)(𝑥𝑛+𝑘− 𝑥̅𝑘+1)
√∑𝑁−𝑘𝑛=1(𝑥𝑛− 𝑥̅1)2√∑𝑛=𝑘+1𝑁−𝑘 (𝑥𝑛− 𝑥̅𝑘+1)2 𝑥̅1 = ∑𝑁−𝑘𝑛=1𝑥𝑛
𝑁−𝑘 かつ 𝑥̅𝑘+1 = ∑𝑁𝑛=𝑘+1𝑥𝑛
𝑁−𝑘
自己相関関数の時間的距離 τ は,以下のように定義した。
R(τ) = 𝑟(τ・𝑓𝑠)
𝑓𝑠 は,サンプリング周波数を表す; R(τ) は, τ・𝑓𝑠 が,整数の時のみ定義さ
れる。
因子分析で抽出した因子の因子得点の自己相関関数の値を 10 msごとに,0-1s の範囲で求めた。時間的な周期の全体的なパターンを観測するために,それぞ れの発話についての自己相関関数を計算した。0より大きい最初のピークを,自 己相関関数の値と時間位置とを求めるために用いた。
18
2.4 結果と考察
2.4.1 成人日本語母語話者と成人英語母語話者との音声の音響的特
徴
日本語母語話者および英語母語話者の音声データをまとめて第 2 および第 3 主成分まで算出し,バリマックス回転をかけた結果を,図2.2-3にそれぞれ示す。
横軸は,臨界帯域フィルターの中心周波数(center frequency)を示す。縦軸は,
因子負荷量(factor loading)を示す。成人日本語母語話者と成人英語母語話者 との音声について第2因子まで抽出すると,両言語において,840 Hz 付近にピ ークを持つ中帯域の因子が得られた。二峰性のある因子は安定していなかった。
成人日本語母語話者と成人英語母語話者との音声について第 3 因子まで抽出す ると,Ueda et al.(2010)の先行研究で,日本語母語話者および英語母語話者 計10名(男女各5名)によって発話された,200文を分析対象にして得られた 結果と,ほとんど同じであった。840 Hz 付近の中帯域の因子が得られた。また,
二峰性のある因子,高周波数帯域に関連のある因子が得られた。 表2.2 に第2 主成分まで抽出した,日本語母語話者および英語母語話者の音声の結果におけ る,帯域の境界周波数を示す。表 2.3 に第 3 主成分まで抽出した,日本語母語 話者および英語母語話者の音声の結果における,帯域の境界周波数を示す。こ れらの境界周波数は,日本語,英語のあいだで似通っていた。
19
Adult Japanese speakers(N = 10)
Adult English speakers ( N = 10 )
図 2.2 日本語母語話者10名(A), 英語母語話者10名(B)の音声因子分析の 結果。第2主成分まで抽出した。累積寄与率は,日本語母語話者では,32.4%, 英 語母語話者では,33.1% であった。中帯域の因子が得られた。
20
Adult Japanese speakers(N = 10)
Adult English speakers ( N = 10 )
図 2.3 日本語母語話者 10 名(A),英語母語話者 10 名(B)の音声因子分析 の結果。第3主成分まで抽出した。累積寄与率は,日本語母語話者では,44.1%, 英語母語話者では,46.9% であった。中帯域の因子,二峰性の因子, 高周波数 帯域の因子が得られた。
21
表 2.2 第2主成分までにバリマックス回転をかけた日本語母語話者および英語 母語話者の音声の分析結果における,帯域の境界周波数の比較
表 2.3 第3主成分までにバリマックス回転をかけた日本語母語話者および英語 母語話者の音声の分析結果における,帯域の境界周波数の比較
Language Boundaries (Hz)
1st 2nd
Japanese English
465 -
2935 3065
Language Boundaries (Hz)
1st 2nd 3rd
Japanese English
476 511
1941 1593
3914 2640
22
2.4.2 成人日本語母語話者と成人英語母語話者との音声の時間構造 因子分析により抽出した 3 つの因子の因子得点の自己相関関数の値を,それ ぞれの音声サンプルごとに算出した結果を,図2.4 に示す。図2.4(A)は,中 帯域の因子(middle-range factor)の因子得点の自己相関関数, 図 2.4(B)
は,二峰性の因子(two-peak factor)の結果,図2.4(C)は,高周波数帯域に 関連のある因子(high-range factor)の結果を示す。中帯域の因子の自己相関 関数の最初のピークの時間位置は,成人日本語母語話者の音声では,0.27 s(S.D.
= 0.10 s),成人英語母語話者の音声では,0.48 s(S.D. = 0.11 s)であり,有意
差が認められた [t(38)= -6.129, p < .01]。 自己相関関数のピーク値の相関値
(係数)の平均値は,成人日本語母語話者では,0.18(S.D. = 0.10),成人英語 母語話者では,0.32(S.D. = 0.19)であり,有意差が認められた [t(38) = -2.83, p < .01]。
二峰性の因子の自己相関関数の最初のピークの時間位置は, 成人日本語母語 話者では,0.36 s (S.D. = 0.15 s), 成人英語母語話者では,0.31 s(S.D. = 0.15 s)であり,有意差は認められなかった [t(38)= -1.078, p >.05]。自己相関関 数のピーク値の相関値(係数)の平均値は,成人日本語母語話者では,0.18(S.D.
= 0.14), 成人英語母語話者では,0.24(S.D. = 0.17)であり,有意差は認めら
れなかった [t(38)= 1.13, p >.05]。
高周波数帯域に関連のある因子の自己相関関数の最初のピークの時間位置は, 成人日本語母語話者では,0.37 s(S.D. = 0.17 s), 成人英語母語話者では,0.36 s(S.D. = 0.15 s)であり,有意差は認められなかった [t(38)= -0.16, p >.05]。
自己相関関数のピーク値の相関値(係数)の平均値は,成人日本語母語話者で は,0.23(S.D. = 0.12), 成人英語母語話者では,0.22(S.D. = 0.17)であり,
有意差は認められなかった [t(38)= -0.34, p >.05]。
23
Middle-range factor
Two-peak factor
図 2.4 成人日本語母語話者(●)と,成人英語母語話者(+)とのそれぞれの 音声サンプルにおける因子分析により抽出した因子の因子得点の自己相関関数 を算出し,最初のピークにおける,自己相関関数のピーク値の相関値と時間位 置を示したもの。(A)は中帯域の因子,(B)は二峰性のある因子,(C)は高周 波数帯域に関連のある因子の自己相関関数のピーク値の相関値と時間を示す。
(次ページへ続く)。
24
High-range factor
25
自己相関関数の最初のピークの時間位置の相対度数分布を,図2.5に示す。図
2.5(A)は,中帯域の因子の因子得点の自己相関関数, 図 2.5(B)は,二峰
性のある因子の自己相関関数,図 2.5(C)は,高周波数帯域に関連のある因子 の自己相関関数を示す。 中帯域の因子の自己相関関数の最初のピークの時間位 置τは,0.2 <τ≤ 0.4 s の範囲に入る例は,成人日本語母語話者では,65%であ ったのに対し、成人英語母語話者では,20%であった。0.4 <τ≤ 0.6 s の範囲に 入る例は,成人日本語母語話者では,10%であったのに対し,成人英語母語話 者では,60%であった。 二峰性の因子の自己相関関数の最初のピークの時間位 置τでは,0.2 <τ≤ 0.4 s の範囲に入る例は,成人日本語母語話者では,50%で あり、成人英語母語話者では,60%であった。高周波数帯域の自己相関関数の 最初のピークの時間位置τでは,0.2 <τ≤ 0.4 s の範囲に入る例は,成人日本語 母語話者では,55%であり、成人英語母語話者では,35%であった。
まとめると,中帯域の因子の自己相関関数の最初のピークの時間位置によっ て求められた,成人日本語母語話者の音声の時間周期性は 0.27 s,成人英語母 語話者の音声の時間周期性は0.48 sであり,有意差が認められた。 Port et al.
(1987)の研究では日本語母語話者の音声の1モーラの長さは平均 0.13-0.14 s,
2モーラの長さは,平均 0.24-0.25 s と報告した。また,Ishikawa(1997)の 研究では,日本語母語話者の2モーラの長さは,0.23-0.27 s の範囲で変化する と報告した。日本語には,2モーラから成るフット(foot)の構造が存在し,日 本語の音韻において非常に重要な役割を果たすといわれている(Inaba, 1998;
Poser, 1990)。 本研究の成人日本語母語話者の音声の時間周期性の結果は,日
本語には,モーラの単位よりも長い時間周期性の単位,つまりフットが存在す る可能性を示した。一方,成人英語母語話者の音声の時間周期性に関しては,
Jassem et al.(1984)の先行研究では,フットの平均長は,0. 42 sと報告され
ている。また,Lea(1974)は,8人の英語母語話者によって発話された31文 を分析し,フットの平均長は,0.53 s であると報告した。本研究の成人英語母 語話者の音声の時間周期性の結果は,過去の先行研究(Jassesm et al., 1984; Lea, 1974)と対応している。
26
Middle-range factor
Two-peak factor
図 2.5 二峰性の因子の自己相関関数の最初のピークの時間位置の相対度数分布。
(A)中帯域の因子の因子得点の自己相関関数,(B)二峰性のある因子の自己 相関関数,(C)高周波数帯域に関連のある因子の自己相関関数を示す。(次ペー ジに続く)。
Two-peak factor
27
High-range factor
28
2.5 まとめ
本章では,成人日本語母語話者と成人英語母語話者との音声を,Ueda et al.
(2010)と同様の方法を用いて,臨界帯域フィルター群に通し,出力パワーの 変化に対して因子分析を行い,成人音声の音響的特徴を調べた。また,因子分 析で取り出した因子得点の自己相関関数を算出し,成人音声の時間構造を調べ た。その結果,以下のことが明らかになった。
まず,成人日本語母語話者と成人英語母語話者との音声について第 3 因子ま で抽出すると,Ueda et al.(2010)の先行研究の結果と,ほとんど同じであっ た。因子のピークがどのあたりに位置するか,因子が交差する様子に着目する と,日本語音声の結果と英語音声の結果は,非常に似通っていた。両言語圏に おいて,中帯域の因子,二峰性のある因子,高周波数帯域に関連のある因子が 得られた。日本語を英語の間には言語上の違いが存在するにも関わらず,非常 に似通った分析結果が得られたことになる。
成人音声の時間構造に関しては,中帯域の因子の自己相関関数の最初のピー クの時間位置によって求められた。この結果から観測される時間周期性は,成 人日本語母語話者においては0.27 s,成人英語母語話者においては0.48 sであ り,有意差が認められた。したがって,成人音声の時間構造に関しては,日本 語と英語とでは,時間周期性が異なることが,分析結果として得られたことに なる。
29
第 3 章 日本語圏の乳幼児の音声の聴 きとりによる観測
3.1 目的
本章では,日本語圏の乳幼児(月齢3, 8, 15, 20, 24 ヶ月)の音声に対して聴 きとりによる観測を行なった。どの月齢で音節を持つ発話が現れるか,研究協 力者が聴きとりによる観測を行った。
3.2 対象
乳幼児のそれぞれの養育者へ,書面と口答にて研究協力の承諾を依頼し,同意 の得られた養育者の乳幼児を研究対象とした。対象者は,正常な発達段階にあ る日本語を第一言語とする家庭で生活する月齢 3 ヶ月の 3 名の乳幼児(女児 3 名),月齢8ヶ月の3名の乳幼児(女児1名,男児2名),月齢15ヶ月の5名の 乳幼児(女児3名,男児2名),月齢20ヶ月の5名の乳幼児(女児3名,男児 2 名),月齢24 ヶ月の5名の乳幼児(女児3名,男児 2名)である。表3.1 に 日本語圏の乳幼児の個人ごとの身長と体重を示す(同一児のデータも用いられ ている)。身長と体重のデータから,乳幼児の身体の発育が正常な発達段階にあ ることが示された。月齢3ヶ月の日本語圏の乳幼児JF07, JF08のデータに関し ては,養育者が記録していなかったが,観察する限りにおいてこの 2 名は正常 な発達段階にあった。
30
表 3.1 日本語圏の乳幼児の身長と体重。Fは女児,Mは男児を示す。
Months of age Weight (kg) Height (cm)
JF05 JF07 JF08
3 3 3
7
―
―
63
―
― Mean
S.D
― ―
JF05 JM06 JM09
8 8 8
9 8 9
70 69 72 Mean
S.D
8.7 0.5
70.3 1.5 JF02
JF06 JM03 JM04 JM07
15 15 15 15 15
8 8 9 10 10
78 76 76 76 80 Mean
S.D
9 1.0
77.2 1.9 JM01
JF02 JF03 JM03 JF01
20 20 20 20 20
11 9 11 10 12
83 82 83 78 79 Mean
S.D
10.6 0.9
81 2.4 JF02
JF03 JF06 JM01 JM03
24 24 24 24 24
10 12 10 11 11
84 87 85 84 82 Mean
S.D
10.8 0.6
84.4 1.8
31
3.3 音声データ
乳幼児の音声は,携帯録音機(Roland, R-09HR; TASCAM, DR-07)を使い,
44.1 kHzサンプリング,16ビット量子化,ステレオ形式という条件で録音を行
った。録音場所は,乳幼児が生活する一般の家庭であった。録音時間は,1ヶ月 に約2時間であった。録音機は,乳幼児から,できれば1 m以上の距離を開け て録音を行った。録音機は床からの反射音などが録音されるのを防ぐため座布 団あるいはクッションの上に乗せて録音した。テレビ,ラジオ,洗濯機などの 雑音が入らないように依頼した。録音の際,両親には,普段通りに行動するよ うに依頼した。乳幼児に発話させるための特別な手順は取らなかった。このよ うに,日豪の日常に近い自然な状況で録音がなされていることが,本研究の特 徴である。著者と九州大学芸術工学部の学生 2 名が,オーディオ・ソフト
(Syntrillium,CoolEdit 2000; Adobe, Audition)を使い,以下の基準に基づい て乳幼児音声の切り出しを行った。
1.発話前後の無音区間75 ms を含める。
2.発話間の無音区間が,1200 ms よりも短い時,全体を一つの発話と見 なす。
3.発話が成人の音声や雑音によって分離された場合,分離された部分は,
異なる発話として分析する。
4.発話が,成人の音声や雑音と重なった場合,分析対象から除外する。
5.笑い声,泣き声,叫び声,金切り声,唸り声などは,分析対象から除 外する。
日本語圏の乳幼児の総発話数,平均発話時間を,表3.2に示す。
32
表3.2 日本語圏の乳幼児の総発話数,平均発話時間
Months of age Number of utterances
Average
duration of an utterance [s]
Standard
Deviation (SD)
[s]
JF05 JF07 JF08
3 3 3
52 40 38
3.5 1.7 1.4
1.6 1.1 0.6
Overall 130 2.2 1.1
JF05 JM06 JM09
8 8 8
41 83 56
1.7 2.7 2.8
1.1 1.4 1.5
Overall 180 2.4 1.3
JF02 JF06 JM03 JM04 JM07
15 15 15 15 15
98 132 111 69 74
2.0 1.1 1.0 1.2 1.7
1.7 1.0 0.6 0.8 1.4
Overall 484 1.4 1.1
JM01 JF02 JF03 JM03 JF01
20 20 20 20 20
90 102 95 85 102
1.2 1.2 1.2 1.8 1.3
1.0 0.9 1.1 1.3 1.1
Overall 474 1.3 1.1
JF02 JF03 JF06 JM01 JM03
24 24 24 24 24
101 130 124 123 108
1.8 1.5 1.4 1.5 1.5
0.9 0.7 0.7 0.8 0.7
Overall 586 1.5 0.8
33
3.4 観測方法
利用機器
観測は,暗騒音 30 dB(A) 以下の防音室で行った。音声刺激はコンピュー ター(Frontier KZFM71/N)に取り付けたオーディオカード(E-MU0404) か らディジタル出力した。出力した信号は,オーディオプロセッサー(Onkyo
SE-U55GX), ローパスフィルター(NF DV8FL, 遮断周波数 15000 Hz), グ
ラフィックイコライザー(Roland RDQ-2031), ヘッドフォンアンプ(Stax SRM-313)の順に通され,ヘッドフォン(Stax SR-303)から後述する判定者 の両耳に呈示された。オーディオプロセッサーによってデジタル信号がアナロ グ信号に変換され,低域通過フィルターは,エイリアシング周波数を抑制する ために用いており,イコライザーはヘッドフォンの周波数特性の形状を平坦に するために用いた。音声刺激の音圧較正には,騒音計(Node Type 2075),人口 耳(Brϋel & Kjӕr TYPE 4153)を用いた。
手続き
研究者あるいは研究協力者である判定者が,乳幼児音声について以下の 2 つ の選択肢から選び,独立に分類した。また,「1.音節あり」を回答した場合,「a.
1音節」,「b. 2音節以上」かどうかについても,判定した。本観測に入る前に,
音声サンプル30個の予備的観測を行った。3人の観測者が,独立に判定して,
下記の基準を決めた。
1.音節あり a. 1音節 b. 2 音節以上 に分ける。
:日本語の音節に該当するものが一箇所でも含まれる。
例)「あ」「い」「か」「た」「ざ」「ぶ」「ぷ」「しゃ」「ぎょ」「まっ」「と ん」「ねー」
:音節が1回(da, ka, ta)だけ現れるものも含む。
:拗音は2文字で記すが1音節。
例)「き」「ぎ」「し」「じ」「ち」「に」「ひ」「び」「ぴ」「み」「り」の11 に,それぞれ小さく「や」「ゆ」「よ」を加えて書き表す音節「き ゃ」「きゅ」「きょ」「ひゃ」「びゃ」「ぴゃ」など。
:促音を含む音は1音節。
例)「あっち」の「あっ」は1音節。
:撥音を含む音は1音節。
例)「さんま」の「さん」は1音節。
34
:長音は1音節。
例)「カード」の「カー」は1音節。「アー」も1音節
2.音節がない。
1に記したような音が一度も現れない。(一度でも現れたときには1.に分類す る。)
例)区切りのない(あるいははっきりしない)声が出つづけている。
笑い声。
何かしゃべっているが,音節が聞き取れない。
子音のような音のみ。
音声刺激は,ランダム順に呈示された。判定者は,刺激を何度でも聴くこと ができた。観測全体に要した時間は,判定者一名につき 7 時間程度であった。
判定者は,これを2日間から3日間かけて行なった。
研究協力者
正常な聴力を有する3名(女性2名, 男性1名)を判定者とした。判定者は,
九州大学の大学院生で,音声ないし聴覚の研究をしている者であった。
35
3.5 観測結果
日本語圏の乳幼児月齢3, 8, 15, 20, 24ヶ月の音声データについて,3名の判 定者から得られた,聴き取りによる観測を,図 3.1 に示す。音節あり,音節な し,母音・子音 1 回ずつに関しては,少なくとも 2 名の判定者の結果が一致し たものである。
月齢が上がるにつれて,「2 音節以上」の回答の頻度(%)は増えていった。
月齢3ヶ月では0%, 月齢8ヶ月では18%, 月齢15ヶ月では43%, 月齢20ヶ月
では87%, 月齢24ヶ月では98% であった。一方,月齢が上がるにつれて,「音
節なし」の回答の頻度(%)は減少した。月齢3ヶ月では100%, 月齢8ヶ月で
は79%, 月齢15ヶ月では39%, 月齢20ヶ月では3%, 月齢24ヶ月では1%であ
る。
図3.1 日本語圏の乳幼児の音声に対する聴き取りによる観測。
One syllable
36
3.6 まとめ
本章では,月齢 3, 8, 15, 20, 24ヶ月の日本語圏の乳幼児の音声に対して聴き とりによる観測を行なった。その結果,月齢3, 8ヶ月では,「音節なし」の音声 は,「音節あり」の音声よりも多いが,月齢 15, 20, 24ヶ月になると,「音節あ り」の音声は,「音節なし」の音声よりも多くなる。特に,月齢 20 ヶ月以上で は,全体の約 9 割以上の音声は,音節を有していることが明らかになった。つ まり,月齢20ヶ月頃になると,乳幼児は,調音器官を上手くコントロールして 発話することが可能になり,音節のある音声が増加することを示した。