本章では、学習者コーパスと母語話者コーパスを比較し、過剰使用語と過少使用語がど のような語であるのかについて分析する。つまり、特徴語という観点から、学習者の話し 言葉における使用語彙を明らかにする。まず、過剰使用語と過少使用語を抽出する。次に、
過剰使用語と過少使用語について
VocabProfil
における頻度層との関係を分析する。最後 に、特徴語の性質をより詳しく分析するため、特徴語を品詞別にまとめる。語彙の豊かさの分析では、タスクに基づくコーパスも自由会話コーパスもためらい語、
相づち、固有名詞、間投詞、外国語も全て分析の対象外としたが、特徴語分析ではこれら の語を全て分析対象とする。各コーパスのトークン数とタイプ数は以下の通りである(表
28)。
表 28 トークン数とタイプ数
タスクに基づくコーパス 自由会話コーパス
母語話者 学習者 母語話者 学習者
トークン 51823 28436 65591 34518
トークン平均 1328.80 729.13 3279.55 908.37
タイプ 2474 1488 4467 2064
タイプ平均 371.05 242.64 602.75 205.11
自由会話コーパスについては、語彙の豊かさの分析で分類することができた「初中級学 習者」グループと「上級学習者」グループ間の使用語彙の差についても分析を行う。初中 級学習者コーパスと上級学習者コーパスのトークン数とタイプ数については、以下の通り である。
表 29 トークン数とタイプ数の平均
初中級学習者 上級学習者
トークン 9991 24527
トークン平均 434.39 1635.13
タイプ 910 1758
タイプ平均 128.30 322.87
6.1. タスクに基づくコーパス
過剰使用語と過少使用語を抽出するため、閾値を決定した。過剰使用語は
G
2≧50
とし、過少使用は
G
2≦-50
とした。なお、過剰使用語に見られるNP
は固有名詞を指し、過少使 用語に見られるHESIT
は、ためらい語euh, eh, bah, bin
などを指す。表 30 過剰使用語と過少使用語
過剰使用語 過少使用語
100≦G
2VOUDRAIS HESIT
ELLE ON
NP DONC
NE JE
50≦G
2<100
PRENEZ PEU
JAPONAISE BIEN
VOUS C’
PEUX VRAIMENT
ABORD TOUT
FOOTBALL UNIVERSITE
次の節から、過剰使用語と過少使用語について、詳しい数値とともに、VocabProfilの 頻度層との対応や品詞分類を行い、分析を進めていく 。
6.1.1. 過剰使用語
過剰使用語について、学習者と母語話者による実測値、
10
万語あたりの調整頻度、グ ループ内での使用割合を示すレンジ、そしてKeyness
は、以下の通りである(表31)。
表 31 過剰使用語の頻度と
keyness
順位
学習者 母語話者
Keyness
実測値 調整頻度 レンジ
(%)
実測値 調整頻度 レンジ(%)
1 VOUDRAIS 212 745.53 100.00 59 113.85 79.49 208.30
2 ELLE 388 1364.47 100.00 264 509.43 94.87 157.37
3 NP 1546 5436.77 100.00 1872 3612.30 100.00 145.20
4 NE 181 636.52 100.00 74 142.79 71.79 133.62
5 JE 1589 5587.99 100.00 1995 3849.64 100.00 126.29
6 PRENEZ 63 221.55 74.36 7 13.51 12.82 91.43
7 JAPONAISE 93 327.05 97.44 40 77.19 56.41 65.45
8 VOUS 297 1044.45 100.00 276 532.58 100.00 64.71
9 PEUX 139 488.82 89.74 89 171.74 82.05 61.48
10 ABORD 46 161.77 69.27 7 13.51 15.38 60.25
11 FOOTBALL 35 123.08 56.41 2 3.86 5.13 58.85
12 UNIVERSITÉ 89 312.98 94.87 46 88.76 76.92 51.82
特にレンジの値に注目すると、興味深い点が
2
点あることが分かる。まず、学習者の レンジが100
%の語があったが、母語話者による使用割合が7
割台のものがある。これは、voudraisと
ne
であるが、全ての学習者が必ずこれらの単語を一度は使用していたの に対して、これらの単語を使用していなかった母語話者がいたことを意味している。また、prenez, abord, football
は、学習者のレンジに対して母語話者のレンジが明らかに低い。これは、学習者のほとんどがこれらの単語を使用していたが、母語話者の中でこれらの単語 を使用した人が少なかったということを意味している。
次に
VocabProfil
における頻度層に従い、各過剰使用語がK1
機能語、K1
内容語、K2
、K3
、Off-list
のどれに属するのかを分析したところ、表32
のようになった。なお、NP(固
有名詞)はこの分析の対象外とした。
表 32 過剰使用語と
VP
の頻度層との関係順位
VP
過剰使用語1 K1
内容語VOUDRAIS
2 K1
機能語ELLE
3 NA NP
4 K1
機能語NE
5 K1
機能語JE
6 K1
内容語PRENEZ
7 K1
内容語JAPONAISE
8 K1
機能語VOUS
9 K1
内容語PEUX
10 K1
内容語ABORD
11 K1
内容語FOOTBALL
12 K1
内容語UNIVERSITE
以上の表より、学習者による過剰使用語はすべて
K1
機能語ないしK1
内容語に属する ことが分かる。つまり、学習者による過剰使用語は、フランス語の頻度層第1
位から1000
位のものであると言える。また、VocabProfilによる頻度層と品詞の関係について、まとめたものが表
33
である。表 33
VocabProfil
の頻度層と品詞VP
品詞 過剰使用語K1
機能語代名詞
ELLE
副詞
NE
代名詞JE
代名詞
VOUS
K1
内容語動詞
VOUDRAIS
動詞
PRENEZ
形容詞
JAPONAISE
動詞
PEUX
名詞
ABORD
名詞
FOOTBALL
名詞
UNIVERSITE
K1
機能語についてはもともと品詞が限定されているが、その中でも人称代名詞主語が 多いことが分かる(elle, je, vous)。このことは、語彙的要因による過剰使用であるのか統語 的要因であるのかというような様々な要因が考えられる。この点については、共起関係やN-grams
分析などのMWUs
レベルで分析する必要があるため、後のMWUs
分析で詳しく扱うこととする。
K1
内容語では、 動詞が3
語、名詞が3
語、形容詞が1
語となった。したがって、過 剰使用語において、名詞と動詞が占める割合が高い。また、固有名詞を含めれば、名詞の 占める割合はさらに高くなる。つまり、学習者の使用語彙は名詞に大きく依存していると 言える。6.1.2. 過少使用語
過少使用語と判断された語における、学習者と母語話者による実測値、
10
万語あたり の調整頻度、レンジ、Keynessは、以下の通りである(表34)。
表 34 過少使用語の頻度と
keyness
順位 学習者 母語話者
Keyness
実測値 調整頻度 レンジ 実測値 調整頻度 レンジ
1 HESIT 57 200.45 28.21 1199 2313.64 100.00 -711.58
2 ON 94 330.57 82.05 521 1005.35 100.00 -125.73
3 DONC 41 144.18 53.85 320 617.49 84.62 -109.91
4 PEU 8 28.13 17.95 163 314.53 92.31 -94.73
5 BIEN 56 196.93 76.92 313 603.98 92.31 -76.13
6 C’ 237 833.45 97.44 795 1534.07 100.00 -76.04
7 VRAIMENT 6 21.10 12.82 105 202.61 69.23 -57.69
8 TOUT 14 49.23 30.77 135 260.50 76.92 -54.38
これより、ためらい語である
HESIT
のkeyness
が極めて高いことが分かる。学習者は 母語話者よりもためらい語の使用が少ないのは、学習者が言葉に詰まった際の対処として、ためらい語を使用せずに無言のポーズをとった可能性がある。しかし、このような無言の ポーズはためらい語の機能を果たす一方で、話者のターンの終了や、発言権の移行も意味 する。つまり、ポーズは誤った解釈を引き起こす可能性があり、ポーズを多用する学習者 は間を持たせている間に、自身のターンを失う可能性がある
(Gilquin 2008:141)。そこで、
学習者は外国語で容認可能な表現を探している間の間を持たすための技術が必要である
(Gilquin 2008: 121)。これまで、ためらい語は語彙教育で重要項目として考えられてこな
かったが、談話面では極めて重要なものであると言える (McCarthy and Carter 1997: 28)。しかし、コーパス言語学の推進力と、その結果引き起こされた言語の真正性への興味の高 まりのもと、ためらい語は教科書の中に採用されるようになってきた。ためらい語は目立 たないことから、ためらい語に単に触れるだけでは十分に学習者の注意を喚起することが できない。したがって、ためらい語を引き立て、適切なアクティビティを通して学習者の 注意を引きつける必要がある
(Gilquin 2008: 142-143)。ためらい語の過少使用のその他の
可能性として、日本語のためらい語を使用していることも考えられる。日本語はFW
と 転写したこと 、また学習者が語を発しなかった際にはコーパスには全く反映されないこ とより、これは憶測から脱することはできない。次に、VocabProfil における頻度層に従い、過少使用語について
K1
機能語、K1 内容語、K2
、K3
、Off-list
のどれに属するのかを分析したところ、以下のようになった(表35)。な
お、
HESIT(ためらい語)はこの分析の対象外とした。
表 35 過少使用語と
VP
の頻度層との関係順位
VP
1 NA HESIT
2 K1
機能語ON
3 K1
機能語DONC
4 K1
内容語PEU
5 K1
内容語BIEN
6 K1
機能語C’
7 K1
内容語VRAIMENT
8 K1
機能語TOUT
以上の表より、過少使用語においても全て
K1
機能語とK1
内容語であることが分かる。つまり、学習者による過少使用語は、頻度層
1
位から1000
位のものである。これは、フ ランス語において高頻度語である単語であるのにも関わらず、母語話者と比較して学習者 はそれらの語彙を過小使用しているということを意味している。Ringbom(1998: 48)はこ の点について、どの学習者言語でも母語話者と比べて、高頻度語を使用する頻度が一貫し て低いということを指摘しており、この見解を支持する結果となった。もちろん、語によ って大きなばらつきがあり、学習者グループの性質によって過剰使用もあれば過少使用も ある点についても言及されており、本分析で過剰使用に高頻度語が多かった点についても、これは矛盾する現象ではない。
次に、
VocabProfil
による頻度層と品詞の関係についてまとめたものが表36
である。表 36
VocabProfil
の頻度層と品詞VP
品詞K1
機能語代名詞
ON
接続詞、副詞
DONC
代名詞
C’
形容詞、副詞、代名詞、名詞
TOUT
K1
内容語副詞
PEU
副詞、名詞、形容詞
BIEN
副詞
VRAIMENT
VocabProfil
の頻度層からは、過少使用語は高頻度語ばかりであるということが分かったが、品詞ごとに分類してみると明らかに過剰使用語の様相とは異なることが分かる。ま ず、品詞の種類の違いである。過剰使用語には名詞や形容詞が多く見られたが、過少使用 語には、副詞が多いのが分かる。もう一点として、複数の品詞を持つ単語が多いことが分
かる。つまり、多義語が多い。また、 過剰使用語に多くの人称代名詞主語が含まれてい たが、過少使用語にも
on
という人称代名詞主語が含まれている。以上の点は、もちろん前後の文脈を考慮する必要があるため、後の
MWUs
分析で追従 することとする。6.2. 自由会話コーパス
タスクに基づくコーパスの分析方法と同じく、過剰使用語と過少使用語を算出し、閾値 を決定した。過剰使用語は
G
2≧50とし、過少使用はG
2≦-50とした。表 37 過剰使用語と過少使用語 過剰使用語 過少使用語
100≦G
2INT ENFIN
OUI HEIN
NP QUI
FW QUOI
TRES LES
VISITE ÇA
BEAUCOUP DES
BC
50≦G
2<100
ALLEE FAIT
FRANÇAIS ILS
JAPONAIS OUAIS
ALLE QU’
PENDANT VOIS
EST LA
C’ BON
MUSIQUE TOUT
J’ AVOIR
DIFFICILE LEUR
JE MEME
COMMENT SAIS
次の節から、過剰使用語と過少使用語について、詳しい数値とともに、VocabProfil の 頻度層との対応や品詞分類を行い、分析を進めていく。
6.2.1. 過剰使用語
過剰使用語のリストと、学習者と母語話者による実測値、
10
万語あたりの調整頻度、レンジ、Keynessは、以下の通りである(表