第二章 語レベルの研究 –Word Units 研究−
2.2. 語彙リスト開発の歴史
2.8.3. LFP への反論
LFP
も他の語彙テストと同様に、一種の間接テストである。LFP
は、テクスト内に現 れる高頻度語や低頻度語の割合を出すことができるが、この割合はテクスト産出者が持つ 語彙の高頻度語や低頻度語の割合を反映しているとは言い切れない。なぜなら、プロファ イル内には正しく産出された語彙のみが反映されるため、LFP
は学習者が言語形式と意 味が正しくリンクしている高頻度語と低頻度語の割合しか示すことができないからである(Laufer and Goldstein 2004: 403)。つまり、テクストに現れないが、話者が持っている
と考えられる語彙能力については、分析することができない。また、LFP に基づく測定は、全て頻度情報をもとにして行われる。しかし、頻度は語 彙の洗練性を決定付ける唯一の要因ではないため、語彙の洗練性という観点を用いる測定 法にとってこれは大きな問題となる (Treffers-Daller et al. 2008: 274)。書き言葉の測定 に限定したとしても、語彙の豊かさを決定する要因は、頻度以外にも多数存在する。たと えば、ライティングのトピックへ精通しているのか、ライティング技能はあるのかという
K1 K1
•頻度1位〜1000 位
K2 K2
•頻度1001位〜2000 位
K3 K3
•頻度2001位〜3000 位
Off-list Off-list
•頻度3000位以下
点である。つまり、トピックが変われば語彙の豊かさの結果も変わる可能性がある。もし、
語彙の豊かさが頻度以外の要因によって強く影響を受け、それらの要因を制御することが できなければ、語彙の豊かさの信頼性の高い測定を行うことはできない。同じ学習者が異 なるテーマで書いた作文について、一定して信頼性の高い語彙の豊かさの測定結果を返す ことができるかを示すことが必要である (Laufer and Nation 1995: 308)。また、単語の 学習しやすさも考慮すべき観点であろう。母語に同起源の単語がある場合、外国語でこの 単語を習得することは難しいことではない。一方、目標言語では高頻度語であるが、母語 には対応する意味を持たない場合、また母語で別の語彙が使用されている場合は、理解す ることや習得することが困難である。このことより、言語教育において単語の頻度リスト のみでは語彙選択や語彙の等級付けの唯一の拠所とはならない (Bogaards and Laufer
2004: x)。また、ある抽象的な意味においては有用な語彙ではないが、特定の人や特的の
目 的 に は 有 用 な 語 彙 も 存 在 す る 。 こ れ は1950
年 代 に フ ラ ン ス でle Français
Fondamental を確立するための研究が行われた際に発展した概念である。頻度に基づく
単語を補強するために、研究者は « disponibilité »という概念を提案した。これは、言語 全体ではそれほど高い頻度ではないが、ある特定のコンテクストで使用される単語を考慮 したものである (Howatt and Widdowson 2004: 290-291)。これらの頻度情報以外の観点 については、
LFP
単独で分析することはできない。したがって、LFP
の欠点を補完でき るような分析が個々に求められている。その他にも
LFP
には、テクスト処理の方法についていくつかの技術的問題点や不明確 な点がある。たとえば、エラーの扱い方、固有名詞の数え方、句の扱いなどが挙げられる。つまり、エラーを無視するのか訂正するのか、リストに含まれない固有名詞を低頻度語と してカウントするのか、複合語や定型句などを一語として扱うのかという問題も残ってい る (Meara 2005: 34)。また、
LFP
は多義語を区別しない点も指摘されている (Ovtcharovet al. 2006: 121)。しかしこの点については、実際に解決が困難であることが予測される。
つまり、多義語の定義自体が不鮮明であるため、ある単語に複数の意味があるのかどうか について、どのような判断を行えば良いのかが明らかでは無い場合があるからである。
フランス語版である
VocabProfil
に限定した問題点は、Jones (2001)のフランス語のVocabProfil
に適応したレマ化のアルゴリズムが意図的に網羅的である点である(Cobband Horst 2004: 27)。 VocabProfil
は、動詞の全活用形をレマ化している。フランス語教 師やフランス語母語話者にとって、動詞の活用形は全て同じ価値を持たないということは 明らかである。好まれて使用される活用形、あまり使われない活用形、話し言葉のあるレ ジスターではもう使用されることが少ない活用形もある。また、低頻度の接辞のいくつか が高頻度基礎語に付加されており、学習者が容易に認識できないような形式も高頻度語と して分類されていることもある (Ovtcharov et al. 2006: 121, Cobb and Horst 2004: 27)。つまり、フランス語の
VocabProfil
では英語のVocabProfile
ほど綿密な単語家族の定義 や設定が行われていない。最後に、話し言葉の研究において
LFP
を用いる際の最大の問題点は、LFP
が書き言葉 コーパスに基づいて作成されている点である。話し言葉コーパスに基づくLFP
は今のと ころフランス語に関しては存在しない。書き言葉テクストに基づくコーパスが書き言葉に 特有の単語を多く含み、話し言葉サンプルから成るコーパスには話し言葉に典型的な語を含んでいるということは驚くべきことではない
(Ovtcharoc et al. 2006: 119-120)。
Treffers-Daller et al. (2008: 274)も指摘しているが、書き言葉コーパスよりも話し言葉コ
ーパスの規模がかなり小さいことから、話し言葉における語彙頻度項目に関する妥当的な 情報が得られにくいという現状であり、書き言葉コーパスの頻度データに基づく話し言葉 の研究が行われているのはやむを得ない。しかし、書き言葉と話し言葉の違いを反映でき ていない語彙の豊かさの測定は、多くの問題に直面する。たとえばVocabProfil
に基づく データ分析を行う際、リスト外単語には”Bousculer” (突き飛ばす)というような非常な稀 な単語が含まれるのと同時に、書き言葉では滅多に現れないが話し言葉に特徴的な単語も 含まれ、この性質の異なる両者が混在する (Tidball and Treffers-Daller 2008: 299)。LFP
の話し言葉分析の妥当性について肯定的な意見も見られる(Laufer 1998、Ovtcharovet al. :2006、Thomas :2008)。しかし、話し言葉コーパスに基づく LFP
の開発が望まれ ていることも事実である。2.9.過剰使用と過少使用
前述のとおり、語彙能力の測定には語彙サイズや語彙の豊かさが多く指標として用い られてきたが、学習者コーパスの登場で過剰使用や過少使用といった面にも注目が集めら れるようになった。過剰使用語や過少使用語はまとめて「特徴語」と呼ばれる。この特徴 語という概念は、複数のコーパスが言語的・内容的に均質であるならば、同じ語の頻度は およそ同じであり、もしある語が一方のみで過剰に頻出しているならば、その後はそのコ ーパスの言語的・内容的性質を集約したものであるという考えに基づいている(石川
2012 : 95)。そして、特徴語を検索する意義は、コーパスが代表する言語変種の特徴を、
具体的で個別的な語のレベルに還元して、実証的手法で分析・検証するようにする点であ ると石川( 2012)は続けている(ibid : 95)。
特徴語は一般的に、学習者コーパスと母語話者コーパスの頻度差が顕著であるかどうか を統計的な手法で検定することによって抽出される。この際、特徴性の度合いが基準とな る。この特徴性の度合いの基準となるのは、主にカイ二乗統計量と対数尤度比である(石 川 2008 : 98)。
カイ二乗統計量は、予想される期待値と観測された実測値のずれの幅を検定の為に加工 した値であり、対数尤度比もまた、実測値と期待値の差に注目したものである(石川
2008 : 98-99)。この 2
つの公式は、以下のとおりである(石川2008 : 100):
カイ二乗統計量: χ2
=Σ(実測値−期待値)
2/ 期待値
対数尤度比:
G
2=2×Σ
実測値(log e (実測値)−log e (期待値))対数尤度比では定数
e
を底とし、その値はおおよそ2.7
である。このように、統計的手法を用いることによって、主観ではなく学習者の特徴的な使用を 抽出できるが、日本人フランス語学習者の産出言語に関する特徴語の研究は、これまで行 われていない。