LFP への反論

第二章語レベルの研究 –Word Units 研究−

２.２. 語彙リスト開発の歴史

２.８.３. LFP への反論

LFP

も他の語彙テストと同様に、一種の間接テストである。

LFP

は、テクスト内に現れる高頻度語や低頻度語の割合を出すことができるが、この割合はテクスト産出者が持つ語彙の高頻度語や低頻度語の割合を反映しているとは言い切れない。なぜなら、プロファイル内には正しく産出された語彙のみが反映されるため、

LFP

は学習者が言語形式と意味が正しくリンクしている高頻度語と低頻度語の割合しか示すことができないからである

(Laufer and Goldstein 2004: 403)。つまり、テクストに現れないが、話者が持っている

と考えられる語彙能力については、分析することができない。

また、LFP に基づく測定は、全て頻度情報をもとにして行われる。しかし、頻度は語彙の洗練性を決定付ける唯一の要因ではないため、語彙の洗練性という観点を用いる測定法にとってこれは大きな問題となる (Treffers-Daller et al. 2008: 274)。書き言葉の測定に限定したとしても、語彙の豊かさを決定する要因は、頻度以外にも多数存在する。たとえば、ライティングのトピックへ精通しているのか、ライティング技能はあるのかという

K1 K1

•頻度1位〜1000 位

K2 K2

•頻度1001位〜2000 位

K3 K3

•頻度2001位〜3000 位

Off-list Off-list

•頻度3000位以下

点である。つまり、トピックが変われば語彙の豊かさの結果も変わる可能性がある。もし、

語彙の豊かさが頻度以外の要因によって強く影響を受け、それらの要因を制御することができなければ、語彙の豊かさの信頼性の高い測定を行うことはできない。同じ学習者が異なるテーマで書いた作文について、一定して信頼性の高い語彙の豊かさの測定結果を返すことができるかを示すことが必要である (Laufer and Nation 1995: 308)。また、単語の学習しやすさも考慮すべき観点であろう。母語に同起源の単語がある場合、外国語でこの単語を習得することは難しいことではない。一方、目標言語では高頻度語であるが、母語には対応する意味を持たない場合、また母語で別の語彙が使用されている場合は、理解することや習得することが困難である。このことより、言語教育において単語の頻度リストのみでは語彙選択や語彙の等級付けの唯一の拠所とはならない (Bogaards and Laufer

2004: x)。また、ある抽象的な意味においては有用な語彙ではないが、特定の人や特的の

目的には有用な語彙も存在する。これは

1950

年代にフランスで

le Français

Fondamental を確立するための研究が行われた際に発展した概念である。頻度に基づく

単語を補強するために、研究者は « disponibilité »という概念を提案した。これは、言語全体ではそれほど高い頻度ではないが、ある特定のコンテクストで使用される単語を考慮したものである (Howatt and Widdowson 2004: 290-291)。これらの頻度情報以外の観点については、

LFP

単独で分析することはできない。したがって、

LFP

の欠点を補完できるような分析が個々に求められている。

その他にも

LFP

には、テクスト処理の方法についていくつかの技術的問題点や不明確な点がある。たとえば、エラーの扱い方、固有名詞の数え方、句の扱いなどが挙げられる。

つまり、エラーを無視するのか訂正するのか、リストに含まれない固有名詞を低頻度語としてカウントするのか、複合語や定型句などを一語として扱うのかという問題も残っている (Meara 2005: 34)。また、

LFP

は多義語を区別しない点も指摘されている (Ovtcharov

et al. 2006: 121)。しかしこの点については、実際に解決が困難であることが予測される。

つまり、多義語の定義自体が不鮮明であるため、ある単語に複数の意味があるのかどうかについて、どのような判断を行えば良いのかが明らかでは無い場合があるからである。

フランス語版である

VocabProfil

に限定した問題点は、Jones (2001)のフランス語の

VocabProfil

に適応したレマ化のアルゴリズムが意図的に網羅的である点である(Cobb

and Horst 2004: 27)。 VocabProfil

は、動詞の全活用形をレマ化している。フランス語教師やフランス語母語話者にとって、動詞の活用形は全て同じ価値を持たないということは明らかである。好まれて使用される活用形、あまり使われない活用形、話し言葉のあるレジスターではもう使用されることが少ない活用形もある。また、低頻度の接辞のいくつかが高頻度基礎語に付加されており、学習者が容易に認識できないような形式も高頻度語として分類されていることもある (Ovtcharov et al. 2006: 121, Cobb and Horst 2004: 27)。

つまり、フランス語の

VocabProfil

では英語の

VocabProfile

ほど綿密な単語家族の定義や設定が行われていない。

最後に、話し言葉の研究において

LFP

を用いる際の最大の問題点は、

LFP

が書き言葉コーパスに基づいて作成されている点である。話し言葉コーパスに基づく

LFP

^は今のところフランス語に関しては存在しない。書き言葉テクストに基づくコーパスが書き言葉に特有の単語を多く含み、話し言葉サンプルから成るコーパスには話し言葉に典型的な語を

含んでいるということは驚くべきことではない

(Ovtcharoc et al. 2006: 119-120)。

Treffers-Daller et al. (2008: 274)も指摘しているが、書き言葉コーパスよりも話し言葉コ

ーパスの規模がかなり小さいことから、話し言葉における語彙頻度項目に関する妥当的な情報が得られにくいという現状であり、書き言葉コーパスの頻度データに基づく話し言葉の研究が行われているのはやむを得ない。しかし、書き言葉と話し言葉の違いを反映できていない語彙の豊かさの測定は、多くの問題に直面する。たとえば

VocabProfil

に基づくデータ分析を行う際、リスト外単語には”Bousculer” (突き飛ばす)というような非常な稀な単語が含まれるのと同時に、書き言葉では滅多に現れないが話し言葉に特徴的な単語も含まれ、この性質の異なる両者が混在する (Tidball and Treffers-Daller 2008: 299)。

LFP

の話し言葉分析の妥当性について肯定的な意見も見られる(Laufer 1998、Ovtcharov

et al. :2006、Thomas :2008)。しかし、話し言葉コーパスに基づく LFP

の開発が望まれていることも事実である。

２.９．過剰使用と過少使用

前述のとおり、語彙能力の測定には語彙サイズや語彙の豊かさが多く指標として用いられてきたが、学習者コーパスの登場で過剰使用や過少使用といった面にも注目が集められるようになった。過剰使用語や過少使用語はまとめて「特徴語」と呼ばれる。この特徴語という概念は、複数のコーパスが言語的・内容的に均質であるならば、同じ語の頻度はおよそ同じであり、もしある語が一方のみで過剰に頻出しているならば、その後はそのコーパスの言語的・内容的性質を集約したものであるという考えに基づいている(石川

2012 : 95)。そして、特徴語を検索する意義は、コーパスが代表する言語変種の特徴を、

具体的で個別的な語のレベルに還元して、実証的手法で分析・検証するようにする点であると石川( 2012)は続けている(ibid : 95)。

特徴語は一般的に、学習者コーパスと母語話者コーパスの頻度差が顕著であるかどうかを統計的な手法で検定することによって抽出される。この際、特徴性の度合いが基準となる。この特徴性の度合いの基準となるのは、主にカイ二乗統計量と対数尤度比である(石川 2008 : 98)。

カイ二乗統計量は、予想される期待値と観測された実測値のずれの幅を検定の為に加工した値であり、対数尤度比もまた、実測値と期待値の差に注目したものである(石川

2008 : 98-99)。この 2

つの公式は、以下のとおりである(石川

2008 : 100)：

カイ二乗統計量： χ²

=Σ(実測値−期待値)

/ 期待値

対数尤度比：

G

=2×Σ

実測値(log e (実測値)−log e (期待値))

対数尤度比では定数

e

を底とし、その値はおおよそ

2.7

である。

このように、統計的手法を用いることによって、主観ではなく学習者の特徴的な使用を抽出できるが、日本人フランス語学習者の産出言語に関する特徴語の研究は、これまで行われていない。

ドキュメント内 Doctoral Thesis (Tokyo University of Foreign Studies) (ページ 70-73)

第二章 語レベルの研究 –Word Units 研究−

２.２. 語彙リスト開発の歴史

２.８.３. LFP への反論

LFP

LFP

LFP

(Laufer and Goldstein 2004: 403)。つまり、テクストに現れないが、話者が持っている

K1 K1

•頻度1位〜1000 位

K2 K2

•頻度1001位〜2000 位

K3 K3

•頻度2001位〜3000 位

Off-list Off-list

•頻度3000位以下

2004: x)。また、ある抽象的な意味においては有用な語彙ではないが、特定の人や特的の

1950

le Français

Fondamental を確立するための研究が行われた際に発展した概念である。頻度に基づく

LFP

LFP

LFP

LFP

et al. 2006: 121)。しかしこの点については、実際に解決が困難であることが予測される。

VocabProfil

VocabProfil

and Horst 2004: 27)。 VocabProfil

VocabProfil

VocabProfile

LFP

LFP

LFP

(Ovtcharoc et al. 2006: 119-120)。

Treffers-Daller et al. (2008: 274)も指摘しているが、書き言葉コーパスよりも話し言葉コ

VocabProfil

LFP

et al. :2006、Thomas :2008)。しかし、話し言葉コーパスに基づく LFP

２.９．過剰使用と過少使用

2012 : 95)。そして、特徴語を検索する意義は、コーパスが代表する言語変種の特徴を、

2008 : 98-99)。この 2

2008 : 100)：

=Σ(実測値−期待値)

/ 期待値

G

=2×Σ

e

2.7

第二章語レベルの研究 –Word Units 研究−