• 検索結果がありません。

学習用語彙リストとコーパス

3.1. 外国語教育におけるコーパスの利用

3.1.2. 学習用語彙リストとコーパス

学習用語彙リストはシラバスや教材の作成と密に関係している.そのため,例えば,「英語教育 において,<...> 電子コーパスが普及する以前から多くの学習用語彙表が作成されて」(中條 2015:

17)きたという歴史がある.齋藤他(編) (2005: 7-8)と中條 (2015: 17)は学習用語彙リストの開発時期 をBNC以前とBNC以後で分けている:開発前期においては手作業で,もしくは小規模な電子コ ーパス(Brown Corpusなど)の情報を利用して学習用語彙リストは作成されていた(その中には,

今なお参照されるものもある).開発後期にはBNCなどの巨大コーパスが出現し,大規模な分析 に基づいた学習用語彙リストが発表されるようになった.

近年では学習用語彙リストの作成にコーパスの頻度データが用いられることは一般的になって きており,Kilgarriff (2010: 2)は,語彙リストは語の生起頻度に基づくべきであると述べている.

ただ,頻度以外にも導入する語彙の選定基準は存在する.以下に,中條 (2015)がまとめた英語の 学習用語彙リストの一覧を挙げる.

表19. 英語の主な学習用語彙リスト (中條 2015: 20-21)83

83 表内に含まれるリストの書誌情報は中條 (2015)を参照されたい.

表からは,語彙選定の基準として頻度だけでなく,分布度84,作成者の主観が用いられているこ とがわかる.フリーズ,トレィヴァー (1958: 2)が述べているように,頻度などの客観的方法と思 弁的・主観的な方法の「いずれか一方のみに偏した方法では,不完全な結果しか得られないこと がわかり,<...> 両者を総合した折衷的な(Eclectic)な経験的な方法(Empirical method)が最も 理想的な方法」であると思われる.英語の高頻度語の定義を目的とした研究は長い歴史を持つが (Webb, Nation 2017: 10),頻度は学習用の語彙選定の絶対的な基準ではない85

とはいえ,高頻度語の学習優先度は高い.Webb, Nation (2017: 6)は,学習者にとって語の価値は 均一ではなく,「その価値は典型的にはその言語における頻度により示される.<...> 高頻度語は コミュニケーションに必要であるため低頻度語よりも価値が高い」と述べている.ジップの法則 (Zipf 1935)からも明らかなように,言語には高頻度に用いられるごく少数の語群と低頻度に用い られる膨大な語群が存在し,当然,効率性が求められる学習において前者の重要性は高い.した がって,高頻度語は外国語学習者にとって重要であり (Nation, Hwang 1995; Nation 2001; Webb,

Nation 2017), これまでに高頻度語を含む数多くの学習用語彙リストが作成されてきた.また,

Webb, Nation (2017: 10)は,高頻度語のテキストカバー率の高さなどの理由を挙げ,頻度は覚える べき語彙の最も重要な選定基準であるかもしれない,と述べている.

代表的な英語の学習用語彙リストとして,まず The Teacher’s Word Book of 30,000 words (Thorndike, Lorge 1944)が挙げられる.Thorndike, Lorge (1944)は,主に米国内の英語母語話者の学 校教育に用いられ,当時としては膨大な1,800万語というテキストデータに基づいた3万語の語 彙頻度表であった (投野 2015b: 2)86.West (1953)のGSL87は実用性・汎用性の高い語を選んで作成 された,英語学習者向けの語彙リストである.GSLでは,語の頻度だけでなく,作成者の主観的 な判断も語彙選定の基準として用いられた88.GSL は学習用語彙リストとして評価が高く,今な お参照され続けている.Coxhead (2000)のAWLには,人文・経済・法律・科学の4分野のテキス

84 石川 (2012: 144)が言うように,分布度(dispersion / range)とは当該の語が生起するテキストの数を意 味し,語の汎用性を表す:例えば,ある語が1種のテキストで100回生起するよりも,100種のテキス トで1回ずつ生起している方が一般性が高いと言える.

85 頻度に特化した語彙リストにはいくつか問題点が見受けられる:例えば,語の頻度はあるコーパ スに 含まれるテキスト群の内容を反映したに過ぎず,統一性にかけるため,日常に有用な語が頻度リストか ら抜け落ちてしまうことがある (Stubbs 2001: 41-42).横川 (2006: 35-36)も同様に,コーパスに基づい た語彙リストの問題点として,学習や日常生活に役立つsoap「石けん」bath「浴室」cushion「クッシ ョン」などの具象名詞の欠如,異なるコーパス間で見られる頻度のずれ,テキストのテーマによって偏 る語彙,コーパスが示す頻度と学習者の直感のずれなどを挙げている.

86 この学習用語彙リストは日本の英語教材に長年影響を与えてきたと言われており (中條 2015: 18),「主 に学校教科書の語彙の適不適の客観的な測定尺度として,また語彙・読書・綴字の学力テスト

(Achivement test)を作成する基礎として」用いられてきた (フリーズ,トレィヴァー 1958: 27).

87 GSLと後述のAWLNGSLに関しては2.3.4.1.を参照されたい.

88 具体的には,GSLは頻度以外に(1) Ease or Difficulty of learning (= cost), (2) Necessity, (3) Cover, (4) Stylistic Level, (5) Intensive and emotional wordsを考慮して作成された (中條 2015: 23-24)

トから成る約350万語の学術コーパスから頻度と分布度に基づいて選定された,高校生・大学生 にとって重要な語彙が含まれている (中條 2015: 28)89.当リストには多くのテキストに共通して 現れる高頻度語は含まれておらず,それを除外したうえで,汎用性の高い学術用語が掲載されて いる (Nation 2001: 17)(GSLの語彙項目とは重複しない).また,近年作成された影響力のある語 彙リストとして,Webb, Nation (2017)はNGSL (Brezina, Gablasova 2015)を挙げている.NGSLは CECの頻度データに基づいて学習用に作成された(分析に使用された CECのコーパス規模は,

約2億7,300万語である).日本人向けの学習用語彙リストとしては,JACET8,000 (相澤他 2005)

が挙げられる.当リストには重要語として8,000語がレベル別に提示されているが,BNCを元に 日本の英語教育の現状を考慮して語彙の選定が行われた (中條 2015: 25).他にも,有名な高頻度 語リストとして,英語のthe British National Corpus/Contemporary American English lists90, BNC word family list 14,000 (Nation 2006)などが挙げられる (cf. Webb, Nation 2017: 10).

ロシア語にも学習用語彙リストはいくつか存在するが (e.g. 中澤(編) 2005; 中澤 2007; 佐藤, 木島 2009; 柳町 2011),英語と比べるとその絶対数はかなり少ない.ただ,TORFL用のレベル別 学習用語彙リスト (Андрюшина (ред.) 2014)は,ロシア語教育において非常に大きな影響力を有し

ている.1.1.で述べたように,TORFLが設定する各レベルの導入語数は入門レベルで約780語(A1),

基礎レベルで約1,300語(A2),第1レベルで約2,300語(B1),第2レベルで約5,000語(B2), 第3レベル(C1)で約11,000語である(第4レベルはネイティヴスピーカーのレベルを想定して いるため,覚えるべき語彙数は設定されていない).数多くの教材が,対象とする学習者のレベル

を TORFL の基準に合わせるだけでなく,導入語彙の種類と数の決定に際してこの語彙リストの

記述を参考にしている (e.g. Варламов и др. 2005; Жукова 2005; Бондарь, Лутин 2006; Беляева, Луцкая 2008; 沼野他 2012; Богомолов 2012; Головко 2015).

他にも,TORFL の語彙リストを参考にして,佐藤,木島 (2009)は学習に必要な日本人向けの

重要語2,200を決定している.中澤 (2007)は日常生活に使用される2,000 語を載せているが,そ

のほとんどの語彙項目がTORFLのそれと重複していることに言及している.なお,TORFLの学 習用語彙リストは,語彙の選定基準として5つの項目を設定しているが,そのうちの1つが頻度 である(どのようなコーパスに基づいた頻度情報なのかについては記載がない).

89 バトラー後藤 (2011: 123)は,AWLに関してESLEnglish as a Second Language )やEFLEnglish as a Foreign Language)の観点から最も参考になる学術用語のリストであろう,と述べている.

90 参考URL: https://www.victoria.ac.nz/lals/about/staff/paul-nation

(27) TORFLの学習用語彙リストにおける語彙選定の基準 (Андрюшина (ред.) 2014: 5).

a. 文体的に無標であること b. 語結合に加わることのできる能力

c. 意味的な価値(頻繁に出会うものや現象を表すことのできる能力)

d. 語形成の能力 e. 頻度

また,コーパスのデータに基づいたロシア語の学習用語彙リストとして,Brown (1996)とSharoff et al. (2013)が挙げられる.これらが基づくコーパスは,現代ロシア語を代表するように設計され ている.Brown (1996)は100万語のコーパスが提示する頻度データに基づいているが,作成者の 主観によって修正が施された学習用語彙リストである(3.3.4.参照).Sharoff et al. (2013)は約1億

5,000万語のInternet Corpusが提示する頻度データを元に編まれた学習用語彙リスト(より正確に

言えば,頻度辞書)である.Sharoff et al. (2013)はロシア語学習者に必要な場面を想定し,彼らの 言語使用に合致するテキストを収集して語彙リストを完成させた(3.3.6.参照).