• 検索結果がありません。

ワードファミリーと言語研究

2.3. 語の単位と言語研究

2.3.4. ワードファミリーと言語研究

2.3.4.1. ワードファミリーを用いた研究事例

前節で言及したように,一般に最も用いられている語の単位は各語形をまとめたレマであろう.

派生に比べて屈折は形態的・意味的に規則性が高く例外が少ないので (Bauer 1983: 26-27),辞書 などでは1語の定義として各語形を集約した単位,すなわち,レマが用いられることが多い.た だ,Laufer, Nation (1995: 312)は,習熟度の高い学習者は,「happy, happiness, happyish, happily, そし

unhappyが密接に関係していることを難なく理解する」ため,WFという単位(概念)は学習

者にとって「語」の定義に最も近いとしている.実際,WF という概念は関係する多くの語彙を 圧縮して整理するため,母語話者や第2外国語として英語を学ぶ学習者を対象とした研究・教育 に広く用いられている (石川 2008: 81).

⚫ WFと語彙学習・語彙サイズ

Nation (2001: 46-47)が述べているように,「語を知ること(knowing a word)には,他の語におい ても生起し得る接辞と語幹から語は構成されているという知識が含まれ」,これは,当然,語彙の 学習負荷を軽減する.言い換えると,「語を知るということには,word familyの構成員に関する 知識も内包されている」(Nation 2001: 47)のである.例えば,既習語(coast「海岸」)と派生接辞

(形容詞を形成する-al)の知識は,新出単語(coastal「海岸の」)の意味を推測してその定着を測 る際に使用することができる (門田, 池村 2009: 81-82).また,学習者の習熟度が増すにつれて,

WF内の構成員の数は増えていくと推測されるため (cf. Schmitt, Meara 1997; Mochizuki, Aizawa

2000),語彙学習に際してWFへの言及は避けられないと思われる.実際,文部科学省が規定する

高等学校学習指導要領解説 (文部科学省 2009: 38)では,「語の数については,活用形を全体とし て1語と数えたり,派生語をまとめて1語と数えたりすることもできる」としており,英語の語 の単位としてWFも想定されているようである.

WFの概念は,「一度,元となる語(base word),もしくは派生語を覚えれば,そのword family の他の構成員を理解する労力は少なくて済む,または,まったく労力を要さない」(Bauer, Nation 1993: 253)という考え方に根ざしている.派生接辞には,意味的・形態的に規則的な派生を行うも のとそうでないものがあるが,その中でも,例えば,英語の接尾辞-ly, -nessや接頭辞un-は,規則 的な振る舞いをする派生接辞であり,これらの派生接辞を知っていれば派生語の学習負荷は減少 する (Nation 2001: 8).

(21) local → locally

「地元の」 「地元で」

接尾辞-lyは規則的で生産性が高い (高橋 2009: 233).一方,最も数の多いロシア語の副詞は,形 容詞短語尾の中性形と同じ形をしているが (Borras, Christian 1971: 240),派生元の形容詞を知って いればかなり規則的に副詞を形成できる76

(22) a. красивый → красиво → красиво

krasivyj krasivo krasivo

beautiful-ADJ. beautiful-ADJ.SF.NE. beautifully-ADV.

「美しい」 「美しい(短語尾)」 「美しく」

b. интересный → интересно → интересно

interesnyj interesno interesno

interesting-ADJ. interesting-ADJ.SF.NE. interestingly-ADV.

「興味深い」 「興味深い(短語尾)」 「興味深く」

他にも,職業や何らかの活動に従事する人を表す名詞の形成に使われる-тел’/-tel'は,規則的で生 産性が高い派生接辞であるが (Ефремова 1996: 457),この派生接辞と派生元の語が既知であれば,

派生語を受容的に理解することは難しくないであろう.

(23) грабить → грабитель b. учить → учитель grabit' grabitel' učit' → učitel'

rob-V. robber-N. teach-V. teacher-N.

「強奪する」 「強奪者」 「教える」 「教師」

他にも,WFは語彙サイズを研究する単位としても用いられる (cf. Read 2007: 108).例えば,

Nation, Beglar (2007)では,学習者の語彙サイズを計測する単位としてWFを採用している.また,

Goulden et al. (1990)の研究によると,成人した英語母語話者が知っている語彙数は,WF換算で

20,000語であるという(この20,000 WFという数値は,発表的な語彙サイズではなく受容的な語

彙サイズを指す).Nation (2006)の分析からは,内容理解の伴ったリーディングが可能な,習熟度

76 (22)の例が示すように,形容詞の中性短語尾形は屈折によって得られる形である.また,これは-о/-o

わりの副詞と形態が同じである.そのため,-о/-oは屈折接辞なのか,派生接辞なのかを判断するには議 論が必要である.ただ,本稿では-о/-oを,形容詞から副詞を形成する派生接辞として扱う.この接尾辞 に関しては6.3.2.で言及する.

の高い英語学習者は 8,000〜9,000 語規模の語彙を知っていなければならないという結果が得ら れているが,この8,000〜9,000語はWF換算によるものである.

⚫ WF単位の学習用語彙リスト

英語学習者向けに作成されたWest (1953)のGeneral Service List(以下,GSL)は約2,000語で構 成されているが,これはWF換算の数字である.GSLの語彙選定の基準には,500万語の書き言 葉コーパスから得られた生起頻度の情報だけでなく,作成者の主観的判断も含まれている.GSL は学習用語彙リストとして評価が高く,今なお参照され続けている.というのも,GSLは汎用性 が高く,書き言葉・話し言葉,学術,小説などの様々な分野のテキストにおいて高いカバー率を 実現するからである (cf. Waring, Nation 1997; Nation 2001, 2004).Coxhead (2000)のAcademic Word

List(以下,AWL)もWF単位で構成された学習用の語彙リストである.570WFで構成されたAWL

には,多くのテキストに共通して現れる高頻度語は含まれておらず,それを除外したうえで汎用 性の高い学術用語が載せてある.

なお,現在はGSLを大幅に改定した New General Service List(以下,NGSL)77も存在する.

⚫ WF単位によるテキストカバー率の計測

Browne (2013, 2014)によると,前出のNGSLは,Cambrige English Corpora(以下,CEC)におい てGSLよりも高いテキストカバー率を実現する.

表18. CECにおけるGSLと NGSLのカバー率 (Browne 2013: 16, 2014: 6-7)

語彙リスト レマの数 WFの数 テキストカバー率

GSL 3,623 1,964 84.24%

NGSL 2,818 2,368 90.34%

GSLの1,964WFはレマ換算に直すと3,623語であるが,これらの語彙はCECのテキストの84.24%

をカバーする.一方,NGSLの2,368WFはレマ換算で2,818語であり,CECにおいて90.34%のテ

77 NGSLとは,Cambrige English Corporaに基づいて作成された学習用語彙リストである.分析元となった Cambrige English Corporaの総語数は約27,300万語である(このコーパスのNewspaper部門は,総語 数が膨大であり,語彙項目の頻度に多大な影響を与えるため分析から除外されている.同様に,巨大な

Academic部門は一般的な英語とは関わりの薄いジャンルであるため,分析対象のコーパスからは除外

されている).また,NGSLの作成に際して,固有名詞,略語,スラングなどは削除してある.さらに,

他の重要な語彙リストとの比較を通してNGSLに含める語彙を選定し,Paul Nationとの議論も行なって いる(詳細はBrowne (2013, 2014)を参照).なお,NGSLは「作成元であるコーパスの性質上,話し言葉 というよりも書き言葉を代表していると思われる」(Webb, Nation 2017: 10)

キストカバー率を実現する.レマ単位で800語近く少ないNGSLの方がオリジナルのGSL より

も6.1%も高いカバー率を達成している.

Nation (2004)は,BNCにおいて高頻度に,かつ,広範囲のテキストに渡って生起している語を

対象として3,000WFの語彙リストを作成し,それによるカバー率を計測した.具体的には,この

研究は,BNCの高頻度3,000WFとGSL + AWLの2,556WFによるカバー率を様々なコーパスにお

いて比較している78.Nation (2006)ではさらに語彙リストの規模を拡大し,BNC Word Family 14,000 が作成された.さらに,2013年にはそこにThe Corpus of Contemporary American English(以下,

COCA)のデータが加えられ,25,000語のBNC-COCAへとその規模を増やしている (中條 2015:

26, 37).

Hu, Nation (2000)は,小説の理解とテキストカバー率の関係を調査した研究である.結果,作品

内の98%の語彙が既知でないと多くの学習者は,十分にその内容を理解することはできなかった

79,この98%という数値をテキスト内の語数に還元すると,50語に約1つが未知語という割合

となる.

Nation (2006)はこの数値がWF単位でどれくらいの語数となるのかを調査した.結果,カバー

率が98%に到達するには,書き言葉のテキストで8,000〜9,000WF,話し言葉のテキストで6,000

〜7,000WFが必要であることがわかった.また,閾値説に関するBatia Lauferの研究は,学習者 がアカデミックなテキストを読むには少なくとも3,000 語を習得している必要があるとしている が (Laufer 1992),この3,000語もWF換算である.

WF単位による特定語数のテキストカバー率を扱った英語以外の研究にCobb, Horst (2004)があ る.この研究は分析対象の言語がフランス語であり,高頻度のWF群が実現するカバー率に英仏 で差があるのかを調査している.分析の結果,リーディングにおいて英語が高頻度 2,000WF + AWLで到達するテキストカバー率85%という数値に,フランス語は2,000WFのみで到達するこ とがわかった.つまり,フランス語の高頻度2,000WFは英語よりも使用率が高く,日常だけでな く学術の場面にも頻繁に現れているのである.したがって,Cobb, Horst (2004)は,フランス語に おいて AWL のような特定分野に特徴的な語彙のリストは必要ない,もしくはその必要性は低い ようであると述べている.この分析結果は,英語の研究成果をそのまま他の言語へ適用してはい

78 Nation (2004)は,複数のコーパスにおいて,BNC3,000WFGSL + AWLがどれだけのカバー率を実

現するかを比較している.結果は,様々な見方ができるが,BNC3,000WFの方がわずかにカバー率 が高かった

79 Hu, Nation (2000)では,他のテキストカバー率による内容理解度も提示されている:

a. 80%: 作品の内容を十分に理解できる被験者はいなかった.

b. 90%: ごく一部の被験者しか作品の内容を理解できなかった.

c. 95%: 一部の被験者が作品の内容を理解できた.

けないことを示す一例である.

2.3.4.2. ワードファミリーの問題点

WFの利用には,どの語をWFに含めてどの語を含めないのか,といった線引きの問題が存在 する (Nation 2001: 8).以下の語は,形容詞белый/belyj「白い」の派生語群であるが,WFにその すべてを含めていいかどうかは疑問である.

(24) белый「白い」の派生語群

a. беловатый b. белеть c. белок d. бельё

belobatyj belet' belok bel'ё

whitish-ADJ. grow_white-V. albumen-N. linen-N.

「白っぽい」 「白くなる」 「白味」 「下着」

質の弱化を意味するa.の接尾辞-оват-/-ovat-は,派生元の語であるбелый/belyj「白い」に対して追 加的なニュアンス「っぽい」を付加している (Караулов (ред.) 1997: 548).また,動詞を形成する 接尾辞-е-/-e-は,「派生元の語である形容詞の意味になっていく」(Ефремова 1996: 115)ことを表し,

b.のбелеть/belet'は「白くなる」を意味する.a.とb.に関しては派生元の語と派生接辞に明るけれ

ば,その意味を推測することは可能であるし,暗記の際の学習負荷も減少するであろう.

ただ,c.とd.は事情が異なる.接尾辞-ок/-ok は,派生元の形容詞が意味する特性をもった男性 名詞を形成するが (Ефремова 1996: 333-334),派生元の語と接尾辞の意味からбелок/belok「白味」

の意味を予測することはできないであろう.d.の бельё/bel'ё と派生元の語の間には,現代ロシア 語では派生の意味的相関の喪失が起きており (Земская 1973: 14-15),その構成要素から「下着」

という意味は導けない.そのため,Тихонов (1985)の語形成辞典では,бельё/belбелый/belyj のWFにはまとめられておらず,бельё/belとしての見出し語が存在している.

a., b., c.はбелый/belyj のWFに含まれるであろうが,学習者の習熟度によってどれを含めて,

逆に,どれを含めないのかを議論しなければならない.その際,Bauer, Nation (1993)のように,い くつかの条件を設定して,WFの定義を段階的に設定することが望まれる(これに関しては6.2.1.

で詳細に論じる).他にも,WFの問題点として,外国人学習者とってこの概念は接辞の知識がな い状態では導入しづらいということが挙げられる (石川 2012: 142).