第三章 Word Units から Multi-Word Units へ
3.2. フレイジオロジーの歴史的背景
2) phraseological unity
部分的に動機的で、その意味が元来の中立的意味のメタファー的拡張とみなさ れるもの;
3) phraseological combination
最も興味深いが、範囲を決定するのが最も困難であるものである。たとえば、2 つの開かれたクラスの語から構成されている単位の場合、一つが文字通りの意味 であり、もう一つが比喩的に使用されている。今日では、restricted collocation と呼ばれているものである。
このように、語レベルの単位では、非動機的で形式的に固定されているイディオムから、
部分的に動機的で部分的に可変的なコロケーションまでが段階的もしくは連続的に並んで いる(Cowie 1998 : 6)。 なお伝統的に、最もイディオム的な単位がこの研究分野の中核と して扱われていた(Granger and Paquot 2008: 28)。
また、Cowie は実際のテクスト内に見られる抽象的な語連続がコロケーションである と考え、特にイディオムとその対極にある「自由連結」との境界線を定めて、コロケーシ ョンの定義を行った (Nesselhauf 2005: 14)。つまり、Cowie のコロケーションの定義で は、最も不定的で透明性のある句と自由結合 (free combination) を区別することに重点が 置かれている。そして、自由結合はフレイジオロジーの領域外として認識されていた
(Cowie 1998: 6)。
このように伝統的アプローチにおいて、語連続は、最も不透明で固定的な語連続から、
もっとも透明性のある不定の語連続までの連続体を形成しているという考え方は一般的に コンセンサスを得られている。以上の分類をまとめたものが図
5
である。図 5 伝統的なフレイジオロジーの分類
語レベル 語レベル
語 / 文 語 / 文 一般的範疇
一般的範疇 Phraseorogical unit Phraseorogical
unit
語レベル
(意味論的単位)
語レベル
(意味論的単位)
phraseological fusion phraseological
fusion phraseological unity phraseological
unity phraseological combination phraseological
combination
文レベル(語用論的単位)
文レベル
(語用論的単位)
自由結合
透明 不透明
伝統的アプローチ
しかし、伝統アプローチの研究範囲であったイディオムやことわざといった最も制約的 な MWUs は極めて出現頻度が少ないと言うことが、現在では明らかになっている(Moon
1998: 79)。
3.2.2. 頻度アプローチ
もう一つのアプローチは、言語内で単語が無作為に連結されるよりも高い頻度で起こる 語連続が存在すると考える立場をとり、頻度アプローチと呼ばれる。このアプローチ は 、
« statistically oriented approach» (Herbst 1996: 380)
、« frequency-based approach » (Nesselhauf 2004)とも呼ばれるものである。これは遡ること J. R. Firth、 特
にM. A. K. Halliday
やJ. Sinclair
が発展させた。頻度に基づくアプローチは、コンピュ ータに基づく連辞関係の研究に携わる研究者によって支持されている(Nesselhauf 2005:11-12)。
頻度アプローチは、伝統的アプローチが主に扱ってきた語用的観点から、文体論や修辞 論へと焦点を移行した。日常的な決まり文句の重要性を認めつつ、コーパス分析では
MWUs
を構成するテクストに重きを置いている。ここで分析の対象となるMWUs
は、統語的、意味的な規則性を持ち、垣根表現や会話構成表現のような談話機能の範囲を満た している。これらは主に、会話内であらわれる動詞的単位や節を構成する単位であり、書 き言葉では名詞句や前置詞句も含む36
(Granger and Paquot 2008: 34-35)。
頻度に基づくアプローチは、伝統アプローチが採用するトップダウン式のアプローチで はない。語彙の共起関係を特定するために、ボトムアップ的なコーパス駆動型アプローチ を使用する。この帰納的なアプローチによって、語連結のより拡大した範囲を説明するこ とができる。また、伝統アプローチがとるコーパス基盤アプローチのように、あらかじめ 定義されている言語カテゴリーに適合させるという手法をとらない (Moon 1998: 39,
Granger and Paquot 2008: 29)。
つまり、言語学の一般的な慣行では、分析に用いられ る言語学的な構成概念にしたがって、あらかじめ前提をたてる。しかし、コーパス駆動型 の分析では、単語の存在にしか前提を置かない。コーパス分析から引き出された単語間の 共起パターンは、後の言語記述の基盤となる (Biber 2009: 276)。このように、コーパス 駆動型の手法は研究目的の点から、コーパス基盤型の研究と異なる。コーパス駆動型の研 究は、コーパスの機能的な分析を通して新しい言語の構成概念を明らかにすることが目的 であるからである (Biber 2009: 278)。MWUs
の分析における急進的なコーパス駆動型のアプローチには3
つの特徴がある(Biber 2009: 281):
1)
レマではなく、コーパスに現れる実際の語形の分析に基づく。2)
単語の文法的統語的状態を考慮せず、語形の連続について分析を行う。3)
頻度が高く、繰り返し現れる語形の組み合わせに焦点を当てる 。36
前者の例として、I don’t know, I think I might, what’s the matter with、後者の例として the effect of, in the case of, the
extent to which
が挙げられているこのタイプの分析方法は母語話者や学習者の日常的に使用する MWUs の研究に良く適 していると考えられている。なぜなら、それらの
MWUs
は良く使用され、一般的であり、心理的に顕著でないからである。また、恒常的に使用される
MWUs
について、広く同意 されたリストがまだ存在しないため、この手法は有効である (De Cock 2004: 227)。つま り頻度アプローチでは、伝統アプローチの範囲外で周辺的なものとして捉えられてきたも のに着目している。つまり、以前では興味のもたれなかった心理的にあまり目立たないよ うな MWUs まで、フレイジオロジーのより広い視点から分析し、共起パターンを全て先 験的な例外なくカバーする。これは、頻度アプローチの最大の利点である。たとえば、伝 統アプローチで分析の興味外にあった自由結合でさえ、研究対象となりうる。実際、この 自由結合と見なされる MWUs は一般的に言語使用の場で広く普及されている (Granger1998: 3, De Cock 2004 : 225, Granger 2005: 167)。
このアプローチでは、MWUs の抽出の方法によってコロケーション分析と
N-gram
分 析の2つのタイプに分けられる (Granger and Paquot 2008 : 38-41)。なお、このアプロ ーチにおけるコロケーションは、伝統的アプローチの指すコロケーションとは異なり、MWUs
を構成する単語のそれぞれの意味を考慮に入れたものではなく、文字通り「共に 用いられる単語」という意味でのコロケーションである:1)
コロケーション分析統計的に頻度の高い語連続を分析するものである。たとえば、ある単語の頻度 が高いことと、語連続の頻度が高いことは等しくない。MWUs の頻度が高いとい うことは、MWUs を構成する単語同士が連続して発せられる頻度が高いというこ とである (Stubbs 2002 : 235)。また
Biber (1990: 990)は、この種の語連続につい
て、熟合度や統語構造はいっさい関係がなく、ただ繰り返し現れる表現であると 定義している。この単位の名称として、「コロケーション」や「コロケート」と いう用語が使用されている。この種の分析はCOBUILD dictionary project
の核 となった分析方法である。また、ここには非連続的な MWUsも含む。2) N-gram
分析:N-gram
という用語は、自動言語処理の分野で多く用いられている。繰り返し起こる
2
語以上の語連鎖を抽出することを可能にする分析方法で、専門用語の抽 出、言語変種に関する研究、中間言語研究、情報検索など、多様な目的で使用さ れてきた。この手法で抽出された語連続は « N-grams »と呼ばれ、2語から成る場 合は « Bigrams »、3 語から成る場合は « Trigrams »とも呼ばれている。さらに は、 « Lexical bundles » (Biber and Conrad 1999, Biber et al. 2003, Biber et al.2004)、 « Clusters » (Scott and Tribble 2006), « Chains » (Stubbs 2002, Stubbs
and Barth 2003), « Recurrent sequences » (De Cock 2004), « Recurrent word
combinations » (Altenberg 1998)など、研究者によって異なる呼称が与えられて
いる 。また、ここには連続的な MWUsしか含まない。これらの
2
つの違いとして、前者の分析から得られる結果は機能語と内容語の両方を 含む高頻度のMWUs
であるのに対して、後者は内容語の連続から成る専門的なMWUs
であることが多い (Biber 2009: 277)。語彙研究の分野において、コーパス駆動的アプローチは、より信頼性が高くより徹底し た言語記述を可能にし、以前から取り組まれてきた多くの問題を解決してきた。しかしこ のアプローチの登場によって、予期していなかった新しいタイプの複雑性も露呈したのも 事実である(Rundell 2002: 141-142)。たとえばこのアプローチでは、共起回数が一定以 上の場合、2 文字以上で構成される全ての語連続が抽出される。したがって、分離複合語 やハイフン付きの複合語のような広い範囲の句については抽出することができるが、複数 の単語が合わさって一語となっているような複合語を抽出することができない (Granger
and Paquot 2008: 32-33)。
3.2.3. 二つのアプローチの融合
伝統的アプローチや頻度アプローチの登場は、それぞれ別の観点からフレイジオロジー の分野に多くの価値を与えた。しかし、伝統アプローチと頻度アプローチの支持者には今 もなお広い隔たりが存在する。実際には、両アプローチが歩み寄ることで得るものも多い。
伝統アプローチの支持者の多くは、コーパスに基づく自動抽出や分析から多くの恩恵を受 けることができるということを認識していないように思える。一方、頻度アプローチの支 持者は伝統アプローチに基づく言語分析から得られる恩恵がどれほど多いかについて正し く理解していないようである(Granger and Paquot 2008: 41)。そこで、この二つのアプ ローチの対立が緩和されるためには、まず、専門用語を厳密に明確化する必要があるだろ う(Granger and Paquot 2008: 41-45)。
最近では、多くの研究者は代替可能性 (Commutability)や透明性 (Transparency)のよ うな伝統アプローチの基準に加えて、頻度に基づくアプローチで使用される共起頻度の基 準も使用している。つまり、両アプローチは時に併用されている。主に伝統アプローチを 採用している研究者も、頻度を定義に用いる基準として捉えている。反対に頻度に基づく アプローチの枠組みで分析を行う研究者もまた、伝統アプローチ的な区別を行うこともあ る (Nesselhauf 2005: 16-18)。また、分析の多くは、コーパス基盤的手法とコーパス駆動 的手法を組み合わせたものであることが多い (Biber 2009: 276)。