• 検索結果がありません。

研究データ

ドキュメント内 結果複合動詞の日中対照研究 (ページ 31-35)

第 1 章 序論

1.4 研究データ

多くの先行研究では、日本語あるいは中国語の複合動詞に関するデータベースを使って分 析されているが、日中結果複合動詞に関するデータベースは非常に少ない。そこで筆者は 様々なデータベースを参照した上で、「日本語の結果複合動詞リスト」と「中国語の結果複合 動詞リスト」を作成した。本節では、これらのリストの作成方法と特徴を説明する。

1.4.1 日本語の結果複合動詞リスト

「日本語の結果複合動詞のリスト」にある例は、主に陳(2015)「日本語複合動詞リスト」

と国立国語研究所による「複合動詞レキシコン」から取ったものである。また、陳(2015)

27

の「日本語複合動詞リスト」は国立国語研究所の山口(2013)が作った「日本語複合動詞リ スト(ver.1.3)に基づき、作成されたものである。陳(2015)の「日本語結果複合動詞リス ト」、山口(2013)の「日本語結果複合動詞リスト(ver.1.3)」と「複合動詞レキシコン」こ の三つのコーパスにはそれぞれの特徴があり、以下、順に紹介する。筆者が作成した「日本 語結果複合動詞リスト」の特徴についてはその後で説明する。

まず、「日本語複合動詞リスト(ver.1.3)」は山口昌也氏が開発した「Webデータに基づく 複合動詞データベース」に集められた日本語語彙的複合動詞をリスト化したものである。山 口(2013)によれば、このデータベースの一番の特徴は Webデータを活用し、漸進的に用 例データベースを構築することである。その具体的な方法は以下のようになる。

A) まず、複合動詞の構成要素になりやすい、「種」となる構成動詞(以後,「種動詞」)を 用意する。今回は,『複合動詞資料集』(野村・石井1987)から上位10語を選択した。

B) 次に、Baroniらの方法(Baroni et al. 2009)を応用して、種動詞に対するWebコー パスを構築する。具体的には、種動詞とランダムな語のペアをキーとして、Web検索 エンジンに与え、得られたURLのWebページをダウンロードする。ランダムな語を キーに加えているのは,収集するWebページの偏りを防ぐためである。種動詞は、終 止形、連用形の2種類用意する。そして、それぞれ5000ページずつ収集し,それぞ れ独立した Web コーパスとする。終止形で検索するのは、種動詞を後項に持つ複合 動詞を発見するため、連用形で検索するのは、前項に種動詞を持つ複合動詞を発見す るためである。

C) 構築したWebコーパスを形態素解析したのち、「動詞(連用形)+動詞」の並びを複 合動詞候補として、頻度を計測する。

D) 得られた複合動詞候補のうち、頻度5以上のものを目視で確認し、複合動詞であれば、

複合動詞リストに追加する。

E) 複合動詞リスト中の複合動詞のWebコーパスを作成する。収集するWeb ページは,

2000ページである。それぞれのWebコーパスを形態素解析し、当該の複合動詞を含 む文を抽出する。抽出した文は、格解析、および、同一文削除などのクリーニングを したのち、用例データベースに追加する。ただし、格要素を一つ以上持つ用例が50例 未満の場合は、登録しない。また、登録した場合は、その構成動詞の用例も用例デー タベースに登録する。

28

F)

(v)の複合動詞リスト中の複合動詞の構成動詞のうち、種動詞でないほうの構成動詞を

種動詞として、(i)~(v)を繰り返す。

(山口2013:62-63)

以上の方法を用いて山口が収集した複合動詞3912語から、陳(2015)は同じ動詞の表記 の違いにすぎないもの(「換える」と「替える」など)、可能形(「踏み込める」など)を削除 した上で、V1とV2が持つ「手段―目的」「原因―結果」「並列関係」などの意味関係も追加 して、3487語の「日本語複合動詞リスト」を作成している。

一方、同じ複合動詞のデータベースとしての「複合動詞レキシコン」は、主に研究者たち の判断で、辞書や先行文献からデータを2700語以上集めている。このデータベースでは、

各複合動詞の格要素はないが、語構造の情報を提供している。しかも、複合動詞の対照の研 究のため、英語、中国語と韓国語の訳文も付けられている。

陳(2015)の「結果複合動詞リスト」も国立国語研究所の「複合動詞レキシコン」も「日 本語の複合動詞」に関するデータベースであるが、本研究の研究対象である結果複合動詞は その一部に過ぎない。本研究は「日本語複合動詞リスト」と「複合動詞レキシコン」を比較 しながら、「手段―目的」と「因果関係」の意味関係を持つものを収集し、604語からなる「日

29 本語の結果複合動詞リスト」を作成した。

また、本研究では、「日本語の結果複合動詞リスト」以外に、日中の対応状況を明確にする ため、一部の作例も扱っている。これらの作例の実際の使用状況を検証するため、「朝日新聞 データベース」(1985)、「読売新聞データベース」(1986~2018.9.18)、「河北新報データベ ース」(1991.8.1~2018.9.18)、「毎日データベース」(1989.10~2018.9.18)を用いて、実例 を探した。

1.4.2 中国語の結果複合動詞リストについて

「中国語の結果複合動詞リスト」は、主に北京大学の詹衛東研究室と早稲田大学の砂岡和 子研究室が共同で作成した「现代汉语述补结构用法数据库」(現代中国語動補構造用法データ ベース)から、因果関係を持つ結果複合動詞1,532語を抽出したものである。

中国語の「動補構造」とは、動詞と補語により構成された複合述語を指す。「補語」とは動 詞の直後に置かれて、動詞の表す動作行為の結果、方向、程度、可能などを表す成分をいう。

上記の「現代中国語動補構造用法データベース」では、結果補語のみならず、その他の補語 を持つ構文が含まれており、各例のピンイン、意味解釈、述語と補語の意味関係、例文まで 示されている。さらに、一部の例について、日本語と英語の訳文と「CCL現代漢語語料庫」

における出現頻度も付け加えられている。

このデータベースでは、「動補構造」の辞書や中国の教育部が認定する国際的な中国語の語 学検定試験(HSK)で要求される語彙リストに現れたものを中心として収録している。ただ し、「CCL現代漢語語料庫」に現れる頻度が非常に低い、あるいは容認度があまりに低い構 造はデータベースから省かれている。

このようにして収集された25,190項目の中には、V2が結果を表す結果複合動詞が12,101 項目(全体の48.04%)ある。ただし、本研究では中国語の結果複合動詞リストを作る際に、

データベースに現れる以下の3種類を除外した。

1)V1とV2が複合した後、V1あるいはV2の本来的な意味が薄れ、抽象的な意味を表すよ うになった複合動詞。例えば:“扒住”(つかまる-固定する)の“住”は単独で使われる際 には、「住む」「止まる」などの意味を持つが、V1と複合して複合動詞のV2となると、「動

30

作の結果が安定あるいは固定する」という意味になってしまう5

2)V1 の動作行為の後、V2 の状態であることに気がついたという評価の意味を表す場合。

一般的には、結果複合動詞は因果関係を表すので、“因为A所以B”(AなのでB)と言い換 えられるが、V2が状態の認識を表す複合動詞であれば、そのような言い換えはできない。例 えば、“吃晚”(食べる-遅い)は「食事をした後、時刻がずいぶん遅くなったことに気づい た」という意味で、“因为吃了,所以晚了。”(食べたので、遅くなった。)とすることはでき ない。“大”(大きい)、“小”(小さい)、“快”(速い)、“慢”(遅い)、“肥”((服などが)大き い)、“瘦”((服などが)小さい)、“轻”(軽い)、“重”(重い)、“咸”(しょっぱい)、“淡”(薄 い)、“长”(長い)、“短”(短い)、“多”(多い)、“少”(少ない)、“粗”(太い)、“细”(細い)、

“宽”(広い)、“窄”(狭い)、“高”(高い)、“低”(低い)などは、V2として使われると、V1 の後の評価を表すものになりやすい。

3)V1かV2のいずれかが方言である場合。例えば、“镏透”(蒸して温める-最大限に達す る)において、V1である“镏”(蒸して温める)は北方標準語ではよく使われているが、南 方ではあまり使用されない。

本研究では、ほとんどの例は「中国語の結果複合動詞リスト」から集めているものである が、日中の対応状況を明確にするため、一部の作例も使用している。これらの作例の実際の 使用状況を検証するため、中国語では、「中華数字苑」(500種類の電子新聞が含まれるデー タベース)を用いて、実例を探した。

ドキュメント内 結果複合動詞の日中対照研究 (ページ 31-35)