• 検索結果がありません。

研 究方法

ドキュメント内 博士学位論文 (ページ 40-52)

第 3 章 本論文で扱う調査データの概要

3.3 研 究方法

3.3.1 「独自の語」の抽出方法

本論文では、類義関係にある副詞の違いについて、副詞と共起する述語(主に中頻度語)

を検討し、その相違から両副詞の特徴を明確にすることが目的である。

そこで、中頻度語の抽出方法について述べる。

中頻度語とは、副詞と共起する述語を頻度順に並べ、その順位から異なり語数の累積の 比率により、高頻度・中頻度・低頻度に分けることができるが、そのうちの中頻度に属す る語のことである。

まず、高頻度語を外す理由は類義語と共起する高頻度の述語というのは、類義語とよく 共起するものである一方、他の(検討対象語が出現しない)文においてもよく使われる(元々 使用頻度の高い)述語である可能性があるためである。田中(1978)は高頻度群の特徴に ついて以下のように述べている。

高頻度群というのは、一方において、基本的な語を含むと同時に、他方において、

その調査対象独特の語を含むという、二つの性格を持っている。頻度(使用率)に基 づいて基本的な語群を選定していく場合には、高頻度語群から、なるべく後者、すな わち、その調査対象に独特な語が集まるという性格を捨象していくわけだが、逆に、

調査対象の語彙的特徴を捉える場合には、高頻度語群から、基本的な語をふるい落と

す操作をすればいい。(中略)各種文献の語彙調査から得られた高頻度語群の中から、

どんな語彙調査においても常に高頻度で現れる、いわば無性格な基本語群をふるい落 として、それぞれの文献に特有な語を抽出する。 (田中 1978:pp.62-63)

このように、高頻度語群を検討する際には基本的な語と独特な語を分けて考える必要が あるが、類義語と共起する述語を検討し、類義語の特徴を取り出す際には困難点がある。

その困難点とは、類義語と共起する述語の高頻度語群は基本的な語が多いため、「独自の語」

が取り出しにくい点であり、また、本論文の対象である類義関係にある副詞は互いに共起 する高頻度の述語が非常に似ている点である。

田中(1978)は、「調査範囲の広い大量語彙調査の高頻度語群は、ほぼ、基本的な語の集 合と見なすことができる(p.64)」と述べているように、BCCWJにおける副詞同士と共起 する高頻度語群は基本的な語の集合である傾向が見られる。

例えば、「やっと」「ようやく」と共起する動詞をまとめたものが表3-1である。

表3-1 「やっと」「ようやく」と共起する高頻度の動詞12

やっと ようやく

順位 動詞 頻度 比率 順位 動詞 頻度 比率

1 する 155 9.8% 1 する 272 11.7%

2 なる 102 6.5% 2 なる 147 6.3%

3 分かる 82 5.2% 3 できる 92 4.0%

4 できる 69 4.4% 4 開く 66 2.8%

5 出る 50 3.2% 5 分かる 64 2.7%

6 見つける 38 2.4% 6 気づく 58 2.5%

7 言う 36 2.3% 7 付く 51 2.2%

7 付く 36 2.3% 8 出る 48 2.1%

9 気づく 35 2.2% 9 言う 41 1.8%

10 開く 32 2.0% 10 たどりつく 40 1.7%

(趙(2013:p.21)の表3を引用)

高頻度の動詞について、国立国語研究所の『BCCWJ の語彙表』13を参考にすると、「や

12 3-1は、BCCWJの「書籍」「ベストセラー」の下位区分である『文学』を用い、「やっと」「ようやく」

と共起する述語を頻度順にまとめた表であるが、第33.2の(18)(19)(20)のように、1890年まで の執筆者の用例が除かれていないものである。そのため、本論の第44.4.3.2の表4-3の結果とやや異な る。

13 国立国語研究所が公開した『BCCWJの語彙表』のうち、「短単位語彙表データ」から「出版・書籍にお ける順位」の動詞のみを参考にした順位である。

(URL http://www.ninjal.ac.jp/corpus_center/bccwj/freq-list.html 2013816日 参照)

っと」「ようやく」と共起する動詞の場合、表3-1に見られる「する」は8位(以下、動詞 の後の順位は、国立国語研究所の『BCCWJ の語彙表』によるものである)、「なる」は21 位、「できる」は43位、「分かる」は105位、「言う」は17位、「付く」は84位、「気づく」

は668位、「開く」は419位である。「やっと」のみに現れる高頻度語「見つける」は1109 位であり、「ようやく」のみに現れる高頻度語「たどりつく」は3871位である(『BCCWJ の語彙表』の「出版・書籍」の頻度)は98748位まであるため、3871位を高頻度語と判断 した)。

また、『国立国語研究所言語処理データ集7 現代雑誌九十種の用語用字 全語彙・表記』

(以下、『雑誌90種』と称する)14の頻度順と合わせてみると、『BCCWJの語彙表』と同 様に頻度が高い基本的な語が多いことが分かる。「やっと」「ようやく」と共起する共通の 動詞は『雑誌90種』の順位から「する」は1位(以下、動詞の後の順位は『雑誌90種』

によるものである)、「なる」は6位、「分かる」は109位、「できる」は46位、「出る」は 62位、「言う」は3位、「付く」は119位、「気づく」は2146位、「開く」は458位である。

「やっと」のみに現れる高頻度「見つける」は1560位、「ようやく」に現れる高頻度語「た どりつく」は6854位である(『雑誌90種』の順位は39,998位まであるため、1560位の「見 つける」、2146位の「気づく」、6854の「たどりつく」などは高頻度語と判断した)。

さらに、両副詞と共起する述語は、高頻度の場合、「やっと」の「見つける」、「ようやく」

の「たどりつく」以外は共通しており、それらを除けば、高頻度の動詞は同様のものが出 現する。なお、「見つける」と「たどりつく」は表3-1には入っていないが、「見つける」は

「ようやく」にも16位に現われ、「たどりつく」は「やっと」にも14位に現われる。

このように、類義関係にある副詞と共起する高頻度の述語は類似しており、基本的な語 が多いため、除外する必要がある。それで検討対象語は、中頻度語・低頻度語の両方であ り、かつ、二つの類義語に共通して現れないものである。

中・低頻度語の検討を指摘したものには、石井(2002)があり、下記のように、語彙と 文章との関係は高頻度語のみではなく、中・低頻度語の検討が必要であると述べている。

ある程度の規模をもつ文章では、それを構成する語彙の大部分は中・低頻度語であり、

中でも、半数程度は頻度 1 の語である。これらを無視したままで、語彙と文章との関係 を十分に明らかにしたとはいえない。また、ある語がある文章で 1 回しか使われなかっ たとしても、その 1 回であることに、その語とその文章との関係は反映しているはずで ある。語彙と文章との関係は、高頻度語だけではなく、その文章に使われたすべての語 に及んでいると考えねばならない。とすれば、これまで高頻度語に限って論じられてい た語彙と文章との関係を、中・低頻度語の場合にまで拡張することが求められる。

(石井 2002:pp.191-192)

14 『国立国語研究所言語処理データ集7 現代雑誌九十種の用語用字 全語彙・表記』は、首都大学東京 大学院日本語教育学教室の所有である。

以上のように、高頻度語を外し15、中・低頻度語を視野に入れて検討すべきであるが、

BCCWJから抽出された用例において低頻度語を検討するには、二つの問題がある。以下の

理由により、本研究では低頻度語を検討対象から除外する。

第一に、BCCWJ が全数調査ではない標本調査である点である。伊藤(2002)は、全数 調査と標本調査の特徴として 6 点を挙げ、高頻度と低頻度について以下のように述べてい る。

標本調査が適しているのは、高頻度を分析する場合である。高頻度として認められる 見出し語の種類には、標本調査と全数調査のどちらの方法をとっても、ほとんど違いが 出てこない。そのため、多くの時間と費用と労力とを必要とする全数調査よりは、標本 調査を採用した方が経済的かつ効率的だということになる。

低頻度の分析ができるのは全数調査だけで、標本調査では不可能である。というのは、

標本調査で使用回数が1回(頻度1)となった見出し語が全数調査でも頻度1である保証 がないからである。また、標本抽出の対象からもれた見出し語も当然あり、その見出し 語が頻度2以上である場合も否定できないのである。 (伊藤 2002:p.62)

また、全数調査での検討が必要である低頻度語について、石井(1996)も「大きな文章 における語の使用頻度を調べるためには、語彙調査が不可欠である。しかも、文章におけ る低頻度語の具体的な使用を見るためには、文章をまるごと扱う『全数調査』方式の語彙 調査でなければならない(p.27)」と述べている。

このように、サンプリングでデータを集めた標本調査の結果である BCCWJ は低頻度語 を分析するのに適していない。

第二に、臨時一語の問題である16。石井(1996)は「臨時一語」について、「文を構成す るそのときにその場限りのものとしてつくられる語であるから、その本質において、1回限 りのもの、つまり、頻度1の語になる『必然性』ないし『可能性』を備えているといえる」

とし、頻度1の低頻度語に現れる「臨時一語」について述べている。実際の用例には、(21)

のような臨時一語、(22)のように臨時につくられる複合語が現れる。

(21)「ここに遂に外務省革命始まる!」 (PB19_00143『総領事館』2001)

(22)あまりにも恥ずかしい光景だったから、遂に誰も描き留めるに至らなかったよう である。(PB59_00465『浮世を生き抜く』2005)

以上のように、低頻度語には「臨時一語」が含まれている可能性がある。石井(1993)

15 本論では研究対象語と共起する高頻度語について出現傾向などを確認する程度にとどめる。

16 臨時一語の問題の他、低頻度語(頻度1)にはサンプリング後、文章を入力する際に誤って入力され たものがあると考えられるが、この点については本論文ではこれ以上触れない。

ドキュメント内 博士学位論文 (ページ 40-52)