• 検索結果がありません。

      解説§2・2,§2・3

群れの最初の行には,r==, p=として数値がしるしてある。バま順位を,ρは使用率を意味する。

たとえば200ペ一門ジの r =1228.5p=.112D/・。は,90誌全体で(助詞・助動詞を除き)本文 をすっかり調べ上げたと仮定した時の,ある見嵐し語の使用率の,標本による推定髄:が0.112パ ーミルであって,この推定髄:によって使用順位を決めれば第1228.5位になるという事である。で はそのある見出し語とはどれか。それが数値の次の行から16行にわたって載っている《イ(位:);

キブン;…;ボウシ〉である。他も同様に読む。

2。3 使:用率を求めること

 2・31ある見出し語の使用率が知りたい時

 この場合には五十音睡夢を引くだけで欝的が達せられる。更に,精度計算がしてある見出し語 だという事がこの蓑から分かったら,95%の信頼区間を知ることも出来る。知りたい語が助詞・

助動詞なら第8衰を,そうでなければ第1表を見る。なお助詞・助動詞か否か迷う場合には,念 のため両方の表で捜されたい。具体的な手続きを実例によって述べよう。

   【例一】「赤字」という語が,調査対象全体でどのくらい使われているか,また雑誌の性質   で分けた各層ではどうかを知ること。

 第1表で捜す。この語は活用しないから見出しはくアカジ》である。第1表を繰ってこの見出 しが出ている行をつきとめる(この書物の36ぺr・ジの46番目にある)。次に「使用率,全体」の

・列を見て,90誌全体での使用率が .057。/o。である事,つまり延べ百万語平均57翻の割合で使わ れている事を知る。

 更に右へ読み進めて,第一層(評論・芸文)では.022。/。o,第二層(庶罠)では.0260/ee,第三 層(実用。通俗科学)では.226e/・・,第四層(生活・婦入)では一だから標本度数。,また第五 層(娯楽・趣味)では. 0200/eoである事を知る。

 以上の数字のうちイタリック体のものみ意味は§2・11に述べて置いた。

 さてこの場合には,備考に何もしるしてないから,上記の使用率推定値:の信頼区間を求めるこ とは出来ない。

   【例二】 「深み」という語の使用率を知ること。

 見出しは《フカミ》である。(ついでながら,もし「深さ」「深げ」ならまずくフカイ》とした 上でそこの二次見出しを見ることになる。§2・11の「見出し」欄の解説を参照。)これは第1表 で捜すべき語であるが,第1表には載っていない。この見出 表4第1表〜第8表にP一マン

し語が,90誌の範囲ですら標本使用度数7に満たなかった事    体で載せた使用率の下限 を意味する。(もし金鉱の標本度数が7以上なら,どの層か

では6以下でも,標本に現われた限りその層の使用率が第1 表または第8表にしるしてある。ただし6以下である;事に注 意を喚起するためイタリック体で示した。)従って五十音順 表に載せてない見諭し語についても,その標本使用率がこれ 以下であった事だけは分る。

 参考のため,表le P 一Vン体(普通の,

      解説§2・3 とめてしるして置く。

  【例三】  「来る」という語が第二層でどのくらい使われていたかを知ること。

 この語が語減衰に載 .ているとすれば,それは五十音順表では第1表の方である。かつ活用す るから,まず代表形に直さなければならない。それは「キ」であり,第1表に載t,,ているとすれ ば,「クル」の位:置ではなく「キ」すなわち「木」や「気」の辺である。先の§1。2の約束によ って,それはくキ・クル》の形を取る(「着る」のくキル》や「切る」のくキリ・ル〉と区別される)。

実際に1第1表を繰って,この見出しは《キル》とくギ〉との間に見繊される(67ペー・ジ)。

 その行の「使用率,二層」の列から4.660。/・・が読み取れる。更に備考欄を見ると,第二層に 対応する位置に*2としてある。これは既に§2・11で述べた通り,第二層における《キ.クル》の使 用率推定に関し,精度と95%の信頼度の下での推定区問が,別の表に示してある事を意味する。

(なお 2 の前につけた*は,この語の調査を前段で打ち打った印である。)この例では,第二層 の使用率順語糞表(第4表)に,それが載せてある。(他の場合もこれに準じて,該当する使用率 順表を考え,下記と同様な手続きを進めればよい。)そこで第4表を繰り,使用率欄が4660の行 を捜す。それは236ページの17番痛に見嵐だされる。その行の精度欄から推定の相飼精度は11.17

%,これに基づいて算娼した信頼区問は,精度の左で使用率との問の二列から求められる。すな わち3.307D/。。を下限,6.0210!。。を上限とする区間が,それである。これは,すっかり調べ尽し た時の使用率はこの範囲にあると言った時,この推定が当っている確率が95パーセントと見積れ

るという事である。

  【例四】 敬語の助動詞「ます」の,全体および各層での使用率を知ること。

 この語は助詞・助動詞の方の第8表で扱われる。助動詞の代表形は終止形と約束したから,「ま し」ではなくくます》という見出しを捜さなくてはならない。実際に第8表でこれが載っている 行を見つけると,292ページの最終行にある。使用率欄を見て,90誌全体では16.304e/o,,第一一 層から順に10.697e/oe,11.865G/oe,9. 3740/。o,39。7020/oo,12.4780/ooという値が読み取れる。

 さて精度の欄を見ると,全体の所が3.◎8%,以下各層とも値がはいっている。従って儒頼麟絹 が,これらのすべてにつV・て,付表に載ってV・る訳である。付表で見回し欄が ます 〔3.08〕

の行を見(294ぺ・・一ジの26番員),そこから,全体に対しては15.ooo−0/。。〜17.607。/。。,第一層に対 しては6. 10so/o,〜15.282。/。。,……とv・うようにして,95%の信頼区間を知る事が嵐来る。

  【二五】 r行ったかも知れない」などのような使い方の「知れない」の使用率を求めるこ   と。

 問題の「しれない」はわれわれの調査の単位語ではない。すなわち 1しれiない} と旬切 って2βとした。単位語「しれ」は「…かもシレません/シレた事さ」などに含まれる単位語

「しれ」と合わさって共通の見出し語くシレル〉を持ち,また「ない」は助動詞のくない》の所 に整理される。従って第1表から《シレル》,第8表からくない》の使用率は求められるが,それ らの結合形「しれない」の使用率を報告21の二二表から得ることは出来ない。

 なおこのように特色的な結合をしたものについては,別の分冊の結合一覧(場合によって助詞・

助動詞編)から,付加的な情報が得られるようにするつもりである。

 2・32 ある見出し語の使用率を他と比べたい時

      角享説§2.3, §2.4

 これには次の二つの場合があろう:(a)ある一つの語の使用率を調査対象の異なる範囲(金体と 任意の騨と,または任意の異なる屡の間)で比べる場合;(b)岡じ調査対象の範囲(たとえば第一 層の中)で甲の語と乙○語との使用率を比べる場合。どららの場合にも五十音順表から知り得 る。もし(a)なら§2・31に述べた仕方によって,その行を横に読むだけでよV・。また㈲では,甲も 乙も共に助詞・助動詞の群れの見出し語か,共にそれ以外の群れの児繊し語かであれば,甲と乙

とそれぞれに§2・31に述べた仕方で求めた結果を比べればよい。

 しかし一方が助詞・助動詞の群れ,他方がその他の群れに属する時には,それぞれの使用率を 算定した時の基礎になる延べ語数が異なるから,単純にこうした比較をし    表5

てはならない。ただし前者と後者との延べ語数の比(今回の調査では前者 助詞。助動詞の延 1に対する割合は右の表のように推定された)を使って調整し,比較する べ語数を1とした        時の,それ以外の

ことが出来る。ただしこの方法によって得た調整使用率は,助詞・助動詞

       語の延べ語数 を含めての延べ語数について考えた使用率とは一致しない。ただどちらの

範囲で多く使われていたかを知るに過ぎない。実例によってその調整法を 述べよう。

  【例六】 存在を表わす《アリ・ル》と陳述を表わすくある》とどちら   が多く使われたかを第四層について此べること。

体層履層層畷 全 二三四五

 まず《アリりレ》〈ある〉の第四屡使用率をそれぞれに,§2・31に述べた仕方で求め,

と8.1270/。。とを得る。前者について表5の1.6551を掛け(後者には1を掛け)調整値:を出す。

今の数値例では 5.922×1.6551= 9. 802である。 これを8.127と比べる。この結果から「ある」

を存在の意に使う方が陳述の用法よりも多いという事が分かる(ただし抽出誤差の影響を勘案す ることは保留して)。

 なおこの場合に,助詞・助動詞を含めた延べ語数に対するそれぞれの使用率を算出することも 出来るが,その方法は付録§6に譲る。

1.5289 1. 3453 i.4173 1. 9718 1.6551 1. 4207

5. 9220/eo

2・4使用順位を求めること

 2・41ある見出し語の使用順位が知りたい時

 助詞・助動詞についての使用順位は,第8表を引き左端の順位欄を見るだけで済む。それ以外 については,まず順位が知りたい語の使用率を第1表から求め,これを手掛りとして使用率順表 を引くことになる。これも実例によって解説しよう。

  【例七】 「水」という語の,90誌全体および各層における使用順位を知ること。

 まず第1表からくミズ》の使用率を求める(§2・31参照)。それは,全体:.3830/。。一層二.109

。/。。二層;.287。/。。三層:.3100/。G四層二.7890/。〇五層:.339。/。。である。これらの値によ り,1頂次第2表から第7表までの使用率の所をたどって,すなわち体裁Aの部分(31ぺ・・一一ジ参照)

では使用率欄,体裁Bの部分ではpの所を見て行って,手掛かりとした数値:に行き当たったら順 位欄またはrの所を見る。そこに示してあるのが求める順位である。さて全体での使用率.3s3e/。。

によって第2表を繰り,188ペー・ジの右下の方を読めば,その順位は第316位である。次に第

一一

窒?.10go/。。を手掛かりとして第3表を繰る。ところがこの表に掲げた語の使用率㊧下限が.152

       −34一

関連したドキュメント