• 検索結果がありません。

(D 本   表

ドキュメント内 現代語の語彙調査 : 婦人雑誌の用語 (ページ 56-61)

 五十音順本四に限らずこれらの語魏表は,§3・1に述べるような性格のものである。そこで

本四の作成に当り,改めて『主婦之亥:』本文全体か『婦入生活』実用記事全体かでの標本度数が

9以.上である見出し形の語を拾い出した。その見爵しを(今度は固有名詞や数に関する言葉をも

通して)五十音順に撲列し,§3の第1表を作った。それには標本慶数を使用率に換,える必要が

あるが,これは「度数分布原表」(cf.§2・51)にそのための欄を設けて計算してある。それを 更に,標本度数1,2,3,……に対応する使用率が各層・各雑誌について一一覧出来る換算衰にま

とめた。この換算表を用いて使用度教の書き換えをした。最後に§4・1の分析の結果に.よって

く等位〉の欄を埋めた。

 (ll)別   i喪

 五十音順別表も,本表の場合とほぼ同様の手順を経て作成した。すなわち§2・44の(夏)

において述べた「基礎度数蓑別表」の中から標本使用度数が9以上である別衷要素を拾い凄し て,§3に掲げたごとき語彙表を作成した。別表は,本表と異なり,四つの部類に分れ,その他 にも細部において本表と異なる扱いをした点も一二あるが,それらはすべて§3の説関(cf。

§3 ・ 22,3・32)に譲ることにする。

 2・62 使用傘順表の作成

 使用率順に排列した語魏表もまたある種の用途を有するであろう。われわれは雑誌別に,本文

全体・実用三二傘体とか更に記事別腰ごとに,使用率順表を作った。この作業は集計カ…ドを中

心に進められる。まず五十音順蓑(本衷)に掲げる範囲の語を見出しにもつ集計カードを拾い串

       _49二

      g2・6

した。集計カードに記入してあるのは絶対度数であるが,使周率推定が単純集計によっているの で,調査対象の同じ範囲についての標本使用度数は使用率(推定値)に比例する(cf.§2・25の

式ヱおよび式7)。だからたとえばr婦入生活』の実用記事金体について使用率順に排列するに は,集計カードのその欄を見て,標本度数を大きいものから順に並べればよい。われわれは最初 に,爾誌とも実用記事全体につきこの排列をして,その欄のそばに(標本での)使用順位を書き 添えた。次にこの排列をくずして,下位の層について再び度数の大きいものから並べ,かつ前の 場合と岡様に使用順位をしるした。さてこのように並べ替えた集計カードを繰って,§3の第5

表ないし第9表の順位・見畠し・使用率・B計(実用罷事全体)順位の欄を埋める。もちろん一一一一 つの届についてこの書き込みをしてから,カ・一 Fをくずして次の層にと移るのである。またr主

婦之友』の場合は,第4表(本丈全体)についても同じ方法で上記の四つの欄を塑めた。これだ け済んでから第3表(実用記事金体)にかかる。集計カードには既に実用記事での順位がはいっ

ているから,これを使って再び使用率順に並べ替えた。この時は各層での順位もカー・ドに書かれ ているので,第3表はもう一:方の雑誌での順位の欄を除いてすべての欄を埋めることが出来る。

鰻後にこれらの表をつき合わせて,相手方の雑誌における使用順位を書き入れ,また一部の表で はく等位〉(cll.§4・1)の境をも書き入れた。これで使用率順表が完成する。なお§3には載

ぜなかった記事別層についての表も作ってある。

一一 50 一

3語 彙  表

3乙1表の性格

 この章に掲げるところの語彙表は,すべて抽出調査の結果を用い曜作ったものである。だから それらの表の性格は,抽出という行動を経た事によって根本から規定されている。たとえば調査 結果の記述にしても,全数調査とはすこぶる意味を異にする。その事は特に,使用度数を扱う場

合に出しい。従ってまずこれらの語彙表の性格を解説して観こうと思う。

 3・ll袈に掲げてある籍の範囲

 どの語彙表も,標本使用度数が9以上の語だけを掲げている。8以下の語を省いた理由は次の

通りである。

 われ:われの調査は抽出調査である。だから単に記述を目的とするにしても,標本度数ヱの語ま でを無反雀に並べることは,大して意味がない。たとえば 母集団で一回きり使われている語を考

えてみよう。そのあるものはたまたま標本の中に現われたため度数1と記録されたのに反し,他 のものはたまたま標本から漏れていたため調査結果としては何も記録されない一一というような 事情が当撚存する。にもかかわらず標本度数1の語を列挙し,他の(母集団ではやはり)同じ使

用度数の語に目をつぶることは,(実は標本に現われなかったので調べ様はないのだが,ンとかく

母集団においても使われていないという錯覚を誘いやすい。さて次に舞集団で田園使われている 語について見よう。抽出調査の結果今度は,標本度数が 2であるもの 1であるもの 0であ る(標本には全然現われない)もの を生ずる。ここで改めて標本度数が1の語を取り上げる と,既に見た所だけでも,母集園での使用度数が1のものと2のものとがある。実際には,母無 二ではもっと多く使われていながら標本には一団しか現われない語がある訳である。同様の事情

で,標本には金然現われなかったものにも,母集団で毒やはり使われていない語のほかになお,

母集団では一回だけ,または二回,三回,…,使われている語が含まれることは明らかである。

一こう見て来れば,標本度数の小さいあたりでは,燈集団で同じくらい使われながら,調査結 果からは漏れるものと記録されるものとが生じている事に気づくであろう。こういう点を意識し

て結果の表を作るのでなければ,十分科学的な態度とは言えない。

 そこでわれわれは次の態度を執って,標本度数8以下の語を結果表(以下の第1ないし9衷)か

ら省いた:母集団での使用率(相対使用度数)Pについて PSF? との推論が危険率a鬼以下

で行えるような標本使用率の下限Pnを求め,さてPL以上の標本使用率を示した語だけを採

って,結果表としての語彙蓑には載せようというのである。われわれの場合,危険率を10%以

       一一 51 一h

       g .o, ・1

下と押さえたので,標本度数9以上の語が表に載ることとなった。耳語の範囲をこう限れば,母

藥囲では表に掲げた語と同等に使:われながらも抽幽誤差のため標本にはi廃われなかったという詣 が,まずはほとんど無いものと思われる。

 3・12語の使薦度数の示し:方

 ここの三二表では,ある語の使用度数を示すのに,母集団についての推定値を,相対使用度数 であるところの使用率によって示す方法を採った。ある語の使用率とは,その語が使われた度数

を延べ語数で割ったもの,すなわちその語が使われる鶏合をいう(cf.§2・52)。

 従来の語彙調査では,結果表に標奉度数をなまのまま示すのが普通だった。しかしわれわれが 真に知りたいのは,特定の標本における数値ではなく,母集懸ではどうかという知識の方なので

ある,」従って調査結果の表には母集団推定値:が示されなくてはならない。

 次に梢対度数である使用率を用いた理由は,いろいろの比較を行う便を図ってである。たとえ ばくデキル〉という動詞はr主婦之友』の衣生活記事にユ6回,食生活記事に14國使ってある が,この数値から薩ちに「衣生活記事で多く使われた」とは,記述的意昧でも言われない。それ はこれらの標本の大きさが違うからで,衣生活記事では麺べ17488語に対するユ6であるに反

し,食生活記事の方はそれよりずっと少ない延べ9568語に対する14である。だからどちらの

漆 こう決定した過程を述べよう。考え方は後の章の§4・11と同じである。一一大きさNの母集団  から大きさPtの標本をunrestricted samp!ingで抜いたとする。抽出比はr三n/Nである。ここで任  意の語の標本度数をκ(変澱),Xの分散をa2とすれば,

       Ix−nPYd=le  と酬いた時,TCHEBYgREVの定理によって

  Cり      王》r.{lx−nPltsfea}義1/海2

 この門辺が本文で述べた危険率を表わす。そこで当面の問題は式(*)において 右辺㍊% κ躍り  とした時のP(parameterである!)の最:小値を求めることになる。これを解くためにまず nP・一・f  と幽き,次いでa2を求めれば

        N−n

      62=it 一 nP(1−P)

       #(1−r)nP(1−P)       [∵実際上エV−1≒/η         =旦ノ(n_f)

      2i  従って式(*)の左辺から

      隅/察ん一∬

 ここで更に c=,fe2(1−r)〃n と置けば,上の不等式は両辺とも正であるから        R ts cf(n一一f)

 この爾辺をノ(キO)で割った上でノについて解けば,

       継叢=、≒         .

       涜+万

 もし。二〇。01ぐらいなら,上の式で1/7;の影響が無椀出来る。 (われわれの場合,どの記事別趨につ  いてもこの条件は満たされる。)そこで近似的に次の式が成り立つ。

       f −aX. k2(1−r)

 ゆえにk2(1−r)より大きい整数のうち最小のものを選べば,それが結果表に載せるべき語の腰ホ度数  の下限である。

      一 52 一一

ドキュメント内 現代語の語彙調査 : 婦人雑誌の用語 (ページ 56-61)