• 検索結果がありません。

新聞使用漢字の試行的分析

N/A
N/A
Protected

Academic year: 2021

シェア "新聞使用漢字の試行的分析"

Copied!
19
0
0

読み込み中.... (全文を見る)

全文

(1)

国立国語研究所学術情報リポジトリ

新聞使用漢字の試行的分析

著者 野村 雅昭

雑誌名 電子計算機による国語研究

巻 2

ページ 89‑106

発行年 1969‑03

シリーズ 国立国語研究所報告 ; 34

URL http://doi.org/10.15084/00000999

(2)

新聞使用漢字の試行的分析

野 村 雅 昭

 第三資料研究室では,昭胸42年度から,「新聞語彙調査(1)に伴う漢字および 表記の研究」を行なっている。これは,語彙調査によって作成されたデーータに,

さらに,電子計算機による処理を施し,各種漢字表・表記一覧表などを作成し て,その分析・記述を行なおうというものである。最初に,漢宇調査から着手 することにし,昭和42年度には,準備段階として,機械処理による手順の研究 を行なった。そして,43年度には,実際の機械処理プログラムの作成および一 紙一年分(2)(全体の約1/3の最)についての機械処理を実施した。この処理シ

ステムは,長単位語のデータによるもので,層別度数つきの各種配列順の漢字 表,長単位語の用例表および趨典蓑などを作成しようとするものである。その 処理システムの一部については,以前に述べたことがある(3)。

 ここで述べようとするのは,そのうち,朝資新聞朝刊(1〜6月分)の結果 についてである。(以下,これをA調査とよぶ。)先にも述べたが,これは長単 位語のデータによるものなので,漢字のぶみ(音訓の別)やどのような語に使:

用されたか(人名・地名などの別)について,くわしいことは,まだわかって いない。したがって,ここでは,結果にあらわれた,漢字の数量的データにつ いて分析を加えることによって,新聞における漢字の量的構造を解明する手が かりをつかむととともに,その分析法についても,ある種の試みを行なうこと

を目的とする。それによって,薪聞における漢字使用の一端をうかがうことが できれば幸いである。

 (1)薪聞語彙調査については, 「電子計箪機による国語研究」 (国研報告31)を参照   のこと。

 (2)標本全体は,昭和41年の,朝H・毎日・読売の朝夕刊の全紙面から,1/60の拙出  比でサンプリングしたものである。

 く3) 「漢字調査の機械処理について」 (国研LDP(月報別冊う1)   /

一89一

(3)

1.新:聞使用漢字の構造

 戦前・戦後を通じて,用字調査あるいは活字調査といわれるものは,多くの 数に上る。そして,現在も,各種の機関によって行なわれているものと思われ る。それらの調査結果について,比較・分析を試みたものも,すでにいくつか 発表されている(4)。上述のように,ここで問題とする調査結果は,部分的なも

のであ!)麗に行なわれた調査との完全な意味での比較はむずかしいと恩われ る。そこで,比較的最近行なわれたいくつかの調査(5)とくらべてみることによ って,新聞漢字使用の特徴を考えてみることにしたい。対象とした調査を,以 下,次のような略号でよぶことにする。

  M調査…毎賃薪聞,S調査…総含雑誌,

  G調査…現代雑誌九十種,N調査…NHK:

 表1は,各調査のことなり回数とのべ宇数とを比較したものである。これで みると,調査の対象によって,ことなり字数とのべ回数との問に一定の関係が 生じることが予想できる。すなわち,調査対象がいろいろな内容を含んでいる ものは,のべ字数が増加するにつれて,ことなり字数も増えつづけるが,内容 が一定の傾肉しか持たないものは,いくらのべ字数が多くなっても,ことなb 字数は,それほど多くは,なりそうもない。薪聞にかぎっていえば,これより

も調査規模を大きくしても,ある程度まで,ことなり宇数は,ふえるであろう が,M調査やA調査の結果から,そう隔ったものにはならないであろう。その    表1 各種調査のことなり字数とのべ字数      表2 各種調査の

ことなり三脚

      1

当用酬灘字回避

のべ無数

M 1 1,sol i s121 2,6131 317,2so

s i i, 777 1 i., oo4 i 2, 7si 1 ii7r i4g

G [ 1, s3s 1 1, 493 i 3, 3−ps 1 2so, og4

N巨68gい3・隔・・gi338…29

Aい・773

6so 1 2, 423 [ 202, oso

総使用度数中の 表外字の割合

M i 2. 60/o

S 1 3.5

G巨5 Al 2.3

m90一

(4)

推測の根拠となるもう一一つの理由がある。それは,新闘では,当用漢字表の範 囲を守ることに,きわめてきびしい態度をとっているからである。豪用漢字は 1850宇であり,当用漢字補正案(6)}こよって加える字や人名鍬下宇をいれても,

せいぜい2000字程度であって,ことなり字数が多v・ということは,表外字が多 いということである。したがって,新聞では,ことなり字数が飛躍的に増える

ということはまず考えられない。

 表2からもぞうした事情をうかがうことができる。新聞における表外字の使 用率は,M調査以降,さらに小さくなっているという推測をたてても,ほぼま ちがってはいないだろう。(M調査には,広告は含まれていない。A調査の結 果から,広告に使用されたものを除くと,表外回の使稽率は,もうすこし小さ くなると思われる。)しかしながら,別の理由によって,表外字の使用率が,

これ以上,極端に減少することもないであろう。なぜならば,旧聞における表 外宇の使用は,広告を除いて,ほとんどが,固有名詞にかぎられてお動その 方針はかなりよく徹底されていると考えられるからである。

 上に述べた,ことなり字数とのべ字数の関係は,全体のある割合を占めるの に必要とする漢宇数という考え方にも,あてはめることができる。図!は,表 3・蓑4などをもととして使用度数の多い順にならべた漢字の度数の上位のも          図1各調査の天一数と使用率の関係

    %

100

      使用率〜

夢ノグフ!

      ノ

,,/

山留

   ルノ

  諺7

 ,ろ ノ/

 房/

〃/

,傷/

!/

一・一・・一一H・羅査

 一一醒一・一̀ (書桧耐

一■一顧一M  as

−A  (全》

一一一一f s

  io 漢字数  100

−91一

leoo

(5)

表3 A調査(朝月新聞朝刊1〜6月分)使用度数分布表

1

   N1001

1000一  501

500t一 301 300N 201

ooO一.

loo.v 90−

80−

70一一

60N 50N 40N

30  v

21.一

11111111110987654321 G9876543211

1

合 計

ことなり 度数

23 T2 X4

3142妬526074822064043046駿娼5665卯996821

    2       113      1Qり

2, 423

のべ度数

欝畿鐙鑑㈱黙黙端姐螂鶉鵬謝謝 54642333333444

旧り3織δ9耐3

202, 480

累 計 ことなり

f

l

累 計 の べ

度 数

      三11111111122       フ 

ひ コ ラ タ ン ラ フ ン ナ シ 

  1245566789144556678914 359679577133711197385423276693839757347761733302

         

使用率(%)}度数

910052138822057687047880037102468150790246915960    122222334456666677780        1 01447608818601151G386390

02

V3 O4 O4 T3 T2 S2 R3 Q5 R7

t4049013172聾48113528215娼

   フ シ シ つ コ フ ア ノ コ ブ シ フ コ ク コ フ つ ジ コ ジ ナ ジ 

596026048260499900011122 360366777889999900000000   1111111111111122222222

使用率(%)

344232210190134680235780742402468014688889999990 135688888999999999999990        1

死㌔

表4 全体のある割合に達する使用度数の順位

i調査

全体の50%

     soo/0      850/0      900/.

     950/0      980/o      gge/o     looo/,

  153

 494  635  780

1, 070

1.414

1, 650 2, 613

S調査

  160

 546  689  890

1, 234 1, 665

2, 003 2, 781

G調査

  176

 638  777  992 1 358

1, 832 2, 157

N調i査

3, 328 i    ?

 370  464  597  813

1, 099

ユ,309 2, 124

A調査  156  491  607  768

1, 044 1, 388 1, 614 2, 423

一92一

(6)

表5

ことなり

字数

のべ字礁飛騨垢蘇

当用漢字i・,・77・レ97,88S 1 97.7

ーー

878

112 769 14

175, 034

 5, 544

17, 180

  127

86. 4

P一.7

8.5

0. 1

表三門

6so 1 4, sgs 1 2. 3

 補正案で加え

︷二

 られる予定の  もの

 人名用漢字

 そ の 他

or 76 547

 318

1, 250 3, 027

e. 2

0.6

1. 5

1 2, 423 1 202, 480 1

100. 0

○ 教育漢字に準ずる  宇とは,葬蘇矛043年7  月11Hに告示された  i新学習脂導要領で小  学校での学翌を認め  られたものをいう。

○ 補正案で加えられ  るものの中には,人  名絹漢字と重複する  尚・杉・斉・竜の4  字が含まれている。

のから累積した分布睡眠である。(S調査は,図が繁雑になるので,省いてあ

・る。実際は,A調査とG調査の問にある。)ほぼ,同一の曲線を描いているが,

のべ字数の多少にかかわらず,ことなり字数が少ないものほど,少ない字数で

.全体をまかなえる率が高い傾向を示している。M調査とA調査がほとんど嗣一 のカーブを描いているのは,寸寸の使用度数分布に一一定の傾向があることを物 語っているものといえよう。N調査が,薪聞に比べて,少ない字数でまかなわ

なえる率が高いのは,新聞にくらべて,二・=・ 一一スでとり上げられる内容が限ら れているからであろう。参考としてあげた,A調査の社会面の分布曲線のほう がN調査に近いことが,この推論を裏づけていると思われる。

 表5は,A調査について,字種別に,総使用字数に対する使用比率を示したも のである。総使用宇数のうち,97.7%が当用漢字表内の漢字でまかなわれてい

るわけである。これに補正案で加えられる予定になっているものをたすと,100 字の内,約98字が当用漢字であるという結果になる。そのうち,教育漢宇の占 める割合は,新学習指導要領で,小学校で学習を認められたものを加えると,約 89%である。こうした数掌からも,現代の新聞では,使用率という点からみる

と,かなり少ない漢字数で全体がまかなわれているということがうかがわれる。

      一93一

(7)

表6 よく使用される表外字

羅i翻査IM調蚕㈱査

12345678910 12345678901111111112

21 Q2 Q3

嘯Q5%幻銘2930 藤迄阪崎.岡言出塚之杉 彦幡羅韓額面仙魑荻鹿 熊奈寝鶴鎌阿尚堀就眠 阪藤岡崎菱之阿鶴鳩淀 奈塚彦杉鎌瀬熊鹿弘幡 畿寒寒離日笠辻鶴亀堺云 頃云藤袖衿心岡崎脇誰 阪之伊巾廻面心那杉竜 鹿頁錦昏睡筈吾貰唄彦

ものは含まれていない。) しかしながら,

の大小という点からみるとき,新聞は少ないほうに属すると思われる。新聞が 内容的には,かなり広範囲にわたるものを含みながら,少ない字数でまかなわ れている理肉は,くり返し述べるように,範囲としての当用漢宇表がきびしく 守られているからである。 (それによって新聞の表記に,具体的に,どのよケ な特色があらわれているかということを閣らかにすることは,重要な問題だ

       一94一

 表外開は,のべ字数の全体に対する割合は 低いが,ことなり字数では,約27%を占めて いる。表6は,表外宇のうち,使用度数の多 い順に,三十位までを示したものである。A 査調とM調査をくらべると,かなりの一致が みられる。A調査にあって, M調査にみえな:

い,迄・乞・頁などは,主として広告欄で用 いられたものである。G調査で高い順位の頃

。云・袖・衿・僕・誰などが新聞ではみられ ないのは,新聞では,人名・地名などの固有 名詞以外の表外字に対してきびしい態度をと っていることを裏がきしている。さきに述べ た,満干における蓑外字の使:用率が,これ以,

上大きく変化することはないだろうというの は,このような意味からである。

 今,かりに,漢字調査の規模を,その母集 団に含まれると仮定することなり男数の,一t 定の(かなり高い)割合を得ることができる・

量という半平で考えるならば,新聞は,その 大きいほうのグループに属するだろう。(大 小の境界をどこに置くかということは,今は1 問題としない。また,ここで地子の対象とし た調査には,小さいほうのグループに属する     そのグループの中で,ことなり字数

(8)

が,今は,それにふれている余裕がない。)つまり,新聞の漢字の構造は,上 述のような意味で,二面的な性格を持っているということができよう。今後,

新聞の漢字ということを考えていく揚合に,こうした位置づけをする必要があ ると思われる。

 (4}斎賀秀夫「漢字使用の実情」 (「言語生活」121)

    同  「現代における一宇・漢語の実態」 (「文学・語学」41)

   菅野謙「漢宇から見たラジオ=ユースの用語」(NKK文献月報1968.9)

i   (最後の論文には,各種の漢字調査について,要を得た解説があり,各種調査の    結果の比較が試みられている。)

 (5〕○毎日新聞…昭和28年3月から5月までの3カ月問の新聞から抽出された7日分84     頁の紙薦の文宇使用度数調査。(「本社使朋活字使朋度数調査表」毎ヨ薪聞大阪     :本社(昭28)駈収)

  ○総合雑誌…昭漁28年7月号から昭和29年6月号までの総合雑誌13種から抽鵡され     た標本の調査。 (国研報告窪9(昭30)所収)

  ○現代雑誌九十種…昭和31年1月号から12月号までの五部門九十種の雑誌から拙出     された標本の調査。(国研報告22(昭38)所収)

  ONHK:ラジオニュース…昭和40年度のラジオニュースの放送原稿の漢字調査。

     (注㈲論文所収)

   (新闘の調査としては,昭$l123ff−11月から昭和24年7月にわたる朝日薪聞の調査と    昭和21年12月から昭和23年11月にわたる毎日薪聞の調査があるが,どちらも,使    用文掌調査ではなく,鋳造した活宇の本数の調査なので,ここでは,取)1上げな    いことにした。)

 (6)昭和29年3月に,国語審議会で,漢字部会から,当用漢宇表を補正する際の資料    として報告されたもの。薪聞では,すでに実施している。

2.層別による漢字使用の傾向

 新聞語彙調査では,四つの角度からなる,層別区分を行なっている(7)。漢字 調査としては,まず,層別による使用情況の概観を得るために,T種層別(話 題による区分)を中心として,それにG種層別(文章の種類による区分)を組 み合わせた十二の層別区分によって,処理を行なった。以下で,層別というの は次の十二の区分をさす。

 1.政治(国内)・労働

 2.外交

       一 9.5 一一

(9)

       111

以上の区分をもとにして,

にする。

 表7は,層別区分ごとの,ことなり半数とのべ字数および総使用丁数に対す るのべ度数の割合を示したものである。どの区分において,漢字カミよく使用さ れているかということは,ことなり宇数やのべ回数の大小だけでは,一概に判 定できない。紙面の面積に対する漢宇の量や,かなや符号をも含めた文字(活 宇)の総数に対する漢字の翻合なども,判定の要素として考える必要があるだ

ろう。今,ここで問題にしょうとするのは,語彙の量に対する漢字の量であ る。語彙調査における漢字ののべ度数は,その長単位語(8)ののべ度数とほぼひ としいということが経験的にいわれている。A調査の長単位語ののべ度数は,

2!8,231である。これで,漢宇のべ度数202,480を割ってみると,1語あたりに 含まれる漢字数は,0.93字となり,さきの経験的法則とほぼ一致している。し かし,各区分ごとに,長単位語に対する漢宇の劉合を計算してみると,その比

率は,表8に示すように,必ずしも一様ではない。区分11と12は,1語あた

り,i字以上の差回を含んでいることになる。これは,広告欄では,漢字の使 用が比較的自由であることとあまり文章のスタイルをとらないことによるもの であろう。特に,三行広衝などでは,紙衝の籔座上,短い語形を漢字によって

表わす傾向の9G V ためである。その他の薩分を数値の高いものから順にながめ

てみると,いわゆる紙薗のかたさといったものと似た順になる。区:分7(スポ       一96一

経済(主として株式に関するもの)

社会(密会面にのるもの)・地方(地方版)

国際(主として外電によるもの)

文化(学芸・教育・撮版など)

ス」X  一一ツ(囲碁・将棋を含む)

婦入・家庭

芸能・娯楽(ラジオ・テレビ番組。その解説)

小説・漫画

商業広告(商贔や事業の広告)

案内広告(いわゆる三行広告。通知・社告などを含む)

         ここでは,層別による国母使用の比較を試みること

(10)

表7 層別区分ごとのことなり字数とのべ宇丁 丁8

区分 話  題 掌数ことなり

のべ轍馨誰難編

■政治・蜘巨24・レ⑤97d

8. 38 0/o

・1外

62重い776i

ls 37

・降 済巨・72i・9,727 i

9. 74

・t社会・地方1 ・・ S82 1・・,67i 1・3・・7

・i国 劇・,・7・1・螂・1

6. 93

・1文

化i・, 358 1・・,56・1 5. 71

州・・1・  ・m一ツ1・,・・唄…S42 1 7. 82

・1鰍・家庭1 ・…71・・5S4 1

2. 74

・芸能・娯楽幽幽・3, 4ss 1

6. 65

・・1小説・漫画 ,i3 1 ,67 1 O. 38

・・虚業広告1・, 779 1…7681・3・・22

・2ky }i内即自554148・・353

23. 88

1三体1 ・・ ・23 1・・2・・48・1・・・…

鴎灘/騨麟

A e. gs 21 o. g4 31 o. s3 41 o. s4

sl o.s4

61 o. 7i 71 o. 7s sl o. s6 9i O.84 ..i

      ,「tτ国 ito l o. 42

・刈 ・.・7 121 1. 36

全i・.93

一一c)や区分9(芸能)の数値ぶかなり高いのは,人名が多く現われることと.

蓑の占める割合の大きいことによると思われる。

 つぎに,ことなり字数をみると,大部分が1,000〜1,500宇であるが,のべ字 数は,区分によって,かなりの違いがみられる。しかも,のべ宇数の多いもの が必ずしもことなり字数が多いとは限らない。のべ字数に比して,ことなり字:

数が少いとみられるのは,区分3(経済)や区分12(案内広告)である。経済 欄は,株式の相場表がその大部分を占めている。そのため,社名など,使用さ れる漢字は,ほとんど一定しているので,のべ字数が多くなっても,ことなi)

字数は,それほど変化がみられない。案内広籍欄も,求人・土地・建物などが 主な内容で,同一の語(漢宇)カミくりかえし用いられるという点で,経済欄と 嗣様のことが考えられよう。これに対して,岡じ広皆でも,一般の商業広告 は,内容も多種にわたり,広告主によっては,かなり自由な用字が行なわれる ため,案内広告と同一の傾向をとってはいなV・。

 のべ字数に対してことなり宇数が多いのは,区分6(文化)と区分9(芸

      一97一

(11)

能)である。文化欄は,学問・芸術・教育・科学・図書など,内容が広範囲 で,いろいろな分野の語彙があらわれるため,ことなり字数が多くなるものと 思われる。また,芸能欄は,主となるテレビ・ラジオの番組欄の人名や題名に 表外字が用いられるため,バラエティに富んだ内容を持っているもののようで

ある。

 図2は,図1と同じように,各区:分ごとの使用度数分布を曲線で表わしたも のである。繁雑さを避けるため,雀いたものもある。表9と合わせみると,お およその傾向をよみとることができよう。(区分2と区分10は,他とくらべ て,のべ度数が小さいので,ここでは,直接比較の対象とはしない。)

 ①使用度数の多1…漢字800字では,すべての区分が使用率90%に達してお   り,ほぼ1,000宇〜1,500字で100%になるが,100宇〜300字あたりでは,

  区分によって,使用率にかなりの違いがみられる。

 ②スポ・一一一ツ欄,経済欄,案内広告などは,100字で,50%〜60%に達するが,

  商業広告や文化欄は,40%前後である。

 ③案内広告と婦人欄をのぞいた,他の区分は,使用度数の多い漢字の上位か   ら40%〜50%で,使用率90%に達している。別の言い方をすれば,ことな   り字数の約半分で,全体の90%をまかなってV・ることになる。また,約55         図2 各層別区分の漢宇数と使用率の関係

%009080706050403020.10 1    使用寧一

〃汐ノ

︐クク         ∠繊〃7

         ズおノ

   @ 

@  @ 

@  @ノク

 ・多塑

32846!齢二・;

一=一

  le

漢字数   leo

−98一

leoo

(12)

ge 9層別区分による使用度数分布

23456789101112 最初の  10字11.9% 114.9%15.1%11.1%13.2%10.1%16.8%11.0%10.8% …  20.6%,.。%1

11.3%20字

18.7

22.922.6

17.4

20.2

16.5

25.6

17.6 17.6

29.9

15.0 18.8

30宇24.329.028.522.4

25.7

2】..331.923.223.237.0

19.7

25.140字28.933.933.326.6

30.7

25.136.928.127.743.323.5

30.6

50字32.938.237.530.435.028.541.232.031.448.5

26.7

35.460掌36.542.241.133.738.6

31.5

44.935.0

34.7

53.129.6

39.6

70宇

39.6

45.744.336.641.934.348.238.7

37.6

57.032.443.380宇42.748.947.239.345.036.851.041.540.360.934.9

46.6

90字45.451.849.941.747.739.253.544.042.864.037.3

49.6

100字48.054.452.443.950.341.455.846.445.266.639.552.3200字66.173.270.059.868.558.671.063.462.085.3

55.6

69.8500字88.995.690.682.889.583.G90.187.284.280.390.11000字98.699.196.398.896.999.999.996.794.598.215CO字99.799.099.9

i①①−

全体の

%%%%%%%%%

050567890

889999990

       1

 335字 424 529 711 768 836 920エ,071

1, 240 256字307377482511538565594622  302掌 376 480 660 709 777 864 9731, 172  445学 551 693 910 9781, e641, 17e1, 3122, 582  320掌 400 514 696 746 817 8901, 030

1, 171        1 445字 542 674 890 9471,0王11, 1261, 242

1, 358  30G字 381 498 691 743 822 9011, 055

三,214  374字 458 568 729 784 840 895 9511, 007  416宇 519 661 885 9521, 0201, 1141, 279

1, 414 159宇1972362742822892973e5313  495学 607 766三,034三,1381, 2C71, 3371,5111, 779

302宇!

2gg

1器

};鵠量

(13)

  %〜65%で,使粥率95%に達する。

④案内旧著は,496字(ことなり字数の32。0%)で,金体の90%に達するが,

  10e%になるのは,1,554字である。すなわち,比較的少なV・字数で,金体   をおおうことができるが,二種はかなり多い。

⑤婦人欄は,全体の90%に達するのに,568宇(56.4%)を必要とするが,

 100%になるのは,!,007字である。このことは,婦入欄では,ある程度の   使用率に達するためには,比較的多くの字種を必要とするが,全体として   は,それほど多くを必要としないことを意味している。

 以上,層別による漢宇使用の特徴を大づかみに指摘したが,これによって,

同じ薪聞でも,話題別によって,かなりの栢違があることがわかったと思う。

なお,雑誌などの層男ljによる特徴と比較してみると,また,興味ある結果が出 るものと思われる。

 (7);林四郎噺聞語彙調査の概略と語彙分析法試案」(前掲国研報告31)

 (8)長単位語とは,文節を基準とし,1文節内の自立語の部分を1語とするものをい   う。(注(7)論文を参照のこと。)

3.層別区分による使用漢字の特徴

 層によって,どのような漢宇がよく使われるかということは,その層にどの ような語彙が多く属するかということと不可分の問題である。その両者の開係 を開らかにすることも,一つの大きな問題であるが,今,それを論ずる余裕は ない。これから行なおうとするのは,語(または,語を構成する要素)を表記 する文字としての漢字が,各層別区分にどのように特徴的に現われるかを,一 応,語彙とは切りはなして,数量的な処理によって見ようとする試みである。

結果として出てきたものについて,後に,語彙との関連を問題とすることにな ろうが,それは,上に述べたことと矛盾はしない。なぜならば,ある漢宇がど のような語に用いられたかということと,漢字と語彙との間に存する〜般的な 関係とは,別の次元に属することだからである。

 一般に,基本語彙というようなものを統計的に用いようとする揚合,一つの 尺度として,深さ(使用度数)とか広さ(出現範囲)といったものが用いられ        一 100 一

(14)

ている。もし,薪聞の基本漢掌というものを求めようとするならば,やはり,

そうした尺度を用いてみることが必要となるだろう。しかし,すでに児てきた ように,属じ薪聞に用いられる漢宇であっても,話題によって,記事の種類に よって,あるいは,紙面上の位置によって,その用いられ方は一様でなく,そ れぞれ異った性格を持っているはずである。各区分の全般的な傾向は,すでに 述べた。ここで,碍的とするのは,各層別区分において,特徴的だと思われる 漢宇を具体的に抽出することである。語奨については,そうした試みが,すで にいくつか行なわれている(g)。それらを参丁目しっっ,漢字について,そうし た方法を試みることにする。

 ある特定の層別区分における漢字(または語彙)の特徴度を数量的に測定す る場合,その基準となるのは,およそ次のようなものであろう。

  ⑳使用度数および順位

  ②実度数(使用度数)と理論度数の差   ③    〃       〃  比   ④その溺別区分への集中度

ここでいう理論度数というのは,配分係数(総のべ度数に対する各磨別区分の のべ度数の比率。表8に%で示してあるのがそれにあたる。)によって,それ ぞれの漢字の使用度数を比例配分して算出したものである。たとえば,使用度 数1位の「則の実度数と理論度数は,表!0のようになる。また,集中度とい

うのは,基本語彙でいう,ちらばり度(出現の範囲の広さ)の反対の概念であ

る。

 もし,①に重点をおいて考えるならば,表11のように,各区分ごとに使用度 数の多い順に三門をならべた表を作ってみればよい。しかしながら,それぞれ をたてにながめると,たしかに,その区分で特徴的に用いられているらしい漢 宇を認めることができるが,横にながめてみると,使用度数の多い字ほど,ど       表19

区分t・回・国・削・国・1・・i・・い21計

鍍釧・S81 661 S6Sl 37・i 27・i・32i 2751・・i・5・い!372國璽 理論度tW 1 26・1441・・21・221222い83!…い8}・・3い2}・24176塑・i

一一 10ユー

(15)

一cqO﹇一

表ll 各層別区分でよく使われる漢宇(数宇は使用度数)

ま2111098765432

1 順評

       一   ゑ フ む バリ む   ヨ ユ ら       ユ   き        

67

U7

U4T8

T5

T5

[43434038383737363534343433 一目万祉三二分東大歩地付給五上坪売高員建

H 372

円278

東272

一一 263

本242

大240

社194

i新193京181分178三三176

人176月175地162閏161中159会157学153建146二143

34752100888887777766

42111111

一鬼分書自生死来会者手三方君今思時同何気

他210子1851ヨ154

一 145激144田138曲133人i21三i10中107天107楽104大1GO作194郎 89

瓢 88n肉

醤87

小 86

再 85学 84 91W8V1U6T9T9T3S3S1S0R8R8R8R8R8R7R5R4R4R4

一人生三二日越中子本気時年分爵自上五出大

大382

一一 368

二347日275三252田228中219打217五186

本181

四177山161

手152

勝151東133

入132

回129

十128 分120

投114 一 192艮132学131人119大119二103

本99 年92 高89 十89 時83 国82 中80 会78 三78 生74 教67 的66 曇66 低65

日275国272一 205十199米170大158会155二140政138発130中123軍118同112入110

北95 議92 統89 相87 民85 的83

一 440十395臼370ここ305学271三270大238人235年230

会209

事197岡184四17δ中173:五168東166生165地153長151区150 N 565

三i三369

一 367東331大286二270電235十188工183五179同175金164

薪16G

四159

化152

業143年140

機135 慶134

国131

国68

日 66

会55

一 40

十34 議31 中31 長30 本30 大28 解27 党24 同24 発24 連24 外21 出21 悶20 的19 委18

会328H 258一 236国225

十222

党161議158政147年142二138

員132

桂129中119三117大116

行112

業111方110長108民105

1234567891011121314151617181920

(16)

の区分でも上位を占める傾向があり,どの層別区分において,より特徴的かと いうことを凋断ずるのは困難である。②または⑧に重点を置くのは,①にくら べて,より求めるものに近づくことができそうな方法である。先にあげた,層 別特徴語彙の試みも,この二つのどちらかに重点を置いて処理している。これ から行なおうとする方法も,③に重点を置いた方法である6理想として考えら れるのは,上にあげた四つの基準(まだほかにも加えるべきものがあるかもし れない)をなんらかの方法で総合して,統計学的にも意味のある処理を行なう ことである。しかしながら,今は,それに足るだけの準備カミできていない。そ こで,将来,よりよい方法を作り上げるための捨石として,以下に述べるよう な一つの試みを行なってみることにした。

 ①対象は,各屡別区分ごとに現われたすべての漢字とする。ただし,区分2   と区分10は,全体に対する比率が小さいので,対象から除く。

 ②各漢字ごとに,理論度数を算出する。算出された理論度数が1に満たない   ものは,対象から除く。

 ③実度数から理論度数を引き,その差を理論度数で割ったものを,その漢字

  の理論度数からの逸脱度とする。ただし,理論度数が3以下で,実度数

  が,10以下のものは,対象から除く。

逸膿一論義鍵駿雛(例)理講=lll逸膿一56留12一・…

 ④層別区分ごとに,逸脱度の大きい順に漢字をならべて,分布表を作り,平   均値Mと標準偏差Sをもとめる。

 ⑤陸別区分ごとに,平均値から標準偏差の2倍以上隔っている漢字を特徴漢   字とする。

   特徴漢字>M十2S

以kのような手つづきを経て,抽出された特徴漢字は,表12に示すおとりであ るが,それについて分析を加える前に,この方法による閥題点をいくつかあげ てみることにする。

 ①この方法の特色は,特定の層にかたよることなく,それぞれの層別区分内 1 における特徴冷媒をひろえることと,使用度数の低い漢字でも,ある層脱   区分における使用率が他の区分に比べて著しく高い揚合には,特徴漢宇に       一 103 一

(17)

︸15   5

@ ξ浦   1

1

1

1

一1

OM S

S、 特徴漢字

 なりうることにある。ただし,使用度数が低いものは概して理論度i数も小   さく,逸脱度が大きくなる傾向を持つので,有意な範囲についての検定を  行なう必要がある。

②実度数が0でも (その層別区分では1字も出現しなかった宇でも),理論  度数が1以上の値を持つ場合がある。ここでは,そういう宇は対象としな  かったが,考え方によっては,消極的な特徴を持った漢宇に含めてもよい   と思われる。しかしながら,上述の方法では,・たとえ対象にするとして   も,理論度数の大小にかかわらず,それらの漢宇の逸脱度は,いずれもマ  イナス1となり,処理上に問題がある。

③一一一twに,実度数が理論度数よりも小さい場合の逸脱度はマイナスになる。

  そして,その範囲は,一1<xく0である。ところで,層別特徴漢宇の範  囲を平均値から標準偏差の2倍以上隔っているものと定義した牛合,M+

  2Sより大きいものとともに, M−2Sより小さv・ものも,消極的な意味   での特徴漢掌になりうるはずである。しかしながら,実際に処理してみる   と,M−2Sは,みなマイナス1よりも小さくなってしまい,該当するも   のは,あらわれない。したがって,この方法は積極的な意昧での特徴漢字   をとりあげるには適しているが,消極的な意味での特徴漢字をひろう方法   としては,あまりよいものとは言えない。

以上のような条件を頭におきながら,表12をながめてみると,次のようなご

、とが考えられる。

①特徴漢字の多少は,その区分の漢宇数とは直接関係がなさそうである。む   しろ,他の区分と異った内容を持つものほど,特徴漢学が多い。

②二つ以上の区分で特徴漢字となったものは,区分1と区分5の府と官,区        一104一

(18)

表重2 層別特…徴漢宇

18H一

上のもの)

予,策,省,箕,賃,官,

j,濠

州,精,油,融,薬,帝,ネ,絹,亜,柄,脂,硝,

客,県,捜,害,消,焼,吹C肉,突,除,羽

派,隊非,爆義命,

x,討,欧,略,革,渉,

跡,究,彼,然,違,皇,

宮,秒,振,湖,永,捕,イ,鵬升,棋,走,督,

劇,夜,朝,謡,雄,奏,?,笑,礎,浩,旧

婚,積,曜,呈,篇,貯,

験,駅,含,可,募,優,ワ,即,及,陽,寮,葬,ョ,刷,珠 例(実度数と理論度数の差が11以

企措⁝輸乳

汁騒士据需

府働 倉郷均 田態 紙債益 法答 鉱維曹 案挙 買伸携 審構 糸繰豚 四条 菱炭病 田閣 鋼製滴

リリ      シ  ひ  ひ

政衆 興糖酸 弓懸 無減病 田針 工護身

署,空,局,故,火,普,航,査,震,防,死,乗起,授,護,危,因,母,庁,病,災,遺,寄,掃

報酬 偽従 藁秘 漸訪 麻臨 聖子 鱗鑑 芯鵬 欝病宙 政繋駐 軍富筋

曇,晴,低,患,史,風,念,雨,著,講,師,想, 番兵憲

敗票 怠盗 癖盗 濃紫 胤犠 墨継 戦撃塩 酸帝国 投幡湯 球遊監 勝矢盤

家,料,思編先,茶,身 打競病

他,歌,曲,天,楽,再,語,郎,夫,映,音,英,彦,演,花,芸,響,講,旬,城,奥,之,漫,隆,

円,訳,錠,販,版,典,愛,評,洗,巻,刊,著,替,蓄,描,御,頁,症,綿,瀬

卒仲窪 歳履斗 遇築荻・

託浴礼 面与依m 歴渋又 付環敷 走邸乞 給勤儀 坪完昇内 同宿干 間接免

特徴漢字数

  3,f

4852

43%  46

7  41

41

53 対象となった漢字数

514

Jr32881

388

358414

63398

886

972 総度数

1, 240

1, 172

1,582

1. 171

化1. 358

1, 2/4

8 i婦人・家庵i1,007

1,414

1, 779

1, 554 政治・労働

会・地方 経

6i文

スポーツ

芸能・娯楽

商業広告 案内広告

区  −34579  1112

(19)

  分3と区分11の綿と酒ぐらいである。ある区分における特徴度が高げれば   高いほど他の区分では,特徴漢字となりにくい,この方法の性格によるも   のと思われる。

 ③話題による層別のため,その層別区分の話題と関連性の強い特徴藷との結   びつきが強い。

  ④社会面では,調査対象となった時期に,羽田空港沖の航空機墜落事故が    あったことを反映して,空・故・航・羽などの字がみられる。

  @経済欄は,会社名および株式用語に関するもの(無・買・減・傭・据)

   が多い。

  ◎芸能欄は,・番組表独特の用字がみられる。特に人名に用いられる掌(郎    ・夫・雄・彦・之)が多いのがめだつ。

  ㊥文化欄には,天気予報が含まれているので,気象関係の語に用いられる    漢字が多い。

  ㊥案内広告欄は,土地建物に関するもの(迄・坪・歩・駅・完・邸)と求    人に関するもの(万・給・歴・面・遇・卒)が多い。固有名詞以外の表    外字,蓬・乞なども,この欄独特の用字である。

 ④属別特徴漢字は,特徴語と強い結びつきを持つが,その逆に,特徴語に用   いられる漢字が特徴字になるとは限らない。例えば,大鵬・質入などは,

  一方が特徴字だが,一方は特微度は,きわめて弱い。

 以上,新聞の朝曇使用について,一応整理のついたデータをもとに,その特 色をさぐってきたが,はじめに述べたように,不一卜分な資料から推測し得たも のは,おそらく九牛の一毛にもおよばないのではないかと思われる。さらに,

この調査が量的にも質的にも充実した時に,いっそう深い分析が行なわれるこ とを期することにしたい。

 (9)林四郎 前掲(7)論文

  木村繁「層別特徴語の判別」 (本書25頁)

一 106 一

参照

関連したドキュメント

ゼオライトが充填されている吸着層を通過させることにより、超臨界状態で吸着分離を行うもので ある。

※ 硬化時 間につ いては 使用材 料によ って異 なるの で使用 材料の 特性を 十分熟 知する こと

世界的流行である以上、何をもって感染終息と判断するのか、現時点では予測がつかないと思われます。時限的、特例的措置とされても、かなりの長期間にわたり

ポンプの回転方向が逆である 回転部分が片当たりしている 回転部分に異物がかみ込んでいる

区分別用途 提出の有無 ア 第一区分が半分を超える 第一区分が半分を超える 不要です イ 第一区分が半分を超える 第二区分が半分以上 提出できます

としても極少数である︒そしてこのような区分は困難で相対的かつ不明確な区分となりがちである︒したがってその

②障害児の障害の程度に応じて厚生労働大臣が定める区分 における区分1以上に該当するお子さんで、『行動援護調 査項目』 資料4)

・分速 13km で飛ぶ飛行機について、飛んだ時間を x 分、飛んだ道のりを ykm として、道のりを求め