国立国語研究所学術情報リポジトリ
電子計算機による新聞の語彙調査 4
著者 国立国語研究所
発行年月日 1973‑03
シリーズ 国立国語研究所報告 ; 48
URL http://doi.org/10.15084/00001248
国立国語研究所報告48
電子計算機による
新聞の語彙調査(W)
国立国語研究所
1973
刊行のことば
昭顧41年に始めた電子計算機による新聞語奨調査の処理がひととおり終ったので,調査の結果
得られた約十九万語の内容を公表する。国立国語研究所は,創設以来s国語施策立案の基礎資料を提供する目的で,現代語の語藁の使 用実態を数量的に調査して来た。婦入雑誌,総合雑誌,雑誌九十種と,三次にわたる雑誌の語彙 調査を経て,昭和41年から新聞の語彙調査にとりかかったが,この時から,調査の手段を,カー
ドと入手による方法から,電子計算機による機械処理に改めた。処理には,昭和40年度末に設置 したH:王TAC 3010を用V・,漢宇かなまじり文の入出力には,沖電気製の漢字テレタイプライタ を用いた。調査資料には,朝日・毎目・読売,三論朝夕刊の,昭和41年1年間の全紙面を用い,約一一億二
千万語の母集団から,六十分の一のサンプル約二百万語を抽出した。これを処理して得られたの
が,本書に示す十九万語である。雑誌九十種目調査は,延べ五十三万語を処理して公表するまでに7年を要した。今回,同じ7 年で延べ:二百万語を処理しえたのは,専ら,電子計算機のおかげであるが,反面,この調査に は,電子計算機を用いたための欠点も,いくつか,かぞえられる。それらは,本書の解説の部分
に記してある。それらの点を考慮されて,本書の語彙表を利用して下さるなら,幸いである。電子計算機で大童の出語資料を処理した最初の試みであるため,システムの設計や処理の技術
に,至らぬ点が多々あったことを反省しているが,ともあれ,まとめの報告ができる段階に来た ことを喜びとしたい。電子計箪機の導入に際して御尽力下さった方々,調査中に各方面から御指導を賜わった方々,
これまで中間報告の語彙を刊行した際,有益な助書や批判のことばを寄せて下さった方々,いち
いちお名前をあげられない多くの方々に厚く感謝の意を表し,今後引き続いて御指導をお願いす
る次第である。
この調査は,第四研究部において,部長林四郎を中心に,言語計量調査室,第一資料研究室,
第三資料研究室に属する研究員が全員で推進しているものである。本書の執筆には,次の者が当
たった。
12345
調査の潤的調査の企画と内容 方法
長単位表の性格
長単位贋内順位表の性格
昭禰47年11月5日
石綿敏雄 同上 同上
川中章夫 村木新次郎
国立国語研究所長 岩 淵 悦 太 郎
目 次
刊行のことば
調査の概要………・……・…………・・一………・………___._ _1
1. 調i査の欝的…………・…………・・……・・………・………・…・…・………… 1
1辱1.調査全体の目的………・・…………・……・………・… 1
1.2.この報告書の目的……一………・……一………・…………・一 ・… 2
2⇔ 調査の企画と内容………● ……… ……… … … …… 2
2.L企圃条件と調査内容:……● …… ………… … …. ……… 2
2. 2. 言周白文寸象 … 一・… 一・・・・・・… 。・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・… 一・・… 4
2.3.調査方式… ………… ….……… ……… ……… 9 ……… 4
2. 4. fi fifi …・・一+・…一・一一・・一・一一一一・ny・・一・・+・・・・・・…一・・ny・一…一一・・一一・・一・・…一・一一…一一一・一・一4・・・… 4 3. 方法…・…・・………・・…・………・………・……・…・… 5
3.1.作業手順……… ……… … …一4……… 5
3. 29 層労q・・・・・・・・・・・・… 一・・… 9一・・・・・・・・・・・・・・・… 一… 一・・… …・・… 8
3.3.調査単位と度数の数え方………一・……一 ・・10
一主要データー覧
4曾 長単位表の性格………・…・・………・………一………124.1.「全体」と「記号・数字外(記号・数字を除く)」の定義一 …・13
4D 2. 層 ・層yJgj・ノ轡内・・… 一・一・・…一t… 一 … 13
4.3.順位・出現率・累積比率一……… 一13
4.49見出しの配列………・・……・……・……・・… …・165. 長単位層内順位表の性格……… 脅 ……… ……… 17
>頻度順(層別)長単位表…… …… …・19
>長単位層内順位表……一…・……・……… 『●… . … 111
>簡易五十音順長単位表・………・……… …一 131
1
調査の概要
1. 調査の目的
1.1調査全体の羅的
この調査は,現代の新聞をとりあげてそこに含まれる用語用字の実態を明らかにし,語彙の構 造や表記法の問題を究明することを資的としている。われわれは,現在までに,婦入雑誌の用 語,総合雑誌の用語,雑誌九十種の用語用宇の諸調査を行ない,その結果を報告書,資料集の形 で公刊してきた。これらの調査はいずれも雑誌を対象としたものなので,今回は材料を薪聞に求 めた。それは,これらの調査がいずれも広く現代のH本語の書きことばの用語用字を見渡してそ
の実態を明らかにするために行なわれており,かつ新聞は現代の言語生活のなかで重要な役捌を果たしているので,現代語の用語調査としてはどうしても新聞を欠かすことができないという事
惰を考えたからである。今回の新聞の用語調査には,従来のものと一線を画する点がいくつもある。それらの重要なも のをとりあげれば,従来の調査では十万の単位の調査規模であったものを,今圏は百:万の単位の
調査規模としたことであり,調査の行程に機械を導入したことである。調査の規模を拡大したの
は,この用語用字の調査にあっては,度数の高いグループの用語用字だけでなく,その次に位置する用語用字のグループの実態を知ることが重要事として要請されているからである。用語用字
の実態を探り,その結果を利用して何かを行おうとするばあい,問題によってはそのことが最も重要になることがある。そして,特に国語問題の解決のための資料として,そのことが重要であ
った。このようにして,百万の単位の用語調査が企画されたのである。そしてそのような大規模
な調査を合理的に行なうためには,どうしても機械化せざるをえなくなった。このような事情
で,電子計算機が導入された。ただ,この種の研究調査に電子計算機を使用することは,われわれにとって最初の経験であったために調査の設計,実施,プnグラム開発,システム設計や人事
閥題等,さまざまの問題を解決しなければならなかった。予期できなかった問題も一,二ではな V・。これらにつV・ては国立国語研究所報告31,34,39,46および49で報告されてV・る。まだまだ未解決の問題が多く,改善すべき余地がすくなくない。今回の調査では,したがってその意隊 で,この種の調査方法の最初の道を切り開くということをその重要なE的の一つとして考えるべ
きである。この用語用字の調査を企画するに当たってその結果が,基本語彙,基本漢字の選定その他現在
の国語国字問題を考えるばあいの,基礎資料として十分に役立つことを念願した。それとともに,用語用字調査の結果も,調査行程自体も,きたるべき情報化社会のなかにあって璽大な役捌を演
ずべき言語情報処理の研究溺発のために,貴重な資料を提供できるものと期待している.2 調査の概要
1.2 この報告書の§的
この調査は昭稲40年に企画,翌41年に実施にうつされ,47年度に一応初期に考えた語彙表作成
の目的をほぼ達成したので,その結果を公刊することにした。この報告書は,後にも説明するように,長単位延べ二百万語についての五十音順語彙表と度数順語彙表を載せ ている。五十音順語
彙裏は数字・特殊記号などを除くすべての異なり語約十入万余語,度数順表は上位一万余語を収
録している。これらは現代新聞用語の実態を示すものであるが,なかにはもちろん,新聞に現われる独特の 用語も含まれている。 「案内広告」などに現われる用語などその使用揚颪でなければ理解しがた いもの,あるいはかなりの臨時使用の用語も数多く含まれているのでいるので,利用にあたって はその点の留意が必要である。またきわめて低い度数については,統計的な見地からその取り扱 いに十分の配慮をのぞみたい。
用語のなかにはきわめて特殊な分野で用いられる専門用語,稀用語,特殊な固有名詞,擬名,
路語,略表記,外国語,誤用に近いもの,無意味語なども含まれている。紙数の関係と,作業進
行の都合上から,それについての注がっけられなかった。これについては,あとでまとめてそのような用語について用例などを示し,注をつけたものを発表する機会をもちたいと考えている。
また,この報告書に収めた語彙表は,あとで述べるように,表記の上で同形の語を集めた表で
あって,本当の意味での単語を集めた「語彙表」にはなっていない。この報告書の利用にあたっ ては,その点についての配慮:も望みたい。以上のように,いくつかの問題点を含んでいるが,この報告書をこの時点で刊行するのは,現
代用語の実態を明かにしようとする大蚤調査の結果を,一般に公開するためである。2.調査の企画と内容
2.1企画条件と調査内容
この大規模な款聞の用語用宇調査を企画するに当たって存在し,あるいは考慮した事項は次の
とおりである。① 調査の対象としては,従来の雑誌の調査のあとをうけて,新聞をとりあげる。これは,濁 代語用語調査が全体として現代日本語の書きことばの用語用字の実態を明らかにする麟的を もったものであり,新聞が環代の書きことばのなかで占めている位置が非常に大きいからで
ある。② 国語国命問題解決のための資料としては,従来国立国語研究所で行なってきた調査より も,さらに一層大規模な調査が要求される。したがって従来に比して,調査規模の拡大を考
える。③ 大規模な用語用字調査の作業を合理化するために,機械化を考える。このためには電子計
算機を使用するのが適当であるが,計算機のシステム設計をどのように行なうか,漢字をど
う扱うか,プログラムの設計はどうするか,どのようにシステムを作り,人員を配置して処
調査の概要 3
理してゆくかという問題を解決してゆく必要がある。特にプログラムの作成は大きなしごと である。④ 漢字の機械処理のために,漢字テレタイプ(漢テレ)を使用するのがよいかどうかを検討 する。これには漢字がそのまま扱えるという利点があるが,いろいろの欠点もある。使丁す ればオフ・ラインが適当であるが,計算機とのメカ的,コード的な問題を少なくするため
に,新しく設計しなければならないところがある。⑥ 用語調査の単位としては,従来はα,βの二種があった。すなわち婦人雑誌ではα,総合 雑誌,現代雑誌九十種ではβの調査単位を用いた。αは長い単位,βは短い単位である。従 来はこのいずれか一種しか用いなかった。今回は,機械化することでもあり,この両者を併 用することにした。長短の両単位を併用すれば,語の構成に関する調査も同時にできて便利 であり,かっ長単位を利用すれば溜刷分布がより有意義なものとなる。このように単位を一 っにきめず,調査の内容を豊かにすることを考える。ただしそれを可能にしたのは,機械化
があったからである。⑥ 助詞・助動詞については従来は調査したものもあり,調査しなかったものもある。今回は これをすべて取り入れることにした。機械を使うばあいは,あらかじめ区別するのは得策で ないし,すべての語について調べる方が,朋語調査の内容が豊憲になり,内容の利用法に編
ができるからである。⑦ 履別法fac 一一種に限定せず,四つの次元から行ない,語彙の分布の考察を立体的にすること ができるようにする。すなわち次元を異にする四つの基準(文種,話題,署名態度,位置)
について,それぞれの予予から分類してある。(3。2。腰別一覧表参照)
⑧ 今園の用語調査は,電子計箪機を用いて行なう第一回のものであるので,技術的に必ずし
もすべての見通しがつけられていたわけではない。解決できなかった閥題として,大きなものは漢字の読み(「通った」のカヨッタ,トオッタなど)も含めて,間語異物の処理のそれ
がある。すなわち同形異語の判別,異形同語の処理がなされていないのである。ただ,漢テ
レを用いて漢学をそのまま入力しているので,かなで書くときの嗣音語がそのまま全部区別
されていないわけではない。かなり救われている。その反面,かな蓑記と漢字表翻の語の
identlficationができなくなっている。いずれにせよ,岡特異語の処理はできなかったのである。この報告書の語学表は,すなわち嗣表記同形語の使用度数表であって,従来国語研究所
で作成してきたようないわゆる語彙表とは,やや性格を異にするものである。このような性
格をもつものでも,十分に役立ちうることは,かのソーンダイクの莫語調査がこの性格のも のであるにかかわらず十分1ご利用されているという事実からも,明らかである。今翻の調査の語彙表はこの意味で,これからの用語調査が解決すべき問題をそのまま残した形になって
いるが,これは次の用語調査の撮発点,立脚点として重要な資料となるであろう。その意味
で計算書語学(computational linguistics)的に見れば有益,重要な資料であるとv・うこと ができる。4 調査の概要
2.2 調査対象
上記のように新聞を対象として取りあげたが,取り扱いの便宜と適当な調査規模ということを 考えて,朝日新聞,丁目新聞,読売新開の三紙とし,昭和41年1年分について日曜特別版を除く
朝夕刊全紙面をその対象とした。2.3 調査方式
全三面について全数調査を行なったのではなく,サンプリングによる調査方式によった。サン
プリングは,薪聞の性格から,エリア・サンプリング方式により,ランダム・サンプリングを行 なった。サンプルの割り合てにも電子引算機を使用した。処理・集計・製表は電子計算機および漢テレを使用した。
2.4 実施
2.41人員
この調査研究は国立国語研究所第四研究部言語計量調査室,第一資料研究室,第三資料研究室
の共同研究によって行なわれている。このうち第三資料研究室は漢宇や表記の集計分析に関する 部分を担当している。現在の各室の人員は次の通りである。第四研究部長 林四郎
言語計量調査室 石綿敏雄 斉藤秀紀 村木新次郎 第一資料研究室 日中章夫 江川清 中野洋 織岡昭夫 第三資料研究室 土屋信一 野村雅昭
以上のほか,調査の企画時より参加し,現在は他に転じたものに,大石初太郎,林大,松本 昭,南不二男,木村繁がある。この研究作業を助けたのは,白井陽子,小高京子,小幡利子,阿
部典子,小林(寺田)尚美,紺野雅子,沢田さち子,沢村都毒:江,篠田(加藤)美代子,柴崎香苗,下由いくよ,白木千夏,田中由紀子,谷内レイ子,中野(山中)三千子,花井(田村)夕起 子,堀江久美子,益子芳江,桜井敏子である。このほか所外のアルバイト延べ数十名がこの仕事 に参加した。またH本ビジネス=ンサルタントの山本一等(現・恒和清報技研)はこの調査設計 に多くの助書を与え,β立電子サービス株式会社の吉崎孝雄,大野智範田口昇の諸氏からはプ
ログラム作成の細部にわたって助書を得た。2.42 実施の経過
この調査は昭和40年に企顧が開始され,40年度には語彙調査プログラム開発の準備として漢テ
レを入出力とする用例つき用語総索引のプログラムを作成し,芥川竜之介「くもの糸」の用例つ き用語総索引を試作して,漢テレ入出力による用語調査機械処理の準備的研究を行なった。41年 度から今回の新聞用語調査の本作業にとりかかり,データの処理方式を定め,これによるデータの作成・さん孔とプログラムの作成に全力を投じて今日にいたっている。現在では,図に示す手
順のうち短単位の入力(再入力)のしごとが完了しており,短単位についての機械処理の作業が
続けられているところである。調査の概要 5 2.43機械の導入
前節で述べたように,機械化を考えて,電子計算機と漢字テレタイプを導入した。この両者は
オフラインで,紙テープを介して情報の授受が行なわれる。その構成は次の通りである。電子計算機HΣTAC3010構成 中央処理装置H−304。磁気テープH−382 6台。高速印 宇装置H−333一 C 1台。紙テープ読取さん孔機H−321 1台。オフライン万能入出力装置
(オキタイパ)H−177 3台。漢字テレタイプ 印字部 10,鍵盤さん孔部8 (昭和47年11
月現在)。
3. 方 法
3.L 作業手順
ここでは,作業手順についての大きな流れについて述べ,別にその内容を図示し,機械処理プ ログラムの一覧表を添える。機械処理プmグラムの一覧表は Aサンプリング関係, B長単 位関係処理プログラム C短単位関係 D表記関係 E用語日宇調査に付帯した,あるいは
それを改善するためのプmグラムの五種に分けてある。
睡のあ・動
① 資料の奴集。 朝目,毎日,読売三記聞の臼曜版をのぞく朝夕刊全紙を収集し整理する。こ れは語数にしていえば長単.位約120,000,000語。
② サンプジング。 エリア・サンプリングの方式により抽出比60分の1で抽出した。サンプリ ング・リストは機械処理によって作成した。抽出単位は1ページの30分の1。すなわち1ペー ジを横2段,縦15段に分けてその一つ。このリストを使って実際にサンプリング場所をぬき出 した。該当場所は前のエリアから続いてはいってきているセンテンスの部分については採ら ず,その次から採り,次のエリアにセンテンスが続いているときはそのセンテンスの終りの部
分まで採った。③ データの前処理。 作業規準に従ってデータに層別指定,単位切りなどの作業を行なう。こ
れを(特製の原稿用紙を用いて)清書し,打鍵さん孔(パンチ)作業を行なうためのテキスト
を作成,総合的に検査する。④ 入塾デターの作成。 漢テレにより第一次打鍵さん孔作業を行なう。モニタ印字により校正
し,これに基いて修正さん孔を行なう。⑤ 機械処理。 別に機械処理のためのプログラムを作成しておき,長単位に関する機械処理を 行なう。処理内容はプPグラムー覧表Aを参照。この処理により,長単位各種語彙表(簡易五 十音順語彙表,度数順贋別語彙表,出典表)が出力される。出力紙テープを漢テレ印字機にか
けて印字。⑥ デ・一・・タの中間処理。 長単位語彙表につき,短単位分割,漢字よみがなつけ,語構成,語種 晶詞活用などの情報を書き加え,清書して打鍵さん孔用のテキストを作成する。
⑦ 三無データ作成。上記データを漢テレにより打鍵さん孔し,モニタ印字によって校正し,修
6 調査の概要
機械処理による用語調査の過程
資料の載集
朝日、毎日、読売 3紙奔年 長120000000語 餐豆180000000語
サンプリング 蘭 処 狸 入 力 作 成 機 械 処 理
■
暦別記入 漢テレパンチ プログラム作成
60
単位分罰 校正 データ入力
標 本指 定 パンチテキスト 修正パンチ 長単位処理
長2000000語
作成 オペレーション
短3GOOGOOii吾 「富」 一
Zアレ アウト・プット
Ypmwwff,
/ 原資料についてサンプリング箇所の指定静
ブ日ック番号層別の記入宝輪 漕聾薫行一 、 ぞい︑いる 麩人鰐一篇出自︵轡蜘蝦︶は︑
塞繰の翔通で北鶴翼方噛への富 田鞭六晒Oろ︑一澱閥ぶりに酪通することになつ把︒
惣かば郷滴することζよる︒ ︐ 己︑ア製 分︑上り蕊本分のパス慶運賑してお霧をさはく︒貨物戴両は︑しば
らくは四百五十爾を用慧︑鳳十爾
分を自鋤車にかえて運送する︒
また︑東北本線浅虫−野内聞の
ぶ通個所も漫くても二士一百まで
に懲旧できる見漣しがついた︒貨
物は策北本灘鑛筏も︑堂分トラ
ック翰送と案蘭一八芦闘の船によ
る代行翰送で籠う︒
雑溝蕪雑け輸遜七舗確課 ブロック番号
」123523
」1:朝日新聞夕刊 6月〜12月
層別
P1:見出し P4二本文 S1:無署名記事 丁5:社会
G1:ニュ・一ス(参照2,2層別)
単位分調
(参照3.3調査単位〉
Ne eh.
N k.
fik. ...
幅、
N
入力見本
(J123523)(PlSIT561)#東北本線1も123副までに1
開通1(P4)#1(1青森馴国鉄東北支社i青森出張所iは…
調査の概要 7
中 間 処 理 再 入 力 機械 処 理 語彙表作成
機槻処理
各 種 分漢テレパンチ
Z正 C正パンチ
?力
プログウ云作成 Z単位処理 Iペレーション
長短各種 龕b表作成
各種プ・グラム
?成とそのオペ 戟[ション
漢字集計
?瀟己 ゙男畦語彙表 p例表 よみがなつけ
P位細分 t撫情報 pンチテキスト
?成
N
Ns.N
計算機が整理した 長単位語彙表
Vpt−w−」 tsst N N N
N㍉温(漢テレアウト2号)
「一}一 一一一一一「
}静出張所i
l l
i 青 梅 署 l
l 1 {青柳美枝子{
l l I 税制簡素化 }
1 1
}税務当局 {
1 .. .n l
I 税務相談所 l
l I L一一一w−
〟@一im一 一一 一j中間処理 人間作業
\舞誘翫翻轍灘の言売み 付力欄
1 0青〔おう〕梅〔め〕 (W800) i l 巳署〔しょ〕 (T1◎0) }
1℃青〔おあ〕柳〔やぎ〕 (W80◎)
1巳美〔み〕枝〔え)子〔こ〕(W800>
1 り税〔ぜい)制〔せい〕 (T100)
1 ?簡〔かん〕素〔そ〕 (T100)
1 芝5イt二 〔カ・〕 (T6 0 0)
0税(ぜい〕務〔む) (T100)
13当〔とう〕局〔きょく〕(T100)
1 0税〔ぜい)務〔む〕 (T100)
1 ?相〔そう〕談〔だん〕 (T100)
1呂所〔じょ〕(T600)
i O税〔ぜい〕 (T100)
1 ?負〔ふ〕担〔たん〕 (T100)
13公〔こう〕平〔へい〕(T100)
1 声〔しょう〕明〔みょう〕(Tl◎0)
1%〈しょうみょう〉 (%%%%)
1 り制〔せい〕隈〔げん〕 (T100>
1 3ワク(S100)
し_________噛
諮構成 D前部分 漢字の読み(〔
イ寸胴ロ 1青幸艮 伊哲
T漢語 1名詞
関係がない短単位
(参照3,4付加情報)
I
iI
一 一一
一 ︷ 一 巨 し t l 聖 ﹂2中部分 3後部分
〕のなか)
出張(T100)
0活用がない 0活用の種類に
(改行で示す)長単.位1東北 本線1も12 3 Hlまで に1開通
短単位 1東北i本線1も【2{31日iまで1に1開通
8 調査の概要
正さん孔して入力データを作成する。
⑧ 機械処理。 別に作成したプログラム(プnグラムー覧表B)により,短単位についての処
理を行なう。出力語彙表は短単位に関しての完全五十音順語彙表ならびに度数順語彙表で,出 力紙テープを漢テレにより印字。⑨ 製表と報告書作成。 上記アウトプットによって製表し,報告書を作成する。これが本報告
書である。全データが処理し終った時点で出す語彙表も,これである。⑩ 各種機械処理。 上記の機械処理のいずれかの段階からデータをとり,さらに機械処理を加 えて各種の語彙表,分析表を作成する。漢字の集計整理,語表記一覧表,類甥語彙表,活用語
一一覧表,用例一覧表など。3.2 層 麟
新開記事は話題からいっても,文章の種類からいっても,多様である。調査の結果,拾われた 語がどういう性格の集団に層しているかがわかることが必要なので,各語の属する文章を層に 分けた。4つの角度から層別をしたが,そのうち三つは記事単位の区別であり,一つは,i記
事内の位置上の区別である。覧
類一 分 の
層
1ノ文章の種類による区分(記事単位の分類) G種層別
1. ニュース (ニュース価値のある事件を速報するもの)2・ ニュースの解説 (独立した解説記事のほか,ニュース記事のあとに付属した「解説」
や「注」も含む)
3.社説・コラム (ニュースの影響下にある論説,評論。寸描的描き方のものも含む)
4. ニュースに連なる特集記事 (取材:角度や編集法に特徴がある)
5.特別読みもの (直接にはニュースと関係演ないが,物を見るHに現時的問題意識を
含んでいる揚合が多い。 動物紳士録 東京むかしむかし 新入国
記 等のようなもの)
6.評論・論文 (多く学芸欄にのるもの,時評的性格がある)
7.実用知識読みもの (家庭欄に多い,ハウ・トゥーものなど)
8.探訪ルポ (インタビューなど見て来たままを報ずる記事。スポーツ欄に多い)
9.長期:ユース展望 (週間,月間,年間などのニュースをまとめたもの)
10.記録・通知 (株式,ラジオ・テレビ番組,催しもののお知らせなど,要件だけを簡 潔にしるしたもの。天気予報,番組案内の文章も含む)
i1.紹介記事 ( 時の人 のような特定人物の紹介。海外雑誌新聞の論調紹介など)
12. 読者の作文 (投書素意見出や ひととぎ 式随想作文など)
13. ロミュニケーション (身上相談式な読者と社側との通信。読者の広場式な読者同士
の通信)
14.小説
告告 広広 の行 業三 事る やゆ 品わ 商い
︵ ︵告諭 広広 単︶交体 事治外主 記政のが ︵内本式 分国資株 区︵︵︵
るよ
蜘 覧
分 位の
題で
問済
経
︐ クイ ウ
内面 ユ ℃︐ の体 も主︶ るが澗 イ の電化 に外文︶ 面面︐版碁 会2直方︵ 社第臨地
︵ ︵ ︵ ︵を 含
ω
棋 将
●
ウが と
番併類 ビ合分 レをの︶ テで位事 ・ま単記 オー7事の ジら記般 ラか︵〜 ︵14分︵ の区 Gる ︑.︸融劇 外記略︵ると ︵︵︵ すご 痴る 豊代た 123記を者 事事事事名社部 庭山︵よ事事虚字記記記が外じ置 ッ浪浪 に温品嘉名名名頭だで同位 一・・ 嘉名社署署署署両名名にのし
ぬロの
内事
O
記 分よ る 疑 に
名
・ ︑ド 題 名
署
O
原 愚
説
の
どな表・ じ
業内画に治交語働会誌化方ポ入忠告態面心頭尾尾尾島署署12上出欄一文鞭 商案漫題政外経労社国文地ス婦芸広名無辺羽並末末外無無体嚴見痴り本塩表写T 話 署 紙 瓢日揮︶L乞3︒4.εa乳&9n且玖︶−︐2.a45︒α乞&9︐魚︶L23︒4︒5︒a7︐& 2 3
4
図同 やに 真12
調査の概要 9
商業広告 (商品や事業の広告)案内広告 (いわゆる三行広告・大学入学案内・死亡通知などをふくむ)
漫画
話題による区:分(記事単位の分類)丁種層男lj 政治 (国内政治)
外交 (資本の外交)
経済 (株式が主体,経済問題でも,第1面にあるものは概ね政治)
労働
社会 (社会面にのるもので,内容は雑多)
国際 (第2面外電が主体,1面にも多い)
文化 (学芸,文化欄)
地方 (地方版)
スポーツ (碁・将棋を含む)
婦入・家庭
芸能・娯楽 (ラジオ・テレビ番組,その解説)
広告 (Gの14から17までを合併したもの)
S種層別
無署名記事 (一一般の記事)通信社記事 冒頭署名記事
末尾署名記事1 (外部者)
末尾署名記事2 (記者)
末尾署名記事3 (略称による。 Q など)
外電冒頭記名記事 ([ニューヨーク十九H=小野寺正特派員」の如きもの)
無署名だが社を代表する立揚にある筆者による記事 (社説,天声入語など)
無署名で外部出たることが明らかなもの(天気予報など)
T12に同じ
紙滋強の位置による区:分(1記事内の部分単位の分類) P種層別
見出し標欄・題名 り一ド 本文
塩引艮言原。署名 表
写真や図・表などの説明
T12に同じ
10 調査の概要
3.3 調査単位と度数の数え方 〉調査i単.位の長さ
調査単位については従来は長い単位(α)と短い単位(β)のいずれか一・・一・・方を用いていたが,今
回はその両方をあわせて用いることにした。この併用によって語の構造も明らかにすることがで
き,造語要素の使用状態についての資料が得られるからである。従来は助詞助動詞を採ったり採
らなかったりしているが,今回は金面的にとりあげた。長単位については調査の規模の拡大か
ら,規剣を簡略化した。また短単位については国立国語研究所報告37を参照されたい。〉度数の数え方
今回の調査では句読点や記号なども単位として数えた。これは,言語の概念を計鐘言語学的に 拡大して考えるばあい,その方が有利かつ有益であり,実際に機械処理を行なうばあいにも,そ のことが理由になって当然便利であるからである。しかし旧来の雪語学の見方からこれを取り除
いた度数が知りたいとするむきもあろうと思われる。そこでこのような記号・数字類までも含め たものを全体度数,そのなかでの度i数順を全体順位としたほか,記号・算用数字を除いた対象に ついてもカウントした。〉調査単位のまとめ方。
この調査ではいわゆる同語聖子の判別を行なっていない。得られた単位は同表記同形の語につ
いて度数をカウントした表である。表記形で同じである「いき」(「粋」の意)と「いき」(「行き」の意)とは区別されず同じ語とカウントされ,表記形が異なる「いき」(「行き」の意)と「行
き」とは別な語として別にカウントされ,整理されている。すなわち異なった語でも表記が同じ であれば区別されず,同じ語でも表記や語形が異なれば別の語として処理されている。しかしす べての語についてこのようなことがあるのではないから,この表はそのようなことを考慮に入れ た上で使用すれば十分役立っと思う。長単位の区切り方 (細則をのぞく)
0.長単位はつねに/に始まり,/に終わる。
1. ス 〈 一スで切る
2.記号および記号連続は1単位とする。
2.1.文字・数字・スペース以外,すなわち句読点・くぎり点・引用符・かっこ・ダッシュ・
リーダー・疑問符・感嘆符・数宇記号・音楽記号などは,すべて記号類と認める。
2. 2.つぎの記号類は無視する。
○数回連続の中に現われる小数点・位取リカンマ。
○よみがなの前後にあるカッコ・ダッシュなど。
○単に名詞を連結するための記号,たとえば姓と名を結ぶ記号など。
3.文節末で切る。
3。1.橋本文法の連文飾的なものは,文飾と認めない。
3.2.用言の連体修飾法は,連体形のあとで切る。
調査の概要 11 4.主述開係で並ぶ体雪文節は,その述語部分を1単位とする。
4,1,形容動詞が語幹のみで使われた時は体雷文節とみなす。
5.並立・対等・列挙・くり返しの文節は原劉として切る。
5.1. 「〜兼〜jr〜対〜」「〜ノ、一〜」など,連結機能を持つ特殊な接辞でつながれているも のは切らない。
5。2.一字漢語が並ぶ場合は切らない。
6. 助詞・助動詞およびその連続は1単位とする。
6.L 助詞・助動詞の範囲は「現代語の助詞・助動詞」の目次にしたがう。
6.2.補助用書の融合形,たとえば「てる」「ちゃう」「とる」「とく」などは,助動詞扱いと する。
6.3. 「〜の〜」の形の体書で,新潮国語辞典が一語扱かいにしているものは「〜の〜」の形 を1単位とする。
6.4. コソァド語に続く「の」,「わが国」の「が」などは切り離さずに前につける。
6.5.形容動詞の活用語尾は,助動詞とは認めない。
7. 固有名詞・動植物名等および,これらを部分とする名詞連続は1単位とする。
7。1. この規定は,つぎにあげるものに適用する。
人名(姓と名は続ける)/地名(行政区画名・山川海湾・岬の名)/国名/会社・団体・
チーム・官公庁・事業所の名/部局・課・係・役の名/書名・作品名・論文名・新聞名・商
品名/特定建造物・寺社・禰・道路・鉄道の名/動植物名・魚名・細菌名・天体名/列車・機械・船・飛行機などの名
7.2.上記7.1.にあげたものの架空名,略称,俗称,ニックネーム,イニシャルについても適 用する。
7.3. 「漢字1字の略称」,イニシャルの並列は,5の規定にしたがう。
7。4.数をふくむ固有名詞の数字部分は切り離さない。
8. 代名詞・数詞・感動詞・接続詞・連体詞・副詞および副詞的に使われた名詞はすべて1単位
とする。8.0。上記の品詞の認定は新潮国語辞典に従う。
8.1.副詞に伴う「に」「と」は切り離さない。
8.2.擬声語,擬態語部分は,それ全体を1副詞と認定する。
9.数字(漢潮脚,算用数宇,ローマ数宇)・数字連続およびそれらが接辞,助数詞を伴う揚合
は,すべて1単位とする。9,1, 漢数字の兆・億・万・千・百・十・伍・参・弐・壱なども数字として扱う。
9.2.数字部分を入れ換えられない形式(「一生」「三位一体」「一心不舌し」「万才」)において は,数宇扱いをしない。
10. 三行広告,テーブル,リストなど,特殊なものの処理は細則による。
10.1. 三行広告は,切れるだけ切る。
/住/通/可/歴/持参/癒談/即決/
12 調査の概要
/砲塁/歩/15分/190万/地/115m2付/和/6/4.5/浴付/
10. 2. テーブル・リストの類の処理は次の原則による。
たて書きの揚合は,右上から左下へ 横書きの喰合は,左上から右下へ
11. 以上の0〜10.による単位分劉の結果が16音節以上で1単位となる時は,切りやすい個茂で 1箇所切る。
11.1. 音節数は拍数によって数える。
(例)チョ・コ・レ・エ・ト=5 パ・イ・ナ・ツ。プ。ル=6
サ・ン・ジュ・ウ・サ・ン・ゲ・ン・ド・オ=10
主要データー覧 調査対象 朝H,毎臼,読売三紙の昭漁41年1年分
打封 出 髪ヒ 1/60
サンプリング単位:は新聞紙面の1/2段(:1ブロック)
3紙 3紙 標 本 母集団
朝刊
5!8400ブロック タ刊
334800ブPック
× 一s.一
60
朝刊
8640ブロック タ刊
5580ブロック 母集団延べ譜数
島本延べ語数
延 べ 異なり
長単位 長単位
長単位 約 12000万 短単位 約 18000万 長単位 約 200万
短単位約300万
全体 記号数字外 1967575 1412948
213368 192492
(以上,執筆 石綿 敏雄)
4. 長単位表の性格
今回は,r度数順(層別)長単位表」「長単位屡内順位表」「簡易五十音順畏単位表」の3種を 報告する。これらの表は,いずれも,電子計算機の処理結果を,ほぼ思実にかかげたもので,見 出し語の中の漢テレ盤外字・盤外記号を,もとの文字や記号にもどしたほかは,人間の手作業は 加えていない。したがって,情報処理関係の基礎資料としても,役立っものと思われる。ただし,
調査の銑要 13
し,「長単位贋内順位表」だけは,「度数順層別長単位表」の三三結果にもとづいて,作成した もので,この結果を出すための特別なプログラム・システムは使用していない。また,「簡易五十音順表」には,記号と算用数宇をのぞき、すべての長単位見旗しを,また,
「度数順(層別)表」には,幽現度数7以上の,畏単位見出しを掲載してあるが,「層内順紘表」
の方は,度数7以上の見出しの中の,各層の上位200の範閥内について作成してある。
4.1. 「全体」ド全層」と「記号・数字外(記号・数字を除く)」の定義
「度数順(層別)表」には,「全体」についての結果と,「記号・数字外」についての結果と が,併雲己してある。
ここにいう「全体」とは,今圏処理した,すべての長単位を見嵐し別に集計したものであり,
単語に当たる長単位ばかりでなく,句読点・小数点あるいは;÷一%¥などの記号類も,すべて
含んでいる。これに対して「記号・数二二」あるいは薪二三・数字をのぞく」として掲げてあるものは,上
、に述べたヂ金体」の中から、句読点・小数点あるいは各種の記号・数字類を除外した揚合の結果
(数値)である。
「層内順位表」の中のギ全層」は,「度数順表」のギ記号・数字外」の数回を記入したもので
ある。
42. 層・屡露彗・履内
「度数順(層別)表」および「魍内順位:表」で扱っている「顧3というのは,新聞記事を,記 事単位:に「話題」によって区分したもの(丁層)で,つぎの12贋1からなっている。
1. 政治 2. 外交 3. 経済 4. 労働 5. 三会 6. 国際 7. 文化
8.地方 9. スポーツ 10.家庭・婦人 ll. 芸能・娯楽 12.広告・その他 「層」の区分のしかた,すなわち決め方が,記事単位であるので,下履の性格は,常識的に
「政治欄」とか「経済欄」とか呼んでいるものに,ほとんど一一致する。
上記の「層」ごとに集計した結果を示したのが,ヂ層兄曝 として揚げてある数値:である。した がって,「政治欄」とか「経済欄」とかに,長単位見鐵しが,どのように現われるかを,比較・
対照して示したものである。
つぎに,「層内順位表」における「層内」は,上記の!2種の「層」の中からある特定な層,た とえば「政治」とか「経済」とかをとりあげて,その層に現われた長単位見出しのみを旧かった ものである。したがって,ある層のみについての,長単位晃出しの現われ方を示すものである。
4.3. 順位・出窺率・累積比率
長単位関係の表のうち,「簡易五十音順表」は詑号と算用数宇をのぞく,すべての見嵐しにつ
いて,またF度数順(層別)表」は,度数7以上の見嵐し21,790につV・て作成してある。また「層 内順位表」は,度数7以上の児出しにつV・て,上位200の範囲内で掲鷲幾してある。これらの蓑で,全体順位として掲げてある順位は,一切の長三位見出しについての度数順の順
14 調i査の概要
位である。したがって,全体順位の場合には,句読点・小数点あるいは各種の記号・数一類にも 順位が与えられている(4.1.参照)
全体出現率は,各見出しの度数の,金体延べ数に対する千分比である。したがって,その見出
しが,長単位:全体の中において,どれだけの比率で出現したかを表わす数である。全体累積箆率は,最上位の見回しから,その見戯しまでの度数の総計が,金体延べ数に対し
て,どんな麹率になっているかを千分Lしで表わしたものである。したがって,長単位全体の中に おいて,最上位から,その見出しまでが,どれだけの比率を占めているかを表わす。ちなみに,「度数順(層別)表」にかかげた度数7・全体順位19308の見出しの累積比率は,849・ 644である。
このことは,今回集計した長単位の全体延べ数の約85%が,この表に収容されていることを示し ている。
つぎに,記号・数字外(記号・数字をのぞく)順位として掲げてある順位は,算用数字・句読 点・小数点あるいは各種記号類を除外した長単位見出しについての度数順位である。したがっ
て,「記号・数宇外順位」の場合には,これらの見嵐しには,順位が与えられていない。記号・数宇外出現率は,「記号・数字外」扱いの長単位の各度数の,延べ数に対する千分比であ る。したがって,その見出しが,「記号・数字外」扱いの長単位(すなわち算用数宇・句読点・小数 点・記号類などを除外したもの)の中において,どれだけの比率で出現したかを表わす数であるe.
表 長単位の延べ数と異なり数との関係
順 位
505000000000000000000257000000000000000000 123456789050505050 112233445
累 積 比 率
全体 %
344445555555566666777 627615492321903169989502491346789935789G12
記号・数字外%233344444455555666666 81350356890エ268124567 059821294788638081687
順 位:
00000000GOOOOOOOOOe80000000000000000000009505050505000000000Q37 566778899012345678991 111111111112
累 積 比 率
全体 %
6426475937662841!0GOO 345566778890112334445777777777778888888888
記号・数病田%68, 869. 8 70. 7 71. 2 72. 1 72. 5 73. 5 74. 1 74. 7 75. 3 75. 9 77. 3 78. 1 78. 1 78. 9 79. 9 79. 9 19. .?.56
81. 0
調査の概要 15 叫号・数字外累積比率は,記号・数字外扱いの見難しについて,最上位から,その見馨しまで の度数の合計を求め,それが「記号・数字外長単位」の延べ数に対し,どんな比率になるかを千 分毘で表わしたものである。したがって,記号・数字外扱いの長単位の総体の中において,最上
位からその見幽しまでが,どれだけの比率を占めているかを表わしている。「度数順(層男の表」に掲げた度数7・記号・数野外順位17069の見出しの累積比率は810. 250である。このことは,集
計した「記号・数字外扱いの長門位すなわち算用即断・句読点・小数点・記号類を除外したも
の」の延べ数の約81%が,この表に収容されていることを示している。なお,今園処理した長単位の延べ数は1,967,575,異なり数は213,368であるが,記号・数字外
の延べと異なりは,それぞれ1岨2948/192492であった。延べ数と異なり数の閥係は,表・図に
示す通りである。r層内順位表」における「層内度数」「層内順位」「層内出現率」「層内累積比率」は,それぞ れ,つぎのようなものである。
まず,心内度数は,4.2.に示した各鰹の中のある層に現われた長単位見出し(記号・数字をの ぞく)の度数であり,三内順位は,その見出しの度数順願位である。
層内出現率は,ある一つの層をとりあげて,その層に現われた長単位見出しの各々の出現率を,
塁 %1
10⑪縛
ノ P
1
50一 ノ
s
図長単位の述べ数と異り数との関係
4θ
14756Sl
(エ0鉛7エ1)
gs37ss
(706474)・
491894
(353237)
( ) 内は 記号・数字外 ユ0 2⑪ 30 40 .5D 6〔} 70 80 90 100 ユ三〇 ユ20 ユ30 ユ40 ユ50 ユ69 ユ70 ユ80 工90 290 2ユ⑪ 220
一異なり語 (単調0①
千分姥で示したものである。したカミって,その見潤しがその層の長単位の総体に対して,どれだ けの比率で現われるかを表わす。
層内累積比率は,ある一つ層をとりあげて,そこに現われた長単位見出し(記号・数字をのぞ
く)について,最上位からその見耀しまでの度数の合計を求め,それが,その層の長単位延べ数 に対して,どれだけの比率を占めるかを千分比で示したものである。したがって,最上位から,その見出しまでが,その癬の長単位の総体(記号・数宇をのぞく)に対して,どんな曲率になる
16 調査の概要
かを表わしている。V・ま「政治」層をとりあげてみると,層内度数44・層内願位195の見出しの
層内累積比率は524.867となってV・る。このことは,「政治」層の長単位延べ数(記号・数字をの ぞく)の約52.5%が,この表に収容されていることを示している。なお,各層の延べ数と異なり数は,つぎの通りである。
0 一 ウ繍
ま りり あコ る お マ むり を ユ し(異なり)
政治…………137427
外交…………22387
経済一………247875グナ{動・・・… 一・・一 9459
社会・・… 一一・一・・265129
国際・・の・・・・・・… 141202
文化一・…一144220 地方……・…・・37711 スポーツ……145524 家庭・婦人一・t69684 芸倉旨・娯楽… 2095工5
その他……537376
.... .一. 一・i・・ 92
(延べ)
23792 5921 25086 3197 454e4 23235 28642 10955 21504
!5086 36926 83016 不明・一…・
4,4. 見出しの配列
簡易五十音順長単位表の見出しの配列は,最初に「見出しの第一字目が,盤内漢字(漢テレに
双容されている漢宇)あるいは,かなで書き始められている見出し」が,簡易五十音順で並ぶ。これが,全部並び終ってから「第一字目が盤外漢字(漢テレに収容されていない漢字)で書き始 められている見出し」が並んでいる。これらが並び終わったあとに,「ローマ字」一→「特殊文 字(ギリシャ文字など)」一一→「算用数字」一→「盤内記号」一→「盤外記号」が順次,並んで いく方式である。
簡易五十音順というのは,見出しの第一字霞が漢字の見出しにかぎって,その漢宇の代表的な
おんヨミガナ(主として音)を使用した五十音順配列である。したがって,第一字目が漢字の見出し
は,普通の五十音順の位置に並んでいないので,その漢字のヨミガナ(代表音訓)によって検索
することになる。かな書きの見出しについては,普通の五十音順配列と,まったくかわりはな い。ただし,第一字罠がかな書きであっても二字昌以降に漢字が出て来た揚合には,その漢宇部 分については,電子計算機のコード(RCAコード)の順序で配列されてしまっている。
以上をまとめると,簡易五十音順の見出し配列は,つぎのようになる。
① 第1字目が盤内内宇あるいはカナの見等し(簡易五十音順)
② 第1字欝が盤外漢字の見出し(電子計算機のコードの順序一RCAコード順)
③ ローマ宇見崩し(アルファベット順)
④ 特殊文字(RCAコード順)
⑥ 算用数字(上昇順)
調査の概要 17
⑥盤内記号(RCAコード順)
⑦ 盤外記号(RCAコード1頼)
度数順(層別)長単位弱ならびに長単位層内順位表の見出しは,度数の高い見嵐しから低い見 回しへ,下降順に配列してある。ただし,同一度数の見出し相互間の配列は上記の「簡易五十音
順長単位表」の配列方式にしたがっている(以上 田中章央執筆)
5. 長単位舌内順位表の性格
「州内順位表」は,各層ごとに,それぞれの用語の標本出現頻度(断口度数),標本出現率(郭
内出現率)などを,各暦をまとめた全屑の出現率とあわせて示したものである。ここで扱ってい
る「層」は,新聞記事を記事単位に「話題」によって区分したもの「丁層」で.つぎの12層から なっている。1.政治 2.外交 3。経済 4,労働 5.社会 6. 国際 7.文化 8.地方 9・スポーツ 10.家庭・婦人 11.芸能・娯楽 12.その他
以上の12層について,各層ごとに標本出現頻度のたかいものから願に配列してある。各贋ごと の用語のリストは,上位200で打ちきってある。中には,標本嵐環頻度が少ないために,200位に
至らないところで打ちきった腰もある。この「層内順位表」では,調査対象となった全体から,句読点,記号,それに算用数宇ではじ
まる長単位を除いたものを扱っている。「全騒出現率」と「全層順位」は,上の12履をまとめた新聞金轡における用語の標本出現率で
あり,またその嵐現率のたかい順に配列したときの順位である。これらの表は,各腰別の用語表であると同時に,新聞金体と各腰との用語の現われ方の比較が
できるという性質をもっている。一般にある語について,履内出現率(Sのと金予冷環率(Ti)の関係で,園丁の特徴語を知る
ことができる。特徴語には,その鰯に特に現われやすい,正の特徴語(あるいは積極的特徴語)と,反対にその層には現われにくい,負の特徴語(消極的特徴語)とが考えられる。そういった
特徴語の判定が,この表から可能である。ただ,SiとT?1との大小関係が,そのまま,正負の 特徴を意味してはいない。層内出現率も全層出現率も標本によって得た数値であり,その標本の 値だけから特徴語の判定をするのは危険である。統計技法を援用して,より精密に特徴語を探し
出す必要があり,使用の際には,この点に注意されたい。実測値(標本度数)と理論度数*との関係で,この半捌をすることは,この一方法である。こ れについては,r電子計算機による国語研究9』の「層別特徴語の判別」(木村繁)を参照された
い。
‡ 理論度数=全体度数×配分係数
配分係数:その麟の延べ語数と全延べ語数との比
18 調査の概要
なお,便宜的な方法としては,特徴語を求めるのに,層内順位と全層順位とを比較することも できる。たとえば,「政治」層で〈首相〉は52位であるが,全屡では526位であり,この属の正の 特徴語だと考えることができる。こういつた使い方も一往可能である。
(以上執筆 村木新次郎)
19
度数順(層別)長単位表
金体……すべての長単位についての数値。
記号・数字外……記号と算用数宇ではじまる長単位を除外したときの数値。
岡一度数の見出し根互間の配列順位は簡易五十音順。
見出しの中で◎印を頭にもつ文字・数字は符号化されている文宇・数字を表わす。
例1「◎N」「◎15」「◎天」「◎解説」
ただし「◎M」は漢テレタイプに収容されていない記号語を一一一2 Sして表わすe
比率の数値は千分比である。
金 順位
12345 6789101112!3141516171819202122232425262728293031323334353637383940皿42434445
」当事Σ季宝 42. 578 40. 725 22. 880 21. 672 2玉.040 20. 280 19.e41 18. 916 15. 888 14. 409 14. 169 12. 322 12. 256 11. 3Q2 10. 780 10. 6e8 8. 573 7. 143 7. 140 5. 315 4. 330 3. 990 3. 593 3. 394 3. 262 3.14圭 3. e70 3.0重7 2. 9e4 2. 480 2. 161 2. e68 ]. 936 正.9玉9 工.873 1. 764 1. 712 1. 671 1. 579 1. rJ3ro 1. vF 30 1. 507 1.460 1. 418 1. 395
体 累積比率 rt,2. 578 83. 3e3 106. ]83 127. 855 148. 895 169. 175 188. 2i6 207. 132 223. 020 237. 429 251.598 263. 920 276. 176 287. 4ri 8 298. 258 3e8. 866 317. 439 S24. 582 331. 722 337. 037 341. e・67 345. 357 348. 950 352. 344 3Jr5. 606 358. 747 361. 817 36tl. 834 367. 738 370. 218 372. 379 374. 447 376. 383 378. 302 380. 175 38 1. 939 383. 651 385. 322 3B6. 901 388. 436
■O
/Q Qノ
Q〜OO
らO
3749
りO つり
39293 159︾493 647593
見幽し M
︐の@●をに︹︺はがてと で
るらる というの N
た0﹂r1いもかあし〃こ2ないこ3い◎
0はののは3でもそに 他まキ
4全 体 総度数 83776 80130 45019 s12641 41398 39902 37465 37218 31261 28351 27878 24244 24114 22237 21210 20872 16868 14055 140t18 10457 8519 7850 7064 6678 6419 6180 6040 5937 5714 4880 4252 4068 3・809 3776 3685 .3470 3369 3288 3106 3021 30隻0 2966 2873 2790 2745 政治 9528 8050 388 4086 5/90 4835 1i48 1143 3zir78 3051 3071 2739 166 290 2376 2e47 26 912 914 27 1e67 708 7五〇 989 913 769 958 20 762 ro73 or72 24 289 15 70r 14 420 442 337 361 181 63 34 121 10
外交 1490 1297 80 648 830 768 14e ユ38 614 466 486 487 24 75 398 336 137 136 20 179 127 99 i44 147 三〇2 160 エ6 圭09 73 93 ヒ46﹇20
209i86804 6!046 41
∠マ
経済
7ま482
6754!Q
∩∠4︻∠136﹂弓832 三
2439 2371 2334 2401 2175 1849 1573 19194 4834 1200 1176 5708 324 3亙3 618e 688 582 382 525 383 315 4i9 3175 380 285 274 1706 176 23 425 206 232 234 158 214 129 7 24 196 1082兄【} 労働
Q/5274
172胃ーワ﹁
75
2つ︾ 328 :i・8 77 244 170 214 190 三8 21 157 128 4 62 62 三2035686139727363766圭0914
9555635 424 1 22玉21 三
度
二会 17993 14831 ]OS3 8761 8376 8237 2747 2738 6110 6297 6104 4741 342 542 4725 5491 56 1842 1849 85 1810 1641 1732 1114 1292 1382 1ego 69 t175 1062 867 54 1201 i87 5 821 rJs3 497 656 209 Jr3 170 435 46
⁝釜﹂ 8689 8843 734 4175 5208 5008 1e44 1042 4128 3193 3eo7 3110 129 221 2398 26玉2 14 821 817 21 1429 651 6e6 977 751 771 339 エ1 692 539 598 7 367 1 19
77圭815Q74
76640512
つ︶43つσ2 4数
文化 9106 800正 733 roo47 3992 4138 1764 玉746 3258 3186 3353 2747 197 495 2230 2092 38 i406 1383 25 1093 876 685 1134 7sro 588 870 49 830 830 480 30 415 28 89 33 403 507 527 394 39 72 i23 159 11
地方 2342 1968 383 三180 1e29 955 823 808 747 715 699 0r21 135 112 524 576 5 270 267 i1 214 193 242 86 146 247 1e4 15 123 106 116 13 108 ま 28 2 123 7e 58 82 Q/3︻07η
3147
分
ポツ
ス一 5905 4469 2821 3606 2796 2458 4646 4639 2594 2352 1759 1773 982 722 1782 2048 9579 337 333 3291 375 607 535 308 346 324 230 1735 347 221 29王 1267 262 王 207 37 240 108 圭50 183 148 12 32 395 1120 侮
臼〆
婦人 家庭 4737 30ri5 292 2796 2226 2e96 506 510 1639 1627 2027 1377 105 24e 999 800 334 340 3 480 554 355 320 481 326 406 8 368 B95 161 20 215 64 2 201 278 198 19・5 xr4 20 3・98 91 4
芸能 娯楽 730rs 8151 8063 3315 3033 2617 3677 3651 2002 1984 2029 2148 184 1819 1549 1342 工356 6413 6453 17G 6e8 496 713 :83 409 617 304 136 292 435 338 k17 207 3653 工20 2814 225 210 267 143 17 1800 56 186 85・
その他 i1i 3280i 2838 2638 : 玉2866 2872、ll矧 iggg81 g?i?1 ,ggi? 1ij
I聯
31351 2223 82 1197 1i81 623 484 1365 957 643 700 701 504 7e2 593 332 415 812 5061 51 2445 354§器 1圏lig−sgr liii
蟹
372 il
記号数字をのぞく 順位 1 2 9﹂ 45 ハ07 8 9
01234 11111
15 ρり7
11
18 19O123 456
ワ臼ウ甜22 222珪i現率 56. 711 29. 299 28. 240 22. 125 20. C65 19. 730 17. 158 15. 011 14. 772 6. 029 5. 556 5. 003 4. 726 4. 543 4. 275 4. 044 3. 454 3. 009 2. 696 2. 384 2. 327 2. 198 2. 138 2. 130 2. 099 2. 03a
累積比率 56. 711 86. elO 工14.250 136. 375 156. 440 176.三70 193. 328 208. 339 223.玉11 229. 140 234. 696 239. 699 244. 425 248. 968 253. 243 257. 287 260. 741 263. 760 266. 446 268. 830 271. 157 273. 355 276. 493 277. 623 279. 722 281.755
藪︵趨濠︶獣菰 昏。