第三章 やさしい日本語ニュースの高頻度語彙
1. 高頻度語彙
1.2. 上位 300 語(カバー率 63% )
構成(第二章1節図10「語彙の構成(品詞)」)に近いが、加えて、延べ語数では3級語彙 の構成(第二章3.1. 図31「3,4 級語彙の構成(品詞、延べ語数)」)に、異なり語数では2級 語彙の異なり語数の構成(第二章3.2. 図36「2 級語彙の構成(品詞)」)にも近い。
本節1-2項で分析した上位100語・300語の品詞の構成は延べ語数ではそれぞれ4級語彙・3 級語彙、異なり語数ではそれぞれ3級語彙・4級語彙のものに近かった。上位600語ではそれ に対し、異なり語数では2級語彙の構成に近いことから、高頻度語彙の範囲を広げると品詞 の構成の上では次第に難易度の低い語彙の構成ではなくなっていくとわかった。しかし延べ 語数では依然として難易度の低い3級語彙の構成に近いことから、難易度の低い高頻度語の ほうが難易度の高い高頻度語よりも高い頻度で用いられる語が多いことがわかる。
語種では、和語の異なり語数が50% 程度で、上位100語・上位300語よりも割合が低いこ とから、上位100語・300語・600語と高頻度語彙を取り出した場合、上位600語の中でも高 い頻度で使われる上位100語や上位300語などの語彙群の中に和語が多く含まれていることが わかる。ただし、和語は上位600語でも延べ語数でみれば半数以上あり、和語の使用率は全
語種の約60% にあたる。また、漢語と混種語の比率は上位300語と比べて大きな違いはみら
れなかったが、外来語は上位100語・上位300語と比べ、異なり語数・延べ語数ともに1.5倍 程度使用率が高かった。こうしたことから、外来語は和語とは反対に上位600語の高頻度語 彙の中では比較的頻度が低い上位300語以降の語彙が多いと言える。
第二章の語彙特徴でみたやさしい日本語ニュースと一般ニュースの語種の構成と比較する と、延べ語数では「2. 語種別の特徴」冒頭の図17「語彙の構成(語種)」に示したやさしい 日本語ニュースのすべての語彙の語種の構成とほぼ同じであり、異なり語数も難易度別の語 種構成よりもやさしい日本語ニュースのすべての語種の構成に近い。こうした語種の構成に ついて、本節1-2項で述べた上位100語・300語の延べ語数はそれぞれ4級の語種構成・3-4級 の語種構成に、異なり語数はそれぞれ 4級の語種構成・3級の語種構成に近かった。そのため、
語種の構成においても品詞の構成と同様に対象とする高頻度語彙の語数を増やすことで、難 易度の低い語彙の構成から難易度の高い語種の構成、あるいはやさしい日本語ニュース全体 の語彙の構成に近づくと言える。
難易度に関して3級語彙と2級語彙の割合は上位100語・300語・600語でほとんど違いが
ない(図42、図43、図45)。4級語彙は上位100語・300語・600語と大きな語彙の括りでみ
るほど割合が低く、延べ語数が異なり語数を大きな差で上回ることから、4級の語彙は極めて 高い頻度で使用される上位100語内の語彙が多いということがわかった。反対に、1級と級外 の語彙は上位100語・300語・600語と語の数を増やすほど特に異なり語数で全体に占める割
合が高くなる。そのため、1級と級外で高い頻度で用いられている語彙は上位600語の中でも 頻度の高い上位100語の語彙よりはそれほど頻度が高くない語彙に含まれるものが多いこと がわかった。また、上位600語の難易度の構成を図29「語彙の構成(難易度)」と比較する と依然として高頻度語彙では難易度の低い語彙が高い割合を示していた。次に、上位600
(675) 語の品詞と語種別の内訳を表58に示す。
表 58 やさしい日本語ニュース高頻度語彙上位 600 語の品詞・語種の分類
種類 語彙 語数
名 詞
和語
人、ため、今、子ども、国、前、ことし、水、海、あと、家、とき、車、間、お金、近く、山、土、雨、
3つ、町、多く、場合、川、店、割合、夏、みんな、道、◇広島、体、上、数、島、ほか、建物、
周り、外、まま、津波、朝、何、ウナギ、日、側、どこ、魚、戦い、夜、名前、1 つ、◇山梨、部屋、
月、声、石、西、食べ物、年寄り、おととし、ところ、◇静岡、◇大阪、隣、蓮、お祭り、夏休み、
熊、砂、次、親、壁、もの、これ、誰、米、話、花、橋、穴、子、畑、力、品物、考え、◇花子、
秋、昔、目、空、色、つかみ取り、あゆ、◇坂本、◇長野、◇栃木、マンボウ、東、沖、下、形、
手、男、氷、クロマグロ、男の子、村、山車、田んぼ、踊り、うそ、つぼ、5つ、疑い、どちら、
◇おすたか、◇岩手、◇品川
118
462 漢語
県、◇日本、市、会社、◇東京、万、飛行機、去年、女性、世界、◇中国、事故、円、政府、
駅、時間、計画、都、客、外国、情報、可能性、予定、被害、警察、物質、家族、男性、7月、
8月、番、全部、会、大統領、問題、研究、億、国際、6月、一緒、首相、選手、線、病気、
今月、病院、区、実験、種類、先生、列車、回、結果、絵、工事、◇東京電力、発電、旅行、
安全、がん、◇富士山、電気、軍、いちばん、日本人、専門家、分、調査、◇韓国、午前、
原因、9月、年、◇厚生労働省、けが、来年、会場、地下、放射性、3月、相談、心配、関係、
家庭、原発、地震、気、会議、戦争、必要、空港、写真、大会、文化、外国人、4月、
携帯電話、生活、訓練、監督、熱中症、一部、将来、先月、度、号、地域、地方、爆弾、
◇京都、役所、機械、原爆、観光、式、危険、◇全日空、◇理化学研究所、◇北海道、
電話、午後、宇宙、映画、英語、気温、決勝、災害、収支、台風、文字、平均、◇日本航空、
海岸、学校、基準、恐竜、細胞、人気、国内、日本語、容疑、土石流、10月、最近、経験、
本、量、◇環境省、◇新宿、熱、科学、学生、金額、航空、高校、最初、自分、車両、医者、
鍾乳洞、放射線、半分、治療、展示、汚染、空爆、語、運転、発表、ほう、町、◇春秋航空、
◇国連、◇群馬、年度、食事、制裁、別、案、世界遺産、点、教育、台、温泉、温度、規則、
事件、症状、線路、大学生、知事、中心、直径、羽毛、賃金、理由、選挙、展覧、活動、
記録、5月、意見、輸出、◇警視庁、自衛隊、◇総務省、服、消費税、通信教育、
都道府県、警察官、原子力、校舎、最後、最低、材料、遺体、銀行、時速、収入、宗教、
小学校、少年、消防、大学、頂上、動物、法律、麻薬、漫画、無人、野菜、土砂、音楽、兆、
州、対策、介護、虐待、授業、検査、1月、連絡、不正
244
外来語
%、◇アメリカ、◇ロシア、m、グループ、km、◇イスラエル、◇ドイツ、インターネット、オリンピック、
ワールドカップ、バス、◇フランス、アニメ、◇パレスチナ、チーム、◇ウクライナ、システム、cm、
◇ハマス、◇ブラジル、ウェブサイト、イベント、ビル、◇香港、ダイヤモンド、サッカー、マウス、
たばこ、デモ、パラリンピック、ビデオ、◇WHO、◇インドネシア、℃、サイト、デパート、ニュース、
ロボット、◇スカイマーク、アルゼンチン、t、ATM、コンサート、ゴール、チーズ、テレビ、バター、
パスワード、マラソン、◇マクドナルド、◇サルコジ、◇シエラレオネ、◇オランダ、◇シベリア、
ウオータースライダー、エルニーニョ、ヘリコプター、スマートフォン、アート、エリート、ストーカー、
ガソリン、メッセージ、◇エルドアン、◇メルケル、◇ジョコ、◇アフリカ、◇ギニア、◇スペイン、
◇ネパール、◇ミャンマー、◇リベリア、◇MRJ
74
混種語
場所、エボラ出血熱、値段、仕事、大勢、◇福島、◇成田空港、◇羽田空港、危険ドラッグ、
◇ガザ地区、◇神奈川、試合、毎年、◇小保方、行方不明、脱法ドラッグ、半年、赤字、
◇宮城、◇STAP細胞、◇イスラム教、◇福島第一原子力発電所、◇東日本大震災、
荷物、デング熱、気持ち
26
動 詞 和語
◆いる、する、なる、ある、できる、言う、作る、考える、話す、出る、増える、使う、来る、亡くなる、
いる、行う、調べる、よる(因)、入る、出す、見る、分かる、取る、◆くる、始める、◆いく、思う、
始まる、住む、続く、続ける、落ちる、終わる、乗る、上がる、開く(ひら)、吸う、売る、行く、降る、
登る、飛ぶ、やめる、◆もらう、見つかる、決める、走る、書く、壊れる、起きる、買う、知る、
つける(付)、持つ、集める、置く、流れる、運ぶ、受ける、上げる、食べる、伝える、さがす、
◆くださる、見える、見つける、入れる、聞く、踊る、撃つ、決まる、増やす、流す、教える、守る、
139 154
種類 語彙 語数
動 詞
和語
集まる、生まれる、着る、落とす、逃げる、送る、もらう、帰る、働く、売れる、変える、楽しむ、
かかる、つく、◆なる、選ぶ、払う、歩く、崩れる、減る、祈る、建てる、見せる、広がる、助ける、
進む、足りる、動く、変わる、離れる、過ぎる、うつる、呼ぶ、残る、通る、遊ぶ、捕まえる、戻る、
育てる、会う、回る、確かめる、喜ぶ、向かう、手伝う、かける(掛)、たまる、片付ける、話し合う、
◆しまう、◆おく、泳ぐ、休む、急ぐ、止める(と)、似る、勝つ、待つ、直す、読む、比べる、止まる、
乗せる、なくす(無)
混種語 発表する、利用する、参加する、輸出する、協力する、紹介する、運転する、出席する、
研究する、相談する、招待する、避難する、出発する、連絡する、説明する 15 形
容 詞
和語 高い、新しい、多い、少ない、大きい、同じ、いろいろ、よい、ない、早い、長い、低い、強い、悪い、
暑い、安い、近い、若い、短い、小さい、詳しい、涼しい、いい、ひどい、速い、貧しい、怖い 27
漢語 必要、元気、有名、大切、安全、危険、急、きれい 8 36
混種語 すばらしい 1
副 詞
和語 初めて、これから、とても、どう、もっと、最も、いつも、すぐ、まだ、また、しっかり、少し 12 16
漢語 約、たくさん、いちばん 3
混種語 特に 1
連体詞 和語 この、大きな、その、どの 4 4
接続詞 和語 そして、しかし、また 3 3
(枠内左上から頻度順、グレーは上位 300 語。◇:固有名詞、◆:補助動詞)
表58に示したとおり、上位600語の語彙で特に多い分類は4種類あり、多い順に、名詞の 漢語の244語、動詞の和語の139語、名詞の和語の118語、名詞の外来語の74語である。比 較的数が少ない50語以下の分類には、形容詞の和語の27語、名詞の混種語の26語、動詞の 混種語の15語、副詞の和語の12語、形容詞の漢語の8語、連体詞の和語の4語、副詞の漢語 と接続詞の和語の3語、形容詞と副詞の混種語の1語がある。なお、連体詞と接続詞について は高頻度上位600語のうち、上位100語以降の語はなく、感動詞は上位600語に含まれる語は なかった。以下、品詞・語種による分類で多くの語を含むものから順に該当する語彙につい て述べる。
最も多いのは名詞の漢語であり、上位301-600語では143語、上位600語全体では244語が が該当する。なお、上位100語で最も多かった分類は動詞の和語だが、上位600語では名詞の 漢語より100語以上少なく、名詞の漢語は動詞の和語の約1.8倍の語が上位600語に含まれて いた。また、この分類で特に目を引くのは二字漢語の多さである。「3月」「けが」など漢 字2字での表記が可能でありながら別の表記であるものを除外しても、244語中167語、70%
弱の語が二字漢語である。こうした漢字2字で表記される語の中には漢字1字の意味を知って いれば「羽毛」「列車」のように、何を意味する語であるのか類推できる語もある。しかし、
「細胞」「事故」のように二つの漢字に分解しても意味の解釈が困難な語も少なくない。な お、この分類には19語の固有名詞があり、上位300語以降の語には「環境省」「警視庁」
「総務省」といった役所名を含む組織の名称も含まれていた。
上位301-600語に位置した名詞の漢語について、上位100語・300語の語と同様に1語からの
ニュース内容の類推のしやすさについて考えれば、「爆弾」「宇宙」「台風」「制裁」「温 泉」「消費税」「麻薬」「虐待」など、使用されるニュースの範囲がある程度限られると思