5.9 日本語話し言葉コーパス(CSJ)による調査
5.9.4 模擬講演で見られた頭字語
模擬講演で見られた二文字から六文字の頭字語の数を以下の表15にまとめた。
表15 模擬講演に見られた頭字語の数(文字数別)
二文字 三文字 四文字 五文字 六文字 延べ語数 1080 643 83 34 12 異なり語数 102 122 18 11 1
七文字及びそれ以上の言葉に関しては、頭字語ではなく、英語であると判断されるため、
除外することにした。
模擬講演で見られた二文字の頭字語の延べ語数は1080個あり、異なり語数は102個であ
8 『日本語話し言葉コーパス』(Corpus of Spontaneous Japanese)は、現代日本語の自発 音声を種々の研究用付加情報とともに大量に格納したデータベースであり、語数にして約 750 万語、時間にして 660 時間の音声が含まれている。
34
る。表15-1は頻度の高い順に30語を挙げたものである。この30語が全体の約81%を占 めている。
表15-1 二文字による頭字語のベスト30
順位 頭字語 頻度(パーセンテージ)
1 CD 157(14.5%)
2 JR 138(12.8%)
3 CM 129(11.9%)
4 IT 102(9.4%)
5 OB 52(4.8%)
6 OL
43(4.0%)
OS
8 DJ 41(3.8%)
9 PR 23(2.1%)
10 FM
22(2.0%)
PC
12 ER 16(1.5%)
13 DK 15(1.4%)
14 IC 13(1.2%)
15 CG
11(1.0%)
MD 17 NG
10(0.9%)
SF 19 ET
9(0.8%)
OA 21 BS
8(0.7%)
AI
23
MC 7(0.6%)
EU
6(0.6%)
GM IP
27
CR
5(0.5%)
SL PL CS
合計 937(86.8%)
35
表15-1を見ると、模擬講演では、生活に関する話題が多く、主に身近な話についての 内容であるため、「CD」「JR」「CM」が上位3位に入る。これらの使用頻度は424回で、二文 字の頭字語の延べ語数の39.2%を占めている。
模擬講演で見られた三文字の頭字語の延べ語数は643個あり、異なり語数は122個であ る。表15-2は頻度の高い上位30語を挙げたものである。この30語の頭字語の使用頻度は 456回で、三文字の頭字語の延べ語数の70.9%を占めている。
表15-2 三文字による頭字語のベスト30 順位 頭字語 頻度(パーセンテージ)
1 NHK 69(10.7%)
2 DNA 31(4.8%)
3 PHS 29(4.5%)
4 NTT 28(4.4%)
5 CPU 26(4.0%)
6 NPO 25(3.9%)
7 NGO
18(2.8%)
PTA 9 BGM
17(2.6%)
IBM
11 EPA 16(2.5%)
12 NEC 14(2.2%)
13 ESS
13(2.0%)
UF0
15 ICU 11(1.7%)
16 LDK 10(1.6%)
17
FRP
9(1.4%)
JAL WHO
20
ATM
8(1.2%)
DOS FBI 23 SAT
7(1.1%)
SOS GDP NHL
36 25 PKF
6(0.9%)
SPM VHS YTC
合計 456(70.9%)
表15-2を見ると、「NHK」という頭字語が一番多く使われ、三文字の頭字語の延べ語数 全体の10%を超えていることが分かった。それ以外の頭字語はすべて5%以下である。ま た、模擬講演は主に生活に関するものだが、「NPO」「NGO」「WHO」などのような政治に関す る頭字語も多く使用されていることが分かった。
模擬講演で見られた四文字の頭字語の延べ語数は83個あり、異なり語数は18個である。
表15-3はそのすべての頭字語を表している。
表15-3 四文字による頭字語 順位 頭字語 頻度(パーセンテージ)
1 AIDS 19(22.9%)
2 HTML 13(15.7%)
3 ISDN
8(9.6%)
YMCA 5 BIOS
5(6.0%)
FIFA 7 MIMD
4(4.8%)
NATO
9 GATT 3(3.6%)
10
HUGO
2(2.4%)
JICA ULSI VLSI YWCA
15
ADSL
1(1.2%)
AIFF MOMA USOC
合計 83(100%)
表15-3を見てみると、「AIDS」が一番多く使われ、全体の約23%を占めている。二番目 は「HTML」で、15.7%を占めている。四文字では、「NATO」「GATT」のような国際関係につ
37
いての頭字語が多く、「YMCA」「YWCA」のように宗教に関する頭字語もある。
模擬講演で見られた五文字の頭字語の延べ語数は34語あり、異なり語数は11語である。
表15-4はそのすべての頭字語を表している。
表15-4 五文字による頭字語 順位 頭字語 頻度(パーセンテージ)
1 BASIC 12(35.3%)
2 TOEFL
5(14.7%)
HACCP
4 TOEIC 4(11.8%)
5 TOPIX 2(5.9%)
6
USRSA
1(2.9%)
COBOL ENIAC ASEAN TESOL NAFTA
合計 34(100%)
表 15-4を見てみると、「BASIC」が一番多く使われ、約全体の35%を占めていることが 分かった。「BASIC」は、「Beginner's All-Purpose Symbolic Instruction Code」の頭字語 で、プログラミング言語の一である。他に、英語能力に関する能力試験である「TOEFL」や
「TOEIC」も使われている。
模擬講演で見られた六文字の頭字語は「UNESCO」しかなく、頻度は12回である。