HlllJHllH]HHHHl]HllHIHHHHHlHJHLHHIllHllJHIH‖lHllHLIHlHHHJHlHllllJHlllllllllHIHHI日日lHHHIHHHIHlHHIHt‖lHIHHIHHlllHIllllHHlHll日日lHHllII
Lj I,B 套 J
言語学 におけるコーパスの位置づけ
‑ コーパス言語学の現状 と今後の展開‑
今 回の講演では、現代 の言語学 において重要な 役割を持つ 「コーパス」 (大規模な言語データベー ス) をめ ぐって、言語学 におけるコーパスの位置 づげや、 コ‑パスを使 った分析 の具体例 などが紹 介 された。講師には、現在 コーパスの構築作業 に 携わ っている、国立国語研究所 の丸 山岳彦氏 をお 招 きした。講演の主なテーマは、(1)「言語学 にお けるコーパスの位置づけ」
、( 2 )「『
日本語話 し言葉 コーパス』 の紹介」、( 3 )「 KOTONOHAプロジェ
ク トの概要」であった。「コーパス」 とは、言語研究 に用 いることを目 的 として編纂 された、大規模 な言語データベース のことである。 「コ‑パスに基 づ く言語研究」 と いう考 え方 自体 には、すでに50年以上の歴史があ るが、特 に1
990
年代半ば以降は、コンピュータの 高性能化 と爆発的な普及 を契機 として、大量 の言 語データか ら一定 の傾向や規則性 を見 出そ うとす る研究が盛 んに行 われ るよ うにな った。 「コーパ ス言語学」 と呼ばれ るこの研究分野は、 コーパス が早期 に整備 されたイギ リスによって主導 されて きた。 日本ではコーパスの整備 が遅れたことから、日本語 を対象 としたコーパス言語学は完全 に立 ち 遅れている状況 にある。講演 では、 まず、20世紀 における言語学の動向と、 その中でのコーパスの 位置づけについて、概説が行われた。
次 に、国立国語研究所が2004年に公開 した 『日 本語話 し言葉 コーパス』 が紹介 された。 これは、
661
時間 もの自発的な話 し言葉 を録音 し、 テキス ト (文字)に書き起 こした上で、品詞情報など様 々富 谷 玲 子
な研究用情報 を付与 したものである。講演では、
『日本語話 し言葉 コーパス』 を用 いた音声現象の分 析例や、話 し言葉 の構造 をどのように記述 ・解明 していけばよいかなどについて、 「ら抜き言葉」 の 使用実態
、「
〜ですね」 の使用実態に関す る分析な ど、具体的で興味深 い研究成果の紹介があった。最後 に、現在 国立 国語研究所 が進 めている
「 K OTONOHAプロジェク ト」 についての概説があっ
た。 この研究計画 は、現代 日本語 の書 き言葉 をバ ランスよ く集めた 「均衡 コーパス」 を作 るという、日本では初めての試みである。研究期間は2006年 か ら
5
年間で、 コーパスの規模 は1億語 を目指す と いう。実際にコーパス構築 に関わ っている現役 の研究 者 を招碑す ることによ り、 コーパスがどうい うも のか、 どのように構築 し、 どのように使 うのか、
などといった具体的な情報が豊富 に示 され、今後 のコーパス研究への期待 を高 ま らせ る講演 とな っ た。当 日は学生 ・教員合わせて約50名 もの出席が あった。特 に学生にとっては未知 の新領域 に関す る高度 な内容であったが、具体 的で興味深 い研究 成果が次 々と紹介 されたため、最後 まで熱心 に聞 き入 っていた。講演終 了後 も内容 の濃 い質疑応答 が続 き、盛況 な講演会 とな った。講師の丸 山氏は 本学の卒業生である。 この講演会 では研究者 とし て第一線で活躍 中の先輩 か ら、研究 の最前線 につ いて直接お話聞 くことができたが、 これは言語 に 関心 を持 つ学生 にとって非常 に大 きな刺激 にな っ たものと思われ る。
lLHHIIHIHIHHlMLHHIHlllllHIHHIlHHHlHHHHlHHHlHHHIIHLHHLIHIMlmHIH]HIHHHIIMHllHlllHHlIHHHIIMLllHHJHHHHHIMHLHHHMLIHIHLHHlHlm