*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・*・* 言語研究センター共同研究
学習者 コーパスを活用 した上級 日本語教育の教材開発
富谷 玲子 ・高木南欧子
2004
年に公開された 『日本語話 し言葉 コーパス』(国立 国語研究所 ・情報通信研究機構 ・東京工業 大学)
、201
1年 に完成 した 『現代 日本語書 き言葉 均衡 コーパス』 (特定領域研究 「日本語 コーパス」 )
に代表 され るように、近年、現代 日本語のコーパ スの開発 と公開がすすめられている。 日本語教育 においてもコーパスの存在 は広 く知 られ るように な り、 さまざまな研究 グループによって開発、公 開がなされ、研究に利用 され始めている。 日本語 教育では、 これ らの基礎資料 を統語構造の分析へ の応用や、教材評価、 コースデザインの開発など 多岐に渡 る応用がなされ るようになったと同時に、比較参照す るための学習者 コーパスの必要性 も求 め られ るようになった。学習者 コーパスとは、第
2
言語学習者 の作文や発話データを大量 に収集、分析 に必要 となる情報 を付加 し、検索が可能な形 に電子化 したものを指す。対照言語研究や誤用分 析、教室活動の分析 などか ら得 る知見 を教室活動 に還元す る際、学習者 コーパスを参照す ることに よ り数量的な分析が可能 になる一方、従来 とは異 なった知見を得 られ る可能性 もある。本研究では、
学部留学生 に対す る日本語教育への還元、初年度 教育 としての日本人学生 に対す る日本語教育への 還元 を可能 にす る基盤構築 を目的 としている。現 在、一般 に公開 されている日本語の学習者 コーパ スは 「日本語学習者 による日本語作文 と,その母 語訳 との対訳データベース (作文対訳
DB)
オンラ イン版」 (国立国語研究所)、 「 KY
コーパス」 ( OPI
テープを文字化 した言語資料) などがあ り、進行 中のプロジェク トなども多 々見受け られ る。 これ らの学習者 コーパスを構築 とい う点でみた場合 に共通 してみ られ る問題点は、学習者 の母語や学習 歴などがさまざまである上 に、書 き起 こされたテ キス トや発話データに肘す るタグの付与 に非常に 時間がかかること、 また、言語運用場面や 目的が 多岐に渡 ることである。 しか し一方で、細かい分 類 と膨大な基礎データの支 えがなければ、期待す る抽 出結果 も得 られに くくな り、 コーパスとして の有用性が低下す る。解決策 の一つとして、抽出 結果を上記にあげた 『現代 日本語書き言葉均衡 コー パス』 とつなげ、参照 を可能 にし、付与 され る情 報 の客観性、信頼性 を向上 させ る試みや、特定分 野 の専門辞書 を組み込むことによって精度 を向上 させ る、辞書 の更新 ・増設 を可能 にす るシステム を採用す るな どの試みがみ られ る。 これ らの試み は、学習者 コ‑パスの設計 には非常に参考 になる と思われ る。
llllHlllllHHHHHllLHlJIHHHllHHlH日lHHIHl]HIHIIHHHHIHHIHLHHIHHHIHHHIlHlHllIHHlllHHlHIHHlHHIllH日日lHHIHHLIHHHHM HHHHHHIllHHllHHHll