第一章 コーパス言語学
1.4. 学習者コーパスとプロジェクト
1.4.6. フランス語学習者話し言葉コーパスプロジェクト
英語学習者話し言葉コーパスに関するプロジェクトは、1990 年代から始まっている。
たとえば、ベルギーのルーバンカトリック大学の
Sylvianne Granger
が中心となって開 発が進められたLouvain International Database of Spoken English Interlanguage
( LINDSEI )コーパスは、1995
年から構築が始まっており、学習者話し言葉コーパスの草分け的存在であると言える。これは、世界中の大学との共同プロジェクトであり、日本語 を含む
20
言語の学習者によるサブコーパスが存在する21。また、日本人英語学習者の話 し言葉コーパスに特化したものでは、NICT JLE
コーパスがある。これは、独立行政法 人・情報通信研究機構が主体となって作成したものであり、一対一の対面式インタビュー テストであるStandard Speaking Test (SST)
の受験者1281
名のデータが収録されてい る。このコーパスは約200
万語の規模で、SST の評価結果が付加された能力別サブコー パスから構成されている(和泉他 2004)。また、日本語学習者話し言葉コーパスも構築が進められている。上村隆一氏は
1991
年 より日本語会話コーパスプロジェクトを始めた。このコーパスでは、ACTFL(AmericanCouncil on The Teaching of Foreign Languages)の OPI(Oral Proficiency Interview)に
準拠したインタビュー形式に則って学習者の言語データが収集されている。学習者は主に アメリカ人と韓国人である。また、「KY コーパス」は、鎌田修氏と山内博之氏が中心と なって構築したコーパスであり、90 名分のACTFL
のOPI
の試験テープを文字化したも のである。学習者の母語は、中国語、英語、韓国語で、それぞれ30
名ずつ抽出され、母 語ごとに初級5
名、中級10
名、上級10
名、超級5
名で構成されている22。上記のコーパス以外にも、英語やフランス語の話し言葉コーパスは現在までに数多く構 築されている。フランス語学習者コーパスについても、構築が進められている。ここでは、
主なフランス語学習者による話し言葉コーパスプロジェクトを概観する。
1.4.6.1.
French Learner Language Oral Corpora
Southampton
大学の研究チームはFrench Learner Language Oral Corpora (FLLOC)
という電子データベースを構築している。ここに含まれるデータは、イギリス教育システ ムの9
年生から13
年生、すなわち13
歳から18
歳までのフランス語学習者に関する横断 的研究データで、異なる習熟度レベルを代表するフランス語学習者の中間言語コーパスで ある。このコーパス構築の目的は、第二言語としてのフランス語の全レベルの代表させる ことである。参加者は9
年生までで既に150
時間のフランス語教育を受け、13年生まで の学習時間はおおよそ600
時間に達する。タスクは、学習者とリサーチチームの研究員 による一対一のセミガイド式インタビューで、全てフランス語で行われた。タスクは二部 構成となっており、前半は若者たちが様々なアクティビティをしている2
枚の写真を見 て、学習者が写真についてできるだけ多くの情報を挙げていく形式のものである。後半は、21
http://www.uclouvain.be/en-cecl-lindsei.html
を参照22
http://opi.jp/shiryo/ky_corp.html
研究員が学習者に最近興味があること、家族について、そして上級者には過去のバカンス について、また将来についての展望について訊ねた。なお、このコーパスデータは研究機 関向けに公開されている23。コーパスはデジタルオーディオファイル、CHILDES によっ てフォーマット化された転写、そして品詞タグが付与されたファイルから成っている。全 転写とオーディオファイルはダウンロードすることができる。これらのデータに基づき、
これまでに形態統語的、語彙的な発達側面や、決まり文句の使用、モノローグとダイアロ ーグの談話の発達側面など、様々な問題について分析が行われている (David 2008, Rule
2004)。
1.4.6.2.
Progression in Foreign Language Learning
Progression in Foreign Language Research Project
は、1993年から1996
年までの3 年にわたってイギリスの2
つの中等教育機関で行われていたプロジェクトである。フラ ンス語学習者60
名について、初年度である7
年生から3
年目である9
年生までの3
年に わたって長期的研究を行った。学習者は3
年間のあいだ、6つの口頭産出タスクを行った。学習者同士でペアになって行うタスクもあれば、研究者と行うタスクもある。学習者の発 達がより明確になるよう、いくつかのタスクは時期をずらして同じものが複数回行われた。
このプロジェクトデータはアナログ録音で計
200
時間、プレーンテクストで650
の転写 ファイル数となった(Rule et al. 2003: 669)。5 年後に新たに立ち上げられたLinguistic Development in Classroom Learner of French
という研究プロジェクトは、Progression in Foreign Language Research Project
を基にしたプロジェクトである。このプロジェク トは Myles によって指揮され、イギリスの経済社会研究委員会(Economic and SocialResearch Council)によって支援された。イギリスの中等教育における 9
年生から11
年生までのフランス語学習者が教育活動を通してどのように言語発達をするのか、またどのよ うな経験を学ぶのかについて文書化することを目的としている。さらに、非分析的な発話 の機械的学習を行う教室の役割についても検証することも目的である。また、前述の
Progression in Foreign Language Research Project
で集められた7
年生から9
年生まで の話し言葉中間言語データを拡張することも狙いの一つである。学習者の数は、それぞれ9
年生から11
年生までの各20
名であり、性別や学力は均整がとれている。各学習者は4
つの口頭タスクを、母語話者および母語話者レベルの話者と一対一のインタビュー形式で 行った。各学年間でのパフォーマンスが比較できるよう、全ての被験者は全く同じタスク を行った。そのうちの3
つはProgression in Foreign Leangage Learning
で使用したタ スクと同じものであり、前プロジェクトのデータとも比較可能である。このプロジェクト で集められたフランス語の話し言葉の録音は約50
時間であり、前回のプロジェクトと合 算すると計250
時間にも及ぶ。2つのプロジェクトを合わせることで、中等教育の初頭か ら中等教育修了試験までどのようにフランス語が発達していくかについての全体像を明ら かにすることができると考えられている(Myles et al. 1998: 329, Marsden et al. 2002:3-4, Rule et al. 2003: 670-675, Rule 2004: 354)。 これらのコーパスを用いて、中級学習者
23
http://www.flloc.soton.ac.uk
の常套語の使用と学習者言語システムの発達における常套語の役割について(Myles
2005a)、動詞句の発達(Myles 2005b)、初級者の否定文の使用の発達(Rule and Marsden 2006)、談話管理と話術の発達(Myles 2003)などの研究も行われている。
1.4.6.3.
Langue et communication (LANCOM)
Leuven
大学のフランス語学研究チームは、1994 年から2001
年にかけてLANCOM
( LANgue et COMmunication )というコーパスの構築を行った。これは、1993
年の連邦 制への移行といったベルギーの政治的背景と関連したプロジェクトである。フラマン語共 同体では、当時フランス語教育の必要性が再考されていた。そこでLeuven
大学は新しい 教育プログラムで行う言語教育に有効なデータ研究について教育機関の了承を得て、教育 と研究の双方で利用できる中間言語コーパス構築に着手することを決定した 。このコー パスの特徴は、教育への応用が第一義的なものとされていることである。したがって、コ ーパス構築の目的は、新しいマニュアル開発の基盤となるデータの収集と、教室活動で利 用できるような様々なロールプレイングのタスクに基づくコーパスを作成することであっ た。タスクは録画および録音されている。場面は、電話による会話、仕事の面接、招待、海外旅行の計画、ホテルの予約、航空券の予約など多岐にわたっている。また、フランス 語母語話者も学習者と同じタスクを行い、それを録画した。加えて、フランスでの日常生 活の場面も録画した。したがって、大半は一つの場面につき、母語話者によるバージョン と学習者によるバージョンの2種類の録画が存在する。このアプローチには
2
つの利点 がある。一つ目は教育上の利点で、フランス語母語話者による実際の日常会話を含むコー パスであることより、教材開発者に有用な話し言葉フランス語のデータを提供できる点で ある。二つ目は大学の研究に関する利点で、学習者のエラーやぎこちなさを研究すること ができる点である。このように中間言語研究が目的となっているため、言語エラーに関す るタグ付けも考案され、様々なタグが既に付与されている。1994 年以降、データは断続 的に追加されており、39時間分の録音が完了しており、19時間分に相当する160593
語 が 既 に 転 写 さ れ て い る(Debrock et al. 1999:48, Flament-Boistrancourt 2001: 5, Mertens 2002: 4)。そして、このコーパスに基づく研究も行われている。このコーパスに
よって非母語話者のエラーやぎこちなさなどを言語学的に発見することができ、フランス 語におけるインタラクションの働きについてこれまであまり研究されてこなかった点につ いて焦点を当てることができた (Debrock et al. 1999:46)。なお、前述の
ELILAP
コーパスとLANCOM
を Mark Debrock が再構築したものがELICOP
である。情報技術の発達とインターネットの普及によってこれらのリソースの大半を公開することが可能となった。
ELICOP
はhttp://bach.arts.kuleuven.be/elicop
よ りアクセスすることができる。1.4.6.4.
InterPhonologie du Français Contemporain (IPFC)
24このプロジェクトは、コーパスに基づいた中間言語の音韻研究を主たる目的として発足 された。フランス語の中間音韻研究に適した話し言葉コーパスは特に少ない。コーパスに 基づく第一言語の音韻研究は、前述の
PFC
プロジェクトによってかなり前進したと言え る。PFC
プロジェクトが誕生した10
年後の2008
年に、非母語話者を研究対象にするPFC
のサブプロジェクトとしてIPFC
プロジェクトが発足された。IPFC
プロジェクトの目的は、外国語としてのフランス語研究に向けたコーパスを構築 し、公開することである。タスクに関しては、同じ母語を持つ学習者には同じプロトコル が使用され、様式は学習者に適応されているが 、PFCプロジェクトに近いプロトコルが 用いられている。IPFC
プロジェクトの独創的な面として、以下の5
つの点を挙げること ができる(近藤・川口2008 : 54)。
1) PFC
のツールを利用し、話し言葉フランス語の統語的・語彙的情報を収集しなが ら、学習者の言語能力、とくに彼らの音声と音韻に焦点を定めている。2)
諸地域の学習者データを比較することができるように、調査項目に一貫性を与え ている。3)
既存のPFC
データベースを参照することで、単一言語および多言語環境における 言語変異を比較研究することが可能である。4) PFC
で培われたネットワークを継承し、研究協力者の国際的なネットワークを構 築している。5)
中間音韻論としての研究的側面だけではなく、PFC
教育プロジェクトとしての教 育的側面における探求も行う。データ収集の際には、5つのタスクを行った:
1)
母語話者によって発音された単語を聞いて、発音する。学習者全体に共通する単 語リストと、学習者の母語によって問題となる単語リストの2
つから成る。2)
上記のリストと、PFC
で使用した語彙リストの音読3) PFC
で使用したテクストの音読4)
学習者のレベルや、学習背景に応じた閉ざされた質問と開かれた質問から成る方 向付けられたインタビュー5)
学習者同士による自由会話IPFC
プロジェクトは、日本語母語話者とスペイン語母語話者の学習者のコーパス構築 から始まった。なお、日本語母語話者であるフランス語学習者を対象とした体系的なコー パスは、このIPFC
コーパスが唯一である。現在までに、日本語とスペイン語母語話者によるサブコーパスの他に、ドイツ語、カナ ダ英語、ギリシャ語、イタリア語、オランダ語、ノルウェー語、ブラジルボルトガル語、
24