• 検索結果がありません。

フランス語学習者話し言葉コーパスプロジェクト

ドキュメント内 Doctoral Thesis (Tokyo University of Foreign Studies) (ページ 48-52)

第一章 コーパス言語学

1.4. 学習者コーパスとプロジェクト

1.4.6. フランス語学習者話し言葉コーパスプロジェクト

英語学習者話し言葉コーパスに関するプロジェクトは、1990 年代から始まっている。

たとえば、ベルギーのルーバンカトリック大学の

Sylvianne Granger

が中心となって開 発が進められた

Louvain International Database of Spoken English Interlanguage

( LINDSEI )コーパスは、1995

年から構築が始まっており、学習者話し言葉コーパスの草

分け的存在であると言える。これは、世界中の大学との共同プロジェクトであり、日本語 を含む

20

言語の学習者によるサブコーパスが存在する21。また、日本人英語学習者の話 し言葉コーパスに特化したものでは、

NICT JLE

コーパスがある。これは、独立行政法 人・情報通信研究機構が主体となって作成したものであり、一対一の対面式インタビュー テストである

Standard Speaking Test (SST)

の受験者

1281

名のデータが収録されてい る。このコーパスは約

200

万語の規模で、SST の評価結果が付加された能力別サブコー パスから構成されている(和泉他 2004)。

また、日本語学習者話し言葉コーパスも構築が進められている。上村隆一氏は

1991

年 より日本語会話コーパスプロジェクトを始めた。このコーパスでは、ACTFL(American

Council on The Teaching of Foreign Languages)の OPI(Oral Proficiency Interview)に

準拠したインタビュー形式に則って学習者の言語データが収集されている。学習者は主に アメリカ人と韓国人である。また、「KY コーパス」は、鎌田修氏と山内博之氏が中心と なって構築したコーパスであり、90 名分の

ACTFL

OPI

の試験テープを文字化したも のである。学習者の母語は、中国語、英語、韓国語で、それぞれ

30

名ずつ抽出され、母 語ごとに初級

5

名、中級

10

名、上級

10

名、超級

5

名で構成されている22

上記のコーパス以外にも、英語やフランス語の話し言葉コーパスは現在までに数多く構 築されている。フランス語学習者コーパスについても、構築が進められている。ここでは、

主なフランス語学習者による話し言葉コーパスプロジェクトを概観する。

1.4.6.1.

French Learner Language Oral Corpora

Southampton

大学の研究チームは

French Learner Language Oral Corpora (FLLOC)

という電子データベースを構築している。ここに含まれるデータは、イギリス教育システ ムの

9

年生から

13

年生、すなわち

13

歳から

18

歳までのフランス語学習者に関する横断 的研究データで、異なる習熟度レベルを代表するフランス語学習者の中間言語コーパスで ある。このコーパス構築の目的は、第二言語としてのフランス語の全レベルの代表させる ことである。参加者は

9

年生までで既に

150

時間のフランス語教育を受け、13年生まで の学習時間はおおよそ

600

時間に達する。タスクは、学習者とリサーチチームの研究員 による一対一のセミガイド式インタビューで、全てフランス語で行われた。タスクは二部 構成となっており、前半は若者たちが様々なアクティビティをしている

2

枚の写真を見 て、学習者が写真についてできるだけ多くの情報を挙げていく形式のものである。後半は、

21

http://www.uclouvain.be/en-cecl-lindsei.html

を参照

22

http://opi.jp/shiryo/ky_corp.html

研究員が学習者に最近興味があること、家族について、そして上級者には過去のバカンス について、また将来についての展望について訊ねた。なお、このコーパスデータは研究機 関向けに公開されている23。コーパスはデジタルオーディオファイル、CHILDES によっ てフォーマット化された転写、そして品詞タグが付与されたファイルから成っている。全 転写とオーディオファイルはダウンロードすることができる。これらのデータに基づき、

これまでに形態統語的、語彙的な発達側面や、決まり文句の使用、モノローグとダイアロ ーグの談話の発達側面など、様々な問題について分析が行われている (David 2008, Rule

2004)。

1.4.6.2.

Progression in Foreign Language Learning

Progression in Foreign Language Research Project

は、1993年から

1996

年までの3 年にわたってイギリスの

2

つの中等教育機関で行われていたプロジェクトである。フラ ンス語学習者

60

名について、初年度である

7

年生から

3

年目である

9

年生までの

3

年に わたって長期的研究を行った。学習者は

3

年間のあいだ、6つの口頭産出タスクを行った。

学習者同士でペアになって行うタスクもあれば、研究者と行うタスクもある。学習者の発 達がより明確になるよう、いくつかのタスクは時期をずらして同じものが複数回行われた。

このプロジェクトデータはアナログ録音で計

200

時間、プレーンテクストで

650

の転写 ファイル数となった(Rule et al. 2003: 669)。5 年後に新たに立ち上げられた

Linguistic Development in Classroom Learner of French

という研究プロジェクトは、

Progression in Foreign Language Research Project

を基にしたプロジェクトである。このプロジェク トは Myles によって指揮され、イギリスの経済社会研究委員会(Economic and Social

Research Council)によって支援された。イギリスの中等教育における 9

年生から

11

年生

までのフランス語学習者が教育活動を通してどのように言語発達をするのか、またどのよ うな経験を学ぶのかについて文書化することを目的としている。さらに、非分析的な発話 の機械的学習を行う教室の役割についても検証することも目的である。また、前述の

Progression in Foreign Language Research Project

で集められた

7

年生から

9

年生まで の話し言葉中間言語データを拡張することも狙いの一つである。学習者の数は、それぞれ

9

年生から

11

年生までの各

20

名であり、性別や学力は均整がとれている。各学習者は

4

つの口頭タスクを、母語話者および母語話者レベルの話者と一対一のインタビュー形式で 行った。各学年間でのパフォーマンスが比較できるよう、全ての被験者は全く同じタスク を行った。そのうちの

3

つは

Progression in Foreign Leangage Learning

で使用したタ スクと同じものであり、前プロジェクトのデータとも比較可能である。このプロジェクト で集められたフランス語の話し言葉の録音は約

50

時間であり、前回のプロジェクトと合 算すると計

250

時間にも及ぶ。2つのプロジェクトを合わせることで、中等教育の初頭か ら中等教育修了試験までどのようにフランス語が発達していくかについての全体像を明ら かにすることができると考えられている(Myles et al. 1998: 329, Marsden et al. 2002:

3-4, Rule et al. 2003: 670-675, Rule 2004: 354)。 これらのコーパスを用いて、中級学習者

23

http://www.flloc.soton.ac.uk

の常套語の使用と学習者言語システムの発達における常套語の役割について(Myles

2005a)、動詞句の発達(Myles 2005b)、初級者の否定文の使用の発達(Rule and Marsden 2006)、談話管理と話術の発達(Myles 2003)などの研究も行われている。

1.4.6.3.

Langue et communication (LANCOM)

Leuven

大学のフランス語学研究チームは、1994 年から

2001

年にかけて

LANCOM

( LANgue et COMmunication )というコーパスの構築を行った。これは、1993

年の連邦 制への移行といったベルギーの政治的背景と関連したプロジェクトである。フラマン語共 同体では、当時フランス語教育の必要性が再考されていた。そこで

Leuven

大学は新しい 教育プログラムで行う言語教育に有効なデータ研究について教育機関の了承を得て、教育 と研究の双方で利用できる中間言語コーパス構築に着手することを決定した 。このコー パスの特徴は、教育への応用が第一義的なものとされていることである。したがって、コ ーパス構築の目的は、新しいマニュアル開発の基盤となるデータの収集と、教室活動で利 用できるような様々なロールプレイングのタスクに基づくコーパスを作成することであっ た。タスクは録画および録音されている。場面は、電話による会話、仕事の面接、招待、

海外旅行の計画、ホテルの予約、航空券の予約など多岐にわたっている。また、フランス 語母語話者も学習者と同じタスクを行い、それを録画した。加えて、フランスでの日常生 活の場面も録画した。したがって、大半は一つの場面につき、母語話者によるバージョン と学習者によるバージョンの2種類の録画が存在する。このアプローチには

2

つの利点 がある。一つ目は教育上の利点で、フランス語母語話者による実際の日常会話を含むコー パスであることより、教材開発者に有用な話し言葉フランス語のデータを提供できる点で ある。二つ目は大学の研究に関する利点で、学習者のエラーやぎこちなさを研究すること ができる点である。このように中間言語研究が目的となっているため、言語エラーに関す るタグ付けも考案され、様々なタグが既に付与されている。1994 年以降、データは断続 的に追加されており、39時間分の録音が完了しており、19時間分に相当する

160593

語 が 既 に 転 写 さ れ て い る

(Debrock et al. 1999:48, Flament-Boistrancourt 2001: 5, Mertens 2002: 4)。そして、このコーパスに基づく研究も行われている。このコーパスに

よって非母語話者のエラーやぎこちなさなどを言語学的に発見することができ、フランス 語におけるインタラクションの働きについてこれまであまり研究されてこなかった点につ いて焦点を当てることができた (Debrock et al. 1999:46)。

なお、前述の

ELILAP

コーパスと

LANCOM

を Mark Debrock が再構築したものが

ELICOP

である。情報技術の発達とインターネットの普及によってこれらのリソースの

大半を公開することが可能となった。

ELICOP

http://bach.arts.kuleuven.be/elicop

よ りアクセスすることができる。

1.4.6.4.

InterPhonologie du Français Contemporain (IPFC)

24

このプロジェクトは、コーパスに基づいた中間言語の音韻研究を主たる目的として発足 された。フランス語の中間音韻研究に適した話し言葉コーパスは特に少ない。コーパスに 基づく第一言語の音韻研究は、前述の

PFC

プロジェクトによってかなり前進したと言え る。

PFC

プロジェクトが誕生した

10

年後の

2008

年に、非母語話者を研究対象にする

PFC

のサブプロジェクトとして

IPFC

プロジェクトが発足された。

IPFC

プロジェクトの目的は、外国語としてのフランス語研究に向けたコーパスを構築 し、公開することである。タスクに関しては、同じ母語を持つ学習者には同じプロトコル が使用され、様式は学習者に適応されているが 、PFCプロジェクトに近いプロトコルが 用いられている。

IPFC

プロジェクトの独創的な面として、以下の

5

つの点を挙げること ができる(近藤・川口

2008 : 54)。

1) PFC

のツールを利用し、話し言葉フランス語の統語的・語彙的情報を収集しなが ら、学習者の言語能力、とくに彼らの音声と音韻に焦点を定めている。

2)

諸地域の学習者データを比較することができるように、調査項目に一貫性を与え ている。

3)

既存の

PFC

データベースを参照することで、単一言語および多言語環境における 言語変異を比較研究することが可能である。

4) PFC

で培われたネットワークを継承し、研究協力者の国際的なネットワークを構 築している。

5)

中間音韻論としての研究的側面だけではなく、

PFC

教育プロジェクトとしての教 育的側面における探求も行う。

データ収集の際には、5つのタスクを行った:

1)

母語話者によって発音された単語を聞いて、発音する。学習者全体に共通する単 語リストと、学習者の母語によって問題となる単語リストの

2

つから成る。

2)

上記のリストと、

PFC

で使用した語彙リストの音読

3) PFC

で使用したテクストの音読

4)

学習者のレベルや、学習背景に応じた閉ざされた質問と開かれた質問から成る方 向付けられたインタビュー

5)

学習者同士による自由会話

IPFC

プロジェクトは、日本語母語話者とスペイン語母語話者の学習者のコーパス構築 から始まった。なお、日本語母語話者であるフランス語学習者を対象とした体系的なコー パスは、この

IPFC

コーパスが唯一である。

現在までに、日本語とスペイン語母語話者によるサブコーパスの他に、ドイツ語、カナ ダ英語、ギリシャ語、イタリア語、オランダ語、ノルウェー語、ブラジルボルトガル語、

24

特記しない限り、IPFC

プロジェクトについては

Racine et al. (2012)を参照した。

ドキュメント内 Doctoral Thesis (Tokyo University of Foreign Studies) (ページ 48-52)