• 検索結果がありません。

日本語テストと言語能力記述文

N/A
N/A
Protected

Academic year: 2022

シェア "日本語テストと言語能力記述文"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

1.テストは何を測定しているのか

日本語教育の実践現場においてテストは必要だろうか。このような問いに対して、当然 必要である、テストがなかったら学生は勉強しなくなる、成績がつけられない、そして授 業が成り立たなくなる、などの反応が返ってくるだろう。言うまでもなく、日本語教育の 実践の場においてテストは必要不可欠なものとして、有形無形に影響を与えている。特に カリキュラムを構成する要素として、何を、いつ、どう、教えるのかを検討する際に、そ の一連の流れの中で教育成果を知るためのテスト、評価は避けては通れない。教育と評価 は表裏一体であり、だれもがテストの必要性は認識している。しかしながら、教師は自作 のテストがどのような知識や能力を測定しているのか十分に理解しているのだろうか。あ る知識や能力を測定するために相応しいテスト課題と形式がどのようなものであるかを検 証することなく、これまでの様式や慣行にのっとって、特段問題意識を持つこともなく問 題作りを行う傾向があるのではないかと思われる。

最近の外国語テストでは、得点から具体的な能力の解釈ができるよう、得点とそれに対 応した能力基準、基準ごとの能力記述などを明示することを重要視するようになってき た。採点して単純に得点を提示するだけでは、満点に対する獲得点数、あるいは達成度し か把握できない。また、点数という数字による情報やその管理のみで終始してしまい、教 師ならびに受験者双方にとって、それ以上の有益な情報は得られない。そこで、得点に対 して、いっそうの意味づけをするために、能力基準を設け、それに対する能力を具体的に 記述することが求められるようになってきた。テストが実際にはどのような知識や能力を 測定しているのかをだれもがわかりやすく具現化することは、テストの妥当性を確認した り、得点の解釈を意味あるものにしたりする上で重要なことである。本稿では、教育と評 価、特にテストで測定しようとする言語能力の明示化の重要性について考察してみたい。

2.テストと言語能力観の史的変遷

まずはじめに、テストと外国語能力の関係についてふり返っておきたい。Spolsky

(1978)は、外国語テストの史的変遷を大きく3つに分けて説明している。

伊東 祐郎

1

キーワード

信頼性 妥当性 スタンダード 言語能力記述文 Can-Do Statements

(2)

①前科学的測定時代(Pre-scientific era)

②心理測定/構造言語学の時代(The psychometric-structuralist era)

・(精神/心理)測定学の影響 ・構造言語学の影響

③心理/社会言語学の時代(The psycholinguistic-sociolinguistic era)

・心理言語学/社会言語学の影響 ・統合的言語能力の流れ

①の時代は、テストの作成から、評価、処理まですべて教師の手に委ねられていた時代 である。テストの作成、実施、採点については、その言語に精通した教師の経験と勘に基 づく出題内容や出題形式が重んじられ、外国語の教師イコールテストの専門家と考えられ ていた時代である。内容や形式、また採点方法に対して、だれも疑問に感じたり、批判す ることのなかった時代である。この頃の外国語教育は文法訳読法が主流で、それに対する テスト法としては、文法、翻訳、自由作文、論文という出題内容と筆答式が代表的なもの であった。文法訳読法においては、言語知識と能力を直接測定するテストとして妥当な方 法だったに違いない。取り上げる内容も、文学を中心に、文芸的な側面が強いものだった。

教師は科学的な分析や原則に従う必要もなく、自由な視点から出題できた時代であったと 言えよう。

②の時代は、教育測定学や言語学から科学的基盤を得て、テスト理論が独自の研究領域 として発展した時代である。1900年代の米国では、教育測定学から影響を受けたテスト 理論は、テストの結果として得られる測定値、すなわち得点を真の値と誤差の和として捉 え、記述統計学を基礎として「信頼性」の問題が論じられるようになった。その結果、記 述、論述などいわゆる伝統的なテスト法による採点結果には「一貫性」「安定性」が低い という批判が生まれた。作文・論文など記述式テストでは、同一の答案であっても採点者 が異なると点数に違いが生じてくることや、同一採点者でも1回目と2回目の採点では点 数が異なることについての批判や問題提起であった。そこで、採点の「客観性」を重視す る考え方が広まり、だれが採点しても結果に一貫性のある「選択式」が注目されるように なった。この測定法は、得点の信頼性が確保できるという点に加え、テストの実施と採点 が容易であるという実用性が高いため、現在でも、日本語能力試験のような大規模テスト では、多肢選択法は最良の方法として位置づけられている。しかしながら、能力評価とい う観点からは、正答を選択するという作業は、文法や語彙などの知識面の測定に偏りがち になり、現実の言語使用を忠実に反映させることがむずかしいと言われている。また、正 答がわからなくてもまぐれ当たりの可能性も生じるなど短所も少なくない。作題の視点か らは、複数の選択肢を用いるため、選択肢作成には特別な知識や技能が必要で、時間と労 力がかかるなどの課題も指摘されている。

③の段階では、「信頼性」を確保しつつ、どれだけ「妥当性」が高められるかが追求さ れている時代である。これは②の時代で指摘された、信頼性の高さがテスト全体の妥当性 を保証するとは限らないという背景が基本にある。言語の構造・語彙についての知識、音 識別、発音、音読、綴りなどの側面だけをテストするだけでは本来の「言語能力」を十分 に測ることはできないとし、「コミュニケーション」ができたかどうかという、知識や能 力を統合的に見なすテストの必要性が高まった時代である。この「統合的テスト」とは、

より現実に近い場面や文脈の中での意味の伝達や理解を測定するテストを指す。ACTFL

(3)

のOPI(Oral Proficiency Interview)テストや一般的なスピーキング・テストやライティ ング・テストなどがこれに当たる。これらのテストの必要性が叫ばれた背景に、筆答式で 構成される大規模テストで高得点を取った者が、必ずしも高いコミュニケーション能力を 有しているとは限らないという事実や、言語活動が文法や語彙知識に基づく訳読・翻訳と いう活動から人的交流の進展にともなってコミュニケーションを中心とした活動に拡大発 展したことがある。

3.言語能力における Can-Do Statements

統合的言語能力については、Canale & Swain(1980)の言語能力モデルがよく知られて いる。詳細は省略するが、このモデルでは、①文法的能力(Grammatical competence)、

②社会言語学的能力(Sociolinguistic competence)、③談話能力(Discourse competence)、

④方略的能力(Strategic competence)がコミュニケーション能力と関連しているとして いる。

その後の言語能力観の展開に大きな役割を果たしたのが、概念・機能シラバス(notional- functional syllabuses)であった。これは、1970年初頭に欧州評議会(Council of Europe)

がコミュニケーション能力を育成するための教授法の開発を目指して新たに提案したも のである。欧州で働く成人学習者が表現する意味と実際の言語の機能をまとめて配列した 項目一覧(シラバス)である。コミュニケーション能力を育成するために、実際の言語運 用場面や状況を把握した上で、指導項目の基準を作成し、学習者のニーズに応じて、指 導項目を選定できるように試みたものである。コミュニケーションを実現するために必 要な意味を概念(notion)(例:時間、量、期間、位置など)と機能(function)(例:提 案、要求、謝罪、拒否など)とに分類したことが特徴的である。その後、このシラバスに 基づいて、言語学習者の言語熟達度が垂直的に体系化され、下位レベルの「Breakthrough

(サバイバル)」から「Waystage(スタートライン)」「Threshold(入門段階)」「Vantage

(中等教育後期)」「Effective Operational Proficiency(効果的に操作可能な熟練レベル)」

「Mastery(熟練レベル)」の6レベルが設定された。各レベルの能力記述は、これまでの ような文法項目や語彙の配列、学習時間という枠を越えたものであった。言語体系という 枠を離れ、コミュニケーション能力という視点から記述されたもので、これが、 Can-Do

Statements (「言語能力記述文」)と呼ばれているものである。

4. Can-Do Statements

とテスティング

言語能力記述文は、コミュニケーション活動にかかわる能力が言語化されたものであ る。学習者の言語能力については、文法能力・語彙能力・発音能力などを細分化して捉え るのではなく、コミュニケーションを機能させる要素をグローバルな視点から捉えている と同時に、言語能力の構成概念を外的な社会的機能に焦点を当てて、現実的でより観察可 能なものとして捉えようとしたところに特徴がある。最近のヨーロッパ共通参照枠や米国 のナショナルスタンダードなどでは、社会学的な観点や行動主義の立場から新たなコミュ

(4)

ニケーション能力のモデルを提示し、教育の方法や評価のあり方への枠組みに新たな解釈 の基礎を提供しようとしている。

日本語教師は、長年の経験からコミュニケーション能力については十分に熟知してい る。そのイメージは、教師各自の経験知として、そして次第に暗黙知となって存在してい る。しかしながら、その暗黙知が言葉によって明らかにされ、相互に共有されることはこ れまであまりなかった。しかし、コミュニケーション能力を育成するための教育や能力測 定の在り方について議論を深化させていくためには、教師それぞれの教育実践を振り返り ながら、教育のめざすべきゴール、学習者に身につけてほしいコミュニケーション能力を 記述化し具体化することが求められている。それによって、コミュニケーション能力を認 識し、確かなものとして教育と評価に反映させられるからである。教師自らが言語能力を 記述化することによって、期待される学習の成果(Outcome)や教師の暗黙知が可視化さ れ、明示化されることになる。これによって、学習者にとっては達成すべき目標が明確に できる。また、教師にとっては、言語行動と言語学習に一貫性を持たせられる教育目標の 設定が可能になる。あわせて、教材開発の基盤にもなりうる。しかも、教育内容とテスト 課題の形式を特定化しやすく、コミュニケーション活動にかかわる評価の結果とその記述 が容易になるのである。

このように言語能力記述文は、これまでの言語運用力を数量や数値ではなく、具体的な 運用力の実情と照らし合わせ、学習、教授、そして評価に一貫性を持たせられる可能性を 秘めている点が注目に値するのである。それ故に、教師には教育における言語能力を内省 し具現化する力、その上で測定したい能力をテストできる能力が求められているのである。

5.教師の評価リテラシー

教師がテスト項目を作成する段階で、具体的な運用力と出題内容や形式についてどれだ け意識して作問に臨んでいるかについては各々の教師の評価リテラシーに頼る部分が少な くない。教師の評価リテラシーは個人差も大きく、外国語テストの史的変遷の時代区分を そのまま、教師の評価に対する認識の度合いとして解釈することも可能だろう。テストの 信頼性や妥当性に対する認識や言語能力の捉え方などは、教師によって多様であり、教師 間で理解され共有されているとは限らないからである。このような個人差というものが、

テストの設計や内容の検討などテスト開発の過程での違いとなって現れてくるのである。

テストの形式や解答方法には気を配るものの、言語能力観に対する考えが違うために、テ ストの精度や妥当性を検証しようとしても作業自体が難しいものになってしまう。コミュ ケーション能力の育成が叫ばれている現在、言語が使用される場面や状況、また、文脈や 人間関係など社会文化的な要因との関連づけを行ってテスト法を研究することは必要であ るが、その対応は十分とは言えない。先に述べた言語能力の枠組みを超えて、教育の現場 における指導のあり方やテスト作成に応用できる言語能力観の醸成が求められている。

そこで、筆者は、教師の評価リテラシーを高め、妥当性の高いテスト開発のために以下 のプロジェクトを提案している。これは早稲田大学大学院で筆者が担当している授業で学 生に課している課題でもある。課題文中の「コミュニケーション能力」の部分は、「聴解力」

(5)

「口頭表現力」「読解力」「文章表現力」と入れ替えて解釈することもできる。

① 日本語学習者に必要なコミュニケーション能力とは、どのようなものか。

② ①のコミュニケーション能力を身につけさせるために、どのような学習活動が役に 立つか。

③ 初級レベル、中級レベル、上級レベル、それぞれにおいて、コミュニケーション能 力は異なるか。異なるとすれば、その根拠は何か。

④ コミュニケーション能力とは、どんな要素から構成されているのか。

⑤ コミュニケーション能力を測定するテストでは、どのようなテスト課題を設定すれ ば、④の能力が測定できるか。

このプロジェクトで重要なことは、作題者が日本語能力をどのように捉えているか内省 する過程である。実践現場により能力の捉え方は異なるだろう。例えば、ビジネス日本語 を教授するクラスでは、ビジネス日本語にかかわる能力の体系化や概念化が必要になり、

明らかに、大学進学で求められるアカデミック・ジャパニーズとは異なるものになる。そ して、初級、中級、上級という各レベルにおいて、当然のことながら導入される語彙や文 型、表現などは異なる。しかし、初級終了を目処とする日本語能力試験N4レベル合格者 は日本語を使って何ができるかと問われたら、具体的に何と説明するだろう。過去の日本 語能力試験の出題基準のような語彙○○語、漢字○○字、学習時間○○時間などと数量的 な情報では運用力についての情報は一切得られない。やはり、教師自らが、学習のゴール、

すなわち日本語を使って何ができるか、コミュニケーションにおける課題達成のための運 用力について明確な説明が果たせることが必要である。これを前提に適切なテストが作成 され、学習者の能力の測定が可能になるのである。

6

.まとめ

「妥当性」を論じるときには、テストの基盤を成している「言語能力観」、または、「理 論」がテストの目的に対して妥当であるかどうかをまず確かめなくてはならない。そのよ うな試みによって検証された妥当性を、「構成概念的妥当性」(Construct validity)と呼ぶ が、テスト結果がテスト作成の基盤となった「言語能力観」「理論」と一致するかどうか を分析・検討し、テスト得点を適切に解釈するための研究が求められている。挑戦すべき ことは、テストの内容・形式・実施方法が真にコミュニケーション能力を測定しているか どうかの実証研究を行うことである。教師自らがその必要性を認識し、テストすることを 科学的に捉えることによって評価リテラシーを向上させられるのである。それがテストに よって学習者の日本語能力を正しく測定できることにつながるのである。

1 いとう・すけろう(東京外国語大学留学生日本語教育センター・教授)

参考文献

伊東祐郎(2006)「日本語能力 Can-do 記述文作成の試み―テスト得点の妥当化をめざして―」『高

(6)

見澤孟先生古希記念論文集』、pp. 35-47

伊東祐郎(2005)「これまでの評価/これからの評価」『AJALT』第28号、国際日本語普及協会、

pp. 12-17

国際交流基金・日本国際教育協会(2004)『日本語能力試験 出題基準[改訂版]』凡人社 高見沢孟(1989)『新しい外国語教授法と日本語教育』アルク

中村洋一(2002)『テストで言語能力は測れるか』桐原書店 名柄迪他(1989)『外国語教育理論の史的発展と日本語教育』アルク

Bachman, L. F. (1990) Fundamental Considerations in Language Testing. Oxford University Press. (池田 央・大友賢二監修 (1997)『言語テスト法の基礎』C.S.L.学習評価研究所)

Bachman, L. F. & Palmer, A. S. (1996)Language Testing in Practice: Designing and Developing Useful Language Tests. Oxford University Press. (大友賢二他監訳(2000)『〈実践〉言語テスト作成法』

大修館書店)

Brown, H. D. (2004) Language Assessment: Principles and Classroom Practices. Longman.

Canale, M. & Swain, M. (1980) ‘Theoretical bases of communicative approaches to second language teaching and testing’ in Applied Linguistics I/I: 1-47

Carroll, J. B. (1961) ‘Fundamental considerations in testing for English language proficiency of foreign students’ in Center for Applied Linguistics: Testing the English Proficiency of Foreign Students: 30-40.

Center for Applied Linguistics.

Council of Europe (2001) Common European Framework of Reference for Languages: Learning, teaching, assessment. Cambridge University Press. (吉島茂他訳(2004)『外国語の学習、教授、評価のため のヨーロッパ共通参照枠』朝日出版社)

Hymes, D.H. (1972) On Communicative competence. In J.B. Pride & J. Holmes (Eds.) Sociolinguistics:

Selected reading. Harmondsworth: Penguin.

Lado, R. (1961) Language Testing: The Construction and Use of Foreign Language Tests. Longman.(門司 勝・本田漠・吉田一衛・松畑煕一訳(1971)『言語テスト』大修館書店)

McNamara, T. F. (2000) Language Testing, Oxford University Press (伊東祐郎他監訳(2004)『言語テス ティング概論』スリーエーネットワーク)

Spolsky, B (1978) Introduction: Linguists and language testers’ in B. Spolsky (ed.): Approaches to Language Testing. [Advances in Language Testing Series: 2]: v-x Center for Applied Linguistics.

Wilkins, D. A. (1976) Notional syllabuses. Oxford University Press. (島岡丘訳(1984)『ノーショナルシ ラバス』桐島書店)

参照

関連したドキュメント

Week 3 Listening Test Part 2, Question-Response (Textbook, Unit 9) Week 4 Listening Test Part 2, Question-Response (Textbook, Unit 9) Week 5 Listening Test Part 5,

LABORATORIES OF VISITING PROFESSORS: Solid State Chemistry / Fundamental Material Properties / Synthetic Organic Chemistry / International Research Center for Elements Science

The following result about dim X r−1 when p | r is stated without proof, as it follows from the more general Lemma 4.3 in Section 4..

0.1. Additive Galois modules and especially the ring of integers of local fields are considered from different viewpoints. Leopoldt [L] the ring of integers is studied as a module

S., Oxford Advanced Learner's Dictionary of Current English, Oxford University Press, Oxford

Amount of Remuneration, etc. The Company does not pay to Directors who concurrently serve as Executive Officer the remuneration paid to Directors. Therefore, “Number of Persons”

(Please note that, because Japanese language proficiency is not required for admission to the Program, the letter of recommendation does not need to be written by a teacher of

In OC (Oral Communication), the main emphasis is training students with listening and speaking skills of the English language. The course content includes pronunciation, rhythm,