• 検索結果がありません。

高校生の英語力を推定する語彙テストの検討 サイズテストと速度テストの比較 増見敦 1 石川慎一郎 2 1. はじめに近年, 学習者の英語力の客観的評価に対するニーズが高まっており, 高校教育の現場においても各種の業者テストが広く活用されている こうしたテストは大規模なリサーチを踏まえて開発されたもの

N/A
N/A
Protected

Academic year: 2021

シェア "高校生の英語力を推定する語彙テストの検討 サイズテストと速度テストの比較 増見敦 1 石川慎一郎 2 1. はじめに近年, 学習者の英語力の客観的評価に対するニーズが高まっており, 高校教育の現場においても各種の業者テストが広く活用されている こうしたテストは大規模なリサーチを踏まえて開発されたもの"

Copied!
18
0
0

読み込み中.... (全文を見る)

全文

(1)

タイトル

Title

高校生の英語力を推定する語彙テストの検討 : サイズテストと速度テ

ストの比較

著者

Author(s)

増見, 敦 / 石川, 慎一郎

掲載誌・巻号・ページ

Citation

神戸大学国際コミュニケーションセンター論集,11:14-30

刊行日

Issue date

2014

資源タイプ

Resource Type

Departmental Bulletin Paper / 紀要論文

版区分

Resource Version

publisher

権利

Rights

DOI

JaLCDOI

10.24546/81008801

URL

http://www.lib.kobe-u.ac.jp/handle_kernel/81008801

PDF issue: 2018-11-30

(2)

高校生の英語力を推定する語彙テストの検討

―サイズテストと速度テストの比較―

増見 敦

1

石川 慎一郎

2

1. はじめに

近年,学習者の英語力の客観的評価に対するニーズが高まっており,高校教育の現場においても各種の 業者テストが広く活用されている。こうしたテストは大規模なリサーチを踏まえて開発されたもので,信頼性も 高いが,一定のコストと時間がかかり,何度も反復して受験させることは容易ではない。 この点をふまえ,現場では,学習者の英語力を一定の精度で推定しうる簡易なテストが強く求められている。 その際,有力な候補となるのは語彙力テストである。多くの先行研究が,語彙力と全般的な英語力の相関を 指摘している。しかしながら,語彙力に限ってみても,そのうちの何を測ればよいのかという問題は残る。 Daller et al.(2007)も言うように,語彙力には,「広さ」,「深さ」,「速さ」の 3 つの側面が存在するからである。

語彙力の 3 つの側面のうち,従来,「広さ」については,The Vocabulary Levels Test(Nation,1990) や,望 月正道氏の開発による「語彙サイズテスト」(相澤他,2010)(以下,「望月テスト」)といった各種の語彙サイズ テストで測定されてきた。また,「深さ」については,個々の語についてその関連語や連想語の知識を問う Vocabulary Knowledge Scale(Paribakht & Weshce,1997)や Word Association Test(Read,2000)等を用いて 測定される。さらに,「速さ」については,提示された文字列の中から語を見つけ出したり,提示された語が実 在語か非語かを判定したり,あるいはペアで提示された語の類義性や反義性を判定したりするのにかかる時 間を計測することが試みられており,Q_Lex(Coulson, 2010)や Lexical Access Time Test(LEXATT)(Iso & Aizawa,2008)等が使用されている。「速さ」の測定では,「人間の記憶の中で,単語に係る様々な情報をに なう部分,いわば頭の中の辞書」(門田・池村,2006)であるメンタルレキシコンへのアクセスの速度が問題に なる。 従来,高校における学習者の語彙力測定手段として用いられてきたのは,「広さ」を測るサイズテストであっ た(八島,2005; 増見・石川,2014 他)。サイズテストは紙と鉛筆だけで手軽に実施が可能で,また,問題の 量を増やすことで幅広いレベルの学習者に使用できる。これに対し,「深さ」や「速さ」のテストはほとんど実施 されてこなかった。前者は語彙力が不足がちの初級学習者には使用しにくく,後者は現場で平易に使用でき るプログラムが多くなかったためである。しかしながら,後者に関しては,先般,Computer-Based English 1 神戸大学附属中等教育学校 a.masumi@people.kobe-u.ac.jp 2 神戸大学国際コミュニケーションセンター/国際文化学研究科 iskwshin@gmail.com

(3)

Lexical Processing Test(CELP)(門田他,2014)が公開され,現場において「速さ」を測定することは以前より 容易になっている。 こうした状況をふまえ,本研究では,サイズテストと速度テストの 2 種類を同じ学習者に実施し,いずれのテ ストが学習者の全般的な英語力の推定により有用であるか,また,2 種類のテストを組み合わせて実施するこ との是非について,実証的に調査することとしたい。

2. 先行研究

語彙力に関する研究は無数に存在する。ここでは,語彙知識の「広さ」を扱った研究と,「速さ」を扱った研 究とに分けて,それぞれの一端を概観する。 2.1 語彙知識の「広さ」に係る研究 語彙サイズと英文読解力の関係を調べた研究として,たとえば,Laufer (1992)は,英語圏で ESL の環境 で英語を学ぶ大学生を対象に,語彙サイズテストのスコアと読解力テストのスコアの相関を調査し,実験協力 者の語彙レベルが 3,000語レベルを境に,読解力に有意差が見られたという結果を報告している。またGrabe (2009)では,語彙力が読解において決定的に重要な役割を担う理由を説明し,その 1 つとして,語彙サイズ の上昇に伴い,テキストの理解度が上昇することを報告している。そして,杉森(2011)は,学習者の語彙サイ ズが,その学習者の英語習熟度を判断する手段の 1 つになり得ると指摘している。 一方,日本人学習者の語彙サイズを扱った研究について,たとえば八島(2002)は,高校 3 年生の平均が 3,700~3,800 語という結果を紹介し,Katagiri(2009)では,高校 3 年間に渡り 252 人の学習者の英語語彙サ イズを縦断的に測定し,14 の伸びのパターンを報告している。また語彙サイズと作文中での語彙運用力に着 目した研究として,大学生の自由英作文を分析した石川(2005)は,「受容語彙と発表語彙の間にはっきりし た数量的関係性は認められない」と示唆し,高校 3 年生を対象に英作文を分析した増見・石川(2014)では, 「受容語彙力(語彙知識の「広さ」)が語彙運用能力と独立している可能性が考えられる」と報告している。 2.2 語彙知識の「速さ」に係る研究 多くの研究が,コミュニケーションを円滑に行う上での語彙処理の「速さ」の重要性を指摘している。たとえ ば,リスニングでは聞こえてきた単語の意味を,スピーキングでは発話に必要な文法事項や語彙などの情報 を,それぞれ自身のメンタルレキシコンから迅速に検索できなければ,コミュニケーションは阻害される(門田, 2010a)。また,「速さ」の重要性は,オーラル面に限定されない。Perfetti(2007)は Lexical Quality Hypothesis を提唱し,語彙処理速度が読み手の読解力を推定するとしている。一般に,流暢な語彙処理がなされるには, 語形(発音,綴り)・意味・文法の語彙知識がメンタルレキシコン内で十分に発達していることが求められる。そ して,語彙知識の高い学習者ほど,テキストに書かれた文字を素早く認識し,その他の読解プロセス(文構造 の分析等)を促進できるのである。一方,語彙知識の低い学習者の場合は,文字の認識ができたとしても,語 の意味への検索に困難が伴うため,語彙処理に続く読解プロセスがうまく処理できず,適切なテキスト読解に 至らない。 語彙処理速度と訓練の関係について,Akamatsu(2008)は,日本人大学生を対象に,語間にスペースを 入れず,複数語を続けて印刷した用紙を渡し,文字列の中で,語と語の区切り目に線を引かせる語認識タス クを実施した。その後,語を素早く認知するための 90 秒間の訓練を毎週 1 回,8 週にわたって実施し,再度,

(4)

タスクを実施した。その結果,訓練後では,語認知の速度と正確性が有意に向上したと報告している。 望ましい語彙処理速度について,門田他(2014)は,前述の CELP テストを大学生に受験させ,速度と正答 率を分析した。その結果,全反応速度が 800 ミリ秒~900 ミリ秒台になると,語彙アクセスが自動化されている という目安を提示している。 また,語彙知識と語彙処理速度の関係について,門田(2010b)は,CELP テストを用いた類義語判断課題 の結果データを分析した。その結果,(a)正答率,(b)正答反応時間,(c)総反応時間の間に相関がほとんど ないことを指摘した上で,「語彙知識量(語彙知識の正確さ)と語彙知識運用度(語彙アクセスの流暢性)の間 に乖離がある」と述べている。

3. 本研究の目的

すでに述べたように,本研究の目的は,日本人高校生の全般的英語力を推定するテストとして,語彙力の 「広さ」を測るサイズテストと,処理の「速さ」を測る速度テストのいずれがより有効か,また,2 種類のテストを組 み合わせて実施することで予測の精度は向上するか,を検証することである。現代の高校生の多様なありよう をふまえ,習熟度別に分析を行う。設定したリサーチ・クエスチョン(RQ)は以下の通りである。 RQ 1 サイズテストは高校生の英語力をどの程度推定するか? また,学習者の習熟度によって推定力はど う変化するか? RQ 2 速度テストは高校生の英語力をどの程度推定するか? また,学習者の習熟度によって推定力はどう 変化するか? RQ 3 サイズテストと速度テストを組み合わせた場合,高校生の英語力をどの程度推定するか? また,学 習者の習熟度によって推定力はどう変化するか? RQ 4 サイズテストと速度テストを高校生はどのように評価するか?

4. 本研究の方法

4.1 データの収集 4.1.1 調査協力者 調査協力者は,関西圏の国立大学附属中等教育学校の 6 年生(一般の高校 3 年生に相当),139 名(男子 62 名,女子 77 名)である。対象者には,帰国生徒など,習熟度が特に高い者(小学校段階にて英語圏より帰 国の 7 名,高校段階にて海外在住 1 年間の経験者 2 名等)もいるが,一方で英語を苦手に感じている者も少 なくない。なお,実験に参加した生徒の数は 141 名であったが,著しく得点が低く,真剣にテストを回答して いない可能性が疑われた 2 名については分析対象からあらかじめ除外している。 4.1.2 調査の方法

本研究では,総合的な英語力テストとして GTEC for STUDENTS を,語彙知識の「広さ」を測るサイズテスト として「望月テスト」を,語彙処理の「速さ」を測る速度テストとして CELP テストを使用した。3 つのテストは, 2014 年 10 月末から 11 月末までの 1 か月間に連続して実施した。3 つのテストの実施時期の幅は狭く,調査 期間内に学習者の英語力に根本的な変化が起こったとは考えにくい。つまり,3 つのテストは,同じ学習者の 同じ時期の英語力と語彙力の 2 つの側面を測定していると判断できる。

(5)

GTEC は授業時間外で,「望月テスト」と CELP テストはライティングの授業時間の冒頭に実施した(CELP テ ストには CALL 教室を使用)。2 種類の語彙力テストの実施に当たっては,当該のテストが研究目的の調査で あること,テスト結果は授業の成績に反映しないことを説明した。はじめに制限時間の目安を定めたが,間に 合わなかった学習者には個別に対応し,全員がすべての問題を回答した。以下,各テストの内容を示す。 (1)英語力テスト GTEC は,「読む」,「聞く」,「書く」の 3 技能の運用能力をスコア型の絶対評価で診断するテストである。 Basic と Advanced の 2 つのレベルがあり,調査協力者は 16 名が Advanced を,その他が Basic を受験した。 GTEC のセクション構成は以下の通りである。

表 1 GTEC for STUDENTS テストのセクション構成

セクション 解答時間 スコア上限(点) Advanced Basic リーディング 45 分 320 250 リスニング 25 分 320 250 ライティング 20 分 170 160 ライティングでは,与えられたテーマに基づく自由回答が求められる。調査対象とした実施回の場合, Basic の課題は「日常生活の中で,あなたが自分以外の人(周囲の人や家族など)のために,心がけるべきこ とや,すべきことは何ですか。1 つ取り上げて,なぜそうすべきと思うのか,その理由を書きなさい」,Advanced の課題は「学生はみな,社会貢献のためのボランティアをすべきである,という意見についてあなたはどう考 えますか。あなたの意見と理由を書きなさい」であった。

また,Advanced と Basic はそれぞれセクション別の上限スコアが異なるため(Advanced は問題が難しいが, その分,点数が高めに出るよう調整されている),トータルスコアは一律に扱ってよいとされている。トータルス コアのレベルの目安は下記の通りである。

表 2 GTEC for STUDENTS トータルスコア・グレードガイドライン

グレード(スコア) レベルの目安 7 (710~810) Advanced-Plus 大学での専門教育を英語で学べる 6 (610~709) Advanced 海外進学を視野に入れることができる 5 (520~609) High 海外の高校の授業に参加できる ※高校卒業時推奨グレード 4 (440~519) Intermediate 海外ホームステイや語学研修で楽しめる 3 (380~439) Primary ALT と日常会話をし,英語体験を楽しめる 2 (300~379) Introductory 定型的なやりとりであればできる 1 ( 0~299) Preparatory 挨拶程度の簡単なコミュニケーションができる 本研究において習熟度別の調査を行う場合には,グレード 6,7 に相当する 45 名,グレード 5 に相当する 52

(6)

名,そしてグレード 1,2,3,4 に相当する 42 名を,それぞれ上位群,中位群,下位群とする。 (2)サイズテスト 「望月テスト」(相澤他,2010)はこれまでに広く使用されており,有効性・妥当性がともに検証されている(望 月, 1998 他)。本研究では,1,000 語レベルから 7,000 語レベルまで,全 7 レベル(各レベルの問題数は 26 問)を使用した。満点は問題総数と等しい 182 点となる。 以下は,テスト問題の一部である。 図 1 語彙サイズテスト(望月テスト)筆記版より (3)速度テスト CELP テストでは,PC 画面に提示された単語ペアが類義語であるかどうかを判断する問題が 100 題提示さ れる。以下は,テスト問題の呈示例である。 あと 6 問 スペースキーを押す と単語が提示されま す。 → + + + + → problem → issue 図 2 問題の提示方法 上図に示すように,まず,問題開始画面が呈示される。協力者がスペースキーを押すと,画面中央部に注 視点が表示され,2 秒間視点を固定するよう指示される。その後,注視点に 1 つ目の単語(プライム語)が 1.6 秒間視覚提示され,0.6 秒のブランク画面の後,2 つ目の単語(ターゲット語)が視覚提示される。協力者は 2 語の間に意味的な類似関係がみられるかどうかを判断し上で,ターゲット語が呈示されてからできるだけ迅 速かつ正確に,キーボード上のキー(Yes は B ボタン,No は N ボタン)を押す。この時,プログラムにより,タ ーゲット語が呈示されてから解答キーが押されるまでの時間が計測される。 日本語の意味を表す英語を(1)~(6)の中から選び、その番号を解答欄に書き入れなさい。 ... 1. 丸い入れ物 2. クッションのある長椅子

(1) bath (2) lamp (3) phone (4) pot (5) sofa (6) stove

... 3. 40 4. 100

(1) forty (2) hundred (3) month (4) six (5) twelve (6) year ... 5. 町 6. 橋

(1) bridge (2) garage (3) place (4) scene (5) square (6) town ... 7. 食事 8. 1 つ、1 個、1 片

(1) air (2) meal (3) piece (4) sign (5) sound (6) white ...

(7)

テストの実施後,プログラムにより,(a)正答率,(b)正答反応時間,(c)総反応時間が算出される。語彙処理 速度を(b)と見るか,あるいは範囲を広げて(c)と見るかは意見の分かれるところであるが,調査協力者の正 答率は 82.6%に達しており,正答反応だけでも十分なデータが得られることから,今回は(b)をもって語彙処 理速度と定義する。 なお,上記の 3 つのテストを終えた後,上位群・中位群・下位群,各 2 名,合計 6 名の学習者を個別に呼び, 2 種類のテストを受けた感想についてインタビューする。インタビュー結果は,メモの形で記録し,質的分析 に使用する。 4.1.3 データ処理 以上より,GTEC のトータルスコア(最高 810 点),「望月テスト」の総得点(182 点満点),CELP テストの正答 反応速度(秒)の 3 つのデータが得られた。以下,一部の学習者のデータを示す。 表 3 調査協力者得点データの一部 協力者 英語力テスト サイズテスト 速度テスト A 344 70 1.124 B 419 111 0.830 C 804 160 0.664 D 603 120 1.120 E 517 87 0.700 F 794 142 1.444 ・・・ ・・・ ・・・ ・・・ 以上のデータセットに対して回帰分析を行う。回帰分析とは,複数の変数からなるデータにおいて,特定の 変数(目的変数)をその他の変数(説明変数)で説明する回帰式を作成する統計手法である。RQ1 と RQ2 で は説明変数を 1 つとする単回帰分析を,RQ3 では説明変数を 2 つとする重回帰分析(全変数投入)を行う。 なお,個々の回帰式からは決定係数が求められる。決定係数は相関係数の 2 乗値で,当該の回帰式がデー タの変動を説明する割合(寄与率)を示し,「回帰式の精度を表す代表的な指標」(涌井他,2011)とされる。

5. 結果と考察

5.1 RQ1:サイズテストによる英語力の推定 5.1.1 サイズテストは全般的な英語力をどの程度推定するか? 結果は図 3 の通りである。回帰式は以下のようになった。 y = 2.98x + 214.2(R2 = .51) 決定係数は 5 割を超えており,サイズテストが高校生の英語力推定の目的に一定の有効性を持つことが確 認された。先行研究では,語彙サイズと読解力・リスニング力の相関がおよそ.5~.7(決定係数は.25~.49)で

(8)

あることが報告されている(Laufer, 1992;望月, 2010)。今回の調査では,当てはまりの度合いはこれよりも幾 分高めとなった。 図 3 サイズテスト得点と GTEC トータルスコアの関係(全体) なお,回帰式の係数は正となっており,「語彙サイズが大きいほうが全般的な英語力も高い」という一般的な 見解が改めて確認された。 5.1.2 学習者の習熟度別に見た場合,サイズテストは英語力をどの程度推定するか? 結果は図 4~6 の通りである。回帰式は以下のようになった。 上位群 y = 1.75x + 432.7(R2 = .21) 中位群 y = 0.51x + 508.2(R2 = .16) 下位群 y = 1.26x + 316.7(R2 = .28) 図 4 サイズテスト得点と GTEC トータルスコアの関係(上位群) 300 400 500 600 700 800 50 70 90 110 130 150 170 190

(9)

図 5 サイズテスト得点と GTEC トータルスコアの関係(中位群) 図 6 サイズテスト得点と GTEC トータルスコアの関係(下位群) サンプル数が小さくなったため,全体で見た場合よりも決定係数は低下しているが,それでも各群ともに一 定の有効性が確認された。決定係数の高さは,下位群>上位群>中位群となる。サイズテストは,群別に見 れば,下位群により有効であると言えるだろう。中位群の決定係数が最も低くなった理由としては,当該レベ ルでは上限・下限の両方が設定されているため,内部的な分散が小さくなったことが考えられる。 なお,回帰式の係数はいずれも正となっており,どの群であっても「語彙サイズが大きいほうが全般的な英 語力も高い」という一般的な見解があてはまることが改めて確認された。 5.2 RQ2:速度テストによる英語力の推定 5.2.1 速度テストは全般的な英語力をどの程度推定するか? 結果は図 7 の通りである。回帰式は以下のようになった。 y = - 143.6x + 685(R2 = .11)

(10)

決定係数は約 10%となり,速度テストが高校生の英語力推定の目的にある程度の有効性を持つことが確認 された。ただし,その有効性はサイズテストに比べると限定的である。 図 7 速度テスト反応時間と GTEC トータルスコアの関係(全体) なお,回帰式の係数は負となっており,「語彙処理速度が速いほうが全般的な英語力も高い」という一般的 な見解が確認された。 5.2.2 学習者の習熟度別に見た場合,速度テストは英語力をどの程度推定するか? 結果は図 8~10 の通りである。回帰式は以下のようになった。 上位群 y = 19.0x + 655.2(R2 = .002) 中位群 y = -16.9x + 583.7(R2 = .03) 下位群 y = -43.6x + 477.6(R2 = .06) 図 8 速度テスト反応時間と GTEC トータルスコアの関係(上位群)

(11)

図 9 速度テスト反応時間と GTEC トータルスコアの関係(中位群) 図 10 速度テスト反応時間と GTEC トータルスコアの関係(下位群) サンプル数が小さくなったため,全体で見た場合よりも決定係数は大幅に低下し,群別に見た場合,速度 テストの有効性は制約されることが確認された。決定係数の高さは,下位群>中位群>上位群となる。速度 テストもまた,群別に見れば,下位群にとって相対的に有効性が高いと言えるだろう。 なお,回帰式の係数は中位群と下位群ではいずれも負となっており,両群ともに,「語彙処理速度が速いほ うが全般的な英語力も高い」という一般的な見解があてはまることが改めて確認された。 一方,ここで注目すべきは,上位群では係数が正となっており,「語彙処理速度が遅いほうが全般的な英語 力も高い」という特異な傾向が示されたことである。係数の値が小さく,また,前述のように決定係数も低いこと から,データの解釈は慎重であるべきだが,今回のデータに基づくと,上位群は,豊かな語彙力を生かして, 与えられた類義性判断課題についてより慎重で多角的な検証を行っている可能性が示唆された。実際, CELP テストには即断しにくい課題が含まれている。上位群が課題の回答に 1 秒以上を要した問題としては, space/room , rear/back , boundary/border , infant/baby , subsequent/following , occupation/profession ,

(12)

distribute/increase,precede/apply などがある。経験を積んだ教師であっても,これらの類義性の有無の判断 は難しい。上位群は,下位群(や中位群)とは異なり,これらの 2 語の意味を十分に理解したうえで,その類義 性の有無について深い検討を行ったのではないかと推定される。上級学習者の場合,語彙処理の「速さ」が 「深さ」に転化する可能性が示されたと言える。 5.3 RQ3:サイズテスト・速度テストによる英語力の推定 5.3.1 サイズテストと速度テストを組み合わせた場合,全般的な英語力をどの程度推定するか? 回帰式は以下のようになった。 [GTEC トータルスコア] =3.01×[サイズテストスコア]+ 6.33×[速度テスト反応時間]+ 205.1(R2 = .51) 決定係数は 5 割を超え,2 種類の語彙テストを組み合わせて高校生の英語力を推定することが有効である ことが確認された。ただし,決定係数はサイズテスト単独の場合とほぼ変わらない。それぞれのテスト実施に かかる時間的コストを考慮すれば,高校生の英語力推定という目的だけであれば,サイズテストの単独実施 が最も合理的だという結論が得られた。 5.3.2 学習者の習熟度別に見た場合,サイズテストと速度テストの組み合わせは英語力をどの程度推定する か? 回帰式は以下のようになった。 上位群 [GTEC トータルスコア]=1.85×[サイズテストスコア] + 61.49×[速度テスト反応時間]+ 374.6(R2 = .23) 中位群 [GTEC トータルスコア]=0.57×[サイズテストスコア] + 8.63×[速度テスト反応時間]+ 493.2(R2 = .16) 下位群 [GTEC トータルスコア]=1.21×[サイズテストスコア] - 12.24×[速度テスト反応時間]+ 333.6(R2 = .29) サンプル数が小さくなったため,全体で見た場合よりも決定係数は低下しているが,群別に見た場合でも, 一定の有効性が確認された。決定係数の高さは,サイズテスト単独の場合と同様,下位群>上位群>中位 群となる。また,上位群と下位群では,サイズテスト単独の場合よりも,決定係数がわずかながら向上すること が示された。 なお,サイズテストスコアに対する係数はすべての群で正になっているが(「語彙サイズが大きいほうが全般 的な英語力も高い」),速度テスト反応時間に対する係数は,下位群で負になっているものの(「語彙処理速 度が速いほうが全般的な英語力も高い」),上位群と中位群では逆転現象が確認された(「語彙処理速度が 遅いほうが全般的な英語力も高い」)。速度テスト単独の場合は上位群のみに見られた逆転現象が,2 種類 のテストを組み合わせた場合にはより広い層で観察されたことになる。このことは,幅広い英語力を持つ高校 生を対象に考えた場合,速度テストの現場での使用が想像以上に難しいことを示唆している。

(13)

5.4 RQ4:サイズテスト・速度テストに対する学習者の評価 インタビュー対象者による代表的なコメントは以下の通りであった。NA は該当するコメントがなかったことを 示す。 表 4 両テストに対する学習者のコメント サイズテスト 速度テスト 肯定的 否定的 肯定的 否定的 上 ・やってよかった。自 分の結果が返ってくる とまた次回頑張ろうと 思う。 ・大学入試センター試 験前にもう一度間違っ た部分を見返した。勉 強に役だてることがで きてよかった。 NA NA ・ボタンで混乱して遅 くなった。 ・押し間違いが多くな って焦った。 ・速く答えなさいと指示 があるので焦る。 ・押し間違えてもやり 直しがきかない。 ・同じ意味だと思った けど,違うかもしれな いと考えて迷った。 中 ・答えを書くので速度 テストよりやりやすい。 ・ときどきやりたい。自 分の語彙力が分かる。 NA ・ゲームみたいで楽 しめた。 ・時間をおいてまたや ってみたい。 ・間違えると気になっ て遅くなる。サイズテス トの方がいい。 下 ・意外にも知っている 語彙数が多いという結 果が返ってきてびっく りした。 ・選択肢が多いので つらい。 ・意味を思い出して回 答するのがレベルが 上がるにつれてつらく なる。 ・ゲームみたいで楽し めた。 ・平均が 1 秒を切って うれしい。 ・時間をおいてまた やってみたい。 ・100 問はしんどい。 ・ボタンで混乱して遅 くなった。 いずれのテストの場合も,とくに下位群において,「問題数が多くしんどい」という趣旨の回答が見られた。こ の点については,今後,推定の妥当性を保持しつつ問題数を精選する可能性を探りたいと思う。 また,速度テストについては,Yes 回答が「B」,No 回答が「N」のキーに割り当てられていたわけだが,この 区別が紛らわしいという回答が複数のレベルの協力者から得られた。たとえば,画面上の○×をマウスで選 ぶ方式や,あるいは,キーボードの左右の方向キーを Yes と No に割り当てるなど,より直感的にわかるインタ フェースを考案する余地があるかもしれない。

(14)

全体としては,サイズテストの方が好意的に受け止められており,速度テストに関しては,「焦る」「迷う」とい った否定的なコメントが多い。しかし,注目すべきは,同じ速度テストについて,「平均が 1 秒を切ってうれし い」といった肯定的コメントも得られていることである。肯定的なもの,否定的なものを含め,速度テストに関す る学習者のコメントからは,おそらくは初めて速度テストを受験したことで,学習者が,これまで気づいていな かった語彙力の「速さ」という側面に強く意識を向け始めたことがうかがえる。 すでに RQ1 および 2 を検討する中で述べたように,英語力の推定という目的に限って見れば,高校現場で 速度テストを積極的に推進する必要性は必ずしも高いものではない。だが,英語語彙力や英語力の構成要 因としての「速さ」に対する学習者の新たな気付きを誘発するという点において,今後,高校現場においても, 速度テストの効果的な活用方法についてさらに広く検討される必要があると言えよう。 5.5 まとめ 以上,一連のデータ分析により,(1)サイズテストのスコアが高校生の英語力を 51%説明すること,(2)速度 テストで得られる反応速度が高校生の英語力を 11%説明すること,(3)2 つのテストを組み合わせても決定係 数は向上しないこと,(4)各テストは主として下位群の能力推定に有効性が高いこと,(5)速度については上 位群(および中位群)において「語彙処理速度が遅いほうが全般的な英語力も高い」という一種の逆転現象 が見られること,(6)学習者は全体としてサイズテストをより効果的に評価すること,(7)速度テストの受験によ り語彙処理における速度の重要性に対する気づきが促進される可能性があること,(8)両テストともに問題数 の削減が,また,速度テストについてキー操作のシステムの改良が検討の余地として残ること,などが明らか になった。

6. 教育現場での語彙テスト使用:学習者へのフィードバック

本研究においては,英語力の推定の目的で 2 種類の語彙テストを比較したわけだが,今後,高校の教育 現場で語彙テストを活用していこうとする場合,単に英語力の診断手段として使用するだけでなく,語彙テス トそのものを教育活動の中にうまく組み込んでいく必要があるだろう。 その際,重要なことは,テストの結果をどのように学習者にフィードバックするかという点である。今回,使用 した「望月テスト」と CELP テストは,学習者に対する直接的にフィードバックを与えるものではない。つまり, 試験を実施した教員の側で学習者に何らかのフィードバックを行う必要がある。本節では,論者自身の実践 の一端を示したい。 6.1 サイズテストのフィードバック サイズテストのフィードバックに関して,最も簡単なのは,正答数および推定語彙サイズを示す方法である。 しかし,仮に,「推定語彙サイズ=2,000 語」といったフィードバックを与えても,高校生は数字の持つ意味を 具体的に理解することができないだろう。 そこで,論者は,図 11 のような独自のフィードバックシートを作成して配布することとした。これは,相澤他 (2010)に付属のテンプレートを部分的に加工したものである。

(15)

図 11 語彙サイズテスト 個人結果票(筆者作成) フィードバックシートでは,(1)全体の語彙サイズ,(2)各レベル別の習得済み語(数値/折れ線グラフ), (3)各語彙レベルの意味合い,(4)指導要領に定める中高学習語彙量の目安(中学 1,200 語,高校 1,800 語), (5)学習アドバイス,の情報を順に示している。 このうち,(2)の情報は特に重要であると考える。たとえば,上例の学習者であれば,3,000 語レベルまでは およそ 80%の語彙を習得できているが,4,000~6,000 語レベルでは習得率が 60%台に低下し,7,000 語レベ ルになると習得率はさらに低下することが視覚的にすぐにわかる。こうした情報は,学習者が,今後,自身の 語彙学習を進めていく上でどの部分に重点的に取り組むべきかを具体的に示すものである。 6.2 速度テストのフィードバック 一方,速度テストのフィードバックに関しても,最も簡単なのは反応時間そのものを示す方法である。しかし, 仮に,「平均反応速度=0.65 秒」といったフィードバックを与えても,一般の高校生の場合,その意味はほと んど理解できない。 そこで,論者は,図 12 のような独自のフィードバックシートを作成して配布した。

(16)

図 12 速度テスト 個人結果票(筆者作成) フィードバックシートでは,CELP テストで得られるデータを基に,(1)正答率,(2)総反応時間(時間/棒グ ラフ),(3)正答反応時間(時間/棒グラフ),(4)英単語処理効率値(偏差値),(5)望ましい反応時間の目安 値,(6)学習アドバイス,の情報を順に示している。 なお,(4)は,門田他(2014)で示された概念で,語彙認知の正確さと処理速度を勘案した英単語処理の 効率を示す値である。具体的には,定数 1 から「正答率」を引いて誤答率を算出し,誤答率と総反応時間をそ れぞれ偏差値に変換し,両方の数値を 2 で割って 2 つの偏差値を合計し,100 から引くことで求められる値で ある。これは,50 を平均とする偏差値で,処理効率値が高いほど数値が高くなるようになっている。エクセル のテンプレートに計算式を入力し,個々の学習者について所定の数字を入れれば自動的に計算結果が表 示されるように工夫した。ただ,速度テストの高校現場での使用の先行例は少なく,英単語処理効率値につ いて,高校生の目指すべき目安は必ずしも明確ではない。今後は,中高生および大学生を含め,多様な協 力者からのデータを蓄積することで,偏差値についても高校生が目指すべきレベルを提供できるようにした いと考えている。 サイズテストのフィードバックシートを受け取った学習者からは,「単語力をつけるための目標がよくわかる」, 「英検に向けてどれだけの語彙を覚えたらよいか分かった」,「今の自分の語彙力がわかって良い」,「知って いる単語のレベルがバラバラなのが分かった」,「基本的な単語がまだついていないことが分かった」といっ た感想が得られている。また,速度テストのフィードバックシートを受け取った学習者からも,「正答率が 100% でなくて悔しい」,「友達より反応速度が遅い」,「0.7 秒を切ってうれしい」,「今度は 1 秒を切りたい」といった 感想が得られている。 今後は,高校現場で活用できる単語テストの種類についてさらに研究の精緻化を図るとともに,効果的な フィードバックの与え方についても試行と検証を深めていくこととしたい。

(17)

本稿は,神戸大学国際コミュニケーションセンター・附属学校英語教育連携推進会議において制定された 「研究アドバイザリー制度」に基づき,大学教員の指導助言を受けて執筆された実践報告である。

参考文献

相澤一美・望月正道(編著)(2010)『英語語彙指導の実践アイディア集―活動例からテスト作成まで』 東京: 大修館書店

Akamatsu, N. (2008). The effects of training on autoimmunization of word recognition in English as a foreign language. Applied Psycholinguistics, 29, 175-193.

Coulson, D. (2010). Q_Lex: A quick test of visual recognition for learners of English. Unpublished PhD thesis, Swansea University.

Daller, H., Milton, J., & Treffers-Daller, J. (2007). Modelling and assessing vocabulary knowledge. Cambridge, England: Cambridge University Press.

Grabe, W. (2009). Reading in a second language: Moving from theory to practice. New York, NY: Cambridge University Press.

石川慎一郎(2005)「大学生英語学習者の受容語彙力と発表語彙力の関係-語彙サイズテストおよびエッセ イ・コーパス分析に基づくアプローチ-」『中部地区英語教育学会紀要』, 34, 337-344.

Iso, T., & Aizawa, K. (2008). Mochizuki kaken project report (3): Development of an online word recognition test: Examination of the internal validity. Paper presented at the 1st JACET Joint Research Forum on English Vocabulary and Reading, Kwansei Gakuin University, Hyogo, Japan.

門田修平・池村大一郎(編著)(2006)『英語語彙指導ハンドブック』 東京:大修館書店 門田修平(2010a)『SLA 研究入門 第二言語の処理・習得研究のすすめ方』東京:くろしお出版 門田修平(2010b)「第二言語における語彙処理と文処理のインターフェイス:日本人学習者への実証研究」 平成 19 年度~平成 21 年度科学研究費補助金〈基盤研究(C)〉研究成果報告書 西宮:関西学院大学 門田修平・野呂忠司・氏木道人・長谷尚弥(編著)(2014)『英単語運用力判定ソフトを使った語彙指導』 東 京:大修館書店

Katagiri, K. (2009). A three-year longitudinal study of vocabulary size in Japanese SHS students and a description of their developmental patterns. ARELE, 20, 131-140.

Laufer, B. (1992). How much lexis is necessary for reading comprehension? In P. J. L. Arnauld and H. Bejoint (Eds.) Vocabulary and applied linguistics (pp. 126-32). London: Macmillan.

増見敦・石川慎一郎(2014)「高校生の英語受容語彙力・発信語彙力・語彙運用能力の関係」『日本教科教育 学会第 40 回全国大会論文集』,66-67. 望月正道(1998)「日本人英語学習者のための語彙サイズテスト」『財団法人語学教育研究所紀要』, 12, 27-53. 望月正道(2010)「技能別及び総合的英語能力を推定する語彙テストの開発:サイズ、構成、認知速度の融 合」平成 19 年度~平成 21 年度科学研究費補助金〈基盤研究(B)〉研究成果報告書

(18)

Paribakht, T. S., & Wesche, M. (1997). Vocabulary enhancement activities and reading for meaning in second language vocabulary acquisition. In J. Coady & T. Huckin (Eds.), Second language vocabulary acquisition: A

rationale for pedagogy (pp.174-200). Cambridge, England: Cambridge University Press.

Perfetti, C.A. (2007). Reading ability: Lexical quality to comprehension. Scientific Studies of Reading, 11(4), 357-383.

Read, J.(2000). Assessing vocabulary. Cambridge, UK: Cambridge University Press.

杉森直樹(2011)「語彙力の測定・評価」 石川祥一・西田正・斉田智里(編著)『テスティングと評価 4: 技能の 測定から大学入試まで』(pp. 237-252) 東京:大修館書店 涌井良幸・涌井貞美(2011)『多変量解析がわかる』 東京:技術評論社 八島等(2002)「日本人高校生の語彙サイズ」(関東甲信越英語教育学会研究紀要),6, 29-42. 八島等(2005)「日本人高校生における推定語彙サイズと「聞くこと」と「読むこと」の力との関係」『関東甲信越 英語教育学会研究紀要』, 19, 47-58.

表 1  GTEC for STUDENTS テストのセクション構成
図 5  サイズテスト得点と GTEC トータルスコアの関係(中位群)  図 6  サイズテスト得点と GTEC トータルスコアの関係(下位群)    サンプル数が小さくなったため,全体で見た場合よりも決定係数は低下しているが,それでも各群ともに一 定の有効性が確認された。決定係数の高さは,下位群>上位群>中位群となる。サイズテストは,群別に見 れば,下位群により有効であると言えるだろう。中位群の決定係数が最も低くなった理由としては,当該レベ ルでは上限・下限の両方が設定されているため,内部的な分散が小さく
図 9  速度テスト反応時間と GTEC トータルスコアの関係(中位群)  図 10  速度テスト反応時間と GTEC トータルスコアの関係(下位群)    サンプル数が小さくなったため,全体で見た場合よりも決定係数は大幅に低下し,群別に見た場合,速度 テストの有効性は制約されることが確認された。決定係数の高さは,下位群>中位群>上位群となる。速度 テストもまた,群別に見れば,下位群にとって相対的に有効性が高いと言えるだろう。    なお,回帰式の係数は中位群と下位群ではいずれも負となっており,両群ともに,
図 11  語彙サイズテスト  個人結果票(筆者作成)  フィードバックシートでは,(1)全体の語彙サイズ,(2)各レベル別の習得済み語(数値/折れ線グラフ), (3)各語彙レベルの意味合い,(4)指導要領に定める中高学習語彙量の目安(中学 1,200 語,高校 1,800 語), (5)学習アドバイス,の情報を順に示している。  このうち,(2)の情報は特に重要であると考える。たとえば,上例の学習者であれば,3,000 語レベルまでは およそ 80%の語彙を習得できているが,4,000~6,000 語レベ
+2

参照

関連したドキュメント

をも添付︵記入︶してはならない﹂と定めていただけだったが︑そのような規制形態でさえ︑オブライエン・テスト

能が自然状態のレベルにまで減衰するのには1 そして廃棄物は蓄積してきた。 た。 一時的な貯

 さて,日本語として定着しつつある「ポスト真実」の原語は,英語の 'post- truth' である。この語が英語で市民権を得ることになったのは,2016年

「Wattbikeが卓越したエルゴメーターであることは間違いありません。テスト再現性の高さはア

従って、こ こでは「嬉 しい」と「 楽しい」の 間にも差が あると考え られる。こ のような差 は語を区別 するために 決しておざ

この 文書 はコンピューターによって 英語 から 自動的 に 翻訳 されているため、 言語 が 不明瞭 になる 可能性 があります。.. このドキュメントは、 元 のドキュメントに 比 べて

 彼の語る所によると,この商会に入社する時,経歴

テストが成功しなかった場合、ダイアログボックスが表示され、 Alienware Command Center の推奨設定を確認するように求め