TOEIC得点と試験のない通常授業における語彙の
保持率との相関-遅延条件下での測定結果と問題点-
木戸口 英 樹
(大学教育基盤センター特命講師)スティーブ ヒル
(大学教育基盤センター特命講師)1.問題と目的
現在多くの大学で、テキストを使用した英語の授業が多様な形態で実施されており、このような授 業形態の効果に関する研究やテキストの開発は数多く行われてきている。しかしながら、近い将来の テストや試験を前提としない通常の授業において、ある単元が終了し相当の時間が経過した時点で、 学習者がその単元のトピックの語彙や概念をどの程度保持しているのかという素朴な疑問に関して は、ほとんど興味や関心が向けられてこなかった。また、この疑問に答えられる先行研究もない。し かしながらこの疑問は、多くの教員が授業ごとに意識する問題であり、日常の授業の質や方法論が問 われる問題でもある。この疑問はまた英語の場合、学習者の内部で生起する、あるトピックの語彙や 概念が英語で構成される心的過程を検討する問題でもある。さらにこの疑問を検討することで、現在 多くの大学で検討されている新たな学期制度を議論する上で、遅延時間を経た学生の実質的な学習効 果や保持レベルを検討する基礎的なデータとなり得る。 通常、学習者は定期テスト等の試験が課されない限り、終了した単元の内容を意識的にリハーサル することは、ほとんどないと考えられる1)。このようなリハーサルが行われない条件下における学習 項目の保持メカニズムの検討は、同時に時間経過に伴う忘却のメカニズムの検討でもある (Wixted, 2004)。学習した項目を想起する再生レベルは、記銘の強さや手がかりの数に応じて変化することが 知られている (Tulving & Thompson, 1973; Craik & Tulving, 1975)。本稿では教員による授業の多様性 やそれらの効果を論じるのではなく、そのような多様な授業を通してあるトピックが終了した時点で 形成される語彙と概念、およびその保持メカニズムに焦点を当てた。 本稿では上記の目的を検討するための実験要因計画として、ある単元の終了後に何らかのタスクを 課すことなく、次の単元に移行する場合 (Session 1) と、単元の終了後に内容と語彙の整理を行うタ スクを課した場合 (Session 2) の2種類の実験的な形態を設けた。またテキストの内容レベルも、親 しみのある内容の単元とそうでないもの2水準を設定した。そしてある単元が終了し相当の時間(3 週間)が経過した時点で、学習者に該当の単元のトピックに関する語彙の再生を求めた。いずれの形 態でも語彙再生が実施されることは、学習者には事前に知らされていなかった。本稿ではこのように、 2種類の授業終了形態を設定し、学習者のトピックに関する語彙の保持レベルは、相当の遅延時間が 経過した場合、現実的にはどのようなものなのかをトピックに関する学習者の再生語彙数を指標に、 TOEIC の得点およびテキストの親密度(難易度)を操作し検討した2)。今回の実験では、ある単元の 学習に際し、学習者によって異なる英語の統語能力や読解力は、3週間という限定された通常授業の 実験期間内では、学習者内で変化せず一定であると仮定し、要因計画の交絡因子とはみなさなかった。なお本稿では通常の授業の一定期間を設定し、 その期間に実施された通常の授業を実験、 学生を参加 者(学習者)と称した。
2.実験1 (Session 1)
2-1.実験参加者 実験では香川大学の理系2学部の一年生からそれぞれ2クラス (T1, T2, A1, A2) を抽出し、 計 84 名(男 60 名,女 24,平均年齢 19.4 歳)を実験の対象とした。なお今回の実験では、参加者は英語能 力に応じた習熟度別クラスに組分けされていなかった。 2-2.方法 実験期間は前期の6月から8月初頭の3ヶ月間とした。各4クラスの TOEIC の平均得点および標 準偏差は、それぞれ T1 = 404.0 (86.3), T2 = 393.7 (113.8), A1 = 405.5 (92.6), A2 = 465.3 (84.4) であった。なお実験の実施に際し、クラス間の交絡要因を除去するために、4 クラス間で直交 計画を援用した (Session 1 では、T1 A1, および T2 A2、Session 2 では T1 A2, および T2 A1)。使用 したテキストは、BBC World Profile on DVD (NAN’ UN-DO, 2014) を用いた。Session 1 では、内容 に親しみのある単元である ‘Hat : Unit 2’ を学習した2クラスを第1グループ (familiar group; 計 42 名)と称し、内容になじみが薄い単元である ‘Platinum: Unit 5’ を学習した2クラスを第2グループ (unfamiliar group; 計 41 名)と称した。 本稿では単元の難易度を親密度と称し、該当の単元に使用されているテーマに特有な語彙約 100 語 を抽出し、 それらの生起頻度の平均を親密度の指標とした。親密度は相対的な概念であるために、語 彙頻度の測定には米国最大の語彙コーパスである COCA(Davies, 2008) を採用した3)。Unit 2 のトピッ クは帽子の歴史とその用途であり、学習者になじみがあり親密度は高いとみなした。この単元に特有 な語彙の平均語彙頻度は 103,846 であった。Unit 5 のトピックはプラチナ金属の歴史やその用途を扱っ た内容で、 この単元の親密度は低いとみなした。この単元の平均語彙頻度は 29,372 であり、Unit 2 と は統計的に有意な差があった (p < .01)。 Session 1 では各単元は 120 分(週1コマ 90 分授業の内の 60 分を2回)で終了し、その時点から3 週間を経た授業の冒頭で、学習した単元の語彙の再生テストを実施した。この再生テストの実施に関 しては、事前に参加者には一切知らされていなかった。ゆえに学習者は3週間の間に学習を終えた単 元の復習は、ほとんど行っていなかったとみなした。またこの3週間の間に、学習者は実験に関係し ない単元を学習したが、これは新たな単元を学習することで過去に学習した単元の記憶のリハーサル が困難になる、逆行マスキング効果 (Bäuml, 1996) をねらったものである。参加者は再生テストの実 施に際し、学習した単元に関する内容や語彙を想起し、与えられた用紙にできる限り多くの語彙を制 限時間内 (10 分)に記述するよう教示された(自由再生)。想起する語彙に関してはテキストの語彙 に限らず、テーマに沿っていれば可とした。これは単なる語彙テストではなく、トピックの内容の想 起を問題としているからである。なお参加者には、 語彙の再生テストは参加者の記憶の保持の調査で あり、成績には影響のないことが告げられた。授業者は日本人1名と英国人1名であり、それぞれ2 クラスを担当し、授業はすべて英語で行われた。なお授業者間の均等性を示す指標として、評定者間 信頼度係数(カッパ係数)を採用したが4)、その結果は .74 (p < .01) であり、教員間一致度は比較的高いとみなした。 2-3.TOEIC 得点 実施された TOEIC (IP テスト ) は、リスニングおよびリーディングの 2 つのセクションで構成さ れ、両セクションの合計が総合得点である標準化された英語能力判定試験の一種である。リスニング とリーディングの関係性については、多くの先行研究で論じられている。ほとんどの研究でリスニン グ得点がリーディング得点を平均点で上回っており、統計的にも有意差が認められている。また両者 には相当の有意な相関 (r = .45 ~ .74) が報告されている (e. g., Liu & Costanzo, 2013)。本稿の実験 参加者 84 名ではリスニングとリーディングとのピアソンの積率相関係数(以下相関係数)はr = .52 (寄与率 : 27.0%)であり、先行研究の範囲内であった。なお香川大学5学部すべての TOEIC 得点 データ (2015) では、リスニングとリーディングとの相関係数は r = .62(寄与率 : 38.4%)であっ た。ETS (Educational Testing Service) の過去に実施された4年間の TOEIC のデータ (Report on Test Takers World Wide, 2014) では、平均点はすべてリスニングが約 50 点高い。これは TOEIC のスコア は偏差値のように相対的な数値であり、リスニングの平均点がリーディングの平均点より 50 点ほど 高く調整されているからである。ゆえに学習者のリスニング能力は得点から 50 点を引いた数字が現 実的な得点となる。今回の実験群4クラスのリスニング得点から 50 点を引いた平均値はリスニング の方が 10 点ほど高かったが、統計的には両者に有意差はなかった。香川大学5学部の TOEIC 得点デー タでは、一部の学部を除き同様な傾向が見られた。しかしながら今回の実験では報告された総合得点 を学習者の TOEIC 得点とした。なお参加者は、大学入学後の定められた前期の中旬に、ほぼ全員が TOEIC を受験した。当日受験が不可能であった学生も、該当月に College TOEIC を受験した。
3.結果
3-1.再生成績
表 1 は各グループで単元が終了し、3週間が経過した時点での語彙再生テストの再生成績である。 第1グループ (familiar)、第2グループ (unfamiliar) の TOEIC の得点差が有意 (t = 3.2, p < .01) で あるにも関わらず、想起したすべての語彙の再生数およびテキストから想起された語彙数に有意差は なかった(いずれもp > .10)。単元による親密度(難易度)も再生数には影響を及ぼさなかったこと になる。
表1 親密度が異なる単元における語彙テストの総再生数とテキストからの再生数の平均値
注:Total recalled score; 再生されたすべての語彙、Total recalled text words; 再生されたすべての語彙に含まれ るテキストの語彙
3-2.再生語彙分布 図1はなじみのある単元 (Hat) となじみの薄い単元 (Platinum) で、それぞれのグループの全学習者 が再生したテキストからの語彙(各 100 語)の分布である5)。縦軸は再生された語彙の生起数であり、 横軸はそれらの語彙とその生起頻度である。生起頻度が高いほどなじみのある(やさしい)語彙と言 える。この図から、生起頻度数の低い(難しい)語彙は、なじみのある単元およびなじみの薄い単元 のいずれの単元においても生起数が少ない。これは 学習者がトピックの内容やそれに伴う語彙を保 持していないか、あるいは保持していてもその記憶痕跡が非常に弱いために、再生には至らなかった からであると考えられる。つまり学習者はある新たな単元を学習するに際し、単元のトピックの難易 度に関わらず既知の語彙の範囲内で内容を処理し、生起頻度の低い新たな語彙は意識的には保持して いなかったと考えられる。これらの結果から一般論として、学習者はテストや試験が事前に告知され て初めて、難しい語彙を意識的に記憶する努力をする傾向があると考えられる。 図1 第1(familiar), 第2(unfamiliar) グループで再生された語彙の生起数とその語彙頻度 3-3.相関分析 また、TOEIC の得点、語彙の総再生数およびテキストからの語彙の再生数の順位相関行列表(表2) から、再生テストで想起された総語彙数は単元の親密度に関わらず、テキストからの語彙と強い相関 のあることが分かる (r = .833, r = .854; 寄与率は各 68.9% , 72.3% )。学習者は再生に際し、単 元のトピックに関する語彙であればテキスト以外の思いつく語彙はすべて可能であると教示された。 しかしながら、いずれのグループ (familiar, unfamiliar) でも、単元の終了後に何らかのタスクが課され ることなく新たな単元に入ると、3週間後にその単元に関して想起された語彙はテキストからのもの が中心であり、またそれらの想起された語彙の生起頻度は高かった。さらに単元の親密度に関わらず、 TOEIC の得点とは相関が弱いことが分かった。
表2 TOEIC の得点 , 語彙の総想起数およびテキストからの語彙の想起数の順位相関行列表
注:Total recalled words: 再生されたすべての語彙。Total recalled text words: 再生されたすべての語彙に含まれ るテキストからの語彙。( ) 内は unfamiliar のグループ 強い相関 ; .84 ~ 1.0, 有意な相関 ; .63 ~ .84, 弱い相関 ; .45 ~ .63, 相関はほとんどない ; 0 ~ .45, ** 1%水準 3-4.考察 以上の結果から、通常の授業において、単元の終了後に学習のまとめや確認が行われないと、学 習者の TOEIC の得点あるいはテキストのトピックの親密度に関わらず、想起される語彙数やその生 起頻度数には、有意差のないことが分かった。換言すれば学習者はある単元の終了後、他の新たな単 元の学習をはさみ3週間が経過した時点で、その単元の出現頻度数の少ない新たなキーワードはほ とんど保持していないことが明らかになった。通常の授業では、学習者の TOEIC の得点あるいはテ キストの親密度に関わらず、何らかの外圧の下で意識的に該当の単元のキーワードを保持しない限 り、既存の知識や語彙でその単元のトピックを解釈する傾向があると考えられる (Marks, Doctorow, & Wittrocka, 1974)。この結果は通常の授業を行う上で考慮すべき重要な知見を示唆するものであり、 ある単元を終えた直後の新たな知識や内容をまとめることが、記憶の保持に寄与する重要なタスクで あると言えよう。しかしながら、学習者は単元で学習したトピックや語彙に関し再生が不可能なだけ であり、再認は可能であったとも考えられる。再生とは外部からの手がかりの有無に関わらず、学習 者がほぼ自動的に学習した項目を想起することであり、この再生過程は項目の記銘度が低いと困難を 伴う。一方再認は、学習した項目の記憶痕跡と呈示された項目との照合過程であるために、記憶の中 にある難しい語彙の痕跡(一部の音素や形態、文脈、スキーマ)が残っていれば再認は可能であり、 通常再認成績は再生成績を有意に上回ることが分かっている (Tulving & Thompson, 1973)。しかしな がらこの再認が可能な記憶痕跡を再生レベルにまで高めるためにも、通常の授業では単元の終了後に 何らかのタスクを学習者に課す必要がある。
4.実験2 (Session 2)
Session 1 では実験の結果から、単元の終了後に何らかのタスクを課すことで、3週間後の語彙の保 持率が向上する可能性を予測した。Session 2 ではこの予測を検証するために、新たな実験を実施した。 Session 1 の終了後、5週間を経て新たなテーマの単元に2回の授業が費やされたが、学習者には2回 目の授業の終了直前に、学習した知識を整理しながら、その単元で重要語と思われる語彙を与えられ た用紙に制限時間 10 分でリストアップするタスクが指示された。用紙は学習者の記入後に授業者に よって回収された。このタスクにより、学習した単元の語彙の保持率は Session 1 の結果と比較し、3週間後には相対的にどの程度高まるのかを検討した。
4-1.実験参加者
Session 1 の参加者 (84 名)と同じであるが、語彙のリストアップタスクの時点、あるいは再生テス トの時点での欠席者を除くと、Session 1 とは参加者の総数 (79 名)が異なったために、TOEIC の平均 得点も変化した。参加者は Session 1 同様に第1グループ (familiar) と第2グループ (unfamiliar) に分け られたが、実験を実施するに際しクラス間の交絡要因を除去するために、4クラス間で直交計画を援 用した (Session 1 では、T1, A1, および T2, A2, Session 2 では T1, A2, および T2, A1)。
4-2.方法
テキストは Session 1 と同じものを使用した。Session 2 では、T1 および A2 を第1グループ(計 38 名) とし、T2 および A1 を第2グループ(計 41 名)とした。単元のテーマはそれぞれ内容になじみのあ る ‘Food: Unit 8’、および内容になじみの薄い ‘Shinjyuku station: Unit 9’ であった。Unit 8 は食文化 の国別比較というなじみのあるテーマであり、使用されたテーマに特徴的な語彙 95 個の平均語彙頻 度数は 37,514 であった。Unit 9 は新宿駅で稼働している多量の乗客を処理できるコンピュータシステ ムに関わる内容であり、親密度は低いとみなした。使用されたテーマに特徴的な語彙 98 個の平均語 彙頻度数は 29,853 であり、両者には統計的な有意差があった (p < .01)。 Session 2 では、各単元は 120 分(週1コマ 90 分授業の内の 60 分を2回)で終了したが、2回目の 授業の終了 10 分前に、学習した知識を整理しながら、その単元で重要語と思われる語彙を、与えら れた用紙にリストアップすることが指示された。用紙は直ちに授業者によって回収された。その時点 から3週間を経た授業の冒頭で、学習者にその単元に関するトピックに関し、単元の語彙再生テスト を実施した。Session 1 同様、このテストは学習者には事前に知らされていなかった。再生テストを実 施するに際し、参加者は該当の単元のトピックを思い返し、テキストからの語彙に限らず、思いつく 語彙を自由に制限時間内(10 分)に、できる限り多くの語彙を想起し記述するよう教示された(自由 再生)。また学習者はこの3週間の間に実験に関係しない新たな単元を学習したが、これは Session 1 と同様に新たな単元を学習することで、過去に学習した単元の記憶のリハーサルが困難になる逆行マ スキング効果をねらったものである。
5.結果
5-1.再生成績 表3から、各グループの TOEIC の平均得点および標準偏差は、第1グループ (familiar) では 439.1 (SD: 94.8)、第2グループ (unfamiliar) では 420.5 (SD: 99.6) であり、両者に統計的な有意差は見 られなかった (p > .10)。両グループとも、学習者が授業でリストアップした語彙数には有意差は見 られなかったが (p > .10)、テキストからリストアップされた語彙は、第2グループの方が有意に多 かった (p < .01)。単元の内容になじみが薄ければ、学習者もその単元の内容に関する語彙は少ない ために、テキストからの引用が多くなるのは当然であると思われる。また再生テストで想起された語彙の成績では、第1グループは第2グループの約2倍の再生数があり、両者間の差も統計的に有意で あった (p < .01)。
表3 親密度が異なる単元でリストアップされた語彙 , 総再生数とテキストからの再生数(平均値)
N = 38 (Familiar), N = 41 (Unfamiliar)
注:Listed total words: 授業でリストアップされた総語彙数 , Text words in list: リストアップされた総語彙数 の中でテキストに記されている語彙 , Recalled total words: 3週間後に想起された総再生数 Recalled listed words: 再生された総語彙数の内、学習者がリストアップした語彙 なじみのある単元ではテキストの語彙以外に、学習者が保持している語彙が利用できることから、 このような有意差が生起したと考えられる。また再生された語彙の中で、学習者が授業でリストアッ プした語彙の再生比率を見ると、第1グループはリストアップした語彙をほぼ再生したが (6.7 out of 7.3)、第2グループでは5分の1以下 (3.4 out of 18.6) であることが分かる。以上の結果から、単 元の語彙をリストアップし3週間が経過した場合、単元の内容になじみがあれば、リストアップした 語彙の多くが再生されたが、内容になじみが薄い場合、リストアップした語彙の多くは再生されなかっ たことが分かった。 5-2.再生語彙分布
図2はなじみのある単元 (Food) となじみの薄い単元 (Shinjyuku station) で、それぞれのグルー プの学習者が再生した、テキストからの生起頻度の異なる語彙(各 95 語、98 語)の分布である6)。 縦軸は再生された語彙の生起数であり、横軸はそれらの語彙とその生起頻度である。生起頻度が高い ほど、なじみのあるやさしい語彙と言える。この図から、生起頻度数の低い(難しい)語彙は、なじ みの薄い単元で多く再生されていることが分かる。この結果は直感に反するが、単元の内容になじみ が薄ければ、学習者は自分が保持している語彙だけでは処理できない。そのために、学習者は自らの 意思に関わらず単元に特有な語彙に注意が向き、その結果記銘度が向上したと考えられる。一方なじ みのある単元では、生起頻度の低い語彙の再生数は、なじみの薄い単元の再生数より少ないことが分 かる。これは、なじみのある単元では、テキストの生起頻度の低い語彙よりも、学習者が既に保持し ている語彙でトピックの内容が処理できたことが要因であると考えられる。ゆえに単元の終了時に、 学習した内容を整理し語彙をリストアップするタスクを行うと、なじみの薄い単元では絶対的な再生 数は少ないものの、生起頻度数の低い語彙が記銘されていることが、この図から明らかになった。
図2 第1(familiar), 第2(unfamiliar) グループで再生された語彙の生起数とその語彙生起頻度 5-3.相関分析 表4は TOEIC の得点、授業でリストアップされた語彙、その中のテキストからの語彙、および 3週間後の総再生数と再生したリストアップされた語彙の順位相関行列表である。第1グループ (familiar) では、TOEIC の得点と授業でリストアップした語彙との間に弱い相関 (r = .47) が見られる が、第2グループ (unfamiliar) では見られない。これは単元がなじみのある内容であれば、TOEIC の 得点が高い学習者ほど豊富な語彙を有していると仮定すると、TOEIC の得点に応じてテキストの語彙 を含めてリストアップする語彙数が多くなるが、なじみの薄い単元ではそのような傾向はないからで あると考えられる。表3では両グループが授業でリストアップした語彙数に有意差はなかったが、実 はその構成内容が異なっていたことが分かる。授業でリストアップされた語彙とその中のテキストに 出現した語彙との相関では、第2グループで強い相関 (r = .92) が見られた。この結果も表3の結果 を支持するものであり、なじみの薄い単元では学習者の有する語彙ではなく、テキストからの語彙の 引用が多くなることを裏付けている。次に再生テストで想起された総語彙数 (Recalled total words) と 授業でリストアップされた語彙、およびその中のテキストからの語彙の相関を見ると、なじみのある 単元では相関 (r = .59/ r = .66) が見られる。これはなじみのある単元では、学習者が授業でリスト アップした語彙や、その中のテキストの語彙が多く想起されたことを示している。一方、内容になじ みが薄い場合、これらの間に相関はほとんどなかった (r = .43/ r = .40)。
次に再生された‘授業でリストアップされた語彙’(Recalled listed words) と他の項目の相関を見る。 この相関は Session 2 の本来の目的である、‘単元終了後に実施された語彙のリストアップの効果’を 検証する重要な分析結果である。なじみのある単元(第1グループ)では、再生されたすべての語彙 との有意な相関 (r = .71, 寄与率 : 49.8% )、および授業でリストアップされた語彙中のテキストか ら抜き出された語彙との有意な相関 (r = .80, 寄与率 : 64.0% ) が得られた。しかしなじみの薄い単 元(第2グループ)では、両者とも相関は弱いものであった。
表4 TOEIC の得点 , 記述された語彙 , テキストの語彙および想起された語彙の順位相関行列表
*( ) 内は、第2(unfamiliar) グループ
注:Listed total words: 授業でリストアップされた総語彙数、Text words in list: リストアップされた総語彙数 の中でテキストに記されている語彙、Recalled total words: 3週間後に想起された総再生数 Recalled listed words: 再生された総語彙数の内、学習者がリストアップした語彙 強い相関 ; .84 ~ 1.0, 有意な相関 ; .63 ~ .84, 弱い相関 ; .45 ~ .63, 相関はほとんどない ; 0 ~ .45, * 5% , ** 1% 水準 , 5-3.考察 これらの結果から、単元終了後にトピックに関し内容を整理し、学習者が思いつく語彙や、テキス トからの語彙をリストアップするタスクを課した場合、その単元を復習することなく3週間が経過し た時点でも、なじみのある単元の語彙は統計的に有意なレベルで再生されることが分かった。またな じみの薄い単元では、絶対的な再生数は少ないものの、生起頻度数の低い語彙も再生されることが分 かった。このような結果は、Session 1 のタスクを課さない場合の結果とは異なる。さらに Session 2 で注目すべき結果は、TOEIC の得点との関係性である。TOEIC の得点は授業でリストアップした語 彙数や、テスト時の再生総数との相関はほとんどなかった。このことから、単元終了後に語彙をリス トアップするタスクを学習者に課すことで、なじみのある単元では TOEIC の成績に関わらず長期の 語彙の保持に効果的であることが分かった。以上の結果を基に、学習した単元の語彙を保持する方略 はいかにあるべきなのかを以下で論じる。
6.総合考察
本稿では単元の終了後、3週間が経過した時点での学習者のトピックに関する語彙の保持レベル を、授業の終了形態とテキストの親密度の2要因を各2水準で検討した。Session 1 では、単元を終え た段階でまとめ等の知識の整理が行われずに3週間が経過した場合、単元の難易度あるいは学習者の TOEIC の得点に関わらず、想起される語彙数やそれらの生起頻度数(難易度)に有意差のないことが 分かった。学習者はこの3週間の間に、英語以外の複数の授業で多様な知識を同時に学習しているた め、その単元の出現頻度数の少ないなじみの薄い語彙は、リハーサルの機会もなく、ほとんど保持し ていなかったのが実態であると考えられる。さらに時間が経過すれば、忘却はより進行する。既に述 べたように、再生と再認の心的過程は大きく異なる。再生とは明らかな手がかりがない状態であって も、ほぼ自動的に記銘した項目が想起できる心的過程である。学習時に語彙を記銘するレベルが低い と、想起は容易ではない。では学習者の積極的な学習を想定しない場合、授業者は学習者の語彙の記 銘レベルをどのように高めるべきなのであろうか。目的の語彙に関しテキストの内容を発展させた、あるいは学習者の興味を引き出す新たな情報を与えることは、エピソード記憶としてその語彙の記 銘が促進され、想起の文脈となることが分かっている (e. g., Verfaellieab, Croceab & Milbergac, 1995; Tulving, E., 2002)。また遅延時間を置いてリハーサルすることも、語彙の記銘に効果的であることも 分かっている (Dempster, 1988; Cepeda, Pashler, Vul, Wixted, & Roher, 2006)。例えば授業者が授業ご とに目的の語彙を同じ文脈で、あるいは異なった文脈で自然に繰り返し発話することは、学習者の意 思に関わらず学習者内で精緻化リハーサルが生起していることになる。このように通常の授業では、 授業者が意識的に学習者に対する記銘方略を工夫することで、学習者の語彙の記銘度が高まると思わ れる。 Session 2 で実施された、単元終了後に語彙をリストアップするタスクは、なじみのある単元でのみ、 その効果が認められた。これは学習者がなじみのある単元の語彙をリストアップする過程で、テキス トの語彙と文脈の連合が容易に形成されたことが要因であると考えられる。 またテキストのエピソー ド、あるいは学習者が有する過去の豊富な知識やエピソードが、単元の語彙と連合し語彙の記銘レベ ルを高めたとも考えられる。このように学習者の知識やエピソード記憶、文脈は再生時の有効な手が かりとなり、再生が促進される (Verfaellieab et al, 1995)。一方、なじみの薄い単元では、リストアッ プの有意な効果は得られなかった。この要因として、単元の内容がなじみの薄い新たな情報で、学習 者に強い興味が生起しなかったために、学習者内に新たな語彙のエピソード記憶がうまく生成されな かった可能性がある。あるいは新たな概念に直面した際、自分のよく知っている知識構造を援用し、 新たな概念を解釈する類推が、不可能であった可能性も考えられる。このようになじみの薄いトピッ クでは、学習者の TOEIC の得点に関わらず、有効な精緻化リハーサルが行われず記銘に失敗したこ とが、TOEIC との有意な相関が得られなかった要因と考えられる7)。このようになじみの薄い単元では、 語彙を効果的に記銘する学習方略として、単元の語彙をリストアップするだけでは十分ではない。こ のタスクをさらに発展させ、語彙と語彙の間の文脈的、内容的な関係性を学習者が能動的に捉え、そ の関係を作図し、語彙が持つ多様な意味や概念を、視覚的に明示化するタスクが効果的であると考え る。学習者はこのようなタスクを行うことで、自らが保持する知識を援用し、新たな知識に対する類 推や理解、応用が可能になると考えられる。換言すれば、学習者が新たな語彙に関して独自の文脈を 構築することで、その語彙の構成概念も体制化できると考えられる。これらのタスクの理論的根拠は、 活性化拡散モデル (Collins & Loftus, 1975; Anderson, 1983) の基本的な概念を基盤とするが、紙面の 都合により、この概念を応用した実験とその結果は別稿で論ずる。
謝辞
本稿の執筆にあたり、実験(授業)に積極的に参加していただき、貴重なデータを提供していただ いた香川大学の該当クラスの皆さんに感謝いたします。そして香川大学教育基盤センター国際教育部 の先生方からは、有意義なコメントやご意見を多数頂きました。ここに改めて感謝の意を表します。注
1)心理学研究では、リハーサルは維持リハーサルと精緻化リハーサルに分類される。何度も頭の中や口頭で項目を繰り返すことは維持リハーサルであり、短期記憶に保持されるが、短時間で減衰す る。しかし短期記憶の内容は、精緻化リハーサルによって長期記憶に転送される。精緻化リハーサ ルとは、物と物との結び付き、因果関係、論理的な理解などを自分なりに解釈し、記憶の構造化を 図ることである。本稿で言及するリハーサルとは後者を指す。 2)今回の実験では、テキストから選定された語彙が学習者にとって、既知の語彙であるか否かの事 前調査は実施しなかった。選定された語彙が既知の語彙であっても、その記銘レベルは学習者によ り異なり、過去に保持していた文脈とは異なる可能性もある。記銘時の文脈と再生時の文脈が異な ると、その語彙の想起の失敗あるいは困難になることが知られている (Anderson, 1978)。選定され た語彙が既知の語彙である学習者にとって、予習は異なった文脈で既知の語彙を同定することであ り、授業で再び出現することで強化される。一方、選定された語彙が未知語である学習者では、予 習は直接プライミング (Tulving & Schacter, 1990) が与えられることになり、潜在的に記憶に残る。 授業でそれらが文脈の中で出現すると、潜在意識にあるものと照合・同定され、語彙の記銘が強化 される。本稿ではこのように、授業中にトピックの文脈で語彙を同定するという心的過程が両者で 類似していること、および学習者に要求された語彙の再生タスクが学習の終了後、長い遅延時間を 経た後で実施されたことから、テキストの語彙が学習者にとって既習か否かは問わなかった。本稿 の研究目的は単なる新語の学習プロセスの解明ではなく、トピックの文脈を基に体制化される概念 を構築する語彙の記銘過程である。ゆえに単元の語彙の保持率は、トピックの文脈や内容の保持率 と強い相関があると考えた。個々の学習者の語彙力は TOEIC の得点を指標とした。 3)単元の語彙の生起頻度数を、テキストの親密度の指標とすることには問題があるとされる(佐藤 , 2011)。特に海外のコーパスの場合、語彙の生起頻度数はネイティブがその文化内で使用する生起 頻度であり、外国人である学習者の文化のそれとは異なる。また学習者が学んだ中学校・高等学校 で出現する語彙の生起頻度数は海外のコーパスのそれとも異なる。今回使用したテキストは、BBC によって編集されたビデオクリップを基に、テキストとして再編集されたものであった。ゆえに、 海外のコーパスを適用し、テキストで使用されている語彙の生起頻度数を親密度の指標とした。本 稿では近年の一般的なニュースに上る話題の語彙の生起頻度は、ある文化に特有な語彙を除けば、 文化間で大きく異なるとはみなさなかった。今回の実験結果から、海外のコーパスを援用しても、 その妥当性には大きな問題のないことが分かった(実験1、 図1)。 4)評定者間のカッパ係数は、テストされた項目を複数の評定者間で評価する場合、評価の一致度を 一連の数式で求めるもので、評定者間の信頼度が測定できるとされる。本稿では、授業者間の均等 性を測定するために質問項目を、授業の進行(4項目)、使用言語(4項目)、学生への姿勢・評価 (5項目)、教科書関係(4項目)、の4つのカテゴリーに大きく分類し作成した。これらの項目を 10 件法で評定し一連の数式に代入し、授業者間の信頼度係数とした。ゆえにこの係数はあくまでも 目安である。 5)この図では、両グループともにテキストから選定された語彙約 100 語の内、再生された語彙それ ぞれ 83 語 (familiar)、47 語 (unfamiliar) を表している。 6)この図では、両グループともにテキストから選定された語彙 95 語、98 語の内、再生された語彙 それぞれ 70 語、42 語を表している。 7)クラスには、なじみの薄い単元の内容に詳しい学習者が存在する可能性があるが、今回の実験では、
その数は各クラスで皆無であることが授業後の調査で分かった。
参考文献
佐藤理史 (2011)「均衡コーパスを規範とするテキスト難易度判定」.『Japio Year Book』, 258-261 頁 . Anderson, J. R. (1978). Schema-directed proceses in language comprehension. In A. M. Lesgols, J. W. Pellegrino, S. D. Fokkema, & R. Glaser (Eds.), Cognitive Psychology and instruction. New York: Plenum Press.
Anderson, J. R. (1983). A spreading activation theory of memory, Journal of verbal learning and verbal behavior, 22, 1-33.
Bäuml, K-H. (1996). Revisiting an old issue: retroactive interference as a function of the degree of original and interpolated learning. Psychonomic Bulletin and Review, 3, 3, 380-384.
BBC World Profile on DVD (2014). NAN’ UN-DO, Tokyo.
Cepeda, N. J., Pashler, H., Vul, E., Wixted, J. T., and Rohrer, D. (2006). Distributed practice in verbal recall tasks: A review and quantitative synthesis, Psychological Bulletin, 132; 354-380.
Collins, A. M. and Loftus, E. F.(1975). A spreading-activation theory of semantic processing. Psychological Review, 82, 6, 407-428.
Craik,F. I. M., and Tulving E (1975). Depth of processing and the retention of words in episodic memory. Journal of Experimental Psychology: general, 104, 3, 268-294.
Davies, M. (2008-). The Corpus of Contemporary American English: 450 million words, 1990-present. Retrieved April 19, 2015 from http://corpus.byu.edu/coca/.
Dempster, F. N. (1988). The spacing effect; a case study in the failure to apply the results of psychological research. American Psychologist, 43, 8, 627-634.
Liu, J and Costanzo, K (2013). The relationship among TOEIC Listening, Reading, Speaking and Writing skills, Powers, Donald E. (ed.) The Research Foundation for the TOEIC Tests: A Compendium of Studies: Volume II. Princeton, NJ: Educational Testing Service, p. 2.1-2.25.
Marks, C. B., Doctorow, and Wittrocka, M. C. (1974). Word Frequency and Reading Comprehensiony, The Journal of Educational Research, 67, 6, 259-262.
Report on Test Takers World Wide: The TOEIC Reading and Listening Test (2014). Princeton, NJ : Educational Testing Service.
Tulving, E. and Thomson. D, M. (1973). Encoding specificity and retrieval processes in episodic memory, Psychological Review, 80, 5, 353-373.
Tulving, E., and Schacter, D. L. (1990). Priming and human memory systems. Science, 247, 4940, 301-6. Tulving, E. (2002). Episodic memory: from mind to brain, Annual Review of Psychology, 53, 1-25.
Verfaellieab, M., Croceab, P. and Milbergac, W. P. (1995). The role of episodic memory in semantic learning: An examination of vocabulary acquisition in a patient with amnesia due to encephalitis, Neurocase, The Neural Basis of Cognition, Volume 1- Issue 4, pp. 291-304.
Wixted, J. T. (2004). The psychology and neuroscience of forgetting, Annual Review of Psychology, 55, 235-269.