TOEIC得点と試験のない通常授業における語彙の保持率との相関　─遅延条件下での測定結果と問題点─-香川大学学術情報リポジトリ

(1)

ＴＯＥＩＣ得点と試験のない通常授業における語彙の

保持率との相関－遅延条件下での測定結果と問題点－

木戸口　英　樹

（大学教育基盤センター特命講師）

スティーブヒル

（大学教育基盤センター特命講師）

１．問題と目的

　現在多くの大学で、テキストを使用した英語の授業が多様な形態で実施されており、このような授業形態の効果に関する研究やテキストの開発は数多く行われてきている。しかしながら、近い将来のテストや試験を前提としない通常の授業において、ある単元が終了し相当の時間が経過した時点で、学習者がその単元のトピックの語彙や概念をどの程度保持しているのかという素朴な疑問に関しては、ほとんど興味や関心が向けられてこなかった。また、この疑問に答えられる先行研究もない。しかしながらこの疑問は、多くの教員が授業ごとに意識する問題であり、日常の授業の質や方法論が問われる問題でもある。この疑問はまた英語の場合、学習者の内部で生起する、あるトピックの語彙や概念が英語で構成される心的過程を検討する問題でもある。さらにこの疑問を検討することで、現在多くの大学で検討されている新たな学期制度を議論する上で、遅延時間を経た学生の実質的な学習効果や保持レベルを検討する基礎的なデータとなり得る。　通常、学習者は定期テスト等の試験が課されない限り、終了した単元の内容を意識的にリハーサルすることは、ほとんどないと考えられる1)_{。このようなリハーサルが行われない条件下における学習} 項目の保持メカニズムの検討は、同時に時間経過に伴う忘却のメカニズムの検討でもある (Wixted, 2004)。学習した項目を想起する再生レベルは、記銘の強さや手がかりの数に応じて変化することが知られている (Tulving & Thompson, 1973; Craik & Tulving, 1975)。本稿では教員による授業の多様性やそれらの効果を論じるのではなく、そのような多様な授業を通してあるトピックが終了した時点で形成される語彙と概念、およびその保持メカニズムに焦点を当てた。　本稿では上記の目的を検討するための実験要因計画として、ある単元の終了後に何らかのタスクを課すことなく、次の単元に移行する場合 (Session 1) と、単元の終了後に内容と語彙の整理を行うタスクを課した場合 (Session 2) の２種類の実験的な形態を設けた。またテキストの内容レベルも、親しみのある内容の単元とそうでないもの２水準を設定した。そしてある単元が終了し相当の時間（３週間）が経過した時点で、学習者に該当の単元のトピックに関する語彙の再生を求めた。いずれの形態でも語彙再生が実施されることは、学習者には事前に知らされていなかった。本稿ではこのように、２種類の授業終了形態を設定し、学習者のトピックに関する語彙の保持レベルは、相当の遅延時間が経過した場合、現実的にはどのようなものなのかをトピックに関する学習者の再生語彙数を指標に、 TOEIC の得点およびテキストの親密度（難易度）を操作し検討した2)_{。今回の実験では、ある単元の} 学習に際し、学習者によって異なる英語の統語能力や読解力は、３週間という限定された通常授業の実験期間内では、学習者内で変化せず一定であると仮定し、要因計画の交絡因子とはみなさなかった。

(2)

なお本稿では通常の授業の一定期間を設定し、その期間に実施された通常の授業を実験、学生を参加者（学習者）と称した。

２．実験１ (Session 1)

２－１．実験参加者　実験では香川大学の理系２学部の一年生からそれぞれ２クラス (T1, T2, A1, A2) を抽出し、計 84 名（男 60 名，女 24，平均年齢 19.4 歳）を実験の対象とした。なお今回の実験では、参加者は英語能力に応じた習熟度別クラスに組分けされていなかった。２－２．方法　実験期間は前期の６月から８月初頭の３ヶ月間とした。各４クラスの TOEIC の平均得点および標準偏差は、それぞれ T1 = 404.0 (86.3), T2 = 393.7 (113.8), A1 = 405.5 (92.6), A2 = 465.3 (84.4) であった。なお実験の実施に際し、クラス間の交絡要因を除去するために、4 クラス間で直交計画を援用した (Session 1 では、T1 A1, および T2 A2、Session 2 では T1 A2, および T2 A1)。使用したテキストは、BBC World Profile on DVD (NAN’ UN-DO, 2014) を用いた。Session 1 では、内容に親しみのある単元である ‘Hat : Unit 2’ を学習した２クラスを第１グループ (familiar group; 計 42 名）と称し、内容になじみが薄い単元である ‘Platinum: Unit 5’ を学習した２クラスを第２グループ (unfamiliar group; 計 41 名）と称した。　本稿では単元の難易度を親密度と称し、該当の単元に使用されているテーマに特有な語彙約 100 語を抽出し、それらの生起頻度の平均を親密度の指標とした。親密度は相対的な概念であるために、語彙頻度の測定には米国最大の語彙コーパスである COCA(Davies, 2008) を採用した3)_{。Unit 2 のトピッ} クは帽子の歴史とその用途であり、学習者になじみがあり親密度は高いとみなした。この単元に特有な語彙の平均語彙頻度は 103,846 であった。Unit 5 のトピックはプラチナ金属の歴史やその用途を扱った内容で、この単元の親密度は低いとみなした。この単元の平均語彙頻度は 29,372 であり、Unit 2 とは統計的に有意な差があった (p < .01)。　Session 1 では各単元は 120 分（週１コマ 90 分授業の内の 60 分を２回）で終了し、その時点から３週間を経た授業の冒頭で、学習した単元の語彙の再生テストを実施した。この再生テストの実施に関しては、事前に参加者には一切知らされていなかった。ゆえに学習者は３週間の間に学習を終えた単元の復習は、ほとんど行っていなかったとみなした。またこの３週間の間に、学習者は実験に関係しない単元を学習したが、これは新たな単元を学習することで過去に学習した単元の記憶のリハーサルが困難になる、逆行マスキング効果 (Bäuml, 1996) をねらったものである。参加者は再生テストの実施に際し、学習した単元に関する内容や語彙を想起し、与えられた用紙にできる限り多くの語彙を制限時間内 (10 分）に記述するよう教示された（自由再生）。想起する語彙に関してはテキストの語彙に限らず、テーマに沿っていれば可とした。これは単なる語彙テストではなく、トピックの内容の想起を問題としているからである。なお参加者には、語彙の再生テストは参加者の記憶の保持の調査であり、成績には影響のないことが告げられた。授業者は日本人１名と英国人１名であり、それぞれ２クラスを担当し、授業はすべて英語で行われた。なお授業者間の均等性を示す指標として、評定者間信頼度係数（カッパ係数）を採用したが4)_{、その結果は .74 (}_{p < .01) であり、教員間一致度は比較}

(3)

的高いとみなした。２－３．TOEIC 得点　実施された TOEIC (IP テスト ) は、リスニングおよびリーディングの 2 つのセクションで構成され、両セクションの合計が総合得点である標準化された英語能力判定試験の一種である。リスニングとリーディングの関係性については、多くの先行研究で論じられている。ほとんどの研究でリスニング得点がリーディング得点を平均点で上回っており、統計的にも有意差が認められている。また両者には相当の有意な相関 (r = .45 ～ .74) が報告されている (e. g., Liu & Costanzo, 2013)。本稿の実験参加者 84 名ではリスニングとリーディングとのピアソンの積率相関係数（以下相関係数）はr = .52 （寄与率 : 27.0％）であり、先行研究の範囲内であった。なお香川大学５学部すべての TOEIC 得点データ (2015) では、リスニングとリーディングとの相関係数は r = .62（寄与率 : 38.4％）であった。ETS (Educational Testing Service) の過去に実施された４年間の TOEIC のデータ (Report on Test Takers World Wide, 2014) では、平均点はすべてリスニングが約 50 点高い。これは TOEIC のスコアは偏差値のように相対的な数値であり、リスニングの平均点がリーディングの平均点より 50 点ほど高く調整されているからである。ゆえに学習者のリスニング能力は得点から 50 点を引いた数字が現実的な得点となる。今回の実験群４クラスのリスニング得点から 50 点を引いた平均値はリスニングの方が 10 点ほど高かったが、統計的には両者に有意差はなかった。香川大学５学部の TOEIC 得点データでは、一部の学部を除き同様な傾向が見られた。しかしながら今回の実験では報告された総合得点を学習者の TOEIC 得点とした。なお参加者は、大学入学後の定められた前期の中旬に、ほぼ全員が TOEIC を受験した。当日受験が不可能であった学生も、該当月に College TOEIC を受験した。

３．結果

３－１．再生成績

　表 1 は各グループで単元が終了し、３週間が経過した時点での語彙再生テストの再生成績である。第１グループ (familiar)、第２グループ (unfamiliar) の TOEIC の得点差が有意 (t = 3.2, p < .01) であるにも関わらず、想起したすべての語彙の再生数およびテキストから想起された語彙数に有意差はなかった（いずれもp > .10)。単元による親密度（難易度）も再生数には影響を及ぼさなかったことになる。

表１　親密度が異なる単元における語彙テストの総再生数とテキストからの再生数の平均値

注：Total recalled score; 再生されたすべての語彙、Total recalled text words; 再生されたすべての語彙に含まれるテキストの語彙

(4)

３－２．再生語彙分布　図１はなじみのある単元 (Hat) となじみの薄い単元 (Platinum) で、それぞれのグループの全学習者が再生したテキストからの語彙（各 100 語）の分布である5)_{。縦軸は再生された語彙の生起数であり、} 横軸はそれらの語彙とその生起頻度である。生起頻度が高いほどなじみのある（やさしい）語彙と言える。この図から、生起頻度数の低い（難しい）語彙は、なじみのある単元およびなじみの薄い単元のいずれの単元においても生起数が少ない。これは学習者がトピックの内容やそれに伴う語彙を保持していないか、あるいは保持していてもその記憶痕跡が非常に弱いために、再生には至らなかったからであると考えられる。つまり学習者はある新たな単元を学習するに際し、単元のトピックの難易度に関わらず既知の語彙の範囲内で内容を処理し、生起頻度の低い新たな語彙は意識的には保持していなかったと考えられる。これらの結果から一般論として、学習者はテストや試験が事前に告知されて初めて、難しい語彙を意識的に記憶する努力をする傾向があると考えられる。図１　第１(familiar), 第２(unfamiliar) グループで再生された語彙の生起数とその語彙頻度３－３．相関分析　また、TOEIC の得点、語彙の総再生数およびテキストからの語彙の再生数の順位相関行列表（表２) から、再生テストで想起された総語彙数は単元の親密度に関わらず、テキストからの語彙と強い相関のあることが分かる (r = .833, r = .854; 寄与率は各 68.9％ , 72.3％ )。学習者は再生に際し、単元のトピックに関する語彙であればテキスト以外の思いつく語彙はすべて可能であると教示された。しかしながら、いずれのグループ (familiar, unfamiliar) でも、単元の終了後に何らかのタスクが課されることなく新たな単元に入ると、３週間後にその単元に関して想起された語彙はテキストからのものが中心であり、またそれらの想起された語彙の生起頻度は高かった。さらに単元の親密度に関わらず、 TOEIC の得点とは相関が弱いことが分かった。

(5)

表２　TOEIC の得点 , 語彙の総想起数およびテキストからの語彙の想起数の順位相関行列表

注：Total recalled words: 再生されたすべての語彙。Total recalled text words: 再生されたすべての語彙に含まれるテキストからの語彙。( ) 内は unfamiliar のグループ強い相関 ; .84 ～ 1.0, 有意な相関 ; .63 ～ .84, 弱い相関 ; .45 ～ .63, 相関はほとんどない ; 0 ～ .45, ** 1％水準３－４．考察　以上の結果から、通常の授業において、単元の終了後に学習のまとめや確認が行われないと、学習者の TOEIC の得点あるいはテキストのトピックの親密度に関わらず、想起される語彙数やその生起頻度数には、有意差のないことが分かった。換言すれば学習者はある単元の終了後、他の新たな単元の学習をはさみ３週間が経過した時点で、その単元の出現頻度数の少ない新たなキーワードはほとんど保持していないことが明らかになった。通常の授業では、学習者の TOEIC の得点あるいはテキストの親密度に関わらず、何らかの外圧の下で意識的に該当の単元のキーワードを保持しない限り、既存の知識や語彙でその単元のトピックを解釈する傾向があると考えられる (Marks, Doctorow, & Wittrocka, 1974)。この結果は通常の授業を行う上で考慮すべき重要な知見を示唆するものであり、ある単元を終えた直後の新たな知識や内容をまとめることが、記憶の保持に寄与する重要なタスクであると言えよう。しかしながら、学習者は単元で学習したトピックや語彙に関し再生が不可能なだけであり、再認は可能であったとも考えられる。再生とは外部からの手がかりの有無に関わらず、学習者がほぼ自動的に学習した項目を想起することであり、この再生過程は項目の記銘度が低いと困難を伴う。一方再認は、学習した項目の記憶痕跡と呈示された項目との照合過程であるために、記憶の中にある難しい語彙の痕跡（一部の音素や形態、文脈、スキーマ）が残っていれば再認は可能であり、通常再認成績は再生成績を有意に上回ることが分かっている (Tulving & Thompson, 1973)。しかしながらこの再認が可能な記憶痕跡を再生レベルにまで高めるためにも、通常の授業では単元の終了後に何らかのタスクを学習者に課す必要がある。

４．実験２ (Session 2)

　Session 1 では実験の結果から、単元の終了後に何らかのタスクを課すことで、３週間後の語彙の保持率が向上する可能性を予測した。Session 2 ではこの予測を検証するために、新たな実験を実施した。 Session 1 の終了後、５週間を経て新たなテーマの単元に２回の授業が費やされたが、学習者には２回目の授業の終了直前に、学習した知識を整理しながら、その単元で重要語と思われる語彙を与えられた用紙に制限時間 10 分でリストアップするタスクが指示された。用紙は学習者の記入後に授業者によって回収された。このタスクにより、学習した単元の語彙の保持率は Session 1 の結果と比較し、３

(6)

週間後には相対的にどの程度高まるのかを検討した。

４－１．実験参加者

　Session 1 の参加者 (84 名）と同じであるが、語彙のリストアップタスクの時点、あるいは再生テストの時点での欠席者を除くと、Session 1 とは参加者の総数 (79 名）が異なったために、TOEIC の平均得点も変化した。参加者は Session 1 同様に第１グループ (familiar) と第２グループ (unfamiliar) に分けられたが、実験を実施するに際しクラス間の交絡要因を除去するために、４クラス間で直交計画を援用した (Session 1 では、T1, A1, および T2, A2, Session 2 では T1, A2, および T2, A1)。

４－２．方法

　テキストは Session 1 と同じものを使用した。Session 2 では、T1 および A2 を第１グループ（計 38 名）とし、T2 および A1 を第２グループ（計 41 名）とした。単元のテーマはそれぞれ内容になじみのある ‘Food: Unit 8’、および内容になじみの薄い ‘Shinjyuku station: Unit 9’ であった。Unit 8 は食文化の国別比較というなじみのあるテーマであり、使用されたテーマに特徴的な語彙 95 個の平均語彙頻度数は 37,514 であった。Unit 9 は新宿駅で稼働している多量の乗客を処理できるコンピュータシステムに関わる内容であり、親密度は低いとみなした。使用されたテーマに特徴的な語彙 98 個の平均語彙頻度数は 29,853 であり、両者には統計的な有意差があった (p < .01)。　Session 2 では、各単元は 120 分（週１コマ 90 分授業の内の 60 分を２回）で終了したが、２回目の授業の終了 10 分前に、学習した知識を整理しながら、その単元で重要語と思われる語彙を、与えられた用紙にリストアップすることが指示された。用紙は直ちに授業者によって回収された。その時点から３週間を経た授業の冒頭で、学習者にその単元に関するトピックに関し、単元の語彙再生テストを実施した。Session 1 同様、このテストは学習者には事前に知らされていなかった。再生テストを実施するに際し、参加者は該当の単元のトピックを思い返し、テキストからの語彙に限らず、思いつく語彙を自由に制限時間内（10 分）に、できる限り多くの語彙を想起し記述するよう教示された（自由再生）。また学習者はこの３週間の間に実験に関係しない新たな単元を学習したが、これは Session 1 と同様に新たな単元を学習することで、過去に学習した単元の記憶のリハーサルが困難になる逆行マスキング効果をねらったものである。

５．結果

５－１．再生成績　表３から、各グループの TOEIC の平均得点および標準偏差は、第１グループ (familiar) では 439.1 (SD: 94.8)、第２グループ (unfamiliar) では 420.5 (SD: 99.6) であり、両者に統計的な有意差は見られなかった (p > .10)。両グループとも、学習者が授業でリストアップした語彙数には有意差は見られなかったが (p > .10)、テキストからリストアップされた語彙は、第２グループの方が有意に多かった (p < .01)。単元の内容になじみが薄ければ、学習者もその単元の内容に関する語彙は少ないために、テキストからの引用が多くなるのは当然であると思われる。また再生テストで想起された語

(7)

彙の成績では、第１グループは第２グループの約２倍の再生数があり、両者間の差も統計的に有意であった (p < .01)。

表３親密度が異なる単元でリストアップされた語彙 , 総再生数とテキストからの再生数（平均値）

N = 38 (Familiar), N = 41 (Unfamiliar)

注：Listed total words: 授業でリストアップされた総語彙数 , Text words in list: リストアップされた総語彙数の中でテキストに記されている語彙 , Recalled total words: ３週間後に想起された総再生数 Recalled listed words: 再生された総語彙数の内、学習者がリストアップした語彙　なじみのある単元ではテキストの語彙以外に、学習者が保持している語彙が利用できることから、このような有意差が生起したと考えられる。また再生された語彙の中で、学習者が授業でリストアップした語彙の再生比率を見ると、第１グループはリストアップした語彙をほぼ再生したが (6.7 out of 7.3)、第２グループでは５分の１以下 (3.4 out of 18.6) であることが分かる。以上の結果から、単元の語彙をリストアップし３週間が経過した場合、単元の内容になじみがあれば、リストアップした語彙の多くが再生されたが、内容になじみが薄い場合、リストアップした語彙の多くは再生されなかったことが分かった。５－２．再生語彙分布

　図２はなじみのある単元 (Food) となじみの薄い単元 (Shinjyuku station) で、それぞれのグループの学習者が再生した、テキストからの生起頻度の異なる語彙（各 95 語、98 語）の分布である6)_。縦軸は再生された語彙の生起数であり、横軸はそれらの語彙とその生起頻度である。生起頻度が高いほど、なじみのあるやさしい語彙と言える。この図から、生起頻度数の低い（難しい）語彙は、なじみの薄い単元で多く再生されていることが分かる。この結果は直感に反するが、単元の内容になじみが薄ければ、学習者は自分が保持している語彙だけでは処理できない。そのために、学習者は自らの意思に関わらず単元に特有な語彙に注意が向き、その結果記銘度が向上したと考えられる。一方なじみのある単元では、生起頻度の低い語彙の再生数は、なじみの薄い単元の再生数より少ないことが分かる。これは、なじみのある単元では、テキストの生起頻度の低い語彙よりも、学習者が既に保持している語彙でトピックの内容が処理できたことが要因であると考えられる。ゆえに単元の終了時に、学習した内容を整理し語彙をリストアップするタスクを行うと、なじみの薄い単元では絶対的な再生数は少ないものの、生起頻度数の低い語彙が記銘されていることが、この図から明らかになった。

(8)

図２　第１(familiar), 第２(unfamiliar) グループで再生された語彙の生起数とその語彙生起頻度５－３．相関分析　表４は TOEIC の得点、授業でリストアップされた語彙、その中のテキストからの語彙、および３週間後の総再生数と再生したリストアップされた語彙の順位相関行列表である。第１グループ (familiar) では、TOEIC の得点と授業でリストアップした語彙との間に弱い相関 (r = .47) が見られるが、第２グループ (unfamiliar) では見られない。これは単元がなじみのある内容であれば、TOEIC の得点が高い学習者ほど豊富な語彙を有していると仮定すると、TOEIC の得点に応じてテキストの語彙を含めてリストアップする語彙数が多くなるが、なじみの薄い単元ではそのような傾向はないからであると考えられる。表３では両グループが授業でリストアップした語彙数に有意差はなかったが、実はその構成内容が異なっていたことが分かる。授業でリストアップされた語彙とその中のテキストに出現した語彙との相関では、第２グループで強い相関 (r = .92) が見られた。この結果も表３の結果を支持するものであり、なじみの薄い単元では学習者の有する語彙ではなく、テキストからの語彙の引用が多くなることを裏付けている。次に再生テストで想起された総語彙数 (Recalled total words) と授業でリストアップされた語彙、およびその中のテキストからの語彙の相関を見ると、なじみのある単元では相関 (r = .59/ r = .66) が見られる。これはなじみのある単元では、学習者が授業でリストアップした語彙や、その中のテキストの語彙が多く想起されたことを示している。一方、内容になじみが薄い場合、これらの間に相関はほとんどなかった (r = .43/ r = .40)。

　次に再生された‘授業でリストアップされた語彙’(Recalled listed words) と他の項目の相関を見る。この相関は Session 2 の本来の目的である、‘単元終了後に実施された語彙のリストアップの効果’を検証する重要な分析結果である。なじみのある単元（第１グループ）では、再生されたすべての語彙との有意な相関 (r = .71, 寄与率 : 49.8％ )、および授業でリストアップされた語彙中のテキストから抜き出された語彙との有意な相関 (r = .80, 寄与率 : 64.0％ ) が得られた。しかしなじみの薄い単元（第２グループ）では、両者とも相関は弱いものであった。

(9)

表４　TOEIC の得点 , 記述された語彙 , テキストの語彙および想起された語彙の順位相関行列表

*( ) 内は、第２(unfamiliar) グループ

注：Listed total words: 授業でリストアップされた総語彙数、Text words in list: リストアップされた総語彙数の中でテキストに記されている語彙、Recalled total words: ３週間後に想起された総再生数 Recalled listed words: 再生された総語彙数の内、学習者がリストアップした語彙強い相関 ; .84 ～ 1.0, 有意な相関 ; .63 ～ .84, 弱い相関 ; .45 ～ .63, 相関はほとんどない ; 0 ～ .45, * 5％ , ** 1％水準 , ５－３．考察　これらの結果から、単元終了後にトピックに関し内容を整理し、学習者が思いつく語彙や、テキストからの語彙をリストアップするタスクを課した場合、その単元を復習することなく３週間が経過した時点でも、なじみのある単元の語彙は統計的に有意なレベルで再生されることが分かった。またなじみの薄い単元では、絶対的な再生数は少ないものの、生起頻度数の低い語彙も再生されることが分かった。このような結果は、Session 1 のタスクを課さない場合の結果とは異なる。さらに Session 2 で注目すべき結果は、TOEIC の得点との関係性である。TOEIC の得点は授業でリストアップした語彙数や、テスト時の再生総数との相関はほとんどなかった。このことから、単元終了後に語彙をリストアップするタスクを学習者に課すことで、なじみのある単元では TOEIC の成績に関わらず長期の語彙の保持に効果的であることが分かった。以上の結果を基に、学習した単元の語彙を保持する方略はいかにあるべきなのかを以下で論じる。

６．総合考察

　本稿では単元の終了後、３週間が経過した時点での学習者のトピックに関する語彙の保持レベルを、授業の終了形態とテキストの親密度の２要因を各２水準で検討した。Session 1 では、単元を終えた段階でまとめ等の知識の整理が行われずに３週間が経過した場合、単元の難易度あるいは学習者の TOEIC の得点に関わらず、想起される語彙数やそれらの生起頻度数（難易度）に有意差のないことが分かった。学習者はこの３週間の間に、英語以外の複数の授業で多様な知識を同時に学習しているため、その単元の出現頻度数の少ないなじみの薄い語彙は、リハーサルの機会もなく、ほとんど保持していなかったのが実態であると考えられる。さらに時間が経過すれば、忘却はより進行する。既に述べたように、再生と再認の心的過程は大きく異なる。再生とは明らかな手がかりがない状態であっても、ほぼ自動的に記銘した項目が想起できる心的過程である。学習時に語彙を記銘するレベルが低いと、想起は容易ではない。では学習者の積極的な学習を想定しない場合、授業者は学習者の語彙の記銘レベルをどのように高めるべきなのであろうか。目的の語彙に関しテキストの内容を発展させた、

(10)

あるいは学習者の興味を引き出す新たな情報を与えることは、エピソード記憶としてその語彙の記銘が促進され、想起の文脈となることが分かっている (e. g., Verfaellieab, Croceab & Milbergac, 1995; Tulving, E., 2002)。また遅延時間を置いてリハーサルすることも、語彙の記銘に効果的であることも分かっている (Dempster, 1988; Cepeda, Pashler, Vul, Wixted, & Roher, 2006)。例えば授業者が授業ごとに目的の語彙を同じ文脈で、あるいは異なった文脈で自然に繰り返し発話することは、学習者の意思に関わらず学習者内で精緻化リハーサルが生起していることになる。このように通常の授業では、授業者が意識的に学習者に対する記銘方略を工夫することで、学習者の語彙の記銘度が高まると思われる。　Session 2 で実施された、単元終了後に語彙をリストアップするタスクは、なじみのある単元でのみ、その効果が認められた。これは学習者がなじみのある単元の語彙をリストアップする過程で、テキストの語彙と文脈の連合が容易に形成されたことが要因であると考えられる。またテキストのエピソード、あるいは学習者が有する過去の豊富な知識やエピソードが、単元の語彙と連合し語彙の記銘レベルを高めたとも考えられる。このように学習者の知識やエピソード記憶、文脈は再生時の有効な手がかりとなり、再生が促進される (Verfaellieab et al, 1995)。一方、なじみの薄い単元では、リストアップの有意な効果は得られなかった。この要因として、単元の内容がなじみの薄い新たな情報で、学習者に強い興味が生起しなかったために、学習者内に新たな語彙のエピソード記憶がうまく生成されなかった可能性がある。あるいは新たな概念に直面した際、自分のよく知っている知識構造を援用し、新たな概念を解釈する類推が、不可能であった可能性も考えられる。このようになじみの薄いトピックでは、学習者の TOEIC の得点に関わらず、有効な精緻化リハーサルが行われず記銘に失敗したことが、TOEIC との有意な相関が得られなかった要因と考えられる7)_{。このようになじみの薄い単元では、} 語彙を効果的に記銘する学習方略として、単元の語彙をリストアップするだけでは十分ではない。このタスクをさらに発展させ、語彙と語彙の間の文脈的、内容的な関係性を学習者が能動的に捉え、その関係を作図し、語彙が持つ多様な意味や概念を、視覚的に明示化するタスクが効果的であると考える。学習者はこのようなタスクを行うことで、自らが保持する知識を援用し、新たな知識に対する類推や理解、応用が可能になると考えられる。換言すれば、学習者が新たな語彙に関して独自の文脈を構築することで、その語彙の構成概念も体制化できると考えられる。これらのタスクの理論的根拠は、活性化拡散モデル (Collins & Loftus, 1975; Anderson, 1983) の基本的な概念を基盤とするが、紙面の都合により、この概念を応用した実験とその結果は別稿で論ずる。

謝辞

　本稿の執筆にあたり、実験（授業）に積極的に参加していただき、貴重なデータを提供していただいた香川大学の該当クラスの皆さんに感謝いたします。そして香川大学教育基盤センター国際教育部の先生方からは、有意義なコメントやご意見を多数頂きました。ここに改めて感謝の意を表します。

注　

１）心理学研究では、リハーサルは維持リハーサルと精緻化リハーサルに分類される。何度も頭の中

(11)

や口頭で項目を繰り返すことは維持リハーサルであり、短期記憶に保持されるが、短時間で減衰する。しかし短期記憶の内容は、精緻化リハーサルによって長期記憶に転送される。精緻化リハーサルとは、物と物との結び付き、因果関係、論理的な理解などを自分なりに解釈し、記憶の構造化を図ることである。本稿で言及するリハーサルとは後者を指す。２）今回の実験では、テキストから選定された語彙が学習者にとって、既知の語彙であるか否かの事前調査は実施しなかった。選定された語彙が既知の語彙であっても、その記銘レベルは学習者により異なり、過去に保持していた文脈とは異なる可能性もある。記銘時の文脈と再生時の文脈が異なると、その語彙の想起の失敗あるいは困難になることが知られている (Anderson, 1978)。選定された語彙が既知の語彙である学習者にとって、予習は異なった文脈で既知の語彙を同定することであり、授業で再び出現することで強化される。一方、選定された語彙が未知語である学習者では、予習は直接プライミング (Tulving & Schacter, 1990) が与えられることになり、潜在的に記憶に残る。授業でそれらが文脈の中で出現すると、潜在意識にあるものと照合・同定され、語彙の記銘が強化される。本稿ではこのように、授業中にトピックの文脈で語彙を同定するという心的過程が両者で類似していること、および学習者に要求された語彙の再生タスクが学習の終了後、長い遅延時間を経た後で実施されたことから、テキストの語彙が学習者にとって既習か否かは問わなかった。本稿の研究目的は単なる新語の学習プロセスの解明ではなく、トピックの文脈を基に体制化される概念を構築する語彙の記銘過程である。ゆえに単元の語彙の保持率は、トピックの文脈や内容の保持率と強い相関があると考えた。個々の学習者の語彙力は TOEIC の得点を指標とした。３）単元の語彙の生起頻度数を、テキストの親密度の指標とすることには問題があるとされる（佐藤 , 2011)。特に海外のコーパスの場合、語彙の生起頻度数はネイティブがその文化内で使用する生起頻度であり、外国人である学習者の文化のそれとは異なる。また学習者が学んだ中学校・高等学校で出現する語彙の生起頻度数は海外のコーパスのそれとも異なる。今回使用したテキストは、BBC によって編集されたビデオクリップを基に、テキストとして再編集されたものであった。ゆえに、海外のコーパスを適用し、テキストで使用されている語彙の生起頻度数を親密度の指標とした。本稿では近年の一般的なニュースに上る話題の語彙の生起頻度は、ある文化に特有な語彙を除けば、文化間で大きく異なるとはみなさなかった。今回の実験結果から、海外のコーパスを援用しても、その妥当性には大きな問題のないことが分かった（実験１、図１）。４）評定者間のカッパ係数は、テストされた項目を複数の評定者間で評価する場合、評価の一致度を一連の数式で求めるもので、評定者間の信頼度が測定できるとされる。本稿では、授業者間の均等性を測定するために質問項目を、授業の進行（４項目）、使用言語（４項目）、学生への姿勢・評価（５項目）、教科書関係（４項目）、の４つのカテゴリーに大きく分類し作成した。これらの項目を 10 件法で評定し一連の数式に代入し、授業者間の信頼度係数とした。ゆえにこの係数はあくまでも目安である。５）この図では、両グループともにテキストから選定された語彙約 100 語の内、再生された語彙それぞれ 83 語 (familiar)、47 語 (unfamiliar) を表している。６）この図では、両グループともにテキストから選定された語彙 95 語、98 語の内、再生された語彙それぞれ 70 語、42 語を表している。７）クラスには、なじみの薄い単元の内容に詳しい学習者が存在する可能性があるが、今回の実験では、

(12)

その数は各クラスで皆無であることが授業後の調査で分かった。

参考文献

佐藤理史 (2011)「均衡コーパスを規範とするテキスト難易度判定」．『Japio Year Book』, 258-261 頁 . Anderson, J. R. (1978). Schema-directed proceses in language comprehension. In A. M. Lesgols, J. W. Pellegrino, S. D. Fokkema, & R. Glaser (Eds.), Cognitive Psychology and instruction. New York: Plenum Press.

Anderson, J. R. (1983). A spreading activation theory of memory, Journal of verbal learning and verbal behavior, 22, 1-33.

Bäuml, K-H. (1996). Revisiting an old issue: retroactive interference as a function of the degree of original and interpolated learning. Psychonomic Bulletin and Review, 3, 3, 380-384.

BBC World Profile on DVD (2014). NAN’ UN-DO, Tokyo.

Cepeda, N. J., Pashler, H., Vul, E., Wixted, J. T., and Rohrer, D. (2006). Distributed practice in verbal recall tasks: A review and quantitative synthesis, Psychological Bulletin, 132; 354-380.

Collins, A. M. and Loftus, E. F.(1975). A spreading-activation theory of semantic processing. Psychological Review, 82, 6, 407-428.

Craik,F. I. M., and Tulving E (1975). Depth of processing and the retention of words in episodic memory. Journal of Experimental Psychology: general, 104, 3, 268-294.

Davies, M. (2008-). The Corpus of Contemporary American English: 450 million words, 1990-present. Retrieved April 19, 2015 from http://corpus.byu.edu/coca/.

Dempster, F. N. (1988). The spacing effect; a case study in the failure to apply the results of psychological research. American Psychologist, 43, 8, 627-634.

Liu, J and Costanzo, K (2013). The relationship among TOEIC Listening, Reading, Speaking and Writing skills, Powers, Donald E. (ed.) The Research Foundation for the TOEIC Tests: A Compendium of Studies: Volume II. Princeton, NJ: Educational Testing Service, p. 2.1-2.25.

Marks, C. B., Doctorow, and Wittrocka, M. C. (1974). Word Frequency and Reading Comprehensiony, The Journal of Educational Research, 67, 6, 259-262.

Report on Test Takers World Wide: The TOEIC Reading and Listening Test (2014). Princeton, NJ : Educational Testing Service.

Tulving, E. and Thomson. D, M. (1973). Encoding specificity and retrieval processes in episodic memory, Psychological Review, 80, 5, 353-373.

Tulving, E., and Schacter, D. L. (1990). Priming and human memory systems. Science, 247, 4940, 301-6. Tulving, E. (2002). Episodic memory: from mind to brain, Annual Review of Psychology, 53, 1-25.

Verfaellieab, M., Croceab, P. and Milbergac, W. P. (1995). The role of episodic memory in semantic learning: An examination of vocabulary acquisition in a patient with amnesia due to encephalitis, Neurocase, The Neural Basis of Cognition, Volume 1- Issue 4, pp. 291-304.

Wixted, J. T. (2004). The psychology and neuroscience of forgetting, Annual Review of Psychology, 55, 235-269.

TOEIC得点と試験のない通常授業における語彙の保持率との相関 ─遅延条件下での測定結果と問題点─-香川大学学術情報リポジトリ