英語入試問題 の計量的語嚢分析 レポー ト*
上 野 之 江
1 .日 的
この報告 の目的 は入試問題で使用 されている語嚢 と受験生が中学,高校で六 年間かけて学習 した既習語嚢 の間にどの くらいの差異 があるのかを 耳ンピュー ターを使 い計量的に分析す ることにある
。高校教科書‑種類,三冊 に出て くる 語嚢 と三種類の英語入試問題 の語嚢 を計量的に比較分析 し,
1) 未習語 ワー ドリス トを作成す る
。その リス ト、 を もとに入試問題内の莱 習語を抽出計量す る
。結果を他の研究結果 と比較す る。
2) 未習語 ワー ドリス トを もとに各人試問題 の リーデ ィング問題 を分析す る
。その後一部入試問題解答例を語嚢の面か ら考察す る
。報告では語嚢,単語,語 とい う用語の うちその時々で一番説明に適 した用語 が交互 に使われている
。これ らの用語の意味の区別 は していない。
2. 言語材料
受験生の中学,高校既習語童 として次の 2 種類の言語材料 を採用 した。
中学既習語嚢 [ 以下 J‑Wor d と略す] として :
UNI CORN I 、 ne w e di t i o n の巻末 にある WORD LI ST ( B) より 1 , 0 8 9 語
現行学習指導要領では, 中学校 における新語数を 9 5 0 ない し 1 , 0 5 0 と指導 し
* この報告 は第二回小樽商科大学教職研究会 ( 1 9 8 9 年 9 月 3 月開催)での研究発表を もとに書かれた ものである。
〔 8 1〕
ている。 この J‑Wor d リス トは中学校必修単語 4 9 0 語 に UNI CORN 教科書編 集者が中学既習語 と判断 した語を加え 1 , 0 8 9 語に した ものせある
。高校既習語嚢 として :
書中 正俊他,Re v i s e dUNI CORN ENGLI SH CPURSE I, Ⅱ ,ⅡB ,( 文
[ 以下 UNI CORN I, I I ,I IB と略す]
これ ら中学,高校既習語嚢 と比較,分析す る英語入試問題 として :
1 9 8 9 年度実施 共通一次試験 [ 以下 KYO と略す]
1 9 8 9 年度実施 小樽商科大学第三次選抜試験 [ 以下 O U Cと略す]
1 9 8 9 年度実施 北海道大学第二次選抜試験 [ 以下 HOK と略す]
を取 り上 げた。各試験問題の構成 は次のようになっている。
蓑1
KYO oUc HOK
解答欄数 7 0 2 8 ‑1 9 ( 3 ) 2 3
これ ら 3 種類の入試問題の問題形式を文法,語嚢,発音を問 う問題の 3 種類 に分類 して比較すると以下のような点が特徴 としてあげられる。
1) HOK には発音の問題が一題 もない。
2) O U Cには音声を使 った He ar i ng,Di c t at i on ( 2 0 分)の問題が国語 ・英
( 1 ) 北海道立手稲高校田原博幸教諭, 北海道立稚 内高校岡山康治教諭 が作成。 Re v i s e d UNI CORN ENGLI SH COURSE I , Ⅱ ,ⅡB に出現 した異な り語 の出現頻度 と出 現場所, 出現率が リス トされている。 このイ ンデ ックスは wo r d‑f o r ms を基準 と して単語を数えている。単語の数 え方 についての詳細 は 3. 分析対象語嚢で述べる。
( 2 )He a r i ng,Di c t a t i o n を含む。
( 3 ) 国語 ・英語選択類 は英作文 3 題, He a r i ng,Di c t a t i on 各 5 題を含み 2 8 解答欄数。
数学 ・英語選択類 は英作文が 4 題 あり合計 1 9 解答欄数 となる。
英語入試問題の計量的語棄分析 レポー ト 83 語選択類 に課せ、 られている。 (このスク リプ トも分析 の対象 に含 まれて
いる。)
3) KYO はマー クカー ド使用 の多肢選択式 の解答 なので解答欄 の数 が際 だ って多 い, 0
4) KYO の文章読解,内容把握問題 の選択肢 はまとまっ. た英文 よ りで きて いる。従 って受験生 は問題文 の他 に多量 の選択肢 も読解す ることが要 求 され る。
5) OUC と HOK には解答方法 は異 なるが, 英文和訳 4‑5 題, 要約 2‑
3 題,和文英訳 3‑4 題 の問題 が共通 してみ られ る。
6) KYO, OUC, HOK 全体 に読解, 文法, 藷嚢 に関す る問題 が多 いが KYO,HPK で は会話文 を取入 れ Spoke n Engl i s h も問題文 と して採 用 している。
3. 分析対象語義
本報告 の比較,分析対象 とな る UNI CORN ワー ドイ ンデ ックスにまとめ ら れた語 は UNI CORN I , Ⅱ , / I I B 三冊 の教科書 の中の, Le s s on を付 した本文, Rapi dReadi ng ,各課 に付 いている練習問題,まとめ,文法説明,発音練習, 巻末 の付録 のすべてを対象 と しているが, WORD LI ST と I DI OM LI ST ,各
ペー ジの脚注 にある新出語 は除 いている。
英語入試問題 について は文章問題 の本文,設問,選択肢,注 の中のすべての 英語 を対象 とした。
コンピューターによる語嚢 の研究では代表的な ものに Kuc e r aandFr anc i s
( 1 9 6 7 ) や Car r ol le ta l .( 1 9 7 1 )等 がある
。前者 は米国 Br own Uni ve r s i t y で
1 9 6 3‑6 4 年 にかけて 1 , 0 1 4 , 0 0 0 語 を収集 し ,5 0 , 4 0 6 の異 な り語 をあげてい る
。後者 は教科書,小説,百科辞典,雑誌等 1 , 0 4 5 種 の印刷物 よ り 5 , 0 8 8 , 7 1 2 語 を収
集 し ,8 6 , 7 4 1 の異 な り語 を抽出 している
。共 に現代英語 に的を絞 って行われた
調査 であ る
。日本 では,竹蓋 ( 1 9 8 1 )が この両者 の頻度上位 1 万語ずつを比較
して得 られた 7 , 3 6 0 語 の共通語嚢 を 「白色語嚢」 と命名 し語嚢調査 の統制群 と
して利用 している
。いずれの調査 ・研究 にお いて も wor d一 一f or ms を基準 に調査 が行われ ワー ド リス トが作成 されて いる 。 wor d‑f or ms は一般的 に使 われて いる wor d の概 念 に近 い ものであるが同一 の もので はない。言語学上 はひ とっの Wor d とみな され るもので も Wor d‑f or ms を基準 にす るとそれぞれ別個 に扱われ る。 例え ば, dr i ve , dr i ve s , dr i vi ng , dr ove I , dr i ve n や dr i ve r , dr i ve r s , dr i ve r s ' , dr i ve r ' S ,dr i ve ' Sのような語 は dr i ve とい う語 の異形態 と考 え られ るが, コン
ピューターによる計量分析で は 1 0 噂 の wor d‑f or ms と して数 え られ る。最近 の コンビュ‑クーによ る調査 では Wor d‑f or ms によ り語 の区別 を し語 の出現 頻度 を測定 している
。とい うのは, コンピューター集計では Wor d‑f or ms を 数 え ることは比較的容易 であ るか らであ る 。 wor d‑f or ms を基準 に数 え同一 基準 で調査 されたテキス トを比 べ ることがで きる 。 wor d‑f or ms を基準 に分 析をす ると,テキス トの長 さ,頻 出語,特定 の wor d二f or ms が出現す る環境 を 探 ることがで き,他 の wor d の出現 にある単語 がどのよ うに影響 しているのか 等 c ol l oc at i on の分析がで きるよ うになる ( Si nc l ai r ,1 9 8 6 ) 。 しか し, wor d‑
f or ms を基準 にす ると助動詞 c an ( で きる) と名詞 c an ( 缶) の区別 はで きな い。 この 2 語 は同 じ語 と してカ ウン トされ るとい う不都合がお きて くる
。この よ うな短所 はあ るが この報告 で も wor d‑f or ms を中心 に分析 を進 め る。わが国の高校教科書,英帝人試問題 を対象 と した語嚢調査 の多 くは he ad‑
wor ds のみを対象 に行われて きた。その調査基準 もそれぞれ異 な り,統一 に欠 けていた。しか し近年 にな り竹蓋 ( 1 9 8 1 )等 wor d‑f or ms を基準 に大規模 な調 査 が コ ンピュー ターを利 用 して行 われ るよ うにな った。 これか らは Wor d‑
f or ms を中心 と した計量調査 が主流 になるはずである
。UNI CORN ワー ドイ ンデ クスに出て くる語 は 3 冊 の教科書 に出現 した全 て の Wor d‑f or ms が イ ンデ ックス された ものであ る。 ここで扱 う UNI CORN ワー ドリス ト ( 4 , 7 6 1 語 ( 4 ) ) ,入試問題 も Wor d‑f o r ms に基づ きテキス トは処理 された。 don' t , won' t の短縮形 は一語 と して扱 われている
。合成語, ol d‑
f as hi one d,t we nt y‑s i x 等‑イフンを伴 う語 もひとつの単語である。 ただ し,
英語入試問題 の計量的語嚢分析 レポー ト 85 hus band‑and‑wi f e のよ うに辞書 に he ad‑wor d と して出て こない ものは
‑イフンをのぞ き 3 語 として扱 った。
4. 分析の方法
ハ ー ドウェア : NECPC‑9 8 01RA
ソフ トウェア : Wor dSt ar 2000J( 2. 0) TAS( 5 )( 4. 0)
( Te xtAnal ys i sSys t em)
Wor dSt ar 2000J で作成 されたテキス トファイルをデータベー子 に読 み込 み デー タフ ァイルを構築 す る
。英文 ワープ ロソフ トを使 ってのデー タ入力 なの で,入力方法が普通 の タイプとほとん ど変 わ らず簡単 である。 この方式 の最大 の利点 は Wor dSt ar 2000J が塔載す るスペ リングチ ェック機能 を利用で きると い う点である
。これによ り ミススペ リングはすべて 自動的 に訂正 され短時間で より正確 なテキス トファイルを作成す ることがで きる。 このように して作成 さ れたデータを もとに TAS( 4. 0) が行 な う主 な分析 は以下の通 りである
。1) 単語 の頻度数, 出現場所 を伴 うワー ドイ ンデ ックスを印刷す る
。2) 文章 の最小 ・最大語数,平均語数,平均文字数並 びに総語数,文 の総数 を計算す る
93) 単語 の検索 をす る
。4) 単語 の頻度数, あ る単語が総語数 に しめ る割合 を表示す る。
5) 逆引 き語嚢集 を作成 す る
。( 4 ) 竹蓋 『日本人英語の科学 』( 1 9 8 2 ,p. 1 0 0 ) では高等学校教科書 の異語数 を 4 , 1 6 6 語 と して い る
。( 5 ) TAS は bBASEI I I PLUS を土台 に小樽商科大学 の君羅久則助教授 によ り開発 され
た システムで あ る。
ここでは, TAS( 4, 0 ) で処理 されたデータを もとに
( 1 ) KYO , OU C, HOK 3 種類 の入試問題 で出現す る語嚢を計量的に比較す る 。(5. 1)
( 2 ) 1 文の長 さを指標 に 3 種類 の入試問題 を比較す る。 ( 5. 2)
( 3 ) 受験生 の既習語 と入試問題語嚢 との差をとり末習語 ワー ドリス トを作成 し入試 リーディング問題を分析す る。 ( 5.3)
( 4 ) 最後 に OU Cの解答例 を分析 し未習語が どのよ うな解答 をされたかを探 る 。(5. 4)
5. ̲結 果
5. 1 KYO ′OU C .HO Kの総語数 と異語数 表 2
ー \ 総語数( 1 ) 異語数 ( 2 ) TTR( 2 ) /( 1 ) KYO 2 , 7 7 3 語 . 9 0 3 語 0 . 3 3
OUC. 1 , 4 8 0 語 5 8 3 語 0 . 3 9.
KYO は多肢選択式 の解答方法 をとるので文章読解 に関す る問題 はその選択 肢 も読解す ることを要求 している
。その結果,総語数,異語数 は記述式解答方 法をとる OU C ,HOK に較べ約 2 倍弱 となっている 。OU Cは総語数 1, 4 8 0 語の 中に Hear i ng,Di ct at i on のスク リプ ト 3 5 7 語 を含んでいる。従 って, Hear i ng , Di ct at i on を選択 しない数学 ・英語類 の総語数 は 1 , 1 2 3 語,異語数 は 4 8 7 語 と なる
。TTR( 6 ) を読 みやす さの指標 と して比 較 す る と読 み易 い順 に KYO , O U C,
( 6 ) 語嚢の大 きさを比較す るときに分析 された言語材料中の総語数が異 なる場合,異語
数 ( Type ) と総語数 ( Toke n) の割合 ( TypeToke nRat i o‑TTR) をとって比較
す る。この値 は文章の読みやす さの指標であるといわれている。( 値の低 いものはど
よみやすい。) ( 竹蓋 ,1 9 8 1 )
英語入試問題の計量的語嚢分析 レポート β7
HOK となる。これ らの総語数,異語数 ,TTR を UNI CORN I, Ⅱ ,ⅡB と比較 してみる。まず UNI CORN 全体を概観す ると表 3 , 4 のようになるが入試問題 とは総語数が違 いす ぎるので, TTR は比較 の対象 にな らない。
表 3 教科書本文+練習問題+まとめ+文法+発音
総語数 異語薮 TTR.
UNⅠ CORNⅠ 2 1 , 8 9 7 語 2 , 1 2 7 語 0 . 0 9 7 UNⅠ CORNⅠ Ⅰ 2 9 , 7 9 2 語 ‑ 3 , 0 4 4 語 0 . 1 0 2 ‑
そ こで,総語数 の大 きさが ほぼ同 じであ る UNI CORN の各 レッス ンを単位 に比較 してみると次のようになる。
表 4
Le s s on 数 竃 品 数 品 数
UNⅠ CORNⅠ 1 7 1 , 2 3 8 語 ̲ 3 9 2 語
UNⅠ CORNⅠ Ⅰ 1 7 1 , 6 2 4 語 5 0 0 ̲ 請 UNⅠ CORNⅠ Ⅰ B 1 1 2 , 3 0 5 語 6 0 0 語
この表か ら 1 レッス ン ( 本文 +練習問題他)の平均総語数 は UNI CORNI と
Ⅱで は 3 8 6 語のひ らきがあることがわか る。 UNJ CORN Ⅱと ⅡB ではその差 が 6 8 1 語 とな って い る
。各 レッス ンの平均総語数 を入試 問題 と比 較 す ると
KYO の総語数 は UNI CORN ⅡB の各 レッス ンの平均総語数 と比較的近 いが さ らに 4 6 8 語 多 い。 OU Q, HOK の総 語 数 は UNI CORN I の後 半 ま た は UNI CORN Ⅱの・ レッス ン平均総語数 と近 いことがわか る
。受験生 が 9 0 分か ら 1 2 0 分 の試験時間 に直面す る英語語嚢 の大 きさは,各教 科書 の各 レッス ンの大 きさとはぼ同上 であるとい うことがで きる
。限 られた時 間内に今 までの授業では何回かにわけて読解 していたテキス トと練習問題やま
とめと同 じ量 を読 まなければな らない受験生の心理的負担 は大 きい。
5. 2 リーデ ィング問題での 1 文の長 さと語数
文章 の読 みやす さを測 るのに r e adabi l i t y とい う尺度 が よ く用 い られ る
。r e a dabi l i t y とは,ある文章が どの くらい読みやすいか,理解 しやすいかを示す 指標である
。又,文章構成要素がその文章 の難易度 にどの様 な割合で関係 して いるかを示す指標で もある。今 までに提案 された r e adabi l i t y の公式 は 3 0 種類 を越 える。高梨 &高橋 ( 1 9 8 7 ) では,様々な r e adabi l i t y 公式を検討 しその中 か ら読解 に影響す る文章内要素 と して公式 に取 り入れ られた ものを列挙 してい る。語 の平均的長 さ,異語 の割合,セ ンテ ンスの平均的長 さ,親近感,文章全 体の音節数,人称代名詞の数,接辞の数,前置詞句 の数,語嚢表 に基ず く難語 数,単文 あるいは複文の使用頻度,内容の密度及 び意外性,図解 の数,語嚢 の 抽象度,文章の構成様式,内容間の相互関係 など 1 5 の要素である。 その 1 5 要 素の うちで圧倒的に多 くの r e ada bi l i t y 公式で用 い られているのが文 の長 さと 単語の難易度である
。文の長 さか らその統語的複雑 さをかなり予測で きるか ら
である。
ここでは以下,文の長 さと単語 の難易度 を中心 に KYO,OUC,HOK の入試 問題 を分析す る。文の長 さを文章を読んで答え る リーディング問題 に的を絞 っ て観察す ると,いわゆる文章問題 は KYO5 題, OUC3 題, HOK3 題 あ り, そ れぞれの文数, 1 文の平均語数,, 総語数 は次のようになっている。
表 5 人試問題の中のリーディング問題
KYO
問題 総文数 認 諾 総語数
文 1 8 8 3 9 1 2 1 3 2
英語入試問題の計量的語嚢分析 レポー ト 89
問題 総文数 誤 ) 総語数
文 3 6 4 日 H= Hq H叩 語 00 2 00 1 2 4 請 2 5 3 7 4 1 日日 間∬ ︼堅 2 1 1 語 1 2 0 甘軌 間此 つiU つり 聖 霊
前述 したように KYOの文章問題 の選択肢 ははとんどがまとまった文 になっ てお り受験生 は読解す ることを要求 されている
。それ故 にこの報告ではこれ ら の選択肢 もテキス トの一部 と考え本来のテキス トの文数 に加えている 。 3 種類 の試験 問題 を比 べ ると文 の長 さで は O U C問題 2 ( 2 5 . 4 6 語) ,HOK 問題 1 ( 2 1 . 7 2 語) ,KYO問題 5( 2 0 . 0 0 語)が 1 文 2 0 語以上の平均語数 とな っている。
その内容 も OU C 「イギ リス人の冗談 について」,HOK 「 労働時間について」, KYO 「 男女 の家庭内分業 について」と評論文か ら題材が取 られている
。また, 総語数 では HOK の問題 3 が一番多 いが 1文 の長 さでは平均 1 3 . 1 3 語 と最短 に なっている
。これは問題文の大半 を会話文が占めるためで全体 は長 いが難易度 はさほど高 くないと思われ る. I1 文平均の長 さが最長 なのは O U Cの問題 2 の
2 5 . 4 6 語 であ る
。こち らの方 が総語数 の多 い HOK問題 3 よ りは難解 であると いえるだろう
。1 文を構成す る語数 の分布をグラフに表す と次 のようになる
。KYO
Ⅹ 6 5 . 0 0 . 0
HOK
Ⅹ 6 5 . 0 0 . 0 x . 6 5 . 0
上の図では,横軸 は 1 文を構成す る語数,縦軸 は文の数 を示 している。横軸 の 1 目盛 りは 6 . 5 語,縦軸の一 目盛 りは 2 . 3 文である。HOK を例 に取 ると 1 文 約 6 . 5 語で構成 されている文が約 4 . 6 文あるということになる 。KYO には 1 文
1 2 語前後の文が多
い。3 9 語以上 の語 はない。KYOの最長文 は 3 8 語か らなる
。O