• 検索結果がありません。

8.2.1 分析対象

本研究では,高校一年生の基礎学力を測定するための多枝選択形式のテストを使用する。

本研究で使用したテストデータは,2008年と2009年度に実施された,英語,国語の2教科 のテストデータである。なお2008年と2009年で同一のテスト項目が用いられている。

表 8-1. 用いたテストデータ 2008年度

英語

2009年度 英語

2008年度 国語

2009年度 国語 項目数 56 56 43 43 受験者数 35779 41381 34773 40270

平均 35.020 34.063 26.843 26.839

標準偏差 9.249 9.288 6.714 6.856

100

8.2.2 基本的な分析手順

本研究では 3つの分析を行った。 (1) 共通項目の項目識別力に着目した分析, (2) 受験 者数に着目した分析, (3) 受験者集団の能力値差に着目した分析である。ただし各分析に 共通して,共通項目数が減少した場合,どの程度等化の精度が低下するのかについて検討し ている。これらの3つの分析に共通する分析手順について説明する。

まず,受験者数を一定にする。2008年度と2009年度のテストデータから,それぞれ同一 の受験者数分のデータを無作為に抽出した。

図 8-1. 全てが共通項目である元データ

図 8-2. 非共通項目を設けるようにテストデータを削除した場合

101

次に非共通項目を作成する。非共通項目とは共通項目ではない項目を指す。本研究で用い る 2 つのテストデータはすべてが共通項目となっている。これを簡易化して説明するため に図 8-1. に示した。この図は10人の受験者集団Aが9項目のテストXを,10人の受験者 集団Bが9項目のテストYを受験したテストデータを表している。テストXとテストYは すべて同一の項目となっている。

共通項目デザインによる等化を行うテストデータとしてすべてが共通項目であるという のは考えにくい。なぜなら,すべての項目が同一ならば2つのテストの受験者を同一の集団 とみなして分析することができるため,等化の必要がないからである。そのためテストデー タを部分的に欠損させ,2つのテスト間に非共通項目を設定した。共通項目がテスト全体の 半分を占めるようにテストデータの削除を行った。これを図式したものとして図 8-2. に示 す。

図 8-2. では,点線で囲まれたテストデータを削除することで非共通項目を作っている。

この操作で得られたテストデータをここでは基準テストと呼ぶ。基準テストを等化し,受験 者iの能力パラメタを求める。ここで得られる受験者の能力パラメタを𝜃𝑖とする。なお,能 力パラメタの分析にはBILOG-MG (Zimowski, Muraki, Mislevy, & Bock, 2003) を用いた。

次に基準テストよりも共通項目数の少ないデータを作成する。その際全体の項目数を変 えずに,共通項目の数を減らしている。全体の項目数を変えないのは,項目数が変わること による等化の精度への影響を統制するためである。

図 8-3. では,Y年度テスト項目のY4の項目を新たに設けた項目Y10としている。この ことにより,X4とY4は本来共通項目であるが,Y4をY10として非共通項目とみなして分 析することになる。これにより全体の項目数を変えずに共通項目の数を減らすことができ る。以上の工程で共通項目数を減らし,共通項目数が2, 4, 6, 8, 10, 12の場合のテストデー タを作りそれぞれ等化を行う。また,等化後に得られるそれぞれの受験者iの能力パラメタ

図 8-3. 共通項目の一部を非共通項目とみなした場合

102 を𝜃̂𝑖とする。

最後に等化の精度を算出する。等化の精度が悪くなると,基準テストから得られた受験者 iの能力パラメタ𝜃𝑖と,共通項目数を減らした場合のテストデータから得られた受験者iの 能力パラメタ𝜃̂𝑖には差が生じると考えられる。𝜃𝑖と𝜃̂𝑖の差の指標として,De Ayala, Plake &

Impara (2001) を参考に次式とした。

RMSE = √∑ (𝜃𝑖− 𝜃̂𝑖) 2

𝑛 (5.1)

RMSEとは,平均二乗誤差 (Root Mean Square Error) のことである。これは比較したい値 同士の間に平均的にどれだけ差があるかを示したものである。

式中のnはテストの総受験者数を指す。また𝜃𝑖は,基準テストで得られた受験者iの能力 パラメタを,𝜃̂𝑖は共通項目数を減らしたテストデータから得られた受験者iの能力パラメタ を表す。これを各受験者で差を取り,2乗したものを平均した値の平方根がRMSEとなる。

この RMSE が共通項目の項目識別力,受験者数,受験者集団の能力値差によって,どの ように変化するのか3つの分析によって確認する。

以上の手順をまとめると,次のようになる。

手順1: それぞれの年度の受験者数を固定する。

手順2: 非共通項目を設け,基準テストを設定する。

手順3: 基準テストよりも,共通項目数の少ないデータを設定する。

手順4: それぞれのデータから得られた能力パラメタから等化の精度を求める。

8.2.3 共通項目の項目識別力に着目した分析の分析手順

この分析では,共通項目の項目識別力の高低が等化の精度にどの程度影響を与えている のかについて検討する。ここでは,それぞれのテストデータの受験者数を2000人として分 析を行った。これは大友 (1996) にある3PLMに必要とされる最小標本数が1000から2000 であることを根拠にしている。この研究では,2PLMによる分析を行うが,標本数2000で あれば2PLMの分析として十分な標本数が得られると考えられる。

8.2.2節における手順 3では,共通項目を非共通項目にするよう,テストデータの整形を

行っている。しかしどの項目から非共通項目にするかによって,等化の精度が変わることが 予想される。

そのため,あらかじめ元々のテストデータを分析し,テストの項目識別力を得た上で,ど の共通項目から非共通項目にするのかを検討した。

項目識別力を得るために,1つのテストデータあたり無作為に25000人ずつ抽出し,2PLM による分析を行った。

103

得られた項目識別力の小さい順に共通項目を並び替える。このテストデータから,項目の 弁別力の違いをもとに3種類のテストデータを作る。

まず共通項目として項目識別力の低いものを残すため,項目識別力の高いものから順に2 つ共通項目を減らす項目識別力の低グループを作る。

次に共通項目として項目識別力の高いものを残すため,項目識別力の低いものから順に2 つ共通項目を減らす項目識別力の高グループを作る。

最後に共通項目として項目識別力の中程度のものを残すため,共通項目の項目識別力の 最も高いものと最も低いものを順に 1 つずつ共通項目減らす,項目識別力の中グループを 作った。

このそれぞれについて,共通項目数がテスト全体の半分を基準テストの共通項目数とし,

共通項目数を12, 10, 8, 6, 4, 2と変化させた場合,受験者集団の能力パラメタがどのように 変化するのかについて検討する。基準テストの共通項目数は,英語は20項目,国語は15項 目となっている。共通項目数がテスト全体の半分を占める場合を基準としたのは,現実のテ スト実施場面で考えられる共通項目数として十分大きい数であると考えられるためである。

ここでは,RMSEについて計18のケースを検討することになる。

8.2.4 受験者数に着目した分析の分析手順

この分析では,できるだけ項目識別力の影響を受けないように統制を加え,受験者数が等 化の精度に与える影響について考える。このためには8.2.3節で紹介した,共通項目に残す 項目の項目識別力の高,中,低のいずれかにそろえる必要がある。ここでは中程度の方法に 揃えることにした。これは項目識別力が等化の精度に特に大きな影響を与える場合,項目識 別力の高,低にそろえると,RMSEの値が極端に高いものや低いものになり,比較検討する のが難しくなることが考えられるためである。

比較する受験者数は500,1000,2000,5000の4つとした。これらのそれぞれについて,

共通項目数が2, 4, 6, 8, 10, 12の6つのテストデータと,共通項目数が半分である場合の受 験者の能力パラメタについて調べる。そのため計24のRMSEを検討することになる。

8.2.5 受験者集団の能力値差に着目した分析の分析手順

8.2.2節の手順 1では受験者数を統一するため,無作為に受験者を抽出していた。ここで

は受験者集団で能力値差がある場合を想定するため,受験者をある能力パラメタの範囲で 抽出することにする。このため,元々のデータについてIRTにより分析し,受験者の能力パ ラメタを求めておく。

次に,受験者の抽出方法を3つに分け,テストデータを作成する。受験者集団の能力値差 が「小さい」,「中程度」,「大きい」の3種類のテストデータを作成する。

104

能力値差小:両方の年度で受験者を無作為に抽出する。

能力値差中:一方の年度は θが2以下,もう一方の年度はθが-2以上の受験者を無作為 に抽出する。

能力値差大:一方の年度は θが1以下,もう一方の年度はθが-1以上の受験者を無作為 に抽出する。

これらのそれぞれについて,共通項目数が2, 4, 6, 8, 10, 12の6つのテストデータと,基 準テストの能力パラメタについて調べる。ここでは,計18のRMSEを比較することになる。

また,受験者数は2000に,共通項目の項目識別力については,8.2.4節と同様に,中程度の ものに統一した。

ドキュメント内 理系記述式テストへのIRT適用課題の検討 (ページ 106-111)