差を求め,その変化値を終了判定に使用する潜在ランク理論版標準誤差低減量基準
(Standard Error Reduction criterion LRT version, SER-LRT)を提案する.
なお,初期設定に関しては,KN-CATの初期テストレット方式は採用せず,単に受験者 の能力確率分布を一様分布とする方式を採用した.すなわち,モデルのランク数をQとす ると,初期のRMPの各要素は1 / Q とする方式である.これはKN-CATの初期テストレッ トの能力推定時の初期値と同じである.
第2節 正答確率
RMPi,能力ランクRiの受験者iがアイテム特性IRPjを持つアイテムjを受験したときの 正答確率は,第2章の式2.2 でIRPベクトルのRiの要素として示したが,この他にも正答 確率を定義することは可能である.それは,IRPとRMPの要素同士の積の和を正答確率 とする,
(5.1)
である.受験者の能力を推定中のCATのプロセスでは暫定的なRMPは各ランクの確率 が大きく,それを反映した正答確率となる特徴があり,CATのアルゴリズムの中で正答確率 を計算する場合に有効である.一方,式2.2の正答確率は,確定した能力ランクの受験者 の正答確率を計算する場合に有効で,モンテカルロシミュレーションで回答を生成する場 合などに用いる.
第3節 識別力ベクトルの定義
項目応答理論のアイテムの識別力は,項目特性曲線の傾きであるが,潜在ランク理論の 尺度は順序尺度であるため,隣接する各ランクの間隔は不定であり,傾きを計算することは 意味がない.そこで隣り合うランクの正答確率の差を識別力に相当すると考える.しかし,
ので幾何平均ではなく算術平均をとる.さらに,各ランクにおける識別力を要素とした識別 力ベクトルδを定義する.モデルのランク数をQとしたとき,RMPiで表される能力を持つ受 験者iに対するアイテム特性IRPjを持つアイテムjの識別力ベクトルの各要素を
(5.2)
ただし, (5.3)
と定義する.それぞれの要素は,能力ランクqの受験者に対するアイテムjの識別力を意味 する.
第4節 情報量の定義
項目応答理論のアイテム情報量は2パラメータロジスティックモデルの場合,式3.1で定 義される.潜在ランク理論でも同様に,RMPiで表される能力を持ち,能力ランクRiを持つ 受験者iに対するアイテム特性IRPjを持つアイテムjの情報量を前節で定義したアイテム 識別力ベクトルδijを使って,
(5.4) と定義する.テスト情報量についても項目応答理論と同様に,n個のアイテムからなるテスト のテスト情報量Itestは,テストを構成するアイテム1からアイテムnまでのアイテム情報量の 総和として,
(5.5) と定義する.
第5節 アイテム選択
本研究では,項目応答理論のアイテム選択アルゴリズムから情報量最大化基準
(Maximum Information criterion, MI)の考え方を潜在ランク理論に適用したLRT版情
報量最大化基準(Maximum Information criterion LRT version, MI-LRT)を提案す る.
MI-LRTアルゴリズムは,k番目に出題するアイテムとして1からk-1アイテムまでの受
験結果で推定した受験者iの能力ランクRi(k-1)とIRPi(k-1)から求めたIj(Ri(k-1))を最大にする アイテム,
(5.6)
を選択する.なお,pij(k-1)は式5.2で与えられている正答確率である.MI-LRTアルゴリズム を疑似コードで表現すると,
MI-LRT(RMP, 未出題アイテムリスト) Info_max = 0.0
Item_selected = “N/A”
WHILE未出題アイテムリストにアイテムあり DO 未出題リストからアイテムjを一つ取り出す Info = δjRi2pijqij # 式5.4
IF info > info_max THEN DO Info_max = info
Item_selected = アイテムj ENDIF
ENDWHILE
RETURN Item_selected (5.7)
となる.
第6節 能力推定
本研究では,ML法の尤度にテスト情報関数の平方を重み付けしたWarmの重み付け 最尤度推定法(Weited maximum likelihood estimation method, WML )の考え方を潜 在ランク理論に適用し,先に述べたテスト情報量を使って再定義した重み付け最尤度推定
法(Weighted maximum likelihood estimation method LRT version, WML-LRT)を 提案する.
第2章で紹介した最大事後分布法(Maximum A Posteriori, MAP)の重みを事後分布 ではなく,テスト情報量の平方に置き換えた ものが WML である(村木, 2011).
WML-LRTでは,式5.5で定義したテスト情報量を使い,各ランクの尤度,
(5.8)
を求め,最大の尤度となるランクを受験者の能力ランク,
(5.9)
を得る.
また,受験者のRMPベクトルの各要素は,
(5.10)
で与えられる.
WML-LRTの推定手順を疑似コードで示すと,
LHtotal = 0.0 w = 1
FOR q TO Q DO LHq_max = 0.0 LHq = 1.0 FOR j TO n DO
IF uij == 0 THEN DO LHq = LHq * (1 - vqj) ELSE DO
LHq = LHq * vqj (5.11)
ENDIF ENDFOR
LHq = LHq * SQRT[ Itest(n)(q)]
IF LHq > LH_max THEN DO LHq_max = LHq
w = q ENDIF
LHtotal = LHtotal + LHq
ENDFOR
FOR q TO Q DO
RMPq = LHq / LHtotal
ENDFOR
RETURN w, RMP となる.
第7節 終了判定
本研究では,項目応答理論の標準誤差低減量基準(Standard Error Reduction criterion, SER)の考え方を潜在ランク理論に適用し,先に述べたテスト情報量による標準 誤差を使って再定義した潜在ランク理論版標準誤差低減量基準(Standard Error Reduction criterion LRT version, SER-LRT)を提案する.
潜在ランク理論における標準誤差を項目応答理論の標準誤差に倣って
(5.12) と仮定する.これを終了判定に使用する.SER は,k番目のアイテム受験時の SEが k-1 番目のアイテム受験時からどれほど減少したか,その低減量がしきい値 ε を下回った時終 了と判定する.すなわち,
SER(k) = SE(k) – SE(k-1) < ε (5.13)
を満たしたとき能力推定の過程を終了させる.
第8節 おわりに
潜在ランク理論におけるアイテムの識別力を新たに提案した.これを基にして潜在ランク 理論に基づくCATのアルゴリズムに使用する統計量として項目応答理論におけるアイテム 情報量に相当する統計量のアイテム情報量を,さらに,それに基づいたテスト情報量を定 義した.
提案したアルゴリズムは,MI-LRT,WML-LRT,SER-LRTのいずれもアイテム情報量,
あるいはテスト情報量に基礎を置いたアルゴリズムであるが,この情報量は CAT のアルゴ リズムを記述するうえでの便宜上のものであり,必ずしもその名の意味するものではない.
LRT-CATのアルゴリズムが項目応答理論に基づくCAT同様に機能するならば,定義した
アイテム情報量もそれに近いものになっている可能性があるといえるであろう.