• 検索結果がありません。

LRT-CAT アルゴリズムの提案

I. 理論編

4. 潜在ランク理論に基づく CAT(LRT-CAT)

4.2. LRT-CAT アルゴリズムの提案

表5 RM(ミスフィット指標)に基づく望ましくない項目の除去

Measure SE Infit MNSQ Infit Zstd Outfit MNSQ Outfit Zstd

Vgm0047 1.28 0.17 1.25 3.06 1.49 3.86

Vgm0042 1.75 0.19 1.18 1.55 1.50 2.81

Vgm0038 1.28 0.16 1.21 2.65 1.48 3.84

Vgm0008 1.64 0.18 1.19 1.74 1.48 2.92

Vgm0028 1.49 0.17 1.18 1.92 1.47 3.19

Vgm0007 1.31 0.16 1.24 2.88 1.49 3.82

Vgm0061 0.92 0.15 1.14 2.31 1.24 2.60

Vgm0014 -2.53 0.25 1.00 0.04 1.49 1.60

Vgm0065 2.39 0.21 1.10 0.69 1.38 1.61

Vgm0032 1.44 0.17 1.16 1.82 1.49 3.45

Vgm0071 2.03 0.19 1.12 1.02 1.30 1.59

Vgm0056 2.28 0.21 1.08 0.62 1.34 1.52

Vgm0053 1.28 0.16 1.18 2.28 1.33 2.74

数が5以下の場合は,アイテムバンクから各ランクの問題を1問ずつランダムに選び出題するのが よいだろう.

離散的なLRTでも,IRP指標βを利用して,様々な困難度の項目を組み合わせて項目の選定を行 うことは実用上十分可能であり,IRTやRMよりもむしろ簡便である.

(2) How to CONTINUE

潜在ランクの中央値付近の複数問からなるテストレット(分析する潜在ランク数が5以下の場 合は,各潜在ランクから1問ずつとする)に対する受験者i の応答ベクトルを

u

iとし,テストレ

ットに選ばれた項目のIRP(行ベクトルυj)を集めた行列を

V

( )0 ,受験者が潜在ランクRqに所

属する確率をFqとすると,次式により受験者iの暫定RMP(ベクトル

p

i)が求まる.

( )

{ = = 1 ,

(0)

} ( × 1 )

= p

iq

p

iq

P F

q i

Q

i

u V

p

( ) (

( )

)

(

( )

)

=

=

=

Q

r i r r

q q i i

q

p

p F

P

1

0 0 )

0

,

(

1 π

π υ u υ u V

u

(32)

ここで

π

qは,潜在ランクRqに所属する事前確率であり,初期値は一様分布

π

q=1/Q (q=1,2,…,Q)

とする.

この受験者i の暫定潜在ランクは,RMP(ベクトル

p

i)の中で,最も値の大きい潜在ランクで あるから,IRP指標βがこの暫定潜在ランクと同じ項目をアイテムバンクから出題するという方 法も考えられる.しかし,LRTがIRTと大きく異なるのは,前述したように,受験者の特性を,

一義的に推定された潜在ランクとしてとらえるだけでなく,RMPとして多義的に表現できる点 である.このLRTの特徴を生かすために,本研究ではRMPに基づき項目を選択する方法として,

暫定RMPとIRP の差分ベクトルの積和平均による項目選択ルールを提案する.

いま,ランク数をQとし,受験者i がn項目解答した時点の暫定RMPを

p

(in)

= [ p

i(1n)

p

iQ(n)

]' ( Q × 1 )

(33)

とする.ここで,

p

iq(n)は,受験者iのRqに対する暫定的な所属確率である.

また,アイテムバンクにあるj 番目の項目のIRPを

υ

j

= [ υ

j1

 υ

jQ

]' ( Q × 1 )

(34)

とする.ここで,

υ

jqはRqに所属する受験者の項目j に対する正答確率である.さらに,IRPの差 分ベクトル

) 1 ) 1 ((

]'

[

1 1

− ×

= δ

j

δ

jQ

Q

j

δ

(35)

を計算する.ここで,

) 1 , , 2 , 1

1

− ( = −

=

+

q Q

δ

jq

υ

jq

υ

jq

(36)

である.

そして,

p

(ni )に対する識別度の高さを以下の式を用いて評価する.すなわち,

2

1 1

) (

1 1

1 ) ( )

(

∑ ∑

= +

=

+

=

Q

q jq

n iq Q

q jq

n n iq

j

δ δ p

λ p

(37)

である.

このλの値が大きいほど受験者i に対する識別度が高いことを示す.これはIRTの項目選択ル ールについて論じているVan der Linden (1998)の中に出てくるMaximum Expected Posterior

Weighted Information という方法に相当すると考えられる.

識別度の高いもの,すなわち,λの値が最大のものから選択する方法も考えられるが,CAT 初期で識別度の高いものから実施すると,アイテムバンクがあまり大きくない場合,CAT終期で RMPが収束し始めたときに,識別度の高いアイテム(局所的に(受験者の暫定ランクの付近で)

急峻なIRPを持つ項目)がなく,かえって効率が悪くなることが懸念される.CAT初期の暫定RMP はなだらかな形状であると考えられるので,識別度の低いものを実施し,識別度の高いものを CAT終期に温存しておく方がよいのではないだろうか.本研究のLRT-CATの項目選択ルールとし ては,アイテムバンクの中でλが最小のものから選択することを提案する.

アイテムバンクに蓄えられた項目数が多くなると,計算負荷がサーバーにかかり過ぎるので,

本研究ではIRP指標βが受験者i の暫定の潜在ランクの推定値±1の項目に限定してλの値を計算 し,その中で最小となる項目を選択することとした.

(3) How to STOP

IRT-CATの場合,θのSEが十分小さくなった場合に推定が収束したと判断して終了するか,あ

らかじめ決めておいた項目数(m)に達した場合に終了にするのが一般的である.LRT-CATの場

合,項目数がm に達した場合に終了にする方法の他に,RMPの変化が一定以下になった場合に,

RMPの推定が収束したと判断して終了させる方法が考えられるだろう.一般的にCATの初期の段 階ではRMPの変化は大きく,受験項目数が増えるにしたがって,その変化は小さくなると考え られるからである.

) (n

p

i

p

(in+1)の差ベクトルの要素のうち,絶対値の最大値

|

-|

max

( ) ( 1)

)

( +

=

jqn jqn Q

q n

jq

p p

μ

(38)

の値を基準として,たとえば

μ

が0.05未満になったときにCATを終了させるという条件で実施す ることも可能である.終了条件をどのようにすべきかについては,実践編の8.1で,シミュレー ション研究の結果を踏まえ再検討を行う.