LCI 検定 - LCI 検定 - テスト項目分析への応用

第 3 章 LCI 検定

3.3 LCI 検定

前節の数値実験により，能力潜在変数を周辺化して二項目だけで独立性を検定する従来手法では，局所独立な二項目を局所従属と判定する誤りが多くなるという現象が示された．

この現象をグラフィカル・モデル[19]のアプローチを用いて説明する．グラフィカル・モデルとは，複雑な因果構造における条件付き独立性の推論に用いられるアプローチである．

グラフィカル・モデルは，確率変数をノードで，変数間の確率的因果をアークで表現する．

たとえば，二つの確率変数XとY があり，Xを所与とするY の条件付き確率P(Y|X)が Xの値によって異なるとき，グラフィカル・モデルではXというノードからY というノードにアークを引く（図3.13）．このとき，XをY の親ノードといい，Y をXの子ノードという．

グラフィカルモデルは，ノードに対する確率変数の型（離散型であるか連続型であるか）

や，アークに対する条件付き確率の関数型に依存しないという好ましい性質がある．本節では，従来手法の誤りをグラフィカル・モデルを用いて説明し，その上で新しい局所独立性検定を提案する．

3.3.1 従来の局所独立性検定のグラフィカル・モデルによる説明

グラフィカル・モデルを用いてIRTモデルを表現すると図3.14のようになる（5項目のテストの場合）．このグラフで局所独立性は，能力潜在変数θからすべてのX_iにアークが存在することと，任意のiとi^′に対してX_iとX_i′ の間にはアークが存在しないこととして表現されている．

従来の局所独立性検定は，検定対象以外のすべての項目間に局所独立性を暗黙に仮定している（図3.15）．そのため，仮定に反し検定対象以外の項目間に従属関係が存在する構造（図3.16）では，検定が正しく行われない．

0 100 200 300 400 500 600 700

0 2 4 6 8 >10

Frequency

(a) completely independent (b) one pair dependent (c) two pairs dependent

図 3.11: 局所独立な項目間のG²統計量の度数分布（項目数: 7）

0 50 100 150 200 250 300 350 400

0 2 4 6 8 >10

Frequency

(d) completely independent (e) one pair dependent (f) nine pairs dependent

図3.12: 局所独立な項目間のG²統計量の度数分布（項目数: 20）

X Y

図3.13: グラフィカル・モデルによる変数Xから変数Y への確率的因果の表現

X2 X3

X1 X4 X5

図3.14: グラフィカル・モデルを用いたIRTモデルの表現

対象 X2 X3

θ X1

X4 X5

図3.15: 従来の局所独立性検定が暗黙に仮定する構造

対象 X2 X3

θ X1

X4 X5

図3.16: 検定対象以外の項目間に従属関係が存在する構造

従来の局所独立性検定の正しさが検定対象以外の項目の構造に依存する問題を解決するために，本論文ではグラフィカル・モデルで変数間の従属関係を特定する方法と同様のアプローチを用いる．グラフィカル・モデルでデータから変数間の従属関係の構造を学習するために，厳密アルゴリズム[14] [31] [40]が存在する．しかし，構造学習はNP困難な問題であり，これらの手法で扱える変数の数は30前後である．したがって厳密アルゴリズムは，より多くの項目が存在するテストには適用できない．

もう一つのアプローチとして，条件付き独立性検定（Conditional Independence Test;

以下，「CI検定」とする．）とよばれる方法がある．CI検定を用いる手法として代表的なものに，PCアルゴリズム[33]，TPDAアルゴリズム[7]，MMPCアルゴリズム[35]などが挙げられる．本論文ではCI検定のアプローチを用いた局所独立性の検定を提案する．

CI検定では条件付き相互情報量を用いて変数間の従属関係を特定する．たとえば，三つ

の変数X, Y, Z があり，Zを所与とするXとY の従属関係（図3.17）の有無を検定する

とき，以下の条件付き相互情報量I(X;Y|Z)を計算する．

I(X;Y|Z) = ∑

P(Z =z)∑

∑

P(X=x, Y =y|Z =z)·

log₂ P(X=x, Y =y|Z =z)

P(X=x|Z=z)P(Y =y|Z =z) . (3.5) I(X;Y|Z)が十分小さな閾値εより小さい場合，XとY の間にZを所与とする従属関係はないとする．I(X;Y|Z)がε以上の場合，XとY の間にZを所与とする従属関係が存在することが多いが，従属関係がないこともあるので注意が必要である．グラフィカル・

モデルで，Z-X間およびZ-Y 間にアークがあり，X-Y 間にアークのない構造は，図3.18 のように，線形経路，分岐経路，合流経路の3種類がある．線形経路および分岐経路では I(X;Y|Z)が小さくなる．しかし合流経路ではI(X;Y|Z)が小さくならない．したがって，

I(X;Y|Z)がε以上の場合に，XとY の間にZを所与とする従属関係があるとみなすためには，ZがXとY の共通の子ノードでないことが必要となる．

条件付き相互情報量I(X;Y|Z)にサンプルサイズN の2倍を乗じたものをG²（= 2N· I(X;Y|Z)）とすると，XとY がZを所与として条件付き独立であるとき，G²はχ²分布に従う．これを利用し，XとY がZを所与として条件付き独立であるという帰無仮説を立ててχ²検定を行い，棄却されたらXとY にZを所与とする従属関係があるとみなすことができる．しかし，CI検定では多くの場合，以下の三つの理由により仮説検定を採用していない．第一の理由は，変数の数が多い場合，CI検定を行う回数が指数関数的に増

加し，検定の多重性の問題が深刻になるからである．第二の理由は，対象変数間の条件付き独立性を帰無仮説としてχ²検定を行うと，サンプルサイズが大きい場合，帰無仮説が棄却されやすくなり，変数間に条件付き従属性が多く検出されるからである．第三の理由は，仮説検定は条件付き独立性と条件付き従属性を対称に扱っていないためである．条件付き独立性を帰無仮説として検定する場合，帰無仮説が棄却された変数間には条件付き従属性があると積極的に主張できる．一方，帰無仮説が保持された変数間では，データが帰無仮説に矛盾しないことが示されたにすぎない．したがって，変数間の条件付き独立性を積極的に主張したい場合，仮説検定は不適切である．

PCアルゴリズム等におけるCI検定では，仮説検定の以上の特徴を考慮し，仮説検定の代わりに，適切な閾値εを設定して条件付き相互情報量I(X;Y|Z)をεと比較している．

すなわち，I(X;Y|Z)がε以上ならば，XとY にZを所与とする従属関係（または図3.18 の合流経路の関係）があるとする．逆に，ε未満ならば，XとY にZを所与とする従属関係はないとする．たとえばTPDAアルゴリズムにおけるCI検定では，サンプルサイズの大小にかかわらずεの値として0.01が有効であるとしている．PCアルゴリズムでは適切なεに関する言及がない．MMPCアルゴリズムでは，所与とする変数が少ない場合には χ²検定を行い，変数が多い場合には検定を行わずに条件付き独立としている．

CI検定で三変数の構造が図3.18のようになったとき，次の三つの場合には従属関係を分離できる．(1)線形経路において，Zが観測されない場合にはXとY は従属だが，Zが観測され値が固定されると，XとY が独立となる．(2)分岐経路において，Zが観測されない場合にはXとY は従属だが，Zが観測され値が固定されると，XとY が独立となる．

(3)合流経路において，Zが観測されない場合にはXとY が独立だが，Zが観測され値が固定されると，XとY が従属となる．これらの条件が成立することをd分離という．アークで結ばれたノードは，d分離でなければすべてd結合の関係にある．

3.3.3 CI検定のアプローチを用いた局所独立性検定

局所独立性検定をグラフィカル・モデルのCI検定の枠組みで行うことを考える．局所独立性検定の対象を項目iと項目i^′とし，これらの親ノード集合に対応する確率変数をX˜_ii′

とする．項目および能力潜在変数θは確率構造gを持つ（図3.19）とする．項目iと項目 i^′の局所独立性を検定するためには，構造gの仮定の下でθを所与とするX_iとX_i′ の条件付き相互情報量が必要である．しかし，構造gは一般的に未知であり，この条件付き相互情報量を正しく計算することは困難である．

ここで，構造gが真である場合，X˜_ii′を所与とするX_iとX_i′の同時エントロピーは，共

対象 X Y

図3.17: 変数Zを所与とするXとY のCI検定

X Z Y

線形経路

X Y

分岐経路

X Y

合流経路図 3.18: Z-X間およびZ-Y 間にアークがありX-Y 間にアークのない構造

…

X1 X2 Xm

Xi Xi'

対象

θ Xi-1 X i+1

…

図3.19: 構造gの例

通の子ノードでない変数を親ノード集合に追加しても変化しないという好ましい性質がある．故に，X_iとX_i′ の子ノードでないすべての変数の集合を

X^¬ⁱⁱ^′ = {X1, X2, . . . , Xi−1, Xi+1, . . . , Xi^′−1, Xi^′+1, . . . , Xm} (3.6) とすると，X^¬ⁱⁱ^′の変数がすべて互いに従属な構造（図3.20）を仮定した場合の，X^¬ⁱⁱ^′と θを所与とするXiとXi^′の条件付き独立性検定は，真の構造（図3.19）におけるXiとXi^′

の条件付き独立性検定と等しくなる．したがって，構造gが未知でも，X_iとX_i′の条件付き独立性を検定するためには，子ノードでないすべての変数を所与とする構造（図3.20）を仮定して条件付き独立性検定を行えばよい．

X^¬ⁱⁱ^′はm−2次元のベクトルである．各要素は0または1の値を取り得るため，X^¬ⁱⁱ^′ は，(0,0, . . . ,0)^t から (1,1, . . . ,1)^tまで 2^m⁻² 通りの値を取り得る．その j 番目（j = 0,1, . . . ,2^m⁻² −1）の値x^¬_jⁱⁱ^′ を，以下「項目iと項目i^′ の子ノードでないすべての変数へのj番目の反応パターン」あるいは単純に「j番目のパターン」とよぶ．

今，X^¬ⁱⁱ^′ =x^¬_jⁱⁱ^′ というパターンと，そのパターンから得られるθの点推定値θˆj を得たとする．項目数mがと受検者数Nが十分に大きく，

P(Xi, X_i′|X^¬ⁱⁱ^′ =x^¬_jⁱⁱ^′, θ) ≈ P(Xi, X_i′|X^¬ⁱⁱ^′ =x^¬_jⁱⁱ^′, θ= ˆθj) (3.7) と近似できる場合を考える．このときX_iとX_i′は，X^¬ⁱⁱ^′およびθと分岐経路を構成している（図3.21）ため，これらによってd分離されるか否か調べる場合，条件からX^¬ⁱⁱ^′ =x^¬_jⁱⁱ^′ もしくはθ= ˆθjの一方を消去できる．θˆjの正確な値を得ることはできないため，条件から θ= ˆθj を消去する（図3.22）．この構造におけるXiとXi^′ の条件付き独立性検定は，真の構造におけるX_iとX_i′ の条件付き独立性検定と等しくなる．

X^¬ⁱⁱ^′のすべての変数が互いに従属である構造をg_cとすると，X^¬ⁱⁱ^′を所与とするX_iと X_i′の条件付き独立性検定をCI検定の枠組みで行うためには，次の相互情報量を用いる．

I(X_i;X_i′|X^¬ii^′, g_c) = ∑

P(X^¬ii^′ =x^¬ii_j ^′|g_c)·

∑1 xi=0

∑1 x_i′=0

P(Xi =xi, Xi^′ =xi^′|X^¬ⁱⁱ^′ =x^¬_jⁱⁱ^′, gc)· log₂P(X_i =x_i, X_i′ =x_i′|X^¬ⁱⁱ^′ =x^¬_jⁱⁱ^′, g_c)·

P(X_i=x_i, X_i′ =x_i′|X^¬ⁱⁱ^′ =x^¬_jⁱⁱ^′, g_c)

P(X_i =x_i|X^¬ii^′ =x^¬ii_j ^′, g_c)P(X_i′ =x_i′|X^¬ii^′ =x^¬ii_j ^′, g_c) , (3.8)

ドキュメント内テスト項目分析への応用 (ページ 33-42)