第 3 章 LCI 検定
3.3 LCI 検定
前節の数値実験により,能力潜在変数を周辺化して二項目だけで独立性を検定する従来 手法では,局所独立な二項目を局所従属と判定する誤りが多くなるという現象が示された.
この現象をグラフィカル・モデル[19]のアプローチを用いて説明する.グラフィカル・モ デルとは,複雑な因果構造における条件付き独立性の推論に用いられるアプローチである.
グラフィカル・モデルは,確率変数をノードで,変数間の確率的因果をアークで表現する.
たとえば,二つの確率変数XとY があり,Xを所与とするY の条件付き確率P(Y|X)が Xの値によって異なるとき,グラフィカル・モデルではXというノードからY というノー ドにアークを引く(図3.13).このとき,XをY の親ノードといい,Y をXの子ノード という.
グラフィカルモデルは,ノードに対する確率変数の型(離散型であるか連続型であるか)
や,アークに対する条件付き確率の関数型に依存しないという好ましい性質がある.本節 では,従来手法の誤りをグラフィカル・モデルを用いて説明し,その上で新しい局所独立 性検定を提案する.
3.3.1 従来の局所独立性検定のグラフィカル・モデルによる説明
グラフィカル・モデルを用いてIRTモデルを表現すると図3.14のようになる(5項目の テストの場合).このグラフで局所独立性は,能力潜在変数θからすべてのXiにアークが 存在することと,任意のiとi′に対してXiとXi′ の間にはアークが存在しないこととし て表現されている.
従来の局所独立性検定は,検定対象以外のすべての項目間に局所独立性を暗黙に仮定し ている(図3.15).そのため,仮定に反し検定対象以外の項目間に従属関係が存在する構 造(図3.16)では,検定が正しく行われない.
0 100 200 300 400 500 600 700
0 2 4 6 8 >10
Frequency
G2
(a) completely independent (b) one pair dependent (c) two pairs dependent
図 3.11: 局所独立な項目間のG2統計量の度数分布(項目数: 7)
0 50 100 150 200 250 300 350 400
0 2 4 6 8 >10
Frequency
G2
(d) completely independent (e) one pair dependent (f) nine pairs dependent
図3.12: 局所独立な項目間のG2統計量の度数分布(項目数: 20)
X Y
図3.13: グラフィカル・モデルによる変数Xから変数Y への確率的因果の表現
X2 X3
θ
X1 X4 X5
図3.14: グラフィカル・モデルを用いたIRTモデルの表現
対象 X2 X3
θ X1
?
X4 X5
図3.15: 従来の局所独立性検定が暗黙に仮定する構造
対象 X2 X3
θ X1
?
X4 X5
図3.16: 検定対象以外の項目間に従属関係が存在する構造
従来の局所独立性検定の正しさが検定対象以外の項目の構造に依存する問題を解決する ために,本論文ではグラフィカル・モデルで変数間の従属関係を特定する方法と同様のア プローチを用いる.グラフィカル・モデルでデータから変数間の従属関係の構造を学習す るために,厳密アルゴリズム[14] [31] [40]が存在する.しかし,構造学習はNP困難な問 題であり,これらの手法で扱える変数の数は30前後である.したがって厳密アルゴリズ ムは,より多くの項目が存在するテストには適用できない.
もう一つのアプローチとして,条件付き独立性検定(Conditional Independence Test;
以下,「CI検定」とする.)とよばれる方法がある.CI検定を用いる手法として代表的なも のに,PCアルゴリズム[33],TPDAアルゴリズム[7],MMPCアルゴリズム[35]などが 挙げられる.本論文ではCI検定のアプローチを用いた局所独立性の検定を提案する.
CI検定では条件付き相互情報量を用いて変数間の従属関係を特定する.たとえば,三つ
の変数X, Y, Z があり,Zを所与とするXとY の従属関係(図3.17)の有無を検定する
とき,以下の条件付き相互情報量I(X;Y|Z)を計算する.
I(X;Y|Z) = ∑
z
P(Z =z)∑
x
∑
y
P(X=x, Y =y|Z =z)·
log2 P(X=x, Y =y|Z =z)
P(X=x|Z=z)P(Y =y|Z =z) . (3.5) I(X;Y|Z)が十分小さな閾値εより小さい場合,XとY の間にZを所与とする従属関 係はないとする.I(X;Y|Z)がε以上の場合,XとY の間にZを所与とする従属関係が存 在することが多いが,従属関係がないこともあるので注意が必要である.グラフィカル・
モデルで,Z-X間およびZ-Y 間にアークがあり,X-Y 間にアークのない構造は,図3.18 のように,線形経路,分岐経路,合流経路の3種類がある.線形経路および分岐経路では I(X;Y|Z)が小さくなる.しかし合流経路ではI(X;Y|Z)が小さくならない.したがって,
I(X;Y|Z)がε以上の場合に,XとY の間にZを所与とする従属関係があるとみなすた めには,ZがXとY の共通の子ノードでないことが必要となる.
条件付き相互情報量I(X;Y|Z)にサンプルサイズN の2倍を乗じたものをG2(= 2N· I(X;Y|Z))とすると,XとY がZを所与として条件付き独立であるとき,G2はχ2分 布に従う.これを利用し,XとY がZを所与として条件付き独立であるという帰無仮説 を立ててχ2検定を行い,棄却されたらXとY にZを所与とする従属関係があるとみな すことができる.しかし,CI検定では多くの場合,以下の三つの理由により仮説検定を採 用していない.第一の理由は,変数の数が多い場合,CI検定を行う回数が指数関数的に増
加し,検定の多重性の問題が深刻になるからである.第二の理由は,対象変数間の条件付 き独立性を帰無仮説としてχ2検定を行うと,サンプルサイズが大きい場合,帰無仮説が 棄却されやすくなり,変数間に条件付き従属性が多く検出されるからである.第三の理由 は,仮説検定は条件付き独立性と条件付き従属性を対称に扱っていないためである.条件 付き独立性を帰無仮説として検定する場合,帰無仮説が棄却された変数間には条件付き従 属性があると積極的に主張できる.一方,帰無仮説が保持された変数間では,データが帰 無仮説に矛盾しないことが示されたにすぎない.したがって,変数間の条件付き独立性を 積極的に主張したい場合,仮説検定は不適切である.
PCアルゴリズム等におけるCI検定では,仮説検定の以上の特徴を考慮し,仮説検定の 代わりに,適切な閾値εを設定して条件付き相互情報量I(X;Y|Z)をεと比較している.
すなわち,I(X;Y|Z)がε以上ならば,XとY にZを所与とする従属関係(または図3.18 の合流経路の関係)があるとする.逆に,ε未満ならば,XとY にZを所与とする従属関 係はないとする.たとえばTPDAアルゴリズムにおけるCI検定では,サンプルサイズの 大小にかかわらずεの値として0.01が有効であるとしている.PCアルゴリズムでは適切 なεに関する言及がない.MMPCアルゴリズムでは,所与とする変数が少ない場合には χ2検定を行い,変数が多い場合には検定を行わずに条件付き独立としている.
CI検定で三変数の構造が図3.18のようになったとき,次の三つの場合には従属関係を 分離できる.(1)線形経路において,Zが観測されない場合にはXとY は従属だが,Zが 観測され値が固定されると,XとY が独立となる.(2)分岐経路において,Zが観測され ない場合にはXとY は従属だが,Zが観測され値が固定されると,XとY が独立となる.
(3)合流経路において,Zが観測されない場合にはXとY が独立だが,Zが観測され値が 固定されると,XとY が従属となる.これらの条件が成立することをd分離という.アー クで結ばれたノードは,d分離でなければすべてd結合の関係にある.
3.3.3 CI検定のアプローチを用いた局所独立性検定
局所独立性検定をグラフィカル・モデルのCI検定の枠組みで行うことを考える.局所独 立性検定の対象を項目iと項目i′とし,これらの親ノード集合に対応する確率変数をX˜ii′
とする.項目および能力潜在変数θは確率構造gを持つ(図3.19)とする.項目iと項目 i′の局所独立性を検定するためには,構造gの仮定の下でθを所与とするXiとXi′ の条件 付き相互情報量が必要である.しかし,構造gは一般的に未知であり,この条件付き相互 情報量を正しく計算することは困難である.
ここで,構造gが真である場合,X˜ii′を所与とするXiとXi′の同時エントロピーは,共
対象 X Y
Z
図3.17: 変数Zを所与とするXとY のCI検定
X Z Y
線形経路
X Y
Z
分岐経路
X Y
Z
合流経路 図 3.18: Z-X間およびZ-Y 間にアークがありX-Y 間にアークのない構造
…
X1 X2 Xm
Xi Xi'
?
対象
θ Xi-1 X i+1
…
図3.19: 構造gの例
通の子ノードでない変数を親ノード集合に追加しても変化しないという好ましい性質があ る.故に,XiとXi′ の子ノードでないすべての変数の集合を
X¬ii′ = {X1, X2, . . . , Xi−1, Xi+1, . . . , Xi′−1, Xi′+1, . . . , Xm} (3.6) とすると,X¬ii′の変数がすべて互いに従属な構造(図3.20)を仮定した場合の,X¬ii′と θを所与とするXiとXi′の条件付き独立性検定は,真の構造(図3.19)におけるXiとXi′
の条件付き独立性検定と等しくなる.したがって,構造gが未知でも,XiとXi′の条件付 き独立性を検定するためには,子ノードでないすべての変数を所与とする構造(図3.20) を仮定して条件付き独立性検定を行えばよい.
X¬ii′はm−2次元のベクトルである.各要素は0または1の値を取り得るため,X¬ii′ は,(0,0, . . . ,0)t から (1,1, . . . ,1)tまで 2m−2 通りの値を取り得る.その j 番目(j = 0,1, . . . ,2m−2 −1)の値x¬jii′ を,以下「項目iと項目i′ の子ノードでないすべての変 数へのj番目の反応パターン」あるいは単純に「j番目のパターン」とよぶ.
今,X¬ii′ =x¬jii′ というパターンと,そのパターンから得られるθの点推定値θˆj を得 たとする.項目数mがと受検者数Nが十分に大きく,
P(Xi, Xi′|X¬ii′ =x¬jii′, θ) ≈ P(Xi, Xi′|X¬ii′ =x¬jii′, θ= ˆθj) (3.7) と近似できる場合を考える.このときXiとXi′は,X¬ii′およびθと分岐経路を構成してい る(図3.21)ため,これらによってd分離されるか否か調べる場合,条件からX¬ii′ =x¬jii′ もしくはθ= ˆθjの一方を消去できる.θˆjの正確な値を得ることはできないため,条件から θ= ˆθj を消去する(図3.22).この構造におけるXiとXi′ の条件付き独立性検定は,真 の構造におけるXiとXi′ の条件付き独立性検定と等しくなる.
X¬ii′のすべての変数が互いに従属である構造をgcとすると,X¬ii′を所与とするXiと Xi′の条件付き独立性検定をCI検定の枠組みで行うためには,次の相互情報量を用いる.
I(Xi;Xi′|X¬ii′, gc) = ∑
j
P(X¬ii′ =x¬iij ′|gc)·
∑1 xi=0
∑1 xi′=0
P(Xi =xi, Xi′ =xi′|X¬ii′ =x¬jii′, gc)· log2P(Xi =xi, Xi′ =xi′|X¬ii′ =x¬jii′, gc)·
P(Xi=xi, Xi′ =xi′|X¬ii′ =x¬jii′, gc)
P(Xi =xi|X¬ii′ =x¬iij ′, gc)P(Xi′ =xi′|X¬ii′ =x¬iij ′, gc) , (3.8)