第 6 章 Pattern-Mixture Model 50
6.7 制約条件 NFMV を仮定した PMM
6.7.2 制約条件 (NFMV) の利用
NFMVにおけるパターンtに対しての完全データの同時密度関数を下記に示す.
ft(Y1, ..., YT) = ft(Y1, ..., Yt)ft(Yt+1|Y1, ..., Yt)ft(Yt+2, ..., YT|Y1, ..., Yt+1)
= ft(Y1, ..., Yt)ft(Yt+1|Y1, ..., Yt)
∏T s=t+2
ft(Ys|Y1, ..., Ys−1) (6.13) 一つ目の同時密度関数は,観測されたデータを用いて特定可能である.よって,二つ目及び三つ目の密度関数 を特定するのに制約条件が必要となる.まず二つ目は現在の未特定の分布のため,何からの制約のもと分布を
特定することになる.また,三つ目に(6.11)式を適用すると,特定できない部分が残るが,その部分にも二つ 目の部分に対して用いた制約条件を用いることで特定可能となる.
具体的に,T = 4時点の最終観測時点R= 1の場合を例に示す.
f1(Y1, Y2, Y3, Y4) = f1(Y1)f1(Y2|Y1)
∏4 s=3
f1(Ys|Y1, Y2)
= f1(Y1)
| {z } 1
×f1(Y2|Y1)
| {z } 2
×f1(Y3|Y1, Y2)
| {z } 3
×f1(Y4|Y1, Y2, Y3)
| {z } 3
1:特定可能な分布,2:NFMVで特定しきれない分布,
3:NFMVで特定される分布
ここで,制約条件NFMVの(6.11)式を詳しく見ていくことにする.
s=t+ 2,…, T に対して
ft(Ys|Y1, ..., Ys−1) = f(Ys|Y1, ..., Ys−1, R≥s−1)
= f≥s−1(Ys|Y1, ..., Ys−1) (6.14) また,この式を下記のように書き換えることが可能となる.
s=t+ 2, ..., T に対して,
f≥s−1(Ys|Y1, ..., Ys−1) =
∑T j=s−1
αjfj(Y1, ..., Ys)
∑T j=s−1
αjfj(Y1, ..., Ys−1)
=
∑T j=s−1
αjfj(Y1, ..., Ys−1)
∑T l=s−1
αlfl(Y1,· · ·, Ys−1)
fj(Ys|Y1, .., Ys−1)
=
∑T j=s−1
ωsjfj(Ys|Y1, ..., Ys−1) (6.15)
ただし,
ωsj= αjfj(Y1, ..., Ys−1)
∑T l=s−1
αlfl(Y1,· · ·, Ys−1) ,
αj :パターンjにおいて観測されている割合
である.MNARのとき,観測されたデータに基づく未観測のデータの条件付き分布は,何らかの仮定により特 定する必要がある.従って,NFMVの仮定のもとで,現在観測されなかった(最初に未観測)データの条件付 き分布は,何らかの仮定により特定する必要がある.すなわち,(6.12)式は特定されていない分布となるため,
何らかの仮定が必要となる.
ここで4時点までの経時測定データにおいて,NFMVの制約条件を用いた4つのパターンの同時密度関数を 示す.ただし,(6.15)式及び(6.11)式において,(6.12)式のような特定されていない分布の密度関数を何らか の関数gを用いて示す.ただし,f2(1234)については細かく示し.他の分布については,同様に展開する.な お,ω21+ω22+ω23+ω23= 1, ω32+ω33+ω34, ω43+ω44 = 1である.簡単のため,後ほどδ:=ω43とし,
ω44= 1−δとおく.
f4(1234) = f4(1234)
f3(1234) = f3(123)f3(4|123) =f3(123)g3(4|123) f2(1234) = f2(12)f2(3|12)f2(4|123)
= f2(12)f2(3|12)f≥3(4|123) (∵NFMV)
= f2(12)g2(3|12)f≥3(4|123) (NFMVで特定しきれない分布をg2とおく)
= f2(12)g2(3|12) [ω43·f3(4|123) +ω44·f4(4|123)] (∵(6.15))
= f2(12)g2(3|12) [
δ·g3(4|123) + (1−δ)f4(4|123) ]
(∵ω43=δ, ω44= 1−δ)
(さらにNFMVで特定しきれない分布をg3とおく)
f1(1234) = f1(1)f1(2|1)f1(34|12)
= f1(1)g1(2|1)f1(3|12)f1(4|123)
= f1(1)g1(2|1)f≥2(3|12)f≥3(4|123) (∵NFMV)
= f1(1)g1(2|1) [ω32·f2(3|12) +ω33·f3(3|12) +ω34·f4(3|12)]
×[
ω43·g3(4|123) +ω44·f4(4|123) ]
(∵(6.15))
= f1(1)g1(2|1) [
ω32·g2(3|12) +ω33·f3(3|12) +ω34·f4(3|12) ]
×[
δ·g3(4|123) + (1−δ)f4(4|123) ]
(∵ω43=δ, ω44= 1−δ)
ただし,δを用いた理由は以下のように二つのパラメータω43, ω44を一つのパラメータδで表現するためである.
δ=ω43= α3f3(123)
α3f3(123) +α4f4(123), 1−δ=ω44= α4f4(123) α3f3(123) +α4f4(123), ω32= α2f2(12)
α2f2(12) +α3f3(12) +α4f4(12), ω33= α3f3(12)
α2f2(12) +α3f3(12) +α4f4(12), ω34= α4f4(12)
α2f2(12) +α3f3(12) +α4f4(12)
NFMVのもとではg1, g2, g3の関数を規定することで,すべての時点のデータの分布が特定されることにな る. Kenward et al. (2003)において示されているNFD1は下記のCase 4に該当し,NFD2が下記のCase 5に該当 する.NFD1及びNFD2はinterior familyにおけるCCMVやNCMVとは異なる.NFD1とNFD2で特定される 分布の表を以下に示す.表6.5に登場したNFMVで特定されていない「?」の部分について,完了例に基づく CCMV又は一番類似のパターンに基づく補完であるNCMVにより,全ての分布が特定される(表6.6,6.7).
表6.6: NFD1 (NFMV + CCMV)で特定される分布
時点1 時点2 時点3 時点4
パターンA f4(1) f4(2|1) f4(3|12) f4(4|123) パターンB f3(1) f3(2|1) f3(3|12) f4(4|123) パターンC f2(1) f2(2|1) f4(3|12) f4(4|123) パターンD f1(1) f4(2|1) (1−ω33(12))f4(3|12) +ω33(12)f3(3|12) f4(4|123)
表6.7: NFD2 (NFMV + NCMV)で特定される分布
時点1 時点2 時点3 時点4
パターンA f4(1) f4(2|1) f4(3|12) f4(4|123) パターンB f3(1) f3(2|1) f3(3|12) f4(4|123) パターンC f2(1) f2(2|1) f3(3|12) f4(4|123) パターンD f1(1) f2(2|1) (1−ω34(12))f3(3|12) +ω34(12)f4(3|12) f4(4|123)
下記にNFMVと合わせた,いくつかの制約条件と4時点までの同時密度関数を示す.
Case 4: NFMV+CCMV (NFD1)
g1(2|1) =f4(2|1), g2(3|12) =f4(3|12), g3(4|123) =f4(4|123)
このときの4時点までの経時測定データにおける同時密度関数は以下となる.
f4(1234) = f4(1234)
f3(1234) = f3(123)f3(4|123)
= f3(123)f4(4|123) f2(1234) = f2(12)f2(3|12)f2(4|123)
= f2(12)f4(3|12)f≥3(4|123) (∵CCMV, NFMV)
= f2(12)f4(3|12) [ω43·f3(4|123) +ω44·f4(4|123)] (∵(6.15))
= f2(12)f4(3|12) [
δ·f4(4|123) + (1−δ)f4(4|123) ]
(∵ω43=δ, ω44= 1−δ, CCMV)
= f2(12)f4(3|12)f4(4|123) f1(1234) = f1(1)f1(2|1)f1(34|12)
= f1(1)f4(2|1)f1(3|12)f1(4|123)
= f1(1)f4(2|1)f≥2(3|12)f≥3(4|123) (∵NFMV)
= f1(1)f1(2|1) [ω32·f2(3|12) +ω33·f3(3|12) +ω34·f4(3|12)]
×[ω43·f3(4|123) +ω44·f4(4|123)] (∵(6.15))
= f1(1)f4(2|1) [
ω32·f4(3|12) +ω33·f3(3|12) +ω34·f4(3|12) ]
×[
δ·f4(4|123) + (1−δ)f4(4|123) ]
(∵ω43=δ, ω44= 1−δ,CCMV)
= f1(1)f4(2|1) [
(1−ω33)f4(3|12) +ω33·f3(3|12) ]
f4(4|123) (∵ω32+ω33+ω34= 1) 4時点までの経時測定データにおけるCase 1: CCMVの密度関数では,全ての未観測データの分布が欠測パ ターンR= 4の分布で補完される形になっているのに対して,Case 4: NFD1の密度関数では,f1(3|12)の未 観測のデータの分布が欠測パターンR= 3の分布f3(3|12)と欠測パターンR= 4の分布f4(3|12)の混合分布 で補完する形となっていることが分かる.このように表6.2を表6.6と比べると,NFD1はCCMVとは異なり,
完了例のデータの分布による補完だけではないことが分かる.
Case 5: NFMV+NCMV (NFD2)
g1(2|1) =f2(2|1), g2(3|12) =f3(3|12), g3(4|123) =f4(4|123) このときの4時点までの経時測定データにおける同時密度関数は以下となる.
f4(1234) = f4(1234)
f3(1234) = f3(123)f3(4|123) =f3(123)f4(4|123) f2(1234) = f2(12)f2(3|12)f2(4|123)
= f2(12)f3(3|12)f≥3(4|123) (∵NFMV)
= f2(12)f3(3|12) [ω43·f3(4|123) +ω44·f4(4|123)] (∵(6.15))
= f2(12)f3(3|12) [
δ·f4(4|123) + (1−δ)f4(4|123) ]
(∵ω43=δ, ω44= 1−δ,NCMV)
= f2(12)f3(3|12)f4(4|123) f1(1234) = f1(1)f1(2|1)f1(34|12)
= f1(1)f4(2|1)f1(3|12)f1(4|123)
= f1(1)f2(2|1)f≥2(3|12)f≥3(4|123) (∵NFMV)
= f1(1)f2(2|1) [ω32·f2(3|12) +ω33·f3(3|12) +ω34·f4(3|12)]
×[ω43·f4(4|123) +ω44·f4(4|123)] (∵(6.15))
= f1(1)f2(2|1) [ω32·f2(3|12) +ω33·f3(3|12) +ω34·f4(3|12)]
×[
δ·f4(4|123) + (1−δ)f4(4|123) ]
(∵NCMV, ω43=δ, ω44= 1−δ)
= f1(1)f2(2|1) [
ω32·f3(3|12) +ω33·f3(3|12) +ω34·f4(3|12)
]×f4(4|123) (∵NCMV)
= f1(1)f2(2|1) [
(1−ω34)f3(3|12) +ω34·f4(3|12)
]×f4(4|123) (∵ω32+ω33+ω34= 1)
4時点までの経時測定データにおけるCase 2: NCMVの密度関数では,全ての未観測データの分布が類似の欠 測パターンの分布で補完される形になっているのに対して,Case 5: NFD2の密度関数では,f1(3|12)の未観測 のデータの分布が欠測パターンR= 3の分布f3(3|12)と欠測パターンR= 4の分布f4(3|12)の混合分布で補 完する形となっていることが分かる.このように表6.3と表6.7を比べると,NFD2はNCMVとは異なり,類 似の欠測パターンの被験者のデータの分布による補完だけではないことが分かる.
ここで4時点のデータにおけるCase 4,5の補完イメージを図6.3及び図6.4に示す.
図6.3: Case 4の補完イメージ図
図6.4: Case 5の補完イメージ図