制約条件 (NFMV) の利用 - 制約条件 NFMV を仮定した PMM

第 6 章 Pattern-Mixture Model 50

6.7 制約条件 NFMV を仮定した PMM

6.7.2 制約条件 (NFMV) の利用

NFMVにおけるパターンtに対しての完全データの同時密度関数を下記に示す．

ft(Y1, ..., YT) = ft(Y1, ..., Yt)ft(Yt+1|Y1, ..., Yt)ft(Yt+2, ..., YT|Y1, ..., Yt+1)

= ft(Y1, ..., Yt)ft(Yt+1|Y1, ..., Yt)

∏T s=t+2

ft(Ys|Y1, ..., Ys−1) (6.13) 一つ目の同時密度関数は，観測されたデータを用いて特定可能である．よって，二つ目及び三つ目の密度関数を特定するのに制約条件が必要となる．まず二つ目は現在の未特定の分布のため，何からの制約のもと分布を

特定することになる．また，三つ目に(6.11)式を適用すると，特定できない部分が残るが，その部分にも二つ目の部分に対して用いた制約条件を用いることで特定可能となる．

具体的に，T = 4時点の最終観測時点R= 1の場合を例に示す．

f1(Y1, Y2, Y3, Y4) = f1(Y1)f1(Y2|Y1)

∏4 s=3

f1(Ys|Y1, Y2)

= f1(Y1)

| {z } 1

×f1(Y2|Y1)

| {z } 2

×f1(Y3|Y1, Y2)

| {z } 3

×f1(Y4|Y1, Y2, Y3)

| {z } 3

1：特定可能な分布，2：NFMVで特定しきれない分布，

3：NFMVで特定される分布

ここで，制約条件NFMVの(6.11)式を詳しく見ていくことにする．

s=t+ 2,…, T に対して

ft(Ys|Y1, ..., Ys−1) = f(Ys|Y1, ..., Ys−1, R≥s−1)

= f_≥s−1(Ys|Y1, ..., Ys−1) (6.14) また，この式を下記のように書き換えることが可能となる．

s=t+ 2, ..., T に対して，

f_≥s−1(Ys|Y1, ..., Ys−1) =

∑T j=s−1

α_jf_j(Y₁, ..., Y_s)

∑T j=s−1

αjfj(Y1, ..., Ys−1)

∑T j=s−1

αjfj(Y1, ..., Ys−1)

∑T l=s−1

α_lf_l(Y₁,· · ·, Y_s₋₁)

fj(Ys|Y1, .., Ys−1)

∑T j=s−1

ωsjfj(Ys|Y1, ..., Ys−1) (6.15)

ただし，

ωsj= αjfj(Y1, ..., Ys−1)

∑T l=s−1

α_lf_l(Y₁,· · ·, Y_s₋₁) ,

αj :パターンjにおいて観測されている割合

である．MNARのとき，観測されたデータに基づく未観測のデータの条件付き分布は，何らかの仮定により特定する必要がある．従って，NFMVの仮定のもとで，現在観測されなかった（最初に未観測）データの条件付き分布は，何らかの仮定により特定する必要がある．すなわち，(6.12)式は特定されていない分布となるため，

何らかの仮定が必要となる．

ここで4時点までの経時測定データにおいて，NFMVの制約条件を用いた4つのパターンの同時密度関数を示す．ただし，(6.15)式及び(6.11)式において，(6.12)式のような特定されていない分布の密度関数を何らかの関数gを用いて示す．ただし，f₂(1234)については細かく示し．他の分布については，同様に展開する．なお，ω₂₁+ω₂₂+ω₂₃+ω₂₃= 1, ω₃₂+ω₃₃+ω₃₄, ω₄₃+ω₄₄ = 1である．簡単のため，後ほどδ:=ω₄₃とし，

ω44= 1−δとおく．

f₄(1234) = f₄(1234)

f₃(1234) = f₃(123)f₃(4|123) =f₃(123)g₃(4|123) f₂(1234) = f₂(12)f₂(3|12)f₂(4|123)

= f2(12)f2(3|12)f_≥3(4|123) (∵NFMV)

= f₂(12)g₂(3|12)f_≥₃(4|123) (NFMVで特定しきれない分布をg₂とおく）

= f₂(12)g₂(3|12) [ω₄₃·f₃(4|123) +ω₄₄·f₄(4|123)] (∵(6.15))

= f₂(12)g₂(3|12) [

δ·g₃(4|123) + (1−δ)f₄(4|123) ]

(∵ω₄₃=δ, ω₄₄= 1−δ)

（さらにNFMVで特定しきれない分布をg3とおく）

f1(1234) = f1(1)f1(2|1)f1(34|12)

= f1(1)g1(2|1)f1(3|12)f1(4|123)

= f1(1)g1(2|1)f_≥2(3|12)f_≥3(4|123) (∵NFMV)

= f1(1)g1(2|1) [ω32·f2(3|12) +ω33·f3(3|12) +ω34·f4(3|12)]

×[

ω43·g3(4|123) +ω44·f4(4|123) ]

(∵(6.15))

= f₁(1)g₁(2|1) [

ω₃₂·g₂(3|12) +ω₃₃·f₃(3|12) +ω₃₄·f₄(3|12) ]

×[

δ·g₃(4|123) + (1−δ)f₄(4|123) ]

(∵ω₄₃=δ, ω₄₄= 1−δ)

ただし，δを用いた理由は以下のように二つのパラメータω43, ω44を一つのパラメータδで表現するためである．

δ=ω43= α3f3(123)

α₃f₃(123) +α₄f₄(123), 1−δ=ω44= α4f4(123) α₃f₃(123) +α₄f₄(123), ω₃₂= α2f2(12)

α₂f₂(12) +α₃f₃(12) +α₄f₄(12), ω₃₃= α3f3(12)

α₂f₂(12) +α₃f₃(12) +α₄f₄(12), ω₃₄= α₄f₄(12)

α2f2(12) +α3f3(12) +α4f4(12)

NFMVのもとではg1, g2, g3の関数を規定することで，すべての時点のデータの分布が特定されることになる. Kenward et al. (2003)において示されているNFD1は下記のCase 4に該当し，NFD2が下記のCase 5に該当する．NFD1及びNFD2はinterior familyにおけるCCMVやNCMVとは異なる．NFD1とNFD2で特定される分布の表を以下に示す．表6.5に登場したNFMVで特定されていない「？」の部分について，完了例に基づく CCMV又は一番類似のパターンに基づく補完であるNCMVにより，全ての分布が特定される（表6.6，6.7）．

表6.6: NFD1 (NFMV + CCMV)で特定される分布

時点1 時点2 時点3 時点4

パターンA f4(1) f4(2|1) f4(3|12) f4(4|123) パターンB f3(1) f3(2|1) f3(3|12) f4(4|123) パターンC f2(1) f2(2|1) f4(3|12) f4(4|123) パターンD f1(1) f4(2|1) (1−ω33(12))f4(3|12) +ω33(12)f3(3|12) f4(4|123)

表6.7: NFD2 (NFMV + NCMV)で特定される分布

時点1 時点2 時点3 時点4

パターンA f4(1) f4(2|1) f4(3|12) f4(4|123) パターンB f3(1) f3(2|1) f3(3|12) f4(4|123) パターンC f2(1) f2(2|1) f3(3|12) f4(4|123) パターンD f1(1) f2(2|1) (1−ω34(12))f3(3|12) +ω34(12)f4(3|12) f4(4|123)

下記にNFMVと合わせた，いくつかの制約条件と4時点までの同時密度関数を示す．

Case 4: NFMV+CCMV (NFD1)

g₁(2|1) =f₄(2|1), g₂(3|12) =f₄(3|12), g₃(4|123) =f₄(4|123)

このときの4時点までの経時測定データにおける同時密度関数は以下となる．

f4(1234) = f4(1234)

f3(1234) = f3(123)f3(4|123)

= f3(123)f4(4|123) f2(1234) = f2(12)f2(3|12)f2(4|123)

= f2(12)f4(3|12)f_≥3(4|123) (∵CCMV, NFMV)

= f₂(12)f₄(3|12) [ω₄₃·f₃(4|123) +ω₄₄·f₄(4|123)] (∵(6.15))

= f₂(12)f₄(3|12) [

δ·f₄(4|123) + (1−δ)f₄(4|123) ]

(∵ω₄₃=δ, ω₄₄= 1−δ, CCMV)

= f₂(12)f₄(3|12)f₄(4|123) f1(1234) = f1(1)f1(2|1)f1(34|12)

= f1(1)f4(2|1)f1(3|12)f1(4|123)

= f1(1)f4(2|1)f_≥2(3|12)f_≥3(4|123) (∵NFMV)

= f1(1)f1(2|1) [ω32·f2(3|12) +ω33·f3(3|12) +ω34·f4(3|12)]

×[ω43·f3(4|123) +ω44·f4(4|123)] (∵(6.15))

= f1(1)f4(2|1) [

ω32·f4(3|12) +ω33·f3(3|12) +ω34·f4(3|12) ]

×[

δ·f₄(4|123) + (1−δ)f₄(4|123) ]

(∵ω₄₃=δ, ω₄₄= 1−δ,CCMV)

= f₁(1)f₄(2|1) [

(1−ω₃₃)f₄(3|12) +ω₃₃·f₃(3|12) ]

f₄(4|123) (∵ω₃₂+ω₃₃+ω₃₄= 1) 4時点までの経時測定データにおけるCase 1: CCMVの密度関数では，全ての未観測データの分布が欠測パターンR= 4の分布で補完される形になっているのに対して，Case 4: NFD1の密度関数では，f₁(3|12)の未観測のデータの分布が欠測パターンR= 3の分布f3(3|12)と欠測パターンR= 4の分布f4(3|12)の混合分布で補完する形となっていることが分かる．このように表6.2を表6.6と比べると，NFD1はCCMVとは異なり，

完了例のデータの分布による補完だけではないことが分かる．

Case 5: NFMV+NCMV (NFD2)

g1(2|1) =f2(2|1), g2(3|12) =f3(3|12), g3(4|123) =f4(4|123) このときの4時点までの経時測定データにおける同時密度関数は以下となる．

f₄(1234) = f₄(1234)

f₃(1234) = f₃(123)f₃(4|123) =f₃(123)f₄(4|123) f2(1234) = f2(12)f2(3|12)f2(4|123)

= f2(12)f3(3|12)f_≥3(4|123) (∵NFMV)

= f2(12)f3(3|12) [ω43·f3(4|123) +ω44·f4(4|123)] (∵(6.15))

= f2(12)f3(3|12) [

δ·f4(4|123) + (1−δ)f4(4|123) ]

(∵ω43=δ, ω44= 1−δ,NCMV)

= f2(12)f3(3|12)f4(4|123) f1(1234) = f1(1)f1(2|1)f1(34|12)

= f₁(1)f₄(2|1)f₁(3|12)f₁(4|123)

= f₁(1)f₂(2|1)f_≥₂(3|12)f_≥₃(4|123) (∵NFMV)

= f₁(1)f₂(2|1) [ω₃₂·f₂(3|12) +ω₃₃·f₃(3|12) +ω₃₄·f₄(3|12)]

×[ω₄₃·f₄(4|123) +ω₄₄·f₄(4|123)] (∵(6.15))

= f1(1)f2(2|1) [ω32·f2(3|12) +ω33·f3(3|12) +ω34·f4(3|12)]

×[

δ·f₄(4|123) + (1−δ)f₄(4|123) ]

(∵NCMV, ω₄₃=δ, ω₄₄= 1−δ)

= f₁(1)f₂(2|1) [

ω₃₂·f₃(3|12) +ω₃₃·f₃(3|12) +ω₃₄·f₄(3|12)

]×f₄(4|123) (∵NCMV)

= f₁(1)f₂(2|1) [

(1−ω₃₄)f₃(3|12) +ω₃₄·f₄(3|12)

]×f₄(4|123) (∵ω₃₂+ω₃₃+ω₃₄= 1)

4時点までの経時測定データにおけるCase 2: NCMVの密度関数では，全ての未観測データの分布が類似の欠測パターンの分布で補完される形になっているのに対して，Case 5: NFD2の密度関数では，f₁(3|12)の未観測のデータの分布が欠測パターンR= 3の分布f₃(3|12)と欠測パターンR= 4の分布f₄(3|12)の混合分布で補完する形となっていることが分かる．このように表6.3と表6.7を比べると，NFD2はNCMVとは異なり，類似の欠測パターンの被験者のデータの分布による補完だけではないことが分かる．

ここで4時点のデータにおけるCase 4，5の補完イメージを図6.3及び図6.4に示す．

図6.3: Case 4の補完イメージ図

図6.4: Case 5の補完イメージ図

ドキュメント内 I (ページ 64-69)