過去に検討した

Doubly Robust

4. 過去に検討した

シミュレーションデータの再解析

シミュレーションデータ

• 2 種類のシミュレーションデータの検討．共に応答変数は連続値．

– うつ病データ

• SAS

ユーザー総会

2014

の土居ら

(2014)

で検討．

– 慢性疼痛データ

•

日本製薬工業協会シンポジウム「臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

―

統計手法・

estimand

と架空の事例に対する流れの整理

―

」の横山ら

(2015)

で検討．

解析モデル（うつ病データ）

Doubly Robust

観測確率モデル（時点ごとにあてはめる）

モデル：ロジスティックモデル説明変数：

投与群，ベースライン値，

1

時点前の応答変数の変化量，

（投与群と

1

時点前の応答変数の変化量の交互作用は指定できない）

IPW

モデル

説明変数：

投与群，時点（カテゴリ値），ベースライン値，

投与群と時点（カテゴリ値）の交互作用重み：

OS

最終解析モデル線形モデル説明変数：

投与群，時点（カテゴリ値），ベースライン値，

投与群と時点（カテゴリ値）の交互作用

SSは指定できない

◎

Bootstrap

：

20

回

解析結果（うつ病データ）

エラーなしで

収束した回数

α

エラー（

%

）推定値の平均

（真値：

0.000

）推定値の

SD MSE

MAR 8686 3.79 -0.002 0.971 0.942

MNAR 8408 3.52 0.004 0.948 0.898

エラーなしで

収束した回数検出力（

%

）推定値の平均

（真値：-3.000）推定値の

SD MSE

MAR 8158 86.79 -2.997 0.968 0.937

MNAR 7562 87.04 -2.949 0.941 0.889

◎収束回数がかなり少ない（～

※エラーなく収束した結果をもとに計算

MAR α

エラー（

%

）検出力（

%

）群間差の推定値の平均

群間差に対する

MSE

MMRM 4.79 90.40 -2.9988 0.8250

MI 4.80 89.19 -2.9984 0.8397

wGEE(OS) 5.36 89.85 -2.9961 0.8606

LOCF 4.78 83.42 -2.8162 0.9293

MNAR α

エラー（

%

）検出力（

%

）群間差の推定値の平均

群間差に対する

MSE

MMRM 4.84 90.53 -2.9688 0.8055

MI 4.7 89.16 -2.9654 0.8250

wGEE(OS) 5.23 89.83 -2.9446 0.8303

LOCF 4.76 86.33 -2.8562 0.8731

以前の解析の結果（うつ病データ）

土居ら

(2014)

・駒嵜ら

(2015)

より駒嵜ら(2015)（直前の演題）の結果

シミュレーション結果（うつ病データ）

• 収束状況

– 75

～

85%

強．収束しないことが

wGEE

法と比べてもかなり多い．

• α エラー

– 4%

未満．

wGEE

法同様コントロールされている．

• 検出力

– 86

～

87%

．

wGEE

法・

MMRM

よりやや劣る．

• MSE

– MMRM

・

MI

・

wGEE

法よりやや大きい．

• バイアス

–

他の手法同様ほとんどない．

※ MAR

の場合は，観測確率モデル・補完モデル共に正しく特定

解析モデル（慢性疼痛データ）

Doubly Robust

観測確率モデル（時点ごとにあてはめる）

モデル：ロジスティックモデル説明変数：

投与群，ベースライン値，

1

時点前の応答変数の変化量，

（投与群と

1

時点前の応答変数の変化量の交互作用は指定できない）

IPW

モデル

説明変数：

投与群，時点（カテゴリ値），ベースライン値，

投与群と時点（カテゴリ値）の交互作用重み：

OS

最終解析モデル線形モデル説明変数：

投与群，時点（カテゴリ値），ベースライン値，

投与群と時点（カテゴリ値）の交互作用

SSは指定できない

◎

Bootstrap

：

20

回

解析結果（慢性疼痛データ）

エラーなしで収束した回数

αエラー

（%）

推定値の平均

（真値：0.000）

推定値の中央値

（真値：0.000）

推定値の

SD MSE

MCAR &

MAR 9823 3.93 -0.033 -0.033 0.377 0.143

MCAR &

MNAR 9841 3.57 -0.004 -0.005 0.365 0.133

エラーなしで収束した回数

検出力

（

%

）

推定値の平均

（真値：-1.000）

推定値の中央値

（真値：-1.000）

推定値の

SD MSE

MCAR &

MAR 9826 76.66 -1.031 -1.031 0.386 0.150

MCAR &

MNAR 9848 75.31 -0.982 -0.984 0.378 0.143

◎収束しないのは弱

※エラーなく収束した結果をもとに計算

以前の解析の結果（慢性疼痛データ）

MCAR + MAR

^{αエラー（%）} ^{検出力（%）} ^{推定値の平均}_{（真値：-1.00）} ^{推定値のSD} ^MSE

MMRM 4.98 81.99 -1.0168 0.3526 0.1246

MI 4.36 77.67 -1.0032 0.3580 0.1282

wGEE(OS) 6.31 74.51 -0.9534 0.3754 0.1431 LOCF

ANCOVA 17.86 97.08 -1.1634 0.3010 0.1173 OC ANCOVA 4.90 74.00 -0.9314 0.3532 0.1295

横山ら(2015)・駒嵜ら(2015)より

MCAR + MNAR

^α^エラー（^%^） ^検出力（^%^） ^{推定値の平均}_（真値：_-1.00_） ^推定値の^SD ^MSE

MMRM 4.96 79.37 -0.9696 0.3488 0.1226

MI 4.31 74.88 -0.9536 0.3537 0.1273

wGEE(OS) 6.04 73.01 -0.9216 0.3665 0.1412 LOCF ANCOVA 16.97 96.87 -1.1294 0.2929 0.1025 OC ANCOVA 5.25 71.92 -0.9031 0.3526 0.1337

駒嵜ら

(2015)

（直前の演題）の結果

シミュレーション結果（慢性疼痛データ）

• 収束状況

– 98%

以上．

wGEE

法より収束しないことが多いが，絶対数は多くはない．

• α エラー

– 4%

未満．

wGEE

法でのインフレがコントロールされた．

• 検出力

– 75

～

77%

弱．

wGEE

法より

2

～

3%

大きい．

MI

とほぼ同等．

MMRM

より

3

～

4%

劣る．

• MSE

– MMRM

・

MI

・

wGEE

法よりやや大きい．

• バイアス

– wGEE

法と比べて格段に小さい．

※補完モデルは正しく特定．観測確率モデルは誤特定．

シミュレーション結果に対する考察 1

• 収束失敗が多い

–

完全分離・準完全分離の大量発生．ロジスティック回帰を時点ごとに当てはめるので，リスク増．

– bootstrap

データでうまくいかないことも多い．

• Proc LOGISTIC

の

Firth

の補正等の利用で緩和できるか．

•

ロジスティック回帰を時点ごとに別々に推定せず，時点を共変量として一括で推定すれば，緩和できるか．

• α エラーは保守的

–

全て

4%

未満．

–

駒嵜ら

(2015)

で

wGEE

法の懸念点のインフレは

control

できた．

•

バイアスが減少した影響か．

•

統計量のばらつきが大きいのは，

bootstrap

の回数が少ないことが影響し

ているか． 41

シミュレーション結果に対する考察 2

• バイアス

–

慢性疼痛データ（観測確率モデル誤特定）に対して，

wGEE

法で発生していたバイアスがかなり緩和された．

• Doubly Robust

の理論通りの結果．

• 検出力

–

うつ病データ：

wGEE

法・

MMRM

より微減

• Bootstrap

回数の影響は要検討．

–

慢性疼痛データ：

wGEE

法より微増（

≓ MI

）

< MMRM

• Bootstrap 回数の影響は要検討

–

今回は時間の都合で

20

回

シミュレーション結果に対する考察 3

• うつ病データ

–

補完モデル・観測モデル共に正しく特定されているが，

wGEE

法より検出力が下がっている．

•

時点間相関の考慮の有無が影響か？

ドキュメント内スライド 1 (ページ 31-44)

Doubly Robust

4. 過去に検討した

シミュレーションデータの再解析

シミュレーションデータ

• 2 種類のシミュレーションデータの検討．共に応答 変数は連続値．

– うつ病データ

• SAS

2014

(2014)

– 慢性疼痛データ

•

―

estimand

―

(2015)

解析モデル（うつ病データ）

Doubly Robust

1

1

IPW

OS

Bootstrap

20

解析結果（うつ病データ）

α

%

0.000

SD MSE

MAR 8686 3.79 -0.002 0.971 0.942

MNAR 8408 3.52 0.004 0.948 0.898

%

SD MSE

MAR 8158 86.79 -2.997 0.968 0.937

MNAR 7562 87.04 -2.949 0.941 0.889

※エラーなく収束した結果をもとに計算

MAR α

%

%

MSE

MMRM 4.79 90.40 -2.9988 0.8250

MI 4.80 89.19 -2.9984 0.8397

wGEE(OS) 5.36 89.85 -2.9961 0.8606

LOCF 4.78 83.42 -2.8162 0.9293

MNAR α

%

%

MSE

MMRM 4.84 90.53 -2.9688 0.8055

MI 4.7 89.16 -2.9654 0.8250

wGEE(OS) 5.23 89.83 -2.9446 0.8303

LOCF 4.76 86.33 -2.8562 0.8731

以前の解析の結果 （うつ病データ）

(2014)

(2015)

シミュレーション結果（うつ病データ）

• 収束状況

– 75

85%

wGEE

• α エラー

– 4%

wGEE

• 検出力

– 86

87%

wGEE

MMRM

• MSE

– MMRM

MI

wGEE

• バイアス

–

※ MAR

解析モデル（慢性疼痛データ）

Doubly Robust

1

1

IPW

• 2 種類のシミュレーションデータの検討．共に応答変数は連続値．

以前の解析の結果（うつ病データ）

以前の解析の結果（慢性疼痛データ）