• 検索結果がありません。

SAS による実装

ドキュメント内 I (ページ 102-105)

第 8 章 その他の手法 87

9.3 SAS による実装

前節で述べたように,MMRMはLMMの特別な形式であり,SASのPROC MIXEDを用いて比較的容易に 実装することができる.本節では,MMRMに基づく解析のための標準的なプログラム・コードおよびその概 説を与える.

説明のため,経時測定データを扱う臨床試験において表9.2の形式でデータセットが得られているとする.

このようなデータセットに対するMMRMに基づく標準的な解析は,以下のように実装することができる.

PROC MIXED DATA=datasetName;

CLASS TREATMENT TIME_POINT SUBJECT_ID;

MODEL RESPONSE = BASELINE TREATMENT TIME_POINT TREATMENT*TIME_POINT / DDFM=KR;

LSMEANS TREATMENT*TIME_POINT / ALPHA=0.05 CL DIFF=CONTROL(’PLACEBO’,’tn’);

REPEATED TIME_POINT / SUBJECT=SUBJECT_ID TYPE=UN;

RUN;

5例えば,群ごとに異なる分散をもつUNなど.

表9.2: MMRM解析のデータ構造の例

SUBJECT_ID TREATMENT BASELINE TIME_POINT RESPONSE

A-01 Drug 1234 t1 1234

A-01 Drug 1234 t2 1234

... ... ... ... ...

A-02 Placebo 1234 t1 1234

... ... ... ... ...

A-03 Placebo 1234 t1 1234

... ... ... ... ...

PROC MIXEDの各ステートメントの詳細についてはSASのヘルプを参照されたい.ここでは,全体の概説

及び特に重要と思われる部分をピックアップして説明する.

9.3.1 PROC MIXED ステートメント

PROC MIXEDステートメントでは,読み込むデータセットの指定を行うほか,推定や出力に関する様々な

オプションを指定することができる.とくにMMRMと関連するのは,EMPIRICALオプションとSCORING オプションである.EMPRICALオプションを指定すると,パラメータのモデルに基づく分散推定量の代わり にいわゆるサンドウィッチ(ロバスト)分散推定量(Huber, 1967; Liang & Zeger, 1986)を出力する.分散共分散 構造にUNを指定すればパラメータの推定値に偏りは含まれないが,収束の問題等でより特定した構造(CSな ど)を採用せざるを得ない場合,分散共分散構造を誤って特定すると,欠測データの有無にかかわらずモデル に基づく分散推定量は偏りをもつことが知られている.このような場面では,EMPRICALオプションを指定 し,サンドウィッチ分散推定量を利用することが必要である.サンドウィッチ分散推定量は,平均構造が正し く特定されていれば一致性をもつことが知られている6

PROC MIXEDのデフォルトの推定方法は制限付き最尤法(Restricted Maximum Likelihood Method:REML) であり,その推定は反復過程を伴う.デフォルトではNewton-Raphson法に基づき観測情報量を利用して反復 推定を行うが,とくに分散共分散構造にUNを指定するとき,欠測データの数が過剰に多い場合や時点間相関 が非常に高い場合,データに比して時点数が多い場合などに,反復過程が収束しない恐れがあることが指摘さ れている(Lu & Mehrotra, 2009).収束しない原因の一つに,PROC MIXEDの与える初期値が不適切な値であ る可能性があるため,このような場面の一つの対処法は,Newton-Raphson法の代わりにFisher’s scoringアル ゴリズムを適用し,反復の初期値を得ることである.SCORINGオプションを指定すると,SCORING=で指定 した数値分だけFisher’s Scoringアルゴリズムで反復を行い,その反復内で収束しなければNewton-Raphson法 に切り替えて反復を行う.初期値のみをFisher’s Scoringアルゴリズムで得るためには,SCORING=1を指定す れば良い.

9.3.2 CLASS ステートメント

CLASSステートメントでは,モデルで利用するカテゴリカル変数を特定する.必要に応じて,連続な数値変

数を指定することも可能である.先述の標準プログラムでは,時点をカテゴリカル変数として扱っている.

6ただし,サンドウィッチ分散推定量の一致性は,欠測メカニズムがMCARであることを仮定しているという指摘もある(Mallinckrodt, 2013).

9.3.3 MODEL ステートメント

MODELステートメントでは,モデルに含まれる応答変数と固定効果の関係(平均構造)を特定する.本報告

書では,ベースライン,治療,時点,治療と時点の交互作用を説明変数とするモデルを実装するプログラムを

「標準」として示したが,それ以外にも様々な解析モデルを選択することができる.例えば,疾患領域によっ ては,ベースラインと各時点の応答の共分散がそれぞれ異なると想定とすることが適切であることもある.こ の場合は,ベースラインと時点の交互作用を組み込んだモデルがより適切であるかもしれない.ベースライ ンの測定値をモデルに組み込む方法については,例えばDinh & Yang (2011)に詳細が与えられている.また,

MODELステートメントの重要なオプションに,自由度の計算方法を指定するDDFMオプションがある.欠測

によりデータがアンバランスであるとき,固定効果の自由度はデータから推定することが必要であり,PROC

MIXEDではいくつかの方法が用意されている.多くの文献で,モデルに基づくパラメータの分散推定量の過小

推定の傾向7を調整し,その分散推定量に基づいてSatterthwaiteの調整自由度を推定するKenward-Roger (KR) 法(Kenward & Roger, 1997)の使用が推奨されている.

9.3.4 LSMEANS ステートメント

LSMEANSステートメントは,固定効果の最小二乗平均を計算するために用いる.提示したプログラムのよ

うにTREATMENT× TIME_POINTを指定すると,治療群ごとにすべての測定時点における最小二乗平均を

出力する.有意水準の指定(ALPHAオプション),信頼区間の出力(CLオプション),最小二乗平均の差の計算

(DIFFオプション)などが可能である.多重比較を行う場合には,ADJUSTオプションで多重性の調整を行う

ことができる.

9.3.5 REPEATED ステートメント

REPEATEDステートメントは,誤差成分ϵiの分散共分散構造Σiを指定するために用いる.SUBJECTオプ

ションで繰り返し測定の単位を指定し,TYPEオプションで分散共分散構造のタイプを指定する8.データセッ トの構造上,繰り返しの単位内でデータの順序が自明でない場合(例えば非単調な欠測で,欠測データのレコー ドが存在しないデータ構造の場合)は,データの順序の情報をもつ変数をREPEATEDステートメントで指定す ることが必要となるが,そうでない場合は省略することができる.なお,Σiの推定値を出力するためにRオプ ション,推定されたΣiに対応する相関行列を出力するためにRCORRオプションを利用することができる9

9.3.6 RANDOM ステートメント

前節で述べたように,MMRMでは,変量効果をモデルに組み込む代わりに,誤差成分の分散共分散行列を 直接的にパラメータ化し,相関を構造化する.したがって,一般にRANDOMステートメントを利用せずとも MMRMを実装することができる.しかし,これは変量効果をモデルに組み込むことができないということを 意味するものではない.一般には,変量効果の分散共分散行列と誤差成分の分散共分散行列を別々に構造化す ることで,幅広い相関構造を表現することが可能である.注意が必要となるのは,MMRMで誤差成分の分散 共分散構造にUNを選択した場合である.誤差成分の分散共分散構造にUNを選択したうえで,さらに変量効 果に被験者を設定すると,モデル(パラメータ)の識別性10が失われREMLの推定が不安定になる.実際に,こ の組合せでREPEATEDステートメントとRANDOMステートメントを指定すると,共分散パラメータの推定

7分散共分散構造が正しく特定できたとしても,モデルに基づくパラメータの分散推定量はそれ自体に分散分散共分散行列の推定量を 含むため,その推定に伴うばらつきを考慮しないと過小推定される.

8先述のCS,AR(1),Toeplitz,UNのほかに多くのタイプが用意されている.詳細はSAS HELPを参照.

9デフォルトでは最初の被験者のものだけが出力される.例えばi番目の被験者のΣiを出力したい場合は"R=i",対応する相関行列を 出力したい場合は"RCORR=i"のように指定すればよい.

10一般に識別性(Identifiability)とは,適切な推測ができるためにモデルが満足しなくてはならない特性を意味する.この場合では,誤 差成分の分散共分散構造のパラメータが過剰になり,パラメータの真値が一意に定まらないため,モデルの識別性がないと考えられる.

に関するHessianが正定値でないことがある.この場合,収束条件を満たしたとしても,推測結果は一意的で はないので注意しなければならない.この点については,Appendix AのA.7.11節も参照のこと.

ドキュメント内 I (ページ 102-105)