【日本製薬工業協会シンポジウム】
生存時間解析の評価指標に関する最近の展開
ーRMST (restricted mean survival time) を理解するー
2. RMSTの定義と統計的推測
2018年6月13日
医薬品評価委員会 データサイエンス部会 タスクフォース4 生存時間解析チーム
留意点
本発表は,先日公開された 「生存時間型応答の評価指標
-RMST(restricted mean survival)を理解する-」
について,日本製薬工業協会 医薬品評価委員会 データサイエンス部会タスクフォース4
生存時間解析チームが
本シンポジウムの趣旨を踏まえ, 再構成したものである
発表構成 1. RMSTの定義と性質 2. RMSTの統計的推測 Kaplan-Meier法によるRMSTの推定 治療群間の比較 3. SASプログラミング時の留意点 SASプログラム 2つの分散の性質 4. まとめ
イベント発現までの時間を𝑻, 境界時間𝝉内での生存時間を𝑿 𝝉 = 𝐦𝐢𝐧 𝑻, 𝝉 とした場合,𝑿 𝝉 の平均値 RMSTの定義 境界時間𝝉内でのイベント発現までの時間に対する 平均値 𝝁 𝝉 = 𝐄 𝑿 𝝉 = 𝐄 𝐦𝐢𝐧 𝑻, 𝝉
RMSTの解釈 生存時間𝑻の生存関数を𝐒 𝒕 とすると,RMSTは, と表現できる RMSTは,「境界時間𝝉内における生存関数の 曲線下面積」としても解釈できる 6 𝝁 𝝉 = න 𝟎 𝝉 𝑺 𝒕 𝒅𝒕 生存割合 生存時間
𝝁(𝝉)
𝜏
0生存時間𝑿 𝝉 の分散 境界時間𝝉内での生存時間𝑿 𝝉 の分散は, と表せる この分散は必要症例数計算時に使用される 𝝈𝟐 𝝉 = 𝐕𝐚𝐫 𝑿 𝝉 = 𝐄 𝑿𝟐 𝝉 − 𝐄 𝑿 𝝉 𝟐 = 𝟐 න 𝟎 𝝉 𝒕𝑺 𝒕 𝒅𝒕 − න 𝟎 𝝉 𝑺 𝒕 𝒅𝒕 𝟐
Royston and Parmar (2013)により,Kaplan-Meier法 による生存曲線を積分する方法が示されている 𝑺 𝒕 はKaplan-Meier法による生存曲線の推定量 𝒕𝟏 < 𝒕𝟐 < ⋯ < 𝒕𝑫は境界時間𝝉内での𝑫個のイベント発現時点 𝒕𝟎 = 𝟎,𝒕𝑫+𝟏 = 𝝉 RMSTの推定量 ෝ 𝝁 𝝉 = 𝒋=𝟎 𝑫 𝒕𝒋+𝟏 − 𝒕𝒋 𝑺 𝒕𝒋
RMSTの推定量𝝁 𝝉 の分散ෝ Greenwoodの公式により, 𝒀𝒋はイベントが発現した時点𝒕𝒋でのリスク集合の大きさ 𝒅𝒋は時点𝒕𝒋でのイベント数 𝐕𝐚𝐫 ෝ𝝁 𝝉 = 𝒋=𝟏 𝑫 𝒊=𝒋 𝑫 𝒕𝒊+𝟏 − 𝒕𝒊 𝑺 𝒕𝒊 𝟐 𝒅𝒋 𝒀𝒋 𝒀𝒋 − 𝒅𝒋
×
×
×
𝑡0 𝑡1 𝑡2 … 𝑡𝐷 𝑌1 𝑌2 … 𝑌𝐷 リスク集合 0 𝑡𝐷+1 = 𝜏 𝜏 𝑑1 𝑑2 … 𝑑𝐷 イベント数治療群間の比較(RMSTの差) 群𝒈(対照薬群を𝟎,実薬群を𝟏)の RMSTの推定量を𝝁ෝ𝒈 𝝉 ,その分散を𝐕𝐚𝐫 ෝ𝝁𝒈 𝝉 2群のRMSTの差の推定量 分散 ෝ 𝝁𝟏 𝝉 − ෝ𝝁𝟎 𝝉 𝐕𝐚𝐫 ෝ𝝁𝟏 𝝉 − ෝ𝝁𝟎 𝝉 = 𝐕𝐚𝐫 ෝ𝝁𝟏 𝝉 + 𝐕𝐚𝐫 ෝ𝝁𝟎 𝝉
差の信頼区間、検定統計量 2群の差の𝟏𝟎𝟎 𝟏 − 𝜶 %信頼区間 𝒛𝜶は標準正規分布の上側𝟏𝟎𝟎𝜶% ෝ 𝝁𝟏 𝝉 − ෝ𝝁𝟎 𝝉 ± 𝒛𝜶 𝟐Τ 𝐕𝐚𝐫 ෝ𝝁𝟏 𝝉 + 𝐕𝐚𝐫 ෝ𝝁𝟎 𝝉 帰無仮説𝑯𝟎: 𝝁𝟏 𝝉 − 𝝁𝟎 𝝉 = 𝟎 対立仮説𝑯𝟏: 𝝁𝟏 𝝉 − 𝝁𝟎 𝝉 ≠ 𝟎 検定統計量 𝒔𝑫は漸近的に標準正規分布に従う 𝒔𝑫 = 𝝁ෝ𝟏 𝝉 − ෝ𝝁𝟎 𝝉 𝐕𝐚𝐫 ෝ𝝁𝟏 𝝉 + 𝐕𝐚𝐫 ෝ𝝁𝟎 𝝉
lifetestプロシジャ timelimオプションを利用 構文 timelim=Lには境界時間𝝉を表す数値を指定 timeは時間変数 censorは打ち切り変数(0は打ち切りを表す) RMSTを求めるためのSASプログラム
例 データセットSAMPLE SASプログラム TIME CENSOR 1 0 2 1 3 1 4 1 5 0
SASプログラミング時の留意点
timelimに指定した時間より後にイベントが発現している場合, 【 SAS/STAT(R) 14.1 User's Guide抜粋】
TIMELIM=time-limit
specifies the time limit used in the estimation of the mean survival time and its standard error. The mean survival time can be shown to be the area under the Kaplan–Meier survival curve. However, if the largest observed time in the data is censored, the area under the survival curve is not a closed area. In such a situation, you can choose a time limit L and estimate the mean survival curve limited to a
time L (Lee 1992, pp. 72–76). This option is ignored if the largest
例(境界時間𝝉 = 𝟑の場合) TIME CENSOR 1 0 2 1 3= 𝜏 1 4 1 5 0 SASプログラム 最終 イベント 出力結果 最終イベント発現時点(時点4) までのRMSTが出力されてしまう
事前に,データセットの加工が必要 DATAステップで,境界時間𝝉より後に発生したイベント を打ち切りに変換したデータセットを作成する 境界時間𝝉 = 𝟑の場合 TIME CENSOR 1 0 2 1 3 1 TIME CENSOR 1 0 2 1 3 1
lifetestプロシジャによる標準誤差 𝒀𝒋はイベントが発現した時点𝒕𝒋でのリスク集合の大きさ 𝒅𝒋は時点𝒕𝒋でのイベント数.𝒎 = σ𝒋=𝟏𝑫 𝒅𝒋 一方,Klein (2003),Collett (2015)等では Τ 𝒎 𝒎 − 𝟏 を掛けない分散が記載されている 𝐕𝐚𝐫 ෝ𝝁 𝝉 = 𝒎 𝒎 − 𝟏 𝒋=𝟏 𝑫 𝒊=𝒋 𝑫 𝒕𝒊+𝟏 − 𝒕𝒊 𝑺 𝒕𝒊 𝟐 𝒅𝒋 𝒀𝒋 𝒀𝒋 − 𝒅𝒋
2つの分散の性質 シミュレーションにより, 被験者𝒊 𝒊 = 𝟏, ⋯ , 𝒏 の生存時間𝑻𝒊が指数分布に従う 境界時間𝝉内での打ち切りが存在しない 𝑽𝒂𝒓_𝑺𝑨𝑺 = 𝒎 𝒎 − 𝟏 𝒋=𝟏 𝑫 𝒊=𝒋 𝑫 𝒕𝒊+𝟏 − 𝒕𝒊 𝑺 𝒕𝒊 𝟐 𝒅𝒋 𝒀𝒋 𝒀𝒋 − 𝒅𝒋 𝑽𝒂𝒓_𝑲𝒍𝒆𝒊𝒏 = 𝒋=𝟏 𝑫 𝒊=𝒋 𝑫 𝒕𝒊+𝟏 − 𝒕𝒊 𝑺 𝒕𝒊 𝟐 𝒅𝒋 𝒀𝒋 𝒀𝒋 − 𝒅𝒋
RMSTの推定量𝝁 𝝉 の分散ෝ 境界時間𝝉内で打ち切りが存在しないとき, RMSTの推定量𝝁 𝝉 は各被験者の生存時間𝑿ෝ 𝒊 𝝉 の単純平均 となるため,その分散は ෝ 𝝁 𝝉 = 𝟏 𝒏 𝒊=𝟏 𝒏 𝑿𝒊 𝝉 𝐕𝐚𝐫 ෝ𝝁 𝝉 = 𝐕𝐚𝐫 𝑿𝒊 𝝉 Τ𝒏 境界時間𝝉内での生存時間を 𝑿𝒊 𝝉 = 𝐦𝐢𝐧 𝑻𝒊, 𝝉
𝑻𝒊がハザード𝝀の指数分布に従う場合
境界時間𝝉内での生存時間𝑿𝒊 𝝉 の分散は Royston and Parmar (2013)により,
シミュレーションにより,𝐕𝐚𝐫 𝑿𝒊 𝝉 Τ𝒏との変化率 𝐕𝐚𝐫 𝑿𝒊 𝝉 = 𝟏 − 𝟐𝝀𝝉𝒆𝒙𝒑 −𝝀𝝉 − 𝒆𝒙𝒑 −𝟐𝝀𝝉 𝝀𝟐 𝑽𝒂𝒓_𝑲𝒍𝒆𝒊𝒏 − 𝐕𝐚𝐫 𝑿𝒊 𝝉 Τ𝒏 Τ 𝐕𝐚𝐫 𝑿𝒊 𝝉 𝒏 𝑽𝒂𝒓_𝑺𝑨𝑺 − 𝐕𝐚𝐫 𝑿𝒊 𝝉 Τ𝒏 Τ 𝐕𝐚𝐫 𝑿𝒊 𝝉 𝒏 ,
シミュレーション条件
シミュレーション回数100,000 境界時間𝝉 = 𝟐年
2年生存率0.9,0.7,0.5,0.3,0.1の指数分布 被験者数30,50,100例
シミュレーション結果(被験者数30例の場合) 2年 生存率 𝝉までの期待 イベント数 𝐕𝐚𝐫 𝑿𝒊 𝝉 /𝒏 𝑽𝒂𝒓_𝑲𝒍𝒆𝒊𝒏の変化率 𝑽𝒂𝒓_𝑺𝑨𝑺の変化率 0.9 3 0.004127 -0.047423 (0.002316) [4319] 0.625805(0.002877) [18628] 0.7 9 0.011167 -0.036021 (0.001002) [ 3] 0.090282(0.001061) [ 34] 0.5 15 0.015778 -0.034887 (0.000580) [ 0] 0.035939(0.000610) [ 0] 0.3 21 0.017257 -0.034298 (0.000408) [ 0] 0.015037(0.000435) [ 0] 0.1 27 0.013316 -0.033068 (0.000639) [ 0] 0.004680(0.000670) [ 0] Mean (SE) [計算不可回数](𝑉𝑎𝑟_𝐾𝑙𝑒𝑖𝑛はイベント0, 𝑉𝑎𝑟_𝑆𝐴𝑆は0及び1の回数)
シミュレーション結果(被験者数50例の場合) 2年 生存率 𝝉までの期待 イベント数 𝐕𝐚𝐫 𝑿𝒊 𝝉 /𝒏 𝑽𝒂𝒓_𝑲𝒍𝒆𝒊𝒏の変化率 𝑽𝒂𝒓_𝑺𝑨𝑺の変化率 0.9 5 0.002530 -0.026240 (0.001720) [501] 0.268747(0.001870) [3456] 0.7 15 0.006700 -0.022728 (0.000783) [ 0] 0.048542(0.000810) [ 0] 0.5 25 0.009467 -0.021683 (0.000449) [ 0] 0.019680(0.000462) [ 0] 0.3 35 0.010354 -0.020878 (0.000311) [ 0] 0.008282(0.000323) [ 0] 0.1 45 0.007989 -0.019464 (0.000496) [ 0] 0.003021(0.000510) [ 0] Mean (SE) [計算不可回数](𝑉𝑎𝑟_𝐾𝑙𝑒𝑖𝑛はイベント0, 𝑉𝑎𝑟_𝑆𝐴𝑆は0及び1の回数)
シミュレーション結果(被験者数100例の場合) 2年 生存率 𝝉までの期待 イベント数 𝐕𝐚𝐫 𝑿𝒊 𝝉 /𝒏 𝑽𝒂𝒓_𝑲𝒍𝒆𝒊𝒏の変化率 𝑽𝒂𝒓_𝑺𝑨𝑺の変化率 0.9 10 0.001265 -0.013414 (0.001210) [3] 0.099393(0.001263) [26] 0.7 30 0.003350 -0.011406 (0.000556) [0] 0.022994(0.000566) [0] 0.5 50 0.004733 -0.010854 (0.000317) [0] 0.009474(0.000321) [0] 0.3 70 0.005177 -0.010532 (0.000218) [0] 0.003894(0.000222) [0] 0.1 90 0.003995 -0.009718 (0.000353) [0] 0.001458(0.000358) [0] Mean (SE) [計算不可回数](𝑉𝑎𝑟_𝐾𝑙𝑒𝑖𝑛はイベント0, 𝑉𝑎𝑟_𝑆𝐴𝑆は0及び1の回数)
考察
𝑽𝒂𝒓_𝑲𝒍𝒆𝒊𝒏は,𝐕𝐚𝐫 𝑿𝒊 𝝉 /𝒏より小さくなる傾向 𝑽𝒂𝒓_𝑺𝑨𝑺は,
イベント数が少ない場合,𝐕𝐚𝐫 𝑿𝒊 𝝉 /𝒏より大きくなり, イベント数が多い場合,𝐕𝐚𝐫 𝑿𝒊 𝝉 /𝒏に近くなる傾向
分散まとめ
Klein (2003),Collett (2015),Rのsurvfit関数では, 𝑽𝒂𝒓_𝑲𝒍𝒆𝒊𝒏が示されている SASは,Kaplan (1958)及びLee (1992)を参考に 𝑽𝒂𝒓_𝑺𝑨𝑺の式を用いている どちらの分散式を用いるべきかのコンセンサスは 得られていない 本報告書では,RMSTの推定量に対する分散式として 𝑽𝒂𝒓_𝑲𝒍𝒆𝒊𝒏を用いている
まとめ RMST 定義:境界時間𝝉内でのイベント発現までの時間に対する 平均値 境界時間𝝉内における生存関数の曲線下面積 Kaplan-Meier法による生存関数を積分し,推定 lifetestプロシジャ timelimオプションを用いて計算可能 プログラミング時の留意点 以下のSASプログラムを報告書に記載 𝝉より後のイベントを打ち切りに変換
参考文献
Royston P, Parmar MKB. Restricted mean survival time: an alternative to the hazard ratio for the design and analysis of randomized trials with a time-to-event outcome. BMC Med
ical Research Methodology 2013; 13:152.
Klein JP, Moeschberger ML. Surival Analysis: Techniques for Censored and Truncated Data second edition. Springer-Verlag: New York: 2003.
Collett D. Modelling survival data in medical reseach, third edition. CRC Press: 2015.
Kaplan EL, Meier P. Nonparametric Estimation From Incomplete Observations. Journal of the American
Statistical Association. 1958: 53(282): 457-481.
Lee ET, Wang JW. Statistical Methods for Survival Data Analysis. Second edition. John Wiley & Sons: New York: 1992.