99
3 章:生存時間データにおける統計解析
100
3.1.2 生存曲線の推定: Kaplan-Meier 法
生存曲線とは,X軸が生存期間,そして
Y
軸が生存割合で描かれた曲線であり,例えば,「期間Tまで生存した割 合はPである」ことが解釈できる.生存曲線の推定に一般的に用いられている方法がKaplan-Meier
法である.図
3.2
は,仮想データ(全生存期間)に対するKaplan-Meier
法による生存曲線の推定結果(Kaplan-Meier曲線)であ る.Kaplan-Meier曲線は,生存期間が0,そして生存割合が 1.0(生存期間が 0
の時点では被験者全員が生存してい ることを意味する)からの階段状プロット(stairs plot)によって表される.このとき,各階段は死亡(イベント)が観測された 時点を表している(死亡が観測された時点で生存割合が減少することを意味する).また,打ち切り時点には,目印(図2
の場合には,「|」を目印としている)が付与される.Kaplan-Meier
曲線の解釈には,(1) X軸(生存期間)からY
軸(生存割合)を評価する場合,(2) Y軸(生存割合)からX
軸(生存期間)を評価する場合,の
2
種類が存在する.評価(1)の一般的な用途は,年次生存割合の推定である.図
3.2
では1
年生存割合の推定の過程を表している.Kaplan-Meier
曲線では,階段の下側が生存割合を表しており,次の階段までの期間は同じ生存割合として解釈される.したがって, 1年生存割合は,1年(365日39
)までの期間において,最後に死亡(イベント)が観測されたときの生存
割合である.図3.2
における,1年生存割合は,0.38(38%)である.評価(2)の一般的な用途は,中央生存期間(MST:Median Survival Time)である.中央生存期間とは,被験者の
50%
が死亡するまでの期間(50%にイベントが発現するまでの期間)である.図
3.2
における中央生存期間は,286日であ る.3.1.3 EZR による生存曲線の推定
(1)
データの概要ここでは,North Central Cancer Treatment Groupによって実施された進行肺癌患者に対するデータ40を用いる.こ のデータは,228名の進行肺癌患者の全生存期間(日)がとられている.このデータは,Lung.csvで与えられる.変数 は,timeが生存期間,status(1:死亡,0:打ち切り)である.
39年次生存率の推定では,うるう年を調整するために,1年を365.25日とすることも多い.
40 Loprinzi CL., et al.: Prospective evaluation of prognostic variables from patient-completed questionnaires. North Central Cancer Treatment Group. Journal of Clinical Oncology. 12(3):601-7, 1994.
図3.2:仮想例に対するKaplan-Meierプロットとその解釈
101
(2) EZR
によるKaplan-Meier
推定の方法EZR
を用いてKaplan-Meier
推定を実行する.ここでは,日数で記載された生存期間を年に変換し,リスク集合のサイズ(任意の時点で死亡リスクに曝された被験者数)を
X
軸の下に記載する.生存曲線の
Kaplan-Meier
推定の方法1:
「統計解析」→「生存時間の解析」→「生存曲線の記述と群間の比較」を選択する.2:
次のようなメニューが表示される.このとき,
・「観察期間の変数(1つ選択)」で「time」を選択する.
・「イベント(1),打ち切り(0)の変数(1つ選択)」で「status」を選択する.
・「X軸の単位」で「日を年に変換」を選択する.
・「At riskのサンプル数を表示する」にチェックを入れる.
3:
「OK」ボタンを押すここで注意しなければいけないのは,イベント・打ち切りを表す変数のコードが決まっており,イベントは
1
で表し,打ち切りは0
で表さなければならない.このときの結果(青色の部分)の説明を以下に示す.
Output.1
Call: survfit(formula = Surv((time/365.25), status == 1) ~ 1, data = Dataset, na.action = na.omit, conf.type = "log-log")
time n.risk n.event survival std.err lower 95% CI upper 95% CI 0.0137 228 1 0.9956 0.00438 0.9693 0.999 0.0301 227 3 0.9825 0.00869 0.9539 0.993 0.0329 224 1 0.9781 0.00970 0.9481 0.991
(省略)
0.9938 69 2 0.4154 0.03583 0.3448 0.484 0.9966 67 1 0.4092 0.03582 0.3387 0.478 1.0157 65 2 0.3966 0.03581 0.3264 0.466
(省略)
1.9357 15 1 0.1246 0.02904 0.0748 0.188 1.9932 14 1 0.1157 0.02830 0.0676 0.178 2.0014 13 1 0.1068 0.02749 0.0606 0.168
(省略)c
これは,生存表と呼ばれるものであり,年次生存割合の推定値を得るために用いる.ここで,「time」は生存期間,
「n.risk」は
time
においてリスクに曝されている被験者数,「n.event」はtime
においてイベントがあった被験者数,102
「survival」,「std.err」,「lower 95% CI」,「upper 95% CI」は,それぞれ
time
における生存割合,標準誤差,95%信頼区間 の下限値,上限値である.例えば, timeが
0.9966
でのsurvival
の0.4092(40.92%)が 1
年生存割合であり,1.9932でのsurvival
の0.1157(11.57%)
が2
年生存割合である(太字の部分).すなわち,年次生存割合は,当該生存期間以下のtime
のなかの最大値をとる(例えば,2
年生存率では2.0014
のほうが2
年に近いが1.9932
の行の情報を用いる).Output.2 サンプル数 生存期間中央値 95%信頼区間 1 228 0.848733744010951 0.777549623545517-0.988364134154689
すなわち,中央生存期間は
0.849(年),95%信頼区間は[0.778, 0.988](年)であることがわかる.また,このときの
Kaplan-Meier
曲線を図3.3
に示す.今回は,95%信頼区間を描写していないが,表示したい場合には,メニューの「95%信頼区間を表示する」にチェックを入れればよい.