• 検索結果がありません。

99

3 章:生存時間データにおける統計解析

100

3.1.2 生存曲線の推定: Kaplan-Meier

生存曲線とは,X軸が生存期間,そして

Y

軸が生存割合で描かれた曲線であり,例えば,「期間Tまで生存した割 合はPである」ことが解釈できる.生存曲線の推定に一般的に用いられている方法が

Kaplan-Meier

法である.

3.2

は,仮想データ(全生存期間)に対する

Kaplan-Meier

法による生存曲線の推定結果(Kaplan-Meier曲線)であ る.Kaplan-Meier曲線は,生存期間が

0,そして生存割合が 1.0(生存期間が 0

の時点では被験者全員が生存してい ることを意味する)からの階段状プロット(stairs plot)によって表される.このとき,各階段は死亡(イベント)が観測された 時点を表している(死亡が観測された時点で生存割合が減少することを意味する).また,打ち切り時点には,目印(図

2

の場合には,「|」を目印としている)が付与される.

Kaplan-Meier

曲線の解釈には,(1) X軸(生存期間)から

Y

軸(生存割合)を評価する場合,(2) Y軸(生存割合)から

X

軸(生存期間)を評価する場合,の

2

種類が存在する.

評価(1)の一般的な用途は,年次生存割合の推定である.図

3.2

では

1

年生存割合の推定の過程を表している.

Kaplan-Meier

曲線では,階段の下側が生存割合を表しており,次の階段までの期間は同じ生存割合として解釈され

る.したがって, 1年生存割合は,1年(365日39

)までの期間において,最後に死亡(イベント)が観測されたときの生存

割合である.図

3.2

における,1年生存割合は,0.38(38%)である.

評価(2)の一般的な用途は,中央生存期間(MST:Median Survival Time)である.中央生存期間とは,被験者の

50%

が死亡するまでの期間(50%にイベントが発現するまでの期間)である.図

3.2

における中央生存期間は,286日であ る.

3.1.3 EZR による生存曲線の推定

(1)

データの概要

ここでは,North Central Cancer Treatment Groupによって実施された進行肺癌患者に対するデータ40を用いる.こ のデータは,228名の進行肺癌患者の全生存期間(日)がとられている.このデータは,Lung.csvで与えられる.変数 は,timeが生存期間,status(1:死亡,0:打ち切り)である.

39年次生存率の推定では,うるう年を調整するために,1年を365.25日とすることも多い.

40 Loprinzi CL., et al.: Prospective evaluation of prognostic variables from patient-completed questionnaires. North Central Cancer Treatment Group. Journal of Clinical Oncology. 12(3):601-7, 1994.

図3.2:仮想例に対するKaplan-Meierプロットとその解釈

101

(2) EZR

による

Kaplan-Meier

推定の方法

EZR

を用いて

Kaplan-Meier

推定を実行する.ここでは,日数で記載された生存期間を年に変換し,リスク集合のサ

イズ(任意の時点で死亡リスクに曝された被験者数)を

X

軸の下に記載する.

生存曲線の

Kaplan-Meier

推定の方法

1:

「統計解析」→「生存時間の解析」→「生存曲線の記述と群間の比較」を選択する.

2:

次のようなメニューが表示される.

このとき,

・「観察期間の変数(1つ選択)」で「time」を選択する.

・「イベント(1),打ち切り(0)の変数(1つ選択)」で「status」を選択する.

・「X軸の単位」で「日を年に変換」を選択する.

・「At riskのサンプル数を表示する」にチェックを入れる.

3:

「OK」ボタンを押す

ここで注意しなければいけないのは,イベント・打ち切りを表す変数のコードが決まっており,イベントは

1

で表し,打ち切りは

0

で表さなければならない.

このときの結果(青色の部分)の説明を以下に示す.

Output.1

Call: survfit(formula = Surv((time/365.25), status == 1) ~ 1, data = Dataset, na.action = na.omit, conf.type = "log-log")

time n.risk n.event survival std.err lower 95% CI upper 95% CI 0.0137 228 1 0.9956 0.00438 0.9693 0.999 0.0301 227 3 0.9825 0.00869 0.9539 0.993 0.0329 224 1 0.9781 0.00970 0.9481 0.991

(省略)

0.9938 69 2 0.4154 0.03583 0.3448 0.484 0.9966 67 1 0.4092 0.03582 0.3387 0.478 1.0157 65 2 0.3966 0.03581 0.3264 0.466

(省略)

1.9357 15 1 0.1246 0.02904 0.0748 0.188 1.9932 14 1 0.1157 0.02830 0.0676 0.178 2.0014 13 1 0.1068 0.02749 0.0606 0.168

(省略)c

これは,生存表と呼ばれるものであり,年次生存割合の推定値を得るために用いる.ここで,「time」は生存期間,

「n.risk」は

time

においてリスクに曝されている被験者数,「n.event」は

time

においてイベントがあった被験者数,

102

「survival」,「std.err」,「lower 95% CI」,「upper 95% CI」は,それぞれ

time

における生存割合,標準誤差,95%信頼区間 の下限値,上限値である.

例えば, timeが

0.9966

での

survival

0.4092(40.92%)が 1

年生存割合であり,1.9932での

survival

0.1157(11.57%)

2

年生存割合である(太字の部分).すなわち,年次生存割合は,当該生存期間以下の

time

のなかの最大値をとる

(例えば,2

年生存率では

2.0014

のほうが

2

年に近いが

1.9932

の行の情報を用いる).

Output.2 サンプル数 生存期間中央値 95%信頼区間 1 228 0.848733744010951 0.777549623545517-0.988364134154689

すなわち,中央生存期間は

0.849(年),95%信頼区間は[0.778, 0.988](年)であることがわかる.また,このときの

Kaplan-Meier

曲線を図

3.3

に示す.今回は,95%信頼区間を描写していないが,表示したい場合には,メニューの「95%

信頼区間を表示する」にチェックを入れればよい.