• 検索結果がありません。

第 3 章 統計的関連性を用いた治療効果に対する代替性の評価尺度 43

3.5 適用例

3.5.2 ARMD Study

3.5. 適用例

表3.5 (b)より, 最頻値を用いて代替性を評価したとき, 代替性の評価尺度それぞれの

2.5%点と97.5 %点に基づく範囲は, 最尤法に比べて狭くなっているが, 12ヵ月時のLDL

とすべての時点のnon-HDL-Cについて, PTEの97.5 %点は1を超えていることがわかる. 他方で, 3, 6ヵ月時のLDL-Cについて, PCSの97.5 %点は0.500を下回っていることから, 表3.1を参照すると, LDL-Cの代替性の水準は“poor”であると判断することができる. 加 えて, 12ヵ月時のnon-HDL-Cについて, PCSの2.5 %点は0.634を超えているが,1には届 いていないことから, 12ヵ月時のnon-HDL-Cの代替性の水準は“moderate,” “substantial,”

もしくは“almost perfect”であると判断することができる. さらに,すべての時点において,

non-HDL-Cの2.5 %点は, LDL-Cの97.5 %点を超えていることから, non-HDL-CはLDL-C より優れたCHDイベントに対する代替エンドポイントであることがわかる. HRM法を用 いた最頻値によるPCSの結果は,既存の医学的な解釈である, LDL-Cは代替エンドポイン トとしては疑わしく(Barter et al., 2007; Psaty and Lumley, 2008), non-HDL-CがCHDイベ ントに対する良い代替エンドポイントになりうることを支持している.

3.5. 適用例

表3.6: ARMD studyデータ(Buyse and Molenberghs, 1998) Y

X S y1 y0

x1 s1 38 9

s0 9 31

x0 s1 30 8

s0 9 56

3.6に, Buyse and Molenberghs (1998)が代替エンドポイントの候補Sの妥当性を評価した 際のデータを示す.

本節では, PEとPCSに関して, 式(3.3)のhを恒等関数とし, 式(3.3)のgx0 と 式(3.6) と (3.7)のE(Y|x0, s)をpr(Y = 1|x0, s)に置き換え, そして, 式(3.3)のgx1 と式(3.7)の E(Y|x1, s) を共にpr(Y = 1|x1, s)に置き換える. 加えて, PTE とPIGに関して, 式(3.1), (3.2), (3.4)と(3.5)においてロジットリンク関数を用いる. そして, 3.2.2節で述べたように, 代替性の水準を判断するためのカットオフ値(表3.1)を用いる際は, PCSの点推定値では なく,その信頼区間の上限と下限を用いて代替性を評価する. この時,最尤法を用いて代替 性の評価をする場合は,代替性評価尺度の信頼区間として,表3.6のデータに基づく多項分 布を使ったパラメトリックブートストラップ法により, 1000個の最尤推定値を求め,その

2.5%点と97.5 %点を用いる. また, 最頻値を用いて代替性を評価する場合は,代替性評価

尺度の1000個の最尤推定値からリサンプリングして得られる最頻値を1000個用意し,そ の2.5%点,および97.5%点を用いる.

表3.7の2列目と3列目にそれぞれ,最尤法による代替性評価と最頻値を用いた代替性 評価による結果を示す. 2列目の結果より, 最尤法によって代替性を評価したとき, PTE の2.5%点と97.5 %点に基づく範囲は範囲[0,1]を含むことがわかる. また, PEとPCSの 2.5%点と97.5 %点はそれぞれ, (0.191,1.797) と(0.075,0.999)であるが, 治療効果をSが どの程度捕捉しているかを判断するには広すぎる. 3列目の結果より,最頻値を用いて代替 性を評価したとき,代替性の評価尺度それぞれの2.5%点と97.5 %点は範囲[0,1]に含まれ

3.5. 適用例

表3.7: ARMD Studyでの代替性の評価尺度の推定値

推定値(2.5%, 97.5 %) 代替性の評価尺度

最尤法による 代替性評価

最頻値を用いた 代替性評価 PTE 0.445 (-0.355, 2.160) 0.245 (0.203, 0.451) PE 0.690 (0.191, 1.797) 0.485 (0.410, 0.666) PIG 0.989 (0.898, 1.000) 1.000 (1.000, 1.000) PCS 0.832 (0.075, 0.999) 0.471 (0.326, 0.798)

ており,またそれらは,最尤法の結果より狭いことがわかる. 加えて, 提案手法によるPTE の97.5 %点は0.500を下回っている. 同様に, PEとPCSの2.5%点と97.5 %点はそれぞれ, (0.410,0.666) と (0.326,0.798) であるため, Sの代替性の水準は, “moderate” と “poor”の 間であると判断できる. この結果は, Buyse and Molenberghs (1998)の見解“the loss of two lines of vision at 6 months(S)is an incomplete surrogate for the loss of three lines of vision at 1 year(Y)”(ただし,(S)と(Y)は本章において追記した)を反映したものと考えられる. 他

方で, PIGの結果に着目すると,Sの代替性は“perfect”と判断される可能性がある. これは,

臨床的な観点(Csaky et al., 2008; Verteporfin in photodynamic therapy study group, 2001)か ら考えると, PIGは代替性の水準を高めに評価している可能性があることを意味している. 他の尺度に比べ, PIGが代替性を過大に評価することの理由として, 次の二つが考えられ る. 一つ目の理由として, PEおよびPCSをPIGと比較した時, 3.2節と3.3節に記載したよ

うに, PIGはX とSの従属関係の程度を適切に反映していない可能性があることが挙げ

られる. 二つ目の理由として, PTEをPIGと比較した時,この2つの尺度が考慮している条 件付き従属関係が異なることが挙げられる(Qu and Case, 2007; Freedman et al., 1992). 具

体的には, PTEは,Xを与えた下でのSとY の従属関係を考慮し, PIGはSを与えた下で

のX とY の従属関係を考慮している. なお,上記の二つの理由についての詳細な考察は, 付録3.7節を参照されたい.