本論文の貢献

第 5 章総括 100

5.2 本論文の貢献

の適当なカットオフ値を定義できないこと,そして三つ目は,代替性評価尺度の多くは,そのばらつきが大きく, そのため信頼区間が許容できないほどに広いことである. 一つ目の問題を解決するため,本論文では,統計的関連性を用いた新たな代替性評価尺度PCSを,治療効果のうち代替エンドポイントの候補が捕捉する部分と,捕捉しない部分への分解に基づいて導入した. そして,二つ目の問題を解決するため, PCSの微分を用いて代替性の水準を判断するためのカットオフ値を与えた. ここで,最終的な代替性の判断は,このカットオフ値によるものだけではなく,臨床的かつ生物学的な観点に基づいてなされるべきであることを強調しておく. 最後に,三つ目の問題を解決するため,推定された代替性評価尺度のブートストラップ分布の最頻値を用いた代替性の評価方法を提案した.

課題の二つ目に対しては,統計的因果推論に関する基礎的な概念を確認したうえで, Pearl 流の統計的因果推論を用いた代替性の評価尺度を提案した. 統計的因果推論の議論をふまえた代替性の評価は, 代替性を議論する際の根本的な要求であると考えられる. 統計的因果推論に基づく既存の代替性評価尺度(Taylor et al., 2005; Albert, 2008)は, 特定の仮定をおかない限り範囲[0,1]外の値をとるという問題点があった. この問題を解決するため,本論文では自然な直接効果および間接効果を用いた代替性の評価尺度C-PCSを提案した.

5.2 ^{本論文の貢献}

5.2.1 臨床的観点からみた本論文の貢献

無作為化比較試験における治療効果を判断するための評価項目(エンドポイント)の設定にあたっては, 治療効果を判断するための感度があること, および臨床的な妥当性があることが重要である(Fleming, 1996). そして,臨床エンドポイントの代わりの評価項目として,代替エンドポイントが必要とされており,そこに求められる実用上の性質として,臨床エンドポイントより早期に,より簡便に測定できることが挙げられている(Molenberghs

5.2. 本論文の貢献 et al., 2005).

Prentice (1989)に端を発するFreedman et al. (1992)のPTEなどの代替性の評価尺度は, 比較的簡単に算出できるため,近年になっても臨床家に広く利用されている(DePrimo et al., 2009; Boekholdt et al., 2012). しかし,前述の既存の代替性の評価尺度に対して,多くの問題点が指摘されているのも事実である(Lin et al., 1997; De Gruttola et al., 1997; Li et al., 2001;

Wang and Taylor, 2002; Qu and Case, 2007).また,複数の無作為化比較試験データを用いたメタアナリシスアプローチ(Buyse et al., 2000)も有効な手法ではあるが, 適切なデータ収集のための基盤が十分に整備されていないという問題点が残っている(Buyse et al., 2010;

Sargent and Mandrekar, 2013). 加えて, メタアナリシスを用いて代替性を評価する場合は, 次の二つの問題点が生じる. 一つ目は,メタアナリシスの対象となった複数の試験で用いられた薬剤に基づく代替性の結果を,それらとは機序の異なる薬剤の効果判定に適用可能であるか不明確である,という問題点がある(Prentice, 2009). 二つ目の問題点として,より早期に・より簡便に測定できる代替エンドポイントを探索する際に,候補となる測定値の測定時点や評価方法が対象となった複数の試験間で不均一である場合は,妥当な評価ができない,という問題点も考えられる(Molenberghs et al., 2005). これらのような問題点を考慮すると, 利用可能な情報に制限が加わるメタアナリシスより, 詳細な検討を加えることが可能な一つの試験に基づく代替性の検討は,依然として医学的に重要な意味を持つものと考えられる.

本論文で提案した代替性の評価尺度PCSは,このような一つの試験に基づく代替性の評価を念頭においている. そして, PCSは既存の統計的関連性を用いた代替性評価尺度の問題点を解決し, かつ臨床家でも理解しやすい性質を備えていることから, 臨床的観点からみて有用な尺度であると考えられる. 加えて, 既存の代替性評価尺度の信頼区間が許容できないほどに広く代替性の評価が十分に実施できなかった問題についても,最頻値を用いた代替性の評価方法により解決されており,本論文で提案した手法を活用することで今後は代替性の定量的な検討が促進されると考えられる.

5.2. 本論文の貢献

また, Pearl流の統計的因果推論に基づき,治療,代替エンドポイント,そして臨床エンド

ポイントを取り巻く因果メカニズムを視覚的に表現した上で代替性を評価することにより,臨床家と統計家が代替性の議論を綿密に行うことが期待される. この場面において,本論文で提案した自然な直接効果および間接効果を用いた代替性の評価尺度C-PCSは有用な尺度であると考えられる. 具体的には, C-PCSはPCSが持つ性質(具体的には,範囲[0,1]

内の値をとる性質)を引き継いでおり, 臨床家でも理解しやすい代替性の評価尺度となっている. これらのことが,臨床的観点からみた本論文の貢献である.

5.2.2 統計的観点からみた本論文の貢献

本論文で提案した代替性の評価尺度PCSは,範囲[0,1]内の値をとること,代替性の水準を判断するための適当なカットオフ値を定義できることが特徴であった. 前者の範囲[0,1]

内の値をとることについては,この性質を満足する尺度を統計家が提供するのは自然な考えである. また, 後者の代替性の水準を判断するための適当なカットオフ値を定義できる特徴については,そのカットオフ値がPCSの微分に基づいて与えられていることから,ここに統計的な貢献があると考えられる. ただし,第3章でも述べたとおり,与えられたカットオフ値は, 代替性のベンチマークとして利用可能ではあるが, 最終的な代替性の判断は, このカットオフ値によるものだけではなく,臨床的かつ生物学的な観点に基づいてなされるべきである.

次に本論文では,既存の代替性評価尺度の多くが持つ“信頼区間が許容できないほど広い”という問題を解決するために, 推定された代替性評価尺度のブートストラップ分布の最頻値を用いた代替性の評価方法を提案した. ここで, この問題に対する本論文の解決の意味について言及しておきたい. この問題に対する統計的観点からみた素直な解決方法は, 既存の代替性評価尺度そのものの推定精度向上を狙った方法の提案である. しかし, 本論文で提案した最頻値を用いた代替性の評価方法は,尺度そのものの推定精度を向上させて

ドキュメント内本文 Thesis 総合研究大学院大学学術情報リポジトリ A1717本文 (ページ 102-105)

第 5 章 総括 100

5.2 本論文の貢献

5.2 本論文の貢献

5.2.1 臨床的観点からみた本論文の貢献

5.2.2 統計的観点からみた本論文の貢献

第 5 章総括 100

5.2 ^{本論文の貢献}