12. 統計的事項
12.3. 中間解析と試験の早期中止
・ 試験期間の途中において、試験の主たる目的が達成されたかどうかを判断するために主として有効性のエ ンドポイントの解析を行うことを中間解析と呼ぶ。ちなみに、英語での「interim analysis」は第III相試験(通常、
ランダム化第II相試験も)の中間解析をさし、2段階デザインの単群の第II相試験における“中間解析”は、
「interim analysis」とは呼ばず、「1st stage decision」と呼ぶ。日本語では「中間解析」と呼んでなんら支障はな いことから、これまでの慣習に則り、JCOG では 2 段階デザインの単群の第 II 相試験における「1st stage decision」も「中間解析」と呼ぶ。
・ ここでは中間解析の目的、時期、解析方法について記述する。定期モニタリングにおいて安全性の点から試 験を中止する場合の規準については、「14.1.定期モニタリング」に記述する。
・ 中間解析・最終解析の詳細な手順については、解析を行う前に別途「解析計画書」を作成してもよい。
・ 中間解析を行わない場合には理由とともにその旨を明記する。
・ 非劣性試験(第III相試験)の中間解析の場合、登録中の中間解析では有意に非劣性が示されただけでは有 効中止(非劣性中止)は行わず、有意に優越性が示された場合に有効中止を行うこととし、登録終了後の中 間解析では有意に非劣性が示されれば有効中止を行うことを原則とする。無効中止については、試験治療群 が標準治療群を下回っている時には総合的に検討することとし、試験治療群の標準治療群に対するハザー ド比の点推定値がハザード比における非劣性マージンを超えて上回った場合は無効中止することを原則とす る。
・ 中間解析で登録中止となった場合のその後の追跡期間は、あらかじめ登録完了後の追跡期間としてプロトコ ールで予定していた期間を標準とする。予定していた期間よりも追跡期間を短縮もしくは延長する場合は、効 果・安全性評価委員会に改訂申請が必要である。標準以外の設定を用いる場合、プロトコールに明記するこ と。
12.3.1. 中間解析の目的と時期
例):第III相試験
試験の途中で本試験の主たる目的が達成されたかどうかを判断する目的で2回の中間解析を行う。1回目 の中間解析は、登録中に登録を続けることが妥当かどうかを判断する目的で、2 回目の中間解析は登録終 了後早期に、予定した期間の追跡を続けるかどうかを判断する目的で行う。いずれの場合も試験の主たる目 的が達成されていると判断された場合は試験を中止し、速やかに試験結果を学会および論文にて公表する。
1 回目の中間解析は、原則として予定登録数の半数の登録が得られた時点以降に問い合わせを行う最初 の定期モニタリングのデータを用いて行い、2回目の中間解析は、登録が終了し、すべての登録患者のプロト コール治療が終了する時期を目途に、データセンターと研究事務局で相談した上で適切と思われる時期の定
JCOGプロトコールマニュアルversion 3.1 90/113 期モニタリングに合わせて行う。ただし、中間解析時点のイベント数が想定よりも極端に少ない場合は、少な くとも無効中止の検討に必要なイベント数(20 イベントを目安とする)が観察されるまで中間解析の実施を延 期する。
原則として1回目の中間解析中も登録は停止しない。
なお、試験進捗が予定どおりであった場合、12.2に示す前提の下での中間解析実施時の期待イベント数は、
第1回中間解析が登録開始後●年時点、第2回中間解析が登録終了後●年時点で行われるとした場合、そ れぞれ●、●となることが予想される。
(第1回中間解析のイベント数が20以下の場合:第1回中間解析のイベント数は20以下となるため、予定 通りであれば第1回中間解析は20イベント観察されるまで延期するが、可能な限り登録期間中に中間解析を 行えるようにデータセンターは研究事務局と協議して適切な中間解析の時期を決定する。)
例):第II相試験
登録途中で予想したよりも明らかに有効性が劣っていることが判明した場合に登録を中止する(無効中止)
目的で登録中に1回の中間解析を行う。
逆に予想したよりも有効性が優れていることが判明した場合は、それ以上試験に参加する患者に対する倫 理性は問題とならず、かつ、次の第 III 相試験のために安全性についても十分なデータを蓄積する必要があ ることから、登録は中止しない(有効中止はしない)。
原則として中間解析中も登録は停止しない。ただし、登録ペースが予想より大きく上回っていた場合には、
中間解析がなされるまでに過剰に患者が登録されてしまう可能性があるため、登録の一時停止を行うことが あり得る。予定外の登録一時停止を行うかどうかは、データセンターと研究事務局/研究代表者で相談した上 で決定する。研究事務局/研究代表者、グループ代表者、データセンターの間での意見の調整が困難な場合 には、登録一時停止の有無は効果・安全性評価委員会委員長もしくは副委員長が決定する。
12.3.2. 中間解析の方法
例1)第III相試験:Lan & DeMetsのα消費関数
中間解析はデータセンターが行う。試験全体のαエラーを片側 2.5%(あるいは片側 5.%)に保つために、中 間解析と最終解析における検定の多重性をLan & DeMetsのα消費関数を用いて調整し、群間の生存期間 の差について統計学的有意性を調べる。α消費関数として、O’Brien & Flemingタイプを用いる(→引用: Lan KKG, DeMets DL. Discrete sequential boundaries for clinical trials. Biometrika 1983;70(3):659-663.)。
中間解析の詳細について、データセンターの当該グループ担当統計スタッフは、中間解析の時点までに解 析計画書を作成する。実際の中間解析は、当該グループ担当ではない統計スタッフが行い、中間解析レポー トを作成する。
【優越性試験】
中間解析において、B群の生存期間がA群のそれを上回り、層別ログランク検定のp値が上記方法により 規定された水準を下回った場合、統計的に有意と判断し、原則として試験を中止する。B 群の生存曲線が A 群のそれを下回っている場合には、検定による判断を行わず、総合的に試験中止の是非を検討することとす る。
無効中止するか否かを判断する為の情報の一つとして、以下を算出する。
Primary endpointに関する予測確率(predictive probability:Spiegelhalterらの方法(→引用:Spiegelhalter DJ, Freedman LS, Parmar MKB. Applying Bayesian ideas in drug development and clinical trials. Statistics in Medicine 12:1501-1511, 1983.)に基づき研究終了時に得られるハザード比の分布を推定し、算出する 確率)
・ Primary endpointに関して最終解析時に統計学的有意にB群のA群に対する優越性が証明さ
れる予測確率
・ 最終解析時にB群のA群に対するハザード比の点推定値が1.0を超えて上回る予測確率
Primary endpoint に関する条件付き検出力(conditional power:Halperin らの方法(→引用:Halperin M, Lan KKG, Ware JH, et al. An aid to data monitoring in long-term clinical trials. Controlled Clinical Trials 3:311-323, 1982.)に基づき算出する検出力)
・ 中間解析後、B群とA群のハザード比が帰無仮説(HR=1.0)のまま維持されると想定した場合の、
中間解析結果を与えたもとでの条件付き検出力
・ 中間解析後、試験治療群と標準治療群のハザード比が試験計画時(HR=0.XX)のまま推移する
JCOGプロトコールマニュアルversion 3.1 91/113 と想定した場合の、中間解析結果を与えた元での条件付き検出力
【非劣性試験】
中間解析において、「12.1 主たる解析と判断規準」に定めた方法で、治療効果のハザード比およびその解 析時点での有意水準に対応する信頼区間を算出し、B群(XX療法)の全生存期間がA群(XX療法)のそれを 上回り、多重性を調整したハザード比の信頼区間の上限がハザード比における非劣性マージン 1.XXX を下 回った場合、統計的に有意に非劣性が証明されたと判断する。
また、非劣性が証明された場合、引き続き優越性の検証を行う。多重性を調整したハザード比の信頼区間 の上限が1を下回った場合、統計的に有意に優越性が証明されたと判断する。
無効中止するか否かを判断する為の情報の一つとして、以下を算出する。
Primary endpointに関する予測確率(predictive probability:Spiegelhalterらの方法(→引用:Spiegelhalter DJ, Freedman LS, Parmar MKB. Applying Bayesian ideas in drug development and clinical trials. Statistics in Medicine 12:1501-1511, 1983.)に基づき研究終了時に得られるハザード比の分布を推定し、算出する 確率)
・ Primary endpointに関して最終解析時に統計学的有意にB群のA群に対する非劣性が証明さ
れる予測確率
・ 最終解析時にB群のA群に対するハザード比の点推定値が1.XXを超えて上回る予測確率
Primary endpoint に関する条件付き検出力(conditional power:Halperin らの方法(→引用:Halperin M, Lan KKG, Ware JH, et al. An aid to data monitoring in long-term clinical trials. Controlled Clinical Trials 3:311-323, 1982.)に基づき算出する検出力)
・ 中間解析後、B群とA群のハザード比が帰無仮説(HR=1.XX)のまま維持されると想定した場合 の、中間解析結果を与えたもとでの条件付き検出力
・ 中間解析後、試験治療群と標準治療群のハザード比が試験計画時(HR=1)のまま推移すると想 定した場合の、中間解析結果を与えた元での条件付き検出力
本試験の中間解析結果に基づく判断規準は以下のとおりである。
・ 標準治療群(XX 療法)に対する試験治療群(XX 療法)の全生存期間での非劣性が証明されなかった 場合、あるいは、非劣性が証明されたものの優越性が証明されなかった場合はいずれの場合も試験 を継続する。
・ 標準治療群(XX療法)に対する試験治療群(XX療法)の全生存期間での非劣性が証明され、さらに優 越性まで証明された場合、試験を中止する(有効中止)。
・ 試験治療群(XX 療法)の全生存期間が標準治療群(XX 療法)のそれを下回っている場合には検定等 の統計学的な判断に制約されずに総合的に試験中止の要否を検討することとするが、ハザード比の 点推定値がハザード比における非劣性マージン(ハザード比=1.XXX)を超えて上回った場合(試験治 療群の許容範囲を超えて悪い場合)には、試験を中止する(無効中止)。
例2)第III相試験:SWOGの方法
中間解析はデータセンターが行う。試験全体の有意水準を 5%に保つために中間解析と最終解析による 多重性を考慮し、それぞれの時期における primary endpointの解析においては The Southwest Oncology Group(SWOG)の方法(→引用: Green S, Benedetti J, Crowley J. Interim Analysis and Data Monitoring Committees. In: Clinical trials in oncology. 2nd ed. Boca Raton: Chapman & Hall/CRC; 2003. p.97-122.)に従う。
下記の有意水準(いずれも片側)を用いる。
1回目中間解析: 0.005 2回目中間解析: 0.005 最終解析: 0.045
それぞれの時期の解析において、○○群の全生存期間が標準治療群のそれを上回り、層別ログランク 検定のp値が上記の有意水準を下回った場合、「統計的に有意」と判断する。
○群の全生存期間が標準治療群のそれを下回っている場合は検定による判断を行わず、総合的に試験 中止の是非を検討することとする。
例3)第II相試験 - 2 stage design:SWOGの方法※
中間解析はSouthwest Oncology Group(SWOG)の方法(→引用: Green S, Benedetti J, Crowley J. The design of clinical trials. In: Clinical trials in oncology. 2nd ed. Boca Raton: Chapman & Hall/CRC; 2003. p.41-77.)