臨床研究におけるRCTと観察研究
医薬品医療機器総合機構 新薬審査第三部 主任審査員(生物統計担当) 飛田英祐
本日の内容
• はじめに
– 臨床研究、治験、観察研究
• 臨床研究で生じる2種類の誤差
– 観察研究とRCT
– 観察研究におけるバイアス防止
• デザイン/解析 • STROBE声明 • メタ・アナリシス• まとめ
CJLSG臨床研究セミナー• 医学研究の種類
はじめに
CJLSG臨床研究セミナー 病気の予防方法、診断方法、治療方法の改善、病気の原因や理解並びに 患者の生活の質の向上を目的として、人を対象に行う医学系研究 臨床研究倫理指針、STROBE 観察研究:コホート、ケースコントロール、ケースシリーズ、症例報告等 薬剤や機器等の治療効果(有効性・安全性・動態)の評価/ 確認を目的とし、人を対象に行う試験 臨床研究倫理指針、CONSORT 臨床試験(介入研究) 承認審査を目的とした臨床試験 企業主導 / 医師主導 薬事法、GCPに準拠 治験 臨床研究臨床試験/治験
• 基本は対照治療との比較に基づき、試験治
療の効果を評価する
– 対照治療:プラセボ、標準治療、試験治療の異な
る複数用量、投与前の状態 等
• 基本的なデザインは
ランダム化比較試験
(
RCT
: randomized control trial)
– ランダム化による(群間の)比較可能性の担保
• RCTは試験治療等の介入に関する価値のあ
る高いエビデンスを提供
治験の限界
• 5 toos
(
Rogers A.S, 1987)
– too few:限られた症例数
– too simple:単純な投与方法
– too narrow:特殊な患者は除外
– too median-aged:年齢の制限
– too brief:投与期間が短い
CJLSG臨床研究セミナー• 一般化可能性、普遍性
の問題
– 実際の臨床現場での有効性、安全性は・・・?
• GCP下で同意が得られた患者を対象とした比較的高度 かつ専門的な医療機関で実施された臨床試験成績医薬品の承認と製造販売後調査
• 医薬品の承認 = 「リスク」<「 ベネフィット」
• 製造販売後調査の実施
– 治療薬が投与されているリスク集団を対象
• 未知/既知のリスクの早期発見・対処、正確に把握 • 年齢、性別、重症度等の要因が有効性/安全性に 与える影響の程度を広い患者集団で観察/調査 • 代替えエンドポイントと真のエンドポイントの関係 CJLSG臨床研究セミナー 治験の限界 観察研究 (薬剤疫学)臨床開発において必要な情報の一例
• 評価項目の選択
– 代替えエンドポイント、評価法のvalidation
• 選択/除外基準の設定
– 治療ターゲット集団の特定、疾患の有病率
• 外部コントロールの可能性
– 対象疾患の自然経過
• 前後差の臨床的意義に関する評価が可能 (効果のカットオフ値) CJLSG臨床研究セミナー
などの情報を得るために実施する
臨床研究はRCT以外でも有用では
観察研究
• 多くの臨床的、公衆衛生上の知見は観察
研究から得られているのは周知の事実・・・
CJLSG臨床研究セミナー– 実際の臨床現場の中での試験治療等の効果
を評価できる(一般化可能性への寄与)
• 幅広い患者層(重症度、年齢、特殊集団)、長期 投与、併用療法、真のエンドポイント– 疾患の潜在的なリスク因子の探索、その関連
の程度の推測
• 疾患とリスク因子の因果関係、原因の追及– 疾患の自然経過や予後
強み
弱み
臨床研究における問題解決の過程
CJLSG臨床研究セミナー 対面助言 承認審査 • 先行研究 • 先行試験 • クリニカル・リサーチ クエスチョン • ・・・臨床研究における生物統計的視点
• 臨床研究は
特定の集団内の健康に関連した状態、
事象の分布、決定要因に関する研究
– 個人データから集団レベルまでのデータを利用
– 研究結果の証拠能力の高さは、基本的に研究デ
ザインによって決まる
CJLSG臨床研究セミナー生物統計的視点の必要性
• 個人のバラツキを考慮し、集団として評価 • 研究デザインの計画段階から結果解釈の段階まで広義の研究デザイン
CJLSG臨床研究セミナー• アウトカム(疾病発生、効果等)に与える曝露(リスク
要因、治療薬等)の影響を妥当で、精度が高く、正確
に推定する
→調査や測定に関する誤差(error)を小さくする必要がある リサーチ・クエスチョン 目的 研究デザイン アウトカム 統計解析 目標症例数 広義の研究デザイン臨床研究における正確性
CJLSG臨床研究セミナー 正確性 (accuracy) 精度 (precision) 妥当性 (validity) 内部妥当性 (internal validity) 外部妥当性 (external validity) ランダム誤差 系統的誤差 (バイアス、交絡) 一般化可能性 普遍性臨床研究で生じる2つの誤差(error)
• 系統的誤差(systematic error)
– 測定値が真の値から特定の方向にズレている
(バイアス)
– 小さくすることで内部妥当性を担保でき、外的妥
当性の検討が可能になる
– 偏った結果に導きやすい「
悪性」の誤差
CJLSG臨床研究セミナー• ランダム誤差(random error)
– ズレが特定の方向に偏らない
– 小さくすることで推定の精度向上
– ある程度の制御可能な「
良性」の誤差
観察研究とRCTにおける最大の相違点
• RCTでは
ランダム化
をすることで
– 群間での背景因子を均質にし、
比較可能性
(内的妥当性)を担保
• 未観測の要因までも(理論的に)群間で分布を均質化 • 交絡因子によるバイアスの除去 – 群間の差について、介入方法以外の違いは偶然でしかない• バイアスを防ぎ、精度を高める強力なツール
– 群間での均質性を保証する可能性は大きいが、
必ず保証するものではない
– 重要な背景因子、交絡因子について解析で調整
する場合もある
CJLSG臨床研究セミナー観察研究における3大バイアス
• 交絡
– 比較を行うグループ間で関心のある曝露要因
以外のさまざまな条件が異なる際に起こり得る
• 選択バイアス
– リスク集団(目的とする母集団)から研究の対象者
をサンプルする際に生じるバイアス
• 情報バイアス
– 測定や収集するデータに関するあらゆる誤差が
引き起こすバイアス
CJLSG臨床研究セミナー交絡因子(Confounding Factor)
• 治療の有無と結果の因果関係に影響を与える
要因(因子)
CJLSG臨床研究セミナー 治療(曝露)の有無 (試験薬/プラセボ) 結果(outcome) 主要評価項目 治療(曝露)の有無の効果(結果)を調べたい その他の要因 性別、年齢、重症度、 ベースライン値、併用薬、等?
「結果」の原因となり得る 主要評価に影響を与える 治療の有無と関連がある (どちらかに偏って存在) 交絡因子 ランダム化により、 理論的に交絡を防止 ランダム化観察研究の疫病
• ランダム化ができない観察研究では、交絡等
によるバイアスのためグループ間の比較の
妥当性(内部妥当性)が保証されていない
CJLSG臨床研究セミナー• 研究結果の再現性に立ちはだかる疫病
– 種々のバイアスの問題
• 選択バイアス、情報バイアス、交絡因子、 報道バイアス、・・・• 十分な交絡因子の調整に限度があり、無視
できないバイアスの大きさが研究毎に混入
弱み
観察研究においてバイアスを防ぐ方法
① 研究におけるバイアスを防ぐ手段
– デザインで対処する方法
– 解析で対処する方法
② 研究報告の質の向上と結果の透明性
– STROBE声明
③ メタ・アナリシス
– 複数の類似研究をまとめて評価する
• 公表バイアスの問題 CJLSG臨床研究セミナー• 観察研究ではバイアスへの対処が研究を
成功へ導く重要な鍵
観察研究においてバイアスを防ぐ方法
① 研究におけるバイアスを防ぐ手段
CJLSG臨床研究セミナー• 観察研究ではバイアスへの対処が研究を
成功へ導く重要な鍵
治療(曝露)の有無 (試験薬/プラセボ) 結果(outcome) 主要評価項目 交絡因子 デザインで対処する方法 解析で対処する方法交絡によるバイアスをデザインで防ぐ
• サンプリング方法
– 対象者を限定
• 交絡要因が既知の場合に対象者をその要因の一部 に限定する(例:男性/女性のみ)– マッチング法
• グループ間で交絡要因の分布をそろえる(比較可能 性)、選択バイアスの防止 – 個別マッチング、頻度マッチング、カウンターマッチング – 傾向スコア:グループ間で共変量の分布のバランスを取る– 限定していない要因、マッチをとらなかった要因
の影響は取り除くことができない
CJLSG臨床研究セミナー交絡によるバイアスを解析で防ぐ
• 層化
交絡要因で層に分けた各層では交絡は除去され
ていることを利用
– 部分集団解析– 標準化
• 層化した各区分ごとの指標の加重平均 • SMR(standardized mortality ratio)など– 層別解析
• 標準化での各層でリスク比/差は共通の値と仮定 • Mantel-Haenszel検定 CJLSG臨床研究セミナー 60歳未満 60歳以上 あり なし あり なし ケース 32 5 77 4 コントロール 50 25 54 9交絡によるバイアスを解析で防ぐ
• 統計モデルの利用
– 結果のモデル化
• 多変量解析(重回帰、ロジスティック回帰、COX回帰等)– 曝露のモデル化
• 傾向スコアを用いた層別解析• 未知/未測定の要因の影響は調整できない
– 交絡因子は調査前に検討され、そのデータは研究
で全て収集しておく必要がある
• 注意:ケース・コントロール研究では情報バイアスとなる 可能性 CJLSG臨床研究セミナー調整(統計モデル)解析における変数選択
• デザイン上、解析上いずれも考慮していない
要因の影響までは防ぐことができない
CJLSG臨床研究セミナー• 交絡要因の選択(変数選択)が重要
– ベースラインにおける観察/測定項目の選択
• 測定項目数とコスト、記録の存在の有無など– どの交絡因子を調整解析に含めるか/否か
• 必要以上の変数を加えることによる推定精度の低下 – 不必要に効果の推定量の分散が大きくなる • 重要な交絡因子を加えないことによるバイアス統計モデル解析での変数選択
質問:回帰分析により解析したいのだが、モデルに含める
要因をどのように決めたらよい?
1. 入手できた全ての因子(交絡因子)をモデルに含める
2. ステップワイズ法により選択する
3. 交絡因子の中で曝露/非曝露グループ間でアウトカム
に有意な差が認められた因子のみをモデルに含める
4. 先行研究や文献、臨床的観点からアウトカムに対する
リスク因子の中から選択してモデルに含める
5. その他・・・
CJLSG臨床研究セミナー変数選択の現実的対処
• 統計モデルに含めなかった因子については、
交絡への対処はしていない
• 重要な交絡因子は必ず研究前に調査し、
解析モデルに加えて調整する必要がある
– 交絡因子数の見積もり
– 解析で十分対応できるだけのサンプル数の収集
• 回帰分析では、複数の因子とアウトカムの関連性を 調べられるが、、、 • 多くの交絡因子を含めるとモデルは不安定になる• 先行研究や文献、臨床的観点から必要十分
な要因を選択
CJLSG臨床研究セミナー傾向スコアを用いた調整
• 曝露のモデル化
– 傾向スコア(propensity score)
• 観測された共変量の下で対象者が特定の曝露(治療 法)を受ける確率のこと • 複数の共変量の情報を0~1の数値に縮約– 考え方
• どの要因の有無が曝露を受ける可能性が高いかの 確率をモデル化 – ロジスティック回帰モデル等でデータから推定 • 確率が近い人は、曝露の受けやすさが類似 • この確率を共変量として調整に利用 – マッチング、層別解析、多変量解析(回帰分析)など CJLSG臨床研究セミナー傾向スコアを用いたマッチング
• 傾向スコアの値が同じ対象者間では曝露群
と非曝露群で検討した共変量の分布は類似
– 各対象者の共変量データから傾向スコアを算出
– 2つの群で傾向スコアの値が等しい対象者をペア
• 同様な値の対象者を同じ層に属するとみなし、層ごと に曝露群または非曝露群に割付け • 層別割付によるランダム化比較試験と同様なデータが 得られているとみなせる– 不適切な傾向スコアのカテゴリー化は残差交絡
となり、バイアスになる可能性
CJLSG臨床研究セミナー傾向スコアを用いた解析の前提
• 傾向スコアの推定の妥当性
– 曝露、結果に影響を与える交絡因子の情報
– 交絡因子(共変量)と曝露のモデルの適切性
• モデル化の適切性
– 実際のデータから直接確認はできない
• 全ての交絡因子の利用可能性、未知の交絡因子 等– 間接的なチェック方法
• モデルの疑似決定係数、c-統計量 • 傾向スコアによる層別、マッチングした各層における 共変量の分布の類似性 CJLSG臨床研究セミナー観察研究においてバイアスを防ぐ方法
② 研究報告の質の向上と結果の透明性
– STROBE声明
• http://www.strobe-statement.org/– 観察研究の強みと弱みを評価するために、報告
において十分詳細かつ明記しておくべき事項
• Checklist for cohort studies
• Checklist for case-control studies • Checklist for cross-sectional studies
• Checklist for cohort, case-control, and cross-sectional studies (combined)
CJLSG臨床研究セミナー
• 観察研究ではバイアスへの対処が研究を
成功へ導く重要な鍵
STROBE Checklist_combined
1. title and abstract (a), (b) Introduction 2. background / rationale 3. objective Methods 4. study design 5. setting 6. participant (a), (b) 7. variable 8. data source 9. bias 10. study size 11. quantitative variable
12. statistical method (a), (b), (c), (d), (e) Result 13. participant 14. descriptive data 15. outcome data 16. main result 17. other analysis Discussion 18. key result 19. limitation 20. interpretation 21. generalisability Other information 22. funding CJLSG臨床研究セミナー
CONSORT 2010 checklist
1. title and abstract (a), (b) Introduction
2. background / objective (a), (b) Methods
3. trial design (a), (b) 4. participant (a), (b) 5. Intervention
6. outcome (a), (b) 7. study size (a), (b) randomization
8. sequence generation (a), (b) 9. allocation concealment
mechanism 10. implementation 11. blinding (a), (b)
Discussion
13. participant flow (a), (b) 14. recruitment (a), (b)
15. baseline data
16. number analyzed
17. outcome and estimation (a), (b) 18. ancillary analysis 19. harm Discussion 20. Limitation 21. generalisability 22. interpretation Other information 22. registration 23. protocol CJLSG臨床研究セミナー
STROBE声明
観察研究に特有の項目
4. Study design
– 研究デザインの骨格
• 対象集団の明確化 – コホート集団の曝露状況 – ソース集団 • 前向き/後ろ向きではなく、いつどのようにデータを収 集したのかが重要 • 元々は意図していなかった目的でのデータ利用 – 主目的として収集したデータの2次利用 – 目的としたリスク因子以外の要因と疾患発病との関係 CJLSG臨床研究セミナー原因追及の過程と観察研究デザイン
• 第1段階(記述疫学)
– 生態学的研究 – 症例報告 – ケース・シリーズ• 第2段階(分析疫学)
– 横断研究 – ケース・コントロール研究 – コホート研究• 第3段階(実験的研究)
– 介入研究 CJLSG臨床研究セミナー因果関係の糸口を得る
因果関係の推理
因果関係の確認
低い 高い証拠能力
結果と原因
観察研究デザイン
• 横断研究
– ある1時点における集団の対象者の要因曝露状
況と疾病状況との関連を調べる
• 要因(リスク因子)の曝露と疾病状況(疾病の有無)を 同じ時点で比較 • 原因と結果の因果関係は不明 CJLSG臨床研究セミナー デメリット メリット 現在 時間軸 がんの 頻度 野菜摂取量 比較現在 時間軸 比較 正常血圧群 高血圧群 脳卒中発生状況 将来
観察研究デザイン
• コホート研究
• 要因曝露から疾病発生まで時間を追って観察でき、時 間的順序と因果の方向が一致 – 曝露グループ別の疾病発生リスク、発生率をリスク差、リスク 比で定量的に調べることができる • 多人数を長期間追跡するためコスト(費用・時間・人手) と結果を得るまでに時間がかかる – まれな疾病の場合には大きな問題 CJLSG臨床研究セミナー デメリット メリット観察研究デザイン
• コホート研究
• 要因曝露から疾病発生まで時間を追って観察でき、時 間的順序と因果の方向が一致 – 曝露グループ別の疾病発生リスク、発生率をリスク差、リスク 比で定量的に調べることができる • 多人数を長期間追跡するためコスト(費用・時間・人手) と結果を得るまでに時間がかかる – まれな疾病の場合には大きな問題 CJLSG臨床研究セミナー デメリット メリット • 後ろ向きコホートでは、既存データにおける暴露状況 の記録の正確性 – 非暴露グループでの記録の不正確/存在しない – 選択バイアス/情報バイアス/思い出しバイアス過去 時間軸 喫煙状況 比較 非患者 肺がん患者 喫煙状況 現在