45: 104 内分泌 ・糖尿 病 ・代 謝 内科,45(2):104-109,2017
躙
颯
鰈
輻
躙
Key Words : reseach design, clinical epidemiology,
EBM, cochrane collaboration, risk of bias
臨床研 究の分類
表1に
示 した ように,臨
床研 究 は実験研 究 と 観 察研 究 に分類 され る。実験研 究 は,介
入研 究 や臨床試験 と呼 ばれ ることがある。 また,観
察 研 究 は疫学研 究 と呼 ばれ る こ とが あ る。本稿 に おいては,治
療法 や予 防法 に関す る臨床研 究 に 限定す る ことにす る。 実験研 究 で は,治
療法 や予 防法 に関 して介入 をかける。介入 とは,日
常診療 とは異なる治療 。 予 防 を施す こ とを意味す る。そのため実施 にお いては,
よ り慎重 に行 うことが求め られ る。 な お,実
験研 究 はその性格 か ら試験 と呼ぶ こ とが あ る。観察研 究で は,日
常診療 どお りの治療 。 予 防 を施す.観
察研 究 は試験 とは呼 ばず,調
査 と呼ぶ ことがある。 実験研 究 は,単
群 での 自己対照試験 と二群以 上 の比較試験 に分 け られる(表 1)。 比較試験 は 既存 デー タと比較す る既存対照試験 と,比
較対 照 を同時 に設 ける同時対照試験 に分 け られ る。 そ して,同
時対 照試験 は非 ラ ンダム化試験 とラ ンダム化試験 に分 け られる。確率 を用 いて群 に 分 ける こ とをラ ンダム化(無作為化)と呼ぶ 。非 ラ ンダム化 とは,た
とえば交互 に割 り振 る よう折 笠 秀 樹
** な試験 である。 自由 に治療法 を選べ る ものは試 験 とは呼 ばず,観
察研 究 に該 当す る。 ラ ンダム 化試験 (R(r;Randomized Controlled Trial)は ,さらに並行群 間試験 と交差試験 に分 け られる。 介入 を伴 わない観 察研 究 は
,症
例報告 ・集積, 横 断研 究,縦
断研 究 に分 け られ る(表 1)。 横 断 研 究 とは時系列 を伴 わない研 究であ り,縦
断研 究 で は時 間経過 を伴 う。縦 断研 究 は,さ
らに前 向 きと後 ろ向 きに分 け られ る。前 向 きとはあ る 時点 か ら将来へ 向 けて とい う意味 であ り,後
ろ 向 きとはあ る時点 か ら過去へ 向 けて とい う意味 で ある.前
向 き研 究 として は前 向 きコホー ト研 究が知 られ る。後 ろ向 き研 究 と しては,ケ
ース コン トロール研 究 と後 ろ向 きコホー ト研究が知 られ る。 コホー トとい うのは特定 の集団の こと である.た
とえば,特
定診療科の患者,人
間 ドッ クを受 けた者,特
定 の地域 に住 む住民,特
定 の 薬剤 を飲 み始 め た患者 な どが該 当す る。 フラ ミ ンガムコホー トや久山町コホー トが有名である。エ ビデ ンス とは
エ ビデ ンス とい うのは証拠 や根拠 と訳 されて い る。その反対 は何 か とい うと経験 になるだろ う。1990年 頃にEBM(Evidence― Based Medicine) といって,科
学的根拠 に基づ く医療が登場 した。 数年前 に亡 くなったDⅣ
id Sackettがカナ ダ 。マ クマス ター大学 にいた ときにEBMを
提 唱 し,そ
臨床研 究 の エ ビデ ンス
レハ
Jレ
**:Evidence levels of clinical research.
**Hideki OⅢ GASA,Ph.D.:富山大学大学 院医学薬学研 究部バ イオ統計学 ・臨床疫 学教 室 〔5930‐0194富山県富 山
市'オ多4キ2630〕 ;D市ision of Biostatistics and Clinical Epidemiology,The Un市ersity ofToyama Gradutte School of
Medicine and Pharlnaceutical Sciences,′royan■a930-0194,J想いkN
EndOCrin010gy, 1)iabetology & Metabolisnl Aug. 2017
表
1
臨床研 究の分類 実 験研 究*(介 入研 究,臨
床 試験)Experimental Studies(Clinical Trials)自己ナ寸′照石肝究Selicontrolled Trials(Bebre― Aier Studies,single― arm Trials,UncOntrolled Trials)
比較研 究Comparative Studies(Controlled Trials)
既存対 照試験Historical Contr01 Trials
同時対 照試験Simultaneous cOntr01 Trials
非 ラ ンダム化試験Non―Randomized Trials
ラ ンダム化試験 Randomized(cOntr01led)Trials(RCT) 並行群 間試験Paranel‐grOup Trials
交差試験Cross―over Trials
観 察研 究(疫学研 究
,非
実験研 究)ObseⅣational studies(Epidemiological Studies,Non‐ experimental Studies)症例報告 ・症例 集積 CaSe repOrts/Case series→ 横 断 も縦 断 もあ る
横 迷斤研 究Cross―sectional studies
糸イ走断石肝究Iノongitudinal Studies 前 向 きProspective
(前向 き)コホー ト研 究 (Prospective)Coho■Smdies 後 ろ向 きRetrospective
ケ ース コ ン トロール研 究Case―Con廿01 studies
後 ろ向 きコホー ト研究Retrospective Cohort Studies
*実験研 究 は基本 的 に縦断研 究 である。 45: 105 の後Gordon Guya枕 らが米国医師会雑誌に論文 と して著 した1)。 Sackettが表 した
EBMの
教科書2)は とても有名である。なお,Sackettは その後オッ クス フォー ド大学へ移 り,Center for Evidence¨Based Medicine(CEBM)を
率いた。EBMは
何か というと,経
験則ではな く,な
ん らかの科学的データに裏づけられた医療 を行 う とい うものである。科学的データとは何か とい うと,臨
床研究 を通 して証明されたデータのこ とを指す.臨
床 とい うからには,「ヒ ト」が対象 でない といけない。 したがって,薬
理学的によ く効 くことを示す動物実験データがあるだけで は十分でな く,「ヒ ト」でよく効いたことを証明 しなければならない。人間を対象 とした臨床研 究を通 じて,「効 く」ということが立証されたデー タをエ ビデンス と呼ぶ。データは論文 として示 されるので,臨
床論文のことをエ ビデンス とい うこともある。エビデンスレベル とは
人 間 を対象 とした臨床研 究がエ ビデ ンス なの だが,臨
床研 究 もさまざまであ る。信用 に値 す る優 れた臨床研究 もあれば,あ
ま り信用 で きな い劣 った臨床研 究 もあ る。論文 になっていれば すべ て重 要証拠 か とい うと,そ
れ はそ うで もな 低 い 図1
エ ビデ ンスの階層構造 ピラ ミッ ドの頂点が研究 レビューで水準が最 も高い い。そこで,エ
ビデンス とい うものを序列化 し た ものがエ ビデンス レベルである。エ ビデンス レベルの分類 には,主
として研究デザイン名が 使われている。図1に
示 したように,ピ
ラミッ ドのようにエ ビデンス レベルは階層化 され,そ
の頂点にあるエ ビデ ンスが最 も証拠 レベルが高 い とされる。また,ピ
ラ ミッ ドの底 にあるエ ビ デンスは証拠 レベルが低い とされる。 歴史的にみると,1979年 ,カ
ナダで定期健康診 断の作業班が健康診断の推奨度を検討 していると き,は
じめて表2の
ようなエ ビデンス レベルを 示す表が登場 した3'。 実験研究の中のRCTが
最高錯精彎
:1摯摯
:摯
摯
,,轡
ヽ
1駆酔│:o日n111111 高 い45:106
内分泌 ・糖尿 病 ・代 謝 内科 第45巻 第2号表
2
カナ ダ の 定 期健 康 診 断 ガ イ ドラ イ ン作 成 作 業 班 が1979年に設 定 した エ ビ デ ンス レベ ルLevel Explanation
II-1
Evidence from at least one RCT
Evidence from at least one well designed cohort study or case control
study, i.e., a controlled trial which is not randomized
Comparisons between times and places with or without the intervention
Opinions of respected authorities, based on clinical experience,
descrip-tive studies or reports of expert committees
(文献3)よ り ) 表
3
米 国予防 サ ー ビス作業班(USPSTF)が1989年に設定 したエ ビデ ンス レベル II-2 111 [,evel Explanation I II‐ 1 11-2 II‐3 IIIEvidence obtained from at least one properly designed RCT
Evidence obtained form well-designed controlled trials without randomization
Evidence obtained from well-designed cohort or case-control analytic studies, prefer-ably from more than one center or research group
Evidence obtained from multiple time series designs with or without the intervention. Dramatic results in uncontrolled trials might also be regarded as this Wpe of evidence.
Opinions of respected authorities, based on clinical experience, descriptive studies, or reports of expert committees.
(文献4)よ り
)
表
4
オ ックスフォー ド大学EBMセ
ンターが2009年 に定めた治療・予防法に関 するエビデ ンス レベルLevel Grading Criteria SR(with homogeneity) of RCTs
Individual RCT (with narrow confi dence interval) A1l and none studies*
SR (with homogeneity) of cohort studies
Individual cohort study , low quality RCT Outcome research
i
Ecological studies SR (with homogeneity) of case-control studiesIndividual case-control study
Case-series, poor quality cohort and case-control studies
Expert opinion *全員が効 く,あるい は全員が副作用無 しの ように
,悉
無律 を示す顕著 な研 究 。 (文献5)よ り ) ・a ・b ・c 2a 2b 2c 3a 3b 4 5 位であ り,続
いてコホー ト研究やケースコン トロー ル研究 というランダム化 を伴 わない比較試験,そ
して最下位 には単 なる専門家が発する意見 となっ ていた。米国で も健康診断の是非 を見直す ように な り,米
国予防サー ビス作業班(USPttF)が
1989 年 に表3の
ようなエ ビデンス レベルを示 した4)。 カナダの もの と違いは何か とい うと,非
ランダム 化比較試験が コホー ト・ケース コン トロール研究 か ら区別 された点であろう。最後 に,EBMの
メ ッ カであるオ ックスフォー ド大学が2009年 に作成 し たエ ビデ ンス レベ ルが表4で
あ る5)。 ォ ックス フォー ド大学のエ ビデ ンス レベルはリサーチクエ スチ ョンごとに作 られているが,表
4に
は治療 。 予防法のための表だけを挙げた。ここではじめて,研 究 レビュー (Systematic Re宙
ew,略
してSR)と い う研究デザインが登場 した.研
究 レビュー とは 複数の臨床研究(主にR(r)を
挙 げ,そ
れ らを統合 す るような研究手法である。研究 レビューは高水 準 にあるが,複
数の臨床研究の結論 はほぼ一致 し てい る ことが前提 である。Endocrinology, I)iabet010gy& R4etab01isnl Aug. 2017 表
5
糖尿病 診療 ガ イ ドライ ンで用 いたエ ビデ ンス水準表 エ ビデ ンス レベ ル デザ イ ンの種類 45: 1071+
1 2 質の高いRCT*,お
よびそれ らのMA/SR**
それ以外 のRCT,およびそれ らのMA/SR**
前向 きコホー ト研究,お
よびそれ らのMA/SR**
(事前 に定めた)RCTサ ブ解析 非 ランダム化比較試験 自己対照(前後比較)試験 後 ろ向 きコホー ト研究 ケース コン トロール研究,お
よびそれ らのMA/SR**
RCT後付 けサブ解析 横断研究 症例集積 3 *質 の高いRCTと は,①
多数例(パワー大),②
二重盲検/独立 アウ トカム判定, ③高追跡率(低脱落率)/低 プロ トコル逸脱,④
ランダム割付法が明瞭,な どを指 す。**MA:Meta¨Anawsis(メ タ解析
),SR:System狙
c Review(研究 レビュー)(文献6)よ り ) エ ビデ ンス レベルの表 とい うのは
,こ
れ ら以 外 に も多 く存在す る。私 たちが関係 した糖尿病 診療 ガイ ドライ ンで は表5の
ような水準表 を用 ぃた6)。RCTで
も,質
の高い もの とそ うでない も のへ分 けた。そ して,質
の高 いR(刀之 それ らに よる研究 レビューを最高位 に置いた。特 に異なっ てい る点 は何 か とい うと, よ く見 かけるRCTの
サ ブ解析論文 を水準2に
位 置づ けた点,サ
ブ解 析 で も後付 けの もの を水準3に
した点がある。 また,非
ラ ンダム化試験や 自己対照試験 を レベ ル3に
した点や,後
ろ向 きコホー ト研究 を前 向 表6
エ ビデ ンス レベル に影響 す るその他 の要 因1.バ
イアス リスク(Risk of Bias) 研究計画 。実施上バイアスが混入 している可能性2.不
精確性(Imprecision) 少数例 などによる結論の信憑性が低い可能性3.低
品質(Low quality) 脱落・欠測 。倫理欠陥・財源不明など質が低い可能性4.非
直接性(Indirectness) 対象・介入・対照・結果指標などが的外れの可能性 5。 非一貫性(Inconsistency) 類似 した結果指標間で結論が異なるような可能性 表7
バ イアス リス クを評価 す るための項 目 RCTの場合(RoB 2.0ツ ール7))1.確
率割付 表 を正 し く作成 したか?2.割
付順 な どは実施者 に隠 していたか?3.被
験 者 。実施者へ盲検 したか? 4.アウ トカムの判定 は盲検 して行 ったか? 5。 アウ トカムの デー タに欠測 は少 なか ったか?6.選
択 的 に報告 してい なか ったか? 7.その他 のバ イアス(早期 中止 な ど)はなか ったか? Non¨RCTの場合 (ROBINS―Iツール8))1.介
入前 の交絡 ・選択バ イアス はなか ったか?2.介
入 時 の介入 ・対照 の分類 にバ イアス はなか ったか?3.介
入後 の逸脱 ・欠測 ・アウ トカム測定 。報告バ イアス はなか ったか? 観 察研 究 の場 合(GRI)Eの中で 開発9))1.対
象組 み入 れの適格基準 は問題 なか ったか?2.原
因 ・結果 の観察 ・測定法 に問題 なか ったか?3.交
絡 因子 につ い ては適切 に調整 していたか?4.追
跡 は十分 な されてい たか(脱落率<20%な
ど)? これ らは主 にコクラ ン共 同計 画 の作業班 に よって開発 されて きた。45: 108 きコホー ト研 究 よ りも
1水
準 下 げて水準3と し た点 も挙 げ られ る。 また,通
常 エ ビデ ンス レベ ルは研 究 デザ イ ンで定義 され るが,例
数 ・盲検 性 。追跡率 。逸脱 ・欠測 な ども勘案 して定義 し た。エ ビデ ンス レベ ル以外 に
考 慮 しな くて はい けない要 因
エ ビデ ンス レベ ルが高 ければ,す
ぐに信用が で きると判断 してはいけない。た とえRCTで
あっ て も,あ
ま りに少数例 であった り,中
途脱落が 多 か った り,ア
ウ トカム判定がいい加減 だ った りす る と,そ
れ らはあまり信用するに値 しない。 そ こで,エ
ビデ ンス レベル以外 に考慮 しな くて はい けない要因 を表6に
ま とめた。バ イアス リ ス クについては,研
究 タイプ ご とに確認 す る項 目を示 した(表 7). コクラン共 同計画 (Cochrane collaboration)が 作業班 を作 って,こ
のバイアス リスクの評価 ツー ルを開発 して きた。 目下,R(r用
,非
R(y「用,そ
して観察研究用 のバ イアス リス ク評価 ツールが ある。R(y「用のツールはRoB 2.0(Risk of Bias 2.0)と呼 ばれ
,確
率割付 ・盲検 。欠測 ・報告 バ イア スな どを含む7)。 非RCTは
ランダム化 していない比較試験 の ことであ り
,ROBINS―
I(Risk of Biasin Non―randomized Studies― of lnteⅣentions)と い うツールが開発 された8)。 介入前 ・介入時 。介 入後 におけるバ イアスを評価する。
3項
目挙が っ てい るが,最
後 の項 目はRCT用
の もの と同様 で ある。非 ランダム化試験では介入前 に交絡(重症 ほ ど治療群 に割 り当てる)。 選択(軽症患者が多 くなる)バ イアスが入 りやす くな り,治
療 ・予 防 法 の比較 を困難 にす る。介入時 に も介入群 と対 照群 の違 いが あい まい にな りが ちであ る。 この2項
目は非 ランダム化試験特有の ものである。最 後 に,コ
ホー ト・ケースコン トロール研究 といっ た観察研究のためのツールも開発 された9)。 曝露 ・ 対 照群 や ケース ・ コ ン トロール を適切 に組 み入 れたか,交
絡 因子 の適切 な調整,高
い追跡率が 特有 の点 であ ろ う。 バ イアス リス クのほか に も考慮 すべ き要 因が ある(表6).こ
れ らはGRADEシ
ステム(Grading of ReCOFnrnendatiOnS,Assess11lent,I)evelop― 内分泌 ・糖尿 病 ・代 謝 内科 第45巻 第2号 ment and Evduation)に 含 まれている10)。 また, コクラン共同計画(コクラン・研究 レビューハ ン ドブ ック11))にも取 り入れ られている。それ らは , 不精確性 ・低品質・非直接性 ・非一貫性である。 不精確 な結果 とい うものは
,少
数例 で信頼 区間 が広 い もの を言 う.倫
理 的 に欠陥があ り,利
益 相 反が疑 わ しい ときは低 品質であろ う。あ ま り 関係 が ない対 象 な どであれ ば,直
接性 に欠 けて い ることになる。 この ような臨床研究 を証拠 と した場合,た
とえエ ビデ ンス レベルが高 いRCT
であ って も値引いてみ ることが肝 要である。最 後 に挙 げたのが非一貫性 で あ り,個
々の臨床研 究 で は複 数 の アウ トカムで結論 が異 なる こ とを 指 す 。心不全 で は有効 だが,心
臓死 で は無効 の ような場合,結
論 は一貫 している とはいえない。 非一貫性 について は,研
究 レビュー をす る さい に も適用 され る。複数の臨床研 究 において,結
論 の一貫性 を確 認 で きれ ば信 憑度 は高 まる。 臨床研 究 それぞれ についてエ ビデ ンス レベ ル を評価 し,さ
らにバ イアス リス クな どの要 因 に つ いて も評価 す る。その うえで研 究 レビュー を す るのが一般 的 なス テ ップであ る。診療 ガイ ド ライン策定 にあたっては,さ
らに患者の価値観 ・ 医療費 ・有害事象 な どを勘案 した うえで治療 の 推奨度 を決定 してい る12)。 文献
1) Evidence-Based Medicine Working Group.
Evi
dence-based medicine : a new approach to teach-ing the practice of medicine. JAMA 7992;268:2420. 2) Sackett DL, Richardson WS, Rosenberg W, HaynesRB. Evidence-based Medicine: howto practice and
teach EBM. NewYork: Churchill Livingstone ,1997.
3) Canadian Task Force on the Periodic Health Ex-amination. Task force report : the periodic health
examination. Can Med Assoc J 1979; 121 : 1193.
4) U.S. Preventive ServicesTask Force. Guide to
clini-cal preventive services. 2nd edition. Appendix A, p.
862. Baltimore : Williams & Wilkins ; 1996.
5) Oxford Centre
for
Evidence-based Medicine (CEBM). Levels of Evidence, March 2009. URL: http : / / www. c e b m. n e t/ o xf o r d- c e n tre- evi d e n c e-based-medicine-levels-evidence-m ar ch-2009/
Endocrinology, Diabetology
&
Metabolism Aug. 2017 6)日本糖尿病 学会.糖
尿病診療 ガイ ドライ ン2016.東 京:南江 堂 ;2016.
7)Higgins JPT,SavOvic J,Page Ⅳ[J,et al、 (eds).Re‐ vised Cochrane risk Of bias tool for randOnlized tri‐
ds(RoB 2.0).In:ChandlerJ,ⅣIcKenzie J,BOutrOn
I,Welch V(eds).Cochrane Ⅳ【ethOds.cOchrane
I])atabaSe of Systeコnatic]Reviews 2016,Issue 10
(Suppl l).dX.dolorg/10.1002/14651858.CD201601.
URL:https://sites.google.com/site/五 sko島iastoo1/ welcol■ e/rob-2-0¨to01
8)Sterne JAC,Hernan MA,Reeves BC,et al.ROB¨
INS―I:a t001 fOr assessing risk Of bias in nOn_ rand01lniSed StudieS of interventions.BMJ 2016;
355:i4919.URL:https://sites.g00gle.coin/site/ riSkOfbiastoo1/welcome/home
9)Guya■ GH,Oxman AD,Vist G,et」 .GRADE guide―
*
lines:4.Rating the quality of e宙 dence¨ study limi‐
ta■OnS(risk of bias).J Clin Epidelnio1 2011;64:
407.
10)SChunemann H,Brozek J,Guyatt G,Oxman A (edS).Introduction to GRADE Handb00k:Hand‐
book fOr grading the quality Of evidence and the
Strength Of reCOnllnendations using the GRAIDE apprOaCh.IJpdated October 2013.URL:http:// gdt.guidelinedeVe10prnent.org/app/handbook/
handbook.htIIll
ll)Higgins JPr,Green S(eds).Cochrane Handb00k br Systematic Reviews of lnteⅣ entions,VersiOn
5。
1.0(updated March 2011).URL:http://
handbook.cOchrane.Org 12)福井次矢