• 検索結果がありません。

<総説>Evidenceを得るために 利用統計を見る

N/A
N/A
Protected

Academic year: 2021

シェア "<総説>Evidenceを得るために 利用統計を見る"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

Evidence を得るために

比 江 島 欣 慎

山梨医科大学数理情報科学

要 旨:最近,EBM,EBN,EBHC といった言葉を良く耳にする。EB は「Evidence-Based」すな わち「根拠に基づいた」を意味する。ランダム化比較試験の結果はこの根拠の 1 つになる。本論文 では,ランダム化比較試験の結果がなぜ根拠となりうるのかについて生物統計学の立場から議論す る。あわせて,ランダム化比較試験を行う際に注意しなければならない点をいくつか紹介する。 キーワード EMB,ランダム化比較試験,交絡,ランダム化 1.はじめに 近年,診療の現場では治療方法を決定する方 法 論 と し て Evidence-Based Medicine( EBM) が話題になっている。また,看護の現場におい ても Evidence-Based Nursing(EBN)が,その 他 関 係 す る 分 野 で も Evidence-Based Health Care(EBHC)などが話題となっている。 「Evi-dence-Based」は直訳すれば「根拠に基づいた」 となるが,ここで言う根拠は,過去の臨床研究 の結果(論文)をさす。これに,患者からのデ ータ(臨床データ,表情,主張など),医師や 看護婦の経験,一般的に言われていることなど の情報を加え総合的に判断して行動を決定する のが EB ○○である1) EB ○○を論じる場合,その論点は大きく 「つくる」,「つたえる」,「つかう」の 3 段階に 分けられる2)。それぞれ,現実の状況としては 「臨床研究」,「学会や論文での発表」,「診療や 看護」が対応する。本論文では,「つくる」す なわち「臨床研究」に絞って議論を進めてい く。 ところで,evidence を有する結果を与える 研究とはどんな研究だろうか。ある研究者は治 療を数多くの患者に行いその結果を集めて,こ れだけの症例の積み重ねによって得られた結果 なのだから evidence が有るに決まっていると 主張するかもしれない。また,ある研究者は比 較試験から出てきた結果なのだから evidence が有ると主張するかもしれない。一般には,ラ ンダム化比較試験の結果が最も質の高い evi-dence をあたえるといわれているが,なぜそう なのだろうか?すべてのランダム化比較試験が 良質の evidence をあたえるのだろうか?本論 文ではこうした疑問に応える形で,ランダム化 比較試験の妥当性とそれを実施する際に気を付 けなければならない点を指摘していく。 まず,第 2 節では,evidence を得るためには 比較試験を行わなければならないことを説明す る。第 3 節では,ある比較試験の結果を例に交 絡という現象を示し,続く第 4 節でランダム化 することの意義について解説する。第 5 節では, ランダム化比較試験を行うにあたり注意しなけ ればならないことを示し,第 6 節でまとめを行 う。なお,これから先の節ではある治療 A が 対象疾患に効果を持つかどうかといった問題を 中心に議論を進めていくことをあらかじめ断っ 〒 409-3898 山梨県中巨摩郡玉穂町下河東 1110 受付: 2001 年 2 月 1 日 受理: 2001 年 5 月 10 日

総  説

(2)

ておく。 2.比較すること 治療 A を対象疾患を持つ患者 200 人に行った ところ,180 人の症状が改善した。はたして治 療 A は効いたのだろうか? 対象疾患の種類に もよるが,それほど少なくはない 200 人という 数の患者に対して 9 割の改善率という結果を示 した治療 A は効果を有すると考えて間違いな いと判断する人がいてもおかしくない。そう判 断した人に次の質問を投げかけたい。もし,同 じ 200 人の患者に「病気が良くなる」というお まじないをかけたところ 180 人の症状が改善し たとしたら,それでも,治療 A が効いたと言 えるだろうか? と。 そもそも,治療 A が効くとはどういうこと だろうか? ある 1 人の患者について考えてみ れば,この患者に治療 A を行わないと症状は 改善しないが,行うと改善するといった状況の 時に治療 A が効いたと言えるだろう。患者の 集団で考えるならば,ある患者集団に治療 A を行わないときより行ったときの方がより高い 症状改善率を得られる場合に治療 A が効いた と言えるだろう。すなわち,治療 A を行った 場合とそうでない場合とを比較しなければ,治 療 A が効いたかどうかは判断できないのであ る。 さて,ここで問題が生じる。同一の患者もし くは同一の患者集団から同時に治療 A を行っ た場合とそうでない場合とを観察できるだろう か? 当然のことながらそれは無理である。で は,どうするか? 1 つの打開策としては,患 者とそっくりな患者を連れてきて,治療 A を 一方には行い他方には行わずにそれぞれを観察 し,その結果を比較するという方法が考えられ る。しかし,双子の患者でも利用しない限りこ の方法の実現は難しい。であるなら,この考え 方を患者集団に適用してはどうだろう。性質の 似た患者集団,すなわち,年齢の分布や男女比, および,研究の結果に影響を与えるような因子 の分布などが似ている患者集団を 2 つ用意し, 治療 A を一方には行い他方には行わずにそれ ぞれを観察し,その結果を比較するのである。 この方法であれば,2 集団間で集団として等質 化を計れば良く,双子の患者を利用する必要も なくなり,現実的に実施可能であると考えられ る。一般に,この方法による試験形態を比較試 験と呼んでいる。 これまでの流れからもわかるように,evi-dence を得るためには少なくとも比較試験の形 態をとる必要がある。このことは,治療の効果 の有無を調べるような集団に対して介入を行う ような研究(介入研究)に限った話しではなく, ある集団の特徴や傾向を調べる介入を行わない 研究においても同様であることを注意してお く。しばしば,集団の対象者の大部分が共通の 性質を持つからといって,その性質をもって集 団の特徴付けを行っている研究発表を見かける が,この結論には注意が必要である。特徴や傾 向というものは他と比べることによって明確化 するもので,単一の集団だけを調べてわかるも のではない。したがって,この場合においても 比較なしに出てくる結論は evidence とはなり 得ないのである。 Evidence のある結果を導きたいのなら,比 較試験を行わなければならないことがこれまで 議論で理解できたと思う。このことは,比較試 験の形態をとらない研究の結果を否定している わけではないことを断っておく。そうした研究 は,仮説の作成や情報収集にきわめて有用であ り,研究初期の段階では重要である。あくまで, 研究者が研究結果に evidence を求める場合に は,比較試験の形態をとる必要があるという話 しである。次節以降では,evidence を得るた めにどのような比較試験を行えばよいかについ て議論を掘り下げていく。 3.交  絡 治療 A が現場に耐えうる効果を有するかど うかを調べるために,現在標準的に用いられて

(3)

いる治療 B との比較試験をそれぞれ 100 人の患 者を用いて行った。その結果が表 1 である。 治療 A の有効率は 0.48,および治療 B の有 効率は 0.62,χ2検定の結果は p = 0.0466 とな り,残念ながら,治療 A は治療 B に勝る治療 とはこの結果を見る限り判断できない。むしろ 治療 B に劣る治療と判断するのが適切である。 では,次の表 2 および表 3 をみてほしい。こ れは,前出の結果を疾患の重症度別に分けた結 果である。 表 2 および表 3 では,それぞれ,治療 A の有 効率が 0.375 で治療 B の有効率が 0.2,治療 A の有効率が 0.9 で治療 B の有効率が 0.725 とな り,重症患者および軽症患者どちらの場合を見 ても治療 A の方が治療 B を有効率で上回って いる。最初の結果とは完全に逆転した結果とな っている。どちらの結果が正しいのだろうか? この現象はシンプソンのパラドックス3)と呼ば れているが,なぜこうした現象が起きるのかを ここで考えてみたい。表 2 および表 3 をよく見 ると次の 2 つのことに気づくだろう。 1)重症患者と軽症患者で治療 A,B の有効率 を比較すると,どちらの治療も重症患者に 対しては有効率が低く,軽症患者に対して は有効率が高い(治療 A は重症: 0.375 で 軽症:0.9,治療 B は重症:0.2 で軽症:0.725)。 2)治療 A を受けた患者には重症患者が多く (100 人中 80 人),治療 B を受けた患者には 軽症患者(100 人中 80 人)が多い。 これら 2 つのことが重なってこのパラドック スが起きている。どちらかが不成立だとこうし たパラドックスが起きないことは簡単に確認で きる。例えば,重症患者および軽症患者に対す る治療 A,B の有効率を変えずに,重症患者を それぞれ 40 人ずつ,軽症患者を 80 人ずつ割り 当てた場合を考えてみよう。表 2,表 3 は次の ように書き換えられる。 したがって,表 1 に対する表は次のようにな る。 治療 A の有効率は 0.725,治療 B の有効率は 0.55 となり,重症度別に見ても全体で見ても, 治療 A は治療 B に勝っている結果となる。確 かにシンプソンのパラドックスは起きていな い。 さて,1)の状態は,重症度という因子がそ れぞれの治療の効果に影響を与えていることを 示している。このような結果に影響を与える因 子を予後因子と呼ぶ。さらに,2)の状態はこ の予後因子に関して治療 A,B の割り当てに偏 りが生じていることを示している。このような 状態にある予後因子を交絡因子と呼ぶ。交絡因 子 の 正 確 な 定 義 に 関 し て は 他 を 参 照 さ れ た い4)。こうしたシンプソンのパラドックスが起 きていることを交絡が起きたといい,それに対 表 6.比較試験の結果 有効 無効 治療 A 48 52 治療 B 62 38 表 5.比較試験の結果(軽症患者) 軽症 有効 無効 治療 A 72 8 治療 B 58 22 表 4.比較試験の結果(重症患者) 重症 有効 無効 治療 A 15 25 治療 B 8 32 表 3.比較試験の結果(軽症患者) 軽症 有効 無効 治療 A 18 2 治療 B 58 22 表 2.比較試験の結果(重症患者) 重症 有効 無効 治療 A 30 50 治療 B 4 16 表 1.比較試験の結果 有効 無効 治療 A 48 52 治療 B 62 38

(4)

処するための統計的な方法が色々と開発されて いる。このデータの場合,重症度を交絡因子と 考えるならば,Mantel-Haenszel 検定3)が適用 でき,その結果は p = 0.029 となる。すなわち, 治療 A は治療 B に勝ると判断できる。 今回の例は結果が逆転するというとても強い 交絡が起きている状態である。一般にどのよう な比較試験の結果にも交絡は起きている。弱い 交絡は結果の方向性を逆転することはなく,推 定値の大きさに影響を与える程度である。交絡 の強さは,予後因子の結果に与える影響の強さ と,予後因子に関する各治療(介入)の割り当 ての偏り具合によって定まる。強い予後因子に 関しては,わずかな偏りでも強い交絡を引き起 こすことがあり,また,弱い予後因子でも大き な偏りがある場合には強い交絡が起きる。研究 者が強い交絡の予防に対して唯一できることは 偏り無く各治療(介入)を割り当てることであ る。 4.ランダム化 さて,比較試験に話しを戻そう。前節での治 療 A が標準治療 B よりも効果の面で優れてい るかを調べる比較試験において重要なのは,な るべく等質な 2 つの集団に治療 A,B をそれぞ れ行うことである。前節の交絡の例は,強い予 後因子に関して治療 A,B の割り当てに偏りが 生じたために引き起こされている。言い方を変 えれば,それぞれの治療が行われた集団間の等 質性が予後因子に関して大きく崩れたために引 き起こされている。強い交絡が起きていないこ とと集団間の等質性が保たれていることはほぼ 同値なことである。したがって,等質な 2 つの 集団を準備するためには,すべての予後因子を 同定した上で,それらの因子に関して治療 A, B を偏りが生じないように割り当てればよいわ けである。果たしてその様なことは可能なのだ ろうか? まず,すべての予後因子を同定できるかどう かを考えてみよう。先行している研究やこれま での経験などからある程度の予後因子を同定す ることは可能であろう。しかし,予想もしてい ない因子が研究の結果に影響を与えている可能 性は,どんなに調べたとしてもなくすことはで きない。結局のところすべての予後因子を同定 することは無理なのである。同定できなかった 予後因子に関して治療 A,B の割り当てに偏り が生じた場合,交絡の起きた結果を受け入れる しかないのである。もし強い交絡が起きていた 場合,逆転した結果を受け入れることになる。 前節の例で言うなら,重症度による交絡がある にもかかわらず,それに気づかずに(重症度を 予後因子として同定しておらずそのデータがな いので)表 2.1 の結果を受け入れることになる。 しかし,まだあきらめるのは早い。もし同定で きない予後因子に関して治療 A,B を偏り無く 割り当てる方法があれば,この状態を回避する ことができる。実は,患者に治療 A,B のどち らを行うかをランダムに決定するという手続き (ランダム化)が唯一この回避を期待できる手 だてなのである。 研究に参加する患者集団をランダム化によっ て 2 つに分けるとき,患者の数が十分大きいな らば,等質な 2 つの集団が作られることが期待 できる5)。それ以外の方法ではどうだろうか? 例えば,午前に来た患者を治療 A に,午後に 来た患者を治療 B に割り当てたとする。もし, 重症な患者ほど午前に来やすいという傾向があ ったとすると,この方法では前節のような結果 を招くことになる。ランダム化以外のいかなる 方法を用いても,予想もしない予後因子との関 連性を完全に否定できないため,その因子に関 する偏りによって強い交絡が引き起こされてし まう可能性を完全には否定できないのである。 ランダム化が唯一強い交絡の回避を期待できる 方法であることがわかる。 しかし,残念ながらランダム化は強い交絡の 回避を期待できる.....方法でしかないことに注意し なければならない。偶然のいたずらで強い交絡 を引き起こすことは十分にあり得るのである。 この偶然による交絡の影響を小さくするために

(5)

は,やはり予後因子の同定が必要不可欠である。 研究を行う前には入念な下調べを行い,研究結 果に強い影響を与える予後因子に関してはすべ て列挙しておくことが重要である。列挙された 予後因子に関して,治療 A,B が偏ることなく 割り当てられるようランダム化を工夫すること で,偶然による交絡の影響を小さくできる。交 絡の強さは予後因子の結果への影響力と偏り具 合で決まることを前節で説明した。見過ごして しまった予後因子の結果への影響力がそれほど 大きくなければ,その因子に関して極端な偏り が起きない限りは交絡の影響は小さいと考えら れる。強い予後因子を同定し治療 A,B の割り 当てを工夫する6)ことで,致命的な交絡が発 生する確率を低く押さえることができるのであ る。 これまでの議論で,強い交絡の影響を受けな い研究結果を得るためにランダム化が比較試験 において重要な役割を果たすことが理解できた であろう。こうした理由から,ランダム化比較 試験の結果は evidence を有していると判断さ れるのである。 5.ランダム化比較試験を行うにあたって ラ ン ダ ム 化 比 較 試 験 の 形 態 を と れ ば evi-dence のある結果が自ずと手にはいるわけでは ない。Evidence を得るために,前節では強い 予後因子を同定することの重要性を指摘した が,他にも注意しなければならないことが多分 にある。この節では,そうした注意点に関して 議論していく。 生物統計家 生物統計家である私がこのことを注意点の最 初に挙げるのは気が引けるのであるが,やはり きわめて重要であると考えるのであえて最初に 議論しておく。しばしば,研究における生物統 計家の役割は集まったデータの集計や解析だけ と誤解されている。事実,私の研究室にデータ を持って解析を依頼に来る研究者は多いが,研 究を行うので相談にのって欲しいと来る研究者 はほんの少しである。海外の研究においては計 画段階から生物統計家が関与するのが一般的で ある。データ収集の際にデータに混入してしま ったバイアス(研究結果をゆがめる原因)は, データ解析時にどんなに高等な統計処理を行っ てもその影響を排除できない。より品質の高い データが収集されるよう,生物統計家は研究の 計画や運営に関与しなければならないのであ る7)。是非とも研究を行う際には生物統計家に 相談に行くことをここで強くお願いしたい。 研究計画書 研究を行う際には研究計画書を作成する。計 画書には,どういう位置づけで研究を行うのか, どのような方法で行うのか,研究のタイムスケ ジュール,測定する項目など研究に関する詳細 を記す8)。ランダム化比較試験においては集め たデータを基にどのように比較するのかその解 析方法を記さなければならない。あわせて,こ の研究にどうしてこれだけの患者数が必要なの かその理由も記さなければならない。解析方法 を事前に記しておくことは,研究から出てきた 結論が,収集されたデータを見た上で都合のい い解析方法を選択して行った結果導かれたもの ではないことを保証するためである。また,必 要な患者数の理由を書いておくことは,不必要 に研究のために患者を犠牲にしていないことを 示すのと同時に,研究によって見つけられた介 入間の差が意義のあるものであることを示す。 これらの記載に関しては生物統計家の助言が必 要となるので,前述の通り生物統計家を計画段 階で関与させておくのが望ましい。Evidence を得るためには,計画段階からデータ収集後に 行われるデータ解析を視野に入れておかなけれ ばならないのである。 調査票 調査票のデザインが研究において収集される データの品質向上に寄与することは意外に知ら れていない。多くの研究者が研究計画に夢中に

(6)

なるあまりデータが記録される調査票の作成を ないがしろにしがちである9)。研究のスタイル にあった記入しやすい調査票を作成すること は,誤記入,記入漏れを防ぎデータ管理をしや すくする10)。特に,アンケート形式の調査票 を作成するときはより注意深い配慮をすべきで ある。個々の項目および質問に誤解が生じる表 現がないかチェックするのは重要であり,作成 した調査票は,作成に関与していない第三者に テスト記入してもらうことをお勧めする。最近 では,データ入力作業までを考慮し,OCR で の読み込みを前提とした調査票の作成も可能と なっている。研究を行う際には調査票の作成に も気を配るよう研究者にはお願いしたい。 脱落 ランダム化比較試験では,研究の対象者が研 究の途中でこなくなってしまい,以降のデータ の収集ができなくなってしまうことがある。こ うした対象者は脱落例として取り扱われるが, しばしば,何の検討をすることなく脱落例のデ ータを最終的なデータ解析からは削除する研究 者がいる。脱落となった対象者のデータの取り 扱いには慎重になるべきである。脱落の発生が 研究の結果と関連を持つ場合,脱落を無視した 解析にはバイアスが入ってしまう。例えば,症 状が改善すると患者の疾患への関心が薄くなり 来院しなくなる傾向があったとする。こうした 状況下でランダム化比較試験を行い,脱落例を 除いたデータ解析を行うと,症状を改善する治 療ほど改善率が低く推定される傾向になること になる。研究者はなるべく研究において脱落例 が生じないよう配慮すべきであるが,やむをえ ず脱落例が出てしまう場合は,その理由,脱落 時の状態等を調査しておく必要がある。そして 可能であるなら,研究終了時の脱落例の状態を 追跡調査しておくのがよい。こうした努力は ITT 解析11,12)の際に重要な情報を与える。 ざっと注意しなければならない点を列挙し議 論してきたが,まだまだ多くの問題点がある。 最近では,研究を行う際に参考になるガイドラ イン13)や解説書9,14)なども作成されているの でそちらに目を通しておくことをお勧めする。 Evidence を導くためにはそれ相応の努力と手 間が必要であることをここで強調しておきた い。 6.最 後 に これまで,evidence を有する結果を導くた めには比較することとランダム化することが重 要であるということを議論してきた。そして, ランダム化比較試験の実施にあたっては,計画 段階から配慮すべきことが数多くあることを指 摘してきた。たとえ小規模のランダム化比較試 験であっても,いざ実施してみると様々な予期 しない問題が起こり,試験を管理運営していく ことが大変であることを,計画した経験のある 研究者は感じているだろう。ましてや大規模な 長期追跡型の研究となるとその苦労は相当なも のである。現在,臨床研究の管理・運営をサポ ートする部門,Clinical Research Center の設 立が各施設で行われている。ここでは,臨床研 究における患者のエントリー,スケジュール管 理,調査票の管理などの業務を主に行う。そこ で業務を行うスタッフを Clinical Research Co-ordinator と呼ぶが,十分な経験を持った人材 が不足しており,その育成が急務とされている のが現状である10,15)。今後こうした人材を育て る教育機関を大学に設置する必要があるのでは ないだろうか。 さて,研究はその主たる目的によって大きく 検証的か探索的かの 2 つに分けられるが,これ まで議論してきたランダム化比較試験は,検証 を主たる目的においた研究で主に用いられる。 検証的な研究を行う際には,実施に必要な情報 を得るための多くの探索的研究がその以前にな されているのが一般的である。予後因子の同定 など探索的研究の結果はランダム化比較試験を 行う際に必要不可欠であり,探索的研究を決し てないがしろにしてはいけない。EBM の浸透 とともにランダム化比較試験ばかりを重要視す

(7)

る傾向が一部では見受けられるが,多くの探索 的研究の結果の上に成立しているランダム化比 較試験こそが evidence を有する結果を与えて くれることを研究者は忘れてはいけないと最後 に強調しておきたい。 参考文献

1) 名 郷 直 樹 : EBM. EBM ジ ャ ー ナ ル , vo1. 1, no. 1: 96–97, 2000. 2) 津谷喜一郎, 内田英二:薬とエビデンスに関す る全体の見通し図.EBM ジャーナル,vo1. 1, no. 1: 98–103, 2000. 3) 柳川 堯:離散多変量データの解析.共立出版, 東京,1986. 4) 佐藤俊哉:疫学研究における交絡と効果の修 飾.統計数理,42: 83–101, 1994. 5) 佐藤俊哉:治療のランダム割り付けと治療効果 の検定. 医学のあゆみ, 173: 779–784, 1995. 6) 比江島欣慎:臨床試験 FAQ ―まじめに質問して みよう―.椿広計,藤田利治,佐藤俊哉編集. これからの臨床試験医薬品の科学的評価―原理 と方法.朝倉書店,東京: 150–158,1999. 7) 佐藤俊哉:試験統計家が果たすべき役割.Bio-medical Perspectives, 8: 394–401, 1999. 8) 藤田 利:臨床試験とは.椿広計,藤田利治, 佐藤俊哉編集.これからの臨床試験医薬品の科 学的評価―原理と方法.朝倉書店,東京: 1–19, 1999. 9) Pocock S. J.:クリニカルトライアル よりよい臨 床試験を志す人たちへ. コントローラー委員会 監訳.篠原出版,東京,1989. 10) 比江島欣慎, 佐藤俊哉, 椿広計:生物統計学から み た Megastudy, 循 環 器 科 , 37: 441–447, 1995. 11) 佐藤俊哉: Intention-to-treat の考え方.医学の あゆみ,173: 925–930,1995. 12) 松井研一: ITT 解析の考え方.椿広計,藤田利 治,佐藤俊哉編集.これからの臨床試験医薬品 の科学的評価―原理と方法.朝倉書店,東京: 102–112,1999. 13) 厚生省:医薬品の臨床試験の実施の基準に関す る症例(平成 9 年 3 月 27 日厚生省令第 28 号), 1997. 14) 椿 広計,藤田利治,佐藤俊哉:これからの臨 床試験医薬品の科学的評価―原理と方法.朝倉 書店,東京,1999. 15) 椿広計,比江島欣慎:抗高脂血症薬市販後調査 「Mega Study」について,統計数理,43: 183–189, 1995.

参照

関連したドキュメント

第四。政治上の民本主義。自己が自己を統治することは、すべての人の権利である

このため、都は2021年度に「都政とICTをつなぎ、課題解決を 図る人材」として新たに ICT職

次に、第 2 部は、スキーマ療法による認知の修正を目指したプログラムとな

点から見たときに、 債務者に、 複数債権者の有する債権額を考慮することなく弁済することを可能にしているものとしては、

自分は超能力を持っていて他人の行動を左右で きると信じている。そして、例えば、たまたま

Bemmann, Die Umstimmung des Tatentschlossenen zu einer schwereren oder leichteren Begehungsweise, Festschrift für Gallas(((((),

「新老人運動」 の趣旨を韓国に紹介し, 日本の 「新老人 の会」 会員と, 韓国の高齢者が協力して活動を進めるこ とは, 日韓両国民の友好親善に寄与するところがきわめ

 模擬授業では, 「防災と市民」をテーマにして,防災カードゲームを使用し