• 検索結果がありません。

研究デザインと統計解析の基礎

N/A
N/A
Protected

Academic year: 2021

シェア "研究デザインと統計解析の基礎"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

研究デザインの重要性

 研究とは,ある事柄に対して実験,観察,調査という 手段を通して取得した事実から,専門的な知識をもとに 考察して一定の見解を得る過程である。そもそもなんら かの疑問をもって仮説を立て,その考えに基づいた,で きる限り客観的なデータから結果を得て考察に至るとい う作業を通して一定の見解を得るために研究を行う。信 頼度の高いデータと結果を効率的に得るために,研究デ ザインや研究方法が重要視される。  研究デザインの知識は,特に臨床研究で必要となる。 臨床研究とは人を対象として行われる研究である。臨床 研究という性格上,大きくは対象や測定されるデータの 偏り,解釈の誤りなど,研究によって得られる見解の信 ぴょう性が疑わしくなる。人が人を対象としてデータを 記録するのだから,いかに用意周到に計画した研究で あっても完璧はあり得ない。  したがって,これからはじめようとする研究デザイン を分類し,その特徴を把握したうえで起こり得る問題を 予想できるのが望ましい。研究をはじめる前に,可能な 限りバイアスを排除し,またどうしても疑わしい,もし くは混在してしまうバイアスを限界として把握できなけ ればならない。他者の研究報告を受ける側としては,バ イアスの存在を推定し,そのバイアスを勘案したうえで 結果がどこまで解釈できるかを見抜く必要がある。

研究デザインとはなにか

 臨床研究における研究デザインは,表 1 のように分類 される。時間要因による分類や対象の割りつけによる分 類,介入の有無によって研究デザインが決まる。記述的 研究と観察的研究については明確な区分けのできない場 合もある。特定の症例集団に対して現状調査をする研究 はケースシリーズ研究であり,横断研究とも判断できる。  研究によって知りたいことは記述統計・予測(現状の 把握),判別(診断),因果関係に大別される。おもに記 述統計には記述的研究と観察的研究デザイン,判別には 観察的研究デザイン,因果関係には観察的研究または実 験的研究(介入研究)デザインが適用される。  記述統計・予測は,原因と思われる要因と結果と思わ れる要因との関係を見るものである。因果関係は不明で もよい。結果と思われる要因として疾患や障害の特徴 (記述的研究,横断研究),またその有無の差異(ケース コントロール研究[後ろ向き研究])が扱われる。記述 統計・予測は,基本的に単純な統計と相関関係に関する 研究である。  判別は,グループを判別するために影響要因を探索す る研究である。因果関係は仮説段階であることが望まし い。健常群と疾患群の判別になにが影響するか,歩行自 立群と歩行不能群の予後予測になにが影響するか,疾患 を有する者の診断に(疾患を有さない者と比較して)な にが指標となるか,などの研究である。おもな研究デザ インは観察的研究デザインのうち,ケースコントロール 研究に代表される後ろ向き研究や横断研究が該当する。  因果関係は,観察的研究のうちおもにコホート研究が 有効であり,実験的研究の方が適切である。ただし,実 験的研究を行った結果から得られる結論が因果関係の確 定に結びつくとは限らない。因果関係の結論に至るため には,いくら優れた研究でも簡単に達成できないので ある。

研究デザインとバイアス

 研究で扱うデータには偶然誤差と系統誤差という誤差 が存在する。これらのうち系統誤差はバイアス(bias; 偏り)と呼ばれる。偶然誤差は,無意識かつランダムに 生じる誤差であり,バイアスは無意識または意識的な行 為によって生じる一定量の偏った誤差である。偶然誤差 は,複数回測定したデータを平均すれば統計的に相殺で

シリーズ 「臨床研究入門」

連載第 3 回 

研究デザインと統計解析の基礎

対 馬 栄 輝

1) *

Design and Statistical Method in Clinical Research of Physical Therapy

1) 弘前大学大学院保健学研究科

(〒 036‒8564 青森県弘前市本町 66‒1)

Eiki Tsushima, PT, MSci, PhD: Graduate School of Health Sciences, Hirosaki University

キーワード:研究デザイン,バイアス,統計解析

(2)

きるのが特徴である。これに対して,バイアスは統計的 な処理が不可能であり,ときには偏った結果から誤った 結論を招いてしまう。  バイアスの代表的なものには,選択バイアス,情報 バイアス,交絡バイアス(単に交絡というときが多い) がある。研究デザインにより,バイアスの特徴がある (表 2)。 1.選択バイアス  選択バイアスは,対象を選択する際に生じるバイアス である。選択バイアスを回避する理想としては,対象を ランダム抽出(単純ランダムサンプリング)する必要が あるが,現実にはほぼ実現不可能である。しかし,層別 サンプリングを考慮するなどの工夫によってかなり信 ぴょう性の高いデータを得られるのも事実である。  サンプリングの工夫に限界があるときは,対象者の制 約を留意しておくとよい。まず,対象者(標本)は母集 団から抽出され,さらに母集団は調査対象集団から抽出 されると考える(図 1)。理想的には調査対象集団が母 集団と等しいときであるが,そう単純ではない。調査対 象集団は“日本全国の 60 歳以上の者”と決めたなら, 母集団が“○○年△月×日∼◎日に A 県 B 市の健康教 ケースシリーズ研究

Case series study △ △ ○ なし なし

分析的研究 Analytical study 観察的研究 Observational study 横断研究 Cross-sectional study ○ あり 特になし なし ケースコントロール研究

Case control study △ ○ あり 特になし なし コホート研究 Cohort study ○ △ あり 特になし なし 実験的研究 experimental study (介入研究 Intervention study) ランダム化比較試験 Randomized Controlled Trial ○ あり あり あり 準ランダム化比較試験

Controlled clinical trial ○ あり 準ランダム化 あり クロスオーバー比較試験

Crossover trials ○ あり 準ランダム化 あり 前後比較試験

Before-after trials ○ なし あり 対照のない研究

Study with no controls ○ なし あり † 観察的研究に含めるときもある ‡ ○が一般的な分類であり,データの取り方によって△に該当する場合もある 表 2 主要な研究デザインとバイアス デザイン バイアス 割りつけのバイアス 因果関係 選択 情報 交絡 横断研究 〇?△? △ × − × 後ろ向き研究 〇?△? △ × × △ 前向き研究 ○ ○ ○ ○ ○ RCT ×?△? ○ ◎ ◎ ○ ◎:ほぼ回避可能 ○:配慮することで回避可能 △:配慮することで,ある程度は回避可能 ×:回避不能なので,対処が必要

(3)

室に参加した 60 歳以上の者”だとすれば,そこから抽 出された対象者は調査対象集団からの標本として妥当だ ろうか。対象者の属性は,この理想(調査対象集団)に 見合うだろうか。もし妥当でないとすれば,どういった 点に特徴のある対象者となっているだろうかと考察す る。そのためには,対象者の除外基準を述べるだけでは 不十分で,包含基準を明示する方が具体的である。  選択バイアスは,対象者の同意を得なければならない 実験的研究の方が問題となる。むしろ記述的研究,観察 的研究では手順の工夫で選択バイアスをかなり排除でき るときもある。  なお,結果となる変数を 2 群以上に割りつける,割り つけのバイアスは割りつけ手順の詳細を示さないと評 価できない。仮に,ランダム化比較試験(以下,RCT) における割りつけ時のコンシールメントを実行したとし ても,具体的な説明は必要である。 2.情報バイアス  情報バイアスとは,データなどの情報を得る際に生じ るバイアスである。たとえば仮説に見合うように,介入 群はよい結果を期待するので,無意識によい方向へ評価 したくなることもあろう。対象者も研究者との関係がよ ければ,よい結果をだそうと努力するだろうし,その逆 もあり得る。また「過去 1 ヵ月間に転倒しましたか?」 という調査をするとき,過去の思い出しのバイアス(リ コールバイアス)が,大いに存在するであろう。こうし たリコールバイアスに対しては,後ろ向き研究では特に 注意が必要で,影響を少なくするためには前向き研究デ ザインが有効である。事前知識の少ない前向き研究,特 に RCT では情報バイアスの排除に有効ではあるが,完 全に排除できるわけではない。  情報バイアスの対処法としてはブラインディング(盲 検化;マスク化ともいう)が原則であるが,後ろ向き研 究では難しいときも多い。情報バイアスは当然,情報の 収集時に発生するので,研究者は評価・測定手順を詳細 に記したマニュアルに忠実にしたがい,事前のプレテス トによる練習も必要となる。  横断研究であれは,被検者への測定順序を計画的に 割りつけて情報バイアスを減らすこともできる1)。こ れを局所管理という。3 つ(A,B,C)の測定を行う とき,A の後に B を測定すると A の効果がもち越され てしまうといった問題が疑われる場合は,被検者 a を A → C → B,b を C → B → A,c を B → A → C, … な どのように順序の影響やもち越し効果を各条件に均等に 割りつける工夫がある。局所管理はいかなる測定に対し て適用できるというわけではなく,条件数が多いときや 時間的な制約がある際には適用し難いという欠点がある。 3.交絡バイアス  原因変数と結果変数が関連性をもつとき,その背後 に存在する隠れた要因を交絡因子(confounding factor) といい,交絡因子が存在することを交絡バイアス(また は単に交絡)と呼ぶ(図 2a)。  交絡因子の条件は①アウトカムと因果関係をもつ,② リスクファクターと関連する,③中間因子(mediator variable)ではない(すなわちリスクファクターの結果 ではない),の 3 点である。図 2b の例では体重が膝伸 展筋力に影響すると考えるとき,身長も間接的に影響す るのではないだろうかという交絡が推測できる。また図 2c では,歩行速度が日常生活活動(以下,ADL)に影 響すると考えるが,膝伸展筋力が間接的に影響するので はないだろうかという交絡を推測する。このような交絡 バイアスが疑わしいときは,原因変数と結果変数の関係 を解析すると同時に交絡因子の影響を調整しなければな らない。  RCT であれば,交絡バイアスをほぼ回避していると 考える。その他の研究デザインでは交絡バイアスが間違 いなく存在すると考えるので,一般的にはマッチング (図 3)もしくは,後述する多変量解析を適用する。

因果関係の仮定と確認

 因果関係の定義として Hill の 9 条件2)(表 3)がある。 この条件を押さえたうえで因果関係を仮定する。といっ ても,この 9 条件をすべて満たさなければ因果関係は成 り立たないわけではない点が因果追究の難しさである。  たとえば図 4a のように体重が膝伸展筋力に影響する 図 1 調査対象集団と母集団,標本の関係

(4)

図 2 交絡バイアスと交絡因子の例 図中の矢印は,原因から結果に向けて引いている.つまり矢印を受ける方が結果変数である.なお,こ の図で例として挙げていることは,あくまで説明のための仮説であり真に因果関係があるかどうかにつ いては定かではないことを断っておく. 図 3 交絡因子をマッチングする一例 交絡因子の影響を排除するために,交絡因子の条件が対象者ごとに異ならないようにする. 表 3 因果関係に対する Hill の 9 条件2)

関連の強さ (strength of the association) 一貫性 (consistency) 時間的前後関係 (Temporality) 用量反応勾配 (biological gradient) 関連の特異性 (specifi city) 生物学的妥当性 (biological plausibility) 過去の経験や知識との整合性 (coherence) 実験に基づく証拠 (experiment) 類似性(類推) (analogy)

(5)

と考える。膝伸展筋力が強い者は体重が重く,膝伸展筋 力が弱い者は体重が軽いとき,「体重は膝伸展筋力に影 響する」と判断した。なお,あくまで仮定の一例である ことを断っておく。同時に,体重と身長が強い相関関係 にあるとする。それであれば,身長の高い者が体重は重 く,身長の低い者が体重は軽いという交絡バイアスの存 在が疑わしい。この“身長”は①膝伸展筋力(結果)と 因果関係をもつ,②体重(原因)と関連する,③中間因 子ではない(体重が原因となって決まる結果ではない因 子)である。  こんどは図 4b を見ると,形のうえでは図 4a と似て いるが,少し意味合いが異なる。膝伸展筋力が日常の活 動範囲に影響するという因果関係を仮定しているのだ が,交絡因子と思われる“歩行速度”が存在する。しか し“歩行速度”は①確かに活動範囲(結果)と因果関係 をもち,②膝伸展筋力(原因)と関連するとしても,③ “膝伸展筋力”が原因となって決まる結果である点(矢 印の向きが異なる)が交絡因子と異なる。歩行速度が速 く(原因)なれば膝伸展筋力が強くなる(結果)わけで はない。これは中間因子である。  中間因子が存在する場合は,マッチングや多変量解析 に含めて調整すべきではない。原因と考えられる変数だ けか,中間因子のいずれかだけを解析の対象とするのが 適切である。ただし,因果関係と同様に中間因子である と確定するのも難しく,また解析者の考え方次第で変化 するために,扱いは慎重でなければならない。図 4 のよ うなパス図を書いてなにを知ろうとしているのか,整理 したうえで研究にとりかかるべきである。

統計解析の基礎

 統計解析は,推定と統計的仮説検定(検定)に分けら れる。データの平均や中央値を求めたり,95%信頼区間 を求める,相関係数を求める,重回帰分析によって回帰 式を求める,主成分分析を行って主成分負荷量を求め る,などの手法は推定の範疇に入る。かたや検定は,2 標本 t 検定や相関の検定,Tukey 法による多重比較法 などを行って確率 p を求め,有意に差があるとか有意 な相関があるなどの判断を下す。  統計解析はデータを取得した後に行うが,事前になに を知りたいか明確にしたうえで適用する手法を決めてお く。検定の基礎知識は本稿で省略するので対馬3)など を参考にされたい。  統計解析はパソコン用の統計ソフトウェア(統計ソフ ト)を用いれば計算を誤ることはないし,各統計ソフト に対応した成書も散見されるので,どの手法を選んだら よいかと迷わずに済むだろう。しかし,データをただあ てはめていけばよいというわけではないので,基本的か つ重要な注意点を挙げる。 1.因果関係と相関関係の区別  研究によってなにを明らかにしたいのかが明確であっ ても,統計解析で適用を誤るケースは少なくない。特に 因果関係については仮説に基づいて確認しておく必要が ある。統計学の用語として,結果変数は従属変数とか 目的変数といい,原因変数は独立変数とか説明変数と いう。   た と え ば, 介 入 群 と 対 照 群 に 分 け て,3 ヵ 月 後 の ADL 得点を測定し,差があるかを検定した。その場合 は原因変数(独立変数)が介入群・対照群であり,結果 が 3 ヵ月後の ADL 得点なので,2 標本 t 検定や Mann-Whitney の検定が適用される(図 5a)。もし介入 A 群, 介入 B 群,対照群のように 3 群に分かれていたなら, 分散分析を適用する。  これとは別に,対象者の入院時の握力を計測(原因) して,1 ヵ月後に ADL 自立群と介助群に分けた(結果) とする(図 5b)。ADL 自立と介助の違いに握力は影響 するだろうか,と考えるときは判別分析や多重ロジス ティック回帰分析の方が適切である。この設定を誤ると 見当違いの結果に至ることもあるので注意が必要である。 2.検定で得られる確率 p の解釈  検定で出力される p の意味は,差の検定であれば母 集団の平均差がない,相関の検定であれば母集団の相関 がない(ρ = 0),分割表の検定であれば行要因と列要 図 4 交絡因子と中間因子の違い b. では原因:膝伸展筋力から歩行速度に矢印が向かっている点で,a. と異なる.

(6)

因に関連がない,などの相違や関連が無(= 0)に等し い状況を仮定したときに,そのデータの相違や関連がど れくらいの確率で起こるかを推定した結果である。  健常群の平均握力が 25 kg で,ある患者群の平均握力 が 23 kg だったとき,平均で 2 kg の差がある。仮に健 常群の母集団平均握力と患者群の母集団平均握力に差が ないとしても,標本の取り方によっては平均 2 kg 程度 の差は起こり得るかもしれない。この 2 kg の差の起こ り得る確率が検定で出力される p となる。もし,p = 0.02 のように小さければ,健常群の母集団平均握力と患者群 の母集団平均握力に差がないという状況下では 2%ぐら いの確率でしか起こり得ないということで,それぞれ の母集団の平均には差があると考えた方が無難である。 そのカットオフ値は有意水準であり,慣習的に 5%で定 まっている。  p の注意点は,相違や関連の程度にまで触れていない ことである。結論からいえば p が小さい方が差が大き いとか,相関が大きいという判断はできない。p はあく まで,相違や関連のない可能性を表すだけである点に注 意が必要である。  もし,相違や関連の程度を知るためには,95%信頼区 間を参照する他はない。多くの統計ソフトでは,正規分 布にしたがうデータを対象とするパラメトリック検定 (分散分析を除く)で 95%信頼区間がほとんど出力され る。しかし,正規分布以外のデータに適用するノンパラ メトリック検定では 95%信頼区間が出力されないとい う欠点がある。 3.記述上の注意  検定で出力される確率 p は,有意水準 p = 0.05 未満 は有意な差があるとか,有意な相関があると判定する。 差の検定であれば,「p < 0.05 は有意な差がある」とか, 「棄却域を p < 0.05 とした」と述べる。p = 0.05 は有意 水準であり,上述したカットオフ値であるから,「有意 水準は p = 0.05 とした」と書くのが正しく,「有意水準 を p < 0.05 とした」と記述するのは間違いである。も う一点は,差の検定によって p = 0.052 であったとき, p = 0.05 に近い値なので「p = 0.052 で差の傾向があっ た」と記すときがあるが,p を見て“差の傾向”を推定 できないので,誤りの表記である。パラメトリック検定 であれば 95%信頼区間をみるか,ノンパラメトリック 検定であれば,せめて効果量(eff ect size)で判断する。 4.多変量解析の活用と過用  臨床研究で得られるデータは,適切な RCT のデザイ ン以外は交絡因子の混在が否定できない。多くは,交絡 因子を考慮した多変量解析の問題である。現在は,世界 的に認められている高い精度の統計ソフト4)が無料で 入手できる時代であり,多彩な多変量解析の手法も可能 である。可能な限り多変量解析の適用を試みるべきであ る。特に重回帰分析や多重ロジスティック回帰分析は活 用価値が高い。  とはいえ,理学療法関連の研究論文では多変量解析の 誤用・乱用が多く見られるのも事実である。特に多分に 主観の入りやすい,主成分分析や因子分析,正準相関分 析などの多変量解析は,専門家に解釈手順を相談または 確認した方が無難である。

今後の課題

 これからの理学療法士は,たとえ臨床における介入を 重視するといっても研究デザインや統計解析に関する知 識は必須となるだろう。同じ専門家の研究報告を正しく 解読できる能力が当然のように必要となるからである。  本稿ですべてを網羅できるわけではないので,さらに 関連する文献や資料を参考にして理解を深めていただく ことを期待する。しかし,研究のための知識を習得する という考えが基盤にある限りは,回り道となり兼ねない。 上述してきた事項を,理学療法の臨床にどう癒合させて いくかの考えが必要となる。なぜ,臨床に対して必要な のかを明確に把握して目的意識をもたなければ結局,研 究のための知識に留まる。この点は歴史的な反省点であ り,改めて考えなければならない課題となるだろう。 図 5 結果変数,原因変数と適用される統計解析

(7)

利益相反

 本論文に関して開示すべき利益相反はない。

文  献

1) 対馬栄輝:よくわかる研究法 3 エビデンスと研究デザイン との関係を知ってますか? 理学療法.2010; 27(4): 569‒575.

2) Hill AB: The Environment and Disease: Association or Causation? Proc R Soc Med. 1965; 58: 295‒300. PMC: 1898525. PMID: 14283879.

3) 対馬栄輝:よくわかる医療統計─「なぜ?」にこたえる道 しるべ─.東京図書,東京,2015.

4) 改変 R コマンダー.http://personal.hs.hirosaki-u.ac.jp/~pteiki/ research/stat/R/(2017 年 6 月 7 日引用)

図 2 交絡バイアスと交絡因子の例 図中の矢印は,原因から結果に向けて引いている.つまり矢印を受ける方が結果変数である.なお,こ の図で例として挙げていることは,あくまで説明のための仮説であり真に因果関係があるかどうかにつ いては定かではないことを断っておく. 図 3 交絡因子をマッチングする一例 交絡因子の影響を排除するために,交絡因子の条件が対象者ごとに異ならないようにする. 表 3 因果関係に対する Hill の 9 条件 2) 関連の強さ (strength of the association)

参照

関連したドキュメント

関連研究の特徴を表 10 にまとめる。SECRET と CRYSTALP

子どもの話には、「へ~」「それで、それで?」などと 相づちを打ちながら、興味を示して聞きま しょう。

返し非排水三軸試験が高価なことや,液状化強度比 が相対密度との関連性が強く,また相対密度が N

大気に関わるものでは樹木や雪氷・氷床堆積物 の代替記録からそれなりに分解能の高い資料

・アカデミーでの絵画の研究とが彼を遠く離れた新しい関心1Fへと連去ってし

このたび牡蠣養殖業者の皆様がどのような想いで活動し、海の環境に関するや、アイディ

分配関数に関する古典統計力学の近似 注: ややまどろっこしいが、基本的な考え方は、q-p 空間において、 ①エネルギー En を取る量子状態

今回、子ども劇場千葉県センターさんにも組織診断を 受けていただきました。県内の子ども NPO