2.4.1 対応のあるクロス集計表・対応のある 2 値アウトカムの 2 群比較
2.4.1.1 対応のあるクロス集計表
通常のクロス集計表では,例えば,被験者を
2
群以上に分けられたもとで(あるいはランダムに2
種類以上の介入を 割付けたもとで),それぞれの群に異なる介入を行い,アウトカムを評価している.そのため,対応のないクロス集計表 では,列(縦方向)に要因,行(横方向)にアウトカムを配置したうえで作成される.つまり,対応のないクロス集計表によ ってまとめられる研究では,2種類の介入のいずれかのみが被験者に実施される.80
これに対して,対応がある場合には,介入前後のアウトカムを比較する場合や,あるいは同一被験者に異なる治 療・検査法が施される.そのため,すべての被験者に対して両方の介入が行われる.したがって,対応がない場合と クロス集計表の構成が異なる.
表
2.6
は,大腸内視鏡検査のNBI
検査と白色光検査で鋸歯状病変の検出の有無を比較した臨床研究の結果に対 して,対応のあるクロス集計表を作成したものである(仮想例).この研究は,定期検診受診者のなかで要精密検査と 診断された50
歳以上の被験者に対して,NBIによる大腸検査と白色光による2
種類の大腸検査の両方を実施してい る.この対応のあるクロス集計表では,列(縦方向)にNBI
検査における鋸歯状病変の検出の有無,行(横方向)に白色 光検査における鋸歯状病変の検出の有無を配置している.すなわち,それぞれのセルの解釈は以下のとおりである.(a) NBI
検査,白色光検査のいずれでも鋸歯状病変ありと診断された被験者数は85
例(b) NBI
検査では鋸歯状病変ありと診断されたが,白色光では鋸歯状病変なしと診断された被験者数は18
例(c) NBI
検査では鋸歯状病変なしと診断されたが,白色光では鋸歯状病変ありと診断された被験者数は10
例(d) ) NBI
検査,白色光検査のいずれでも鋸歯状病変なしと診断された被験者数は61
例対応のあるクロス集計表では,列パーセント点あるいは行パーセント点を用いることはなく,総パーセント点のみが 利用される.例えば,NBI検査,白色光検査のいずれでも鋸歯状病変ありと診断された被験者(表
1
のセル(a))の割合 は,48.9%であると解釈される.2.4.1.2 対応のある 2 値アウトカムに対する 2 群の比較:McNemar 検定
対応のある
2×2
クロス集計表において,2 種類の介入によるアウトカムにおける事象の発現率を比較する方法がMcNemar
検定である.すなわち,McNemar 検定では,帰無仮説H
0「介入によるアウトカムの事象の発現率に違いがない」に対して対立仮説
H
1「介入によるアウトカムの事象の発現率に違いがある」を検定する.表2.6
の事例において,NBI
検査で「病変あり」と診断される(真の)確率を𝑝NBI,白色光検査で「病変あり」と診断される(真の)確率を𝑝WHとする.このとき,上記の仮説は,帰無仮説
H
0「𝑝NBI− 𝑝WH= 0」に対して,対立仮説H
1「𝑝NBI− 𝑝WH≠ 0」を検定することを意 味する.実際に得られた試験結果で診断能を考える.試験結果において,NBI 検査で「病変あり」と診断された割合を 𝑝̂NBI,白色光検査で「病変あり」と診断される割合を𝑝̂WHとするとき,これらの割合は𝑝̂NBI=セル(a) +セル(b)
𝑁 ,𝑝̂WH=セル(a) +セル(c) 𝑁
である.ここに,
N
は被験者数を表す.McNemar検定では,これらの割合の差Δ̂を検討することになるので,Δ̂ = 𝑝̂NBI− 𝑝̂WH=セル(b) −セル(c) 𝑁
表
2.6:大腸内視鏡検査の臨床研究結果に対する対応のあるクロス集計表(括弧内は総パーセント)
白色光 合計
あり なし
NBI
あり
(a) 85 [48.9%]
(b) 18 [10.3%]
103
なし
(c) 10 [5.7%]
(d) 61 [35.1%]
71
合計 95 79 174
81 になり,セル(b)とセル(c)を比較すればよいことになる28.
表
2.6
の事例におけるMcNemar
検定でのp
値は0.185
なので,有意でなかった.つまり,内視鏡検査(NBI検査,白 色光検査)によって診断能(病変の検出率)に差異があるとはいえなかった.また,NBI検査における所見ありの割合は59.2%(103/174)であり,白色光による所見ありの割合は 54.6%であることから,NBI
検査と白色光検査では,5%程度の差異であった.
2.4.1.2 EZR による McNemar 検定の実行 (1)
データの概要65
歳以上の高齢者を対象に,転倒予防訓練と運動機能の低下の有無に関する研究が実施された.この研究では,200
人の被験者に対して,転倒予防訓練前に運動機能検査を行い,3カ月の転倒予防訓練後に同様の検査を実施し ている.ここでの目標は,転倒予防訓練後に運動機能の低下が改善していることを確認することにある.のデータは,「fall_risk.csv」に保存されている.ここで変数「訓練前」は訓練前の運動機能の低下の有無(低下あり,低下なし)であり,
「訓練後」は訓練後の運動機能の低下の有無(低下あり,低下なし)である.
(2) EZR
による計算ここでは,EZRを用いて
McNemar
検定を実行する.McNemar検定は,帰無仮説H
0「歩行訓練を行っても運動機能 の低下割合に変化がない」に対して対立仮説H
1「歩行訓練を行うことで運動機能の低下割合に変化がある」を検定す る.McNemar
検定の実行1:
「統計解析」→「名義変数の解析」→「対応のある比率の比較(二分割表の対称性の検定、McNemar 検定)」を選択する.2:
次のようなメニューが表示される.このとき,
・「行の変数(1つ選択)」で「訓練前」選択する.
・「列の選択(1つ選択)」で「訓練後」を選択する.
・「連続性補正」で「Yes」を選択する.
3:
「OK」ボタンを押す「連続性補正」とは,McNemar検定もカイ
2
乗検定と同様にp
値の計算に近似を用いるため,それを補正 するものである.ここでは,EZRでの計算結果(青色の部分)のみを解釈するOutput.1
訓練後
訓練前 低下あり 低下なし 低下あり 40 60 低下なし 30 70
28対応のあるクロス集計表を2×2の行列であると考えると,McNemar検定とは,その行列の対称性を評価していると考えることができる.
82
Output.1
は,クロス集計表による要約の結果である.因みに,全体パーセントは,「統計解析」→「名義変数の解析」→「分割表の作成と群間の比率の比較(Fisherの正確検定)」において,「総計パーセント」を選べばよい(2.2.5節を参照).
この出力の下側の
R
の出力(「McNemar's Chi-squared test with continuity correction」と記載された部分)は,EZR による最後の出力と同じ内容なので割愛する.McNemar
検定は,一番下の出力Output.2 McNemar検定 P値 = 0.00224
である.p 値が
0.05
未満なので,有意な結果が得られた.したがって,歩行訓練を行うことで運動機能の低下割合に 変化が認められた.2.4.2 対応のある 2 値アウトカムの 3 群以上の比較
2.4.2.1 Cochran の Q 検定
表
2.8
は,癌性疼痛患者に対して,3 種類の除痛薬を投与したときの神経障害性疼痛の改善の有無を評価したクロ スオーバー試験29の結果である.ここで,1 は改善を表しており,0 は非改善を表している.このように,3 種類以上の 介入によるアウトカムでの事象の発現率を評価する場合には,McNemar検定を用いることができず,CochranのQ
検 定を用いることになる30.Cochran
のQ
検定では,帰無仮説H
0「介入(要因)によるアウトカムの事象の発現率はすべて同じである」に対して対立仮説
H
1「帰無仮説H
0ではない」を検定する31.表2.8
の事例において,薬剤A
での(真の)改善率を𝑝A,薬剤B
での(真の)改善率を
𝑝B,薬剤C
での(真の)改善率を𝑝C,とする.このとき,上記の仮説は,帰無仮説H
0「𝑝A= 𝑝B= 𝑝C」に 対する検定を行うことを意味する.表
2,8
の事例における値は0.034
なので,有意であった.つまり,除痛薬によって神経障害性疼痛の改善率に違い が認められた.一方で,CochranのQ
検定では,3種類以上の介入(要因)によるアウトカムの事象の発現率の違いを 評価できるものの,「どこに違いがあるか」を検討することはできない.そのため,薬剤A vs.
薬剤B(比較 AB),薬剤
B vs.
薬剤C(比較 AC),薬剤 B vs.
薬剤C(比較 BC)のすべての組み合わせ(ペアワイズ)での比較を McNemar
検定のもとで評価する必要がある.このとき,検定を
3
回繰り返すことから,多重比較が必要になる.29チェンジオーバー・デザインと呼ばれることもある.
30 Fless愛好会 訳:計数データの統計学,株式会社アーム,2009 [原著:Fless J. L., Levin B., Paik MC.: Statistical Methods for Rate and Proportions (3rd edition), Wiley, 2003].
31 CochranのQ検定は,2値アウトカムに対する検定である.一方で,量的アウトカムに対する検定には,正規分布が仮定できる場合には繰り返し測定の分散分析
(Repeated Measured ANOVA),仮定できない場合にはFreadman検定がある.
表2.8:癌性疼痛患者に対する3種類の除痛薬のクロスオーバー試験の結果(0:非改善,1:改善)
患者 制吐剤
A B C
1 0 1 0
2 1 1 0
3 1 1 1
4 0 0 0
5 1 0 0
6 0 1 1
7 0 0 0
8 1 1 0
9 0 1 0
10 1 1 1
11 0 1 0
12 1 1 0
計 6 9 3
改善率(%) 60.0% 75.0% 25.0%
83
表
2.9
は,3剤(薬剤A,薬剤 B,薬剤 C)のすべての組み合わせでの対応のあるクロス集計表である.2
値アウトカムにおいて一般的に用いられる多重比較には,Bonferroni 法や
Holm
法のように,p 値を調整する方法である.McNemar 検定のp
値のBonferroni
の方法による調整p
値は・比較
AB:0.180 × 3 = 0.540
・比較
AC:0.180 × 3 = 0.540
・比較
BC:0.014 × 3 = 0.042
である.したがって,薬剤
B
と薬剤C
において有意であった.薬剤B
で改善したにも関わらず,薬剤C
で改善しなかった割合が
50.0%(6
例)であるのに対して,薬剤C
で改善したにも関わらず,薬剤B
で改善しなかった割合が0.0%(0
例)であることから,薬剤
B
による除痛効果は薬剤C
よりも優れているといえる(表2.9(c)).
2.4.2.2 EZR による Cochran の Q 検定の実行 (1)
データの概要ここでは,ある疾患患者
17
名に3
種類の薬剤(Treat:新薬,Control:既存薬,Placebo:プラセボ)のチェンジオーバ ー試験(すなわち,それぞれの被験者は,ウォッシュアウト期間を通じて,3 種類の薬剤の全てが投与・評価されてい る)を実施したときの結果(仮想例)である.このとき,アウトカムは,2 値 (0:無効,1:有効)がとられている.このデータ は,「changeover.csv」で得られる.(2) EZR
による計算EZR
を用いてCochran
のQ
検定を実行する.CochranのQ
検定は,帰無仮説H
0「3種類の薬剤間の有効割合に違いがない」に対して対立仮説
H
1「3種類の薬剤間の有効割合に違いがある」を検定する.EZRにおけるCochran
のQ
検定の注意点は,アウトカムが0
あるいは1
のダミー変数で与えられなければいけない点にある(その他の手法では このようなことはない).そのため,カテゴリデータで与えられている場合には,「アクティブデータセット」→「変数の操作」→「ダミー変数を作成する」を用いて,2値化しなければならない.
EZR
による解析方法を以下に示す.表2.9:癌性疼痛患者に対する3種類の除痛薬のクロスオーバー試験に対するペアワイズでの対応のあるクロス集計表
84
Cochran
のQ
検定の実行1:
「統計解析」→「名義変数の解析」→「対応のある3
群以上の比率の比較(CochranのQ
検定)」を選 択する.2:
次のようなメニューが表示される.このとき,
・「対応のある群を複数選択してください(0,1の二値であることが必要)」で「Control」,「Placebo」,
「Treat」を選択する.
3:
「OK」ボタンを押すここでは,EZRでの計算結果(下側の青色の部分)のみを解釈する.上側の
R
の出力(「Cochran's Q test」の下に出 力された部分) は,EZRでの出力と同じのためである.Cochran Q 検定 P値 = 0.0013
その結果,p値は
0.013
であることから,有意である.したがって,薬剤によって,有効割合に違いが認められる.どの薬剤間に違いが認められるかを検定する場合には,2.4.1節の
McNemar
検定を実施し,p値を3
倍すればよい.そのときの結果のみ,以下に示す.
p値 Bonferroniによ る多重比較32
Treat vs. Control 0.0455 0.1365
Treat vs. Placebo 0.0026 0.0078
Control vs. Placebo 0.2890 0.8670 すなわち,新薬(Treat)とプラセボ(Placebo)のあいだに有意差が認められる.