2.2 クロス集計表による統計的推測
2.2.6 EZR によるクロス集計表及び検定の実行
(1)
データの概要テープ剥離に用いるベンジンが皮膚かぶれの原因と考え,剥離材にオリーブ油を利用した.このとき,剥離剤(ベン ジン・オリーブ油)と皮膚かぶれの発現の有無には違いがあるだろうか.このデータは,Skin_rash.csv に保存されてい る.変数は,テープ離脱(ベンジン,オリーブ油),皮膚かぶれ(あり,なし)である.
27 Cochran W.G. : Some methods for strengthening the common χ2 tests, Biometrics, 10, 417-451, 1954.
図
2.2:開腹外科手術の縫合術に対するランダム化比較第 III
相試験の結果74
皮膚かぶれ
あり なし 合計
オリーブ油 例数
24 100 124
全体パーセント10.0 41.8 51.9
列パーセント32.4 60.6 51.9
行パーセント19.4 80.6 100.0
ベンジン 例数
50 65 115
全体パーセント
20.9 27.2 48.1
列パーセント67.6 39.4 48.1
行パーセント43.5 56.5 100.0
合計 例数
74 165 239
全体パーセント
31.0 69.0 100.0
列パーセント100.0 100.0 100.0
行パーセント31.0 69.0 100.0
(2) EZR
による計算ここでは,EZRによるクロス集計表の作成,及び検定(Fisherの正確検定,カイ
2
乗検定)の方法について述べる.クロス集計表の作成及び検定の方法
1:
「統計解析」→「名義変数の解析」→「分割表の作成と群間の比率の比較(Fisherの正確検定)」を選 択する.2:
次のようなメニューが表示される.このとき,
・「行の選択(1つ以上選択)」で「テープ離脱」を選択する.
・「列の選択(1つ選択)」で「皮膚かぶれ」を選択する.
・「パーセントの計算」で「行のパーセント」を選択する.
・「仮説検定」で「カイ
2
乗検定」と「フィッシャーの正確検定」にチェックを入れる.・「カイ
2
乗検定の連続性補正」で「Yes」を選択する.3:
「OK」ボタンを押すここで,「行」は群(説明変数)を表し,「列」はアウトカムを表す.また,パーセントの意味は,以下のとおりである.
75
・全体パーセント(EZR では総計のパーセント):被験者全体のなかで,何パーセントの被験者が各セルに属しているか を表す.例えば,(オリーブ油,あり)のセルの場合には,「オリーブ油を剥離剤に用いて,かつ皮膚かぶれになっ た割合は,10.0%である」と解釈される.
・列パーセント(EZR では列のパーセント):皮膚かぶれの有無で分けたときの,それぞれの剥離剤の割合を表している
(縦方向に 100%になるように計算している).例えば,(オリーブ油,あり)のセルの場合には,「皮膚かぶれになっ
た被験者のうち,32.4%がオリーブ油を用いた」と解釈される.
・行パーセント(EZR では行のパーセント):剥離剤の種類で分けたときの,皮膚かぶれの有無の割合を表している(横
方向に
100%になるように計算している).例えば,(オリーブ油,あり)のセルの場合には,「オリーブ油を剥離剤
に利用した被験者のうち,19.4%が皮膚かぶれになった」と解釈される.
仮説検定では,カイ
2
乗検定とFisher
の正確検定の二つを選択したが,実際のデータ解析では,いずれか一方の みを用いればよい.このとき,カイ2
乗検定の連続性補正とは,2.2.4節でのYates
の補正を表す.「分割表の作成と群間の比率の比較(Fisher の正確検定)」では,複数の出力(青色の部分が複数存在する)が表 示される.ここでは,R及び
EZR
での計算結果(青色の部分)のみを解釈する.Output.1
皮膚かぶれ テープ離脱 あり なし オリーブ油 24 100 ベンジン 50 65
Output.1
は,クロス集計表による要約の結果である.つまり,皮膚かぶれあり 皮膚かぶれなし
オリーブ油
24 100
ベンジン
50 65
である.
Output.2
皮膚かぶれ
テープ離脱 あり なし Total Count オリーブ油 19.4 80.6 100 124 ベンジン 43.5 56.5 100 115
Output.2
は,クロス集計表の列パーセント(EZRでは行のパーセント)を表している.つまり,皮膚かぶれあり 皮膚かぶれなし オリーブ油
19.4% 80.6%
ベンジン
43.5% 56.5%
である.オリーブ油のほうが,ベンジンよりも皮膚かぶれの割合が低いことが示唆される.因みに,Count は各群の症 例数を表している.
Output.3
Pearson's Chi-squared test with Yates' continuity correction data: .Table
X-squared = 15.135, df = 1, p-value = 0.0001001
Output.3
は,Yatesの補正を伴うカイ2
乗検定の結果である.帰無仮説H
0は「剥離剤の種類と皮膚かぶれの有無には関連性がない(剥離剤の種類によって皮膚かぶれの有無に違いがない)」に対して,対立仮説
H
1は「剥離剤の種類 と皮膚かぶれの有無には関連性がある(剥離剤の種類によって皮膚かぶれの有無に違いがある)」である.「p-value」が
p
値を表している(p値=0.0001001である).有意水準α=0.05を下回ることから,剥離剤によって皮膚かぶれの有無 に違いが認められる.76 Output.4
Fisher's Exact Test for Count Data
data: .Table p-value = 0.00007754
alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval:
0.1669801 0.5767046 sample estimates:
odds ratio 0.3135849
Output.4
は,Fisherの正確検定の結果である.カイ2
乗検定と同様に,帰無仮説H
0「剥離剤の種類と皮膚かぶれの有無には関連性がない(剥離剤の種類によって皮膚かぶれの有無に違いがない)」に対して,対立仮説
H
1「剥離剤の 種類と皮膚かぶれの有無には関連性がある(剥離剤の種類によって皮膚かぶれの有無に違いがある)」を検定してい る.「p-value」がp
値を表している(p値=0.00007754である).有意水準α=0.05を下回ることから,剥離剤によって皮膚 かぶれの有無に違いが認められる.また,「odds ratio」下側の0.3135849
が(オリーブ油)/(ベンジン)のオッズ比であり,「95 percent confidence interval」下側の
0.1669801 0.5767046
がオッズ比に対する95%信頼区間である.すなわち,オ
ッズ比[95%信頼区間]を小数点以下3
桁で四捨五入すると,0.314 [0.167, 0.577]である.また,95%信頼区間が1.00(オ
リーブ油とベンジンで皮膚かぶれの罹患が同じ)を含んでいないことから,オリーブ油の皮膚かぶれに対する罹患リス クはベンジンに比べて有意に小さいと言える.Output.5
皮膚かぶれ=あり 皮膚かぶれ=なし Fisher検定のP値 テープ離脱=オリーブ油 24 100 0.0000775 テープ離脱=ベンジン 50 65
Output.5
は,Output.1のクロス集計表とOuput.4
のFisher
の正確検定の結果を表示したEZR
での出力である.説 明が重複するため,内容の解釈は割愛する.(3) EZR
によるクロス集計表の直接入力による計算EZR
では,クロス集計表を直接入力して計算することができる.先ほどの皮膚かぶれのデータのクロス集計表は,皮膚かぶれあり 皮膚かぶれなし
オリーブ油
24 100
ベンジン
50 65
であった.これを
EZR
に直接入力した場合でも,同様の解析が実行できる.直接入力による解析では,先ず,「統計解析」→「名義変数の解析」→「分割表の直接入力と解析」を選択する.する と,メニューが表示されるので,次のように入力する.
STEP1:「数を入力:」の下側のセルに次のように入力する.
あり なし オリーブ油
24 100
ベンジン50 65
なお,セルの大きさの関係で,「オリーブ油」と「ベンジン」と入力すると,最初の文字が見えなくなるが,計算 には問題はない.また,今回は,2×2分割表なので,「行数」と「列数」はデフォルトになるが,3群以上(行数 が
3
以上)の場合には,「行数」のスライダーを右側に動かすと「数を入力:」の行数が増加し,アウトカムが3
カテゴリ以上の場合には,「列数」のスライダーを右側に動かすと「数を入力:」の列数が増加する.STEP2:「パーセントの計算」で「行のパーセント」を選択する(列パーセントが表示される).
STEP3:「仮説検定」で「独立性のカイ 2
乗検定(連続補正有り)」及び「フィッシャーの正確検定」にチェックする.77 これらの作業を行った場合,メニューは,次のようになる.
「OK」ボタンを押すと,先ほどの場合と同様の出力が得られる.