• 検索結果がありません。

第 章頻度データの評価 SAS JMP による解析結果を下記に示した. SAS JMP では, 分析 ニ変量の分布 病棟を X へ, 罹患を Y へ, 該当人数を 重み へ アクション OK 計算結果の表が算出される.Pearson の値で判断する. P= で有意差 (P<0.0) を示

N/A
N/A
Protected

Academic year: 2021

シェア "第 章頻度データの評価 SAS JMP による解析結果を下記に示した. SAS JMP では, 分析 ニ変量の分布 病棟を X へ, 罹患を Y へ, 該当人数を 重み へ アクション OK 計算結果の表が算出される.Pearson の値で判断する. P= で有意差 (P<0.0) を示"

Copied!
10
0
0

読み込み中.... (全文を見る)

全文

(1)

11 章 頻度データの評価

頻度データは一般的に

2×2 の検定を用いている.この中には,カイ二乗(X

)検定,Fisher 直接確率検定および

オッズ比

計算などがある.

1.

カイ二乗検定

Xmas は,Christmas(12/25)の Christ の前半をギリシャ読みでカイと読めることが語源.

横の行(群数)が

2,縦の列(反応)が 2 なので 2×2 定性的相関表(2×2 Contingency)(表 1)という.この検

定は,両側検定を前提としている.どこかのセルに

5 以下の数値がある場合は,カイ二乗確率が低めに算出さ

れることから

Yetes の補正または Fisher の直接確率検定が使用されている.

1. 2×2 定性的相関表

Class 1

Class 2

Total

Group 1

A

B

A+B

Group 2

C

D

C+D

A+C

B+D

A+B+C+D=N

)

(

)

(

)

(

)

(

)

(

2 2

D

C

B

A

D

B

C

A

C

B

D

A

N

X

+

+

+

+

´

=

ある病院の病棟別に

1 週間あたりの風邪の罹患率について調査した結果を表 2 に示した.病棟間に差がある

か解析する.

2. 病棟別風邪の罹患率

人 数

病棟

罹患

罹患なし

合計

A

1

49

50

B

9

41

50

計算すると下記の通りになる.

自由度=(行数

-1)(列数-1)= (2-1) (2-1) = 1 を計算すると,カイ二乗値 = X

= 7.111

自由度

1,X

の分布表(数表

11-1)から 7.111 に対する確率は 1%水準の値 6.635 より大きいので 1%水準で有

意(P<0.01)を示したことになる.すなわち病棟間に差があることになる.

数表 11-1. カイ二乗分布のパーセント(吉村ら,1987)

有 意 水 準 点 ,

α

自由度,

群数

-1

0.100

0.050

0.010

0.001

1

2.705

3.841

6.635

10.82

2

4.605

5.991

9.210

13.81

3

6.251

7.814

11.34

16.26

4

7.779

9.487

13.27

18.46

5

9.236

11.07

15.08

20.51

6

10.64

12.59

16.81

22.45

7

12.01

14.06

18.47

24.32

8

13.36

15.50

20.09

26.12

9

14.68

16.91

21.66

27.87

10

15.98

18.30

23.20

29.58

SAS JMP で計算する場合の入力フォーマットを表 3 に示した.

3. 表 2 のデータを SAS JMP に入力

病棟

罹患

該当人数

A

アリ

1

B

アリ

9

A

ナシ

49

B

ナシ

41

(2)

SAS JMP による解析結果を下記に示した.

SAS JMP では,分析→ニ変量の分布→病棟を X へ,罹患を Y へ,該当人数を「重み」へ→アクション OK→

計算結果の表が算出される.

Pearson の値で判断する. P=0.0077 で有意差(P<0.01)を示す.同時に Fisher の

正確検定も計算される.左側検定(片側検定,

P=0.0078)で判断する.この場合,直接確率が表示される.

SAS JMP のサンプルデータの「タイタニック」を開く.2×2 のクロス検定で生存者の動向を検索する.SAS JMP

では,分析

→ニ変量の分布→生存者を説明変数 X へ,クラス,年齢および度数を Y へ,→アクション OK.

Pearson の値を得る.生存者に対して全ての調査項目は,有意差が認められる.このデータは,集計データでは

なく生データである.したがって,ニ変量の分布で解析する.タイタニック号に乗船していた

2201 名の生死別

を乗船クラス別(1 等,2 等,3 等,乗組員),性別(男女)および年齢別(成人,子供)に調査した結果であ

る.

2.

適合度の検定(ある観察度数と理論値との比較)

血漿分離に用いる遠心分離器を

4 台使用したところ年間次の如き故障回数(表 4)を示した.これは故障回

数が等しいといえるか?

4. 遠心分離器の年間故障回数

遠心分離器番号

1

2

3

4

故障回数

46

33

38

49

166

(3)

88

.

3

166

5

.

41

7050

166

4

1

166

49

4

1

166

38

4

1

166

33

4

1

166

46

2 2 2 2 2

-

=

-

=

´

+

´

+

´

+

´

=

X

)

4

(

25

.

0

4

1

 は仮定する確率分布

=

=

N

X

分布表(数表

11-1)の自由度 4-1=3 の点は 7.814.したがって,算出した 3.88 はこれより小さいことから,

同等という故障回数を捨てることできない.すなわち,故障回数が等しく,機械による差はないと結論できる.

SAS JMP による解析結果を下記に示した.

SAS JMP では,分析→一変量の分布→水準を Y へ,故障回数を度数へ,→アクション OK→水準をクリッ

→割合の検定→全ての空欄にこの場合 1(仮説割合,実際には 0.25 となる)を入力する→完了.Pearson

の値を得る.P=0.275,5%水準で有意差を認めない.

適合度の検定の検出力の把握

適合度の検定;ショウジョウバエが酒を鑑定するはなし(佐藤,

1968).箱の中に二種類の異なったお酒を

入れてショウジョウバエを

50 匹放ちどちらのお酒に何匹飛び込んだかを記録する.下記に有意差(P<0.05)の目

安を

P 値で示した.

(佐藤原図,

1968)

(4)

ショウジョウバエのきき酒テストの結果

(有意水準)

清酒:焼酎=48:2

(P=0.1%)

清酒:赤ブドー酒

=8:42

(P=0.1%)

ビール:赤ブドー酒=16:34

(P=1.1%)

ビール:清酒

=36:14

(P=1.8%)

清酒:合成酒=33:17

(P=2.4%)

ブランデー:ウイスキー

=32:18

(P=4.7%)

ウイスキー特級:ウイスキー一級=28:22 (P=39%)

ブランデー:ウイスキー=32:18 を計算する.

92

.

3

50

92

.

53

50

2

1

50

18

2

1

50

32

2 2 2

-

=

-

=

´

+

´

=

X

数表

11-1 のカイ二乗分布の 0.05, 自由度 1(2-1)の交点 3.84 と比較して計算値 3.92 は大きいことから,この食

い違いは

5%水準で有意差を示したことになる.

SAS JMP による解析結果を下記に示した.

(5)

イカサマサイコロの検定

サイコロの一部に穴をあけて鉛をつめ,外見上は見分けが付かないように細工したものであるとか,その他

色々なことを聞く.しかし,全く正しいサイコロ,つまり

1 から 6 までの目が公正に出るサイコロを作ろうと

すると,極めて困難なことであると聞く.サイコロを

120 回振った出目の結果を表 5 に示した.

5. サイコロを 120 回振った出目

出目の回数

18

17

25

20

30

10

9

.

11

120

9

.

131

120

6

1

120

10

6

1

120

30

6

1

120

20

6

1

120

25

6

1

120

17

6

1

120

18

2 2 2 2 2 2 2

-

=

-

=

´

+

´

+

´

+

´

+

´

+

´

=

X

この場合の自由度は,出目が

6 種類あるので(6-1)5 である.数表 11-1 のカイ二乗分布の 0.05, 自由度 5 の交

11.07 と比較して計算値 11.9 は大きいことから,サイコロの目の出方は公正でないということが,危険率 5%

以下でいえることになる.

SAS JMP による解析結果を下記に示した.

SAS JMP では,分析→一変量の分布→水準を Y へ,度数を度数へ,→アクション OK→水準をクリック→

割合の検定

→全ての空欄にこの場合 1(仮説割合,実際には 0.16667 となる)を入力する→完了.Pearson

の値を得る.P=0.0362,5%水準で有意差を認める.

(6)

応用例

: SAS JMP のサンプルデータの Car poll を用いた検定.

1) 車の車種別保有率のデータを分析する

商業車

(work),スポーツ車(sporty)およびファミリーカー(family)の保有率を解析したい.始めに各車種が 1:1:1

として入力する.検定結果は,ピアソンタイプの値で吟味すると

0.1%水準で有意差がある.したがって,車種

1:1:1 ではないことが分かる.

次に

5:2:1 では,5%水準で有意差がない.したがって,車種は 5:2:1 であることが分かる.

2) 肉眼的観察割合が理論値に合致するか否か?

メンデルの遺伝,あるデータベースより得た豆の形態を分類した.3:1:9:3 に合致しているか否か吟味する.

gr=108, gw=32, yr=315, yw=101, Total 556, y=黄色,r=丸い,g=緑,w=しわがある.

(7)

5625

.

0

16

9

,

0625

.

0

16

1

,

1875

.

0

16

3

=

=

=

47

.

0

556

47

.

556

556

1875

.

0

556

101

5625

.

0

556

315

0625

.

0

556

32

1875

.

0

556

108

2 2 2 2 2

-

=

-

=

´

+

´

+

´

+

´

=

X

0.1875+0.0625+0.5625+0.1875=1

検定結果は,数表

11-1 カイ二乗分布のパーセント点,自由度(4-1)=3 の 5%水準点の 7.81 と計算値 0.47 を比較

すると計算値の方が小さいことから

5%水準で有意差が認められないことからメンデルの遺伝の 3:1:9:3 の理論

に合致していることが分かる.

3.

Fisher の直接確率検定

前述の表

2 に示したデータについて解析する.

2. 病棟別風邪の罹患率

人 数

病棟

罹患

罹患なし

合計

A

1 (A)

49 (B)

50

B

9 (C)

41 (D)

50

直接確率

=

=

=

0

.

0078

!

41

!

9

!

49

!

1

!

100

!

90

!

10

!

50

!

50

1

P

!;階乗記号;

5 の場合,1×2×3×4×5 となる.

この確率に加えてもっと極端な結果を考えると表

6 の表となる.P

を計算する.0 の欄が見られたらこれよ

り極端な例はないので終わりとする.

6. 病棟別風邪の罹患率

人 数

病棟

罹患

罹患なし

合計

A

0

50

50

B

10

40

50

直接確率

=

=

=

0

.

0006

!

40

!

10

!

50

!

0

!

100

!

90

!

10

!

50

!

50

2

P

最終確率は

P

P

を加えた値となる.

P

P

0.0078+0.0006=0.0084

分子分母でお互いに消去する.しかし,コンピュータでなければ対応ができない.0.0084 は 1%より小さいの

で,

P<0.01 で有意差を示したことになる.片側検定が一般的に使用されている.両側検定を望む場合は,計算

値を二倍する.

SAS JMP による Fisher の直接確率検定の解析は,カイ二乗検定の項に記載した.SAS JMP では片側検定で

0.0078 となり他のコンピュータ(上記の 0.0084)による計算と若干直接確率が異なる.

! ! ! ! ! )! ( )! ( )! ( )! ( D C B A N D B C A D C B A P= + + + +

(8)

4.

オッズ比,

Odds ratio

産業衛生・疫学調査分野およびその他の広い分野で常用されている.これは,当たる確率と外れる確率との

比である.競馬のオッズと同様である.

1) ケースおよびコントロールグループの因果関係(表 7)

7. ある調査研究の結果

暴露

調査研究グループ

あり

(+)

なし

(-)

合計

ケース(処置)

a

b

a+b

コントロール(対照)

c

D

c+d

合計

a+c

b+d

a+b+c+d

方波見ら(1997)の例題(表 8)によって説明する.

8. 食塩摂取量と脳血管疾患患者発生数

食塩摂取量

調査群

1 日 15g 以上(+)

1 日 15g 未満(-)

脳血管疾患ケース

84(a)

36(b)

120

対照

66(c)

54(d)

120

150

90

240

オッズ比(OR)は,

91

.

1

66

36

54

84

=

´

´

=

=

bc

ad

OR

95%信頼区間(CI)は,

ïþ

ï

ý

ü

ïî

ï

í

ì

+

+

+

±

=

d

c

b

a

OR

In

CI

exp

(

)

1

.

96

1

1

1

1

1.96 は,t-分布表の 5%水準値の∞の値である.同様に正規分布表(Z の表)の両側の 5%水準値である.

533

.

0

54

1

66

1

36

1

84

1

96

.

1

1

1

1

1

96

.

1

647

.

0

91

.

1

log

)

(

=

+

+

+

´

=

+

+

+

=

=

=

d

c

b

a

S

OR

In

e

信頼区間の下限値

CI

1

,上限値

CI

2

とすると,

25

.

3

2

18

.

1

533

.

0

647

.

0

)

(

12

.

1

114

.

0

533

.

0

647

.

0

)

(

18 . 1 114 . 0 1

=

=

\

=

+

=

+

=

=

\

=

-=

-e

CI

S

OR

In

e

CI

S

OR

In

から

から

が得られる.

と入力すると

卓数または,

を算出するには,関電

および

から

および

12

.

1

)

114

.

0

(

25

.

3

12

.

1

18 . 1 114 . 0

Exp

Excel

e

e

=

オッズ比は,

1.91,95%信頼区間は「1.12-3.25」となる.これは 1.00 より大きいので,1 日に 15 g 以上の食塩

摂取は脳血管疾患の危険因子である可能性が大きい.調査人数は各群とも同数である.

オッズ比で示した文献例(今泉,稲葉編集,1997)を表 9 に示す.ケースおよびコントロール(対照)の調

査標本数は大きく,ほぼ同数を集めている.

(9)

9. アルツハイマー病の危険要因(EC 共同体での共同研究結果)

頻度

危険因子

オッズ比

95%信頼

区間

ケース

コントロール

1. 痴呆の家族歴

3.5

2.6-4.6

203/814

140/894

2. パーキンソン病の家族歴

2.4

1.0-5.8

20/312

8/294

3. ダウン症候群・精神遅延の家族歴

2.7

1.2-5.7

20/588

7/615

4. 頭部外傷(アルツハイマー病発症

1 年以上前に意識消失)

1.8

1.3-2.7

87/1059

50/1059

5. 甲状腺機能低下症

2.3

1.0-5.4

17/655

8/732

6. うつ病

1.8

1.2-2.9

55/743

34/818

7. 喫煙

0.8

0.6-1.0

477/899

563/955

危険因子を判定する際,オッズ比の大きさの目安は,

1.00 以上が危険因子を良く反映していると思われる.

一般的に喫煙群では,アルツハイマー病の罹患率が少ないといわれているが,このデータからは,喫煙によっ

てアルツハイマー病の予防効果はないと考える.

2) 発生率を解析する場合

何らかの特性の有無によってここの対照を二つのグループに分割し,ある発生率・頻度を評価する場合(舟

喜・折笠,

2001)のクロス表を表 10 に示した.

10. 因果関係のあるデータのクロス表

特性

調査研究結果

あり

(+)

なし

(-)

合計

発生

A

b

a+b

発生せず

C

D

c+d

合計

a+c

b+d

a+b+c+d

イングランドおよびウェールズの三つの保健所で出産前健康診断における風疹の感染に関する研究を実施し

た結果を表

11 に示す.

11. アジア系および非アジア系別の出産前健康診断における風疹感染

グループ

風疹感染

アジア系

非アジア系

合計

あり

161

748

909

なし

2475

34020

36495

合計

2636

34768

37404

オッズ比(OR)は,

84

.

2

34768

/

748

2636

/

161

)

/(

)

/(

=

=

+

+

=

d

b

b

c

a

a

OR

の標誤誤差は,

R

e

log

0845

.

0

34768

1

748

1

2636

1

161

1

-

+

-

=

95%信頼区間(CI)は,

8782

.

0

)

0845

.

0

96

.

1

(

84

.

2

log

-

´

=

=

e

W

および

2094

.

1

)

0845

.

0

96

.

1

(

84

.

2

log

+

´

=

=

e

X

以上から母集団における

R に関する 95%信頼区間は,

2094 . 1 8782 . 0

e

e

 ~ 

(10)

すなわち

2.41~3.35 となる.

オッズ比は,2.84,95%信頼区間は「2.41-3.35」となる.2.84 は 1.00 と比較して大きいので,アジア系と非ア

ジア系の妊婦間では風疹の感染に差があることが分かる.

オッズ比の有意差判断基準は,オッズ比の

95%信頼区間が 1.0 を含まないものを有意水準 5%で統計学的に有

意と判断する(中村ら,2002).

【引用文献および引用資料】

今泉洋子,稲葉裕編集

(1997):保健統計学,pp134,倍風館,東京.

方波見重兵衛,金森雅夫,本多 靖(1997):系統看護学講座,pp172-173,医学書院,東京.

佐藤 信

(1968):推計学のすすめ,講談社,東京.

舟喜光一,折笠秀樹共訳(2001):信頼性の統計学,pp60-62,サイエンティスト社,東京.

吉村 功編著

(1987):毒性・薬効データの統計解析-事例研究によるアプローチ-, サイエンティスト社,

東京.

中村好一,金子 勇,河村優子,坂野達郎,内藤佳津雄,前田一男,黒部睦夫,平田 滋,矢崎俊樹,後

藤康章,橋本修二(2002):在宅高齢者の主観的健康観と関連する因子,日本公衆衛生雑誌,49, No.5,

409-416.

表 1. 2×2 定性的相関表
表 9.  アルツハイマー病の危険要因(EC 共同体での共同研究結果)  頻度  危険因子  オッズ比  95%信頼 区間 ケース  コントロール  1.  痴呆の家族歴  3.5  2.6-4.6  203/814  140/894  2

参照

関連したドキュメント

を塗っている。大粒の顔料の成分を SEM-EDS で調 査した結果、水銀 (Hg) と硫黄 (S) を検出したこと からみて水銀朱 (HgS)

前章 / 節からの流れで、計算可能な関数のもつ性質を抽象的に捉えることから始めよう。話を 単純にするために、以下では次のような型のプログラム を考える。 は部分関数 (

で得られたものである。第5章の結果は E £vÞG+ÞH 、 第6章の結果は E £ÉH による。また、 ,7°²­›Ç›¦ には熱核の

Wach 加群のモジュライを考えることでクリスタリン表現の局所普遍変形環を構 成し, 最後に一章の計算結果を用いて, 中間重みクリスタリン表現の局所普遍変形

証明で使われる重要な結果は mod p ガロア表現の strictly compatible system への minimal lifting theorem (以下, LT と略記する) と modular lifting theorem (主に

3 軸の大型車における解析結果を図 -1 に示す. IRI

重回帰分析,相関分析の結果を参考に,初期モデル

計算で求めた理論値と比較検討した。その結果をFig・3‑12に示す。図中の実線は