• 検索結果がありません。

医薬統計で汎用される検定と 多重比較法

N/A
N/A
Protected

Academic year: 2021

シェア "医薬統計で汎用される検定と 多重比較法"

Copied!
159
0
0

読み込み中.... (全文を見る)

全文

(1)

医薬統計で汎用される検定と

多重比較法

東京理科大学

浜田知久馬

2014/4/3

「医薬統計入門セミナー/第17回

EXSUSユーザー会」

(2)

要旨

医薬品開発関連の統計業務の経験数年程度の方を想定し

て,医薬統計で汎用される検定と多重比較法についてチュー

トリアルを行う.

複数の検定の組み全体を1つの解析とみなして,全体で

誤って有意とする確率を有意水準以下に抑える手法の総称

を,多重比較とよび,一元配置型を中心に様々な方法が提

案されている.基準群との比較を行なう方法としてDunnett法,

全ての群間の対比較を対象としたTukey法等が用いられる.

分散分析,回帰分析,多重比較の違いを対比(contrast)と

の関連で解説し,また,EXSUSでの解析についてデモンスト

レーションを行う.

(3)

内容

基本的な多重比較法

Bonferroni,Dunnett,Tukey,Scheffe

DunnettとWilliams

ノンパラ多重比較

Steel,Steel-Dwass,Shirley-Williams

対比と最大対比法

分散分析,回帰分析の対比による表現

(4)

JPS分散分析使用論文数

n

%

n

%

n

%

n

%

1-way ANOVA

46 34.3% 75 50.7% 74 55.6% 49 50.5%

2-way ANOVA

6

4.5% 11

7.4% 11

8.3%

6

6.2%

Kruskal-Wallis test

8

6.0%

3

2.0%

5

3.8%

2

2.1%

Friedman test

0

0.0%

0

0.0%

1

0.8%

0

0.0%

Repeated measures 1-way ANOVA 10

6.8%

4

3.0%

8

8.2%

Repeated measures 2-way ANOVA 2

1.4%

8

6.0%

3

3.1%

Repeated measures MANOVA

0

0.0%

1

0.7%

0

0.0%

0

0.0%

手法名

1996 年

(n = 134)

2002 年

(n = 148)

2007 年

(n = 133)

2012 年

(n = 97)

3

2.2%

(5)

5

分散分析

ANOVA: ANalyisis Of VAriance

分散(variance):ばらつきを表す統計用語

分散分析:データのばらつきを構成する要素が存在

するときに個々の要素に分解

二元配置(two-way)分散分析

例)抗酸化剤(A,B,C),濃度,誤差

薬剤,時点,誤差

(6)

A

B

C

(7)

JPS多重比較使用論文数

n % n % n % n % Dunnett test 49 36.6% 45 30.4% 34 25.6% 21 21.6% Williams test 0 0.0% 3 2.0% 2 1.5% 3 3.1% Tukey test 5 3.7% 16 10.8% 21 15.8% 23 23.7% Bonferroni test 5 3.7% 13 8.8% 16 12.0% 16 16.5% Scheffe test 8 6.0% 8 5.4% 9 6.8% 3 3.1% Fisher(P)LSD test 5 3.7% 5 3.4% 13 9.8% 2 2.1% Newman-Keuls test 1 0.7% 4 2.7% 5 3.8% 5 5.2% Duncan test 10 7.5% 2 1.3% 4 3.0% 0 0.0%

Steel Dwass test 0 0.0% 0 0.0% 0 0.0% 1 1.0%

contrast mean test 0 0.0% 0 0.0% 0 0.0% 2 2.1%

手法名 1996 年 (n = 134) 2002 年 (n = 148) 2007 年 (n = 133) 2012 年 (n = 97)

(8)

検定の結果と2つの誤り

真実 検定 結果

差がない

差がある

有意差なし

有意差あり

(あわて者の誤り)αエラー βエラー (ぼんやり者の誤り) 正しく判定できた 正しく判定できた

(9)

9

p値と第1種の過誤

α

• p値:本当は差がないときに,偶然で

差が生じる確率

• 検定:p値<0.05のとき有意と判定

• αエラー:誤って差があるといってしまう確

率は,検定を行なえば,有意水準0.05以下

に抑えることができる.

• βエラー:Nと検出したい差の大きさに

依存する→症例数設計

(10)

薬剤師国家試験 2013 98回

問192 薬物治療の効果判定の統計処理に用いられるTukey法に関 する記述のうち,正しいのはどれか.2つ選べ. 1 すべての群の同時対比較を行う検定方法である. 2 1つの対照群と2つ以上の処理群を比較検定する 方法である. 3 分散が等しくないデータの比較検定に適している. 4 正規分布に従わないデータの比較検定に適している. 5 パラメトリックなデータの比較検定に適している

(11)

基本的な多重比較法

正規分布と等分散性が前提

分散分析:多群全体で差があるか

Dunnett:対照群との対比較

Tukey :全ての群間の対比較

4群における例

Dunnett:1-2,1-3,1-4

Tukey :1-2,1-3,1-4,2-3,2-4,3-4

11

(12)

時計を止める超能力

ユリ・ゲラーが「わたしがTVをご覧のみなさんの

もとに念を送って,みなさんの手元にある時

計を止めて見せます」というのです. たとえば,

番組の15分間,彼が念を送りますと番組の視

聴者から「TVを見ていたら時計が本当に止

まってしまった!」という驚きの知らせが番組

に何件も寄せられます

(13)

時計を止める超能力

(14)

超能力か?

1)1つの時計が15分間に止まる可能性は非常

に低い.電池の寿命を1年として

1/(4×24×365)=1/35040

2)当時視聴率は高かった.

500万世帯が視て,1世帯に4個時計がある

とすると,2000万個の時計が対象

2000万/3.504万=570個

が止まる個数の期待値

(15)

有料アダルトサイト等の

架空料金請求メール

あなた様がご利用された当社が運営するアダルト番組の

利用料が未納となっています.

未納料金は下記のとおりとなっていますので,○月

○○日○時までに下記口座まで,御入金して頂くようお

願い申し上げます.

合計お支払い金額:○万円

【振込先口座】○○銀行:○○支店

速やかに御入金して頂けない場合は,私共から各地域の

債権代行関連業者へ債権譲渡を致しますので,最終

的に集金専門担当員を御自宅などに訪問をさせて頂き

ます.その際には上記の合計支払額の約○倍の請求さ

せて頂く場合が御座いますので,お忘れなく必ず御入

金して下さい

15

(16)

架空料金請求メール

請求金額はそれなりに高額 例)10万円

身に覚えのある人はそれなりに存在

会社や家族には知られたくない

莫大な数の人にメールを送付 例)100万人

詐欺の元ではあまりかからない 例)数100万円

成功率はかなり低い 例)0.1%

報酬 10万円× 100万人×0.001=1億円

十分詐欺ビジネスとして成り立つ

(17)

典型的な毒性試験

ラット(雄)のRBC(赤血球数) 単位(×104/mm3 対照群 低用量群 中用量群 高用量群 平均値 926.0 911.9 891.5 893.0 標準偏差 25.7 20.1 39.8 35.4 N 10 10 10 10 17 1

y

01

.

1

12

t

t

13

2

.

47

36

.

2

14

t

2

y

y

3

y

4

自由度36のt分布の5%点:2.03

 





i j i j ij

n

n

s

y

y

t

1

1

2

(18)

検定の多重性と多重比較

1回の比較あたりの有意水準:5%

3回の比較全体で偶然で

有意差が出る確率:

>>5%(12.5%程度)

検定の多重性

(multiplicity)

:複数の検定を

同時に行うことによって,偶然によって

有意になる確率が大きくなる現象.

多重比較

(multiple comparison)

1回の実

験で多数比較を行うとき,実験全体での

第Ⅰ種の過誤の確率を有意水準以下に制

御しようとする統計手法の総称.

のいずれかが有意

14 13 12

,

t

,

t

t

(19)

帰無仮説の下でのp値の累積分布関数

p値:0~1の一様分布

19

p値

帰無仮説の下での p値の分布: x以下の値を とる確率:x 例)0.6以下の値を とる確率:0.6

(20)

20

独立な最小p値の分布

1 m m

)

1

(

)'

(

)

(

)

1

(

1

)

(

p

)

(

1

)

1

(

1

1

m

x

m

x

F

x

f

x

x

F

m

m

確率密度関数:

分布関数:

値の分布

個の最小

α未満

最小p値が有意

つ以上が有意

α

α水準で有意: 

つ以上が

個の独立な検定のうち

(21)

m個の最小p値の確率密度関数

21 1 2 3 4 5 m=10

)

( p

f

1

)

1

(

)

(

p

m

p

m

f

p

(22)

m個の最小p値の累積分布関数

)

( p

F

22 1 2 3 4 5 m=10

に近いとき

Bonferroni

p

m

)

(

0

)

1

(

1

)

(

m

p

F

p

Sidak

p

p

F

0.40126

(23)

αエラーのシミュレーション

23

  

既知,

2

1

1

1

1

1

1

1

1

j 2 2 i j i j ij i i j i j ij

y

y

y

y

t

n

n

n

n

y

y

t

 





i

:標準正規分布(N(0,1))

tも標準正規分布にしたがう

シミュレーション回数10万回

(24)

αエラーのシミュレーション

24 1-2群の 比較 度数 パーセント 累積 度数 累積 パーセント * 5054 5.05 5054 5.05 ns 94946 94.95 100000 100.00 1-3群の 比較 度数 パーセント 累積 度数 累積 パーセント * 4936 4.94 4936 4.94 ns 95064 95.06 100000 100.00 1-4群の 比較 度数 パーセント 累積 度数 累積 パーセント * 5036 5.04 5036 5.04 ns 94964 94.96 100000 100.00 いずれか の比較 度数 パーセント 累積 度数 累積 パーセント * 12551 12.55 12551 12.55 ns 87449 87.45 100000 100.00

(25)

独立性

の正の相関

は+

は小さくなる)

がたまたま大きいと

の負の相関

を共通して引くため

の正の相関)

は非独立

は独立

0.71

(

0.71

2

/

1

5

.

0

,

,

,

,

,

2 12 12 1 1 12 1 14 13 12 4 3 2 1

y

t

t

y

y

t

y

t

t

t

y

y

y

y

25

(26)

y1 y2 y3 y4 t12 t13 t14 y1 1 -0.00453 -0.00351 -0.0022 -0.70744 -0.70884 -0.70616 y2 -0.00453 1 -0.00476 -0.00644 0.70997 -0.00015 -0.00137 y3 -0.00351 -0.00476 1 -0.00018 -0.00089 0.70785 0.00234 y4 -0.0022 -0.00644 -0.00018 1 -0.003 0.00143 0.70961 t12 -0.70744 0.70997 -0.00089 -0.003 1 0.49909 0.49634 t13 -0.70884 -0.00015 0.70785 0.00143 0.49909 1 0.50046 t14 -0.70616 -0.00137 0.00234 0.70961 0.49634 0.50046 1 Pearson の相関係数, N = 100000 変数 N 平均 標準偏差 y1 100000 -0.00186 0.99762 y2 100000 0.00289 1.00122 y3 100000 -0.0007764 0.99621 y4 100000 -0.00326 1.00252 t12 100000 0.00336 1.00168 t13 100000 0.0007669 0.99867 t14 100000 -0.0009883 1.00118

(27)

27 N=400の場合の散布図 71 . 0  r 71 . 0   r 5 . 0  r 0  r y1 y2 y3 t12 t13

(28)

y1

y2

y3

y4

t12 t13 t14

y1

1

0

0

0 -0.71 -0.71 -0.71

y2

0

1

0

0 0.71

0

0

y3

0

0

1

0

0 0.71

0

y4

0

0

0

1

0

0 0.71

t12 -0.71 0.71 0

0

1 0.5 0.5

t13 -0.71

0 0.71

0 0.5

1 0.5

t14 -0.71

0 0 0.71 0.5 0.5

1

Pearson の相関係数(真値)行列

(29)

基本的な多重比較法 A,B,Cの比較

29

A

B

C

AB

AC

BC

Tukey:AB,AC,BC

Dunnett:AB,AC

Scheffe:

AB,AC,BC,A-BC

A-BC

m:比較の数

Bonferroni:p値をm倍

Sidak:独立性を前提

に多重性調整

(30)

Bonferroni

(比較の数だけ問題にする)

ex) 比較3回 対照群 -低用量群a 対照群 -中用量群b 対照群 -高用量群c

a

1 誤りの種類 1 aのみ 4 6 2 bのみ 7 3 cのみ

b

c

4 aとb 2 5 3 5 bとc 6 aとc 7 aとbとc 30

(31)

Bonferroni

5/3=1.66% aの円の面積

5/3=1.66% bの円の面積 に制御

5/3=1.66% cの円の面積

+ + >

3回比較を行うときは,1回あたりの比較を有

意水準5/3%に抑えれば全体での誤りは

5%以下になる.

31

(32)

Bonferroni の方法

• Bonferroniの不等式

– Ei: 正しい帰無仮説H0(i)が誤って棄却される事象

Pr(E∪Eb∪Ec)≦Pr(E)+Pr(Eb)+Pr(Ec)

Type I FWE = Pr(正しい帰無仮説のうち少なくとも1つが誤って棄却される) ≦Σi Pr(正しい帰無仮説H0(i)が誤って棄却される) (1)

Eb Ec

(33)

Bonferroni

比較の回数を増やす場合には,その回数に応じて

1回の比較当たりの有意水準を変化させる.

ex) 対照群との比較の他に

低用量ー高用量 中用量ー高用量

この2つの比較にも興味があるものとする.

比較の回数の合計は5回であるので,1回当たりの比較を

1%(5/5)の有意水準で行えばよい.

Bonferroniは群間でnが異なるような場合にも

正当である.

独立性を前提のSidak法を近似

比較に負の相関があってもよい.

33

(34)

Dunnett

対照群,低用量,中用量,高用量群 対照群との比較だけを対象にするような場合 の面積がちょうど5%になるようにする. Bonferroniよりも少し有意になりやすい. nが等しいことを前提に導かれた方法であるが,最近ではnが 等しくない場合の正確な方法(PROBMC関数)および近似法 (GLM)が可能である. *2群と3群の平均値の差がかなり大きくても,比較の対象外で あるので有意といってはならない.

(35)

Tukey

すべての対比較を対象とするような場合

対照群 6つの比較を対象

低用量群 ○

中用量群 ○ ○

高用量群 ○ ○ ○

対照群 低用量群 中用量群 高用量群

nが等しくないときの精度が高い近時法として

Tukey-Kramer法(GLM,PROBMC関数)がある.

35

(36)

Scheffe

群間でnが等しくなくてもよい

対比較でもよい

群を併合してもよい

1群,2群,3群,4群 1群,4群,2群,3群

群間の対比較のときにScheffeを用いると

過度に保守的

対照群 無処置群 5mg群

10mg群

20mg群

(37)

多重比較まとめ

D:Dunnett,T:Tukey,S:Scheffe,B:Bonferroni

比較の対象数 少 多

検出力 高 低

D T S

nが等しくない時の妥当性 妥当 改良法

B,S T,D

37

(38)

例 Repeated toxicity study

RBC(Red Blood Cell counts)

group dose raw data mean SD Control 0mg 925 917 912 912 949 926.0 25.7 908 908 989 931 909 low-dose 1mg 898 925 908 873 908 911.9 20.1 941 893 920 922 931 mid-dose 3mg 874 876 916 908 873 891.5 39.8 807 874 919 952 916 high-dose 10mg 869 919 874 852 830 893.0 35.4 906 914 898 933 935

(39)

RBCデータ

Vehicle Low Middle High 800 850 900 950 1000 mean±SEM Compound

*

#

#

$

$

R B C (× 1 0 4 mm 3 ) 926.0 911.9 891.5 893.0

(40)

Dunnett法の結果

group

y の最小 2

乗平均

H0:LSMean=Control

t 値

Pr > |t|

1

926.000000

2

911.900000 -1.01

0.6221

3

891.500000 -2.47

0.0478

4

893.000000 -2.36

0.0609

(41)

他の多重比較法

proc

glm

;

class

group;

model

y=group;

lsmeans

group /adj=tukey

pdiff

tdiff

;

run

;

proc

glm

;

class

group;

model

y=group;

lsmeans

group /adj=scheffe

pdiff

tdiff

;

run

;

proc

glm

;

class

group;

model

y=group;

lsmeans

group /adj=bonferroni

pdiff

tdiff

;

run

;

(42)

Tukey法

効果 group に対する最小 2 乗平均 H0: LSMean(i)=LSMean(j) の t 統計量/ Pr > |t|

従属変数 : y

i/j

1 2 3 4

1

1.01022 2.471815 2.364345

0.7445 0.0818 0.1025

2

-1.01022 1.461595 1.354125

0.7445 0.4706 0.5355

3

-2.47181 -1.46159 -0.10747

0.0818 0.4706 0.9995

4

-2.36434 -1.35412 0.10747

0.1025 0.5355 0.9995

(43)

GLMのTukey法の結果の図示

43

(44)

Scheffe法

効果 group に対する最小 2 乗平均 H0: LSMean(i)=LSMean(j) の t 統計量/ Pr > |t| 従属変数 : y i/j 1 2 3 4 1 1.01022 2.471815 2.364345 0.7964 0.1261 0.1533 2 -1.01022 1.461595 1.354125 0.7964 0.5512 0.6121 3 -2.47181 -1.46159 -0.10747 0.1261 0.5512 0.9997 4 -2.36434 -1.35412 0.10747 0.1533 0.6121 0.9997

(45)

Bonferroni

効果 group に対する最小 2 乗平均 H0: LSMean(i)=LSMean(j) の t 統計量/ Pr > |t| 従属変数 : y i/j 1 2 3 4 1 1.01022 2.471815 2.364345 1 0.1098 0.1415 2 -1.01022 1.461595 1.354125 1 0.9152 1 3 -2.47181 -1.46159 -0.10747 0.1098 0.9152 1 4 -2.36434 -1.35412 0.10747 0.1415 1 1 45

(46)

各手法の性能比較(全ての対比較)

data rbc;

do group=1 to 4;

do i=1 to 10;

input y @@;output;end;end;

cards;

925 917 912 912 949 908 908 989 931 909 898 925 908 873 908 941 893 920 922 931 874 876 916 908 873 807 874 919 952 916 869 919 874 852 830 906 914 898 933 935

proc glm;class group;model y=group;

lsmeans group

/TDIFF ADJUST=SIMULATE(REPORT SEED=4989);run;

(47)

各手法の性能比較(全ての対比較)

47

シミュレーション結果

手法

95% 分位点

(棄却限界値)

正確なアルファ

Simulated

2.732637

0.0457

Tukey

2.693227

0.0500

Bonferroni

2.791972

0.0398

Sidak

2.783564

0.0405

GT-2

2.774853

0.0414

Scheffe

2.932370

0.0284

T

2.028094

0.1968

(48)

各手法の性能比較(基準群との比較)

proc

glm

;

class

group;

model

y=group;

lsmeans

group

/

PDIFF

=CONTROL

TDIFF

ADJUST

=SIMULATE

(49)

各手法の性能比較(基準群との比較)

シミュレーション結果

手法

95% 分位点

(棄却限界値)

正確なアルファ

Simulated

2.472055

0.0478

Dunnett,

two-sided

2.452127

0.0500

Bonferroni

2.511040

0.0437

Sidak

2.503954

0.0444

GT-2

2.499104

0.0449

Scheffe

2.932370

0.0158

T

2.028094

0.1236

49

(50)

Williams検定の特徴

Dunnett検定の結果(両側5%)

群1 群2 群3 群4

926.0 911.9 891.5* 893.0

Williams検定の特徴

1)どの用量から対照群に比べて有意に変化

しているかを明らかにできる.

2)対立仮説に用量反応関係の単調性を仮定

μ

1

≧μ

2

≧μ

3

≧μ

4

(少なくとも1つは>)

3)多重性を考慮して第Ⅰ種の過誤を制御

4)下降手順であり,用量の高い群から比較を

行い,有意差がなくなった用量で終了

5)RBCへの適用結果 群3と群4で有意

(51)

Dunnett検定とWilliams検定の比較

51 解析法 Dunnett検定 Williams検定 想定 用量反応関係が単調・ 非単調 用量反応関係が単調 対立仮説 両側と片側が可 本質的に片側(両側はBonferroni 法で,2.5%水準で下側と上側) 検討内容 対照群とどの群で違いが あるか 対照群とどの用量から違いがあ るか 適用 対照群 A群 B群 C群 対照群 D1群 D2群 D3群 αエラー 多重性を考慮して制御 多重性を考慮して制御 手順 一段階手順 多段階手順(下降手順) 単調な場合 検出力が低い 検出力が高い 非単調な場合 解釈しやすい 解釈しにくい

(52)

Williams検定の統計量

}

,

,

,

max{

,

,

)

1

(

)

(

1

1

3 2 2 2 2 2 1 1 1 2 2 2 1 p p p p p p p p p p p p p p k i i k i n i j i ij a p p

y

y

y

M

n

y

n

y

n

n

y

n

y

n

y

n

y

y

s

n

n

s

y

M

t







  

  

(53)

c o n tr o l low m id d le h ig h 0 20 40 60 80 100 % Re s p o n s e c o n tr o l low m id d le h ig h 0 20 40 60 80 100 % Re s p o n s e

Williamsのイメージ(再掲)

Williams 53 • 反応が単調な場合 (逐次t検定に等しい) • 反応に逆転ありの場合 (逆転部分は平均化する)

①=②

(54)

検討①down turn(反応の逆転)のな

い場合

(55)

検討①down turn(反応の逆転)のな

い場合

55

• 結果

(56)

検討②

弱いdown turn(反応の逆転)のある

場合

(57)

検討②

弱いdown turn(反応の逆転)のある

場合

57

• 結果

(58)

検討③

強いdown turn(反応の逆転)のある

場合

(59)

検討③

強いdown turn(反応の逆転)のある

場合

59

• 結果

(60)

ウイリアムス(Williams)検定(WILP)

SASマクロWILP

データセット名{data=}, 群数{g=}, 有意水準{a=}, 群

を表す変数{group=}, 反応変数{y=},対立仮説の

方向{tail= 1:上側 2:下側}

OBS control group mean adjmean t wp wtc star 1 926 2 911.9 911.90 1.01022 0.15957 1.68830 2 926 3 891.5 891.50 2.47181 0.01027 1.76560 * 3 926 4 893.0 892.25 2.41808 0.01213 1.79073 *

(61)
(62)

Downturnデータへの

Dunnett法の適用(downturn)

g y の最小 2 乗平均 H0:LSMean=Control t 値 Pr > |t| 1 1.26550000 2 1.08280000 -5.51 <.0001* 3 1.14920000 -3.51 0.0038* 4 1.19930000 -2.00 0.1586 5 1.24330000 -0.67 0.9055

(63)

Downturnデータへの

Williams法の適用(下側2.5%)

63

OBS control group mean adjmean t wp wtc star 1 1.2655 2 1.0828 1.08280 5.51187 .000000824 1.67943 *

2 1.2655 3 1.1492 1.11600 4.51026 .000024164 1.75550 *

3 1.2655 4 1.1993 1.14377 3.67257 .000341217 1.78015 *

(64)

パラメトリック多重比較の前提

Y

P群

A群

μ

1

μ

2

帰無仮説H

0

μ

1

= μ

2

= μ

3

= μ

4

B群

C群

μ

3

μ

4

(65)

美女と野獣 パラとノンパラ

(66)
(67)

野獣:Beast

67

B

inomial カテゴリカル

E

xponential 指数分布 生存時間

分布 対称だが 尖り大

A

bnormal 異常値

S

kewed 歪んだ分布 *

(68)

パラに対応するノンパラの多重比較

パラ

ノンパラ

対照群と

の比較

Dunnett

Steel

(STEEL)

群間の

対比較

Tukey

Steel-Dwass

(STEELD)

単調性を前提に 対照群との比較

Willimas

(WILP)

Shirley-Williams

(WILN)

68

()内:作成マクロ名

(69)

パラメトリック多重比較

69



  





k i i k i n i j i ij a b a b knk k k n n

n

y

y

s

n

n

s

y

y

t

y

y

y

k

Group

y

y

y

Group

y

y

y

Group

1 1 1 2 2 2 , 2 1 2 2 , 2 2 2 1 1 1 , 1 2 1 1

)

1

(

)

(

1

1

,

,

:

,

,

:

2

,

,

:

1

  

    

  

tを多重比較の数表と比較する.

(70)

ノンパラメトリック多重比較

Joint-ranking

70



  





k i i k i n i j ij a b a b knk k k n n

n

r

r

s

n

n

s

r

r

z

r

r

r

k

Group

r

r

r

Group

r

r

r

Group

1 1 1 2 2 2 , 2 1 2 2 , 2 2 2 1 1 1 , 1 2 1 1

1

)

(

1

1

,

,

:

k

,

,

:

2

,

,

:

1

  

変換

       順位に

    

群を一緒にして

  

  

zを自由度無限大の多重比較の数表と比較する.

(71)

ノンパラメトリック多重比較

Separate-ranking

(a-b群比較)

71

1

)

(

)

(

1

1

,

,

:

b

,

,

:

a

1 1 2 2 2 2 , 2 1 , 2 1





b a na j nb j bj aj a b a b bnb b b ana a a

n

n

r

r

r

r

s

n

n

s

r

r

z

r

r

r

Group

r

r

r

Group

  

    順位に変換 

   比較する2群を

  z2はWilcoxon検定のカイ2乗に一致

(72)

パラ・ノンパラ多重比較の違い

1)データを全群を一緒にして順位に置き換

える.

(separate rankingでは比較する2群ごとに)

2)s

を群内分散をプールしたものから,

全分散に置き換える.

3)自由度を無限大にする.

(検定統計量を正規近似する)

(73)

PROBMC関数

value=probmc(string,c,prob,df,k,<parameters>); value :計算の結果:累積分布か%点 string :多重比較のタイプの指定 "DUNNETT1":片側Dunnett "DUNNETT2":両側Dunnett "WILLIAMS” : Williams検定 "RANGE" :スチューデント化範囲(Tukey) "MAXMOD":最大絶対値 c :検定統計量の値の指定 prob :下側確率の指定 cとprobのどちらか一方のみを指定, 指定しない方は欠測 (.) df :自由度の指定, 自由度無限大のときは欠測値(.) k :"DUNNETT1","DUNNETT2"と“WILLIAMS”:g-1 "RANGE"と"MAXMOD" :g parameters:Dunnett型で例数が異なる場合に指定 73

(74)

マクロの仕様

マクロ変数

%let data=解析対象SASデータセット;

%let y=反応変数(数値変数);

%let group=群変数

(1から連続した整数値)

;

%let

g=対照群を含めた群の数;

%let a=有意水準(0~1)

%let tail=1(上側検定),2(下側検定)

tailはマクロ

S_WILLのみ

(75)

Steel検定のマクロ

%macro STEEL;

data wil;set &data;

do i1=1;do i2=i1+1 to &g; pair=compress(i1||i2); if &group=1 then output;if &group=i2 then output; end;end;

proc sort data=wil;by pair;

proc npar1way wilcoxon data=wil noprint;class &group;var &y; by pair i1 i2;output out=out ;

proc summary data=&data;var y;class &group;output out=n n=n; proc transpose data=n out=n prefix=n;var n;id &group;

data n;set n;df=.;

array n(&g) n1-n&g;array r(&g) r1-r&g;

do i=1 to &g;r(i)=sqrt(n(i)/(n(i)+n1));end; data out;set out;df=.;

data out;merge out n;by df; z=sqrt(_kw_);

dp=1-probmc('dunnett2',abs(z),.,df,&g-1,of r2--r&g); dzc=probmc('dunnett2',.,1-&a,df,&g-1,of r2--r&g);

proc print data=out; var pair i1 i2 z p2_wil p_kw dp dzc;run;

%mend ;

(76)

Steel-Dwass検定のマクロ

%macro STEEL_D;

data wil;set &data;

do i1=1 to &g;do i2=i1+1 to &g; pair=compress(i1||i2);

if &group=i1 then output; if &group=i2 then output; end; end;

proc sort data=wil;by pair;

proc npar1way wilcoxon data=wil noprint; class &group;var &y;

by pair i1 i2;output out=out ; data out;set out;

z=sqrt(_kw_);df=.;

tp=1-probmc('range',abs(z*2**.5),.,df,&g); tzc=probmc('range',.,1-&a,df,&g)/2**0.5; proc print data=out;

var pair i1 i2 z p2_wil p_kw tp tzc;run;

(77)

Steel検定の実行例(STEEL)

data

test1;

do

group=

1

to

3

;

do

j=

1

to

10

;

input

y @@;

output

;

end

;

end

;

cards

;

50 55 65 63 60 68 69 60 52 49

80 86 74 66 79 81 70 62 60 72

42 48 58 63 62 55 63 60 53 45

;

%let

data=test1;

%let

g=3;

%let

a=0.05;

%let

group=group;

%let

y=y;

%

STEEL;

(78)

Steel検定の結果

PAIR :比較を行う群の対

Z :Z統計量

P_KW :ウイルコクソン検定のp値

P2_WIL:連続修正後のp値

DP :Steel検定のp値

DZC :Steel検定の棄却限界値

OBS pair i1 i2 z P2_WIL P_KW dp dzc

1 12 1 2 2.95257 0.00356 0.00315 0.00610 2.21213

(79)

Steel-Dwass検定の実行例(STEELD)

data test2;

do group=1 to 4; do j=1 to 11;

input y @@;output;end;end;

cards; 6.9 7.5 8.5 8.4 8.1 8.7 8.9 8.2 7.8 7.3 6.8 9.6 9.4 9.5 8.5 9.4 9.9 8.7 8.1 7.8 8.8 . 5.7 6.4 6.8 7.8 7.6 7.0 7.7 7.5 6.8 5.9 . 7.6 8.7 8.5 8.5 9.0 9.2 9.3 8.0 7.2 7.9 7.8 ;

%let data=test2;%let g=4;%let a=0.05; %let group=group;%let y=y;

%STEEL_D;

(80)

Steel-Dwass検定の結果

TP :Steel-Dwass検定のp値

TZC :Steel-Dwass検定の棄却限界値

OBS pair i1 i2 z P2_WIL P_KW tp tzc

1 12 1 2 2.68023 0.00817 0.00736 0.03696 2.56903 2 13 1 3 2.54000 0.01225 0.01109 0.05398 2.56903 3 14 1 4 1.28264 0.21139 0.19962 0.57401 2.56903 4 23 2 3 3.74608 0.00021 0.00018 0.00103 2.56903 5 24 2 4 2.04678 0.04427 0.04068 0.17097 2.56903 6 34 3 4 3.38446 0.00081 0.00071 0.00398 2.56903

(81)

Shirley-Williams検定の実行例(WILN)

data test3;

do group=1 to 4; do i=1 to 12;

input y @@;output;end;end;

cards; 13 23 8 17 25 34 18 26 10 28 18 21 26 22 30 38 15 24 18 11 21 30 31 23 22 10 29 37 22 13 29 28 21 16 21 26 26 34 30 45 17 19 27 18 36 24 25 31 ;

%let data=test3;%let g=4;%let group=group; %let y=y; %let a=0.05; %let tail=1; %

S_WILL;

(82)

Shirley-Williams検定の結果

各ステージの平均順位 ステージ 群1 群2 群3 群4 2 10.708 14.292 3 15.375 21.167 18.958 4 18.375 25.667 23.083 30.875

OBS stage control g mean adjmea n

z wp wtc star

1 2 10.7083 2 14.2917 14.2917 1.24347 0.10685 1.64485 2 3 15.3750 3 18.9583 20.0625 1.09179 0.16385 1.71619 3 4 18.3750 4 30.8750 30.8750 2.18990 0.01666 1.73900 *

(83)

Joint versus Separate ranking

83 group control 34.6 37.5 53.6 50.0 58.3 29.4 43.3 45.2 A 46.4 43.5 52.6 55.2 51.7 50.0 57.1 40.0 B 56.5 57.1 53.3 55.6 72.2 50.0 51.7 47.4 C 65.0 53.6 61.9 53.6 44.4 72.7 61.5 51.9

平均

p値

44.0

Joint

Separate

49.6

0.7327

0.4866

55.5

0.0859

0.1044

58.1

0.0155

0.0418

(84)

1 2 3 4 g 30 40 50 60 70 y group 反応 変数

(85)

Joint vs. Separate ranking

1) Joint rankingは平均値の差が大きいところで

有意になりやすい.

2) Separate rankingは平均値の差が小さいとこ

ろで有意になりやすい.

3) どちらを用いるベキかはコンセンサスはな

い.

4) 米国ではノンパラの多重比較はあまり用い

られない.

85

(86)

平均値の差のt検定の前提

不偏性(unbiased)

測定に系統的な偏りがない

独立性(independence)

観測値が互いに影響を受けない

等分散性(homogeneity of variance)

ばらつきの大きさが一定

正規性(normality)

左右対称な山形の分布

(87)

平均値の差のt検定の前提

87

0

]

,

[

]

[

]

[

)

,

(

:

:

)

,

(

:

:

,

,

:

,

,

:

2

,

,

:

1

' ' 2 2 1 2 0 , 2 1 2 2 , 2 2 2 1 1 1 , 1 2 1 1

j i ij ij i ij i ij ij kn k k k n n

y

y

Cov

y

V

y

E

N

y

H

N

y

H

y

y

y

k

Group

y

y

y

Group

y

y

y

Group

独立性:

等分散:

不偏性:

    

  

(88)

前提条件の図示

Y

P群

A群

μ

1

μ

2

帰無仮説H

0

μ

1

= μ

2

= μ

3

= μ

4

B群

C群

μ

3

μ

4

(89)

多群比較のt統計量

89

群をプールした群内分

  

    

k

s

n

y

y

s

n

n

s

y

y

t

y

y

y

k

Group

y

y

y

Group

y

y

y

Group

k i i k i n i j i ij a b a b knk k k n n

:

)

1

(

)

(

1

1

,

,

:

,

,

:

2

,

,

:

1

2 1 1 1 2 2 2 , 2 1 2 2 , 2 2 2 1 1 1 , 1 2 1 1



  





  

ij

: 第i群のj番目

の観測値

(90)

多群比較(a-b)のt統計量

a b a b a b b a a b a b a b

y

y

n

n

s

y

y

t

n

n

n

n

n

s

y

y

t





1

1

1

1

2 2

 

t統計量はnが等しいときは 平均値の差に比例

(91)

対比(contrast)とは

91

水準で有意 を越えると が サンプルサイズ 群の平均値 対比の係数 対比統計量 5% 1.96 1 , : , 0 : 1 2 1 1 2 1 1 2 2 1 t n y y s i n y C C n s C y C t k i i k i n i j i ij i i k i i i k i i i k i i i

 

           4 4 3 3 2 2 1 1

y

C

y

C

y

C

y

C

(92)

対比:4群の場合

)

(

12 22 32 42 2 4 4 3 3 2 2 1 1 4 3 2 1 4 2 2 4 3 2 2 3 2 2 2 2 1 2 2 1 4 4 3 3 2 2 1 1

C

C

C

C

n

s

y

C

y

C

y

C

y

C

t

n

n

n

n

n

if

n

s

C

n

s

C

n

s

C

n

s

C

y

C

y

C

y

C

y

C

t

(93)

分散についての重要な公式

93 n n n n n n n Y Y Y V Y V Y Y V Y Y V C CY V n i n 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2 2 ] [ 2 ) 1 ( ] [ 2 ] [ ] [

                         

  

確率変数Y

1

, Y

2

, ・・・ ,Y

n

が互いに独立に

期待値

μ,分散σ

2

の分布にしたがうとき

(94)

対比統計量の分子の期待値と分散

 

   

k i i i k i i i k i i k i i i

n

C

n

C

n

C

y

C

V

y

C

V

y

C

V

C

y

C

E

1 2 2 2 2 2 2 1 2 2 1 2 2 1 1 1 1 1

0

(95)

C

1

C

2

C

3

C

4

=-1 0 0 1

95 4 1 1 4 4 2 1 2 4 1 4 2 2 3 2 2 2 2 2 1 2 2 4 3 2 1

1

1

1

0

0

1

0

0

1

n

n

s

y

y

n

s

n

s

y

y

n

s

n

s

n

s

n

s

y

y

y

y

t

(96)

C

1

C

2

C

3

C

4

=-2 0 0 2

対比の係数を定数倍してもZは不変

4 1 1 4 4 2 1 2 4 1 4 2 2 3 2 2 2 2 2 1 2 2 4 3 2 1

1

1

2

2

2

2

0

0

2

2

0

0

2

n

n

s

y

y

n

s

n

s

y

y

n

s

n

s

n

s

n

s

y

y

y

y

t

(97)

対比の係数の例

ex1) Dunnett法の対比の係数の例

-1 1 0 0 -1 0 1 0

-1 0 0 1

ex2) Tukey法の対比の係数の例

-1 1 0 0 -1 0 1 0

-1 0 0 1 0 -1 1 0

0 -1 0 1 0 0 -1 1

97

(98)

対比統計量tの分布

1)帰無仮説:用量反応なし

2)対立仮説:用量反応あり

薬効の大きさに比例するように対比係数Cを

設定するとμは大きくなる.

98 0

N(0,1)

平均0,SD1

の正規分布

μ

N(μ,1)

平均0,SD1

の正規分布

(99)

最大対比法

tmax(複数の対比の最大値):検定統計量

• Robertson(1988):multiple contrast tests

• 様々な多重比較法を統一的に表現

Tukey, Dunnett, Max t, Williams

(Yoshimura(1997)による分母の拡張)

Bartholomew(三輪(1997))

2重修正Williams(三輪(1997))

• 用量反応パターンの解析

Hamada(1997)

99

(100)

最大対比法 多重性調整p値

• 複数の対比を同時に評価→多重性

(Scheffe Bonferroni法は過度に保守的)

• Max tのp値

積分法 正確な方法 (広津(1989))

• 任意の対比の多重性調整p値の多重積分によ

る計算(岸本・浜田(1994))

• SAS/MULTTESTを用いたresamplingによる多重

性調整p値の計算

(Hamada(1997))

• adj=simulate 乱数によるシミュレーション

• モンテカルロ積分による最大対比法の棄却限界値の計

算(西山(2003))

(101)

用量相関性検定の各手法と

対比との関連

帰無仮説 H

0

μ

μ

=・・・=

μ

a

対立仮説 H

μ

μ

≦・・・≦

μ

a

(1つの不等号は厳密に成り立つものとする.

μ

μ

a

単調減少を検定する場合は,≦ → ≧)

用量相関性の検定:対立仮説の下で有意にでやすいよう

に検定統計量を工夫

回帰分析,Max t,ウイリアムス,ヨンキー,累積カイ2

乗,コクラン・アミテージ,タローン検定

101

(102)

回帰分析

proc

glm

;

class

group;

model

y=group;

contrast

'linear'

group -

3

-

1

1

3

;

run

;

対比 自由度 対比平方 和

平均平方 F 値 Pr > F linear 1 7128.180 7128.180 7.32 0.0104

(103)

最小2乗法による傾きの推定値

103

                                          2 4 3 2 1 2 4 3 2 1 1 4 3 2 1 2 2 1 ) ( ] 5 . 1 ) 5 (. ) 5 . 0 ( ) 5 . 1 [( ) ( ] ) 5 . 2 4 ( ) 5 . 2 3 ( ) 5 . 2 2 ( ) 5 . 2 1 [( 5 . 2 4 , 3 , 2 , 1 4 ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( x x y y y y n x x y y y y n b n n n n n x x y x x x x y y x x y x x y x x y y x x x x y x x x x y y x x S S b i i i i i i i i i i i i i i i i i i i XX XY 群の場合  4 3 2 2 1

1

1

3

3

y

C

y

y

y

(104)

回帰分析(regression analysis)

正規分布と等分散を仮定した方法

・例)-3 -1 1 3(等差的),

-7 -5 -1 13(等比的)

・多項式回帰 2次成分(1 -1 -1 1),

3次成分 (-1 3 -3 1)

・単回帰分析はPearsonの相関係数が0である

かを検定することと等価

・REG,GLM,CORR,MULTTEST

(105)

分散分析,回帰分析,多重比較

3つの統計手法

分散分析 Analysis of Variance

バラツキの大きさを分解

回帰分析 Regression analysis

XとYの線形関係のモデル化

多重比較 Multiple comparison

多群の比較

105

(106)

6つのt統計量

106

効果 group に対する最小 2 乗平均

H0: LSMean(i)=LSMean(j) の t 統計量/ Pr > |t|

従属変数 : y

i/j

1

2

3

4

1

1.01022 2.471815 2.364345

0.3191 0.0183

*

0.0236

*

2

-1.01022

1.461595 1.354125

0.3191

0.1525

0.1841

3

-2.47181 -1.46159

-0.10747

0.0183

0.1525

0.915

4

-2.36434 -1.35412 0.10747

0.0236

0.1841

0.915

(107)

分散分析の結果 FA=2.78

107 要因 自由度 平方和 平均平方 F 値 Pr > F Model 3 8134.20000 2711.40000 2.78 0.0548 Error 36 35065.40000 974.03889 Corrected Total 39 43199.60000 要因 自由 度 Type I 平方和 平均平方 F 値 Pr > F group 3 8134.200000 2711.400000 2.78 0.0548

(108)

回帰分析の結果 FR=7.32

Dependent Variable: y

対比 自由度 対比平方和 平均平方

F 値 Pr > F

(109)

分散分析,回帰分析,多重比較の関係

109

2 2 3 4 2 4 2 3 1 4 1 3 1 2 2 2 2 2 2 3 4 2 4 2 3 1 4 1 3 1 2 2 2 3 4 2 2 4 2 2 3 2 1 4 2 1 3 2 1 2 3 4 2 4 2 3 1 4 1 3 1 2 10 36 6 2 / ) 3 1 ) 1 ( ) 3 (( ) ( 6

                                           ij R ij A t t t t t t t t t t t t t F t t t t t t t F t t t t t t a b a b ab

y

y

n

n

s

y

y

t

 

1

1

2

(110)

群間平方和の別表現

110 2 4 3 2 4 2 2 3 2 2 4 1 2 3 1 2 2 1 4 3 4 2 3 2 3 1 3 1 2 1 2 4 2 3 2 2 2 1 4 1 2 4 1 2 4 1 2 4 1 2 4 1 2 4 1 2 4 1 2

)

(

)

(

)

(

)

(

)

(

)

(

2

2

2

2

2

2

3

3

3

3

4

)

(

4

4

/

)

(

)

(

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

n

i i i i i i i i i i i i i i i

       次のスライド参照

(111)

群間平方和の別表現

111 4 3 4 2 3 2 4 1 3 1 2 1 2 4 2 3 2 2 2 1 2 4 3 4 2 4 1 4 4 3 2 3 2 3 1 3 4 2 3 2 2 2 1 2 4 1 3 1 2 1 2 1 2 4 3 2 1 2 4 1

2

2

2

2

2

2

)

(

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

y

i i

(112)

分散分析,回帰分析,

多重比較の関係

data

ana;

t12=-

1.01022

;t13=-

2.471815

;t14=-

2.364345

;

t23=-

1.461595

;t24=-

1.354125

;t34=

0.10747

;

FA=(t12**

2

+t13**

2

+t14**

2

+t23**

2

+t24**

2

+t34**

2

)/

6

;

FR=(t12+t13+t14+t23+t24+t34)**

2

/

10

;

proc

print round

;

run

;

OBS t12 t13 t14 t23 t24 t34 FA

FR

1

-1.01 -2.47 -2.36 -1.46 -1.35 0.1

2.78 7.32

(113)

対比較と回帰分析

113

比較

係数 平均値の差

1-2

-1

1

0 0

14.1

1-3

-1

0

1 0

34.5

1-4

-1

0

0 1

33

2-3

0 -1

1 0

20.4

2-4

0 -1

0 1

18.9

3-4

0

0 -1 1

-1.5

-3 -1

1 3

119.4

Y=a+bX

参照

関連したドキュメント

の応力分布状況は異なり、K30 値が小さいほど応力の分 散がはかられることがわかる。また、解析モデルの条件の場合、 現行設計での路盤圧力は約

重回帰分析,相関分析の結果を参考に,初期モデル

地図 9 “ソラマメ”の語形 語形と分類 徽州で“ソラマメ”を表す語形は二つある。それぞれ「碧豆」[pɵ thiu], 「蚕豆」[tsh thiu]である。

カウンセラーの相互作用のビデオ分析から,「マ

統制の意図がない 確信と十分に練られた計画によっ (逆に十分に統制の取れた犯 て性犯罪に至る 行をする)... 低リスク

FSIS が実施する HACCP の検証には、基本的検証と HACCP 運用に関する検証から構 成されている。基本的検証では、危害分析などの

本論文での分析は、叙述関係の Subject であれば、 Predicate に対して分配される ことが可能というものである。そして o

区分別用途 提出の有無 ア 第一区分が半分を超える 第一区分が半分を超える 不要です イ 第一区分が半分を超える 第二区分が半分以上 提出できます