情報ヷ統計処理
統計パヸト
第
7
回
臨床試験管理センタヸ西山毅 たけし
nishiyama@minos.ocn.ne.jp
推定
め
神 世界=母集団 い 限 情報
いわ わ 人間 ,統計 通 何 神さ 知 い真 値=パ ー 見積 パ ー 見積 推定 呼ぶ
母集団 population
標本 sample
神
世界
人間界
ン
ン ン
推定
め
続
res = lm(統計 , ー 名 い 推
定結果 変数res 入
res⇒点推定値
confint(res)⇒95%信頼区間
使う統計 決
Y=α+ 1X1+ 2X2+誤差ε
Y 量的変数
2011
年医師国家試験
新 く発売さ 抗菌薬A 肺炎 対 治療効果 調べ
,新 入院 肺炎患者 対象 ,抗菌薬A 投与 群
A群 既存 抗菌薬B 投与 群 B群 割 け ,治療 効果 入院期間 比較検討 .得 結果 表 示 .
こ 結果 解釈 い 正 い .
a. A群 B群 比べ 入院期間 平均 3.6%短い.
b. A群 入院期間 平均値 誤差 3.6%以内 あ .
c. A群 方 B群 入院期間 短く 確率 3.6% あ .
d. A群 96.4% 患者 入院期間 B群 平均入院期間 短い.
e. A群 B群 入院期間 差 い ,誤 差 あ 確 率 3.6% あ .
群 群 P値
対象者数 人 人
検定
男 X=1, 女 X=0 いう ー変数 使えば,
体重 男女差 あ ?
⇒ =0 or ≠0
パ ー 関 仮 正 い う 手持 ー 使 検定test こ
• 女 体重 測定値Y = α+誤差ε
男 体重 測定値Y= α + + 誤差ε
• 誤差ε 正規 布
• 体重 測定値Y= α + X + 誤差ε
検定
コンセプト
研究 主張 いこ 対立仮 H1
反対 否定 い仮 :帰無仮 H0 立
H0 世界 ン ー 得
確率 さい⇒H1 判断 う
言い いこ 反対 否定 ,間接的 主
張 正 い 判断 点 検定 背理法 あ
さ
例
第1 ッ :仮
示 い ,H1: ≠0
反対 仮 H0: =0
第2 ッ :検定統計量T Y 決
こ 場合 ,
• 体重 測定値Y= α + X + 誤差ε
男X=1 vs 女X=0
• 誤差ε 正規 布
� � = 男 � 平均値 − 女 � 平均値
こ
場合
T
分布
T 確率密度関数f(t) , ン 数 n
,
,
こ 場合 検定統計量 布 こう
?
⇒知 く や いけ
� = Γ �
� � − Γ � − +
� � −
−�/
第
ステップ
補足
統計 仮 決 ば, 最適 検定統
計量T(Y) 理論的 け
H0 T(Y) 布 考え
⇒H1 考え い.H 場合 考え こ 注意
検定統計量
T Y
統計
仮
ッ ボッ
エラヸ
H0 正 い ,間違 H1 正 い 判定
確率:α
H 正 い ,間違 H0 正 い 判
定 確率:
こ 表 縦向
H1 正 い ,検定
Test H0 判定
確率
H0 正 い ,検定
H1 判定 確率α
H1 H0
H1 正解 α
H0 正解
1 1
True
T
e
s
t
’
エラヸ
続
言葉 覚え 混乱 式 覚え う
α = P(H1’ | H0)
β = P(H0’ | H1)
◯ △ 確率P △|□
H1 H0
H1 正解 α
H0 正解
1 1
True
T
e
s
t
’
’
α ー
一方 決
第
ステップ
検定 ,α 方 決 ⇒自動的 決
検定 先立 ,あ 決 α 値 有意
水準 呼ぶ
慣例的 α=0.05 こ 多い
理論的 根拠 何 い
第
ステップ
P
値
何
?
H0: =0
T 布 左図
T(Y) 式 ,T
±∞ 近いほ
H0 矛盾 ,
H1 く .
-4 -2 0 2 4
0 .0 0 .1 0 .2 0 .3 0 .4
H1 H0 H1
T
� � = 男 � 平均値 − 女 � 平均値
P
値
何
?
T Y , H1
い 両端
,H1 判定
,中心部
H0 判定
う.
こ 線引
?
-4 -2 0 2 4
0 .0 0 .1 0 .2 0 .3 0 .4
H1 H0 H1
T
� � = 男 � 平均値 − 女 � 平均値
P
値
何
?
灰色 面積 確率
=0.05 T 値 T
< -1.96, 1.96 < T
H1 H0 区
う
こ 部 T
場合 ,H0 H1
あ 可能性 高い
-4 -2 0 2 4
0 .0 0 .1 0 .2 0 .3 0 .4
H1 H0 H1
-4 -2 0 2 4 0 .0 0 .1 0 .2 0 .3 0 .4 T ー
P
値
何
?
T( ー H1側
確率=P値 ぶ
T ー =2.1 ,
P値=0.036
α=0.05 領域
T ー 入
⇔P値<0.05
第
ステップ
P値<0.05⇒H1 判定
H0 棄却 言う
P値≧0.05⇒H0 判定
H0 採択 言う
有意水準α 検定前 決 値 あ ,P値
ン ー 得 点 注意
検定手順
め
統計 決
第 ッ :仮 決
第 ッ :検定統計量T Y 決
第 ッ :有意水準α 決
第 ッ :P値 求
第 ッ :H0 or H1 判定
こ 中 我々 や ば い
統計 決
仮 決
有意水準 決
検定手順
め
続
さ ,慣 有意水準α=0.05
けば良い ,実際 や こ ,
統計 ,仮 決 け.
他 全部R や く .
R
や
しょう
demo.csv 込 ,変数d 代入
d = read.csv(“demo.csv”)
こ 統計 解析結果 変数res 代入
res=lm(Wt~Sex,d)
• 体重 測定値Y= α + X + 誤差ε
男X=1 / 女X=0
• 誤差ε 正規 布
R
や
しょう
summary(res)
統計 R 指定 い い.仮 設
定 う ?
線形 関数lm ,
H0: α=0 vs H1:α≠0
H0: =0 vs H1: ≠0
仮 自動的 設定 く .
Estimate Std. Error t value Pr(>|t|) (Intercept) 52.9219 0.263 201.23 <2e-16 Sexm 13.9991 0.4341 32.25 <2e-16
P値
α
線形
H0: =0 vs H1: ≠0
真
体重
α
に目星
い
いる場合
実際 研究 こ 仮 使うこ い …
こ 関数lm い ,関数t.test 使う t.test(d$Wt, mu=50)
t = 30.1383, df = 1639, p-value < 2.2e-16 95 percent confidence interval:
57.53596 58.58513 sample estimates: mean of x
58.06055
• 体重 測定値Y = 真 体重α+誤差ε
• 誤差ε 正規 布
P値
α 95%信頼区間
α 推定値
体重
性別
身長
決
るモデル
R こ 仮 設定 や く
,統計 け指定 ばOK
res=lm(Wt~Sex+Ht, d)
summary(res)
• 体重 測定値Y= α + X + ×身長 + 誤差ε
男X=1 / 女X=0
• 誤差ε 正規 布
仮 H0: =0 vs H1: ≠0
H0: =0 vs H1: ≠0
Estimate Pr(>|t|) (Intercept) -46.746 <2e-16 Sexm 5.70792 <2e-16 Ht 0.63417 <2e-16
体重
学歴
決
るモデル
levels(d$School
[1] "high" "junior" "univ"
高卒 基準 い ⇒中卒 基準
d$School=relevel(d$School, ref=“junior”)
• 体重 測定値Y= α+ 1X1+ 2X2+誤差ε
• 誤差ε 標準正規 布
X1 X2
中卒 0 0 高卒 1 0 大卒 0 1
仮 H0: 1=0 vs H1: 1≠0
H0: 2=0 vs H1: 2≠0
体重
学歴
決
るモデル
res=lm(Wt~School, d)
summary(res)
高卒 P値>0.05⇒H0: =0
高卒 あ こ 体重 影響 い
大卒 P値<0.05⇒H1: ≠0
大卒 あ こ 体重 影響
Estimate Std. Error t value Pr(>|t|) (Intercept) 56.8424 0.8293 68.545 <2e-16 Schoolhigh 0.5616 0.9424 0.596 0.5513 Schooluniv 1.8832 0.9053 2.08 0.0376
P値 α
1 2
仮説を変え
る
res=lm(Wt~School, d)
anova(res)
質的変数 パ ー べ =0 う 一
気 検定 こ 散 析 ANOVA ぶ
• 体重 測定値Y= α+ 1X1+ 2X2+誤差ε
• 誤差ε 標準正規 布
仮 H0: 1= 2=0 vs H1:( 1= 2=0) い
Df Sum Sq Mean Sq F value Pr(>F) School 2 896 447.97 3.8318 0.02186 Residuals 1637 191376 116.91
検定
め
統計
仮 H0 vs H1
有意水準α 決 い い α=0.05 OK
統計 仮 R 指定 P値 求
⇒P値 < α H1 判定
2011
年医師国家試験
こ P値 意味 ?
統計 ⇒ く,A群X=1 / B群X=0 時
入院期間=α+ X+誤差
仮 ⇒ く,H0: =0 vs H1: ≠0
P値=0.036
⇒H0 A群 B群 入院期間 差 い
,観察 ー 検定統計量 ,H1側 A群 B群 入院期間 差 側 値 確率
群 群 P値
対象者数 人 人
2011
年医師国家試験
選択肢
a. A群 B群 比べ 入院期間 平均 3.6%短い.
b. A群 入院期間 平均値 誤差 3.6%以内 あ .
c. A群 方 B群 入院期間 短く 確率 3.6%
あ .
d. A群 96.4% 患者 入院期間 B群 平均入院期
間 短い.
e. A群 B群 入院期間 差 い ,誤 差
2011
年医師国家試験
A群 B群 入院期間 差 い ,誤
差 あ 確率 3.6% あ .
厳密 下線部 誤
差 い H0 ,誤 差 あ H1
判定 確率 ,検定 行う前 決 有意
水準α=5% ハ .
P値 ,差 い H0 ,検定統計量T 観測値 H1側 大 値 確率
P値 ,差 い H0 ,観察値 大
2011
年医師国家試験
うや こ 問題 作 ン イ ,P値