• 検索結果がありません。

実習資料 統計ソフトRを使った統計学実習

N/A
N/A
Protected

Academic year: 2018

シェア "実習資料 統計ソフトRを使った統計学実習"

Copied!
31
0
0

読み込み中.... (全文を見る)

全文

(1)

情報ヷ統計処理

統計パヸト

7

臨床試験管理センタヸ西山毅 たけし

nishiyama@minos.ocn.ne.jp

(2)

推定

 神 世界=母集団 い 限 情報

いわ わ 人間 ,統計 通 何 神さ 知 い真 値=パ ー 見積  パ ー 見積 推定 呼ぶ

母集団 population

標本 sample

世界

人間界

ン ン

(3)

推定

 res = lm(統計 , ー 名 い 推

定結果 変数res 入

 res⇒点推定値

 confint(res)⇒95%信頼区間

 使う統計 決

 Y=α+ 1X1+ 2X2+誤差ε

 Y 量的変数

(4)

2011

年医師国家試験

 新 く発売さ 抗菌薬A 肺炎 対 治療効果 調べ

,新 入院 肺炎患者 対象 ,抗菌薬A 投与 群

A群 既存 抗菌薬B 投与 群 B群 割 け ,治療 効果 入院期間 比較検討 .得 結果 表 示 .

 こ 結果 解釈 い 正 い .

a. A群 B群 比べ 入院期間 平均 3.6%短い.

b. A群 入院期間 平均値 誤差 3.6%以内 あ .

c. A群 方 B群 入院期間 短く 確率 3.6% あ .

d. A群 96.4% 患者 入院期間 B群 平均入院期間 短い.

e. A群 B群 入院期間 差 い ,誤 差 あ 確 率 3.6% あ .

群 群 P値

対象者数 人 人

(5)

検定

 男 X=1, 女 X=0 いう ー変数 使えば,

 体重 男女差 あ ?

 ⇒ =0 or ≠0

パ ー 関 仮 正 い う 手持 ー 使 検定test こ

• 女 体重 測定値Y = α+誤差ε

男 体重 測定値Y= α + + 誤差ε

• 誤差ε 正規 布

• 体重 測定値Y= α + X + 誤差ε

(6)

検定

コンセプト

研究 主張 いこ 対立仮 H1

反対 否定 い仮 :帰無仮 H0 立

H0 世界 ン ー 得

確率 さい⇒H1 判断 う

 言い いこ 反対 否定 ,間接的 主

張 正 い 判断 点 検定 背理法 あ

(7)

 第1 ッ :仮

 示 い ,H1: ≠0

 反対 仮 H0: =0

 第2 ッ :検定統計量T Y 決

 こ 場合 ,

• 体重 測定値Y= α + X + 誤差ε

男X=1 vs 女X=0

• 誤差ε 正規 布

� � = 男 � 平均値 − 女 � 平均値

(8)

場合

T

分布

 T 確率密度関数f(t) , ン 数 n

 ,

 こ 場合 検定統計量 布 こう

⇒知 く や いけ

� = Γ �

� � − Γ � − +

� � −

−�/

(9)

ステップ

補足

 統計 仮 決 ば, 最適 検定統

計量T(Y) 理論的 け

 H0 T(Y) 布 考え

⇒H1 考え い.H 場合 考え こ 注意

検定統計量

T Y

 統計

 仮

ッ ボッ

(10)

エラヸ

 H0 正 い ,間違 H1 正 い 判定

確率:α

 H 正 い ,間違 H0 正 い 判

定 確率:

 こ 表 縦向

 H1 正 い ,検定

Test H0 判定

確率

 H0 正 い ,検定

H1 判定 確率α

H1 H0

H1 正解 α

H0 正解

1 1

True

T

e

s

t

(11)

エラヸ

 言葉 覚え 混乱 式 覚え う

 α = P(H1’ | H0)

 β = P(H0’ | H1)

 ◯ △ 確率P △|□

H1 H0

H1 正解 α

H0 正解

1 1

True

T

e

s

t

 α ー

 一方 決

(12)

ステップ

 検定 ,α 方 決 ⇒自動的 決

 検定 先立 ,あ 決 α 値 有意

水準 呼ぶ

 慣例的 α=0.05 こ 多い

 理論的 根拠 何 い

ステップ

(13)

P

 H0: =0

T 布 左図

 T(Y) 式 ,T

±∞ 近いほ

H0 矛盾 ,

H1 く .

-4 -2 0 2 4

0 .0 0 .1 0 .2 0 .3 0 .4

H1 H0 H1

T

� � = 男 � 平均値 − 女 � 平均値

(14)

P

 T Y , H1

い 両端

,H1 判定

,中心部

H0 判定

う.

 こ 線引

-4 -2 0 2 4

0 .0 0 .1 0 .2 0 .3 0 .4

H1 H0 H1

T

� � = 男 � 平均値 − 女 � 平均値

(15)

P

 灰色 面積 確率

=0.05 T 値 T

< -1.96, 1.96 < T

H1 H0 区

 こ 部 T

場合 ,H0 H1

あ 可能性 高い

-4 -2 0 2 4

0 .0 0 .1 0 .2 0 .3 0 .4

H1 H0 H1

(16)

-4 -2 0 2 4 0 .0 0 .1 0 .2 0 .3 0 .4 T ー

P

 T( ー H1側

確率=P値 ぶ

 T ー =2.1 ,

P値=0.036

 α=0.05 領域

T ー 入

⇔P値<0.05

(17)

ステップ

 P値<0.05⇒H1 判定

 H0 棄却 言う

 P値≧0.05⇒H0 判定

 H0 採択 言う

 有意水準α 検定前 決 値 あ ,P値

ン ー 得 点 注意

(18)

検定手順

 統計 決

 第 ッ :仮 決

 第 ッ :検定統計量T Y 決

 第 ッ :有意水準α 決

 第 ッ :P値 求

 第 ッ :H0 or H1 判定

 こ 中 我々 や ば い

 統計 決

 仮 決

 有意水準 決

(19)

検定手順

 さ ,慣 有意水準α=0.05

けば良い ,実際 や こ ,

 統計 ,仮 決 け.

他 全部R や く .

(20)

R

しょう

 demo.csv 込 ,変数d 代入

 d = read.csv(“demo.csv”)

 こ 統計 解析結果 変数res 代入

 res=lm(Wt~Sex,d)

• 体重 測定値Y= α + X + 誤差ε

男X=1 / 女X=0

• 誤差ε 正規 布

(21)

R

しょう

 summary(res)

 統計 R 指定 い い.仮 設

定 う ?

 線形 関数lm ,

 H0: α=0 vs H1:α≠0

 H0: =0 vs H1: ≠0

仮 自動的 設定 く .

Estimate Std. Error t value Pr(>|t|) (Intercept) 52.9219 0.263 201.23 <2e-16 Sexm 13.9991 0.4341 32.25 <2e-16

P値

α

線形

H0: =0 vs H1: ≠0

(22)

体重

α

に目星

いる場合

 実際 研究 こ 仮 使うこ い …

 こ 関数lm い ,関数t.test 使う  t.test(d$Wt, mu=50)

 t = 30.1383, df = 1639, p-value < 2.2e-16  95 percent confidence interval:

 57.53596 58.58513  sample estimates:  mean of x

 58.06055

• 体重 測定値Y = 真 体重α+誤差ε

• 誤差ε 正規 布

P値

α 95%信頼区間

α 推定値

(23)

体重

性別

身長

るモデル

 R こ 仮 設定 や く

,統計 け指定 ばOK

 res=lm(Wt~Sex+Ht, d)

 summary(res)

• 体重 測定値Y= α + X + ×身長 + 誤差ε

男X=1 / 女X=0

• 誤差ε 正規 布

仮 H0: =0 vs H1: ≠0

H0: =0 vs H1: ≠0

Estimate Pr(>|t|) (Intercept) -46.746 <2e-16 Sexm 5.70792 <2e-16 Ht 0.63417 <2e-16

(24)

体重

学歴

るモデル

 levels(d$School

 [1] "high" "junior" "univ"

 高卒 基準 い ⇒中卒 基準

 d$School=relevel(d$School, ref=“junior”)

• 体重 測定値Y= α+ 1X1+ 2X2+誤差ε

• 誤差ε 標準正規 布

X1 X2

中卒 0 0 高卒 1 0 大卒 0 1

仮 H0: 1=0 vs H1: 1≠0

H0: 2=0 vs H1: 2≠0

(25)

体重

学歴

るモデル

 res=lm(Wt~School, d)

 summary(res)

 高卒 P値>0.05⇒H0: =0

 高卒 あ こ 体重 影響 い

 大卒 P値<0.05⇒H1: ≠0

 大卒 あ こ 体重 影響

Estimate Std. Error t value Pr(>|t|) (Intercept) 56.8424 0.8293 68.545 <2e-16 Schoolhigh 0.5616 0.9424 0.596 0.5513 Schooluniv 1.8832 0.9053 2.08 0.0376

P値 α

1 2

(26)

仮説を変え

 res=lm(Wt~School, d)

 anova(res)

 質的変数 パ ー べ =0 う 一

気 検定 こ 散 析 ANOVA ぶ

• 体重 測定値Y= α+ 1X1+ 2X2+誤差ε

• 誤差ε 標準正規 布

仮 H0: 1= 2=0 vs H1:( 1= 2=0) い

Df Sum Sq Mean Sq F value Pr(>F) School 2 896 447.97 3.8318 0.02186 Residuals 1637 191376 116.91

(27)

検定

 統計

 仮 H0 vs H1

 有意水準α 決 い い α=0.05 OK

 統計 仮 R 指定 P値 求

⇒P値 < α H1 判定

(28)

2011

年医師国家試験

 こ P値 意味 ?

 統計 ⇒ く,A群X=1 / B群X=0 時

 入院期間=α+ X+誤差

 仮 ⇒ く,H0: =0 vs H1: ≠0

 P値=0.036

⇒H0 A群 B群 入院期間 差 い

,観察 ー 検定統計量 ,H1側 A群 B群 入院期間 差 側 値 確率

群 群 P値

対象者数 人 人

(29)

2011

年医師国家試験

 選択肢

a. A群 B群 比べ 入院期間 平均 3.6%短い.

b. A群 入院期間 平均値 誤差 3.6%以内 あ .

c. A群 方 B群 入院期間 短く 確率 3.6%

あ .

d. A群 96.4% 患者 入院期間 B群 平均入院期

間 短い.

e. A群 B群 入院期間 差 い ,誤 差

(30)

2011

年医師国家試験

 A群 B群 入院期間 差 い ,誤

差 あ 確率 3.6% あ .

 厳密 下線部 誤

 差 い H0 ,誤 差 あ H1

判定 確率 ,検定 行う前 決 有意

水準α=5% ハ .

 P値 ,差 い H0 ,検定統計量T 観測値 H1側 大 値 確率

 P値 ,差 い H0 ,観察値 大

(31)

2011

年医師国家試験

 うや こ 問題 作 ン イ ,P値

参照

関連したドキュメント

まずフォンノイマン環は,普通とは異なる「長さ」を持っています. (知っている人に向け て書けば, B

1-1 睡眠習慣データの基礎集計 ……… p.4-p.9 1-2 学習習慣データの基礎集計 ……… p.10-p.12 1-3 デジタル機器の活用習慣データの基礎集計………

年限 授業時数又は総単位数 講義 演習 実習 実験 実技 1年 昼 930 単位時間. 1,330

[r]

[r]

日本の伝統文化 (総合学習、 道徳、 図工) … 10件 環境 (総合学習、 家庭科) ……… 8件 昔の道具 (3年生社会科) ……… 5件.

4-2

分配関数に関する古典統計力学の近似 注: ややまどろっこしいが、基本的な考え方は、q-p 空間において、 ①エネルギー En を取る量子状態