• 検索結果がありません。

統計学入門(2016年度) 福地純一郎のページ introstat2016

N/A
N/A
Protected

Academic year: 2018

シェア "統計学入門(2016年度) 福地純一郎のページ introstat2016"

Copied!
68
0
0

読み込み中.... (全文を見る)

全文

(1)

2016

2016

12

9

junichiro.fukuchi@gakushuin.ac.jp

(2)

1

章 統計学とは何か

1.1

データの種類

1.1.1

測定の尺度による分類

Stevens 4

1

名義尺度

順序尺度

5 1,2,3,4,5

間隔尺度

4 18 9 00 比率尺度

1.1.2

データの計測形態に着目する分類

時系 列データ

クロスセクションデータ 空間データ

時系列データの例 :

クロスセクションデータの例 : GDP

1

(3)

2

1

変数データ分析

1

2.1

ヒストグラム

1 2.1

2010 7 2011 2 1 ヒストグラム

階級 階級幅 度数

Histogram of Nikkei$return

Nikkei$return

Frequency

−0.04 −0.03 −0.02 −0.01 0.00 0.01 0.02 0.03

0

5

10

15

20

25

30

2.1:

(4)

100 右に歪んだ分布

左に歪んだ分布

Histogram of kouji_23ku$kakaku

kouji_23ku$kakaku

Frequency

0 500000 1000000 2000000 3000000

0

50

100

150

200

250

(5)

x1, x2, . . . , xn

✓ ✏

n

i=1

xi =x1+x2+· · ·+xn

n

i=1

xi i 1,2, . . . , n xi

a

n

i=1

a=a+a+· · ·+a

| {z }

n =na ✓ ✏ (1) n ∑ i=1

(xi +yi) = n

i=1

xi+ n ∑ i=1 yi (2) n ∑ i=1

axi =a n

i=1

xi

✒ ✑

問題1

問題2 (1) (2)

問題3

n

i=1

(axi+byi) = a n

i=1

xi+b n

i=1

yi

2.2

データの代表値−平均、メディアン−

1 代表値

(6)

2.2.1

平均

x1, x2. . . . , xn 平均

¯

x= 1

n

n

i=1

xi

平均の性質1

n

i=1

(xi−x¯) = 0

平均の性質2

外れ値

例 2.1.

330,280,230,240,390,290,340,1580

¯

x= 460 8 7 460

1 1580

2.2.2

メディアン

メディアン(中央値)

x(1) < x(2) <· · ·< x(n)

M d=

{ x(n+1

2 ) n ,

1 2

{

x(n/2)+x(n/2+1)

}

n .

2.2.3

モード

(7)

モード,メディアン,平均の関係

単峰型 双峰型

< < 2

< <

2.3 23

350 427 528

(8)

2.3

四分位数

2 2

第1四分位数 2

第3四分位数 第2四分位数 四分位数

2.4

箱ひげ図

箱ひげ図

2.4:

sapporo

naha

toky

o

−10 0 10 20 30

(9)

2.5

データのばらつきの尺度

2.5.1

範囲,四分位範囲

範囲(レンジ)

四分位範囲

= 3 − 1

2.5.2

分散,標準偏差

偏差

= − =xi−x¯

分散

Sx2 =1

n {

(x1−x¯)2+ (x2−x¯)2+· · ·+ (xn−x¯)2

}

= 1

n

n

i=1

(xi−x¯)2 (2.1)

(xi−x¯)2 xi x¯

Sx =

√ S2

x

(10)

2.5.3

平均の性質(続き)

(1) x1, x2, . . . , xn a x1+a, x2+a, . . . , xn+a

¯

x+a

(2) x1, x2, . . . , xn b bx1, bx2, . . . , bxn bx¯

(3) x1, x2, . . . , xn b a bx1+a, bx2+a, . . . , bxn+

a bx¯+a

2.5.4

分散と標準偏差の性質

S2

x x1, x2, . . . , xn Sx

(1) x1, x2, . . . , xn a x1+a, x2+a, . . . , xn+a

S2

x Sx

(2) x1, x2, . . . , xn b bx1, bx2, . . . , bxn b2Sx2

|b|Sx

(3) x1, x2, . . . , xn b a bx1+a, bx2+a, . . . , bxn+

a b2S2

x |b|Sx

✓ ✏

x1, x2, . . . , xn a+bxi,i= 1,2, . . . , n

a+bx1, a+bx2, . . . , a+bxn

: a+bx¯ : b2Sx2

: |b|Sx

✒ ✑

✓ ✏

zi =

xi−x¯

Sx

i= 1,2, . . . , n (2.2)

標準化 基準化 標準化得点

(11)

z1, z2, . . . , zn z¯, Sz2,Sz ¯

z =0

S2

z =1

Sz =1

問題

A B C D E 85, 86, 87, 88, 89

解答 87

−2, −1, 0, 1, 2

2

4 + 1 + 0 + 1 + 4 = 10

Sx2 = 10 5 = 2

Sx=

2≒1.4142

−2/√2, 1/√2, 0/√2, 1/√2, 2/√2

1.414, 0.707, 0 0.707, 1.414

偏差値

10 50

xi = 50 + 10×

xi−x¯

Sx

(12)

3

2

変数データの分析

3.1

散布図

2 散布図

2

( )

20 40 60 80 100 120

5

10

15

20

25

area

yachin

3.1:

3.1 203

正の相関関係

3.2: 19

3.2 19

(13)

無相関

3.2

2

変数データの直線的関係の尺度−共分散,相関係数−

共分散

✓ ✏

x y (x1, y1), . . . ,(xn, yn) x y

Sxy =

1

n{(x1−x¯)(y1−y¯) +· · ·+ (xn−x¯)(yn−y¯)}=

1

n

n

i=1

(xi−x¯)(yi−y¯) (3.1)

✒ ✑

✓ ✏

x, y

r= Sxy

SxSy

(3.2)

x y 相関係数(correlation coefficient)

✒ ✑

r

r=

n

i=1

(xi−x¯)(yi−y¯)

v u u t

n

i=1

(xi−x¯)2 n

i=1

(yi−y¯)2

(3.3)

r (3.3)

(14)

( )

✓ ✏

(i) 1r1 a

(ii) r

r 1

(iii) r

r −1

(iv) r 0

a

49

✒ ✑

3.3 1

3.3:

(v) 1 r 1

(vi) 1 r −1

(v)

3.3

相関関係と因果関係

相関関係 因果関係

2

1

3.3 ฀

(15)

3.4

見かけ上の相関

3.4 47

3.4: 47

見かけ上の相関

3.5

(16)

4

章 回帰分析

4.1

単回帰分析

2

3.1

yachin =a+b×area

area yachin

被説明変数 説明変数 最小2乗法

a b a,b

\

yachin = 3.1553 + 0.2118×area (4.1)

(4.1) 回帰式

20 40 60 80 100 120

5

10

15

20

25

area

yachin

(17)

回帰式のあてはめ

4.1

回帰分析

y x y x

y=a+bx (4.2)

最小2乗法

4.2

最小

2

乗法

( x

i

, y

i

)

a + b x

x

i

y

i

x y

a+bx

i

4.2: 2

x−y y =a+bx a, b (xi, yi)

y=a+bx (xi, a+bxi)

2 yi−a−bxi y =a+bx (x1, y1),(x2, y2), . . . ,(xn, yn)

yi 2

S(a, b) = n

i=1

(yi−a−bxi)2

S(a, b) a, b 最小2乗法

S(a, b) a, b 1

b =

n

i=1

(xi−x¯)(yi−y¯)

n

i=1

(xi−x¯)2

(4.3)

(18)

(4.3) ,(4.4) a, b y=a+bx 回帰式

y

ˆ

y=a+bx

例題

5 (

) 2.

xi yi

24 17 25 19 26 20 27 21 28 23

a, b

xi yi (xi−x¯) (yi−y¯) (xi−x¯)2 (xi−x¯)(yi−y¯) 24 17 -2 -3 4 6 25 19 -1 -1 1 1 26 20 0 0 0 0 27 21 1 1 1 1 28 23 2 3 4 6 0 0 10 14

¯

x=26, y¯= 20

b =14

10 = 1.4, a= 20−1.4×26 =−16.4

a, b

ˆ

y=a+bx

回帰式 回帰直線 .

ˆ

y=16.4 + 1.4x

1 1.4

2

(19)

4.3

決定係数

2

y=a+bx (4.5)

xi y yˆi

ˆ

yi =a+bxi, ı = 1,2, . . . , n.

ˆ

yi yi 回帰値 yi yˆi

yi yˆi

ei =yi−yˆi, i= 1,2, . . . , n (4.6)

残差 (4.6)

yi = ˆyi+ei (4.7)

ˆ

yi yi ei

(4.7) y¯

yi−y¯= (ˆyi−y¯) +ei (4.8)

(4.8) 2 i

n

i=1

(yi−y¯)2

| {z }

yi

= n

i=1

(ˆyi−y¯)2

| {z }

ˆ yi + n ∑ i=1

e2i | {z }

(4.9)

(4.9) y1, y2, . . . , yn

yi yˆi

R2 =

n

i=1

(ˆyi−y¯)2 n

i=1

(yi−y¯)2

(4.10)

R2 決定係数 y

i yˆi

yi (4.9)

0≦R2 ≦1

(20)

4.4

回帰分析の名前の由来

Galton (1822-1911) (regression) 4.3 2

2 Galton

1cm 1cm

Galton 回帰(regression)

150 155 160 165 170

150

155

160

165

170

twodimrn$x

tw

odimr

n$y

(21)

5

章 確率

5.1

準備:順列と組合せ

例 5.1. a b c d 4

4 2 3 3 2 4×3×2 = 24 24

例 5.2. a b c d 2

4 2 3 4×3 = 12 12

n r n r 順列

nPr nPr

nPr =n(n−1)· · ·(n−r+ 1) =

n!

(n−r)! (5.1)

n! n! = n(n−1)· · ·2·1 n 階乗

例 5.3. 2

2

ab, ac, ad, bc, bd, cd

6 (4×3)/2 = 6

n r n r 組合せ

nCr n r nPr

1 r r!

nPr r! nCr

nCr= n

Pr

r! =

n!

(22)

5.2

標本空間と事象

試行

1 Ω( )

Ω ={1,2,3,4,5,6}

標本空間 Ω

事象(event)

A ={1,2} 1 2 {1,2}, {2,4,6}

1 , Ω

{1}, {2}, {3}, {4}, {5}, {6}

根元事象

∅ 空事象

例 5.4. 2 .

Ω = {(H, H), (H, T), (T, H), (T, T)}

, (H, T) 1 (Head) , 2 (Tail)

{(H, H)}, {(H, T)}, {(T, H)}, {(T, T)}

{(H, H)}, {(H, H),(H, T)}

問題 5.1. 5.4 {(H, H)}, {(H, H),(H, T)}

, .

和事象AB A B

積事象A∩B A B

(23)

AB , A B 互いに排反 , . A B

A B

5.3

確率

0 1 .

2 .

5.3.1

等可能性の原理による確率の定義

, , A

P(A)

P(A) = #A

#Ω

, #A A .

5.3.2

頻度に基づく確率の定義

.

2 2

1

P(·) 3

✓ ✏

(C1) A 0P(A)1

(C2) Ω P(Ω) = 1, P() = 0 (C3) A B P(A∪B) =P(A) +P(B)

✒ ✑

(24)

5.3.3

主観確率

5.3.4

確率の性質

, , .

✓ ✏

(a)P(Ac) = 1P(A)

(b) AB P(A)P(B)

(c) A, B P(AB) =P(A) +P(B)P(AB)

(d)A1, A2,· · · , An ,

P(A1∪A2∪ · · · ∪An) =P(A1) +P(A2) +· · ·+P(An).

✒ ✑

問題 5.2. 2 4

問題 5.3. 13 5

5

(1) 1, 2, 3, 4, 5

(2) 5 13

(1)

1

13C5

= 5!8! 13! =

5·4·3·2·1 13·12·11·10·9 =

1 13·11·9

(2)

12C4 13C5

= 12! 4!8! ·

5!8! 13! =

(25)

5.4

条件付き確率と乗法定理

5.4.1

条件付き確率

2 1 1 2

1 A, 2 B

A B A

1 1 B 1/2

A B

A A

B AB P(AB)

P(A) P(A) = 2/3, P(A∩B) = 1/3

P(AB)

P(A) =

1/3 2/3 =

1 2

✓ ✏

定義 5.1. A,B P(A)>0

事象Aが起こったときの事象Bの条件付き確率 P(B|A)

P(B|A) = P(A∩B)

P(A) (5.3)

✒ ✑

5.4.2

乗法公式

✓ ✏

乗法公式

P(AB) = P(A)×P(B |A) (5.4)

.

✒ ✑

A, B

A ={A∩B} ∪ {A∩Bc} (5.5)

{AB} {ABc}

(26)

解答 : A,

B 2

10

P(A B) = P(A)P(B|A) = 2

10 × 1 9

P(ABc) = P(Bc)P(A|Bc) = 8 10 ×

2

9 2 B

P(A) = P(A∩B) +P(A∩Bc)

= 2 10 ×

1 9 +

8 10 ×

2 9

= 2 90 +

16 90 =

18 90 =

2 10

5.5

独立性

✓ ✏

定義 5.2. 事象の独立性

2 A, B

P(A∩B) = P(A)P(B)

, A B 独立 .

✒ ✑

A B P(A)>0

P(B|A) =P(B) (5.6)

. (5.6) , A B

. A B , A, B

.

3 A, B, C P(A∩B) = P(A)P(B), P(A∩C) =P(A)P(C), P(B ∩C) =

P(B)P(C),P(ABC) =P(A)P(B)P(C) , A, B, C

. 4 .

モンティ・ホール問題

Let’s make a deal

1 3

(27)

6

章 確率変数

離散型確率変数 連続型確率変数

6.1

離散型の確率変数と確率分布

X X 1 6

1/6

X 1 2 3 4 5 6

1 6 1 6 1 6 1 6 1 6 1 6 X

x1, x2, . . . , xk

X

p1, p2, . . . , pk

X 離散型確率変数(random variable) pi =P(X =xi),

(i= 1,2, . . . , k) x1, x2, . . . , xk p1, p2, . . . , pk , X 確率分布

p1+p2+· · ·+pk= 1

Z Z Z

Z 2 3 4 5 6 7 8 9 10 11 12

1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36

Z = 2 (1,1)

1

36 Z = 3 (1,2), (2,1) 2

36

1 2 3 4 5 6 1/6

5.1

2 3 4 5 6 7 8 9 10 11 12 1/36

(28)

6.2

離散型確率分布の例

6.2.1

離散型一様分布

離散型一様分布 X n 1,2, . . . , n

P(X =k) = 1

n (k= 1,2, . . . , n)

6.2.2

二項分布

A A p n

n A X X 1,2, . . . , n

X

P(X =k) = nCkpk(1−p)n−k (k = 0,1, . . . , n)

二項分布(binomial distribution) B(n, p) X

B(n, p) X B(n, p) X ∼B(n, p)

n

k=0

nCk pk(1−p)n−k= (p+ 1−p)n = 1

問題 6.1. 0.8

(29)

6.3

期待値(離散型確率変数)

X x1, x2, . . . , xk pi =P(X =xi)

E(X) = k

i=1

xipi

X 期待値(expected value) X 確率分布の平均 X

.

例 6.1.

X B(n, p)

E(X) = n

k=0

k×nCk pk(1−p)n−k

= n

k=0

k n!

k!(n−k)! p

k(1p)n−k

=np

n

k=1

(n−1)!

(k1)!{(n1)(k1)}! p

k−1(1p)(n−1)−(k−1)

=np

n−1

s=0

(n−1)!

s!{(n1)s}! p

s(1p)(n−1)−s

=np

B(n, p) np

n−1

s=0

(n1)!

s!{(n1)s}! p

s(1

−p)(n−1)−s= (p+ 1

−p)n−1 = 1

✓ ✏

n (a+b)n

(a+b)n= n

k=0

nCk akbn−k

✒ ✑

6.3.1

確率変数の関数の期待値

X g g(X) X

x1, x2, . . . , xk pi = P(X =xi), i = 1, . . . , k Y = g(X)

Y g(x1), g(x2), . . . , g(xk)

Y ℓ y1, . . . , yℓ

Y =g(X) ,

E[g(X)] = ℓ

(30)

. g(X) E[g(X)]

定理 6.1. X X x1, x2, . . . , xk

E[g(X)] = k

i=1

g(xi)pi (6.1)

定理

6.1

を使って問題を解く

問題 6.2. X

(1) E(X) (2) E(X2)

解答 (1)

E(X) = 1× 1 6 + 2×

1 6+ 3×

1 6 + 4×

1 6 + 5×

1 6+ 6×

1 6 = 3.5 (2) 6.1

E(X2) =12× 1

6+ 2

2×1

6 + 3

2 ×1

6 + 4

2× 1

6 + 5

2× 1

6+ 6

2× 1

6

=1

6(1 + 4 + 9 + 16 + 25 + 36) = 15.17 2

✓ ✏

X c

(a) E(c) = c

(b) E(X+c) =E(X) +c

(c) E(cX) = cE(X)

(d) X, Y E(X+Y) = E(X) + E(Y)

✒ ✑

証明(a), (b), (c) (d) 7

分散

X 分散(variance)

V(X) = E[(X−E(X))2]

X µ= E(X) 1 g(x) = (xµ)2

6.1 X

V(X) = k

i=1

(xi−µ)2pi = (x1−µ)2p1 +· · ·+ (xk−µ)2pk (d)

1

(31)

定理 6.2. X

V(X) = E(X2)[E(X)]2 (6.2) 証明 µ= E(X)

V(X) =E[(Xµ)2] =E[X22µX +µ2]

=E[X2]−2µE(X) +µ2

=E[X2]−µ2 ✷

X cm cm2

X

X 標準偏差(standard deviation) D(X)

D(X) = √V(X) (6.3)

例 6.2. B(n, p)

X B(n, p) E[X(X1)] =n(n1)p2

E[X(X1)] = n

k=0

k(k1)×nCk pk(1−p)n−k

= n

k=2

k(k1) n!

k!(n−k)! p

k(1

−p)n−k

=n(n−1)p2

n

k=2

(n2)!

(k−2)!{(n−2)−(k−2)}! p

k−2(1p)(n−2)−(k−2)

=n(n1)p2

n−2

s=0

(n2)!

s!{(n−2)−s}! p

s(1

−p)(n−2)−s =n(n1)p2

E(X2) = n(n1)p2 +np 6.2 V(X) = E(X2)

[E(X)]2 =n(n1)p2+np=np(1p)

✓ ✏

B(n, p) np,np(1p) X B(n, p)

E(X) =np, V(X) = np(1−p)

✒ ✑

練習問題10

0.3 10

X

(32)

6.4

数学の準備1:定積分

[a, b] f(x)

[a, b] a = x0 < x1 < · · · < xn =b [a, b] n

[x0, x1],[x1, x2],· · · ,[xn−1, xn] ∆ = {x0, x1,· · · , xn}

|x1−x0|,|x2 −x1|,· · · |xn−xn−1| ∆ |∆|

[xi−1, xi] ui

n

i=1

f(ui)(xi−xi−1) =f(u1)(x1−x0) +f(u2)(x2−x1) +· · ·+f(un)(xn−xn−1)

f ∆ リーマン和 f || →0

n → ∞ S

S [a, b] f

∫ b

a

f(x)dx

∫ b

a

f(x)dx=F(b)F(a)

F f

(33)

6.5

数学の準備2:広義積分

[a, b]

[a,) [a,) a [a,)

f(x) [a,∞)

lim

t→∞

∫ t

a

f(x)dx

f(x) [a,)

∫ ∞

a

f(x)dx

f(x) (−∞, a]

lim

t→−∞

∫ a

t

f(x)dx

f(x) (−∞, a]

∫ a

−∞

f(x)dx

(−∞,) f(x) (−∞,)

lim

t→−∞

∫ a

t

f(x)dx lim

t→∞

∫ t

a

f(x)dx

∫ ∞

−∞

f(x)dx= lim

t→−∞

∫ a

t

f(x)dx+ lim

t→∞

∫ t

a

f(x)dx

例題 6.1. a >0

(1)

∫ t

0

e−axdx, (2)

∫ ∞

0

e−axdx, (3)

∫ t

0

xe−x2

dx, (4)

∫ ∞

0

xe−x2

dx,

( )

(1)

∫ t

0

e−axdx=

[ −1 ae −ax ]t 0

=−1 ae

−at+ 1

a

(2)

0

e−axdx= lim

t→∞

(

−1

ae

−at+ 1

a ) = 1 a (3) ∫ t 0

xe−x2

dx=

[

−12e−x2

]t

0

=1 2e

−t2

+1 2

(4)

∫ ∞

0

xe−x2

dx= lim

t→∞

(

−1

2e −t2

+1 2

)

(34)

6.2: J 846

6.6

連続型確率変数

連続型確率変数 (

GNP )

6.2 2002 J

X f(x) 0 [a, b]

aX b f(x) x=a, x=b x

f(x) X 確率密度関数(probability density function, pdf)

X x f(x)0

a < b

P(aX b) =

∫ b

a

f(x)dx (6.4)

f

0 2 4 6 8 10 12 14 16 18 0

0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18

a b

f(x)

a b

f(x) dx P(a≤ X≤ b) =

(35)

✓ ✏

X f(x) f(x) X

(1) f(x)0

(2) x y=f(x) 1 (3) P(a X b)

✒ ✑

6.7

連続型確率変数の期待値

:

✓ ✏

X f(x) X E(X)

E(X) =

∫ ∞

−∞

xf(x)dx (6.5)

✒ ✑

X [L, R] f(x) [L, R] 0

X

E(X) =

∫ R

L

xf(x)dx (6.6)

x x

X µ X

V(X) = E[(Xµ)2)] =

∫ ∞

−∞

(xµ)2f(x)dx (6.7)

✓ ✏

V(X) = E(X2)[E(X)]2

✒ ✑

6.8

一様分布

a, b a < b

f(x) =

{

1

b−a a≤x≤b

(36)

例 6.3.

X X 0 360 [0, 360]

6.9

正規分布

正規分布の定義

✓ ✏

f(x)

f

(

x

) =

1

2

πσ

e

−1 2

(

x−µ

σ

)

2

(6.8)

, 正規分布(normal distribution) N(µ, σ2)

✒ ✑

X (6.8)

E(X) = µ (6.9)

V(X) = σ2 (6.10)

2 N(µ, σ2) 平均µ, 分散σ2 の正規分布

0, 1 N(0,1) 標準正規分布 X

(6.8) X µ σ2 , X N(µ, σ2)

-4 -3 -2 -1 0 1 2 3 4

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

µ+σ

N (

µ

,

σ

2

)

µ µ+2 σ µ+3 σ

µ-3 σ µ-2 σ µ-σ x

6.4: N(µ, σ2)

(37)

N(µ, σ2) f(x)

✓ ✏

(i)f(x) µ

(ii) 2 (µ−σ, f(µ−σ)) (µ+σ, f(µ+σ))

(iii) [µ3σ, µ+ 3σ] ,

P(µ−σ ≦X≦µ+σ) = 0.683

P(µ−2σ≦X ≦µ+ 2σ) = 0.955

P(µ−3σ≦X ≦µ+ 3σ) = 0.997

(iv)f(x) x=µ √1

2πσ

✒ ✑

-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

N(0, 1) N(4, 1)

N(0, 4)

6.5:

2

(1)

(38)

正規分布の確率密度関数の x=µ における高さ µ, σ2

f

(

x

) =

1

2

πσ

e

−1 2

(

x−µ

σ

)

2

(6.11)

x=µ f(x) x=µ

f(µ) = √1

2πσ (6.12)

N(µ, σ2) x=µ 1

2πσ

1

2π ≒0.4 (6.13)

N(µ, σ2) 0.4 σ

定理 6.3 ( 1). a, b

X N(µ, σ2)

aX+b∼N(aµ+b, a2σ2)

Xµ

σ ∼N(0,1)

Z = X−µ

σ X 標準化 X

(39)

付録

(6.9) z = (x−µ)/σ

E(X) =

∫ ∞

−∞

x√1

2πσe

−12(

x−µ

σ ) 2 = ∫ ∞ −∞ 1 √

2πσ(σz+µ)e

−12z 2 σdz = ∫ ∞ −∞ 1 √

2πze

−12z 2 dz+ ∫ ∞ −∞ 1 √

2πµe

−12z 2 dz =µ ∫ ∞ −∞ 1 √

2πze

−12z 2

dz = 0

( )

∫ ∞

−∞ 1

2πe

−12z 2

dz = 1

(6.10)

Z = (Xµ)/σ) Z N(0,1) Z V(Z)

V(Z) = E(Z2) =

∫ ∞

−∞

z2√1

2πσe

−12(

z−µ

σ )

2

dz

=

[

−z√1

2πσe

−12(

z−µ

σ )

2]∞

−∞ +

∫ ∞

−∞

z2√1

2πσe

−12(

z−µ

σ )

2

dz

=0 + 1 = 1

σZ+µ N(µ, σ) X =µ+σZ V(X) =σ2.

6.3

F(x) =P(X x) X 分布関数

X N(µ, σ2) X t= (sb)/a

a >0

P(aX+b≤x) =P(X ≤(x−b)/a) (6.14)

=

∫ (x−b)/a −∞

1

2πσe

−12(

t−µ

σ ) 2 dt (6.15) = ∫ x −∞ 1 √

2πσae

−12(

s−aµ−b

aσ )

2

ds (6.16)

(40)

6.9.1

上側確率,上側パーセント点

X

P(X > u) (6.17)

(6.17) 上側確率

1 u u

u

u= 0.55 , .5 .05

0.291 Z N(0,1)

P(Z >0.55) = 0.291 (6.18)

α 上側100αパーセント点

100α zα

2.5 0.5 1.96, 2.58 X a P(X =a) = 0

(41)

6.10

正規分布についての確率の求め方

1

例題 6.2. Z N(0,1) (1) P(Z >1)

(2) P(Z >1.96) (3) P(Z ≦1)

解答

(1) u= 1.00 P(Z >1) = 0.159 .

(2) P(Z >1.96) = 0.025 .

(3) P(Z ≦ 1) = 1 −P(Z > 1) P(Z > 1) = 0.159 P(Z ≦ 1) = 10.159 = 0.841

6.3

例題 6.3. X N(50,100) (1) P(X >60)

(2) P(X ≦60) (3) P(X ≦70)

解答 (1)

P(X >60) =P (

X50

10 >

6050 10

)

=P (

X50

10 >1

)

= 0.159

(X−50)/10

(2) (1) P(X ≦60) = 1P(X >60) = 10.159 = 0.841 (3)

P(X ≦70) =P (

X−50

10 ≦

70−50 10

)

=P (

X−50

10 ≦2

)

= 1−P (

X−50

10 ≥2

)

(42)

7

章 多次元の確率分布

7.1

同時確率分布と周辺確率分布

2 X Y . X x1, x2,· · · , xk,

Y y1, y2,· · · , yℓ . ,

p(xi, yj) = P(X =xi, Y =yj), i= 1,· · · , k, j = 1,· · · , ℓ

X Y . 2 p(·,·) X Y 同

時確率関数 同時確率分布 .

p(·,·) yj p(xi, yj) X

X 周辺確率分布 p1(xi) p1(xi) = ∑ℓj=1p(xi, yj)

p1(x1), . . . p1(xk) X ∑ki=1p1(xi) = 1

p2(yj) p2(yj) = ∑ki=1p(xi, yj) p2(y1), . . . p2(yℓ) Y

∑ℓ

j=1p2(yj) = 1

例 7.1. X

Y X Y

解答 36

1/36

X Y

1 2 3 4 5 6

1 361 361 361 361 361 361 16 2 361 361 361 361 361 361 16 Y 3 1

36 1 36 1 36 1 36 1 36 1 36 1 6

4 361 361 361 361 361 361 16 5 1 36 1 36 1 36 1 36 1 36 1 36 1 6 6 1 36 1 36 1 36 1 36 1 36 1 36 1 6 X 1 6 1 6 1 6 1 6 1 6 1 6

例 7.2. X

(43)

X Y 1 2 3 4 5 6

0 1 36 1 36 1 36 1 36 1 36 1 36 6 36

1 361 362 362 362 362 361 1036 Y 2 361 361 362 362 361 361 368

3 1 36 1 36 1 36 1 36 1 36 1 36 6 36

4 361 361 0 0 361 361 364 5 361 0 0 0 0 361 362 X 16 16 16 16 16 16

7.2

期待値

g(x, y) 2 X, Y g(X, Y)

g(X, Y) g(X, Y)

✓ ✏

E[g(X, Y)] = k ∑ i=1 ℓ ∑ j=1

g(xi, yj)p(xi, yj)

✒ ✑

7.2.1

共分散

, µX E(X) , µY E(Y) . 2 X Y 共 分散(covariance) Cov(X, Y)

Cov(X, Y) =E[(XµX)(Y −µY)] = k ∑ i=1 ℓ ∑ j=1

(xi−µX)(yj−µY)P(X =xi, Y =yj)

. Cov(X, Y) X Y . X Y

,

. , X Y ,

. .

Cov(X, Y) = E(XY)E(X)E(Y) (7.1)

7.3

連続型確率変数の場合

1

X, Y

2 f(x, y) a, b, c, d(a < b, c < d)

P(aX b, cY d) =

∫ b

a

∫ d

c

(44)

f(x, y) (X, Y) 同時確率密度関数 2 3

x1

x2

z

7.1: f(x, y)

7.4

確率変数の独立性

X Y ab, cd

P(aX b, cY d) =P(aX b)×P(cY d) (7.3)

X Y

X Y ,

.

2 X, Y ,xi (i= 1,· · ·, k),yj (j = 1,· · ·ℓ)

. , i= 1,· · ·, k, j = 1,· · · , ℓ ,

P(X =xi, Y =yj) =P(X =xi)×P(Y =yj)

,X Y

2 X,Y , f(x), g(y) . ,

x y , X, Y f(x, y)

f(x, y) = f(x)g(y)

,X Y

2

(45)

7.5

期待値の性質

定理 7.1. [ ] 2 X, Y

(1) E(X+Y) = E(X) + E(Y)

(2) V(X+Y) = V(X) + 2×Cov(X, Y) + V(Y)

. X Y .

(3) E(XY) = E(X)E(Y) (4) Cov(X, Y) = 0

(5) V(X+Y) = V(X) + V(Y)

(1), (2) X Y .

問題 7.1. A B A X, B

Y (X, Y) A 1

B 2 0.14

X Y 0 1 2 3

0 0.06 0.08 0.04 0.02 1 0.15 0.20 0.10 0.05 Y 2 0.10 0.14 0.05 0.01 3 0 0 0 0 X

(1) X Y

(2) A B A

問題 7.2. A B 200m A B

1 2 200m A B 100m ( )

(46)

定理7.1の証明

(1)の証明 E(X+Y)

= k ∑ i=1 ℓ ∑ j=1

(xi+yj)p(xi, yj)

= k ∑ i=1 ℓ ∑ j=1

xip(xi, yj) + k ∑ i=1 ℓ ∑ j=1

yjp(xi, yj)

= k ∑ i=1 xi ℓ ∑ j=1

p(xi, yj) + ℓ ∑ j=1 yj k ∑ i=1

p(xi, yj)

= k

i=1

xip1(xi) + ℓ

j=1

yjp2(yj) =E(X) + E(Y)

(2)の証明 V(X+Y)

=E[{(X+Y)E(X+Y)}2] =E[{(XE(X)) + (Y E(Y))}2]

=E[{XE(X)}2]+ 2E [{XE(X)} {Y E(Y)}] + E[{XE(X)}2] =V(X) + 2Cov(X, Y) + V(Y)

(3)の証明 E(XY) = k ∑ i=1 ℓ ∑ j=1

xiyjP(X =xi, Y =yj)

= k ∑ i=1 ℓ ∑ j=1

xiyjP(X =xi)P(Y =yj) X Y

= k

i=1

xiP(X =xi) ℓ

j=1

yjP(Y =yj)

=E(X)E(Y) ✷

(4)の証明

Cov(X, Y) =E [(XµX)(Y −µY)] =E [(XµX)] E [(Y −µY)]

(47)

X a,b aX+b

aX+b

✓ ✏

(a) E(aX+b) =aE(X) +b

(b) V(aX +b) =a2V(X)

✒ ✑

証明(a) 29

(b) µ=E(X) E(aX+b) =aµ+b

V(aX +b) = E[(aX +b(aµ+b))2] = E(a2(Xµ)2) = a2E((Xµ)2) = a2V(X) ✷

7.1 n X1, X2, . . . , Xn

(a) E(X1+X2+· · ·+Xn) = E(X1) + E(X2) +· · ·+ E(Xn)

(b) n X1, X2· · ·, Xn ,

V(X1+X2+· · ·+Xn) = V(X1) + V(X2) +· · ·+ V(Xn)

✓ ✏

n X1, X2· · · , Xn µ σ2

E

( n

i=1

Xi

)

=nµ

V

( n

i=1

Xi

)

=nσ2

✒ ✑

¯

X = 1

n

∑n

i=1Xi aX+b

✓ ✏

n X1, X2· · · , Xn µ σ2

E(X¯)=µ

V(X¯)=σ

2

n

✒ ✑

例 7.3.

n

X1, X2· · · , Xn E(Xi) = 60(g), V(Xi) = 1(g2)

(48)

7.6

確率変数の和の確率分布

2

1 2 3 4 5 6 1/6

7.1

2 3 4 5 6 7 8 9 10 11 12 1/36

7.2 2

生性3

✓ ✏

定理 7.2 ( ). X1, X2 X1

N(µ1, σ12) X2 N(µ2, σ22)

X1+X2 ∼N(µ1+µ2, σ12+σ22)

✒ ✑

7.2

n X1, X2, . . . , Xn

Xi ∼N(µ, σ2), i= 1,2, . . . , n

n

i=1

Xi ∼N

(

nµ, nσ2)

✓ ✏

定理 7.3. n X1, X2, . . . , Xn

Xi ∼N(µ, σ2), i = 1,2, . . . , n

¯

X = 1

n

n

i=1

Xi ∼N

( µ,σ

2

n )

✒ ✑

7.3

3

(49)

8

章 統計的推測

8.1

母集団と標本

母集団 (i)

(ii) (iii)

統計的推測

8.1.1

標本

(

サンプル

)

標本抽出, サンプリング

無作為標本

標本の大きさ n

推定

点推定 区間推定 2

点推定量 推定量

点推定値 推定値

8.1.2

有限母集団の場合

N

(50)

例 8.1. 1 2012 11

n = 1272 0.173

母比率の推定

p p 母比率

p n

X

ˆ

p= X

n

ˆ

p p

8.1:

p

X B(n, p) n X−np

np(1−p)

N(0, 1) 2.5%

1.96 2

P {

−1.96 √X−np

np(1p) ≤1.96

}

≒0.95

1

45 1 434

2

(51)

P {

−1.96× √

p(1−p)

n ≤pˆ−p≤1.96×

p(1−p)

n }

≒0.95

n pˆ p √ p pˆ

P {

ˆ

p−1.96× √

ˆ

p(1pˆ)

n ≤p≤pˆ+ 1.96×

ˆ

p(1pˆ)

n }

≒0.95

p

信頼係数95%の信頼区間

✓ ✏

n

[

ˆ

p1.96

ˆ

p(1pˆ)

n , pˆ+ 1.96

ˆ

p(1pˆ)

n ]

95% p

✒ ✑

8.1

1.96×

ˆ

p(1pˆ)

n = 1.96×

0.173(10.173)

1272 = 0.0208

p 95%

(52)

8.1.3

無限母集団の場合

無限母集団

無限母集団の例

1. 50 20

2. 100m

8.1.4

母集団と母集団分布

例 8.2. A 100m

A 1 100m 10

100m

100 10

100m 100m

10 15

母集団分布

✓ ✏

n X1, X2, . . . , Xn n

{X1, X2, . . . , Xn}

✒ ✑

8.1.5

母集団分布のパラメータ

パラメータ 母数

N(µ, σ2) µ, σ2 母平均

(53)

8.2

パラメータと統計量

8.2.1

統計量

統計量

8.2.2

統計的推測の方法

N(µ, σ2)

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

x

...

µ,σ2

X1, X2, . . . , Xn

, ¯X

, s2

8.2:

( )

• · · ·

• · · ·

• · · ·

: 点推定 推

8.2.3

推定量と推定値

X1, X2, . . . , Xn 推定量

¯

X µ s2 σ2

n 3 x

1, x2, . . . , xn 推定値

✓ ✏

θ T θ

E(T) = θ

T θ

(54)

µ σ2

¯

X = 1

n

n

i=1

Xi (8.1)

s2 = 1

n−1

n

i=1

(Xi−X¯)2 (8.2)

s2

µ 7.5 E( ¯X) = µ

¯

X µ

定理 8.1. X1, X2, . . . , Xn n E(Xi) =

µ, V(Xi) =σ2, i= 1,2, . . . , n

E(s2) = σ2 (8.3)

証明 Yi =Xi−µ, i= 1,2, . . . , n Y¯ = ¯X−µ

n

i=1

(Xi−X¯)2 = n

i=1

(Yi−Y¯)2

= n

i=1

Yi2nY¯2

E(Y2

i ) = V ar(Yi) =σ2,E( ¯Y2) = V ar( ¯Y) =

σ2 n E { n ∑ i=1

(Xi−X¯)2

}

= E

( n

i=1

Yi2 −nY¯2

) = E ( n ∑ i=1 Y2 i )

−E(nY¯2)

= nσ2σ2

= (n1)σ2

E(s2) = E

{

1

n1

n

i=1

(Xi−X¯)2

}

= σ2 ✷

E( ¯X) =µ, E(s2) =σ2 X¯ µの不偏推定量

s2 σ2 の不偏推定量

例題 8.1.

(55)

9

章 正規母集団からの標本と関連する

分布

2 χ2 2 t

9.1

χ

2

分布

χ2

✓ ✏

Z1, Z2,· · ·, Zk N(0,1)

Y

Y =Z12+Z22+· · ·+Zk2

Y 自由度k χ2 分布 χ2(k)

✒ ✑

χ2(1) 57

1

9.2

t

分布

t

✓ ✏

Z N(0,1) Y k χ2 χ2(k)

Z Y t

t= √Z

Y /k

t 自由度k の t 分布 t(k)

✒ ✑

t 分布の特徴

(1) t 0 .

(2) k t N(0,1) .

(3) k t . , k → ∞ t

N(0,1) .

1

χ2

(56)

0 2 4 6 8 10 12 14 16 18 20 0

0.1 0.2 0.3 0.4 0.5 0.6 0.7

x

f(x)

k=1

k=2

k=3

k=10

9.1: k χ2

付録:

χ

2

(1)

の確率密度関数

準備:

✓ ✏

F(x) X 分布関数

F(x) =P(X x)

✒ ✑

X f(x)

F(x) =P(X ≤x) =

∫ x

−∞

f(t)dt

F′(x) =f(x).

Z N(0, 1) Y =Z2 Z

f(x) = 1

2π exp{−x

2/2} F(x) Y G(y)

y >0

(57)

-4 -3 -2 -1 0 1 2 3 4 0

0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

x

f(x)

N ( 0, 1 )

t ( 5 )

t ( 1 )

9.2: k t

Y g(y) G

g(y) = d

dyG(y) = d dy {F(

y)−F(−√y)}

= 1 2√y{f(

y)

−f(√y)}

= 1

2√y ×2×

1

2πe

−y/2

=√1

2πy

−1/2e−y/2.

χ2(1)

g(y) = √1

2πy

(58)

9.3

同一の正規分布に従う確率変数

X1, X2,· · · , Xn n

X1, X2,· · · , Xn N(µ, σ2)

¯

X = 1

n

n

i=1

Xi

2

n

i=1

(

Xi−X¯

)2

X1, X2,· · · , Xn N(µ, σ2)

∑n

i=1(Xi−µ)2

σ2 =

n

i=1

(

Xi−µ

σ2

)2

χ2 n χ2 µ X¯

✓ ✏

定理 9.1. X1, X2,· · · , Xn N(µ, σ2)

¯

X

n

i=1

(

Xi−X¯

)2

n

i=1

(

Xi−X¯

)2

σ2

n1 χ2

(59)

✓ ✏

定理 9.2. X1, X2,· · · , Xn N(µ, σ2)

¯

X−µ

s/√n

n1 t

✒ ✑

証明.

¯

X−µ

s/√n =

¯

X−µ

σ/√n ·

1

s/σ

=X¯ −µ

σ/√n ·

1

√ s22

=X¯ −µ

σ/√n ·

1

∑n

i=1(Xi −X¯)2

σ2 ·

1

n−1

(9.1)

9.1 (9.1) t

¯

X−µ

s/√n

n1 t

k t α tα(k)

(60)
(61)

9.4

母平均の信頼区間

µ σ2

信頼区間 µ

X1, X2,· · · , Xn N(µ, σ2)

9.2

¯

X−µ

s/√n

n1 t

0.95 =P (

−t0.025(n−1)≤

¯

X−µ

s/√n ≤t0.025(n−1) )

=P (

¯

Xt0.025(n−1)×

s √

n ≤µ≤X¯ +t0.025(n−1)× s √ n

)

¯

x,s2

✓ ✏

[

¯

x−t0.025(n−1)×

s √

n, x¯+t0.025(n−1)× s √ n

]

95% µ

✒ ✑

練習問題

問題1

(1) t0.025(8)

(2) t0.025(15)

例題

A 1000m 9 9 ¯

x= 180.0 s= 0.9 N(µ, σ2)

(62)

10

章 仮説検定

10.1

母平均の検定

仮説検定

23.1cm 23.1cm

16 x¯= 23.2 ( ) s= 0.16

23.1

X1, X2, . . . , X16 16

N(µ, σ2)

帰無仮説 H0

H0 :µ= 23.1

対立仮説 H1

H1 :µ̸= 23.1

,

t= X¯ −23.1

s/√16 ∼t(15) (10.1)

15 t t(15) 2.5% 2.131

P {

¯

X23.1

s/√16

>2.131

}

= 0.05 (10.2)

H0 t 2.131

t |t|>2.131 H0

(63)

帰無仮説を棄却する t = x¯−23.1

s/√16 =

0.1 0.16/4 =

0.1

0.04 = 2.5 |t|>2.131 H0 :µ= 23.1

10.1.1

有意水準

|t|>2.131 棄却域

|t|>2.131 帰無仮説は棄却される −2.131≤t ≤2.131

帰無仮説は棄却されない 0.05

0.05 0.01

有意水準 α

有意水準 αの検定

10.1.2

母平均の検定:一般的な説明

X1, X2, . . . , Xn N(µ, σ2)

µ µ0

H0 :µ=µ0

H1 :µ̸=µ0

α

✓ ✏

H0 :µ=µ0 H1 :µ̸=µ0

t= x¯−µ0

s/√n (10.3)

|t|> tα/2(n−1) H0

|t| ≤tα/2(n−1) H0

✒ ✑

練習問題18

300ml

9 x¯= 298.4

s = 2.4 H0 : µ= 300 H1 :µ̸= 300

(64)

10.1.3

母平均の検定:片側検定

10 25

TOEIC ¯

x= 5 s= 6 TOEIC

X1, X2, . . . , X25 25 TOEIC N(µ, σ2)

H0 :µ≤0

H1 :µ >0

片側対立仮説 24 t

5% 1.711

¯

x

s/√25 >1.711 (10.4)

¯

x

s/√25 =

5

6/5/≒4.17 4.17>1.711

α µ0

✓ ✏

H0 :µ≤µ0 H1 :µ > µ0

t= x¯−µ0

s/√n (10.5)

t > tα(n−1) H0

ttα(n−1) H0

✒ ✑

H0 :µ≥µ0 H1 :µ < µ0

(65)

2種類の誤り

(a)

第1種の誤り Type 1 error

(b)

第2種の誤り Type 2 error

1 α

1 (α) H0

H1 2

µ 帰無仮説が棄

却されないことは、標本が帰無仮説と(統計的に)矛盾しないことを意味するのであって、帰 無仮説が積極的に支持されるわけではない。

10.1: W. S. Gosset ( , 1876-1937). Guiness brewery

(66)

10.1.4

P

61

X1, . . . , Xn

H0 :µ= 23.1 v.s. H1 :µ̸= 23.1

61 t= x¯−23.1

s/√16 =

0.1 0.16/4 =

0.1

0.04 = 2.5

¯

X23.1

s/√16

t = 2.5 0.025 1

P

P

✓ ✏

N(µ, σ2)

H0 :µ=µ0 v.s. H1 :µ̸=µ0

X1, . . . , Xn

t

P (

¯

Xµ0

s/√n > t

)

P値

P < α α

✒ ✑

1

(67)

10.2

発展:回帰分析における仮説検定

2

4 2

yi,xi i yi

yi =α+βxi+ui, i= 1,2, . . . , n (10.6)

ui, i = 1,2, . . . , n N(0, σ2) ui

α,β

(xi, yi), i= 1, . . . , n 2 βˆ β 2

ˆ

β

ˆ

β−β

σβˆ ∼

N(0, 1) (10.7)

σβˆ βˆ

σβˆ =

σ

n

i=1

(xi−x¯)2

(10.8)

(10.7) σβˆ

σ2 e

1, . . . , en ˆ

σ2 = 1

n2

n

i=1

e2i (10.9)

ˆ

σ2 βˆ

se( ˆβ) = √ n σˆ ∑

i=1

(xi−x¯)2

(10.10)

ˆ

β 標準誤差(standard error)

✓ ✏

ˆ

ββ

se( ˆβ) ∼t(n−2) (10.11)

✒ ✑

t(n2) n2 t β

(68)

10.2.1

β

についての仮説検定

H0 :β = 0 (10.12)

H1 :β ̸= 0

ˆ

β

se( ˆβ) (10.13)

(10.12)

t t t

|t|> tα/2(n−2) (10.14)

α H0 (10.14) H0

参照

関連したドキュメント

2017年度 2018年度 2019年度 2020年度 第一庁舎、第二庁舎、議会棟の合計 188,600 156,040 160,850

今年度第3期最終年である合志市地域福祉計画・活動計画の方針に基づき、地域共生社会の実現、及び

部長 笹本弘美 2016

2014年度 2015年度 2016年度 2017年度 2018年度 2019年度 2020年度

2014年度 2015年度 2016年度 2017年度 2018年度 2019年度 2020年度

2014年度 2015年度 2016年度 2017年度 2018年度 2019年度 2020年度

2014年度 2015年度 2016年度 2017年度 2018年度 2019年度 2020年度

2014年度 2015年度 2016年度 2017年度 2018年度 2019年度 2020年度