2016
2016
12
9
junichiro.fukuchi@gakushuin.ac.jp
第
1
章 統計学とは何か
1.1
データの種類
1.1.1
測定の尺度による分類
Stevens 4
1
名義尺度
順序尺度
5 1,2,3,4,5
間隔尺度
4 18 9 00 比率尺度
1.1.2
データの計測形態に着目する分類
時系 列データ
クロスセクションデータ 空間データ
時系列データの例 :
クロスセクションデータの例 : GDP
1
第
2
章
1
変数データ分析
1
2.1
ヒストグラム
1 2.1
2010 7 2011 2 1 ヒストグラム
階級 階級幅 度数
Histogram of Nikkei$return
Nikkei$return
Frequency
−0.04 −0.03 −0.02 −0.01 0.00 0.01 0.02 0.03
0
5
10
15
20
25
30
2.1:
100 右に歪んだ分布
左に歪んだ分布
Histogram of kouji_23ku$kakaku
kouji_23ku$kakaku
Frequency
0 500000 1000000 2000000 3000000
0
50
100
150
200
250
x1, x2, . . . , xn
✓ ✏
n
∑
i=1
xi =x1+x2+· · ·+xn
✒ n ✑
∑
i=1
xi i 1,2, . . . , n xi
a
n
∑
i=1
a=a+a+· · ·+a
| {z }
n =na ✓ ✏ (1) n ∑ i=1
(xi +yi) = n
∑
i=1
xi+ n ∑ i=1 yi (2) n ∑ i=1
axi =a n
∑
i=1
xi
✒ ✑
問題1
問題2 (1) (2)
問題3
n
∑
i=1
(axi+byi) = a n
∑
i=1
xi+b n
∑
i=1
yi
2.2
データの代表値−平均、メディアン−
1 代表値
2.2.1
平均
x1, x2. . . . , xn 平均
¯
x= 1
n
n
∑
i=1
xi
平均の性質1
n
∑
i=1
(xi−x¯) = 0
平均の性質2
外れ値
例 2.1.
330,280,230,240,390,290,340,1580
¯
x= 460 8 7 460
1 1580
2.2.2
メディアン
メディアン(中央値)
x(1) < x(2) <· · ·< x(n)
M d=
{ x(n+1
2 ) n ,
1 2
{
x(n/2)+x(n/2+1)
}
n .
2.2.3
モード
モード,メディアン,平均の関係
単峰型 双峰型
< < 2
< <
2.3 23
350 427 528
2.3
四分位数
2 2
第1四分位数 2
第3四分位数 第2四分位数 四分位数
2.4
箱ひげ図
箱ひげ図
2.4:
sapporo
naha
toky
o
−10 0 10 20 30
2.5
データのばらつきの尺度
2.5.1
範囲,四分位範囲
範囲(レンジ)
四分位範囲
= 3 − 1
2.5.2
分散,標準偏差
偏差
= − =xi−x¯
分散
Sx2 =1
n {
(x1−x¯)2+ (x2−x¯)2+· · ·+ (xn−x¯)2
}
= 1
n
n
∑
i=1
(xi−x¯)2 (2.1)
(xi−x¯)2 xi x¯
Sx =
√ S2
x
2.5.3
平均の性質(続き)
(1) x1, x2, . . . , xn a x1+a, x2+a, . . . , xn+a
¯
x+a
(2) x1, x2, . . . , xn b bx1, bx2, . . . , bxn bx¯
(3) x1, x2, . . . , xn b a bx1+a, bx2+a, . . . , bxn+
a bx¯+a
2.5.4
分散と標準偏差の性質
S2
x x1, x2, . . . , xn Sx
(1) x1, x2, . . . , xn a x1+a, x2+a, . . . , xn+a
S2
x Sx
(2) x1, x2, . . . , xn b bx1, bx2, . . . , bxn b2Sx2
|b|Sx
(3) x1, x2, . . . , xn b a bx1+a, bx2+a, . . . , bxn+
a b2S2
x |b|Sx
✓ ✏
x1, x2, . . . , xn a+bxi,i= 1,2, . . . , n
a+bx1, a+bx2, . . . , a+bxn
: a+bx¯ : b2Sx2
: |b|Sx
✒ ✑
✓ ✏
zi =
xi−x¯
Sx
i= 1,2, . . . , n (2.2)
標準化 基準化 標準化得点
z1, z2, . . . , zn z¯, Sz2,Sz ¯
z =0
S2
z =1
Sz =1
問題
A B C D E 85, 86, 87, 88, 89
解答 87
−2, −1, 0, 1, 2
2
4 + 1 + 0 + 1 + 4 = 10
Sx2 = 10 5 = 2
Sx=
√
2≒1.4142
−2/√2, −1/√2, −0/√2, 1/√2, 2/√2
≒−1.414, −0.707, 0 0.707, 1.414
偏差値
10 50
xi = 50 + 10×
xi−x¯
Sx
第
3
章
2
変数データの分析
3.1
散布図
2 散布図
2
( )
20 40 60 80 100 120
5
10
15
20
25
area
yachin
3.1:
3.1 203
正の相関関係
3.2: 19
3.2 19
無相関
3.2
2
変数データの直線的関係の尺度−共分散,相関係数−
共分散
✓ ✏
x y (x1, y1), . . . ,(xn, yn) x y
Sxy =
1
n{(x1−x¯)(y1−y¯) +· · ·+ (xn−x¯)(yn−y¯)}=
1
n
n
∑
i=1
(xi−x¯)(yi−y¯) (3.1)
✒ ✑
✓ ✏
x, y
r= Sxy
SxSy
(3.2)
x y 相関係数(correlation coefficient)
✒ ✑
r
r=
n
∑
i=1
(xi−x¯)(yi−y¯)
v u u t
n
∑
i=1
(xi−x¯)2 n
∑
i=1
(yi−y¯)2
(3.3)
r (3.3)
( )
✓ ✏
(i) −1≤r≤1 a
(ii) r
r 1
(iii) r
r −1
(iv) r 0
a
49
✒ ✑
3.3 1
3.3:
(v) 1 r 1
(vi) 1 r −1
(v)
3.3
相関関係と因果関係
相関関係 因果関係
2
1
3.3
3.4
見かけ上の相関
3.4 47
3.4: 47
見かけ上の相関
3.5
第
4
章 回帰分析
4.1
単回帰分析
2
3.1
yachin =a+b×area
area yachin
被説明変数 説明変数 最小2乗法
a b a,b
\
yachin = 3.1553 + 0.2118×area (4.1)
(4.1) 回帰式
20 40 60 80 100 120
5
10
15
20
25
area
yachin
回帰式のあてはめ
4.1
回帰分析
y x y x
y=a+bx (4.2)
最小2乗法
4.2
最小
2
乗法
( x
i
, y
i
)
a + b x
x
i
y
i
x y
a+bx
i
4.2: 2
x−y y =a+bx a, b (xi, yi)
y=a+bx (xi, a+bxi)
2 yi−a−bxi y =a+bx (x1, y1),(x2, y2), . . . ,(xn, yn)
yi 2
S(a, b) = n
∑
i=1
(yi−a−bxi)2
S(a, b) a, b 最小2乗法
S(a, b) a, b 1
b =
n
∑
i=1
(xi−x¯)(yi−y¯)
n
∑
i=1
(xi−x¯)2
(4.3)
(4.3) ,(4.4) a, b y=a+bx 回帰式
y
ˆ
y=a+bx
例題
5 (
) 2.
xi yi
24 17 25 19 26 20 27 21 28 23
a, b
xi yi (xi−x¯) (yi−y¯) (xi−x¯)2 (xi−x¯)(yi−y¯) 24 17 -2 -3 4 6 25 19 -1 -1 1 1 26 20 0 0 0 0 27 21 1 1 1 1 28 23 2 3 4 6 0 0 10 14
¯
x=26, y¯= 20
b =14
10 = 1.4, a= 20−1.4×26 =−16.4
a, b
ˆ
y=a+bx
回帰式 回帰直線 .
ˆ
y=−16.4 + 1.4x
1 1.4
2
4.3
決定係数
2
y=a+bx (4.5)
xi y yˆi
ˆ
yi =a+bxi, ı = 1,2, . . . , n.
ˆ
yi yi 回帰値 yi yˆi
yi yˆi
ei =yi−yˆi, i= 1,2, . . . , n (4.6)
残差 (4.6)
yi = ˆyi+ei (4.7)
ˆ
yi yi ei
(4.7) y¯
yi−y¯= (ˆyi−y¯) +ei (4.8)
(4.8) 2 i
n
∑
i=1
(yi−y¯)2
| {z }
yi
= n
∑
i=1
(ˆyi−y¯)2
| {z }
ˆ yi + n ∑ i=1
e2i | {z }
(4.9)
(4.9) y1, y2, . . . , yn
yi yˆi
R2 =
n
∑
i=1
(ˆyi−y¯)2 n
∑
i=1
(yi−y¯)2
(4.10)
R2 決定係数 y
i yˆi
yi (4.9)
0≦R2 ≦1
4.4
回帰分析の名前の由来
Galton (1822-1911) (regression) 4.3 2
2 Galton
1cm 1cm
Galton 回帰(regression)
150 155 160 165 170
150
155
160
165
170
twodimrn$x
tw
odimr
n$y
第
5
章 確率
5.1
準備:順列と組合せ
例 5.1. a b c d 4
4 2 3 3 2 4×3×2 = 24 24
例 5.2. a b c d 2
4 2 3 4×3 = 12 12
n r n r 順列
nPr nPr
nPr =n(n−1)· · ·(n−r+ 1) =
n!
(n−r)! (5.1)
n! n! = n(n−1)· · ·2·1 n 階乗
例 5.3. 2
2
ab, ac, ad, bc, bd, cd
6 (4×3)/2 = 6
n r n r 組合せ
nCr n r nPr
1 r r!
nPr r! nCr
nCr= n
Pr
r! =
n!
5.2
標本空間と事象
試行
1 Ω( )
Ω ={1,2,3,4,5,6}
標本空間 Ω
事象(event)
A ={1,2} 1 2 {1,2}, {2,4,6}
1 , Ω
{1}, {2}, {3}, {4}, {5}, {6}
根元事象
∅ 空事象
例 5.4. 2 .
Ω = {(H, H), (H, T), (T, H), (T, T)}
, (H, T) 1 (Head) , 2 (Tail)
{(H, H)}, {(H, T)}, {(T, H)}, {(T, T)}
{(H, H)}, {(H, H),(H, T)}
問題 5.1. 5.4 {(H, H)}, {(H, H),(H, T)}
, .
和事象A∪B A B
積事象A∩B A B
A∩B , A B 互いに排反 , . A B
A B
5.3
確率
0 1 .
2 .
5.3.1
等可能性の原理による確率の定義
, , A
P(A)
P(A) = #A
#Ω
, #A A .
5.3.2
頻度に基づく確率の定義
.
2 2
1
P(·) 3
✓ ✏
(C1) A 0≤P(A)≤1
(C2) Ω P(Ω) = 1, ∅ P(∅) = 0 (C3) A B P(A∪B) =P(A) +P(B)
✒ ✑
5.3.3
主観確率
5.3.4
確率の性質
, , .
✓ ✏
(a)P(Ac) = 1−P(A)
(b) A⊂B P(A)≤P(B)
(c) A, B P(A∪B) =P(A) +P(B)−P(A∩B)
(d)A1, A2,· · · , An ,
P(A1∪A2∪ · · · ∪An) =P(A1) +P(A2) +· · ·+P(An).
✒ ✑
問題 5.2. 2 4
問題 5.3. 13 5
5
(1) 1, 2, 3, 4, 5
(2) 5 13
(1)
1
13C5
= 5!8! 13! =
5·4·3·2·1 13·12·11·10·9 =
1 13·11·9
(2)
12C4 13C5
= 12! 4!8! ·
5!8! 13! =
5.4
条件付き確率と乗法定理
5.4.1
条件付き確率
2 1 1 2
1 A, 2 B
A B A
1 1 B 1/2
A B
A A
B A∩B P(A∩B)
P(A) P(A) = 2/3, P(A∩B) = 1/3
P(A∩B)
P(A) =
1/3 2/3 =
1 2
✓ ✏
定義 5.1. A,B P(A)>0
事象Aが起こったときの事象Bの条件付き確率 P(B|A)
P(B|A) = P(A∩B)
P(A) (5.3)
✒ ✑
5.4.2
乗法公式
✓ ✏
乗法公式
P(A∩B) = P(A)×P(B |A) (5.4)
.
✒ ✑
A, B
A ={A∩B} ∪ {A∩Bc} (5.5)
{A∩B} {A∩Bc}
解答 : A,
B 2
10
P(A ∩ B) = P(A)P(B|A) = 2
10 × 1 9
P(A∩Bc) = P(Bc)P(A|Bc) = 8 10 ×
2
9 2 B
P(A) = P(A∩B) +P(A∩Bc)
= 2 10 ×
1 9 +
8 10 ×
2 9
= 2 90 +
16 90 =
18 90 =
2 10
5.5
独立性
✓ ✏
定義 5.2. 事象の独立性
2 A, B
P(A∩B) = P(A)P(B)
, A B 独立 .
✒ ✑
A B P(A)>0
P(B|A) =P(B) (5.6)
. (5.6) , A B
. A B , A, B
.
3 A, B, C P(A∩B) = P(A)P(B), P(A∩C) =P(A)P(C), P(B ∩C) =
P(B)P(C),P(A∩B∩C) =P(A)P(B)P(C) , A, B, C
. 4 .
モンティ・ホール問題
Let’s make a deal
1 3
第
6
章 確率変数
離散型確率変数 連続型確率変数
6.1
離散型の確率変数と確率分布
X X 1 6
1/6
X 1 2 3 4 5 6
1 6 1 6 1 6 1 6 1 6 1 6 X
x1, x2, . . . , xk
X
p1, p2, . . . , pk
X 離散型確率変数(random variable) pi =P(X =xi),
(i= 1,2, . . . , k) x1, x2, . . . , xk p1, p2, . . . , pk , X 確率分布
p1+p2+· · ·+pk= 1
Z Z Z
Z 2 3 4 5 6 7 8 9 10 11 12
1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36
Z = 2 (1,1)
1
36 Z = 3 (1,2), (2,1) 2
36
1 2 3 4 5 6 1/6
5.1
2 3 4 5 6 7 8 9 10 11 12 1/36
6.2
離散型確率分布の例
6.2.1
離散型一様分布
離散型一様分布 X n 1,2, . . . , n
P(X =k) = 1
n (k= 1,2, . . . , n)
6.2.2
二項分布
A A p n
n A X X 1,2, . . . , n
X
P(X =k) = nCkpk(1−p)n−k (k = 0,1, . . . , n)
二項分布(binomial distribution) B(n, p) X
B(n, p) X B(n, p) X ∼B(n, p)
n
∑
k=0
nCk pk(1−p)n−k= (p+ 1−p)n = 1
問題 6.1. 0.8
6.3
期待値(離散型確率変数)
X x1, x2, . . . , xk pi =P(X =xi)
E(X) = k
∑
i=1
xipi
X 期待値(expected value) X 確率分布の平均 X
.
例 6.1.
X B(n, p)
E(X) = n
∑
k=0
k×nCk pk(1−p)n−k
= n
∑
k=0
k n!
k!(n−k)! p
k(1−p)n−k
=np
n
∑
k=1
(n−1)!
(k−1)!{(n−1)−(k−1)}! p
k−1(1−p)(n−1)−(k−1)
=np
n−1
∑
s=0
(n−1)!
s!{(n−1)−s}! p
s(1−p)(n−1)−s
=np
B(n, p) np
n−1
∑
s=0
(n−1)!
s!{(n−1)−s}! p
s(1
−p)(n−1)−s= (p+ 1
−p)n−1 = 1
✓ ✏
n (a+b)n
(a+b)n= n
∑
k=0
nCk akbn−k
✒ ✑
6.3.1
確率変数の関数の期待値
X g g(X) X
x1, x2, . . . , xk pi = P(X =xi), i = 1, . . . , k Y = g(X)
Y g(x1), g(x2), . . . , g(xk)
Y ℓ y1, . . . , yℓ
Y =g(X) ,
E[g(X)] = ℓ
∑
. g(X) E[g(X)]
定理 6.1. X X x1, x2, . . . , xk
E[g(X)] = k
∑
i=1
g(xi)pi (6.1)
定理
6.1
を使って問題を解く
問題 6.2. X
(1) E(X) (2) E(X2)
解答 (1)
E(X) = 1× 1 6 + 2×
1 6+ 3×
1 6 + 4×
1 6 + 5×
1 6+ 6×
1 6 = 3.5 (2) 6.1
E(X2) =12× 1
6+ 2
2×1
6 + 3
2 ×1
6 + 4
2× 1
6 + 5
2× 1
6+ 6
2× 1
6
=1
6(1 + 4 + 9 + 16 + 25 + 36) = 15.17 2
✓ ✏
X c
(a) E(c) = c
(b) E(X+c) =E(X) +c
(c) E(cX) = cE(X)
(d) X, Y E(X+Y) = E(X) + E(Y)
✒ ✑
証明(a), (b), (c) (d) 7
分散
X 分散(variance)
V(X) = E[(X−E(X))2]
X µ= E(X) 1 g(x) = (x−µ)2
6.1 X
V(X) = k
∑
i=1
(xi−µ)2pi = (x1−µ)2p1 +· · ·+ (xk−µ)2pk (d)
1
定理 6.2. X
V(X) = E(X2)−[E(X)]2 (6.2) 証明 µ= E(X)
V(X) =E[(X−µ)2] =E[X2−2µX +µ2]
=E[X2]−2µE(X) +µ2
=E[X2]−µ2 ✷
X cm cm2
X
X 標準偏差(standard deviation) D(X)
D(X) = √V(X) (6.3)
例 6.2. B(n, p)
X B(n, p) E[X(X−1)] =n(n−1)p2
E[X(X−1)] = n
∑
k=0
k(k−1)×nCk pk(1−p)n−k
= n
∑
k=2
k(k−1) n!
k!(n−k)! p
k(1
−p)n−k
=n(n−1)p2
n
∑
k=2
(n−2)!
(k−2)!{(n−2)−(k−2)}! p
k−2(1−p)(n−2)−(k−2)
=n(n−1)p2
n−2
∑
s=0
(n−2)!
s!{(n−2)−s}! p
s(1
−p)(n−2)−s =n(n−1)p2
E(X2) = n(n−1)p2 +np 6.2 V(X) = E(X2)−
[E(X)]2 =n(n−1)p2+np=np(1−p)
✓ ✏
B(n, p) np,np(1−p) X B(n, p)
E(X) =np, V(X) = np(1−p)
✒ ✑
練習問題10
0.3 10
X
6.4
数学の準備1:定積分
[a, b] f(x)
[a, b] a = x0 < x1 < · · · < xn =b [a, b] n
[x0, x1],[x1, x2],· · · ,[xn−1, xn] ∆ = {x0, x1,· · · , xn}
|x1−x0|,|x2 −x1|,· · · |xn−xn−1| ∆ |∆|
[xi−1, xi] ui
n
∑
i=1
f(ui)(xi−xi−1) =f(u1)(x1−x0) +f(u2)(x2−x1) +· · ·+f(un)(xn−xn−1)
f ∆ リーマン和 f |∆| →0
n → ∞ S
S [a, b] f
∫ b
a
f(x)dx
∫ b
a
f(x)dx=F(b)−F(a)
F f
6.5
数学の準備2:広義積分
[a, b]
[a,∞) [a,∞) a [a,∞)
f(x) [a,∞)
lim
t→∞
∫ t
a
f(x)dx
f(x) [a,∞)
∫ ∞
a
f(x)dx
f(x) (−∞, a]
lim
t→−∞
∫ a
t
f(x)dx
f(x) (−∞, a]
∫ a
−∞
f(x)dx
(−∞,∞) f(x) (−∞,∞)
lim
t→−∞
∫ a
t
f(x)dx lim
t→∞
∫ t
a
f(x)dx
∫ ∞
−∞
f(x)dx= lim
t→−∞
∫ a
t
f(x)dx+ lim
t→∞
∫ t
a
f(x)dx
例題 6.1. a >0
(1)
∫ t
0
e−axdx, (2)
∫ ∞
0
e−axdx, (3)
∫ t
0
xe−x2
dx, (4)
∫ ∞
0
xe−x2
dx,
( )
(1)
∫ t
0
e−axdx=
[ −1 ae −ax ]t 0
=−1 ae
−at+ 1
a
(2)
∫ ∞
0
e−axdx= lim
t→∞
(
−1
ae
−at+ 1
a ) = 1 a (3) ∫ t 0
xe−x2
dx=
[
−12e−x2
]t
0
=−1 2e
−t2
+1 2
(4)
∫ ∞
0
xe−x2
dx= lim
t→∞
(
−1
2e −t2
+1 2
)
6.2: J 846
6.6
連続型確率変数
連続型確率変数 (
GNP )
6.2 2002 J
X f(x) ≥ 0 [a, b]
a≤X ≤b f(x) x=a, x=b x
f(x) X 確率密度関数(probability density function, pdf)
X x f(x)≥0
a < b
P(a≤X ≤b) =
∫ b
a
f(x)dx (6.4)
f
0 2 4 6 8 10 12 14 16 18 0
0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18
a b
f(x)
∫
a b
f(x) dx P(a≤ X≤ b) =
✓ ✏
X f(x) f(x) X
(1) f(x)≥0
(2) x y=f(x) 1 (3) P(a ≤X ≤b)
✒ ✑
6.7
連続型確率変数の期待値
:
✓ ✏
X f(x) X E(X)
E(X) =
∫ ∞
−∞
xf(x)dx (6.5)
✒ ✑
X [L, R] f(x) [L, R] 0
X
E(X) =
∫ R
L
xf(x)dx (6.6)
x x
X µ X
V(X) = E[(X−µ)2)] =
∫ ∞
−∞
(x−µ)2f(x)dx (6.7)
✓ ✏
V(X) = E(X2)−[E(X)]2
✒ ✑
6.8
一様分布
a, b a < b
f(x) =
{
1
b−a a≤x≤b
例 6.3.
X X 0 360 [0, 360]
6.9
正規分布
正規分布の定義
✓ ✏
f(x)
f
(
x
) =
√
1
2
πσ
e
−1 2
(
x−µ
σ
)
2
(6.8)
, 正規分布(normal distribution) N(µ, σ2)
✒ ✑
X (6.8)
E(X) = µ (6.9)
V(X) = σ2 (6.10)
2 N(µ, σ2) 平均µ, 分散σ2 の正規分布
0, 1 N(0,1) 標準正規分布 X
(6.8) X µ σ2 , X ∼N(µ, σ2)
-4 -3 -2 -1 0 1 2 3 4
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
µ+σ
N (
µ
,
σ
2
)
µ µ+2 σ µ+3 σ
µ-3 σ µ-2 σ µ-σ x
6.4: N(µ, σ2)
N(µ, σ2) f(x)
✓ ✏
(i)f(x) µ
(ii) 2 (µ−σ, f(µ−σ)) (µ+σ, f(µ+σ))
(iii) [µ−3σ, µ+ 3σ] ,
P(µ−σ ≦X≦µ+σ) = 0.683
P(µ−2σ≦X ≦µ+ 2σ) = 0.955
P(µ−3σ≦X ≦µ+ 3σ) = 0.997
(iv)f(x) x=µ √1
2πσ
✒ ✑
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
N(0, 1) N(4, 1)
N(0, 4)
6.5:
2
(1)
正規分布の確率密度関数の x=µ における高さ µ, σ2
f
(
x
) =
√
1
2
πσ
e
−1 2
(
x−µ
σ
)
2
(6.11)
x=µ f(x) x=µ
f(µ) = √1
2πσ (6.12)
N(µ, σ2) x=µ √1
2πσ
1
√
2π ≒0.4 (6.13)
N(µ, σ2) 0.4 σ
定理 6.3 ( 1). a, b
X ∼N(µ, σ2)
aX+b∼N(aµ+b, a2σ2)
X−µ
σ ∼N(0,1)
Z = X−µ
σ X 標準化 X
付録
(6.9) z = (x−µ)/σ
E(X) =
∫ ∞
−∞
x√1
2πσe
−12(
x−µ
σ ) 2 = ∫ ∞ −∞ 1 √
2πσ(σz+µ)e
−12z 2 σdz = ∫ ∞ −∞ 1 √
2πze
−12z 2 dz+ ∫ ∞ −∞ 1 √
2πµe
−12z 2 dz =µ ∫ ∞ −∞ 1 √
2πze
−12z 2
dz = 0
( )
∫ ∞
−∞ 1
√
2πe
−12z 2
dz = 1
✷
(6.10)
Z = (X−µ)/σ) Z ∼N(0,1) Z V(Z)
V(Z) = E(Z2) =
∫ ∞
−∞
z2√1
2πσe
−12(
z−µ
σ )
2
dz
=
[
−z√1
2πσe
−12(
z−µ
σ )
2]∞
−∞ +
∫ ∞
−∞
z2√1
2πσe
−12(
z−µ
σ )
2
dz
=0 + 1 = 1
σZ+µ N(µ, σ) X =µ+σZ V(X) =σ2.
✷
6.3
F(x) =P(X ≤x) X 分布関数
X ∼N(µ, σ2) X t= (s−b)/a
a >0
P(aX+b≤x) =P(X ≤(x−b)/a) (6.14)
=
∫ (x−b)/a −∞
1
√
2πσe
−12(
t−µ
σ ) 2 dt (6.15) = ∫ x −∞ 1 √
2πσae
−12(
s−aµ−b
aσ )
2
ds (6.16)
6.9.1
上側確率,上側パーセント点
X
P(X > u) (6.17)
(6.17) 上側確率
1 u u
u
u= 0.55 , .5 .05
0.291 Z N(0,1)
P(Z >0.55) = 0.291 (6.18)
α 上側100αパーセント点
100α zα
2.5 0.5 1.96, 2.58 X a P(X =a) = 0
6.10
正規分布についての確率の求め方
1
例題 6.2. Z ∼N(0,1) (1) P(Z >1)
(2) P(Z >1.96) (3) P(Z ≦1)
解答
(1) u= 1.00 P(Z >1) = 0.159 .
(2) P(Z >1.96) = 0.025 .
(3) P(Z ≦ 1) = 1 −P(Z > 1) P(Z > 1) = 0.159 P(Z ≦ 1) = 1−0.159 = 0.841
6.3
例題 6.3. X ∼N(50,100) (1) P(X >60)
(2) P(X ≦60) (3) P(X ≦70)
解答 (1)
P(X >60) =P (
X−50
10 >
60−50 10
)
=P (
X−50
10 >1
)
= 0.159
(X−50)/10
(2) (1) P(X ≦60) = 1−P(X >60) = 1−0.159 = 0.841 (3)
P(X ≦70) =P (
X−50
10 ≦
70−50 10
)
=P (
X−50
10 ≦2
)
= 1−P (
X−50
10 ≥2
)
第
7
章 多次元の確率分布
7.1
同時確率分布と周辺確率分布
2 X Y . X x1, x2,· · · , xk,
Y y1, y2,· · · , yℓ . ,
p(xi, yj) = P(X =xi, Y =yj), i= 1,· · · , k, j = 1,· · · , ℓ
X Y . 2 p(·,·) X Y 同
時確率関数 同時確率分布 .
p(·,·) yj p(xi, yj) X
X 周辺確率分布 p1(xi) p1(xi) = ∑ℓj=1p(xi, yj)
p1(x1), . . . p1(xk) X ∑ki=1p1(xi) = 1
p2(yj) p2(yj) = ∑ki=1p(xi, yj) p2(y1), . . . p2(yℓ) Y
∑ℓ
j=1p2(yj) = 1
例 7.1. X
Y X Y
解答 36
1/36
X Y
1 2 3 4 5 6
1 361 361 361 361 361 361 16 2 361 361 361 361 361 361 16 Y 3 1
36 1 36 1 36 1 36 1 36 1 36 1 6
4 361 361 361 361 361 361 16 5 1 36 1 36 1 36 1 36 1 36 1 36 1 6 6 1 36 1 36 1 36 1 36 1 36 1 36 1 6 X 1 6 1 6 1 6 1 6 1 6 1 6
例 7.2. X
X Y 1 2 3 4 5 6
0 1 36 1 36 1 36 1 36 1 36 1 36 6 36
1 361 362 362 362 362 361 1036 Y 2 361 361 362 362 361 361 368
3 1 36 1 36 1 36 1 36 1 36 1 36 6 36
4 361 361 0 0 361 361 364 5 361 0 0 0 0 361 362 X 16 16 16 16 16 16
7.2
期待値
g(x, y) 2 X, Y g(X, Y)
g(X, Y) g(X, Y)
✓ ✏
E[g(X, Y)] = k ∑ i=1 ℓ ∑ j=1
g(xi, yj)p(xi, yj)
✒ ✑
7.2.1
共分散
, µX E(X) , µY E(Y) . 2 X Y 共 分散(covariance) Cov(X, Y)
Cov(X, Y) =E[(X−µX)(Y −µY)] = k ∑ i=1 ℓ ∑ j=1
(xi−µX)(yj−µY)P(X =xi, Y =yj)
. Cov(X, Y) X Y . X Y
,
. , X Y ,
. .
Cov(X, Y) = E(XY)−E(X)E(Y) (7.1)
7.3
連続型確率変数の場合
1X, Y
2 f(x, y) a, b, c, d(a < b, c < d)
P(a≤X ≤b, c≤Y ≤d) =
∫ b
a
∫ d
c
f(x, y) (X, Y) 同時確率密度関数 2 3
x1
x2
z
7.1: f(x, y)
7.4
確率変数の独立性
X Y a≤b, c≤d
P(a≤X ≤b, c≤Y ≤d) =P(a≤X ≤b)×P(c≤Y ≤d) (7.3)
X Y
X Y ,
.
2 X, Y ,xi (i= 1,· · ·, k),yj (j = 1,· · ·ℓ)
. , i= 1,· · ·, k, j = 1,· · · , ℓ ,
P(X =xi, Y =yj) =P(X =xi)×P(Y =yj)
,X Y
2 X,Y , f(x), g(y) . ,
x y , X, Y f(x, y)
f(x, y) = f(x)g(y)
,X Y
2
7.5
期待値の性質
定理 7.1. [ ] 2 X, Y
(1) E(X+Y) = E(X) + E(Y)
(2) V(X+Y) = V(X) + 2×Cov(X, Y) + V(Y)
. X Y .
(3) E(XY) = E(X)E(Y) (4) Cov(X, Y) = 0
(5) V(X+Y) = V(X) + V(Y)
(1), (2) X Y .
問題 7.1. A B A X, B
Y (X, Y) A 1
B 2 0.14
X Y 0 1 2 3
0 0.06 0.08 0.04 0.02 1 0.15 0.20 0.10 0.05 Y 2 0.10 0.14 0.05 0.01 3 0 0 0 0 X
(1) X Y
(2) A B A
問題 7.2. A B 200m A B
1 2 200m A B 100m ( )
定理7.1の証明
(1)の証明 E(X+Y)
= k ∑ i=1 ℓ ∑ j=1
(xi+yj)p(xi, yj)
= k ∑ i=1 ℓ ∑ j=1
xip(xi, yj) + k ∑ i=1 ℓ ∑ j=1
yjp(xi, yj)
= k ∑ i=1 xi ℓ ∑ j=1
p(xi, yj) + ℓ ∑ j=1 yj k ∑ i=1
p(xi, yj)
= k
∑
i=1
xip1(xi) + ℓ
∑
j=1
yjp2(yj) =E(X) + E(Y)
(2)の証明 V(X+Y)
=E[{(X+Y)−E(X+Y)}2] =E[{(X−E(X)) + (Y −E(Y))}2]
=E[{X−E(X)}2]+ 2E [{X−E(X)} {Y −E(Y)}] + E[{X−E(X)}2] =V(X) + 2Cov(X, Y) + V(Y)
(3)の証明 E(XY) = k ∑ i=1 ℓ ∑ j=1
xiyjP(X =xi, Y =yj)
= k ∑ i=1 ℓ ∑ j=1
xiyjP(X =xi)P(Y =yj) X Y
= k
∑
i=1
xiP(X =xi) ℓ
∑
j=1
yjP(Y =yj)
=E(X)E(Y) ✷
(4)の証明
Cov(X, Y) =E [(X−µX)(Y −µY)] =E [(X−µX)] E [(Y −µY)]
X a,b aX+b
aX+b
✓ ✏
(a) E(aX+b) =aE(X) +b
(b) V(aX +b) =a2V(X)
✒ ✑
証明(a) 29
(b) µ=E(X) E(aX+b) =aµ+b
V(aX +b) = E[(aX +b−(aµ+b))2] = E(a2(X−µ)2) = a2E((X−µ)2) = a2V(X) ✷
7.1 n X1, X2, . . . , Xn
(a) E(X1+X2+· · ·+Xn) = E(X1) + E(X2) +· · ·+ E(Xn)
(b) n X1, X2· · ·, Xn ,
V(X1+X2+· · ·+Xn) = V(X1) + V(X2) +· · ·+ V(Xn)
✓ ✏
n X1, X2· · · , Xn µ σ2
E
( n
∑
i=1
Xi
)
=nµ
V
( n
∑
i=1
Xi
)
=nσ2
✒ ✑
¯
X = 1
n
∑n
i=1Xi aX+b
✓ ✏
n X1, X2· · · , Xn µ σ2
E(X¯)=µ
V(X¯)=σ
2
n
✒ ✑
例 7.3.
n
X1, X2· · · , Xn E(Xi) = 60(g), V(Xi) = 1(g2)
7.6
確率変数の和の確率分布
2
1 2 3 4 5 6 1/6
7.1
2 3 4 5 6 7 8 9 10 11 12 1/36
7.2 2
再
生性3
✓ ✏
定理 7.2 ( ). X1, X2 X1
N(µ1, σ12) X2 N(µ2, σ22)
X1+X2 ∼N(µ1+µ2, σ12+σ22)
✒ ✑
7.2
n X1, X2, . . . , Xn
Xi ∼N(µ, σ2), i= 1,2, . . . , n
n
∑
i=1
Xi ∼N
(
nµ, nσ2)
✓ ✏
定理 7.3. n X1, X2, . . . , Xn
Xi ∼N(µ, σ2), i = 1,2, . . . , n
¯
X = 1
n
n
∑
i=1
Xi ∼N
( µ,σ
2
n )
✒ ✑
7.3
3
第
8
章 統計的推測
8.1
母集団と標本
母集団 (i)
(ii) (iii)
統計的推測
8.1.1
標本
(
サンプル
)
標本抽出, サンプリング
無作為標本
標本の大きさ n
推定
点推定 区間推定 2
点推定量 推定量
点推定値 推定値
8.1.2
有限母集団の場合
N
例 8.1. 1 2012 11
n = 1272 0.173
母比率の推定
p p 母比率
p n
X
ˆ
p= X
n
ˆ
p p
8.1:
p
X B(n, p) n √X−np
np(1−p)
N(0, 1) 2.5%
1.96 2
P {
−1.96≤ √X−np
np(1−p) ≤1.96
}
≒0.95
1
45 1 434
2
P {
−1.96× √
p(1−p)
n ≤pˆ−p≤1.96×
√
p(1−p)
n }
≒0.95
n pˆ p √ p pˆ
P {
ˆ
p−1.96× √
ˆ
p(1−pˆ)
n ≤p≤pˆ+ 1.96×
√
ˆ
p(1−pˆ)
n }
≒0.95
p
信頼係数95%の信頼区間
✓ ✏
n
[
ˆ
p−1.96
√
ˆ
p(1−pˆ)
n , pˆ+ 1.96
√
ˆ
p(1−pˆ)
n ]
95% p
✒ ✑
8.1
1.96×
√
ˆ
p(1−pˆ)
n = 1.96×
√
0.173(1−0.173)
1272 = 0.0208
p 95%
8.1.3
無限母集団の場合
無限母集団
無限母集団の例
1. 50 20
2. 100m
8.1.4
母集団と母集団分布
例 8.2. A 100m
A 1 100m 10
100m
100 10
100m 100m
10 15
母集団分布
✓ ✏
n X1, X2, . . . , Xn n
{X1, X2, . . . , Xn}
✒ ✑
8.1.5
母集団分布のパラメータ
パラメータ 母数
N(µ, σ2) µ, σ2 母平均
8.2
パラメータと統計量
8.2.1
統計量
統計量
8.2.2
統計的推測の方法
N(µ, σ2)
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
x
...
µ,σ2
X1, X2, . . . , Xn
, ¯X
, s2
8.2:
( )
• · · ·
• · · ·
• · · ·
: 点推定 推
定
8.2.3
推定量と推定値
X1, X2, . . . , Xn 推定量
¯
X µ s2 σ2
n 3 x
1, x2, . . . , xn 推定値
✓ ✏
θ T θ
E(T) = θ
T θ
µ σ2
¯
X = 1
n
n
∑
i=1
Xi (8.1)
s2 = 1
n−1
n
∑
i=1
(Xi−X¯)2 (8.2)
s2
µ 7.5 E( ¯X) = µ
¯
X µ
定理 8.1. X1, X2, . . . , Xn n E(Xi) =
µ, V(Xi) =σ2, i= 1,2, . . . , n
E(s2) = σ2 (8.3)
証明 Yi =Xi−µ, i= 1,2, . . . , n Y¯ = ¯X−µ
n
∑
i=1
(Xi−X¯)2 = n
∑
i=1
(Yi−Y¯)2
= n
∑
i=1
Yi2−nY¯2
E(Y2
i ) = V ar(Yi) =σ2,E( ¯Y2) = V ar( ¯Y) =
σ2 n E { n ∑ i=1
(Xi−X¯)2
}
= E
( n
∑
i=1
Yi2 −nY¯2
) = E ( n ∑ i=1 Y2 i )
−E(nY¯2)
= nσ2−σ2
= (n−1)σ2
E(s2) = E
{
1
n−1
n
∑
i=1
(Xi−X¯)2
}
= σ2 ✷
E( ¯X) =µ, E(s2) =σ2 X¯ µの不偏推定量
s2 σ2 の不偏推定量
例題 8.1.
第
9
章 正規母集団からの標本と関連する
分布
2 χ2 2 t
9.1
χ
2分布
χ2
✓ ✏
Z1, Z2,· · ·, Zk N(0,1)
Y
Y =Z12+Z22+· · ·+Zk2
Y 自由度k χ2 分布 χ2(k)
✒ ✑
χ2(1) 57
1
9.2
t
分布
t
✓ ✏
Z N(0,1) Y k χ2 χ2(k)
Z Y t
t= √Z
Y /k
t 自由度k の t 分布 t(k)
✒ ✑
t 分布の特徴
(1) t 0 .
(2) k t N(0,1) .
(3) k t . , k → ∞ t
N(0,1) .
1
χ2
0 2 4 6 8 10 12 14 16 18 20 0
0.1 0.2 0.3 0.4 0.5 0.6 0.7
x
f(x)
k=1
k=2
k=3
k=10
9.1: k χ2
付録:
χ
2(1)
の確率密度関数
準備:✓ ✏
F(x) X 分布関数
F(x) =P(X ≤x)
✒ ✑
X f(x)
F(x) =P(X ≤x) =
∫ x
−∞
f(t)dt
F′(x) =f(x).
Z N(0, 1) Y =Z2 Z
f(x) = √1
2π exp{−x
2/2} F(x) Y G(y)
y >0
-4 -3 -2 -1 0 1 2 3 4 0
0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
x
f(x)
N ( 0, 1 )
t ( 5 )
t ( 1 )
9.2: k t
Y g(y) G
g(y) = d
dyG(y) = d dy {F(
√
y)−F(−√y)}
= 1 2√y{f(
√y)
−f(−√y)}
= 1
2√y ×2×
1
√
2πe
−y/2
=√1
2πy
−1/2e−y/2.
χ2(1)
g(y) = √1
2πy
9.3
同一の正規分布に従う確率変数
X1, X2,· · · , Xn n
X1, X2,· · · , Xn N(µ, σ2)
¯
X = 1
n
n
∑
i=1
Xi
2
n
∑
i=1
(
Xi−X¯
)2
X1, X2,· · · , Xn N(µ, σ2)
∑n
i=1(Xi−µ)2
σ2 =
n
∑
i=1
(
Xi−µ
σ2
)2
χ2 n χ2 µ X¯
✓ ✏
定理 9.1. X1, X2,· · · , Xn N(µ, σ2)
¯
X
n
∑
i=1
(
Xi−X¯
)2
n
∑
i=1
(
Xi−X¯
)2
σ2
n−1 χ2
✓ ✏
定理 9.2. X1, X2,· · · , Xn N(µ, σ2)
¯
X−µ
s/√n
n−1 t
✒ ✑
証明.
¯
X−µ
s/√n =
¯
X−µ
σ/√n ·
1
s/σ
=X¯ −µ
σ/√n ·
1
√ s2/σ2
=X¯ −µ
σ/√n ·
1
√
∑n
i=1(Xi −X¯)2
σ2 ·
1
n−1
(9.1)
9.1 (9.1) t
¯
X−µ
s/√n
n−1 t
k t α tα(k)
9.4
母平均の信頼区間
µ σ2
信頼区間 µ
X1, X2,· · · , Xn N(µ, σ2)
9.2
¯
X−µ
s/√n
n−1 t
0.95 =P (
−t0.025(n−1)≤
¯
X−µ
s/√n ≤t0.025(n−1) )
=P (
¯
X−t0.025(n−1)×
s √
n ≤µ≤X¯ +t0.025(n−1)× s √ n
)
¯
x,s2
✓ ✏
[
¯
x−t0.025(n−1)×
s √
n, x¯+t0.025(n−1)× s √ n
]
95% µ
✒ ✑
練習問題
問題1
(1) t0.025(8)
(2) t0.025(15)
例題
A 1000m 9 9 ¯
x= 180.0 s= 0.9 N(µ, σ2)
第
10
章 仮説検定
10.1
母平均の検定
仮説検定
23.1cm 23.1cm
16 x¯= 23.2 ( ) s= 0.16
23.1
X1, X2, . . . , X16 16
N(µ, σ2)
帰無仮説 H0
H0 :µ= 23.1
対立仮説 H1
H1 :µ̸= 23.1
,
t= X¯ −23.1
s/√16 ∼t(15) (10.1)
15 t t(15) 2.5% 2.131
P {
¯
X−23.1
s/√16
>2.131
}
= 0.05 (10.2)
H0 t 2.131
t |t|>2.131 H0
帰無仮説を棄却する t = x¯−23.1
s/√16 =
0.1 0.16/4 =
0.1
0.04 = 2.5 |t|>2.131 H0 :µ= 23.1
10.1.1
有意水準
|t|>2.131 棄却域
|t|>2.131 帰無仮説は棄却される −2.131≤t ≤2.131
帰無仮説は棄却されない 0.05
0.05 0.01
有意水準 α
有意水準 αの検定
10.1.2
母平均の検定:一般的な説明
X1, X2, . . . , Xn N(µ, σ2)
µ µ0
H0 :µ=µ0
H1 :µ̸=µ0
α
✓ ✏
H0 :µ=µ0 H1 :µ̸=µ0
t= x¯−µ0
s/√n (10.3)
|t|> tα/2(n−1) H0
|t| ≤tα/2(n−1) H0
✒ ✑
練習問題18
300ml
9 x¯= 298.4
s = 2.4 H0 : µ= 300 H1 :µ̸= 300
10.1.3
母平均の検定:片側検定
10 25
TOEIC ¯
x= 5 s= 6 TOEIC
X1, X2, . . . , X25 25 TOEIC N(µ, σ2)
H0 :µ≤0
H1 :µ >0
片側対立仮説 24 t
5% 1.711
¯
x
s/√25 >1.711 (10.4)
¯
x
s/√25 =
5
6/5/≒4.17 4.17>1.711
α µ0
✓ ✏
H0 :µ≤µ0 H1 :µ > µ0
t= x¯−µ0
s/√n (10.5)
t > tα(n−1) H0
t≤tα(n−1) H0
✒ ✑
H0 :µ≥µ0 H1 :µ < µ0
2種類の誤り
(a)
第1種の誤り Type 1 error
(b)
第2種の誤り Type 2 error
1 α
1 (α) H0
H1 2
µ 帰無仮説が棄
却されないことは、標本が帰無仮説と(統計的に)矛盾しないことを意味するのであって、帰 無仮説が積極的に支持されるわけではない。
10.1: W. S. Gosset ( , 1876-1937). Guiness brewery
10.1.4
P
値
61
X1, . . . , Xn
H0 :µ= 23.1 v.s. H1 :µ̸= 23.1
61 t= x¯−23.1
s/√16 =
0.1 0.16/4 =
0.1
0.04 = 2.5
¯
X−23.1
s/√16
t = 2.5 0.025 1
P
P
✓ ✏
N(µ, σ2)
H0 :µ=µ0 v.s. H1 :µ̸=µ0
X1, . . . , Xn
t
P (
¯
X−µ0
s/√n > t
)
P値
P < α α
✒ ✑
1
10.2
発展:回帰分析における仮説検定
24 2
yi,xi i yi
yi =α+βxi+ui, i= 1,2, . . . , n (10.6)
ui, i = 1,2, . . . , n N(0, σ2) ui
α,β
(xi, yi), i= 1, . . . , n 2 βˆ β 2
ˆ
β
ˆ
β−β
σβˆ ∼
N(0, 1) (10.7)
σβˆ βˆ
σβˆ =
σ
√ n
∑
i=1
(xi−x¯)2
(10.8)
(10.7) σβˆ
σ2 e
1, . . . , en ˆ
σ2 = 1
n−2
n
∑
i=1
e2i (10.9)
ˆ
σ2 βˆ
se( ˆβ) = √ n σˆ ∑
i=1
(xi−x¯)2
(10.10)
ˆ
β 標準誤差(standard error)
✓ ✏
ˆ
β−β
se( ˆβ) ∼t(n−2) (10.11)
✒ ✑
t(n−2) n−2 t β
10.2.1
β
についての仮説検定
H0 :β = 0 (10.12)
H1 :β ̸= 0
ˆ
β
se( ˆβ) (10.13)
(10.12)
t t t
|t|> tα/2(n−2) (10.14)
α H0 (10.14) H0