統計学
社会統計の基礎
-正規分布、標準正規分布
累積分布関数の逆関数
t分布
正規分布に従うサンプルの平均の信頼区間
担当: 岸 康人資料ページ: https://goo.gl/qw1DJw
正規分布(復習)
▋正規分布(Normal Distribution)N (μ, σ
2)
別名:ガウス分布(Gaussian Distribution)
–
密度関数
Excel:= NORM.DIST ( x, μ, σ, FALSE )
–
累積分布関数
???(-_-;) 初等関数で書けない(が数値計算は可能) NORM.DIST ( x, μ, σ, TRUE )–
平均:
–
分散:
(標準偏差:σ)
正規分布(復習)
▋
正規分布の特徴
–
2項分布の極限
–
観測誤差の分布
–
中心極限定理
• 平均はn→∞で正規分布に従う–
平均に関して左右対称
–
再生性
前回の演習
1. X~N(20, 25)のとき、P[X>25]を求めよ。
P[X>25]=1-P[X≦25]~0.159
前回の演習
2. X~N(20, 25)のとき、P[X≦15]を求めよ。
P[X≦15]~0.159
前回の演習
3. X~N(20, 25)のとき、P[15≦X≦25]を求めよ。
P[15≦X≦25]=P[X≦25]-P[X≦15]~0.683
=NORMDIST(25,20,SQRT(25),TRUE)
-NORMDIST(15,20,SQRT(25),TRUE)
σ σ前回の演習
4. X~N(20, 100)のとき、P[10≦X≦30]を求めよ。
P[10≦X≦30]=P[X≦30]-P[X≦10]~0.683
=NORMDIST(30,20,SQRT(100),TRUE)
-NORMDIST(10,20,SQRT(100),TRUE)
σ σ前回の演習
5. X~N(20, 225)のとき、P[5≦X≦35]を求めよ。
P[5≦X≦35]=P[X≦35]-P[X≦5]~0.683
=NORMDIST(35,20,SQRT(225),TRUE)
-NORMDIST(5,20,SQRT(225),TRUE)
σ σ前回の演習
6. X~N(30, 225)のとき、P[15≦X≦45]を求めよ。
P[15≦X≦45]=P[X≦45]-P[X≦15]~0.683
=NORMDIST(45,30,SQRT(225),TRUE)
-NORMDIST(15,30,SQRT(225),TRUE)
σ σ前回の演習
7. X~N(25, 100)のとき、P[15≦X≦35]を求めよ。
P[15≦X≦35]=P[X≦35]-P[X≦15]~0.683
=NORMDIST(35,25,SQRT(100),TRUE)
-NORMDIST(15,25,SQRT(100),TRUE)
σ σ前回の演習
3. X~N(20, 25)のとき、 σ=5だから、 P[15≦X≦25]=P[20-5≦X≦20+5] =P[μ-σ≦X≦μ+σ] 4. X~N(20, 100)のとき、σ=10だから、 P[10≦X≦30]=P[20-10≦X≦20+10] =P[μ-σ≦X≦μ+σ] 5. X~N(20, 225)のとき、σ=15だから、 P[5≦X≦35]=P[20-15≦X≦20+15] =P[μ-σ≦X≦μ+σ] 6. X~N(30, 225)のとき、σ=15だから、 P[15≦X≦45]=P[30-15≦X≦30+15] =P[μ-σ≦X≦μ+σ] 7. X~N(25, 100)のとき、σ=10だから、 P[15≦X≦35]=P[25-10≦X≦25+10] =P[μ-σ≦X≦μ+σ]X~N(μ, σ
2)のとき、
P[μ-σ≦X≦μ+σ] ~0.683
前回の演習
X~N(μ, σ
2)のとき、P[μ-3σ≦X≦μ+3σ]は?
例えば、X~N(20,100)として、P[-10≦X≦50]~0.9973
=NORMDIST(50,20,10,TRUE)
-NORMDIST(-10,20,10,TRUE)
3σ 3σ正規分布
▋標準正規分布 N(0,1)
–
μ=0, σ
2=1(σ=1)の正規分布を標準正規分布と呼ぶ
正規分布
▋標準正規分布 N(0,1)
–
密度関数
= NORM.DIST ( x, 0, 1, FALSE )
=
NORM.S.DIST
(
x
, FALSE )
–
累積分布関数
= NORM.DIST ( x, 0, 1, TRUE )
=
NORM.S.DIST
(
x
, TRUE )
正規分布
▋3σ範囲
–
1σ範囲:P[μ-σ≦X≦μ+σ] =P[-1≦Z≦1]=0.6827…
–
2σ範囲:P[μ-2σ≦X≦μ+2σ]=P[-2≦Z≦2]=0.9545…
–
3σ範囲:P[μ-3σ≦X≦μ+3σ]=P[-3≦Z≦3]=0.9973…
–
4σ範囲:P[μ-4σ≦X≦μ+4σ]=P[-4≦Z≦4]=0.9999…
3σ 3σ 正規分布の場合 99.7%のサンプル は3σ範囲内正規分布
▋確率→実現値を求める
–
確率pが与えられたとき、P[-r≦Z≦r]=pを満たすrは?
• Z~N(0,1) • 例えばp=0.9のとき、下図 90%のサンプルが 入っているような範 囲をみつけたい ? ?正規分布
▋確率→実現値を求める
–
確率pが与えられたとき、P[-r≦Z≦r]=pを満たすrは?
• P[-r≦Z≦r]=1-P[Z≦-r]-P[Z<r] だから、 P[Z≦-r](=P[Z<r])=(1-p)/2 となるrを求めればよい P[Z<r]=5% ? ? P[Z≦-r]=5%正規分布
▋確率→実現値を求める
–
確率pが与えられたとき、P[-r≦Z≦r]=pを満たすrは?
• 正規分布の累積分布関数が書けないので、P[Z≦-r]=(1-p)/2の解r も初等関数で表せないが、数値計算は可能 =NORM.S.INV(確率) (標準正規分布の累積分布関数の逆関数) ? ? NORM.S.INV(0.05) =-1.64485… 1.64485…正規分布
▋確率→実現値を求める
–
確率pが与えられたとき、P[-r≦Z≦r]=pを満たすrは?
• r=NORM.S.INV( (1-p)/2 ) 90%のサンプルが入ってい る範囲は、 -1.64485≦Z≦1.64485 -1.64485 1.64485正規分布
▋標準正規分布 N(0,1)
–
密度関数
=
NORM.S.DIST
(
x
, FALSE )
–
累積分布関数
=
NORM.S.DIST
(
x
, TRUE )
–
累積分布関数の逆関数
• 確率から実現値を求める=
NORM.S.INV
( p )
t分布
▋t分布 T(ν)
–
ν(ニュー;ギリシャ文字):自由度
• サンプルサイズ-1 • νを大きくするとN(0,1)に近づく–
Wikipedia:t分布
–
平均:E[X]=0
–
分散:V[X]=ν/(ν-2) (ν>2)
t分布
▋
考案した人
–
William Sealy Gosset a.k.a. Student
• 1876-1937