2 次元分布 ( 連続型確率変数 )
カイ 2 乗分布
•
母集団が標準正規分布N (0, 1)
に従うとき,そこからの無作為標本(z 1 , z 2 , . . . z N )
によっ て作られる統計量x =
N
i =1
z i 2 (124)
確率密度関数は
f (x) = 1
2 n/ 2 Γ(N/2) x N/ 2−1 e − x/ 2 (125)
•
このとき, x
は自由度(d.f.)(degrees of freedom) N
のカイ2
乗分布( χ 2 -distribution)
に従う といい,χ 2 N
で表す.
• Γ(m)
はガンマ関数と呼ばれΓ(m) =
∞
0
e − x x m −1 dx (126)
で定義される
.
1. Γ(1) = 1 , Γ( 1 2 ) = √ π 2. Γ(m + 1) = mΓ(m)
3. m
が正の整数ならΓ(m) = m!
カイ 2 乗分布
•
平均:
xf (x)dx = 1
2 N/ 2 Γ(N/2)
x N/ 2−1 e − x/ 2 dx
= 2(N/2)
2 N/ 2+1 Γ(N/2 + 1)
x N/ 2 e − x/ 2 dx = N (127)
•
分散:
x 2 f (x)dx − N 2 = 1
2 N/ 2 Γ(N/2)
x 2 x N/ 2−1 e − x/ 2 dx − N 2
= 4(N/2)(N/2 + 1) 2 N/ 2+2 Γ(N/2 + 2)
x N/ 2+1 e − x/ 2 dx − N 2
= 2N (128)
•
カイ2
乗分布表(付表)では,表側に自由度N
をとり,表頭に確率α
をとる.両者がクロ スするところにある値がχ 2 N (α)
であって,p(x ≥ χ 2 N (α)) = α (129)
となる.すなわち,自由度
N
のカイ2
乗分布に従う確率変数x
がχ 2 N (α)
以上という区間に 属する確率がα
になる.この確率αを上側確率といい,χ 2 N (α)
を上側100α%
点という.ティー分布
•
確率変数x
が標準正規分布N (0, 1)
に従い, y
が自由度ν
のカイ2
乗分布に従 うとする.
•
このとき,2
つの確率変数x, y
が独立ならばt = x
y ν
(130)
は自由度
(d.f.)ν
のティー分布(t-distribution)
に従うといい, t ν
で表す.
•
確率変数t
の確率密度関数はf (t) = Γ( ν +1 2 )
√ νπΓ( ν 2 ) (1 + t 2
ν ) − ν +1 2 , t ∈ ( −∞ , + ∞ ) (131)
である.ティー分布
•
一般に, N (μ, σ 2 )
における標本平均において,x − μ σ/ √
N (132)
は標準正規分布に従うので
σ
既知のときμ
を推測することが可能• σ 2
が分かっていないとき,思い切って標本分散s xx
を利用すると,x − μ
√ s xx / √
N (133)
は正規分布にしたがわない
•
ところがy = N s xx
σ 2 = 1 σ 2
N
i =1
(x i − x) 2 (134)
が
χ 2 (N − 1)
に従い• x ˆ = x − μ σ/ √
N (135)
が
N (0, 1)
に従うと仮定し,
これらの比を考えると未知のσ
による項が消えるティー分布
•
自由度(d.f.)N
のティー分布(t-distribution)
に従うといい, t N
で表す.
•
確率変数t
の確率密度関数はf (t) = Γ( N 2 +1 )
√ N Γ( N 2 )Γ( 1 2 ) (1 + t 2
N ) −
N2+1, t ∈ ( −∞ , + ∞ ) (136)
である.
•
平均:
偶関数なので ゼロ•
分散:
証明1 + x 2
N = 1
t , Γ( N 2 +1 )
√ N Γ( N 2 )Γ( 1 2 ) = A (137)
とおく
.
するとx =
N ( 1
t − 1), 2x
N dx = − 1
t 2 dt, ⇒ dx = −
√ N 2 ( 1
t − 1) −1 / 2 t −2 dt (138)
x ∈ ( −∞ , ∞ ) ⇒ t ∈ (0, 1] (139)
ティー分布 ( 分散の証明つづき )
•
これらを用いるとE[x 2 ] = A
x 2 (1 + x 2
N ) −
N2+1dx = AN √ N
1
0
t
N+12−2 ( 1
t − 1) 1 / 2 dt
= AN √ N
1
0
t
N2−2 (1 − t) 1 / 2 dt = AN √ N
1
0
t (
N2−1)−1 (1 − t) 3 / 2−1 dt (140)
ここで,
簡単のためα = N 2 − 1 , β = 3/2
とおきΓ(α)Γ(β) Γ(α + β ) =
1
0
t α −1 (1 − t) β −1 dt (141)
を利用すると
AN √
N
1
0
t (
N2−1)−1 (1 − t) 3 / 2−1 dt = AN √
N Γ( N 2 − 1)Γ( 3 2 )
Γ( N 2 + 1 2 ) = Γ( N 2 +1 )
√ N Γ( N 2 )Γ( 1 2 ) N √
N Γ( N 2 − 1)Γ( 3 2 )
Γ( N 2 + 1 2 ) (142) Γ( N 2 +1 )
√ N Γ( N 2 )Γ( 1 2 ) N √
N Γ( N 2 − 1)Γ( 3 2 )
Γ( N 2 + 1 2 ) = N
N − 1 (143)
エフ分布
• x 1 , x 2
が互いに独立で,
それぞれχ 2 (ν 1 ), χ 2 (ν 2 )
にしたがうとき, F =
x 1 ν 1 x 2 ν 2
(144)
の分布を
,
自由度(ν 1 , ν 2 )
のF
分布F (ν 1 , ν 2 )
と言う.
•
この分布は,理論値と実際に起こった値との差を評価するのに用いられる.
天気予報の降水確率を評価するのに用いる,
一般に,分散分析を行なうとき に用いられる.
•
確率密度関数f (x) = Γ( ν 1 + 2 ν 2 )
Γ( ν 2 1 )Γ( ν 2 2 ) ( ν 1
ν 2 ) ν 2 1 x ν 1 2 −2 (1 + ν 1
ν 2 x) − ν 1+ 2 ν 2 (145)
エフ分布 ( 平均 )
•
平均:
証明E(x) =
∞
0
xf (x)dx =
∞
0
x Γ( ν
1+ 2 ν
2) Γ( ν 2
1)Γ( ν 2
2) ( ν 1
ν 2 )
ν21x
ν12−2(1 + ν 1
ν 2 x) −
ν1+2ν2dx (146)
•
簡単のためA = Γ( ν
1+ 2 ν
2) Γ( ν 2
1)Γ( ν 2
2) ( ν 1
ν 2 )
ν21(147)
とおき
E(x) =
∞
0
Axx
ν12−2(1 + ν 1
ν 2 x) −
ν1+2ν2dx = A
∞
0
x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx
= A[ 1
− ν
1+ 2 ν
2+ 1 ν 2
ν 1 x
ν21(1 + ν 1
ν 2 x) 1−
ν1+2ν2] ∞ 0 − A 1
− ν
1+ 2 ν
2+ 1 ν 2 ν 1
ν 1 2
∞
0
x
2−1ν1(1 + ν 1
ν 2 x) 1−
ν1+2ν2dx
= − A 2
− (ν 1 + ν 2 ) + 2 ν 2 ν 1
ν 1 2
∞
0
x
2−1ν1(1 + ν 1
ν 2 x) 1−
ν1+2ν2dx
= − A 2
− (ν 1 + ν 2 ) + 2 ν 2 ν 1
ν 1 2
∞
0
x
2−1ν1(1 + ν 1
ν 2 x) −
ν1+2ν2(1 + ν 1
ν 2 x)dx
(148)
エフ分布 ( 平均 )
E(x) = − A ν 2
− (ν 1 + ν 2 ) + 2 (
∞
0
x
2−1ν1(1 + ν 1
ν 2 x) −
ν1+2ν2ν 1
ν 2 xdx −
∞
0
x
2−1ν1(1 + ν 1
ν 2 x) −
ν1+2ν2)dx
= − A ν 2
− (ν 1 + ν 2 ) + 2 ( ν 1 ν 2
∞
0
x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx −
∞
0
x
2−1ν1(1 + ν 1
ν 2 x) −
ν1+2ν2)dx (149)
∞
0
A x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx = − A ν 2
− (ν 1 + ν 2 ) + 2 ν 1 ν 2
∞
0
x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx
− A ν 2
− (ν 1 + ν 2 ) + 2
∞
0
x
ν21−1 (1 + ν 1
ν 2 x) −
ν1+2ν2dx (150)
∞
0
A(1 + ν 1
ν 2 )x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx = − A ν 2
− (ν 1 + ν 2 ) + 2
∞
0
x
ν21−1 (1 + ν 1
ν 2 x) −
ν1+2ν2dx (151) (1 + ν 1
− (ν 1 + ν 2 ) + 2 )
∞
0
Ax
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx = − ν 2
− (ν 1 + ν 2 ) + 2 (152) E(x) =
∞
0
Ax
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx = −
ν
2−( ν
1+ ν
2)+2 ν
2−( ν
1+ ν
2)+2
= ν 2
ν 2 − 2 (153)
エフ分布 ( 分散 )
E(x 2 ) =
∞
0
x 2 f (x)dx =
∞
0
x 2 Γ( ν
1+ 2 ν
2) Γ( ν 2
1)Γ( ν 2
2) ( ν 1
ν 2 )
ν21x
ν12−2(1 + ν 1
ν 2 x) −
ν1+2ν2dx (154) A = Γ( ν
1+ 2 ν
2)
Γ( ν 2
1)Γ( ν 2
2) ( ν 1
ν 2 )
ν21(155)
を導入し
E(x 2 ) =
∞
0
x 2 f (x)dx =
∞
0
x 2 Ax
ν12−2(1 + ν 1
ν 2 x) −
ν1+2ν2dx
= 2A
2 − (ν 1 + ν 2 ) ν 2
ν 1 x
ν21+1 (1 + ν 1
ν 2 x) −
ν1+2ν2+1 | ∞ 0
− 2A
2 − (ν 1 + ν 2 ) ν 2 ν 1 ( ν 1
2 + 1)
∞
0
x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2+1 dx
= − 2A
2 − (ν 1 + ν 2 ) ν 2 ν 1 ( ν 1
2 + 1)
∞
0
x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2+1 dx
= − 2A
2 − (ν 1 + ν 2 ) ν 2 ν 1 ( ν 1
2 + 1)
∞
0
x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx
− 2A
2 − (ν 1 + ν 2 ) ( ν 1
2 + 1)
∞
0
x
ν21+1 (1 + ν 1
ν 2 x) −
ν1+2ν2dx
(156)
エフ分布 ( 分散 )
E(x 2 ) = − 2A
2 − (ν 1 + ν 2 ) ν 2 ν 1 ( ν 1
2 + 1)
∞
0
x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx
− 2A
2 − (ν 1 + ν 2 ) ( ν 1
2 + 1)
∞
0
x
ν21+1 (1 + ν 1
ν 2 x) −
ν1+2ν2dx
= − 2A
2 − (ν 1 + ν 2 ) ν 2 ν 1 ( ν 1
2 + 1)
∞
0
x
ν21(1 + ν 1
ν 2 x) −
ν1+2ν2dx − 2
2 − (ν 1 + ν 2 ) ( ν 1
2 + 1)E(x 2 )
= − 2A
2 − (ν 1 + ν 2 ) ν 2 ν 1 ( ν 1
2 + 1) ν 2
ν 2 − 2 − 2
2 − (ν 1 + ν 2 ) ( ν 1
2 + 1)E(x 2 ) (157)
(1 + 2
2 − (ν 1 + ν 2 ) ( ν 1
2 + 1))E (x 2 ) = − 2A
2 − (ν 1 + ν 2 ) ν 2 ν 1 ( ν 1
2 + 1) ν 2
ν 2 − 2 (158)
V (x 2 ) = E (x 2 ) − (E(x)) 2 = 2ν 2 2 (ν 1 + ν 2 − 2)
ν 1 (ν 2 − 2) 2 (ν 2 − 4) (159)
14. 推定
点推定
•
データ処理は,
与えられたデータについて代表値や散布度などを算出 するものであり,
結論もそのデータに関してのみいえる•
統計処理が行われるのは,
処理結果を取扱うデータのみに限定して言 及するのではなく,
•
それを手がかりとして背後の母集団についての情報を得る•
データの背後により大きい母集団があると考え,
データはそこからラ ンダムに抽出されたサンプルとみなして,
データ処理の結果をもとに,
母集団の様相を推測する.
推定量
•
記号の約束•
母集団–
母平均μ,
–
母標準偏差σ,
母分散σ 2 –
相関係数ρ
•
標本統計量(
確率変数がx
で表される場合) –
標本平均x,
–
標本標準偏差√
s xx ,
分散s xx –
相関係数r
•
ランダムサンプル(x 1 , x 2 , . . . , x N )
とは,
同一母集団から無作為に抽出さ れた,相互に独立なN
個のサンプルである.•
これをiid
サンプル(independent and identically distributed random
samples
)というモーメント法
• k
個の母数を推定したいとき, k
次までの母集団モーメントと標本モー メントを対応させることにより,k
個の方程式をたて,それを母数につ いて解くことによって,推定量を求めるというモーメント法である.
• μ ˆ = x, σ ˆ 2 = s xx (160)
15. 推定量とその性質
不偏性
•
不偏性: unbiasedness
•
不偏推定量: unbiased estimator
•
個々の推定量の実現値,
すなわち推定値は母数から離れ,
へだたりがあっ ても,
何度も推定値を求めれば,
平均的には母数が得られるような性質•
標本平均の期待値は母平均に等しい•
証明: x 1 , x 2 , . . . x N
はそれぞれ同一の母集団から無作為に抽出されて いるため,
それぞれ独立かつ同一の分布であると考えてよい.
その結果E (x 1 ) = E (x 2 ) = . . . = E (x N ) = μ (161)
が成立する.
その結果,
E (x) = 1 N
N i =1
E (x i ) = μ (162)
ドキュメント内
tokei01.dvi
(ページ 77-93)