乗分布 - 2 次元分布 ( 連続型確率変数 )

2 次元分布 ( 連続型確率変数 )

カイ 2 乗分布

•

母集団が標準正規分布

N (0, 1)

に従うとき，そこからの無作為標本

(z ₁ , z ₂ , . . . z _N )

によって作られる統計量

x =

N

i =1

z _i ² (124)

確率密度関数は

f (x) = 1

2 ^n/ ² Γ(N/2) x ^N/ ²⁻¹ e ⁻ ^x/ ² (125)

•

^このとき

, x

_は自由度

(d.f.)(degrees of freedom) N

_のカイ

2

乗分布

( χ ² -distribution)

に従うといい，

χ ² _N

_で表す

.

• Γ(m)

_{はガンマ関数と呼ばれ}

Γ(m) =

_∞

0 e ⁻ ^x x ^m ⁻¹ dx (126)

で定義される

.

1. Γ(1) = 1 , Γ( ¹ ₂ ) = √ π 2. Γ(m + 1) = mΓ(m)

3. m

が正の整数なら

Γ(m) = m!

カイ 2 乗分布

•

^平均

:

xf (x)dx = 1

2 ^N/ ² Γ(N/2)

x ^N/ ²⁻¹ e ⁻ ^x/ ² dx

= 2(N/2)

2 ^N/ ²⁺¹ Γ(N/2 + 1)

x ^N/ ² e ⁻ ^x/ ² dx = N (127)

•

^分散

:

x ² f (x)dx − N ² = 1

2 ^N/ ² Γ(N/2)

x ² x ^N/ ²⁻¹ e ⁻ ^x/ ² dx − N ²

= 4(N/2)(N/2 + 1) 2 ^N/ ²⁺² Γ(N/2 + 2)

x ^N/ ²⁺¹ e ⁻ ^x/ ² dx − N ²

= 2N (128)

•

^カイ

2

乗分布表（付表）では，表側に自由度

N

_{をとり，表頭に確率}

α

_{をとる．両者がクロ} スするところにある値が

χ ² _N (α)

_{であって，}

p(x ≥ χ ² _N (α)) = α (129)

となる．すなわち，自由度

N

のカイ

2

乗分布に従う確率変数

x

が

χ ² _N (α)

以上という区間に属する確率が

α

になる．この確率αを上側確率といい，

χ ² _N (α)

を上側

100α%

点という．

ティー分布

•

^確率変数

x

_{が標準正規分布}

N (0, 1)

_に従い

, y

_が自由度

ν

_のカイ

2

乗分布に従うとする

.

•

^{このとき，}

2

つの確率変数

x, y

_{が独立ならば}

t = x

y ν

(130)

は自由度

(d.f.)ν

のティー分布

(t-distribution)

に従うといい

, t _ν

_で表す

.

•

^確率変数

t

_{の確率密度関数は}

f (t) = Γ( ^ν ⁺¹ ₂ )

√ νπΓ( ^ν ₂ ) (1 + t ²

ν ) ⁻ ^ν ⁺¹ ² , t ∈ ( −∞ , + ∞ ) (131)

である．

ティー分布

•

^一般に

, N (μ, σ ² )

における標本平均において，

x − μ σ/ √

N (132)

は標準正規分布に従うので

σ

既知のとき

μ

を推測することが可能

• σ ²

が分かっていないとき，思い切って標本分散

s _xx

を利用すると，

x − μ

√ s _xx / √

N (133)

は正規分布にしたがわない

•

^ところが

y = N s _xx

σ ² = 1 σ ²

N

i =1

(x _i − x) ² (134)

が

χ ² (N − 1)

に従い

• x ˆ = x − μ σ/ √

N (135)

が

N (0, 1)

_{に従うと仮定し}

,

これらの比を考えると未知の

σ

_{による項が消える}

ティー分布

•

^自由度

(d.f.)N

のティー分布

(t-distribution)

に従うといい

, t _N

で表す

.

•

^確率変数

t

_{の確率密度関数は}

f (t) = Γ( ^N ₂ ⁺¹ )

√ N Γ( ^N ₂ )Γ( ¹ ₂ ) (1 + t ²

N ) ⁻

^N²⁺¹

, t ∈ ( −∞ , + ∞ ) (136)

である．

•

^平均

:

偶関数なのでゼロ

•

^分散

:

証明

1 + x ²

N = 1

t , Γ( ^N ₂ ⁺¹ )

√ N Γ( ^N ₂ )Γ( ¹ ₂ ) = A (137)

とおく

.

すると

x =

N ( 1

t − 1), 2x

N dx = − 1

t ² dt, ⇒ dx = −

√ N 2 ( 1

t − 1) ⁻¹ ^/ ² t ⁻² dt (138)

x ∈ ( −∞ , ∞ ) ⇒ t ∈ (0, 1] (139)

ティー分布 ( 分散の証明つづき )

•

^{これらを用いると}

E[x ² ] = A

x ² (1 + x ²

N ) ⁻

^N²⁺¹

dx = AN √ N

₁

0 t

^N+1²

⁻² ( 1

t − 1) ¹ ^/ ² dt

= AN √ N

₁

0 t

^N²

⁻² (1 − t) ¹ ^/ ² dt = AN √ N

₁

0 t ⁽

^N²

⁻¹⁾⁻¹ (1 − t) ³ ^/ ²⁻¹ dt (140)

ここで

,

簡単のため

α = ^N ₂ − 1 , β = 3/2

とおき

Γ(α)Γ(β) Γ(α + β ) =

₁

0 t ^α ⁻¹ (1 − t) ^β ⁻¹ dt (141)

を利用すると

AN √

N

₁

0 t ⁽

^N²

⁻¹⁾⁻¹ (1 − t) ³ ^/ ²⁻¹ dt = AN √

N Γ( ^N ₂ − 1)Γ( ³ ₂ )

Γ( ^N ₂ + ¹ ₂ ) = Γ( ^N ₂ ⁺¹ )

√ N Γ( ^N ₂ )Γ( ¹ ₂ ) N √

N Γ( ^N ₂ − 1)Γ( ³ ₂ )

Γ( ^N ₂ + ¹ ₂ ) (142) Γ( ^N ₂ ⁺¹ )

√ N Γ( ^N ₂ )Γ( ¹ ₂ ) N √

N Γ( ^N ₂ − 1)Γ( ³ ₂ )

Γ( ^N ₂ + ¹ ₂ ) = N

N − 1 (143)

エフ分布

• x ₁ , x ₂

_{が互いに独立で}

,

それぞれ

χ ² (ν ₁ ), χ ² (ν ₂ )

_{にしたがうとき}

, F =

x ₁ ν ₁ x ₂ ν ₂

(144)

の分布を

,

自由度

(ν ₁ , ν ₂ )

_の

F

_分布

F (ν ₁ , ν ₂ )

_と言う

.

•

この分布は，理論値と実際に起こった値との差を評価するのに用いられる

.

天気予報の降水確率を評価するのに用いる

,

一般に，分散分析を行なうときに用いられる

.

•

^{確率密度関数}

f (x) = Γ( ^ν ¹ ⁺ ₂ ^ν ² )

Γ( ^ν ₂ ¹ )Γ( ^ν ₂ ² ) ( ν ₁

ν ₂ ) ^ν ² ¹ x ^ν ¹ ² ⁻² (1 + ν ₁

ν ₂ x) ⁻ ^ν ¹⁺ ² ^ν ² (145)

エフ分布 ( 平均 )

•

^平均

:

証明

E(x) =

_∞

0 xf (x)dx =

_∞

0 x Γ( ^ν

⁺ ₂ ^ν

) Γ( ^ν ₂

)Γ( ^ν ₂

) ( ν ₁

ν ₂ )

^ν²¹

x

^ν¹²⁻²

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx (146)

•

^{簡単のため}

A = Γ( ^ν

⁺ ₂ ^ν

) Γ( ^ν ₂

)Γ( ^ν ₂

) ( ν ₁

ν ₂ )

^ν²¹

(147)

とおき

E(x) =

_∞

0 Axx

^ν¹²⁻²

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx = A

_∞

0 x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx

= A[ 1

− ^ν

⁺ ₂ ^ν

+ 1 ν ₂

ν ₁ x

^ν²¹

(1 + ν ₁

ν ₂ x) ¹⁻

^ν¹⁺²^ν²

] ^∞ ₀ − A 1

− ^ν

⁺ ₂ ^ν

+ 1 ν ₂ ν ₁

ν ₁ 2

_∞

0 x

²⁻¹^ν¹

(1 + ν ₁

ν ₂ x) ¹⁻

^ν¹⁺²^ν²

dx

= − A 2

− (ν ₁ + ν ₂ ) + 2 ν ₂ ν ₁

ν ₁ 2

_∞

0 x

²⁻¹^ν¹

(1 + ν ₁

ν ₂ x) ¹⁻

^ν¹⁺²^ν²

dx

= − A 2

− (ν ₁ + ν ₂ ) + 2 ν ₂ ν ₁

ν ₁ 2

_∞

0 x

²⁻¹^ν¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

(1 + ν ₁

ν ₂ x)dx

(148)

エフ分布 ( 平均 )

E(x) = − A ν ₂

− (ν ₁ + ν ₂ ) + 2 (

_∞

0 x

²⁻¹^ν¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

ν ₁

ν ₂ xdx −

_∞

0 x

²⁻¹^ν¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

)dx

= − A ν ₂

− (ν ₁ + ν ₂ ) + 2 ( ν ₁ ν ₂

_∞

0 x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx −

_∞

0 x

²⁻¹^ν¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

)dx (149)

_∞

0 A x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx = − A ν ₂

− (ν ₁ + ν ₂ ) + 2 ν ₁ ν ₂

_∞

0 x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx

− A ν ₂

− (ν ₁ + ν ₂ ) + 2

_∞

0 x

^ν²¹

⁻¹ (1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx (150)

_∞

0 A(1 + ν ₁

ν ₂ )x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx = − A ν ₂

− (ν ₁ + ν ₂ ) + 2

_∞

0 x

^ν²¹

⁻¹ (1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx (151) (1 + ν ₁

− (ν ₁ + ν ₂ ) + 2 )

_∞

0 Ax

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx = − ν ₂

− (ν ₁ + ν ₂ ) + 2 (152) E(x) =

_∞

0 Ax

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx = −

ν

₂

−( ν

₁

+ ν

₂

)+2 ν

₂

−( ν

₁

+ ν

₂

)+2

= ν ₂

ν ₂ − 2 (153)

エフ分布 ( 分散 )

E(x ² ) =

_∞

0 x ² f (x)dx =

_∞

0 x ² Γ( ^ν

⁺ ₂ ^ν

) Γ( ^ν ₂

)Γ( ^ν ₂

) ( ν ₁

ν ₂ )

^ν²¹

x

^ν¹²⁻²

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx (154) A = Γ( ^ν

⁺ ₂ ^ν

)

Γ( ^ν ₂

)Γ( ^ν ₂

) ( ν ₁

ν ₂ )

^ν²¹

(155)

を導入し

E(x ² ) =

_∞

0 x ² f (x)dx =

_∞

0 x ² Ax

^ν¹²⁻²

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx

= 2A

2 − (ν ₁ + ν ₂ ) ν ₂

ν ₁ x

^ν²¹

⁺¹ (1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

⁺¹ | ^∞ ₀

− 2A

2 − (ν ₁ + ν ₂ ) ν ₂ ν ₁ ( ν ₁

2 + 1)

_∞

0 x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

⁺¹ dx

= − 2A

2 − (ν ₁ + ν ₂ ) ν ₂ ν ₁ ( ν ₁

2 + 1)

_∞

0 x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

⁺¹ dx

= − 2A

2 − (ν ₁ + ν ₂ ) ν ₂ ν ₁ ( ν ₁

2 + 1)

_∞

0 x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx

− 2A

2 − (ν ₁ + ν ₂ ) ( ν ₁

2 + 1)

_∞

0 x

^ν²¹

⁺¹ (1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx

(156)

エフ分布 ( 分散 )

E(x ² ) = − 2A

2 − (ν ₁ + ν ₂ ) ν ₂ ν ₁ ( ν ₁

2 + 1)

_∞

0 x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx

− 2A

2 − (ν ₁ + ν ₂ ) ( ν ₁

2 + 1)

_∞

0 x

^ν²¹

⁺¹ (1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx

= − 2A

2 − (ν ₁ + ν ₂ ) ν ₂ ν ₁ ( ν ₁

2 + 1)

_∞

0 x

^ν²¹

(1 + ν ₁

ν ₂ x) ⁻

^ν¹⁺²^ν²

dx − 2

2 − (ν ₁ + ν ₂ ) ( ν ₁

2 + 1)E(x ² )

= − 2A

2 − (ν ₁ + ν ₂ ) ν ₂ ν ₁ ( ν ₁

2 + 1) ν ₂

ν ₂ − 2 − 2

2 − (ν ₁ + ν ₂ ) ( ν ₁

2 + 1)E(x ² ) (157)

(1 + 2

2 − (ν ₁ + ν ₂ ) ( ν ₁

2 + 1))E (x ² ) = − 2A

2 − (ν ₁ + ν ₂ ) ν ₂ ν ₁ ( ν ₁

2 + 1) ν ₂

ν ₂ − 2 (158)

V (x ² ) = E (x ² ) − (E(x)) ² = 2ν ₂ ² (ν ₁ + ν ₂ − 2)

ν ₁ (ν ₂ − 2) ² (ν ₂ − 4) (159)

14. 推定

点推定

•

^{データ処理は}

,

与えられたデータについて代表値や散布度などを算出するものであり

,

結論もそのデータに関してのみいえる

•

統計処理が行われるのは

,

処理結果を取扱うデータのみに限定して言及するのではなく

,

•

それを手がかりとして背後の母集団についての情報を得る

•

データの背後により大きい母集団があると考え

,

データはそこからランダムに抽出されたサンプルとみなして

,

データ処理の結果をもとに

,

母集団の様相を推測する

.

推定量

•

^{記号の約束}

•

^母集団

–

母平均

μ,

–

母標準偏差

σ,

母分散

σ ² –

相関係数

ρ

•

^{標本統計量}

(

確率変数が

x

_{で表される場合}

) –

標本平均

x,

–

標本標準偏差

√

s _xx ,

分散

s _xx –

相関係数

r

•

^{ランダムサンプル}

(x ₁ , x ₂ , . . . , x _N )

_とは

,

同一母集団から無作為に抽出された，相互に独立な

N

_{個のサンプルである．}

•

^これを

iid

サンプル（

independent and identically distributed random

samples

）という

モーメント法

• k

個の母数を推定したいとき

, k

次までの母集団モーメントと標本モーメントを対応させることにより，

k

個の方程式をたて，それを母数について解くことによって，推定量を求めるというモーメント法である

.

• μ ˆ = x, σ ˆ ² = s _xx (160)

15. 推定量とその性質

不偏性

•

^不偏性

: unbiasedness

•

^{不偏推定量}

: unbiased estimator

•

^{個々の推定量の実現値}

,

すなわち推定値は母数から離れ

,

へだたりがあっても

,

何度も推定値を求めれば

,

平均的には母数が得られるような性質

•

標本平均の期待値は母平均に等しい

•

^証明

: x ₁ , x ₂ , . . . x _N

はそれぞれ同一の母集団から無作為に抽出されているため

,

それぞれ独立かつ同一の分布であると考えてよい

.

その結果

E (x ₁ ) = E (x ₂ ) = . . . = E (x _N ) = μ (161)

が成立する

.

その結果

,

E (x) = 1 N

N i =1

E (x _i ) = μ (162)

ドキュメント内 tokei01.dvi (ページ 77-93)

乗分布

2 次元分布 ( 連続型確率変数 )

カイ 2 乗分布

•

N (0, 1)

(z 1 , z 2 , . . . z N )

x =

N

i =1

z i 2 (124)

f (x) = 1

2 n/ 2 Γ(N/2) x N/ 2−1 e − x/ 2 (125)

•

, x

(d.f.)(degrees of freedom) N

2

( χ 2 -distribution)

χ 2 N

.

• Γ(m)

Γ(m) =

∞

0

e − x x m −1 dx (126)

.

1. Γ(1) = 1 , Γ( 1 2 ) = √ π 2. Γ(m + 1) = mΓ(m)

3. m

Γ(m) = m!

カイ 2 乗分布

•

:

xf (x)dx = 1

2 N/ 2 Γ(N/2)

x N/ 2−1 e − x/ 2 dx

= 2(N/2)

2 N/ 2+1 Γ(N/2 + 1)

x N/ 2 e − x/ 2 dx = N (127)

•

:

x 2 f (x)dx − N 2 = 1

2 N/ 2 Γ(N/2)

x 2 x N/ 2−1 e − x/ 2 dx − N 2

= 4(N/2)(N/2 + 1) 2 N/ 2+2 Γ(N/2 + 2)

x N/ 2+1 e − x/ 2 dx − N 2

= 2N (128)

•

2

N

α

χ 2 N (α)

p(x ≥ χ 2 N (α)) = α (129)

N

2

x

χ 2 N (α)

α

χ 2 N (α)

100α%

ティー分布

•

x

N (0, 1)

, y

ν

2

.

•

2

x, y

t = x

y ν

(130)

(d.f.)ν

(t-distribution)

, t ν

.

•

t

f (t) = Γ( ν +1 2 )

√ νπΓ( ν 2 ) (1 + t 2

(z ₁ , z ₂ , . . . z _N )

z _i ² (124)

2 ^n/ ² Γ(N/2) x ^N/ ²⁻¹ e ⁻ ^x/ ² (125)

( χ ² -distribution)

χ ² _N

_∞

e ⁻ ^x x ^m ⁻¹ dx (126)

1. Γ(1) = 1 , Γ( ¹ ₂ ) = √ π 2. Γ(m + 1) = mΓ(m)

2 ^N/ ² Γ(N/2)

x ^N/ ²⁻¹ e ⁻ ^x/ ² dx

2 ^N/ ²⁺¹ Γ(N/2 + 1)

x ^N/ ² e ⁻ ^x/ ² dx = N (127)

x ² f (x)dx − N ² = 1

2 ^N/ ² Γ(N/2)

x ² x ^N/ ²⁻¹ e ⁻ ^x/ ² dx − N ²

= 4(N/2)(N/2 + 1) 2 ^N/ ²⁺² Γ(N/2 + 2)

x ^N/ ²⁺¹ e ⁻ ^x/ ² dx − N ²

χ ² _N (α)

p(x ≥ χ ² _N (α)) = α (129)

χ ² _N (α)

χ ² _N (α)

, t _ν

f (t) = Γ( ^ν ⁺¹ ₂ )

√ νπΓ( ^ν ₂ ) (1 + t ²

ν ) ⁻ ^ν ⁺¹ ² , t ∈ ( −∞ , + ∞ ) (131)

, N (μ, σ ² )

• σ ²

s _xx

√ s _xx / √

y = N s _xx

σ ² = 1 σ ²

(x _i − x) ² (134)

χ ² (N − 1)

, t _N

f (t) = Γ( ^N ₂ ⁺¹ )

√ N Γ( ^N ₂ )Γ( ¹ ₂ ) (1 + t ²

N ) ⁻

1 + x ²

t , Γ( ^N ₂ ⁺¹ )

√ N Γ( ^N ₂ )Γ( ¹ ₂ ) = A (137)

t ² dt, ⇒ dx = −

t − 1) ⁻¹ ^/ ² t ⁻² dt (138)

E[x ² ] = A

x ² (1 + x ²

N ) ⁻

₁

⁻² ( 1

t − 1) ¹ ^/ ² dt

₁