• 検索結果がありません。

Xn ・E(Xi)=µ,V(Xi)= σ2を仮定 母数(µ, σ2)を推定する

N/A
N/A
Protected

Academic year: 2021

シェア "Xn ・E(Xi)=µ,V(Xi)= σ2を仮定 母数(µ, σ2)を推定する"

Copied!
31
0
0

読み込み中.... (全文を見る)

全文

(1)

第10章 推定量の求め方

10.1 最小二乗法

n個のデータ(実現値) x1,x2,· · ·,xn

・背後に対応する確率変数を仮定:X1,X2,· · ·, Xn

E(Xi)=µV(Xi)= σ2を仮定 母数(µ, σ2)を推定する。

観測データ x1, x2,· · ·, xnをもとにして,µの最小二乗推定値を求める。

minµ

n i=1

(xiµ)2 µの解をµˆ とすると,

µˆ = 1 n

n i=1

xi

となり,µˆ xを得る。

すなわち,

dn

i=1(xiµ)2

dµ =0

µについて解く。

µの最小二乗推定量はデータ xiを対応する確率変数Xi で置き換えて,

µˆ = 1 n

n i=1

Xi

(2)

となり,µˆ Xを得る( ˆµについて,推定値と推定量は同じ記号を使っている) 以上を回帰分析に応用すると,

minα,β

n i=1

(YiαβXi)2 を解くことになる。

すなわち,

n

i=1(YiαβXi)2

∂α =0

n

i=1(YiαβXi)2

∂β =0

の連立方程式をα,βについて解く。

10.2 最尤法

n個の確率変数X1, X2, · · ·, Xn は互いに独立で,同じ確率分布 f(x) f(x;θ) とする。ただし,θは母数で,例えば,θ=(µ, σ2)である。

X1, X2,· · ·,Xnの結合分布は,互いに独立なので,

f(x1,x2,· · ·,xn;θ)

n i=1

f(xi;θ) と表される。

観測データx1, x2,· · ·, xnを与えたもとで,n

i=1 f(xi;θ)θの関数として表 される。すなわち,

l(θ)=

n i=1

f(xi;θ)

(3)

l(θ)を尤度関数と呼ぶ。

maxθ l(θ)

となるθを最尤推定値θˆ =θˆ(x1,x2,· · ·,xn)と呼ぶ。

データx1,x2,· · ·,xnを確率変数X1,X2,· · ·,Xnで置き換えて,θˆ= θˆ(X1,X2,· · ·,Xn) を最尤推定量と呼ぶ。

maxθ l(θ)

maxθ logl(θ)

θの解はともに同じものであることに注意。logl(θ)を対数尤度関数と呼ぶ。

最尤推定量の性質: nが大きいとき,

θˆ N(θ, σ2θ) ただし,

σ2θ = 1

n

i=1E[(d logf(Xi;θ) dθ

)2]

= 1

n

i=1E[d2log f(Xi;θ) dθ2

]

θがベクトル(k×1)の場合,nが大きいとき,

θˆ N(θ,Σθ) ただし,

Σθ =(n

i=1

E[(logf(Xi;θ)

∂θ

)(log f(Xi;θ)

∂θ

)0])1

=(n

i=1

E[2logf(Xi;θ)

∂θ∂θ0

])1

(4)

1 正規母集団N(µ, σ2)からの標本値x1,x2,· · ·, xnを用いて,

(1) σ2が既知のとき,µの最尤推定値と最尤推定量 (2) σ2が未知のとき,µσ2の最尤推定値と最尤推定量 をそれぞれ求める。

[解]N(µ, σ2)の密度関数は,

f(x;µ, σ2)= 1

2πσ2 exp(

1

2σ2(xµ)2)

となる。したがって,互いに独立なX1,X2,· · ·,Xn の結合分布は,

f(x1,x2,· · ·,xn;µ, σ2)

n i=1

f(xi;µ, σ2)

=

n i=1

1

2πσ2 exp(

1

2σ2(xiµ)2)

=(2πσ2)n2 exp(

1 2σ2

n i=1

(xiµ)2) となる。

(1)σ2が既知のとき,尤度関数l(µ)は,

l(µ)= (2πσ2)n2 exp(

1 2σ2

n i=1

(xiµ)2) となる。

l(µ)を最大にするµlogl(µ)を最大にするµは同じになる。

したがって,対数尤度関数は,

logl(µ)= n

2log(2πσ2) 1 2σ2

n i=1

(xiµ)2 となり,

d logl(µ)

dµ = 1

σ2

n

(xiµ)=0

(5)

となるµを求める。µの解をµˆ とすると,µの最尤推定値は,

µˆ = 1 n

n i=1

xi x

を得る。

さらに,観測値 x1, x2,· · ·, xnをその確率変数X1,X2,· · ·,Xnで置き換えて,µ の最尤推定量は,

µˆ = 1 n

n i=1

Xi X

となる。

µˆ の分散を求めるために,

logf(Xi;µ)=1

2log(2πσ2) 1

2σ2(Xiµ)2 d logf(Xi;µ)

dµ = 1

σ2(Xiµ) (d logf(Xi;µ)

dµ

)2

= 1

σ4(Xiµ)2 E[(d log f(Xi;µ)

dµ

)2]

= 1

σ4E[(Xiµ)2]= 1 σ2 と計算される。

最尤推定量の性質から,nが大きいとき,

µˆ N(µ, σ2µ) ただし,

σ2µ = 1

n

i=1E[(d logf(Xi;µ) dµ

)2] = σ2 n

(6)

この場合は,nの大きさに関わらず,µˆ N(µ, σ2µ)が成り立つ。

(2)σ2が未知のとき,µσ2の尤度関数は,

l(µ, σ2)=(2πσ2)n2 exp(

1 2σ2

n i=1

(xiµ)2) となる。

対数尤度関数は,

logl(µ, σ2)= n

2log(2π) n 2logσ2

1 2σ2

n i=1

(xiµ)2 と表される。

µσ2について,最大化するためには,

logl(µ, σ2)

∂µ = 1

σ2

n i=1

(xiµ)= 0

logl(µ, σ2)

∂σ2 =n 2

1 σ2 + 1

2σ4

n i=1

(xiµ)2 =0 の連立方程式を解く。

µ,σ2の解をµˆ, ˆσ2とすると,最尤推定値は,

µˆ = 1 n

n i=1

xi x

σˆ2 = 1 n

n i=1

(xiµˆ) 1 n

n i=1

(xix) となる。

(7)

観測値x1,x2,· · ·, xnをその確率変数X1,X2,· · ·,Xnで置き換えて,µ,σ2の最 尤推定量は,

µˆ = 1 n

n i=1

Xi X

σˆ2 = 1 n

n i=1

(Xiµˆ) 1 n

n i=1

(XiX) となる。

σ2の最尤推定量σˆ2は,σ2の不偏推定量S2 = 1 n1

n i=1

(XiX)2とは異なる ことに注意。

θ= (µ, σ2)0 とする。nが大きいとき,

θˆ N(θ,Σθ) ただし,

Σθ = (n

i=1

E[2log f(Xi;θ)

∂θ∂θ0

])1

logf(Xi;θ)=1

2log(2π) 1

2log(σ2) 1

2σ2(Xi µ)2

logf(Xi;θ)

∂θ =





log f(Xi;θ)

log∂µf(Xi;θ)

∂σ2





=





1

σ2(Xiµ)

1

2σ2 + 1

2σ4(Xiµ)2





(8)

2log f(Xi;θ)

∂θ∂θ0

=





2logf(Xi;θ)

∂µ2

2logf(Xi;θ)

∂µ∂σ2

2logf(Xi;θ)

∂σ2∂µ

2logf(Xi;θ)

(σ2)2





=



 1

σ2 1

σ4(Xiµ)

1

σ4(Xiµ) 1 2σ4 1

σ6(Xiµ)2





E[2log f(Xi;θ)

∂θ∂θ0 ]

=



 1

σ2 1

σ4E(Xiµ)

1

σ4E(Xiµ) 1 2σ4 1

σ6E[(Xiµ)2]





=



 1

σ2 0

0 1

2σ4





よって,

Σθ =(n

i=1

E[2logf(Xi;θ)

∂θ∂θ0

])1

=





σ2

n 0

0 2σ4 n





まとめると,µσ2の最尤推定量µˆ =(1/n)n

i=1Xiσˆ2 =(1/n)n

i=1(XiX)2 の分布は,nが大きいとき,

( µˆ σˆ2

)

N ( ( µ

σ2 )

,





σ2

n 0

0 2σ4 n





)

(9)

2 X1, Xn,· · ·,Xnは互いに独立で,それぞれパラメータpを持ったベルヌ イ分布に従うものとする。すなわち,Xiの確率関数は,

f(x;p)= px(1 p)1−x x=0,1 となる。

このとき尤度関数は,

l(p)=

n i=1

f(xi;p)=

n i=1

pxi(1 p)1xi となり,対数尤度関数は,

logl(p)=

n i=1

logf(xi;p)

=log(p)

n i=1

xi+log(1 p)

n i=1

(1xi)

=log(p)

n i=1

xi+log(1 p)(n

n i=1

xi) となる。

logl(p)を最大にするpを求める。

d logl(p) dp = 1

p

n i=1

xi 1 1 p(n

n i=1

xi)=0

したがって,pについて解くと,pの最尤推定値pˆ は,

ˆ p= 1

n

n i=1

xi となる。

さらに,xi Xiで置き換えて,pの最尤推定量pˆ は,

ˆ p= 1

n

n i=1

Xi

(10)

となる。

ˆ

pの分布を求める。

logf(Xi;p)=Xilog(p)+(1Xi) log(1p) d logf(Xi;p)

dp = Xi

p 1Xi

1 p = Xi p p(1 p)

E[(d log f(Xi;p) dp

)2]

= E[(Xi p)2] p2(1 p)2

E[(Xi p)2]=

1 xi=0

(xi p)2f(xi;p)

=

1 xi=0

(xi p)2pxi(1p)1xi

= p2(1 p)+(1 p)2p= p(1p) 1

n

i=1E[(d logf(Xi;p) dp

)2] = p(1 p) n

したがって,

ˆ

p N(p, p(1 p) n ) を得る。

3 X1,Xn,· · ·,Xnは互いに独立で,それぞれパラメータλを持ったポアソ ン分布に従うものとする。すなわち,Xiの確率関数は,

f(x;λ)= λxe−λ

x! x=0,1,2,· · · となる。

(11)

このとき尤度関数は,

l(λ)=

n i=1

f(xi;λ)=

n i=1

λxie−λ xi! となり,対数尤度関数は,

logl(λ)=

n i=1

logf(xi;λ)

=log(λ)

n i=1

xinλ

n i=1

log(xi!) となる。

logl(λ)を最大にするpを求める。

d logl(λ) dλ = 1

λ

n i=1

xin=0

したがって,λについて解くと,λの最尤推定値λˆ は,

λˆ = 1 n

n i=1

xi

となる。

さらに,xi Xiで置き換えて,λの最尤推定量λˆ は,

λˆ = 1 n

n i=1

Xi

となる。

λˆ の分布を求める。

logf(Xi;λ)= Xilog(λ)λlog(Xi!) d logf(Xi;λ)

dλ = Xi λ 1

(12)

d2log f(Xi;λ)

dλ2 =Xi λ2 E(d2logf(Xi;λ)

dλ2

) = E(Xi) λ2

E(Xi)=

x=0

x f(x;λ)

=

x=0

xλxe−λ x!

=

x=1

xλxe−λ x!

=

x=1

λλx1e−λ (x1)!

=

x=0

λλxe−λ x!

=λ

1

n

i=1E(d2logf(Xi;λ) dλ2

) = λ n

したがって,

λˆ N(λ, λ n) を得る。

4 X1,Xn,· · ·,Xnは互いに独立で,それぞれパラメータλを持った指数分 布に従うものとする。すなわち,Xi の密度関数は,

f(x;λ)= λe−λx x> 0

(13)

このとき尤度関数は,

l(λ)=

n i=1

f(xi;λ)=

n i=1

λe−λxi となり,対数尤度関数は,

logl(λ)=

n i=1

logf(xi;λ)

=nlogλλ

n i=1

xi となる。

logl(λ)を最大にするpを求める。

d logl(λ) dλ = n

λ

n i=1

xi =0

したがって,λについて解くと,λの最尤推定値λˆ は,

λˆ = n

n

i=1xi となる。

さらに,xi Xiで置き換えて,λの最尤推定量λˆ は,

λˆ = n

n i=1Xi となる。

λˆ の分布を求める。

logf(Xi;λ)=logλλXi d logf(Xi;λ)

dλ = 1

λXi d2log f(Xi;λ)

dλ2 = 1 λ2

(14)

1

n

i=1E(d2logf(Xi;λ) dλ2

) = λ2 n

したがって,

λˆ N(λ, λ2 n) を得る。

10.2.1 変数変換

確率変数 X の密度関数を f(x),分布関数を F(x) P(X < x)とする。Y = aX+bとするとき,Y の密度関数g(y)を求める。

Y の分布関数をG(y)として,次のように変形できる。

G(y)= P(Y <y)= P(aX +b<y)

= 

P(

X< yb a

), a> 0のとき

P(

X> yb a

), a< 0のとき

= 

P(

X< yb a

), a>0のとき 1P(

X < yb a

), a<0のとき

= 

F(yb a

), a>0のとき 1F(yb

a

), a<0のとき

分布関数と密度関数との関係は,

dF(x)

dx = f(x) dG(x)

dx = g(x) であるので,Y の密度関数は,

g(y)= dG(y)

(15)

= 



1

af(yb a

), a>0のとき

1

af(yb a

), a<0のとき

= 1

af(yb a

)

と表される。

一般に,確率変数Xの密度関数を f(x)とする。単調変換X =h(Y)とすると き,Y の密度関数g(y)は,

g(y)=|h0(y)|f(h(y)) となる。

10.2.2 回帰分析への応用

回帰モデル

Yi =α+βXi+ui i=1,2,· · ·,n

u1,u2,· · ·,un は互いに独立で,すべてのiについてui N(0, σ2)を仮定する。

ui の密度関数は,

f(ui)= 1

2πσ2 exp(

1 2σ2u2i) となる。

Yi の密度関数g(Yi)は,

g(Yi)=|h0(Yi)|f(h(Yi)) によって求められる。

この場合,h(Yi)= YiαβXiなので,h0(Yi)=1となる。

(16)

したがって,Yiの密度関数は,

g(Yi)= |h0(Yi)|f(h(Yi))

= f(h(Yi))

= 1

2πσ2exp(

1

2σ2(YiαβXi)2) となる。

u1,u2,· · ·,unは互いに独立であれば,Y1,Y2,· · ·,Ynも互いに独立になるので,

Y1,Y2,· · ·,Ynの結合密度関数は,

g(Y1,Y2,· · ·,Yn)=

n i=1

g(Yi)

= (2πσ2)n2 exp(

1 2σ2

n i=1

(YiαβXi)2) となる。これはα,β,σ2の関数となっている。

よって,尤度関数は,

l(α, β, σ2)=(2πσ2)n2 exp(

1 2σ2

n i=1

(YiαβXi)2) となる。

対数尤度関数は,

logl(α, β, σ2)=n

2log(2π) n

2log(σ2)

1 2σ2

n i=1

(YiαβXi)2 となる。

logl(α, β, σ2)を最大にするために,

logl(α, β, σ2)

∂α = 1

σ2

n

(YiαβXi)= 0

参照

関連したドキュメント

1 に示す. TecchanDatabase.class Database Ga_operator.class Individual.class Main.class Control.class Control.wsdd ࡮SetURL

A:

[r]

[r]

[r]

市川 温ほか:構造的モデル化法によるダム要 素モデルの構築,土木学会第 54 回年次学術講演

配布資料は 1-503 向かいの引出 , http://hig3.net で再配布してい ます. Quiz の略解は授業終了後に

[r]