Fisher Information Matrix とクラメール

のように定義されるp行p列の行列である. p= 1の場合には,変数Xの分散を表すことからも分かるように,分散を多次元に拡張したものである.

分散共分散行列の性質としては次のものが挙げられる. 分散共分散行列は基本的には,変数の分散を表しているので, (半)正定値行列になる. すなわち,任意のu=^t(u1,· · ·, up)∈R^pに対して,

tuV (X)u= Xp i,j=1

u_iV (X)_iju_j ≥0 (7.7)

が成り立つ. ³³ 不等式(7.7)は,分散共分散行列の固有値が全て0以上(半正定値の場合)[正(正定値の場合)]であることを意味している. また, 定義から明らかであるが,分散共分散行列は対称行列である. すなわち,

V (X) =^tV (X) (7.8)

が成り立っている.

7.1.2 一致推定量と不偏推定量

一般に,母集団が大きすぎて全数調査が出来ない場合などには,母集団から標本(例えば,大きさn) を抽出し,その標本について調べることで,母集団についてのパラメータを推定することになる.

「一致推定量」とは,標本の大きさnが十分大きい極限で,母集団のパラメータを偏りなく推定できる推定量のことである. 数学的に厳密に言うと次のようになる. 標本サイズnの標本から推定した推定量をt_nと表すことにすると,任意のϵ >0,δ >0に対して,ある正の整数N が存在して,

n > N ⇒P rob{|tn−θ|< ϵ}>1−δ (7.9) となるとき,t_nを母集団のパラメータθに対応する一致推定量であるという. ³⁴

次に,「不偏推定量」は次のように定義される量である. 標本(サイズn)から推定したθˆk(x)が母集団のパラメータθ_kの不偏推定量であるとは, ˆθ_k(x)の期待値が,θ_kになることである. すなわち,

Dθˆ_k E≡

dⁿxθˆ_k(x)f(x|θ) =θ_k (7.10) ということである. 不偏推定量の重要な点は,その期待値が母集団のパラメータになることである. Fisher Analysisでは,この不偏推定量を用いて推定される,母集団のパラメータ(理論のパラメータ) の最小分散限界を見積もることになる.

のようになる. ここで確率分布関数による平均を〈·〉=R

dⁿx{·}f(x|θ)のように表した. (7.11)は, 確率分布関数の,パラメータによる一階微分の期待値は0であるということを表している. (7.11)をさらにθjで微分すると,

Z dⁿx

·∂²lnf(x|θ)

∂θi∂θj

f(x|θ) +∂lnf(x|θ)

∂θi

∂f(x|θ)

∂θj

= 0 Z

dⁿx

·∂²lnf(x|θ)

∂θi∂θj

+∂lnf(x|θ)

∂θi

∂lnf(x|θ)

∂θj

f(x|θ) = 0

¿∂²lnf(x|θ)

∂θ_i∂θ_j À

¿∂lnf(x|θ)

∂θ_i

∂lnf(x|θ)

∂θ_j À

= 0 (7.12)

となることから,m行m列の行列Iを I ≡ −

¿∂²lnf(x|θ)

∂θ∂^tθ À

¿∂lnf(x|θ)

∂θ

∂lnf(x|θ)

∂^tθ À

Iij ≡ −

¿∂²lnf(x|θ)

∂θi∂θj

¿∂lnf(x|θ)

∂θi

∂lnf(x|θ)

∂θj

(7.13) のように定めることができる. (mは理論のパラメータの個数であった. )

ここで(7.11)を考慮すると, I =

¿∂lnf(x|θ)

∂θ

∂lnf(x|θ)

∂^tθ À

¿·∂lnf(x|θ)

∂θ −

¿∂lnf(x|θ)

∂θ

À¸ ·∂lnf(x|θ)

∂^tθ −

¿∂lnf(x|θ)

∂^tθ

À¸À

= V

µ∂lnf(x|θ)

∂θ

(7.14) となることから,行列Iは, ^∂^ln^f(x|θ)

∂θ の分散共分散行列であることが分かる.

f(x|θ)は,理論のパラメータθを固定して見ると,データxの従う確率分布関数であるが,データ xを定数として,θの関数として見たときには,理論のパラメータθについて,何らかの情報を持った量だと思うことができる. 後者の見方で見たときのf(x|θ)を改めて,L(θ|x)と書き,尤度関数と呼ぶ. ³⁵ このL(θ|x)を用いて書いたときの行列I をF と書いて, Fisher Information Matrix(フィッシャー情報行列)と呼ぶ.

F = −

¿∂²lnL(θ|x)

∂θ∂^tθ À

F_ij = −

¿∂²lnL(θ|x)

∂θi∂θj

(7.15) 次に,不偏推定量の定義式(7.10)をパラメータθ_lで微分することにより,

dⁿxθˆ_k(x)∂f(x|θ)

∂θ_l =δ_kl⇔ Z

dⁿxθˆ_k(x)∂lnf(x|θ)

∂θ_l f(x|θ) =δ_kl (7.16) となる. この式から,θ_k×(7.11)を辺々引くと,

Z dⁿx

hθˆ_k(x)−θ_k

i∂lnf(x|θ)

∂θl

f(x|θ) =δ_kl→¿h

θˆ_k(x)−θ_k

i∂lnf(x|θ)

∂θl

=δ_kl (7.17)

35Lはlikelihood=尤度の頭文字である.

となるが,ここで相互共分散行列の定義(7.5)及び, (7.11), (7.10)を考慮すると,上式は, Cov

θ,ˆ ∂lnf(x|θ)

∂θ

¿hˆθ−D θˆ

Ei ·∂lnf(x|θ)

∂^tθ −

¿∂lnf(x|θ)

∂^tθ

À¸À

=1m

Cov µ

θ,ˆ ∂lnf(x|θ)

∂θ

¿hθˆ_k−D θˆ_k

Ei ·∂lnf(x|θ)

∂θ_l −

¿∂lnf(x|θ)

∂θ_l

À¸À

=δ_kl (7.18) のように表すことができる. ここで1_mはm次の単位行列である. 次に,

A(x) =

Ã θˆ

∂lnf(x|θ)

∂θ

(7.19) という2m次元のベクトルを定義する. 相互共分散行列の定義(7.5)と分散共分散行列の定義(7.6)に注意すると,Aの分散共分散行列は,

V (A) =

[A− 〈A〉]^t[A− 〈A〉]®







³ˆθ

Cov µ

θ,ˆ ^∂^ln^f(x|θ)

∂θ

Cov

µ∂lnf(x|θ)

∂θ ,θˆ

¶ V

µ∂lnf(x|θ)

∂θ





 (7.20)

のように分解して書けることが分かる. 各ブロックのサイズはm×mである. さらに(7.14) (あるいは(7.15))及び(7.18)を考慮すると,Aの分散共分散行列は,

V (A) = Ã

³θˆ

´ 1m

1_m F

(7.21) となる. V (A)は,分散共分散行列であったので, (半)正定値行列である. すなわち任意のベクトル U ∈R^2m^に対して,

tUV (A)U ≥0 (7.22)

が成り立つ. 任意のベクトルu,v ∈R^mを用いて, U =

Ã u v

(7.23) のように書けば, (7.22)は,

¡_t

u^tv¢Ã V

³ˆθ

´ 1_m 1m F

! Ã u v

≥ 0

⇔^tuV

³θˆ

u+^tuv+^tvu+^tvFv ≥ 0 (7.24)

のように表すことができる. (7.24)の左辺をg(u,v)とおくと,g(u,v)は g(u,v) = ^tuV

³θˆ

u+^tuv+^tvu+^tvFv

= ^tu

³ V

³θˆ

´−F⁻¹

´ u+^t¡

v+F⁻¹u¢ F¡

v+F⁻¹u¢

(7.25) のように変形することができる.³⁶ ここで, Fisher Information Matrix F は, (7.14), (7.15)より,

∂lnf(x|θ)

∂θ の分散共分散行列であったので,正定値行列であるとしてよい. 従ってFは正則であり,逆

36Fisher Information Matrixは定義から対称行列`

F =^tF´

であることを式変形の途中で考慮した.

行列F⁻¹が存在するとしてg(u,v)を変形した. (7.25)の第二項は,Fの正定値性から,v+F⁻¹u=0 のときに最小値0をとる. 一方で, (7.24)のように任意のu,v ∈ R^m^に対して,g(u,v) ≥0である. このことから,

³ V

³ˆθ

´−F⁻¹

u≥0, ∀u∈R^m (7.26)

が成り立つことが分かる. すなわちV

³θˆ

´−F⁻¹は(半)正定値行列である. (7.26)は,クラメール -ラオの不等式と呼ばれる. 特に,u=ei 37の場合を考えると, (7.26)から,

Vii

³ˆθ

´≥¡ F⁻¹¢

ii, 1≤i≤m (7.27)

という関係式が得られることが分かる. ここで, 分散共分散行列の対角成分Vii

³ˆθ

は, 不偏推定量 θˆi(x)の分散

¿³θˆi−D θˆi

E´₂À

であったことに注意すると, (7.27)はθˆiの最小分散限界を表していると言える. 特に最小分散限界を実現する不偏推定量のことを有効推定量と呼ぶ. 以上のことから,不偏推定量の場合の最小分散限界を求めるには, Fisher Information Matirxを計算して,その逆行列の対角成分を求めればよいことが分かる. 後の計算では,理論のパラメータの最小分散限界¡

F⁻¹¢

iiを求めることになる.

ドキュメント内 ,,., Cosmic Background ExplorerCOBE, Cosmic Microwave BackgroundCMB., Wilkinson Microwave Anisotropy ProbeWMAP, CMB,. CMB,, photon 00., photon d (ページ 80-83)

Fisher Information Matrix とクラメール - ラオの不等式