c
2
分布
2
2 2
2 2
2 2 / 2 1 / 2 / 2
2
2
2
2
2 2
( )
0 1
( ) {( ) } / 2 ( / 2)
( )
( ) 2
i
i
x x
n
n
V
e
x
n
E
c
c
c
c
c
c
c
c
c
c
n
i=1
n
i=1
平均値 ,標準偏差 の正規分布
に従う変
自由度 の (カイ
数 の自乗和
が従う分布を自由度 の 分布と呼ぶ。 一般に自由度 の 分布は
f
平均値 ,標準
期待値 分散
偏差 の正規分布に従う も自
二乗)
由度
の
分布
分
2
2
2
2 2 2
2
( )
1
i
x x
n
m l
m l
c
c
c
c
c
n
i=1
布、
はしかし自由度 の 分布
分布の加算:自由度 の 分布に従う変数と自由度 の 分布に従う
変数の和は、自由度 の 分布に従う。
0
0.1
0.2
0.3
0.4
0.5
0 5 10 15
P(
c
2 )
c2
c2
distribution
dof=1 dof=2
dof=4 dof=6
カイ二乗分布の確率分布の積分
あてはめの良さの検定
Data Reduction and Error Analysis for the Physical Sciences, Bevington & Robinson より
•
最小二乗フィットによ
りモデルパラメータを
最適化した際の
c
2値
を求める
•
上記の
c
2値(以上の
値)を得る確率を表か
ら調べる。
•
確率があまりにも小さ
ければ何か間違って
いる。(例えばモデル
が適当でない)
reduced-
c
2
の値の表(対応する
c
2
の値を超える
確率Pと自由度
の関数として表示されている)
パラメータの推定誤差
2 2
2
1
2
2 2
2
1
1
1
1
n
a i
i i i
n
i
b i
i i i
a
y
x
b
y
最適化したパラメータはあくまでもパラメータの
真の値の推定値。 必ず推定誤差がある。
直線モデルの場合、誤差伝播側より計算できる
2 2
2
2 2 2 2
2
2 2 2
2 2
2
2
2 2
2
1 1
2
2
0, 0
,
1 1
1
1
( )
( , )
i i i i
i i i i
n n
i i i
i i i i i
i i i i
i i
i i i
i
i i i i
a b
x y x y
a
x y x x
y y
y
x y ax b
P a b
b
x x
c c
c
c
c
a b
から を最小
を最大にする
にす
= を最小にす
とし
ただ
る
る て
し
2
任意関数の最小二乗(カイ二乗)フィット
2
2
1
2 2
2 2
2 min
2
2 min 2 min
( )
( )
1
n
i i
i i
y x
y
y x
m
n m
a
a
a
a
a
a
a
c
c c
c
c
c
c
c
c
任意の関数形
をモデルに採用した場合でも
を最小にするようパラメータを決定する。
パラメータの数を として は自由度 =
の 分布に従うことが期待される。
パラメータの誤差の推定:
を最小にするパラメータ値
に対して、 を1だけ増加させる
(
) の値、
、
を探す。
の誤差範囲(1パ
ラメータ68%信頼水準)は
a
c2 min
a
から
a
c2 min
a
。
カイ二乗フィットのパラメータ推定誤差1
1 1 , 1
1
1
( , ),...., ( ) ,....,
,...,
( ; ,..., )
( ,..., )
n n n
n
p
p
x y x y y y
f x a a
a a
1
n回の測定でデータの組 が得られたとし、 の測定誤差
(ただし正規分布するランダム誤差)を とする。これらのデータ点は、
p個のパラメータで指定されるモデル に、正規分布に従う誤差が
付加されたデータで構成される母集団から採取されたと仮定する。
パラメータの真の値(これは不可知)を と仮定
2
; 1
1 2
1
2
; 1
2 2 2
1
1 1
( ,..., )
1
( ,..., ) exp
2
2
( ,..., )
exp
ˆ ˆ
( ,..., ) ( ,..., )
n
i i p
p
i i i
n
i i p
i i
p p
y f x a a
P a a
y f x a a
n
P a a a a
c c c
すると尤度
(データ点の組が得られる確率は)は
の中身を と定義する。 は自由度 の 分布に従う。
一方 を最大にするようなパラメータの組(=最適パラメータ)を と
す
2
; 1
2 2
min
1
2
min
2
ˆ ˆ
( ,..., )
-n
i i p
i i
y f x a a
p
n p
c c
c
c
るとこれは の最小値 を与える。
はp個のパラメータによって調整して最小化を行ったので自由度が 減って、
自由度 の 分布に従う。
カイ二乗フィットのパラメータ推定誤差2
2
; 1 1 1
2 2
2
; 1 ; 1
2
2
1 1
2
1 1
ˆ
ˆ
,...,
,...,
( ,...,
)
ˆ
ˆ
,...,
,...,
ˆ
1
1
( ,...,
)
( ,...,
)
2
i p p p
p
n
i i p i i p
j j j
i i j
j j
p p
j j
f x a
a
a
a
a
a
y
f x a
a
y
f x a
a
A a
a
a
A
P a
a
F a
a
c
c
c
j
が
の線形関数の場合、
が の最小値を与えることに
注意すると
という形にかけるはず(
=0)。
とすると
を含まない関数
2
2
1
2 2 2 2
min
; 1 1
2 2 2 2
min
ˆ
exp
2
,...,
,...,
p
j j
j
i p p
a
a
f x a
a
a
a
c
c
c
c
c
c
c
c
これから
は自由度pの 分布に従うことがわかる。
が
の線形関数でない場合は、このような形にはかけないが
は自由度pの 分布で近似する。
区間推定
) /
- ( / 2) ( / 2)
x
z
z x z
x z x z
例)
平均値 、標準偏差 の正規分布に従う母集団
から、1回の測定で測定値 を採取する操作を
考える。 の真の値は知らず、 は何らかの方法で
推定できていたとする(例えば測定誤差に等しい
など)。 の存在する範囲はどのように推定できるか?
を平均0、標準偏差1の正規分布に従う変数だとして、
確率1- となる区間は
- ( /2) ( ( /2)
変形して
100 (1- )
が信頼係数 %での の信頼区間
1-
/
2
( / 2)
z
- ( / 2)
z
信頼区間=confidence interval、信頼係数=confidence level
z
( )
相関が0でない例
ラインスペクトルをガウシアンモデルでフィットする
。
2
2
2 2
2 2 2
( ) exp
2
, , ,
, ,
,
2
(
A B C
I A B
x C
F x A
B
A B C
A B C
I A B
I I
A B
G x
モデルとして次の形式のガウシアン関数を仮定
して をフィッティングにより求める。
フィッティングプログラムは の最適値と
その誤差 , を出力してくれる。
このラインの積分強度は
共分散を無視して と計算すると、
誤差を過大評価する恐れがある。
2
2
) exp
2
2
x C
I
B
B
というモデル式を使えば、このような問題は回避できる
宿題
D
デルタカイ2乗=1がパラメータの推定誤差になるこ
とをy(x)=bのモデルの例で示せ。
xspecのフィッティングの出力結果に関して、具体的
な例を使い、どのような定義の値がかかれているか
説明せよ。
xにも誤差がある場合どのように扱うべきか?x,yが
独立で、それぞれ正規分布に従う誤差をもっている
として、直線モデルの場合を例にとって考えよ。(ヒン
ト:下の式)
2 2
2 2
2 2
2 2
ˆ ˆ
1 1
ˆ
( , ; , , , ) exp exp
2 2
2 2
ˆ ˆ, ˆ ˆ
ˆ ˆ
1
ˆ
( , ; , , , ) exp exp
2 2 2
i i
i i xi yi
xi yi
xi yi
i i i i
i i xi yi
xi yi xi yi
x x y y
P a b x y dx
x y y ax b
x x y ax b y ax
P a b x y dx
ただし は であらわされる直線モデル上の点
2
2 2 2
2
xi yi
b
a