統計的データ解析 2013
2013.10.28 林田 清
(大阪大学大学院理学研究科)
問題A
1.
独立でない測定値u,v
と、その関数x=f(u,v)
の具体例をひとつあげよ。この 例において、誤差伝搬則で共分散を無視するか考慮するかで、x
の誤差 が過大評価されるか過少評価されるか、定性的に述べよ。(井上2)2.
あるきめられた時間T(s)
の間に、1個の放射線検出器を用いて放射線源 の強さを測定する。ソースを測定しているときの(バックグランド込みの)カ ウントレートの期待値がr(c/s),
ソースを外したときのカウントレートの期待値が
b(c/s
)であるとき、時間Tのうちでソース測定の時間をいくらにとるのが最適か?(吉田)
3.
ある1
本の棒の長さに関してx 1 ,x 2 ,…,x n
のn
回分の測定値がある。測定誤 差は個々に異なるs i
と仮定して、この棒の長さを最尤法で推定せよ。(
内 田)4.
独立な二つの測定量x,y
がs x ,s y
の誤差をもっているとき、x+y
の誤差は誤 差伝搬則を使うとsqrt(s x 2 +s y 2 )
とかける。x,y
が正規分布に従うことから出 発して、これを証明せよ。(Taylor
の本のp.153
を参照;5.53
式は1/2
間違 い?) (片多)5.
あるコインの表が出る確率をp
を評価したい。10
回投げる実験をしたところ4
回表が出た。最尤法により、p
を推定せよ。(吉永)データのモデル化、あてはめ (Fit) 、回帰
ばらつきのある測定値に適当なモ デル(直線や曲線)であてはめるこ と
モデル
直線の場合。。。線形回帰
多項式の場合
一般の関数の場合
データの誤差
各点共通の場合
各点で重みが異なる場合
モデル点のまわりのばらつき
正規分布の場合
それ以外の場合0 5 10 15
0 2 4 6 8 10
X
-1 0 1 2 3 4 5
0 2 4 6 8 10
X
最小二乗フィット ( 例:直線モデル) 1
0 0
0 0 0
0
( )
,
, ( )
( )
i i
i i i
x y x y
y x ax b
a b
a b y x a x b
y y x s
測定値の組( , )があり、独立変数 と従属変数 の間の関係を
で近似するとき 、 に関する最も確からしい推定値は どうやって決められるか?
母集団における係数を とし、”真”の関係式を
さらに測定値 は平均値 、標準偏差 の 正規分布に従うと仮定する。
0 5 10 15
0 2 4 6 8 10
X
正規分布に従う
母集団から標本
を 1 個採ってくる
のが測定
最小二乗フィット ( 例:直線モデル) 2
2 0
2 0
0 0
1
1 1
1 1 ( )
exp 2 2
( )
1 1
( , ) exp
2 2 , ( ,
i i
i i
i
i i
i
n n n
i i
i
i
i i i i
i
y P
y y x P
n y
y y x
P a b P
a b y
P a b
s s
s s
を観測する確率(密度) は個の観測値 の組を得る確率(密度)は
同様に任意の係数推定値 に従うときに観測値 の組を得る確率(密度)は
2
1 1
0 0
0 0
1 1 ( )
) exp
2 2 ( , )
( , ) ( , ) ( , )
n n
i i
i i i i
y y x
P a b
P a b a b a b
s s
観測は母集団 から採取する操作。
の最大値を与えるような が の最尤推定値。
最尤法の考え方
最小二乗フィット ( 例:直線モデル) 3
2 2
2
2 2 2 2
2
2 2 2
2 2
2
2
2 2
2
1 1
2
2
0, 0
,
1 1
1
1 ( )
( , )
i i i i
i i i i
n n
i i i
i i i i i
i i i i
i i
i i i
i
i i i i
a b
x y x y
a
x y x x
y y
y
x y ax b
P a b
b
x x
s s s s
s s s
s s
s
s s s
a b から を最小
を最大にする
にす
= を最小にす
とし
ただ
る
る て
し
2
二乗の和を最小にするので 最小二乗フィットと呼ぶ。
2 フィットともいう。
2
2 2 1
2 2
1 , )
,
, ) ( )
1
,
1
n
i i
i i i
i
i i
i i
i
i i i i i
i i
y ax b a b
x y x
a n x y x y
b x y x x y
n x b
x
ax a b
s
2
各点の誤差が同一のとき
を最小にする( を 求めることは、各測定点 とモデル点 ( の距離のニ乗和を最小にする を求める
ただ
価
し
ことと等