• 検索結果がありません。

統計的データ解析 2013

N/A
N/A
Protected

Academic year: 2021

シェア "統計的データ解析 2013"

Copied!
10
0
0

読み込み中.... (全文を見る)

全文

(1)

統計的データ解析 2013

2013.10.28 林田 清

(大阪大学大学院理学研究科)

(2)

問題A

1.

独立でない測定値

u,v

と、その関数x

=f(u,v)

の具体例をひとつあげよ。この 例において、誤差伝搬則で共分散を無視するか考慮するかで、

x

の誤差 が過大評価されるか過少評価されるか、定性的に述べよ。(井上2)

2.

あるきめられた時間T

(s)

の間に、1個の放射線検出器を用いて放射線源 の強さを測定する。ソースを測定しているときの(バックグランド込みの)カ ウントレートの期待値が

r(c/s),

ソースを外したときのカウントレートの期待

値が

b(c/s

)であるとき、時間Tのうちでソース測定の時間をいくらにとるの

が最適か?(吉田)

3.

ある

1

本の棒の長さに関して

x 1 ,x 2 ,…,x n

n

回分の測定値がある。測定誤 差は個々に異なる

s i

と仮定して、この棒の長さを最尤法で推定せよ。

(

内 田)

4.

独立な二つの測定量

x,y

s x ,s y

の誤差をもっているとき、

x+y

の誤差は誤 差伝搬則を使うと

sqrt(s x 2 +s y 2 )

とかける。

x,y

が正規分布に従うことから出 発して、これを証明せよ。(

Taylor

の本の

p.153

を参照;

5.53

式は

1/2

間違 い?) (片多)

5.

あるコインの表が出る確率を

p

を評価したい。

10

回投げる実験をしたところ

4

回表が出た。最尤法により、

p

を推定せよ。(吉永)

(3)

データのモデル化、あてはめ (Fit) 、回帰

ばらつきのある測定値に適当なモ デル(直線や曲線)であてはめるこ と

モデル

直線の場合。。。線形回帰

多項式の場合

一般の関数の場合

データの誤差

各点共通の場合

各点で重みが異なる場合

モデル点のまわりのばらつき

正規分布の場合

それ以外の場合

0 5 10 15

0 2 4 6 8 10

X

-1 0 1 2 3 4 5

0 2 4 6 8 10

X

(4)

最小二乗フィット ( 例:直線モデル) 1

0 0

0 0 0

0

( )

,

, ( )

( )

i i

i i i

x y x y

y x ax b

a b

a b y x a x b

y y x s

 

 

測定値の組( , )があり、独立変数 と従属変数 の間の関係を  

で近似するとき 、 に関する最も確からしい推定値は どうやって決められるか?

母集団における係数を とし、”真”の関係式を

さらに測定値 は平均値 、標準偏差 の 正規分布に従うと仮定する。

0 5 10 15

0 2 4 6 8 10

X

正規分布に従う

母集団から標本

を 1 個採ってくる

のが測定

(5)

最小二乗フィット ( 例:直線モデル) 2

2 0

2 0

0 0

1

1 1

1 1 ( )

exp 2 2

( )

1 1

( , ) exp

2 2 , ( ,

i i

i i

i

i i

i

n n n

i i

i

i

i i i i

i

y P

y y x P

n y

y y x

P a b P

a b y

P a b

s  s

s   s

 

    

 

   

   

 

 

      

   

                         

を観測する確率(密度) は

個の観測値 の組を得る確率(密度)は

同様に任意の係数推定値 に従うときに観測値 の組を得る確率(密度)は

2

1 1

0 0

0 0

1 1 ( )

) exp

2 2 ( , )

( , ) ( , ) ( , )

n n

i i

i i i i

y y x

P a b

P a b a b a b

s   s

 

      

   

                       

観測は母集団 から採取する操作。 

の最大値を与えるような が の最尤推定値。

最尤法の考え方

(6)

最小二乗フィット ( 例:直線モデル) 3

2 2

2

2 2 2 2

2

2 2 2

2 2

2

2

2 2

2

1 1

2

2

0, 0

,

1 1

1

1 ( )

( , )

i i i i

i i i i

n n

i i i

i i i i i

i i i i

i i

i i i

i

i i i i

a b

x y x y

a

x y x x

y y

y

x y ax b

P a b

b

x x

 

s s s s

s s s

 s s

s

s s s

 

   

 

 

   

  

 

   

  

 

  

      

 

 

   

   

   

  

 

a b から を最小

を最大にする

にす

= を最小にす

とし

ただ

る て

2

 

 

二乗の和を最小にするので 最小二乗フィットと呼ぶ。

2 フィットともいう。

 

 

 

 

 

2

2 2 1

2 2

1 , )

,

, ) ( )

1

,

1

n

i i

i i i

i

i i

i i

i

i i i i i

i i

y ax b a b

x y x

a n x y x y

b x y x x y

n x b

x

ax a b

s

 

 

  

  

   

 

2

各点の誤差が同一のとき

を最小にする( 求めることは、各測定点 とモデル点 ( の距離のニ乗和を最小にする を求める

ただ

ことと等

(7)

グラフの書き方、フィッティングの練習

 gnuplot

 インターネットで参照できる日本語のマニュアルもあり

 http://lagendra.s.kanazawa-u.ac.jp/ogurisu/manuals/gnuplot- intro/

 http://lagendra.s.kanazawa-u.ac.jp/ogurisu/manuals/gnuplot/

 qdp

 Excel を利用した最小二乗フィット

 サンプルのデータ

直線モデル用その1

xye.dat

次のページ

直線モデル用

http://133.1.160.249/~hayasida/Class/Class2008/xsx_ysy.txt

ガウシアンモデル用

http://133.1.160.249/~hayasida/Class/Class2008/gaussian.txt

(8)

gnuplot の練習

 データファイル

(例えば)

xye.dat を用意 する。

1.0 2.2 0.2 2.0 2.9 0.1 3.0 4.3 0.3 4.0 5.0 0.1 5.0 5.8 0.3

 端末で gnuplot とうつと起動する。続 いて以下の操作を試してみる。

 plot "xye.dat" using 1:2:3 with yerrorbars

 set xrange[0.0:7.0]

 set yrange[0.0:7.0]

 f(x)=a*x+b

 fit f(x) "xye.dat" using 1:2:3 via a,b

(ここで表示されるフィット結果を理解せよ)

 replot f(x)

次に、各点の誤差を無視した(重みづけなしの)フィットを 比較のためやってみると

 g(x)=c*x+d

 fit g(x) "xye.dat" using 1:2 via c,d

 replot f(x),g(x)

(9)

qdp によるグラフ表示、フィットの練習

 データの用意、 gnuplot 用の xye.dat を使用する。ただし、 3 列目 が y のエラーであることを指定するために、ファイルの先頭に read serror 2という一行を追加する。

 端末で(常深研標準の設定している場合) headas とうつ

 qdp ファイル名でグラフ表示されるはず

 表示範囲を指定したい場合は r x 0.0 7.0 とか。詳しくはマニュ アル参照のこと。( xspec の plot コマンドとほとんど同じ)

 http://heasarc.gsfc.nasa.gov/ftools/others/qdp/qdp.html

 直線モデルによるフィットは

 model linr cons

パラメータの初期値入力

 fit

(10)

Excel を利用したフィティングの演習

 Excel でソルバーを利用して  2 の最小値を求める。

 サンプル Excel ファイル

 http://133.1.160.249/~hayasida/Class/Class2010/m1m2se

minar/20101117_fitting.xlsx

参照

関連したドキュメント

この画面において、「IF 条件が満たされ るケース」をクリックし、 「IF」ボタンをク リックする。すると図 16

必須である。例えば,PC1 軸が 90  %の情報を保持し,PC2

[r]

 某医科大学の眼科教室に協力してデータ解析を行 いました.データはある幼稚園から高校まである学 校の生徒( 4 歳から 18 歳)約 4000

証明 定理 3.2 の後半の証明と同様である。 3.3 まとめ • H1誤差評価については – 1次元の証明は、誤差最小の原理+補間関数の局所的な誤差 – 2次元の証明は、誤差最小の原理+補間関数の局所的な誤差+分割の正則性から導 かれる大域的な誤差評価 • L2 誤差評価は、H1 誤差評価よりも h の冪が1高い評価が得られるAubin-Nitcshe の

古典的な尤度比検定 (deviance 差が χ 2 分布にしたがうと仮定) このふたとおりを説明します.まずは parametric bootstrap

以降に、具体的な風況データ整備の手順を示す。.. ③