• 検索結果がありません。

統計的データ解析 2013

N/A
N/A
Protected

Academic year: 2021

シェア "統計的データ解析 2013"

Copied!
15
0
0

読み込み中.... (全文を見る)

全文

(1)

統計的データ解析 2013

2013.10.07

林田 清

(大阪大学大学院理学研究科)

(2)

実験データの統計処理

基本となる考え方

誤差について

母集団と標本

平均値と標準偏差

誤差伝播

最尤法

平均値につく誤差

いろいろな確率分布

最小二乗法、カイ二乗フィット

検定と推定

(時間があれば)モンテカルロシミュレーションの基礎

(3)

セミナーの方針

林田が概念を説明

次週までの問題を各自

(

少なくとも

M1

は必ず)解

問題の解答を発表

次の章の説明へ

最終試験問題は参加者に考えてもらう予定

説明資料は

web

に順次掲載していく

参考書 (他にもあれば紹介してほしい)

“誤差解析入門”, John R. Taylor (東京化学同人)

実験精度と誤差

”, N.C.

バーフォード

(

丸善)

“Data reduction and error analysis …”, Bevington & Robinson

“Numerical Recipe in C”, (

技術評論社)

統計学入門(東京大学出版会)、自然科学の統計学(東京大学出版会)

後半では演習の回を設ける。演習で使用する予定のソフト

oocalc, Excel

qdp, gnuplot

xspec

dis45, root

Xwindow

が開けること

xming

など

(4)

誤差 (Error) :真の値からのずれ

測定誤差

物差しが曲がっていた

測定する対象が室温が低いため縮んでいた

1gの単位までしかデジタル表示されない計りで1g以下

計りの目盛りを読み取る角度によって値が異なる

統計誤差

放射線源を検出器で測定したときの計数率

テレビの視聴率

偶然誤差

(Random Error)

と系統誤差

(Systematic

Error)

(5)

測定値xの分布

0 1 2 3 4 5 6

0 1 2 3 4 5 6 7 8 9 10

頻度

測定値の分布

 n

個の測定値

x 1 , x 2 , …, x n

の分布

例えば

1

本の棒の長さを

n

人の人が同じものさしを使って測定する

(同じ設計で製作した)

n

本の棒の長さ

1

個の放射線源について1分間あたりの放射線の検出個数

n

回測定する

ある振り子の振動周期をn回測定する

分布の広がりが誤差を表す

頻度分布=

ヒストグラム

(6)

母集団と標本

母集団

同じ条件で無限回の測定を繰り返したときの測定値 の分布

(

極限頻度分布)

実際には無限回の測定は不可能

極限頻度分布は存在すると仮定する

測定は母集団から標本を採取する操作

採集された標本から、母集団の分布パラメータ を推定するのが統計的解析

真の値は不可知

(7)

平均値、標準偏差

その他、中央値、最頻値

1 2

1

2 2

1 2

1

1

2 2

1

n , ,....,

1

1 ( )

1

*) 1 ( )

lim 1

lim 1 ( )

n

n i i

n i i

n i i

n n i

i n n i

i

x x x

x x

n

s x x

n x x

n n x

n x

σ

µ

σ µ

=

=

=

→∞ =

→∞ =

≡ −

=

= −

回の(独立な)測定

各々の誤差は

(標本の)平均値

(標本の)(不偏)分散(=標準偏差 ) 

不偏分散に対して を標本分散とよぶこともあるので注意 母集団の平均 

母集団の分散

わざわざ“標本の”といわないのが普通

(8)

( ) ( )

( )

1

2 2

2

2 2

2 2

2 2 2

1 1

( )

1

1

2 2

1 1

( ) ( )

2 2

1 ( ) ( ) 2( )( )

2 1 ( 1)

1 1

( )

( 1) 2

n i i

i j i j

ij i j

i j i j

i j i j

n n

ij n ij

i j

i j n

i i

x x

n

x x x x

x x

x x x x x x

x x x x x x x x

s n n

x x n n

=

= =

=

  +    + 

∆ ≡ −  + − 

   

   

= − = − − −

= − + − − − −

∆ = ∆

= −

∑ ∑

平均       

二項間の分散の和 

の平均     

( )

( ) ( )

2 2

1

2

1 1 1

2 1

( ) 2( )( )

( ) 1

( 1) ( 1)

1 ( )

( 1)

n

j i j

j

n n n

i i j

i i j

n i i

x x x x x x

n x x x x x x

n n n n

x x n

=

= = =

=

+ − − − −

= − − − −

− −

= −

∑ ∑ ∑

標本の分散(標準偏差2) (なぜ

n-1

で割るのか?)

(不偏)分散

s n 2

標準偏差

s n

(9)

誤差伝播1

2 2

1

2 2

1

2 2

2 2

( , ,...)

lim 1 ( )

( ) ( )

lim 1 ( ) ( )

lim 1 ( ) ( ) 2( )(

n

x i

n i

i i i

n

x i i

n i

i i i i

n

x f u v

x x n

x x

x x u u v v

u v

x x

u u v v

n u v

x x

u u v v u u v v

n u v

σ

σ

→∞ =

→∞ =

→∞

=

 

=   −  

∂ ∂

   

− −   ∂   + −   ∂   +

 −   ∂   + −   ∂   + 

  ∂   ∂  

 

∂ ∂

   

−   ∂   + −   ∂   + − −

 

 

[ ]

1

2 2 2 2

1 1

1

2 2

2 2 2

)

1 1

lim ( ) , lim ( )

lim 1 ( )( ) (covariance)

2

n

i

n n

u n i v n i

i i

n

uv i i

n i

x u v u

x x

u v

u u v v

n n

u u v v n

x x

u v

σ σ

σ

σ σ σ σ

=

→∞ →∞

= =

→∞ =

  ∂  ∂  + 

   ∂   ∂   

 

 

   

=   −   =   −  

 

≡   − −  

∂ ∂

  +   + +

 ∂   ∂ 

   

∑ ∑

 

共分散

v

x x

u v

∂ ∂

   +

 ∂  ∂ 

   

測定値

u,v

の関数としてxが定義 されているとき、xの誤差は

u,v

測定誤差からどう計算(伝播)さ れるか

(10)

誤差伝播2

[ ]

1

2 2

2 2 2

lim 1 ( )( )

2

n

uv i i

n i

x u v uv

u u v v n

x x x x

u v u v

σ

σ σ σ σ

→∞ =

 

≡   − −  

∂ ∂ ∂ ∂

  +   + +    +

 ∂   ∂   ∂  ∂ 

      

  

 u

とvが独立のとき(相関がないとき)、共分散

σ uv

はゼロ

2 2

2 2 2

x u v

x x

u v

σ  σ   ∂   + σ     + 

(11)

誤差伝播3

足し算、引き算 。。。誤差は同じ

バックグランドの引き算で誤差が大きくなる

かけ算

相対誤差の大きい成分が全体の誤差を決める

2 2 2

x u v

x u v x u v

σ σ σ

= + = −

= +

 あるいは    

2 2

2 2 2 2 2 2 2

2 2

u v

x u v

x uv

v u u v

u v

σ σ

σ σ σ

=

 

= + =  + 

 

 

(12)

平均値の誤差

(Error)

、不確かさ

(Uncertainty)

測定を

n

回繰り返して平均を取ることで、(偶然)

誤差を1

/√n

に小さくできる

1 2

1

2 2 2

2 1

n , ,....,

1

1 1

n n

i i

n

x x

i

x x x

x x

n

n n

σ

σ σ σ σ

=

=

= =

誤差伝播則を使

回の(独立な)測定 各々の誤差は 標本平均値

標本平均値の誤差 うと

(13)

最尤法 (Maximum Likelihood Method)

1 2

2

1 2

n , ,....,

μ Gauss)

1 1

exp 2

2

' , ,....,

'

n

i i

i i

i i

n

x x x

x x dx dQ Pdx

P x

x x x

σ

µ σ π σ

µ µ

µ +

=

  −  

≡  −   

 

 

 

回の(独立な)測定

を考える。

母集団が平均値   標準偏差 の正規( 分布の場合 1回の測定で   の値を観測する確率は

ここで  は不可知、推定値は

の組が得られる(得られた)確率を尤度とよぶ。

尤度が最大になるような が最もよい推定値と考える。

これが最尤法(Maximum Likelihood Method)の考え方。

最尤法(正規分布の場合の例)

(14)

最尤法2

最尤法(正規分布の場合の例)

2

1 2

1

2

1

' '

1 1 '

( ') exp

2 2

, ,...,

( ') ( ')

1 1 '

exp 2

2

( ') '

i

i i

n n

i i

n n

i i

x P x

n x x x

P P

x

P

µ σ σ

µ µ

σ π σ

µ µ

µ σ π σ

µ µ µ

=

=

=

  −  

=    −       

=

 − 

   

=    −   

 

     

平均値 、標準偏差 の正規分布を仮定すると を観測する確率は

回の測定で を観測する確率(尤度)は

を最大にする が最も確からしい の推定値

考え方:

最も確率の高い標本分布(測定 値の組)が実現されているはず

(15)

最尤法3

最も確からしい母集団平均

(mean)

の推定値は加算 平均

(average)

2

1

2 1

1

( ')

' 1

2

' 0

' ' 1

n

i i

n

i i

n i i

P X

X x

x dX

d

x x n

µ

µ σ

µ

µ σ

µ

=

=

=

 − 

=  

 

 − 

= −   =

 

= =

を最大にすることは次の を最小にするのと同じ

最尤法(正規分布の場合の例)

参照

関連したドキュメント

Research Institute for Mathematical Sciences, Kyoto University...

1-1 睡眠習慣データの基礎集計 ……… p.4-p.9 1-2 学習習慣データの基礎集計 ……… p.10-p.12 1-3 デジタル機器の活用習慣データの基礎集計………

5 종류의 계절 생선회와 도화새우 5 種類の旬の刺身とボタンエビ 5 kinds of sashimi and botanebi 국내산 한우 등심 데리야키 国内産韓牛ロース照り焼き.

解析モデル平面図 【参考】 修正モデル.. 解析モデル断面図(その2)

社会調査論 調査企画演習 調査統計演習 フィールドワーク演習 統計解析演習A~C 社会統計学Ⅰ 社会統計学Ⅱ 社会統計学Ⅲ.

These two kinds of oil behave similar characteristics, but it can be shown that the difference of the pressure increasing rate or P-T curves are come from the difference of

Abstract: Using the CMT analysis for local events (M>3.5) carried out regularly by National Research Institute for Earth Science and Disaster Prevention (NIED), the spatial variation

※ CMB 解析や PMF 解析で分類されなかった濃度はその他とした。 CMB