• 検索結果がありません。

統計的データ解析 2013

N/A
N/A
Protected

Academic year: 2021

シェア "統計的データ解析 2013"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

統計的データ解析 2013

2013.11.05

林田 清

(大阪大学大学院理学研究科)

(2)

グラフの書き方、フィッティングの練習

gnuplot

インターネットで参照できる日本語のマニュアルもあり

http://lagendra.s.kanazawa-u.ac.jp/ogurisu/manuals/gnuplot- intro/

http://lagendra.s.kanazawa-u.ac.jp/ogurisu/manuals/gnuplot/

qdp

Excel を利用した最小二乗フィット

サンプルのデータ

直線モデル用その1

xye.dat

次のページ

直線モデル用

http://133.1.160.249/~hayasida/Class/Class2008/xsx_ysy.txt

ガウシアンモデル用

http://133.1.160.249/~hayasida/Class/Class2008/gaussian.txt

復習を兼ねて

gnuplot/

ガウシアンモデルでフィットしてみよう

(3)

統計的検定 (statistical test)

x

10

回の測定の平均値が

̅𝑥𝑥 =0.45

、標準 偏差が

0.05

だったとする

仮説

H

(

例)母集団の平均値

µ

0.5

である

対立仮説

H’

:”母集団の平均値

µ

0.5

でない”

本当はこれを示したいので、Hを帰無仮説ともいう。

平均値

µ =0.5

、標準偏差

σ = 0.05

の母集団 から

10

個の標本をサンプルした場合に、平 均値

̅𝑥𝑥

0.05

以上ずれる(

̅𝑥𝑥 ≤ 0.45

あるいは

̅𝑥𝑥 ≥ 0.55

になる)確率

P

は?

P

が定められた危険率

(

有意水準)

α

より

小さい:仮説

H

は誤り。

H

が正しい可能性を棄て る危険性

α

を伴って。

大きい:仮説Hは棄却できない。

危険率(有意水準)

=significance level

例1

両側検定

0.55 0.45

Null hypotesis

(4)

統計的検定 (statistical test)

仮説

H

(

例)母集団の平均値は

0.5

である

対立仮説

H’

を”母集団での平均値は

0.5

より小さい”と設 定することもある。

今回測定した標本が何らかの理由により、

0.5

より小さな 値であることを示したいとい意図が背景にある場合。

平均値

µ =0.5

、標準偏差

σ = 0.05

の母集団から

10

個の標本をサンプルした場合に、平均値が

̅𝑥𝑥 ≤

0.45

である確率

P

は?

P

が定められた危険率

(

有意水準)

α

より

小さい:仮説

H

は誤り。

H

が正しい可能性を棄てる危険 性

α

を伴って。

大きい:仮説は否定できない。

2

片側検定

0.55 0.45

真の結果(不明)

𝜇𝜇 = 0.5 𝜇𝜇 < 0.5

検定 結果

H

を採択

(H

を棄却しない) 正しい判断 第

2

種の過誤

H’

を採択

(H

を棄却する) 第1種の過誤 正しい判断

ここで紹介している(一般に使われる)のは、第1種の過誤をお

かす危険率を考慮して、

H

を棄却するか、否かという検定。

(5)

χ

2

分布

2

2 2

2 2

2 2 / 2 1 / 2 / 2

2

2 2

2

2 2

( )

0 1

( ) {( ) } / 2 ( / 2)

( )

( ) 2

i

i

x x

n

n V

e

x n

E

ν χ ν

ν

χ

χ ν χ

χ χ

χ

ν

µ χ

µ σ χ

σ

ν χ ν

=

= Γ

= =

n

i=1

n

i=1

平均値 ,標準偏差 の正規分布 に従う変

自由度 の (カイ

数 の自乗和  

が従う分布を自由度 の 分布と呼ぶ。  一般に自由度 の 分布は

f

平均値 ,標準

期待値  分散 

偏差 の正規分布に従う  も自 二乗)

由度  

の 分布

2

2 2

2 2 2

2

( )

i 1 x x

n

m l

m l σ χ

χ χ χ

χ

+

n

i=1

布、 

はしかし自由度 の 分布

分布の加算:自由度 の 分布に従う変数と自由度 の 分布に従う 変数の和は、自由度 の 分布に従う。

0 0.1 0.2 0.3 0.4 0.5

0 5 10 15

P(χ2 )

χ2

χ2distribution

dof=1 dof=2 dof=4 dof=6

(6)

カイ二乗分布の確率分布の積分 あてはめの良さの検定

Data Reduction and Error Analysis for the Physical Sciences, Bevington & Robinson より

最小二乗フィットによ りモデルパラメータを 最適化した際の

χ2

値 を求める

上記の

χ2

値(以上の 値)を得る確率を表か ら調べる。

確率があまりにも小さ ければ何か間違って いる。(例えばモデル が適当でない)

educed-χ2の値の表(対応するχ2の値を超える 確率Pと自由度νの関数として表示されている)

(7)

http://cluster.f7.ems.okayama-u.ac.jp/~yan/jscscd/table/chi.html

に も同様の表(但し

reduced chi-squared

ではなく

chi-squared

の値)が掲 載されている。

Excel

なら

CHIDIST,CHIINV

(8)

フィットのよさに関するカイ二乗検定

[

問題例

]

7組の測定データ

(xi ,yi)

i=1,..,7

)で、

X

の誤 差は無視できるほど小さく、

yi

の誤差は

σi

とする。これを

y=ax+b

の直線モデルを仮定し、

a,b

をフリーパラメータと してカイ二乗フィットする。 自由度は

7-2=5

χ2min

の値 によって、どのような判断をするか?

例えば、

χ2min=15.1

を得た場合

自由度

5

χ2

分布で

15.1

以上の値を得る確率は

0.99%

結論例1:

危険率

1%

(以上)でこのモデルは棄却される”

結論例2:

危険率

0.5%

ではこのモデルは棄却されない”

χ2min=6.0

を得た場合

自由度

5

χ2

分布で

6.0

以上の値を得る確率は

31%

結論例:

(危険率

10%

では)このモデルは棄却されない”

χ2min=0.55

を得た場合

自由度

5

χ2

分布で

0.55

以下の値を得る確率は

1%

結論例

: χ2min

の値が小さすぎる(と危険率

1%

で結論できる)。誤差の

評価が不適当である可能性が大きい。”

参照

関連したドキュメント

Research Institute for Mathematical Sciences, Kyoto University...

1-1 睡眠習慣データの基礎集計 ……… p.4-p.9 1-2 学習習慣データの基礎集計 ……… p.10-p.12 1-3 デジタル機器の活用習慣データの基礎集計………

5 종류의 계절 생선회와 도화새우 5 種類の旬の刺身とボタンエビ 5 kinds of sashimi and botanebi 국내산 한우 등심 데리야키 国内産韓牛ロース照り焼き.

解析モデル平面図 【参考】 修正モデル.. 解析モデル断面図(その2)

社会調査論 調査企画演習 調査統計演習 フィールドワーク演習 統計解析演習A~C 社会統計学Ⅰ 社会統計学Ⅱ 社会統計学Ⅲ.

These two kinds of oil behave similar characteristics, but it can be shown that the difference of the pressure increasing rate or P-T curves are come from the difference of

Abstract: Using the CMT analysis for local events (M>3.5) carried out regularly by National Research Institute for Earth Science and Disaster Prevention (NIED), the spatial variation

※ CMB 解析や PMF 解析で分類されなかった濃度はその他とした。 CMB