Microsoft PowerPoint - Lecture 10.ppt [互換モード]

(1)

環境プラニング演習

_II

第10回

2009 6 27

2009. 6. 27

千葉大学工学部都市環境システム学科

山崎文雄

http://ares tu chiba u jp/

1

http://ares.tu.chiba-u.jp/

講義予定

(1) 2009年 4月18日（土） 12:50ｰ14:20 演習の説明，微分・積分と数値計算1 (2) 2009年 4月25日（土） 12:50ｰ14:20 微分・積分と数値計算2 (3) 2009年 5月 9日（土） 12:50ｰ14:20 振動問題と時間積分 (4) 2009年 5月16日（土） 12:50ｰ14:20 １質点系の地震応答計算（課題１）年答算 (5) 2009年 5月16日（土） 14:30ｰ16:00 応答スペクトルの計算 (6) 2009年 5月30日（土） 12:50ｰ14:20 フーリエ解析1 (7) 2009年 5月30日（土） 14 30 16 00 フリエ解析2 （課題2） (7) 2009年 5月30日（土） 14:30ｰ16:00 フーリエ解析2 （課題2） (8) 2009年 6月13日（土） 12:50ｰ14:20 復習 (9) 2009年 6月13日（土） 14:30ｰ16:00 確率分布の基礎と正規分布 (9) 2009年 6月13日（土） 14:30ｰ16:00 確率分布の基礎と正規分布 (10) 2009年 6月27日（土） 12:50ｰ14:20 一様乱数と確率分布の検定 (11) 2009年 6月27日（土） 14:30ｰ16:00 中心極限定理と正規乱数（課題3） (11) 2009年 6月27日（土） 14:30 16:00 中心極限定理と正規乱数（課題3） (12) 2009年 7月 4日（土） 12:50ｰ14:20 確率紙の作り方・使い方 (13) 2009年 7月18日（土） 12:50ｰ14:20 基礎統計解析1 ( ) (14) 2009年 7月18日（土） 14:30ｰ16:00 基礎統計解析2 （課題4） 2

乱数

(random number)

(

)

とは？

¾でたらめ

な数列

＝出現がほぼ同じ割合＋非規則

¾最も基本的なのは

一様乱数

Æ 均一分布

) ( x fX a b− 1

¾

ピ

タ発生させる乱数は

疑似乱数

a b x 0

¾コンピュータで発生させる乱数は，

疑似乱数

(pseudo-random number)

(p

)

（本当は「でたらめ」ではない．初期値を与え，規則にし

たがって計算する）

3

たがって計算する．）

疑似乱数の要件

¾周期が長いこと

（短いとすぐ繰り返し数列になる）

¾再現性があること

¾統計的検定に耐えられること

（デタラメであることが証明できる）

（デタラメであるとが証明できる）

¾乱数発生のスピドが速いこと

¾乱数発生のスピードが速いこと

4

(2)

一様乱数の発生

(合同法)

合同式：

)

(mod

)

(

)

1 (

k

a

x

k

L

x

+

=

⋅

mod L

= Lの倍数は切り捨てる

)

(mod

)

(

)

1 (

k

a

x

k

L

x

+

１番目のx=

x(1)

: 初期値

a L x(1)は非負の整数 (上手に選ぶ必要がある)

a, L, x(1)は非負の整数 (上手に選ぶ必要がある)

実際の例

(東大計算機センタ

)

：

実際の例

(東大計算機センター)

：

初期値 19530527

（自分で与える．大きな整数）

a

=48828125

(なにがいいか検定してみる)

m

=2147483647=2

31

1 （32ビットのコンピュータで表現で

m

=2147483647=2 -1

（32ビットのコンピュタで表現で

きる最大の数）

5

Excelはオーバーフローしないのでこの方法は使えない

Excelにおける一様乱数の発生

挿入Î関数Î数学／三角ÎRAND 6

平均値，分散，変動係数の例

) ( x fX

均一分布の場合

a b− 1

a

b

x

0

平均値

μ

1 ₍

_a

+

_b

₎

平均値

μ

_X

=

2

)

(

2

1 _a

+

_b

2

1 _(b

₎

分散

σ

_X2

=

₁₂

1 (

b

−

a

)

2 変動係数

ν

_X

=

⎟

⎠

⎞

⎜

⎝

⎛

+

−

b

a

b

3

1

7 X

₃

_{⎝ + b}

_a

_⎠

統計関数とExcel (統計量からの検索)

統計量 Excel 関数名 定義式（『統計学入門』）など和 SUM 平均 AVERAGE 28 (2 1) 平均 AVERAGE p.28 (2.1) 分散（不偏分散） VAR 偏差の平方和 ÷(n - 1) => p.184 (9.5) 分散 VARP 同上 ÷n => p.37 (2.10) 標準偏差 STDEV 分散（不偏分散）VAR の平方根標準偏差 STDEV 分散（不偏分散）VAR の平方根標準偏差 STDEVP 分散VARP の平方根 => p.37 (2.10) 平均偏差 AVEDEV 偏差の絶対値の平均 => p.36 (2.9) 相関係数 CORREL 49 (3 1) 相関係数 CORREL p.49 (3.1) 共分散 COVAR 偏差の積和 ÷n => p.49 (3.1) 第 2 式データの正規偏差％点 ZTEST データ各値の正規分布対応の％点。名称は不適切。 t 検定 TTEST 2 標本 t 統計量の値に対する片側・両側確率。5％（等）と比較。カイ2 乗検定 CHITEST ピアソンのカイ2 乗の上側確率。独立性の検定のため。カイ乗検定アソンのカイ乗の側確率。独立性の検定のため。標準得点 STANDARDIZE 歪度 SKEW 歪み方の向き・程度。EXCEL 定義に問題*。尖度 KURT 尖り方の方向・程度。EXCEL 定義に問題*。順位 RANK xi のデータ範囲（絶対参照）での順位。タイ分割せず。部分集計 SUBTOTAL 累積和は引数（9, A$1:A1）etc. から複写。9 が重要。 8 * 標準的テキストとはやや異なるが、サンプルが大なら差は小さい。正式定義はこちら。 http://www.qmss.jp/e-stat/excel/commands-stat.htm

(3)

標本平均

(sample mean)

標本平均: 標本に対して計算した平均値

∑

n

1 =

x

∑

= i i

x

n

1

1 は標本数が大きくなると母集団の平均値に近づく

nは標本数(サンプル数)，

x

：エックスバー

は標本数が大きくなると，母集団の平均値

μ

に近づく．

x

n

x

=

1

+

2

+

L

+

n

データの数

データの合計

　

n

デ

タの数

例えば

=AVERAGE(A2:A11)

Excelにおける使い方：

（A2からA11までの平均） 9 （均）

標本分散

_{(sample variance)}

₍

_p

₎

標本分散

: 標本に対して計算した分散

=

2

s

1 (

x

)

2

n

n i

−

∑

Excelでは =VARP(A2:A11)

不偏標本分散

: 偏りを除いた標本分散

1

n

_i=

=

2

s

2

)

(

1 x

x

n i

−

∑

Excelでは =VAR(A2:A11)

•標本数が大きくなると，標本分散と不偏標本分散で差はない

1

)

(

1 n

i i

−

∑

=

標本数が大きくなると，標本分散と不偏標本分散で差はない

•標本数が大きくなると，不偏標本分散は母集団の分散

に近づく

•Excelでは両方の関数がある

2

σ

•Excelでは両方の関数がある．

標本標準偏差

s

1 (

x

)

2 n

=

∑

Excelでは =STDEV(A2:A11) 10

標本標準偏差

1

)

(

1 x

x

n

s

i i

−

=

∑

= Excelでは STDEV(A2:A11)

Excelにおけるヒストグラム作成

ツールÎ分析ツールÎヒストグラム棒をクリックÆデータ系列の書式設定 ÆオプションÆ棒の間隔0 11 ÆオプションÆ棒の間隔0

観測データの適合度検定

観測デタ

適合度検定

適合度検定：

観測データが理論的な確率モデルに

適合度検定：

観測デタが理論的な確率モデルに

適合しているかどうかの検定

カイ二乗

(

χ

2

_)検定

_{：ヒストグラムと理論的な確率密度}

を比較するもの

コロモゴロフースミルノフ検定

(

Kolmogorov-Smirnov Test )

：

(

Kolmogorov Smirnov Test )

観測データの累積率と理論的な確率分布関数を比

較するもの

(4)

観測データの適合度検定(2)

( )

検定

カイ二乗(χ2)検定

_{Kolmogorov-Smirnov 検定}

カイ二乗(χ2)検定

13

適合度検定の手順と例(1)

手順１：仮説の設定

帰無仮説

様乱数は

様ある

帰無仮説

H0 : EXCELの一様乱数は一様である．

対立仮説

H1 : EXCELの一様乱数は一様でない．

手順２：有意水準の設定

有意水準は帰無仮説が

もかかわらず帰無仮説が誤

有意水準αは帰無仮説が正しいにもかかわらず，帰無仮説が誤っ

ていると判断する（棄却する）確率．通常，

5%で考える．

手順

3：検定方式と棄却域の設定

グ

論度数

較

検定

有意

ヒストグラムと理論度数の比較なので，カイ二乗検定を用い，有意

水準0.05と自由度からχ

2

_{の上側確率に対応する値を求める．}

14

適合度検定の手順と例

(2)

手順

4：検定統計量の計算

データに基づき検定統計量の値を求める．カイ二乗検定では，観

測度数の期待度数からの乖離の指標

χ2 (カイ二乗)を計算．

∑

=

−

=

r i i i i

E

A

1 2 2

(

)

χ

手順５：判定と結論

検定統計量の値が棄却域に入ている場合には帰無仮説

H0を

= i 1 i

検定統計量の値が棄却域に入っている場合には，帰無仮説

H0を

棄却し，対立仮説

H1を有意と判断する．棄却域に入っていない場

合は

を棄却するとがきず

を有意とは判断きな

合には，

H0を棄却することができず，H1を有意とは判断できない．

帰無仮説

H0が棄却された場合，対立仮説H1を積極的に支持．

帰無仮説

H0が棄却されなかった場合は，疑わしさを立証できな

15

かったに過ぎない．

χ2分布における自由度と有意水準

自由度

df

上側確率

(有意水準)

α

Figure 8.3. Chi-Square Sampling Distributions for df=2, 3, and 4

16

Figure 8.4. Chi-Square Sampling Distribution for df=4

(5)

カイ

2 乗 (χ

2 ) 検定

_{EXCELのヘルプ}

CHITEST

カイ2 乗 (χ2) 検定を行います。CHITEST 関数では、統計と自由度に対するχ2 分布から値を抽出します検定をう仮説が実験証されどうをすがきて返します。χ2 検定を行うことにより、仮説が実験によって証明されたかどうかを判断することができます。書式書式 CHITEST(実測値範囲,期待値範囲) 実測値範囲期待値に対する検定の実測値が入力されているデータ範囲を指定します。期待値範囲期待値が入力されているデタ範囲を指定します実測値と期待値では行方向の値期待値範囲期待値が入力されているデータ範囲を指定します。実測値と期待値では、行方向の値の合計と列方向の値の合計がそれぞれ等しくなっている必要があります。解説解説 •実測値範囲と期待値範囲に含まれるデータの個数が異なる場合、エラー値#N/A が返されます。 •χ2 検定では、まず χ2 統計量が計算され、次に実測値と期待値の差が加算されます。CHITEST 関数は等式CHITEST = p(X >χ2) で表されますここで数は、等式CHITEST = p(X >χ2) で表されます。ここでまた Aij = i 行 j 列内の実測値の度数 (実測値頻度)

∑∑

−

=

r c ij ij

E

A

2 2

(

)

χ

Aij i 行 j 列内の実測値の度数 (実測値頻度) Eij = i 行 j 列内の期待値の度数 (期待値頻度) r = 行数 c = 列数

∑∑

= = i 1 j 1

E

ij 17 数 CHITEST 関数では、χ2 統計量と自由度 df に対する確率が計算されます。このとき、 df = (r-1)(c-1) となります。 (1次元の場合はdf = r-1)

EXCELで作成したχ

2

_{分布の上限確率表}

有意水準α 有意水準α 18

CHIINV(α, f)

挿入Î関数Î統計ÎCHIINV

EXCELによるカイ二乗検定

=CHITEST(B2:B11,C2:C11) 2 自由度f=10-1=9 2

χ

CHIINV(p, f)

したがってこの結果は一様分布で自由度と右側確率値に対応するχ2_値したがって，この結果は様分布であるとの仮説を棄却できない． 19 自由度と右側確率値に対応するχ2_値

練習問題

さいころシミュレーション

Excelの一様乱数RAND()を用いて，さいころのシミュ

レションを120回行い各目の値(1 2 3 4 5 6)がそれぞ

レーションを120回行い，各目の値(1,2,3,4,5,6)がそれぞ

れ何回出るか試してみよ．

また

結果が

様分布かどうか

またこのシミュレーション結果が一様分布かどうか，

カイ二乗検定により検定せよ．

ヒント

INT（）実数の小数点以下を切り捨てて整数化する

ヒント

すなわち，

INT(RAND()*6)+1 で1から6の間の整数が出る．

20

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

環境プラニング演習

II

第10回

2009 6 27

2009. 6. 27

千葉大学 工学部 都市環境システム学科

山崎 文雄

http://ares tu chiba u jp/

http://ares.tu.chiba-u.jp/

講義予定

乱数

(random number)

(

)

とは？

¾でたらめ

な数列

＝ 出現がほぼ同じ割合＋非規則

¾最も基本的なのは

一様乱数

Æ 均一分布

¾

ピ

タ 発生させる乱数は

疑似乱数

¾コンピュータで発生させる乱数は，

疑似乱数

(pseudo-random number)

(p

)

（本当は「でたらめ」ではない．初期値を与え，規則にし

たがって計算する ）

たがって計算する．）

疑似乱数の要件

疑似乱数の要件

¾周期が長いこと

¾周期が長いこと

（短いとすぐ繰り返し数列になる）

¾再現性があること

¾再現性があること

¾統計的検定に耐えられること

¾統計的検定に耐えられること

（デタラメであることが証明できる）

（デタラメである とが証明できる）

¾乱数発生のスピ ドが速いこと

¾乱数発生のスピードが速いこと

一様乱数の発生

(合同法)

合同式：

)

(mod

)

(

)

1

(

k

a

x

k

L

x

+

=

⋅

mod L

= Lの倍数は切り捨てる

)

(mod

)

(

)

1

(

k

a

x

k

L

_II

千葉大学工学部都市環境システム学科

山崎文雄

＝出現がほぼ同じ割合＋非規則

タ発生させる乱数は

たがって計算する）

（デタラメであるとが証明できる）

¾乱数発生のスピドが速いこと

（32ビットのコンピュタで表現で

₍

_a

_b

₎

_a

_b

_(b

₎

₁₂