• 検索結果がありません。

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

N/A
N/A
Protected

Academic year: 2021

シェア "Microsoft PowerPoint - Lecture 10.ppt [互換モード]"

Copied!
5
0
0

読み込み中.... (全文を見る)

全文

(1)

環境プラニング演習

II

第10回

2009 6 27

2009. 6. 27

千葉大学 工学部 都市環境システム学科

山崎 文雄

http://ares tu chiba u jp/

1

http://ares.tu.chiba-u.jp/

講義予定

(1) 2009年 4月18日(土) 12:50ー14:20 演習の説明,微分・積分と数値計算1 (2) 2009年 4月25日(土) 12:50ー14:20 微分・積分と数値計算2 (3) 2009年 5月 9日(土) 12:50ー14:20 振動問題と時間積分 (4) 2009年 5月16日(土) 12:50ー14:20 1質点系の地震応答計算 (課題1) 年 答 算 (5) 2009年 5月16日(土) 14:30ー16:00 応答スペクトルの計算 (6) 2009年 5月30日(土) 12:50ー14:20 フーリエ解析1 (7) 2009年 5月30日(土) 14 30 16 00 フ リエ解析2 (課題2) (7) 2009年 5月30日(土) 14:30ー16:00 フーリエ解析2 (課題2) (8) 2009年 6月13日(土) 12:50ー14:20 復習 (9) 2009年 6月13日(土) 14:30ー16:00 確率分布の基礎と正規分布 (9) 2009年 6月13日(土) 14:30ー16:00 確率分布の基礎と正規分布 (10) 2009年 6月27日(土) 12:50ー14:20 一様乱数と確率分布の検定 (11) 2009年 6月27日(土) 14:30ー16:00 中心極限定理と正規乱数(課題3) (11) 2009年 6月27日(土) 14:30 16:00 中心極限定理と正規乱数(課題3) (12) 2009年 7月 4日(土) 12:50ー14:20 確率紙の作り方・使い方 (13) 2009年 7月18日(土) 12:50ー14:20 基礎統計解析1 ( ) (14) 2009年 7月18日(土) 14:30ー16:00 基礎統計解析2 (課題4) 2

乱数

(random number)

(

)

とは?

¾でたらめ

な数列

= 出現がほぼ同じ割合+非規則

¾最も基本的なのは

一様乱数

Æ 均一分布

) ( x fX a b− 1

¾

タ 発生させる乱数は

疑似乱数

a b x 0

¾コンピュータで発生させる乱数は,

疑似乱数

(pseudo-random number)

(p

)

(本当は「でたらめ」ではない.初期値を与え,規則にし

たがって計算する )

3

たがって計算する.)

疑似乱数の要件

疑似乱数の要件

¾周期が長いこと

¾周期が長いこと

(短いとすぐ繰り返し数列になる)

¾再現性があること

¾再現性があること

¾統計的検定に耐えられること

¾統計的検定に耐えられること

(デタラメであることが証明できる)

(デタラメである とが証明できる)

¾乱数発生のスピ ドが速いこと

¾乱数発生のスピードが速いこと

4

(2)

一様乱数の発生

(合同法)

合同式:

)

(mod

)

(

)

1

(

k

a

x

k

L

x

+

=

mod L

= Lの倍数は切り捨てる

)

(mod

)

(

)

1

(

k

a

x

k

L

x

+

1番目のx=

x(1)

: 初期値

a L x(1)は非負の整数 (上手に選ぶ必要がある)

a, L, x(1)は非負の整数 (上手に選ぶ必要がある)

実際の例

(東大計算機センタ

)

実際の例

(東大計算機センター)

初期値 19530527

(自分で与える.大きな整数)

a

=48828125

(なにがいいか検定してみる)

m

=2147483647=2

31

1

(32ビットのコンピュータで表現で

m

=2147483647=2 -1

(32ビットのコンピュ タで表現で

きる最大の数)

5

Excelはオーバーフローしないのでこの方法は使えない

Excelにおける一様乱数の発生

挿入Î関数Î数学/三角ÎRAND 6

平均値,分散,変動係数の例

) ( x fX

均一分布の場合

a b− 1

a

b

x

0

平均値

μ

1

(

a

+

b

)

平均値

μ

X

=

2

)

(

2

1

a

+

b

2

1

(b

)

分散

σ

X2

=

12

1

(

b

a

)

2

変動係数

ν

X

=

+

b

a

a

b

3

1

7 X

3

⎝ + b

a

統計関数とExcel (統計量からの検索)

統計量 Excel 関数名 定義式(『統計学入門』)など 和 SUM 平均 AVERAGE 28 (2 1) 平均 AVERAGE p.28 (2.1) 分散(不偏分散) VAR 偏差の平方和 ÷(n - 1) => p.184 (9.5) 分散 VARP 同上 ÷n => p.37 (2.10) 標準偏差 STDEV 分散(不偏分散)VAR の平方根 標準偏差 STDEV 分散(不偏分散)VAR の平方根 標準偏差 STDEVP 分散VARP の平方根 => p.37 (2.10) 平均偏差 AVEDEV 偏差の絶対値の平均 => p.36 (2.9) 相関係数 CORREL 49 (3 1) 相関係数 CORREL p.49 (3.1) 共分散 COVAR 偏差の積和 ÷n => p.49 (3.1) 第 2 式 データの正規偏差%点 ZTEST データ各値の正規分布対応の%点。名称は不適切。 t 検定 TTEST 2 標本 t 統計量の値に対する片側・両側確率。5% (等)と比較。 カイ2 乗検定 CHITEST ピアソンのカイ2 乗の上側確率。独立性の検定のため。 カイ 乗検定 アソンのカイ 乗の 側確率。独立性の検定のため。 標準得点 STANDARDIZE 歪度 SKEW 歪み方の向き・程度。EXCEL 定義に問題*。 尖度 KURT 尖り方の方向・程度。EXCEL 定義に問題*。 順位 RANK xi のデータ範囲(絶対参照)での順位。タイ分割せず。 部分集計 SUBTOTAL 累積和は引数(9, A$1:A1)etc. から複写。9 が重要。 8 * 標準的テキストとはやや異なるが、サンプルが大なら差は小さい。正式定義はこちら。 http://www.qmss.jp/e-stat/excel/commands-stat.htm

(3)

標本平均

(sample mean)

標本平均: 標本に対して計算した平均値

n

1

=

x

= i i

x

n

1

1

は標本数が大きくなると 母集団の平均値 に近づく

nは標本数(サンプル数),

x

:エックスバー

は標本数が大きくなると,母集団の平均値

μ

に近づく.

x

n

x

x

x

x

=

=

1

+

2

+

L

+

n

データの数

データの合計

 

n

タの数

例えば

=AVERAGE(A2:A11)

Excelにおける使い方:

(A2からA11までの平均) 9 ( 均)

標本分散

(sample variance)

(

p

)

標本分散

: 標本に対して計算した分散

=

2

s

1

(

x

x

)

2

n

n i

Excelでは =VARP(A2:A11)

不偏標本分散

: 偏りを除いた標本分散

1

n

i=

=

2

s

2

)

(

1

x

x

n i

Excelでは =VAR(A2:A11)

•標本数が大きくなると,標本分散と不偏標本分散で差はない

1

)

(

1

n

i i

=

標本数が大きくなると,標本分散と不偏標本分散で差はない

•標本数が大きくなると,不偏標本分散は母集団の分散

に近づく

•Excelでは両方の関数がある

2

σ

•Excelでは両方の関数がある.

標本標準偏差

s

1

(

x

x

)

2 n

=

Excelでは =STDEV(A2:A11) 10

標本標準偏差

1

)

(

1

x

x

n

s

i i

=

= Excelでは STDEV(A2:A11)

Excelにおけるヒストグラム作成

ツールÎ分析ツールÎヒストグラム 棒をクリックÆデータ系列の書式設定 ÆオプションÆ棒の間隔0 11 ÆオプションÆ棒の間隔0

観測データの適合度検定

観測デ タ

適合度検定

適合度検定:

観測データが理論的な確率モデルに

適合度検定:

観測デ タが理論的な確率モデルに

適合しているかどうかの検定

カイ二乗

(

χ

2

)検定

:ヒストグラムと理論的な確率密度

を比較するもの

を比較するもの

コロモゴロフースミルノフ検定

(

Kolmogorov-Smirnov Test )

(

Kolmogorov Smirnov Test )

観測データの累積率と理論的な確率分布関数を比

較するもの

較するもの

(4)

観測データの適合度検定(2)

( )

検定

カイ二乗(χ2)検定

Kolmogorov-Smirnov 検定

カイ二乗(χ2)検定

13

適合度検定の手順と例(1)

手順1: 仮説の設定

帰無仮説

様乱数は

様 ある

帰無仮説

H0 : EXCELの一様乱数は一様である.

対立仮説

H1 : EXCELの一様乱数は一様でない.

手順2: 有意水準の設定

有意水準 は帰無仮説が

もかかわらず 帰無仮説が誤

有意水準αは帰無仮説が正しいにもかかわらず,帰無仮説が誤っ

ていると判断する(棄却する)確率.通常,

5%で考える.

手順

3: 検定方式と棄却域の設定

論度数

検定

有意

ヒストグラムと理論度数の比較なので,カイ二乗検定を用い,有意

水準0.05と自由度からχ

2

の上側確率に対応する値を求める.

14

適合度検定の手順と例

(2)

手順

4: 検定統計量の計算

データに基づき検定統計量の値を求める.カイ二乗検定では,観

測度数の期待度数からの乖離の指標

χ2 (カイ二乗)を計算 .

=

=

r i i i i

E

E

A

1 2 2

(

)

χ

手順5: 判定と結論

検定統計量の値が棄却域に入 ている場合には 帰無仮説

H0を

= i 1 i

検定統計量の値が棄却域に入っている場合には,帰無仮説

H0を

棄却し,対立仮説

H1を有意と判断する.棄却域に入っていない場

合 は

を棄却する とが きず

を有意とは判断 きな

合には,

H0を棄却することができず,H1を有意とは判断できない.

帰無仮説

H0が棄却された場合,対立仮説H1を積極的に支持.

帰無仮説

H0が棄却されなかった場合は,疑わしさを立証できな

15

かったに過ぎない.

χ2分布における自由度と有意水準

自由度

df

上側確率

(有意水準)

α

Figure 8.3. Chi-Square Sampling Distributions for df=2, 3, and 4

16

Figure 8.4. Chi-Square Sampling Distribution for df=4

(5)

カイ

2 乗 (χ

2

) 検定

EXCELのヘルプ

CHITEST

カイ2 乗 (χ2) 検定を行います。CHITEST 関数では、統計と自由度に対するχ2 分布から値を抽出し ます 検定を う 仮説が実験 証 され どう を す が き て返します。χ2 検定を行うことにより、仮説が実験によって証明されたかどうかを判断することができ ます。 書式 書式 CHITEST(実測値範囲,期待値範囲) 実測値範囲 期待値に対する検定の実測値が入力されているデータ範囲を指定します。 期待値範囲 期待値が入力されているデ タ範囲を指定します 実測値と期待値では 行方向の値 期待値範囲 期待値が入力されているデータ範囲を指定します。実測値と期待値では、行方向の値 の合計と列方向の値の合計がそれぞれ等しくなっている必要があります。 解説 解説 •実測値範囲と期待値範囲に含まれるデータの個数が異なる場合、エラー値#N/A が返されます。 •χ2 検定では、まず χ2 統計量が計算され、次に実測値と期待値の差が加算されます。CHITEST 関 数は 等式CHITEST = p(X >χ2) で表されます ここで 数は、等式CHITEST = p(X >χ2) で表されます。ここで また Aij = i 行 j 列内の実測値の度数 (実測値頻度)

∑∑

=

r c ij ij

E

E

A

2 2

(

)

χ

Aij i 行 j 列内の実測値の度数 (実測値頻度) Eij = i 行 j 列内の期待値の度数 (期待値頻度) r = 行数 c = 列数

∑∑

= = i 1 j 1

E

ij 17 数 CHITEST 関数では、χ2 統計量と自由度 df に対する確率が計算されます。このとき、 df = (r-1)(c-1) となります。 (1次元の場合はdf = r-1)

EXCELで作成したχ

2

分布の上限確率表

有意水準α 有意水準α 18

CHIINV(α, f)

挿入Î関数Î統計ÎCHIINV

EXCELによるカイ二乗検定

=CHITEST(B2:B11,C2:C11) 2 自由度f=10-1=9 2

χ

CHIINV(p, f)

したがって この結果は一様分布で 自由度と右側確率値に対応するχ2 したがって,この結果は 様分布で あるとの仮説を棄却できない. 19 自由度と右側確率値に対応するχ2

練習問題

さいころシミュレーション

Excelの一様乱数RAND()を用いて,さいころのシミュ

レ ションを120回行い 各目の値(1 2 3 4 5 6)がそれぞ

レーションを120回行い,各目の値(1,2,3,4,5,6)がそれぞ

れ何回出るか試してみよ.

また

結果が

様分布かどうか

またこのシミュレーション結果が一様分布かどうか,

カイ二乗検定により検定せよ.

ヒント

INT() 実数の小数点以下を切り捨てて整数化する

ヒント

すなわち,

INT(RAND()*6)+1 で1から6の間の整数が出る.

20

参照

関連したドキュメント

 複雑性・多様性を有する健康問題の解決を図り、保健師の使命を全うするに は、地域の人々や関係者・関係機関との

READ UNCOMMITTED 発生する 発生する 発生する 発生する 指定してもREAD COMMITEDで動作 READ COMMITTED 発生しない 発生する 発生する 発生する デフォルト.

参考資料ー経済関係機関一覧(⑤各項目に関する機関,組織,企業(2/7)) ⑤各項目に関する機関,組織,企業 組織名 概要・関係項目 URL

図 キハダマグロのサプライ・チェーン:東インドネシアの漁村からアメリカ市場へ (資料)筆者調査にもとづき作成 The Yellowfin Tuna Supply Chain: From Fishing Villages in

Functions on M are said to be bandlimited if their Fourier transform has compact support. Such func- tions have many remarkable properties. In particu- lar, they are determined by

・大都市に近接する立地特性から、高い県外就業者の割合。(県内2 県内2 県内2/ 県内2 / / /3、県外 3、県外 3、県外 3、県外1/3 1/3

口腔の持つ,種々の働き ( 機能)が障害された場 合,これらの働きがより健全に機能するよう手当

※立入検査等はなし 自治事務 販売業