環境プラニング演習
II
第10回
2009 6 27
2009. 6. 27
千葉大学 工学部 都市環境システム学科
山崎 文雄
http://ares tu chiba u jp/
1http://ares.tu.chiba-u.jp/
講義予定
(1) 2009年 4月18日(土) 12:50ー14:20 演習の説明,微分・積分と数値計算1 (2) 2009年 4月25日(土) 12:50ー14:20 微分・積分と数値計算2 (3) 2009年 5月 9日(土) 12:50ー14:20 振動問題と時間積分 (4) 2009年 5月16日(土) 12:50ー14:20 1質点系の地震応答計算 (課題1) 年 答 算 (5) 2009年 5月16日(土) 14:30ー16:00 応答スペクトルの計算 (6) 2009年 5月30日(土) 12:50ー14:20 フーリエ解析1 (7) 2009年 5月30日(土) 14 30 16 00 フ リエ解析2 (課題2) (7) 2009年 5月30日(土) 14:30ー16:00 フーリエ解析2 (課題2) (8) 2009年 6月13日(土) 12:50ー14:20 復習 (9) 2009年 6月13日(土) 14:30ー16:00 確率分布の基礎と正規分布 (9) 2009年 6月13日(土) 14:30ー16:00 確率分布の基礎と正規分布 (10) 2009年 6月27日(土) 12:50ー14:20 一様乱数と確率分布の検定 (11) 2009年 6月27日(土) 14:30ー16:00 中心極限定理と正規乱数(課題3) (11) 2009年 6月27日(土) 14:30 16:00 中心極限定理と正規乱数(課題3) (12) 2009年 7月 4日(土) 12:50ー14:20 確率紙の作り方・使い方 (13) 2009年 7月18日(土) 12:50ー14:20 基礎統計解析1 ( ) (14) 2009年 7月18日(土) 14:30ー16:00 基礎統計解析2 (課題4) 2乱数
(random number)
(
)
とは?
¾でたらめ
な数列
= 出現がほぼ同じ割合+非規則
¾最も基本的なのは
一様乱数
Æ 均一分布
) ( x fX a b− 1¾
ピ
タ 発生させる乱数は
疑似乱数
a b x 0¾コンピュータで発生させる乱数は,
疑似乱数
(pseudo-random number)
(p
)
(本当は「でたらめ」ではない.初期値を与え,規則にし
たがって計算する )
3たがって計算する.)
疑似乱数の要件
疑似乱数の要件
¾周期が長いこと
¾周期が長いこと
(短いとすぐ繰り返し数列になる)
¾再現性があること
¾再現性があること
¾統計的検定に耐えられること
¾統計的検定に耐えられること
(デタラメであることが証明できる)
(デタラメである とが証明できる)
¾乱数発生のスピ ドが速いこと
¾乱数発生のスピードが速いこと
4一様乱数の発生
(合同法)
合同式:
)
(mod
)
(
)
1
(
k
a
x
k
L
x
+
=
⋅
mod L
= Lの倍数は切り捨てる
)
(mod
)
(
)
1
(
k
a
x
k
L
x
+
1番目のx=
x(1)
: 初期値
a L x(1)は非負の整数 (上手に選ぶ必要がある)
a, L, x(1)は非負の整数 (上手に選ぶ必要がある)
実際の例
(東大計算機センタ
)
:
実際の例
(東大計算機センター)
:
初期値 19530527
(自分で与える.大きな整数)
a
=48828125
(なにがいいか検定してみる)
m
=2147483647=2
311
(32ビットのコンピュータで表現で
m
=2147483647=2 -1
(32ビットのコンピュ タで表現で
きる最大の数)
5Excelはオーバーフローしないのでこの方法は使えない
Excelにおける一様乱数の発生
挿入Î関数Î数学/三角ÎRAND 6平均値,分散,変動係数の例
) ( x fX均一分布の場合
a b− 1a
b
x
0平均値
μ
1
(
a
+
b
)
平均値
μ
X=
2)
(
2
1
a
+
b
2
1
(b
)
分散
σ
X2=
12
1
(
b
−
a
)
2
変動係数
ν
X=
⎟
⎠
⎞
⎜
⎝
⎛
+
−
b
a
a
b
3
1
7 X3
⎝ + b
a
⎠
統計関数とExcel (統計量からの検索)
統計量 Excel 関数名 定義式(『統計学入門』)など 和 SUM 平均 AVERAGE 28 (2 1) 平均 AVERAGE p.28 (2.1) 分散(不偏分散) VAR 偏差の平方和 ÷(n - 1) => p.184 (9.5) 分散 VARP 同上 ÷n => p.37 (2.10) 標準偏差 STDEV 分散(不偏分散)VAR の平方根 標準偏差 STDEV 分散(不偏分散)VAR の平方根 標準偏差 STDEVP 分散VARP の平方根 => p.37 (2.10) 平均偏差 AVEDEV 偏差の絶対値の平均 => p.36 (2.9) 相関係数 CORREL 49 (3 1) 相関係数 CORREL p.49 (3.1) 共分散 COVAR 偏差の積和 ÷n => p.49 (3.1) 第 2 式 データの正規偏差%点 ZTEST データ各値の正規分布対応の%点。名称は不適切。 t 検定 TTEST 2 標本 t 統計量の値に対する片側・両側確率。5% (等)と比較。 カイ2 乗検定 CHITEST ピアソンのカイ2 乗の上側確率。独立性の検定のため。 カイ 乗検定 アソンのカイ 乗の 側確率。独立性の検定のため。 標準得点 STANDARDIZE 歪度 SKEW 歪み方の向き・程度。EXCEL 定義に問題*。 尖度 KURT 尖り方の方向・程度。EXCEL 定義に問題*。 順位 RANK xi のデータ範囲(絶対参照)での順位。タイ分割せず。 部分集計 SUBTOTAL 累積和は引数(9, A$1:A1)etc. から複写。9 が重要。 8 * 標準的テキストとはやや異なるが、サンプルが大なら差は小さい。正式定義はこちら。 http://www.qmss.jp/e-stat/excel/commands-stat.htm標本平均
(sample mean)
標本平均: 標本に対して計算した平均値
∑
n1
=
x
∑
= i ix
n
11
は標本数が大きくなると 母集団の平均値 に近づく
nは標本数(サンプル数),
x
:エックスバー
は標本数が大きくなると,母集団の平均値
μ
に近づく.
x
n
x
x
x
x
=
=
1+
2+
L
+
nデータの数
データの合計
n
デ
タの数
例えば
=AVERAGE(A2:A11)
Excelにおける使い方:
(A2からA11までの平均) 9 ( 均)標本分散
(sample variance)
(
p
)
標本分散
: 標本に対して計算した分散
=
2s
1
(
x
x
)
2n
n i−
∑
Excelでは =VARP(A2:A11)不偏標本分散
: 偏りを除いた標本分散
1n
i==
2s
2)
(
1
x
x
n i−
∑
Excelでは =VAR(A2:A11)•標本数が大きくなると,標本分散と不偏標本分散で差はない
1)
(
1
n
i i−
∑
=標本数が大きくなると,標本分散と不偏標本分散で差はない
•標本数が大きくなると,不偏標本分散は母集団の分散
に近づく
•Excelでは両方の関数がある
2σ
•Excelでは両方の関数がある.
標本標準偏差
s
1
(
x
x
)
2 n=
∑
Excelでは =STDEV(A2:A11) 10標本標準偏差
1)
(
1
x
x
n
s
i i−
−
=
∑
= Excelでは STDEV(A2:A11)Excelにおけるヒストグラム作成
ツールÎ分析ツールÎヒストグラム 棒をクリックÆデータ系列の書式設定 ÆオプションÆ棒の間隔0 11 ÆオプションÆ棒の間隔0観測データの適合度検定
観測デ タ
適合度検定
適合度検定:
観測データが理論的な確率モデルに
適合度検定:
観測デ タが理論的な確率モデルに
適合しているかどうかの検定
カイ二乗
(
χ
2)検定
:ヒストグラムと理論的な確率密度
を比較するもの
を比較するもの
コロモゴロフースミルノフ検定
(
Kolmogorov-Smirnov Test )
:
(
Kolmogorov Smirnov Test )
観測データの累積率と理論的な確率分布関数を比
較するもの
較するもの
観測データの適合度検定(2)
( )
検定
カイ二乗(χ2)検定
Kolmogorov-Smirnov 検定
カイ二乗(χ2)検定
13適合度検定の手順と例(1)
手順1: 仮説の設定
帰無仮説
様乱数は
様 ある
帰無仮説
H0 : EXCELの一様乱数は一様である.
対立仮説
H1 : EXCELの一様乱数は一様でない.
手順2: 有意水準の設定
有意水準 は帰無仮説が
もかかわらず 帰無仮説が誤
有意水準αは帰無仮説が正しいにもかかわらず,帰無仮説が誤っ
ていると判断する(棄却する)確率.通常,
5%で考える.
手順
3: 検定方式と棄却域の設定
グ
論度数
較
検定
有意
ヒストグラムと理論度数の比較なので,カイ二乗検定を用い,有意
水準0.05と自由度からχ
2の上側確率に対応する値を求める.
14適合度検定の手順と例
(2)
手順
4: 検定統計量の計算
データに基づき検定統計量の値を求める.カイ二乗検定では,観
測度数の期待度数からの乖離の指標
χ2 (カイ二乗)を計算 .
∑
=−
=
r i i i iE
E
A
1 2 2(
)
χ
手順5: 判定と結論
検定統計量の値が棄却域に入 ている場合には 帰無仮説
H0を
= i 1 i検定統計量の値が棄却域に入っている場合には,帰無仮説
H0を
棄却し,対立仮説
H1を有意と判断する.棄却域に入っていない場
合 は
を棄却する とが きず
を有意とは判断 きな
合には,
H0を棄却することができず,H1を有意とは判断できない.
帰無仮説
H0が棄却された場合,対立仮説H1を積極的に支持.
帰無仮説
H0が棄却されなかった場合は,疑わしさを立証できな
15かったに過ぎない.
χ2分布における自由度と有意水準
自由度
df
上側確率
(有意水準)
α
Figure 8.3. Chi-Square Sampling Distributions for df=2, 3, and 4
16
Figure 8.4. Chi-Square Sampling Distribution for df=4