2.確率分布
• 確率変数と確率分布
– 離散確率変数と連続確率変数 – 確率密度分布と確率分布関数
• 重要な確率分布
– 母集団の分布
• 二項分布
• ポアソン分布
• 正規分布
• その他の分布
– 統計量の分布
• Student-t分布
• χ2分布
離散的確率密度分布
札幌の天気(降水確率) 2005年4月25日11時00分発表
20 19 18 17 16 15 14 13 12 11
10 60 30
70 10
30 0 29
10 9
40 10 28
40 8
50 30 27
70 7
10 30 26
0 6
20 40 25
30 5
0 0 24
0 4
50 50 23
70 3
40 0 22
20 2
50%
10% 21 50%
4/1
2005年4月の「降水確率」の分布
離散的確率密度分布
降水確率(2005年4月)の度数分布表
0 0
0 3
1 5
4 4
2 5
6 総日数
100 90
80 70
60 50
40 30
20 10
0 降水確率
階級(%)
4月の札幌の降水確率予報
PDFはヒストグラムを資料総数で割ったもの
(降水確率の平均値は30%)
離散的確率密度分布
離散的確率密度分布と連続的確率密度分布 4月の札幌の最高気温予報
階級 (2度きざみ)
ベクトル量の頻度分布表記
Wind roses (風配図)
ベクトル量の頻度分布表記
Wind roses (風配図)
Probability density function for a random variable 大気海洋変数の確率分布(1)
大気海洋変数の確率分布(2)
札幌の日平均気温の時系列と度数分布(1976-1997)
度数分布
サインカーブとランダム分布の重ね合わせ
Probability density function for a sinosoidal oscillation 大気海洋変数の確率分布(2)
二項分布
Binominal distribution(Bernoulli) 離散的確率分布
ポアソン分布 Poisson distribution
E(x)=np V(x)=np
オホーツク海での海氷厚の頻度分布
モデルの検証(1999年の例)
実況: 船舶観測(実線)と係留氷厚計
(破線)による氷厚分布
モデル: ΔH=5cmに対応するポアッソ ン分布(一点鎖線)
Raftingの確率過程モデル N ラフティング回数
P 積み重ね領域率
連続的確率分布
正規分布
Normal distribution(Gaussian)
0.90 0.95
μ-2σ μ-σ μ μ+σ μ+2σ
この位置は?
0.025x2=0.05 0.05x2=0.10
1.65
1.96
中心極限定理(Central Limit Theorem)
X1,X2,…XNが独立に同一の分布 E(Xi)=μ,V(Xi)=σ2
に従うとき、 十分おおきなNに対して X= ∑Xi/N
は正規分布 N(μ,σ2/N) に近似的に従う。
E,Vさえあえば 分布の形は なんでもよい
標本平均
中心極限定理(Central Limit Theorem)
標本平均 母平均 Z= X -μ
σ/√N
標準誤差
としたZの分布は、Nを大きくするともに 正規分布N(0,12)に近づく。
x1 = rand(n); x2=rand(n);
T(i)= ( x1(i) + x2(i) +…+ x10(i) ) /10; i=1,100
中心極限定理(Central Limit Theorem)
左)100個の乱数のヒストグラム
右)N=10として平均したものの100個のヒストグラム
中心極限定理(Central Limit Theorem)
対数正規分布
対数正規分布とは?
0以下の値はとらない
X t+1 =X t*(1+dX)
lnX t+1=lnX t+ln(1+dX)
0 X
Xが大きいほど
ばらつきも大きい ばらつきなし
ばらつきの大きさがそのときの値に比例する
松山・谷本2005
χ
2分布
のちにスペクトル推定で 自由度に応じて形が異なる
平均 n 分散 2n
2.5% 0.5%
Student’s-t 分布
標準誤差で わったもの
平均 0
分散 n/(n-2) 自由度に応じて形が異なる
のちにコンポジット・回帰で
上側 両側 自由度
tの値
5%
まとめ
• 目的とする変数の確率密度分布をよく把握し ておく。
• 正規分布は分布関数の基本である。標準化を 行うと取り扱いが容易である。
• 中心極限定理により、すべての一様分布の標 本平均の分布は正規分布に帰着する。
• 正規分布からχ2分布、Student’s t分布が導 かれる。これらの分布は統計的検定に利用さ れる。