2.確率分布
• 2.1
確率変数と確率分布– 2.1.1 確率密度分布と累積分布関数 PDF
とCDF – 2.1.2
ベクトル量の確率密度分布• 2.2
重要な確率分布– 2.2.1 離散的確率分布と連続的確率分布
•
二項分布•
ポアソン分布•
正規分布–
正規化・標準化–
中心極限定理•
対数正規分布– 2.2.2 統計量の分布
• Student-t分布
•
χ2分布Probability density function for a random variable
大気海洋変数の確率密度分布(1)度数分布 確率変数と確率分布
2.1
確率変数と確率分布-5 0 5 0
0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
PDF (normalized aao index)
-5 0 5
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
CDF (normalized aao index)
確率密度関数 累積分布関数
Probability Density Function Cumulative Distribution Function
1
札幌の日平均気温の時系列と度数分布(
1976-1997
)度数分布 大気海洋変数の確率密度分布(2)
サインカーブとランダム分布の重ね合わせ 連続的確率密度分布
Probability density function for a sinosoidal oscillation
大気海洋変数の確率分布(2)ベクトル量の確率密度分布
Wind roses (風配図)
ベクトル量の確率密度分布
Wind roses (風配図)
二項分布 Binominal distribution 2.2 重要な確率分布
離散的確率分布
E(B)=np
V(B)=np(1
-p)
ポアソン分布 Poisson distribution
E(x)=np V(x)=np 2.2 重要な確率分布
離散的確率分布
μ=10
x p(x)
μ=5μ=6 μ=4 μ=3 μ=2 μ=1
実例実例 オホーツク海での海氷厚の頻度分布
氷厚の分布
氷厚の頻度分布
乗りあげ
ラフティング
μ: 平均乗り上げ回数
m⊿H:氷厚
m: 乗り上げ回数
氷厚m⊿Hの海氷のPDF
⊿Hの厚さを持つ氷盤の多数回の 乗り上げで説明できる
モデルの検証(1999年の例)
実況: 船舶観測(実線)と係留氷厚計
(破線)による氷厚分布
モデル: Hm=19.7cm,ΔH=5cmに対応 するポアッソン分布(一点鎖線)
Raftingの確率過程モデル N
ラフティング回数p
積み重ね領域率 μ=3.9 (Hm=20)Nが大きくpが小さいとき
にはポアソン分布!メートル
pの分が乗り上げ
乗り上げのない1-pに
pの分が乗り上げ
平均乗り上げ4回
正規分布 Normal distribution
(Gaussian)
0.95 0.90
μ-2σ μ-σ μ μ+σ μ+2σ
連続的確率分布
この位置は?
0.68
E(x)= μ
V(x)= σ
21.65
1.96
0.025x2=0.05 0.05x2=0.10
正規分布の確率分布
Z= X -μ
σStandardized anomaly
平均
標準偏差
ZはN(0,1)分布に従う
正規化・標準化
南方振動指数。太線は5か月移動平均値を示す。
http://www.data.kishou.go.jp/climate/elnino/faq/qa/sstsoi.html
SO index
タヒチ海面気圧標準化[A] ダーウィン海面気圧標準化[B]
[A]-[B]を標準化
A strongly negative SOI for several months indicates an El Nino event;
a strongly positive SOI for several months indicates a La Nina
実例実例 南方振動指数
ダーウィン タヒチ
-5 -4 -3 -2 -1 0 1 2 3 4 5 0
0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
Normalized aao index
-5 -4 -3 -2 -1 0 1 2 3 4 5
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
Normalized so index
SO index AAO index
X 1 ,X 2 , … X N
が独立に同一の分布E(Xi)=μ, V(Xi)=σ 2
に従うとき、 十分おおきなnに対して
X= ∑X i
/nは正規分布
N(μ,σ 2 /n)
に近似的に従う。中心極限定理(Central Limit Theorem)
E,Vさえあえば
分布の形はなんでもよい!
Z= X -μ
σ/√n標準誤差 標本平均 母平均
としたZの分布は、nを大きくするとともに 正規分布N(0,1
2 )に近づく。
中心極限定理(Central Limit Theorem)
x1 = rand(n); x2=rand(n);
T(i)= ( x1(i) + x2(i) + … + x10(i) ) /10; i=1,100
中心極限定理(Central Limit Theorem)
左)100個の乱数のヒストグラム
右)N=10として平均したものの100個のヒストグラム
中心極限定理(Central Limit Theorem)
2.69/sqrt(15)=0.69 2.69/sqrt(5)=1.20
2.69/sqrt(10)=0.85
対数正規分布
log(x)~N(μ,σ)
E ( x ) = exp ( μ + σ 2 / 2 )
V ( x ) = exp ( 2 μ + σ 2 ) { exp ( σ 2 ) - 1 }
0 X
Xが大きいほど
ばらつきも大きい ばらつきなし
ばらつきの大きさがそのときの値に比例する
0以下の値はとらない
対数正規分布とは?
X t+1 =X t *(1+dX)
lnX t+1 =lnX t +ln(1+dX)
掛け算で効く 対数を取ると
正規分布
松山・谷本2005
例題 年最大日降雨量は対数正規分布に従う
1960 0 1970 1980 1990 2000 2010
50 100 150 200 250
Year
M a x im u m d a ily pr e c ipit a io n ( m m / d a y )
札幌の毎年の最大日降水量
0 50 100 150 200 250 0
0.005 0.01 0.015
Maximum daily precipitation (mm/day)
R e la ti v e f req uency
2.5 3 3.5 4 4.5 5 5.5 6 0
0.5 1 1.5
ln (Maximum daily precipitation) (mm/day)
R e la ti v e f req uency
μ=4.295, σ=0.401
対数正規分布 その他の例
1985 25.5
1995 26.3
2006 28.2
χ 2 分布
のちにスペクトル推定で 自由度nに応じて形が異なる
→30以上で正規分布
平均
n
分散2n
2 degrees of freedom
統計量の分布
n
n
Student ’ s-t分布
のちにコンポジット・回帰で 自由度nに応じて形が異なる
→30以上で正規分布 平均
0
分散
n/(n-2)
標準誤差で 割ったもの