.. ( )T p T = p p = T () T x T N P (X < x T ) N = ( T ) N (2) ) N ( P (X x T ) N = T (3) T N P T N P 0

(1)

2011年5月8日

確率分布と水文統計量の求め方

洪水流量や確率年雨量を求める場合など，年最大水文量に基づく水文統計量の求め方について，参考文献に基づき，まとめています．この文書は，理論を解説するものではなく，プログラムを作成するうえで必要となる数式を整理したものです．

1. 基礎事項 1 1.1 確率年 . . . 1 1.2 平均値・分散・ひずみ係数 . . . 1 1.3 確率重み付き積率とL積率 . . . 1 1.4 プロッティング・ポジション公式 . . . 2 2. 確率分布モデル 3 2.1 正規分布(N分布) . . . 3 2.2 対数正規分布(LN3分布) . . . 4 2.3 ピアソンIII型分布(P3分布) . . . 6 2.4 対数ピアソンIII型分布(LP3分布) . . . 7 2.5 グンベル分布. . . 8 2.6 一般化極値分布(GEV分布) . . . 9 2.7 平方根指数型最大値分布(SQRT-ET分布) . . . 10 2.8 ワイブル分布(3母数) . . . 12 3. ジャックナイフ法による推定 14 4. ブートストラップ法による推定 14 5. 棄却検定 15

参考文献

星清：水文統計解析，開発土木研究所月報，No.540，1998年5月星清：現場のための水文統計(1)，開発土木研究所月報，No.540，1998年5月星清・新目竜一・宮原雅幸：現場のための水文統計(2)，開発土木研究所月報，No.541，1998年6月合田良実・久高将信・河合弘泰：L-moments法を用いた波浪の極値統計解析について，土木学会論文集B2(海岸工学)，Vol.B2-65 No.1，2009，pp161-165 Derek A. Roﬀ(著)・野間口眞太郎(訳)：生物学のための計算統計学 –最尤法，ブートストラップ法，無作為化法–，共立出版株式会社，2011年3月10日

(2)

1. 基礎事項

1.1 確率年再現期間(確率年)T と非超過確率pの関係 T = 1 1− p p = 1− 1 T (1) T年確率事象xT がN年間に1回も起こらない確率と1回以上起こる確率 P (X < xT)N = ( 1− 1 T )N 1回も起こらない確率 (2) P (X= xT)N = 1− ( 1− 1 T )N 1回以上起こる確率 (3) 計算事例：T年確率事象がN年間に1回も起こらない確率P T 5 10 30 100 200 500 1000 5000 N 5 5 5 10 20 50 100 500 P 0.328 0.590 0.844 0.904 0.905 0.905 0.905 0.905 1.2 平均値・分散・ひずみ係数 ¯ x = 1 N N ∑ j=1 xj 標本平均 (4) S2= 1 N N ∑ j=1 (xj− ¯x)2 標本分散 (5) Cs= 1 N N ∑ j=1 ( xj− ¯x S )3 標本ひずみ係数 (6) ˆ σ2= N N− 1S 2 _不偏分散 ₍₇₎ ˆ γ = √ N (N− 1) N− 2 Cs 不偏ひずみ係数 (8) 1.3 確率重み付き積率とL積率

確率統計水文学では，確率重み付積率(PWM : Probability Weighted Moments)とL積率(L Moments) が導入され，活用されている．従来から用いられている平均値・分散・ひずみ係数などには，データの並び順序の概念はないが，確率重み付積率およびL積率では，昇順にデータを並び替えた順序統計量が用いられる．母集団の確率重み付き積率(PWM)は以下のとおり定義される． βr= ∫ 1 0 xFrdF (r = 0, 1, 2, . . . ) (9) また，母集団のPWMとL積率の関係は以下のとおり関係付けられる． λ1= β0 (10) λ2= 2β1− β0 (11) λ3= 6β2− 6β1+ β0 (12) 標本値の確率重み付き積率は以下のとおりであり，標本値についてもPWMとL積率の関係は同様に用い

(3)

られる． b0= 1 N N ∑ j=1 x(j) (13) b1= 1 N (N− 1) N ∑ j=1 (j− 1)x(j) (14) b2= 1 N (N− 1)(N − 2) N ∑ j=1 (j− 1)(j − 2)x(j) (15) ここに，x(j)はN個の標本を昇順に並べ替えたときの，小さいほうからj番目の値を示す． 1.4 プロッティング・ポジション公式 F [x(i)] = i− α N + 1− 2α (16) N 標本数 i 標本値を昇順に並べたときの小さいほうからの順位 x(i) i番目の順位標本値 F [x(i)] プロッティング・ポジション(非超過確率相当) α 1∼1の定数

公式名 Weibull Blom Cunnane Gringorten Hazen

(4)

2. 確率分布モデル

2.1 正規分布(N分布) 水文統計量xが，正規分布に従う場合の母数推定方法を示す． (1) 確率密度関数 f (x) = √ 1 2πσx · exp [ −1 2 ( x− µx σx )2] (17) (2) 確率分布関数 F (x) = Φ ( x− µx σx ) Φ(z) = √1 2π ∫ z −∞ exp ( −1 2t 2 ) dt (18) (3) 非超過確率pに対する水文統計量xp z = x− µx σx → x = µx+ σxz (19) xp= µx+ σxzp zpはp = Φ(z)となるzの値 (20) (4) 母数推定(L積率法) b0= 1 N N ∑ j=1 x(j) b1= 1 N (N − 1) N ∑ j=1 (j−1)x(j) b2= 1 N (N− 1)(N − 2) N ∑ j=1 (j−1)(j −2)x(j) (21) ここに，x(j)はN個の標本を昇順に並べ替えたときの，小さいほうからj番目の値を示す．上記bi= βiとして，以下の関係によりλiを算定する． λ1= β0 λ2= 2β1− β0 λ3= 6β2− 6β1+ β0 (22) 母数は，以下に示すL積率と母数の関係により推定する． { µx= λ1 σx= √ πλ2 (23)

(5)

2.2 対数正規分布(LN3分布) 水文統計量xが，分布下限aを持つ3母数対数正規分布に従う場合の母数推定方法を示す． (1) 確率密度関数 f (x) = 1 (x− a)√2πσy · exp { −1 2 [ ln(x− a) − µy σy ]2} y = ln(x− a) (24) (2) 確率分布関数 F (x) = Φ ( ln(x− a) − µy σy ) Φ(z) = √1 2π ∫ z −∞ exp ( −1 2t 2 ) dt (25) (3) 非超過確率pに対する水文統計量xp z = ln(x− a) − µy σy → x = a + exp(µy+ σyz) (26) xp= a + exp(µy+ σyzp) zpはp = Φ(z)となるzの値 (27) (4) 母数推定(岩井法)                a = x(1)· x(N )− xm 2 x(1)+ x(N )− 2xm x(1)+ x(N )− 2xm> 0 µy= 1 N ∑N j=1ln(xj− a) σy2= 1 N ∑N j=1[ln(xj− a) − µy] 2 (28) ここに，x(1)，x(N )，xmは，それぞれ標本最小値，標本最大値，メディアン(中央値)である．xjなど添字に括弧がついていない標本値は，順位は関係ない統計量であるが，実務計算では，最小・最大・メディアンを求めるのに小さい順に並び替えたほうが便利であるためx(j)の形となろう． (5) 母数推定(積率法) ¯ x = 1 N N ∑ j=1 xj Sx2= 1 N N ∑ j=1 (xj− ¯x)2 Csx= 1 N N ∑ j=1 ( xj− ¯x Sx )3 (29) µx= ¯x σx= [N/(N− 1)]1/2Sx γx= √ N (N − 1) N− 2 Csx (30) 不偏ひずみ係数γxについては，以下に示す，BobeeとRobitailleによる偏り補正した式(対数正規分布の場合)も用いられる．( )内でBに乗ずるのはCsxの3乗であることに注意． γx= Csx(A + B· Csx3) (31) ここに A = 1.01 + 7.01/N + 14.66/N2 B = 1.69/N + 74.66/N2 (32) ここで，積率と母数の関係は以下の通り． µx= a +  √ φ σx=  √ φ(φ− 1) γx= (φ + 2) √ φ− 1 (33)  = exp(µy) φ = exp ( σy2 ) (34)

(6)

よって，母数は以下に示す関係より推定する． φ = [ β +√β2− 1 ]1/3 + [ β−√β2− 1 ]1/3 − 1 ( β = 1 +γx 2 2 ) (35)  = √ σx φ(φ− 1) (36)      σy= √ ln φ µy= ln  a = µx−  √ φ (37)

(7)

2.3 ピアソンIII型分布(P3分布)

水文統計量xが，ピアソンIII型分布：Pearson type 3 distribution (ガンマ分布)に従う場合の母数推定方法を示す． (1) 確率密度関数 f (x) = 1 |a| · Γ(b) ( x− c a )b−1 · exp ( −x− c a ) a > 0 : c5 x < ∞ (38) (2) 確率分布関数 F (x) = G ( x− c a ) G(w) = 1 Γ(b) ∫ w 0 tb−1exp(−t)dt (a > 0) (39) (3) 非超過確率pに対する水文統計量xp w = x− c a → x = c + aw (40) xp= c + awp wpはp = G(w)となるwの値 (41) (4) 母数推定(積率法) ¯ x = 1 N N ∑ j=1 xj Sx2= 1 N N ∑ j=1 (xj− ¯x)2 Csx= 1 N N ∑ j=1 ( xj− ¯x Sx )3 (42) µx= ¯x σx= [N/(N− 1)]1/2Sx γx= √ N (N − 1) N− 2 Csx (43)

不偏ひずみ係数γxについては，以下に示す，BobeeとRobitailleによる偏り補正した式(ピアソンIII型分布の場合)も用いられる．( )内でBに乗ずるのはCsxの2乗であることに注意． γx= Csx(A + B· Csx2) (44) ここに A = 1 + 6.51/N + 20.2/N2 B = 1.48/N + 6.77/N2 (45) ここで，積率と母数の関係は以下の通り． µx= c + a· b σx2= a2· b γx= 2a |a|√b (46) 以上より，母数は以下に示す関係より推定する．      b = 4/γx2 (b > 0) a = σx/ √ b (γx< 0→ a = −σx/ √ b < 0) c = µx− ab (47) ここで，γx< 0の場合はa < 0であり，wpは1− pに対する値とすることに注意する．なお，γxの絶対値が小さい場合，対数ピアソンIII型と同じ現象が発生する可能性がある．ただし数値的には未確認．

(8)

2.4 対数ピアソンIII型分布(LP3分布) 水文統計量xの対数変換値y = ln xが，ピアソンIII型分布に従う場合の母数推定方法を示す． (1) 確率密度関数 f (x) = 1 |a| · Γ(b) · x ( ln x− c a )b−1 · exp ( −ln x− c a ) a > 0 : exp(c) < x <∞ (48) (2) 確率分布関数 F (x) = G ( ln x− c a ) G(w) = 1 Γ(b) ∫ w 0 tb−1exp(−t)dt (a > 0) (49) (3) 非超過確率pに対する水文統計量xp w = ln x− c a → x = exp(c + aw) (50) xp= exp(c + awp) wpはp = G(w)となるwの値 (51) (4) 母数推定(積率法) yj = ln xj y =¯ 1 N N ∑ j=1 yj Sy2= 1 N N ∑ j=1 (yj− ¯y)2 Csy= 1 N N ∑ j=1 ( yj− ¯y Sy )3 (52) µy= ¯y σy= [N/(N− 1)]1/2Sy γy= √ N (N − 1) N− 2 Csy (53)

不偏ひずみ係数γxについては，以下に示す，BobeeとRobitailleによる偏り補正した式(ピアソンIII型分布の場合)も用いられる．( )内でBに乗ずるのはCsyの2乗であることに注意． γy = Csy(A + B· Csy2) (54) ここに A = 1 + 6.51/N + 20.2/N2 B = 1.48/N + 6.77/N2 (55) ここで，積率と母数の関係は以下の通り． µy= c + a· b σy2= a2· b γy= 2a |a|√b (56) 以上より，母数は以下に示す関係より推定する．      b = 4/γy2 (b > 0) a = σy/ √ b (γy < 0→ a = −σy/ √ b < 0) c = µy− ab (57) ここで，γy< 0の場合はa < 0であり，wpは1− pに対する値とすることに注意する．なお，γyの絶対値が小さい場合，bが非常に大きな数値となり，ガンマ分布の％点計算が収束しないケースもあり得る．このため，bが大きな数値の場合は，以下の示すWilson-Hilferty変換により非超過確率pに対する水文統計量xpを算定する． xp= exp(µy+ σy· Kp) Kp= 2 γy ( 1 +γyzp 6 − γy2 36 ) − 2 γy (58) ここに，zpはN (0, 1)に従う標準正規変量である．Wilson-Hilferty変換を用いるか否かの境界は，b < 10, 000 ば目安になる．ひずみ係数γy< 0の場合でも，標準正規変量zpはpに対して求めればよいし，またKpの計算でも，γyを|γy|とする必要な無い．すなわち，pもγyも計算値そのままを入力すればよい．

(9)

2.5 グンベル分布水文統計量xが，グンベル分布(Gumbel distribution)に従う場合の母数推定方法を示す． (1) 確率密度関数 f (x) = 1 aexp [ −x− c a − exp ( −x− c a )] − ∞ < x < ∞ (59) (2) 確率分布関数 F (x) = exp [ − exp ( −x− c a )] (60) (3) 非超過確率pに対する水文統計量xp p = exp [ − exp ( −x− c a )] → x = c− a ln[− ln(p)] (61) xp= c− a ln[− ln(p)] (62) (4) 母数推定(L積率法) b0= 1 N N ∑ j=1 x(j) b1= 1 N (N − 1) N ∑ j=1 (j−1)x(j) b2= 1 N (N− 1)(N − 2) N ∑ j=1 (j−1)(j −2)x(j) (63) ここに，x(j)はN個の標本を昇順に並べ替えたときの，小さいほうからj番目の値を示す．上記bi= βiとして，以下の関係によりλiを算定する． λ1= β0 λ2= 2β1− β0 λ3= 6β2− 6β1+ β0 (64) 母数は，以下に示すL積率と母数の関係により推定する． { a = λ2/ ln 2 c = λ1− 0.5772a (65)

(10)

2.6 一般化極値分布(GEV分布)

水文統計量xが，一般化極値分布(Generalized Extreme Value distribution)に従う場合の母数推定方法を示す． (1) 確率密度関数 f (x) = 1 a ( 1− kx− c a )1/k−1 · exp [ − ( 1− kx− c a )1/k] (k6= 0) (66) (2) 確率分布関数 F (x) = exp [ − ( 1− kx− c a )1/k] (k6= 0) (67) (3) 非超過確率pに対する水文統計量xp p = exp [ − ( 1− kx− c a )1/k] → x = c + a k · { 1− [− ln(p)]k} (68) xp= c + a k· { 1− [− ln(p)]k} (69) (4) 母数推定(L積率法) b0= 1 N N ∑ j=1 x(j) b1= 1 N (N − 1) N ∑ j=1 (j−1)x(j) b2= 1 N (N− 1)(N − 2) N ∑ j=1 (j−1)(j −2)x(j) (70) ここに，x(j)はN個の標本を昇順に並べ替えたときの，小さいほうからj番目の値を示す．上記bi= βiとして，以下の関係によりλiを算定する． λ1= β0 λ2= 2β1− β0 λ3= 6β2− 6β1+ β0 (71) 母数は，以下に示すL積率と母数の関係により推定する．                k = 7.8590d + 2.9554d2 _ここに _{d =} 2λ2 λ3+ 3λ2− ln(2) ln(3) a = kλ2 (1− 2−k)· Γ(1 + k) c = λ1− a k· [1 − Γ(1 + k)] (72)

(11)

2.7 平方根指数型最大値分布(SQRT-ET分布)

水文統計量xが，平方根指数型最大値分布(SQRT exponential-type distribution of maximum)に従う場合の母数推定方法を示す． (1) 確率密度関数 f (x) =ab 2 exp [ −√bx− a ( 1 +√bx ) exp ( −√bx )] (x= 0) (73) (2) 確率分布関数 F (x) = exp [ −a(1 +√bx ) exp ( −√bx )] (x= 0) (74) (3) 非超過確率pに対する水文統計量xp p = exp [ −a(1 +√bx ) exp ( −√bx )]

= exp [−a(1 + tp) exp(−tp)] (tp=

√ bx) (75) → x = tp 2 b ln(1 + tp)− tp= ln [ −1 aln(p) ] (76) xp= tp2 b ln(1 + tp)− tp= ln [ −1 aln(p) ] (77) ■(参考) tpの求め方 g(tp) = ln(1 + tp)− tp− ln [ −1 aln(p) ] (78) とおくと g0(tp) = 1 1 + tp − 1 (79) であり，関数g(tp)は単調減少関数であることがわかる．また，通常，g(0) > 0であるため， Newton-Raphson法により，以下の繰り返しによりg(tp) = 0となるtpを求められる． tp(n+1)= tp(n)− g(tp(n)) g0(tp(n)) (n)は繰り返し回数のカウンタ (80) tpの初期値としては，非超過確率pが比較的大きい領域でのxpを知りたいため，標本値xの最大値を用いてtp= √ b· xmaxとすることにより，効率的にtpを求められる． (4) 母数推定(最尤法) 母数a，bは，以下に示す対数尤度関数Lが最大になるように定める． L(a, b) = N ∑ j=1 ln f (xj) = N ln a + N ln b− N ln 2 − N ∑ j=1 √ bxj− a  ∑N j=1 exp ( −√bxj ) + N ∑ j=1 √ bxjexp ( −√bxj )  (81)

(12)

上式Lをbに関して偏微分したものが0となる条件より，以下のとおりbの関数としてaが定まる．これを a1とする． ∂L ∂b = 0 → a = ∑N j=1 √ bxj− 2N ∑N j=1(bxj) exp ( −√bxj ) = a1 (82) また，Lをaに関して偏微分したものが0となる条件より，これもbの関数としてaが定まる．これをa2とする． ∂L ∂a = 0 → a = N ∑N j=1exp ( −√bxj ) +∑N_j=1√bxjexp ( −√bxj ) = a2 (83) Lが最大となるのはa1= a2のときであるため，h(b) = a1(b)− a2(b) = 0となるbの値を，二分法で求めることができる．なお，a2> 0は保障されるが，a1は，以下の条件を満たすときにa1> 0となるため，二分法におけるbの小さい側の初期値を設定する際注意する． a1> 0 → b > ( 2N ∑N j=1 √_x j )2 (84) 二分法におけるbの大きい側の初期値は，経験的にbが1程度以下であることから，以下のようにプログラムすれば良い．(C言語) /* Bisection method */ b1=bb; /* a1>0 となる b1 (小さい側初期値)を設定 */ b2=b1+0.5; /* 小さい側初期値 b1+0.5 を大きい側初期値 b2 とする */ bb=0.5*(b1+b2); /* 中間値 bb の設定 */ f1=FSQR(nd,datax,b1,&a1,&a2); /* h(b1)の計算 */ f2=FSQR(nd,datax,b2,&a1,&a2); /* h(b2)の計算 */ ff=FSQR(nd,datax,bb,&a1,&a2); /* h(bb)の計算 */ do{ /* 収束計算ループ */ if(f1*ff<0.0)b2=bb; if(ff*f2<0.0)b1=bb; if(ff==0.0)break; if(0.0<f1*ff&&0.0<ff*f2){b1=b2;b2=b1+0.5;} /* 見込んだ範囲に解がない場合上側範囲を */ bb=0.5*(b1+b2); /* 0.5 ずつ増加させて解を検索する */ f1=FSQR(nd,datax,b1,&a1,&a2); f2=FSQR(nd,datax,b2,&a1,&a2); ff=FSQR(nd,datax,bb,&a1,&a2); }while(0.001<fabs(a1-a2)); /* 収束判定基準：|h(b)|<0.001 */

(13)

2.8 ワイブル分布(3母数) 水文統計量xが，3母数ワイブル分布(Weibull distribution)に従う場合の母数推定方法を示す． (1) 確率密度関数 f (x) = k a ( x− c a )k−1 exp [ − ( x− c a )k] (k6= 0) (85) (2) 確率分布関数 F (x) = 1− exp [ − ( x− c a )k] (k6= 0) (86) (3) 非超過確率pに対する水文統計量xp 1− p = exp [ − ( x− c a )k] → x = c + a[− ln (1 − p)]1/k (87) xp= x = c + a[− ln (1 − p)]1/k (88) (4) 母数推定(L積率法：合田らの方法 *) による) b0= 1 N N ∑ j=1 x(j) b1= 1 N (N − 1) N ∑ j=1 (j−1)x(j) b2= 1 N (N− 1)(N − 2) N ∑ j=1 (j−1)(j −2)x(j) (89) ここに，x(j)はN個の標本を昇順に並べ替えたときの，小さいほうからj番目の値を示す．上記bi= βiとして，以下の関係によりλiを算定する． λ1= β0 λ2= 2β1− β0 λ3= 6β2− 6β1+ β0 (90) 母数は，以下に示すL積率と母数の関係により推定する．          k = 285.3τ6− 658.6τ5+ 622.8τ4− 317.2τ3+ 98.52τ2− 21.256τ + 3.5160 ここに τ = λ3/λ2 a = λ2 (1− 2−1/k)· Γ(1 + 1/k) c = λ1− a · Γ(1 + 1/k) (91) *) 合田良実・久高将信・河合弘泰：L-moments法を用いた波浪の極値統計解析について，土木学会論文集B2(海岸工学)，Vol.B2-65 No.1，2009，pp161-165 なお，本文表-2 極値分布関数の母数推定式のワイブル分布の項で，形状母数kの値がλ3の関数となっているが，τ3= λ3/λ2と思われる．また尺度母数Aの分母にkが入っているがこれも誤植と思われる． (5) 母数推定(最尤法) この問題では推定すべき母数が3個あるため，まず最初に位置母数cを推定し既知とした上で，形状母数k と尺度母数aを推定する方法をとる． (I)母数cの推定

(14)

標本値xの非超過確率F (x)は，選定したプロッティング・ポジション公式により算定する．プロッティング・ポジション公式を用いるため，標本値xは，昇順に並べ替えておくことに注意する．確率分布関数を変形して， 1− F (x) = exp [ − ( x− c a )k] (92) 上式の両辺の対数を2回とることにより ln{− ln[1 − F (x)]} = k ln(x − c) − k ln a → Y = A· X + B (93) 標本値をYi= ln{− ln[1−F (xi)]}，Xi= ln(xi−c)として直線回帰することにより，k = A，a = exp(−B/A) として求めることができる．この際，cの値を，標本値の最小値から小さいほうに変化させ，繰り返し回帰を行いながら，直線回帰による相関係数が最大となる時のcを求めるcとする．この段階で，一応3母数k，a，cは求まったことになるが，更に推定精度を上げるため，cのみを固定し，次の段階で再度k，aを算定する．ここで求めたkは，以降行うNewton-Raphson法の初期値として利用するが，aは特に必要としない値である． (II)母数kおよびaの推定上記によりcは定まったため，t = x− cと置くことにより， f (t) = k a ( t a )k−1 exp [ − ( t a )k] (94) 上式の対数尤度関数L =∑N_i=1ln f (ti)において，以下の条件を満たすようkおよびaをNewton-Raphson 法で推定する．kの初期値は，cを求めるときに算定した値を用いればよい． ∂L ∂k = 0 → 1 k+ ∑N i=1ln ti N − ∑N i=1[(ln ti)· tik] ∑N i=1tik = 0 (95) ∂L ∂a = 0 → a = ( ∑N i=1tik N )1/k (96) g(k) = 1 k + T0 N − T2(k) T1(k) g0(k) =−1 k2 − T3(k)· T1(k)− [T2(k)]2 [T1(k)]2 (97) T0= N ∑ i=1 ln ti T1(k) = N ∑ i=1 tik T2(k) = N ∑ i=1 [ln ti· tik] T3(k) = N ∑ i=1 [ln ti· ln ti· tik] (98) kが収束するまで以下の繰り返しを行う．ここにnは繰り返し回数のカウンタである． kn+1= kn− g(kn) g0(kn) (99) kが定まれば，次式によりaが定まる． a = ( ∑N i=1tik N )1/k (100)

(15)

3. ジャックナイフ法による推定

Jackknife法による偏りを補正した推定値(JackKnife推定値)と標準誤差の推定値の計算方法を示す．手順は以下の通り． 1 N 個のデータx(i)を用いて統計量の推定値θˆを求める． 2 i番目のデータを除いたN− 1個のデータによる推定値θˆ(i)を求める． 3 n− 1個のデータによる推定値θˆ(i)はN 個求められるため，これらの平均θˆ(_·)を求める． ˆ θ(·)= 1 N N ∑ i=1 ˆ θ(i) (101) 4 N 個のデータx(i)を用いて統計量の推定値θˆと，N− 1個のデータによる推定値の平均θˆ(_·)を用いて，以下の式でjackknife推定値θ¯を求める． ¯ θ = N· ˆθ − (N − 1) · ˆθ(·) (102) 5 θの標準誤差の推定値(SE)は，以下の通り与えられる． (SE) = v u u tN − 1 N N ∑ i=1 ( ˆ θ(i)− ˆθ(·) )2 (103)

4. ブートストラップ法による推定

bootstrap法による点推定と区間推定の方法を述べる． 1 N 個のデータx(i)を用いて統計量の推定値θˆを求める． 2 元のN個のデータから繰り返しを許してN個のデータを無作為に抽出しこれの推定値θ∗(i)を求める． 3

θ∗(i)(bootstrap反復値)をB個求め，これらの平均をbootstrap法による点推定とする．

ˆ θ∗ = 1 B B ∑ i=1 θ∗(i) (104) 4 bootstrap反復値の分布は，母数の分布を表していると考えられるため，bootstrap反復値を最小値から最大値まで昇順に並べ，反復値が所要の下側確率・上側確率となる限界を見つけ，これを信頼限界とする．この方法は，母数の分布を正規分布と仮定する必要はない．この方法はパーセンタイル法 (percentile method)と呼ぶ．

(16)

5. 棄却検定

ある特定の分布に従う標本の中に，希にしか起こらない特に大きな値あるいは小さな値が含まれている場合，これを同一母集団のデータとして採用すべきか棄却してよいかの検定を行う手順を述べる．課題ある母集団から採取したN 個の標本値に対し，その最大値を検定対象値xとして棄却検定を行う． 1 検定対象値を除いたN− 1個のデータより確率分布の母数推定を行い，確率分布関数F (x)を推定する． 2 推定した確率分布関数より，検定対象値の上側確率(超過確率)qを推定する． 3 検定対象値の上側確率が等しくなる標準正規分布の％点を算定し，これをuとする．すなわち以下の関係を満足するuを求める．ここにΦは標準正規分布の確率分布関数である．上側確率 q = 1− F (x) = 1− Φ(u) (105) 4 検定対象値が他の N − 1個の標本値と同一の母集団であるなら，次式で表される F値は自由度 (1, M − 1)のF分布に従うはずである．ここに，M (= N− 1)は検定対象値を除いたデータ数であることに注意． F = ( M − 1 M + 1 ) · u2 (106) よって以下を満足するF分布の上側確率2を求める． F_M1₋₁(2) = ( M − 1 M + 1 ) · u2 (107) 5 危険率βに対する棄却限界の値を求める． 0= 1− (1 − β0)1/N (βは通常5%) (108) 5 検定対象値より定めたと棄却限界0を比較し，以下の判定を行う．          5 0 棄却限界より検定対象値の上側確率は小さく検定対象値は棄却できる(解析に用いない)  > 0 棄却限界より検定対象値の上側確率は大きく検定対象値は棄却できない(解析に用いる) (109)

.. ( )T p T = p p = T () T x T N P (X < x T ) N = ( T ) N (2) ) N ( P (X x T ) N = T (3) T N P T N P 0

確率分布と水文統計量の求め方

目次

参考文献

1.

基礎事項

2.

確率分布モデル

3.

ジャックナイフ法による推定

4.

ブートストラップ法による推定

5.

棄却検定