• 検索結果がありません。

サンプル分散の式で

N/A
N/A
Protected

Academic year: 2021

シェア "サンプル分散の式で"

Copied!
55
0
0

読み込み中.... (全文を見る)

全文

(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)

(

参考

)

サンプル分散の式で

1/N 1

をかける理由 サンプル分散

S2

の期待値を考えてみよう。

X1X¯N = µ

1 1 N

X1 1 N

XN k=2

Xk (13.1)

なので

¡X1X¯N¢2

= µ

1 1 N

2

(X1)2−2 µ

1 1 N

X1 1

N XN k=2

Xk+ 1 N2

XN k=2

(Xk)2+ 1 N2

X

k,l,k6=l

XkXl (13.2)

となる。この式の期待値

E(¡

X1X¯N¢2

)

{Xk, k= 1,· · ·, N}

がそれぞれ独立なので

µ

1 1 N

2

E(X2)2 µ

1 1 N

N1

N E(X)2+ N1

N2 E(X2) +(N1)(N2)

N2 E(X)2

= N1 N

³

E(X2)E(X)2

´

= N 1

N σ2 (13.3)

となる。

S2

の期待値は上式の

N

N 1

倍なのでサンプル分散の期待値が母分散に等しいことがわかる:

E(S2) =σ2 (13.4)

(例)

ランダムウォークの母平均と母分散の時間発展 一般の時刻

t

でのランダムウォークの母平均

µ(t) = X

x=−∞

xP(x, t) (13.5)

を計算してみよう。いきなり

µ(t)

を求めるのは難しそうなので,時間が

1

ステップ増えると

µ(t)

がどれだけ変化するかを考える。式

(8.1)

より

µ(t+ 1) = X

x=−∞

xP(x, t+ 1) = X

x=−∞

x(pP(x1, t) +qP(x+ 1, t)) (13.6)

となる。上式右辺第

1

項は

p

X

x=−∞

xP(x1, t) = p X

y=−∞

(y+ 1)P(y, t) = p X

y=−∞

yP(y, t) +p X

y=−∞

P(y, t)

= p µ(t) +p (13.7)

となる。y

=x1

であり,

X

y=−∞

P(y, t) = 1

を用いた。同様に

q X

x=−∞

xP(x+ 1, t) = q X

y0=−∞

(y01)P(y0, t) = q X

y0=−∞

y0P(y0, t)q X

y0=−∞

P(y0, t)

= q µ(t)q (13.8)

(14)

となるので

µ(t+ 1) =µ(t) +pq (13.9)

が得られる。µ(0) = 0 なので

µ(t) = (pq) t (13.10)

となる。時間とともに

p > q

なら母平均は増加し,p < q なら減少する。

次に母分散を計算してみよう。まず,時刻

t+ 1

でのランダムウォーカーの位置

X(t+ 1)

2

乗の期待値は

E

³

X(t+ 1)2

´

= X

x=−∞

x2 P(x, t+ 1) =p X

x=−∞

x2 P(x1, t) +q X

x=−∞

x2 P(x+ 1, t)

= p X

y=−∞

y2 P(y, t) + 2p X

x=−∞

y P(y, t) +p X

x=−∞

P(y, t)

+ q X

y0=−∞

y02 P(y0, t)2q X

y0=−∞

y0 P(y0, t) +q X

y0=−∞

P(y0, t)

= (p+q)E(X(t)2) + 2(pq)E(X(t)) +p+q

= E(X(t)2) + 2(pq)µ(t) + 1 (14.11)

のように時刻

t

の量と関係がつく。これより

σ2(t+ 1) = E

³

X(t+ 1)2

´

µ(t+ 1)2

= E(X(t)2) + 2(pq)µ(t) + 1

³

µ(t) +pq

´2

=σ2(t) + 4pq (14.12)

が得られ,母分散は

t

1

増えるごとに

4pq

だけ増加することがわかる。。σ

2(0) = 0

なので

σ2(t) = 4 p q t (14.13)

となる。

【問】

ランダムウォーカーが確率

pR

で 右へ,確率

pL

で左へ,確率

pS

でその位置にとどまる場合の 時刻

t

の母平均と母分散を求めなさい。

【答】

上と同様に時刻

t+ 1

t

の量の関係をつけると

µ(t+ 1) =µ(t) +pRpL, σ2(t+ 1) =σ2(t) +pR+pL³

pRpL´2

(14.14)

が得られる。初期条件

µ(0) = 0, σ2(0) = 0

より

µ(t) = (pRpL)t , σ2(t) =

½

pR+pL

³

pRpL

´2¾

t (14.15)

となる。尚,p

R+pL+pS = 1

なので

σ2(t)

は次のようにも表せる。

σ2(t) =

³

4pRpL+pS(1pS)

´

t (14.16)

(15)

・確率変数のとる値が連続

(実数)

の場合

確率変数

X

が離散的な値

{x1, x2,· · · }

をとる場合は

X = xi

となる確率

P(xi)

を考えたが,

X

のとる値が連続な場合は,X がある

1

点の値をとる確率,例えば

(X = 1.0

となる確率) は

0

となる。(点の長さは

0

であるため。)

X

のとる値がある区間

[a , b]

に入る確率,P

(a X b)

を考える必要がある。

P(aX b) = Z b

a

p(x)dx (15.1)

である場合

p(x) (≥0)

は 確率密度関数 と呼ばれ る。

Z

−∞

p(x)dx = 1 (15.2)

となっている。また,X のとる値が

x

以下である 確率

F(x) = P(−∞ < X x)

x

の関数と考え て 累積分布関数 と呼ぶ。

F(x) = Z x

−∞

p(x0)dx0 (15.3)

-2 -1 0.5 1 2

0.1 0.2 0.3 0.4 0.5 0.6

p(x) = 1

π e−x2

<注>

dF(x)/dx=p(x)

の関係がある。すなわち,F

(x)

p(x)

の原始関数の一つ。

・母平均

(離散的な場合の式(10.1)

に対応)

µ=E(X) =

Z

−∞

x p(x) dx (15.4)

・関数

f(X)

の期待値

(離散的な場合の式(11.2)

に対応)

E(f(X)) =

Z

−∞

f(x) p(x) dx (15.5)

・母分散

(離散的な場合の式(12.1)

に対応)

σ2 =E

³

(Xµ)2

´

= Z

−∞

(xµ)2 p(x) dx= Z

−∞

x2 p(x) dxµ2 (15.6) (例)

区間

[0, 1)

の一様乱数

p(x) = (

1 ; 0x <1

0 ; x <0 || 1x (15.7)

double uniform(void){

double r;

r = ((double) rand())/((double)RAND_MAX + 1.0);

return(r);

}

他の確率分布に従う確率変数は

uniform()

から作る。

(16)

・累積分布関数

F(x) =

0 ; x <0 x ; 0x <1 1 ; 1x

(16.1)

・母平均

µ= Z 1

0

x dx= x2 2

¯¯

¯¯

x=1 x=0

= 1

2 (16.2)

・母分散

σ2 = Z 1

0

x2 dxµ2 = x3 3

¯¯

¯¯

x=1 x=0

1 4 = 1

12 (16.3)

(例)

区間

[a , b)

の一様乱数

p(x) = (

1/(ba) ; ax < b

0 ; x < a || bx (16.4)

double get_myrandom(void){

double x;

double r;

r=uniform();

x= r*(b -a) + a ; return x;

}

1 2 3 4

0.20.4 0.60.81

F(x)

x

a= 1,b= 3

の場合

・累積分布関数

F(x) =

0 ; x < a (xa)/(ba) ; a x < b

1 ; bx

(16.5)

・母平均

µ= Z b

a

x

ba dx= x2 2(ba)

¯¯

¯¯

x=b x=a

= a+b

2 (16.6)

・母分散

σ2 = Z b

a

x2

ba dxµ2 = x3 3(ba)

¯¯

¯¯

x=b x=a

(a+b)2

4 = (ba)2

12 (16.7)

(例)

p(x) =

1/2 ; 1x <2 1/4 ; 2x <4

0 ; x <1||4x

(16.8)

(17)

double get_myrandom(void){

double x;

double r;

r=uniform();

if( r < 0.5 ){

x= 2.0*r + 1.0;

} else {

x= 4.0*r ; }

return x;

}

1 2 3 4 5

0.2 0.4 0.6 0.8 1

1 2 3 4 5

0.1 0.2 0.3 0.4 0.5

F(x)

x

x p(x)

・累積分布関数

F(x) =

0 ; x <1 (x1)/2 ; 1x <2 (x2)/4 + 1/2 ; 2x <4

1 ; 4x

(17.1)

・母平均

µ= Z 2

1

x 2 dx+

Z 4

2

x

4 dx= x2 4

¯¯

¯¯

x=2 x=1

+ x2 8

¯¯

¯¯

x=4 x=2

= 9

4 (17.2)

・母分散

Z

−∞

x2 p(x)dx = Z 2

1

x2 2 dx+

Z 4

2

x2

4 dx= x3 6

¯¯

¯¯

x=2 x=1

+ x3 12

¯¯

¯¯

x=4 x=2

= 35 6 σ2 = 35

6 µ9

4

2

= 37

48 (17.3)

・確率密度

p(x)

に従う確率変数

X

を区間

[0,1)

の一様乱数

r

から作る方法,逆関数法 確率変数

X

が区間

[0,1)

の一様乱数

r

から

X =f(r)

と作れたとする。このとき

Z b

a

p(x)dx=P(aX < b) =P(f−1(a)r < f−1(b)) =f−1(b)f−1(a) (17.4)

という関係がある。ただし

f−1

f

の逆関数を表す。式

(15.3)

と比較すると,f

−1

X

の累 積分布関数

F(x)

とすればよいことがわかる。従って

X =F−1(r), F :

累積分布関数

(17.5)

によって確率変数

X

が区間

[0,1)

の一様乱数

r

から作れる。

(18)

(例)

コーシー

(Cauchy)

分布

p(x) = a π

1

a2+x2 (18.1) F(x) = 1

πarctan

³x a

´ +1

2 (18.2)

X =a tan

³ (r1

2

´

(18.3)

-4 -2 2 4

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

-4 -2 2 4

0.1 0.2 0.3

F(x)

p(x)

x

x

a= 1

の場合の図

(例)

指数分布;稀にしか起こらない現象が次に起きるまでの時間の分布

p(x) = a e−ax, x0 (18.4)

F(x) = 1e−ax (18.5)

X =1

a log(1r) (18.6)

1 2 3 4 5

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

1 2 3 4 5

0.2 0.4 0.6 0.8 1

x

x p(x)

F(x)

a= 1

の場合の図

【問】

確率密度

p(x)

p(x) = (

1x/2 ; 0x <2

0 ; x <0||2x (18.7)

に従う確率変数

X

を一様乱数

uniform()

から生成する関数を表す

C

のプログラム

(の一部)

を 書きなさい。

【答】

累積分布関数は

F(x) = x x2

4 (18.8)

となる。一様乱数を

r

で表すと,X は

r=XX2

4

X

について解いて

X = 22

1r (18.9)

(19)

と表される。以下は

C

で書かれたプログラムの例を示す;

double Finverse(double r){

double x;

x= 2.0 - 2.0 * sqrt( 1.0 - r);

return x;

}

double get_myrandom(void){

double x;

double r;

r=uniform();

x=Finverse(r); /* Finverse

は累積分布関数の逆関数で, 上で定義される

*/

return x;

}

2

つの確率変数

X

Y

の間に関数関係

Y =f(X)

がある場合の確率密度の関係

A=f(a), B =f(b)

であるとき,

P(aX b) = P(AY B) = Z B

A

pY(y) dy (19.1)

となる。ところが,関係

y=f(x)

を用いて,積分変数を

y

から

x

に変えると

Z B

A

pY(y) dy= Z b

a

pY(f(x)) df(x)

dx dx (19.2)

となるので結局

P(aX b) = Z b

a

pY(f(x)) df(x)

dx dx (19.3)

という等式が得られる。この式と

(15.1)

を比べると

X

の確率密度

pX(x)

Y

の確率密度

pY(y)

の間に次の関係があることがわかる;

pX(x) =pY(f(x)) df(x)

dx (19.4)

【問】

摩擦のない水平面

(x-y

平面) 上の点

(0, −a)

から物体をいろいろな向きに滑らせる。物体をど の向きにも一様にランダムに滑らすとする。物体が

x

軸を横切るときの

x

座標を確率変数

X

とする。X に対する確率密度

p(x)

を求めなさい。

【答】

物体を滑らす向きと

y

軸との角度を

θ

とする。物体が

x

軸を横切る場合のみ考えると,

θ

−π/2< θ < π/2

の範囲にあるので

θ

に対する確率密度

pθ(θ)

pθ(θ) = 1

π , π

2 < θ < π

2 (19.5)

(20)

となる。X

=atan(θ)

の関係があるので式

(19.4)

より

p(x) = a

π 1

a2+x2 (20.1)

となる。式

(18.1)

と比べると

X

はコーシー分布に従うことがわかる。

・2 つの確率変数に対する確率密度

2

つの確率変数

X

Y

を考える。点

(X , Y)

x-y

平面の領域

R

に属する確率

P

³

(X , Y)R

´

は確率密度

p(x, y)

を用いて

P³

(X , Y)R´

= Z Z

R

p(x, y) dxdy (20.2)

と表される。ここで,右辺は

2

変数の関数

p(x, y)

の領域

R

での

2

重積分を表す。

【問】

1

回にジャンプする変位

S =X(t+ 1)X(t)

が連続な値をとるランダムウォークを考える。S が確率密度

w(s)

に従う場合を考える。時刻

t

のウォーカーの位置

X(t)

a X(t)< b

とな る確率は確率密度

p(x, t)

を用いて

P(a X(t)< b) = Z b

a

p(x, t)dx (20.3)

と表される。時刻

t+ 1

のウォーカーの位置

X(t+ 1)

に対する確率密度

p(x, t+ 1)

p(x, t)

の 間の関係を表す式を求めなさい。

【答】

時刻

t+ 1

のウォーカーの位置

X(t+ 1)

aX(t+ 1) < b

となる確率

P(a X(t+ 1)< b)

aX(t) +S < b

となる確率に等しい。この確率は

2

つの確率変数

S

X(t)

に対する確率 密度

w(s) p(x, t)

を領域

aX(t) +S < b

で積分すれば得られる;

P(aX(t+ 1)< b) = Z Z

a≤x+s<b

w(s) p(x, t) dxds (20.4)

積分変数

x

の代わりに

y=x+s

を用いると

P(aX(t+ 1)< b) =

Z b

a

dy Z

−∞

ds w(s) p(ys, t) (20.5)

となる。一方,X(t

+ 1)

に対する確率密度

p(x, t+ 1)

を用いると

P(aX(t+ 1)< b) = Z b

a

p(x, t+ 1) dx (20.6)

であるので,式

(20.5)

(20.6)

を比べて次の関係式が得られる;

p(x , t+ 1) = Z

−∞

w(s)p(xs , t) ds (20.7)

(21)

【問】

1

回にジャンプする変位

S =X(t+ 1)X(t)

が確率密度

w(s)

に従うランダムウォークを考え る。時刻

t= 0

でウォーカーが位置

X(0) = X0

から出発する場合の,任意の時刻

t = 0,1,2,· · ·

での母平均と母分散を求めなさい。

【答】

一般の時刻

t

でのランダムウォークの母平均

µ(t) =

Z

−∞

xp(x, t) dx (21.1)

をプリント.13 と同様に計算してみよう。まず時間が

1

ステップ増えると

µ(t)

がどれだけ変化 するかを考える。式

(20.7)

より

µ(t+ 1) = Z

−∞

xp(x, t+ 1) dx= Z

−∞

dx x Z

−∞

ds w(s)p(xs , t) ds (21.2)

となる。積分変数

x

の代わりに

y=xs

を用いると

µ(t+ 1) = Z

−∞

dy Z

−∞

ds (y+s)w(s)p(y , t)

= Z

−∞

dy y p(y , t) Z

−∞

ds w(s) + Z

−∞

dy p(y , t) Z

−∞

ds s w(s)

= µ(t) +µS (21.3)

が得られる。ここで

µS =E(S) = Z

−∞

ds s w(s) (21.4)

1

回にジャンプする変位

S

の母平均を表す。µ(0) =

X0

なので

µ(t) =µS t+X0 (21.5)

となる。

次に母分散を計算してみよう。時刻

t+ 1

でのランダムウォーカーの位置

X(t+ 1)

2

乗の期 待値は

E

³

X(t+ 1)2

´

= Z

−∞

x2 p(x, t+ 1) = Z

−∞

dx x2 Z

−∞

ds w(s) p(xs , t) ds (21.6)

となる。上と同様に積分変数

x

の代わりに

y =xs

を用いると次が得られる:

E

³

X(t+ 1)2

´

= Z

−∞

dy Z

−∞

ds (y+s)2 w(s) p(y , t)

= Z

−∞

dy y2 p(y , t) Z

−∞

ds w(s) + 2 Z

−∞

dy y p(y , t) Z

−∞

ds s w(s) +

Z

−∞

dy p(y , t) Z

−∞

ds s2 w(s)

= E

³ X(t)2

´

+ 2µ(t)µS+E

³ S2

´

(21.7)

(22)

ここで

E

³ S2

´

= Z

−∞

ds s2 w(s) (22.1)

である。式

(21.3)

と式

(21.7)

より

σ2(t+ 1) = E

³

X(t+ 1)2

´

µ(t+ 1)2

= E(X(t)2) + 2µ(t)µS+E

³ S2

´

³

µ(t) +µS

´2

= E(X(t)2)µ(t)2+E

³ S2

´

µ2S =σ2(t) +σ2S (22.2)

が得られる。

σS2 =E

³ S2

´

µ2S (22.3)

1

回にジャンプする変位

S

の母分散を表す。ランダムウォーカーの母分散は

t

1

増えるご とに

σ2S

だけ増加することがわかる。。σ

2(0) = 0

なので

σ2(t) = σ2S t (22.4)

となる。

【問】

一回にジャンプする変位

S(t) =X(t+ 1)X(t)

が時刻

t

によって異なる確率密度

w(s, t)

に 従うランダムウォークを考える。この場合には任意の時刻

t = 0,1,2,· · ·

での母平均と母分散 はどんな式で表されるだろうか?

【答】

上と同様に考えると

µ(t+ 1) = µ(t) +µS(t) (22.5)

σ2(t+ 1) = σ2(t) +σS(t)2 (22.6)

となる。ここで

µS(t) =E

³ S(t)

´

= Z

−∞

s w(s, t) ds (22.7)

S(t)

の母平均,

σS(t)2 =E

³

(S(t)µS(t))2)

´

= Z

−∞

s2 w(s, t) dsS(t))2 (22.8)

S(t)

の母分散を表す。これより

µ(t) = Xt−1

k=0

µS(k)+µ(0) (22.9)

σ(t)2 = Xt−1

k=0

σS(k)2 +σ(0)2 (22.10)

と表せる。

(23)

・サンプル平均の母平均と母分散

1

回にジャンプする変位

S =X(t+ 1)X(t)

が同じ確率密度

w(s)

に従うランダムウォークを 考える。

X(t+ 1) =X(t) +S(t) (23.1)

なので,ウォーカーが

X(0) = 0

から出発する場合を考えると

X(t) =S(0) +S(1) +· · ·+S(t1) =

Xt−1

k=0

S(k) (23.2)

となる。従って

(21.5)

(22.4)

より

t

個の独立な同じ確率密度に従う確率変数の和

S(0) +S(1) +· · ·+S(t1) (23.3)

の母平均と母分散は,和の中のどれか

1

個の確率変数

{S(k), k = 0,· · · , t1}

の母平均や母分 散の

t

倍になることがわかる。

今,母平均が

µ1

,母分散が

σ12

である確率密度に従う確率変数を考える。この確率変数

N

個 から作られるサンプル平均

X¯N = 1

N(X1+X2+· · ·+XN) (23.4)

の母平均

µN

と母分散

σN2

µN =µ1, σN2 = 1

Nσ21 (23.5)

となる。分散の平方根は確率変数の分布のばらつきの大きさの程度を表す量なので,

N

回の試行から得られたサンプル平均のばらつきの大きさは

1

N

に比例して減少し ていく。

確率変数

X

が何かの測定値である場合を考えよう。いろいろな測定誤差のために得られた測 定値

X

は真の値

µ1

からずれる。しかし,何回も測定を繰り返して平均値を求めることで真の 値

µN =µ1

からのずれが小さくなる確率が高まる。また,サンプル分散から母分散を推定する ことにより得られたサンプル平均

X¯N

に含まれる誤差の大きさを見積もることができる。

<注> 中心極限定理

サンプル平均

X¯N

の従う確率密度は

N → ∞

で平均

µN

,分散

σN2

の 正規分布

p(x) = 1

2π σN

exp µ

(xµN)2 N2

(23.6)

に近づくことが知られている。

(24)

・中心極限定理を利用して平均

0,分散 1

の正規分布を作る方法

r1, r2,· · ·rN

をそれぞれ区間

[0,1)

の一様乱数とする。,式

(16.2),(16.3)

より

rk

の平均と分散 は

1/2

1/12

なので

z =

µr1+r2+· · ·+rN

N 1

2

¶Á r 1

12N (24.1)

は平均

0,分散 1

の確率変数となる。中心極限定理より

N

が大きくなると

z

の従う確率密度 は平均

0,分散1

の正規分布に近づく。実際上は

N = 6

ぐらいで

z

は正規分布に近くなる。

<注>

2

つの確率変数

X

Y

が 独立 であるということ

2

つの確率変数

X

Y

が独立であるとは任意の関数

f(X)

g(Y)

に対して

E

³

f(X) g(Y)

´

=E

³ f(X)

´ E

³ g(Y)

´

(24.2)

が成り立つことを意味する。

X

Y

が離散的な値をとる確率変数の場合,これは積事象の確率がそれぞれの事象の確率の 積となること

P(X =x && Y =y) =PX(X=x) PY(Y =y) (24.3)

を意味する。また,X と

Y

が連続的な値をとる確率変数の場合,これは

X,Y

の確率密度が

p(x , y) = pX(x) pY(y) (24.4)

のように

2

つの関数の積となることを意味する。

今まで,考えたきたランダムウォークはウォーカーのいる位置

X(t)

と次にジャンプする変位

S(t)

が独立な確率変数の場合なので,式

(14.11)

や式

(21.7)

の結果は次のようにしても得られる;

E

³

X(t+ 1)2

´

= E

³

(X(t) +S(t))2

´

=E

³

X(t)2+ 2X(t) S(t) +S(t)2

´

= E

³ X(t)2

´ +E

³

2X(t)S(t)

´ +E

³ S(t)2

´

= E

³ X(t)2

´ + 2 E

³ X(t)

´ E

³ S(t)

´ +E

³ S(t)2

´

= E

³ X(t)2

´

+ 2 µ(t) µS +E

³ S(t)2

´

(24.5)

参照

関連したドキュメント

重回帰分析,相関分析の結果を参考に,初期モデル

文献資料リポジトリとの連携および横断検索の 実現である.複数の機関に分散している多様な

絡み目を平面に射影し,線が交差しているところに上下 の情報をつけたものを絡み目の 図式 という..

で得られたものである。第5章の結果は E £vÞG+ÞH 、 第6章の結果は E £ÉH による。また、 ,7°²­›Ç›¦ には熱核の

この節では mKdV 方程式を興味の中心に据えて,mKdV 方程式によって統制されるような平面曲線の連 続朗変形,半離散 mKdV

In this paper, we consider the discrete deformation of the discrete space curves with constant torsion described by the discrete mKdV or the discrete sine‐Gordon equations, and

方式で 45 ~ 55 %、積上げ方式で 35 ~ 45% 又は純費用方式で 35 ~ 45 %)の選択制 (※一部例外を除く)

スイーパー/スクラバー ビルメンテナンスや駅構内清掃など で大いに活躍している産業用電動式 清掃機。5 人分の仕事も 1 人で