(
参考
)サンプル分散の式で
1/N −1をかける理由 サンプル分散
S2の期待値を考えてみよう。
X1−X¯N = µ
1− 1 N
¶
X1− 1 N
XN k=2
Xk (13.1)
なので
¡X1−X¯N¢2
= µ
1− 1 N
¶2
(X1)2−2 µ
1− 1 N
¶ X1 1
N XN k=2
Xk+ 1 N2
XN k=2
(Xk)2+ 1 N2
X
k,l,k6=l
XkXl (13.2)
となる。この式の期待値
E(¡X1−X¯N¢2
)
は
{Xk, k= 1,· · ·, N}がそれぞれ独立なので
µ1− 1 N
¶2
E(X2)−2 µ
1− 1 N
¶N−1
N E(X)2+ N−1
N2 E(X2) +(N−1)(N−2)
N2 E(X)2
= N−1 N
³
E(X2)−E(X)2
´
= N −1
N σ2 (13.3)
となる。
S2の期待値は上式の
NN −1
倍なのでサンプル分散の期待値が母分散に等しいことがわかる:
E(S2) =σ2 (13.4)
(例)
ランダムウォークの母平均と母分散の時間発展 一般の時刻
tでのランダムウォークの母平均
µ(t) = X∞
x=−∞
xP(x, t) (13.5)
を計算してみよう。いきなり
µ(t)を求めるのは難しそうなので,時間が
1ステップ増えると
µ(t)がどれだけ変化するかを考える。式
(8.1)より
µ(t+ 1) = X∞
x=−∞
xP(x, t+ 1) = X∞
x=−∞
x(pP(x−1, t) +qP(x+ 1, t)) (13.6)
となる。上式右辺第
1項は
pX∞
x=−∞
xP(x−1, t) = p X∞
y=−∞
(y+ 1)P(y, t) = p X∞
y=−∞
yP(y, t) +p X∞
y=−∞
P(y, t)
= p µ(t) +p (13.7)
となる。y
=x−1であり,
X∞
y=−∞
P(y, t) = 1
を用いた。同様に
q X∞
x=−∞
xP(x+ 1, t) = q X∞
y0=−∞
(y0−1)P(y0, t) = q X∞
y0=−∞
y0P(y0, t)−q X∞
y0=−∞
P(y0, t)
= q µ(t)−q (13.8)
となるので
µ(t+ 1) =µ(t) +p−q (13.9)
が得られる。µ(0) = 0 なので
µ(t) = (p−q) t (13.10)
となる。時間とともに
p > qなら母平均は増加し,p < q なら減少する。
次に母分散を計算してみよう。まず,時刻
t+ 1でのランダムウォーカーの位置
X(t+ 1)の
2乗の期待値は
E
³
X(t+ 1)2
´
= X∞
x=−∞
x2 P(x, t+ 1) =p X∞
x=−∞
x2 P(x−1, t) +q X∞
x=−∞
x2 P(x+ 1, t)
= p X∞
y=−∞
y2 P(y, t) + 2p X∞
x=−∞
y P(y, t) +p X∞
x=−∞
P(y, t)
+ q X∞
y0=−∞
y02 P(y0, t)−2q X∞
y0=−∞
y0 P(y0, t) +q X∞
y0=−∞
P(y0, t)
= (p+q)E(X(t)2) + 2(p−q)E(X(t)) +p+q
= E(X(t)2) + 2(p−q)µ(t) + 1 (14.11)
のように時刻
tの量と関係がつく。これより
σ2(t+ 1) = E³
X(t+ 1)2
´
−µ(t+ 1)2
= E(X(t)2) + 2(p−q)µ(t) + 1−
³
µ(t) +p−q
´2
=σ2(t) + 4pq (14.12)
が得られ,母分散は
tが
1増えるごとに
4pqだけ増加することがわかる。。σ
2(0) = 0なので
σ2(t) = 4 p q t (14.13)
となる。
【問】
ランダムウォーカーが確率
pRで 右へ,確率
pLで左へ,確率
pSでその位置にとどまる場合の 時刻
tの母平均と母分散を求めなさい。
【答】
上と同様に時刻
t+ 1と
tの量の関係をつけると
µ(t+ 1) =µ(t) +pR−pL, σ2(t+ 1) =σ2(t) +pR+pL−³
pR−pL´2
(14.14)
が得られる。初期条件
µ(0) = 0, σ2(0) = 0より
µ(t) = (pR−pL)t , σ2(t) =
½
pR+pL−
³
pR−pL
´2¾
t (14.15)
となる。尚,p
R+pL+pS = 1なので
σ2(t)は次のようにも表せる。
σ2(t) =
³
4pRpL+pS(1−pS)
´
t (14.16)
・確率変数のとる値が連続
(実数)の場合
確率変数
Xが離散的な値
{x1, x2,· · · }をとる場合は
X = xiとなる確率
P(xi)を考えたが,
X
のとる値が連続な場合は,X がある
1点の値をとる確率,例えば
(X = 1.0となる確率) は
0となる。(点の長さは
0であるため。)
X
のとる値がある区間
[a , b]に入る確率,P
(a ≤X ≤b)を考える必要がある。
P(a≤X ≤b) = Z b
a
p(x)dx (15.1)
である場合
p(x) (≥0)は 確率密度関数 と呼ばれ る。
Z ∞−∞
p(x)dx = 1 (15.2)
となっている。また,X のとる値が
x以下である 確率
F(x) = P(−∞ < X ≤ x)を
xの関数と考え て 累積分布関数 と呼ぶ。
F(x) = Z x
−∞
p(x0)dx0 (15.3)
-2 -1 0.5 1 2
0.1 0.2 0.3 0.4 0.5 0.6
p(x) = 1
√π e−x2
<注>
dF(x)/dx=p(x)の関係がある。すなわち,F
(x)は
p(x)の原始関数の一つ。
・母平均
(離散的な場合の式(10.1)に対応)
µ=E(X) =Z ∞
−∞
x p(x) dx (15.4)
・関数
f(X)の期待値
(離散的な場合の式(11.2)に対応)
E(f(X)) =Z ∞
−∞
f(x) p(x) dx (15.5)
・母分散
(離散的な場合の式(12.1)に対応)
σ2 =E³
(X−µ)2
´
= Z ∞
−∞
(x−µ)2 p(x) dx= Z ∞
−∞
x2 p(x) dx−µ2 (15.6) (例)
区間
[0, 1)の一様乱数
p(x) = (
1 ; 0≤x <1
0 ; x <0 || 1≤x (15.7)
double uniform(void){
double r;
r = ((double) rand())/((double)RAND_MAX + 1.0);
return(r);
}
他の確率分布に従う確率変数は
uniform()から作る。
・累積分布関数
F(x) =
0 ; x <0 x ; 0≤x <1 1 ; 1≤x
(16.1)
・母平均
µ= Z 1
0
x dx= x2 2
¯¯
¯¯
x=1 x=0
= 1
2 (16.2)
・母分散
σ2 = Z 1
0
x2 dx−µ2 = x3 3
¯¯
¯¯
x=1 x=0
−1 4 = 1
12 (16.3)
(例)
区間
[a , b)の一様乱数
p(x) = (
1/(b−a) ; a≤x < b
0 ; x < a || b≤x (16.4)
double get_myrandom(void){
double x;
double r;
r=uniform();
x= r*(b -a) + a ; return x;
}
1 2 3 4
0.20.4 0.60.81
F(x)
x
a= 1,b= 3
の場合
・累積分布関数
F(x) =
0 ; x < a (x−a)/(b−a) ; a ≤x < b
1 ; b≤x
(16.5)
・母平均
µ= Z b
a
x
b−a dx= x2 2(b−a)
¯¯
¯¯
x=b x=a
= a+b
2 (16.6)
・母分散
σ2 = Z b
a
x2
b−a dx−µ2 = x3 3(b−a)
¯¯
¯¯
x=b x=a
− (a+b)2
4 = (b−a)2
12 (16.7)
(例)
p(x) =
1/2 ; 1≤x <2 1/4 ; 2≤x <4
0 ; x <1||4≤x
(16.8)
double get_myrandom(void){
double x;
double r;
r=uniform();
if( r < 0.5 ){
x= 2.0*r + 1.0;
} else {
x= 4.0*r ; }
return x;
}
1 2 3 4 5
0.2 0.4 0.6 0.8 1
1 2 3 4 5
0.1 0.2 0.3 0.4 0.5
F(x)
x
x p(x)
・累積分布関数
F(x) =
0 ; x <1 (x−1)/2 ; 1≤x <2 (x−2)/4 + 1/2 ; 2≤x <4
1 ; 4≤x
(17.1)
・母平均
µ= Z 2
1
x 2 dx+
Z 4
2
x
4 dx= x2 4
¯¯
¯¯
x=2 x=1
+ x2 8
¯¯
¯¯
x=4 x=2
= 9
4 (17.2)
・母分散
Z ∞
−∞
x2 p(x)dx = Z 2
1
x2 2 dx+
Z 4
2
x2
4 dx= x3 6
¯¯
¯¯
x=2 x=1
+ x3 12
¯¯
¯¯
x=4 x=2
= 35 6 σ2 = 35
6 − µ9
4
¶2
= 37
48 (17.3)
・確率密度
p(x)に従う確率変数
Xを区間
[0,1)の一様乱数
rから作る方法,逆関数法 確率変数
Xが区間
[0,1)の一様乱数
rから
X =f(r)と作れたとする。このとき
Z b
a
p(x)dx=P(a≤X < b) =P(f−1(a)≤r < f−1(b)) =f−1(b)−f−1(a) (17.4)
という関係がある。ただし
f−1は
fの逆関数を表す。式
(15.3)と比較すると,f
−1を
Xの累 積分布関数
F(x)とすればよいことがわかる。従って
X =F−1(r), F :
累積分布関数
(17.5)によって確率変数
Xが区間
[0,1)の一様乱数
rから作れる。
(例)
コーシー
(Cauchy)分布
p(x) = a π
1
a2+x2 (18.1) F(x) = 1
πarctan
³x a
´ +1
2 (18.2)
X =a tan
³ (r−1
2)π
´
(18.3)
-4 -2 2 4
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
-4 -2 2 4
0.1 0.2 0.3
F(x)
p(x)
x
x
a= 1
の場合の図
(例)指数分布;稀にしか起こらない現象が次に起きるまでの時間の分布
p(x) = a e−ax, x≥0 (18.4)
F(x) = 1−e−ax (18.5)
X =−1
a log(1−r) (18.6)
1 2 3 4 5
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
1 2 3 4 5
0.2 0.4 0.6 0.8 1
x
x p(x)
F(x)
a= 1
の場合の図
【問】
確率密度
p(x)p(x) = (
1−x/2 ; 0≤x <2
0 ; x <0||2≤x (18.7)
に従う確率変数
Xを一様乱数
uniform()から生成する関数を表す
Cのプログラム
(の一部)を 書きなさい。
【答】
累積分布関数は
F(x) = x− x2
4 (18.8)
となる。一様乱数を
rで表すと,X は
r=X−X24
を
Xについて解いて
X = 2−2√1−r (18.9)
と表される。以下は
Cで書かれたプログラムの例を示す;
double Finverse(double r){
double x;
x= 2.0 - 2.0 * sqrt( 1.0 - r);
return x;
}
double get_myrandom(void){
double x;
double r;
r=uniform();
x=Finverse(r); /* Finverse
は累積分布関数の逆関数で, 上で定義される
*/return x;
}
・
2つの確率変数
Xと
Yの間に関数関係
Y =f(X)がある場合の確率密度の関係
A=f(a), B =f(b)であるとき,
P(a≤X ≤b) = P(A≤Y ≤B) = Z B
A
pY(y) dy (19.1)
となる。ところが,関係
y=f(x)を用いて,積分変数を
yから
xに変えると
Z BA
pY(y) dy= Z b
a
pY(f(x)) df(x)
dx dx (19.2)
となるので結局
P(a≤X ≤b) = Z b
a
pY(f(x)) df(x)
dx dx (19.3)
という等式が得られる。この式と
(15.1)を比べると
Xの確率密度
pX(x)と
Yの確率密度
pY(y)の間に次の関係があることがわかる;
pX(x) =pY(f(x)) df(x)
dx (19.4)
【問】
摩擦のない水平面
(x-y平面) 上の点
(0, −a)から物体をいろいろな向きに滑らせる。物体をど の向きにも一様にランダムに滑らすとする。物体が
x軸を横切るときの
x座標を確率変数
Xとする。X に対する確率密度
p(x)を求めなさい。
【答】
物体を滑らす向きと
y軸との角度を
θとする。物体が
x軸を横切る場合のみ考えると,
θは
−π/2< θ < π/2
の範囲にあるので
θに対する確率密度
pθ(θ)は
pθ(θ) = 1π , −π
2 < θ < π
2 (19.5)
となる。X
=atan(θ)の関係があるので式
(19.4)より
p(x) = aπ 1
a2+x2 (20.1)
となる。式
(18.1)と比べると
Xはコーシー分布に従うことがわかる。
・2 つの確率変数に対する確率密度
2
つの確率変数
Xと
Yを考える。点
(X , Y)が
x-y平面の領域
Rに属する確率
P³
(X , Y)∈R
´
は確率密度
p(x, y)を用いて
P³(X , Y)∈R´
= Z Z
R
p(x, y) dxdy (20.2)
と表される。ここで,右辺は
2変数の関数
p(x, y)の領域
Rでの
2重積分を表す。
【問】
1
回にジャンプする変位
S =X(t+ 1)−X(t)が連続な値をとるランダムウォークを考える。S が確率密度
w(s)に従う場合を考える。時刻
tのウォーカーの位置
X(t)が
a ≤X(t)< bとな る確率は確率密度
p(x, t)を用いて
P(a ≤X(t)< b) = Z b
a
p(x, t)dx (20.3)
と表される。時刻
t+ 1のウォーカーの位置
X(t+ 1)に対する確率密度
p(x, t+ 1)と
p(x, t)の 間の関係を表す式を求めなさい。
【答】
時刻
t+ 1のウォーカーの位置
X(t+ 1)が
a≤X(t+ 1) < bとなる確率
P(a ≤X(t+ 1)< b)は
a≤X(t) +S < bとなる確率に等しい。この確率は
2つの確率変数
Sと
X(t)に対する確率 密度
w(s) p(x, t)を領域
a≤X(t) +S < bで積分すれば得られる;
P(a≤X(t+ 1)< b) = Z Z
a≤x+s<b
w(s) p(x, t) dxds (20.4)
積分変数
xの代わりに
y=x+sを用いると
P(a≤X(t+ 1)< b) =Z b
a
dy Z ∞
−∞
ds w(s) p(y−s, t) (20.5)
となる。一方,X(t
+ 1)に対する確率密度
p(x, t+ 1)を用いると
P(a≤X(t+ 1)< b) = Z b
a
p(x, t+ 1) dx (20.6)
であるので,式
(20.5)と
(20.6)を比べて次の関係式が得られる;
p(x , t+ 1) = Z ∞
−∞
w(s)p(x−s , t) ds (20.7)
【問】
1
回にジャンプする変位
S =X(t+ 1)−X(t)が確率密度
w(s)に従うランダムウォークを考え る。時刻
t= 0でウォーカーが位置
X(0) = X0から出発する場合の,任意の時刻
t = 0,1,2,· · ·での母平均と母分散を求めなさい。
【答】
一般の時刻
tでのランダムウォークの母平均
µ(t) =Z ∞
−∞
xp(x, t) dx (21.1)
をプリント.13 と同様に計算してみよう。まず時間が
1ステップ増えると
µ(t)がどれだけ変化 するかを考える。式
(20.7)より
µ(t+ 1) = Z ∞
−∞
xp(x, t+ 1) dx= Z ∞
−∞
dx x Z ∞
−∞
ds w(s)p(x−s , t) ds (21.2)
となる。積分変数
xの代わりに
y=x−sを用いると
µ(t+ 1) = Z ∞
−∞
dy Z ∞
−∞
ds (y+s)w(s)p(y , t)
= Z
−∞
dy y p(y , t) Z ∞
−∞
ds w(s) + Z
−∞
dy p(y , t) Z ∞
−∞
ds s w(s)
= µ(t) +µS (21.3)
が得られる。ここで
µS =E(S) = Z ∞
−∞
ds s w(s) (21.4)
は
1回にジャンプする変位
Sの母平均を表す。µ(0) =
X0なので
µ(t) =µS t+X0 (21.5)
となる。
次に母分散を計算してみよう。時刻
t+ 1でのランダムウォーカーの位置
X(t+ 1)の
2乗の期 待値は
E
³
X(t+ 1)2
´
= Z ∞
−∞
x2 p(x, t+ 1) = Z ∞
−∞
dx x2 Z ∞
−∞
ds w(s) p(x−s , t) ds (21.6)
となる。上と同様に積分変数
xの代わりに
y =x−sを用いると次が得られる:
E
³
X(t+ 1)2
´
= Z ∞
−∞
dy Z ∞
−∞
ds (y+s)2 w(s) p(y , t)
= Z ∞
−∞
dy y2 p(y , t) Z ∞
−∞
ds w(s) + 2 Z ∞
−∞
dy y p(y , t) Z ∞
−∞
ds s w(s) +
Z ∞
−∞
dy p(y , t) Z ∞
−∞
ds s2 w(s)
= E
³ X(t)2
´
+ 2µ(t)µS+E
³ S2
´
(21.7)
ここで
E
³ S2
´
= Z ∞
−∞
ds s2 w(s) (22.1)
である。式
(21.3)と式
(21.7)より
σ2(t+ 1) = E³
X(t+ 1)2
´
−µ(t+ 1)2
= E(X(t)2) + 2µ(t)µS+E
³ S2
´
−
³
µ(t) +µS
´2
= E(X(t)2)−µ(t)2+E
³ S2
´
−µ2S =σ2(t) +σ2S (22.2)
が得られる。
σS2 =E
³ S2
´
−µ2S (22.3)
は
1回にジャンプする変位
Sの母分散を表す。ランダムウォーカーの母分散は
tが
1増えるご とに
σ2Sだけ増加することがわかる。。σ
2(0) = 0なので
σ2(t) = σ2S t (22.4)
となる。
【問】
一回にジャンプする変位
S(t) =X(t+ 1)−X(t)が時刻
tによって異なる確率密度
w(s, t)に 従うランダムウォークを考える。この場合には任意の時刻
t = 0,1,2,· · ·での母平均と母分散 はどんな式で表されるだろうか?
【答】
上と同様に考えると
µ(t+ 1) = µ(t) +µS(t) (22.5)
σ2(t+ 1) = σ2(t) +σS(t)2 (22.6)
となる。ここで
µS(t) =E
³ S(t)
´
= Z ∞
−∞
s w(s, t) ds (22.7)
は
S(t)の母平均,
σS(t)2 =E
³
(S(t)−µS(t))2)
´
= Z ∞
−∞
s2 w(s, t) ds−(µS(t))2 (22.8)
は
S(t)の母分散を表す。これより
µ(t) = Xt−1
k=0
µS(k)+µ(0) (22.9)
σ(t)2 = Xt−1
k=0
σS(k)2 +σ(0)2 (22.10)
と表せる。
・サンプル平均の母平均と母分散
1
回にジャンプする変位
S =X(t+ 1)−X(t)が同じ確率密度
w(s)に従うランダムウォークを 考える。
X(t+ 1) =X(t) +S(t) (23.1)
なので,ウォーカーが
X(0) = 0から出発する場合を考えると
X(t) =S(0) +S(1) +· · ·+S(t−1) =Xt−1
k=0
S(k) (23.2)
となる。従って
(21.5)と
(22.4)より
t個の独立な同じ確率密度に従う確率変数の和
S(0) +S(1) +· · ·+S(t−1) (23.3)
の母平均と母分散は,和の中のどれか
1個の確率変数
{S(k), k = 0,· · · , t−1}の母平均や母分 散の
t倍になることがわかる。
今,母平均が
µ1,母分散が
σ12である確率密度に従う確率変数を考える。この確率変数
N個 から作られるサンプル平均
X¯N = 1
N(X1+X2+· · ·+XN) (23.4)
の母平均
µNと母分散
σN2は
µN =µ1, σN2 = 1
Nσ21 (23.5)
となる。分散の平方根は確率変数の分布のばらつきの大きさの程度を表す量なので,
N
回の試行から得られたサンプル平均のばらつきの大きさは
1√N
に比例して減少し ていく。
確率変数
Xが何かの測定値である場合を考えよう。いろいろな測定誤差のために得られた測 定値
Xは真の値
µ1からずれる。しかし,何回も測定を繰り返して平均値を求めることで真の 値
µN =µ1からのずれが小さくなる確率が高まる。また,サンプル分散から母分散を推定する ことにより得られたサンプル平均
X¯Nに含まれる誤差の大きさを見積もることができる。
<注> 中心極限定理
サンプル平均
X¯Nの従う確率密度は
N → ∞で平均
µN,分散
σN2の 正規分布
p(x) = 1√2π σN
exp µ
−(x−µN)2 2σN2
¶
(23.6)
に近づくことが知られている。
・中心極限定理を利用して平均
0,分散 1の正規分布を作る方法
r1, r2,· · ·rN
をそれぞれ区間
[0,1)の一様乱数とする。,式
(16.2),(16.3)より
rkの平均と分散 は
1/2と
1/12なので
z =
µr1+r2+· · ·+rN
N − 1
2
¶Á r 1
12N (24.1)
は平均
0,分散 1の確率変数となる。中心極限定理より
Nが大きくなると
zの従う確率密度 は平均
0,分散1の正規分布に近づく。実際上は
N = 6ぐらいで
zは正規分布に近くなる。
<注>
2つの確率変数
Xと
Yが 独立 であるということ
2
つの確率変数
Xと
Yが独立であるとは任意の関数
f(X)と
g(Y)に対して
E³
f(X) g(Y)
´
=E
³ f(X)
´ E
³ g(Y)
´
(24.2)
が成り立つことを意味する。
X
と
Yが離散的な値をとる確率変数の場合,これは積事象の確率がそれぞれの事象の確率の 積となること
P(X =x && Y =y) =PX(X=x) PY(Y =y) (24.3)
を意味する。また,X と
Yが連続的な値をとる確率変数の場合,これは
X,Yの確率密度が
p(x , y) = pX(x) pY(y) (24.4)
のように
2つの関数の積となることを意味する。
今まで,考えたきたランダムウォークはウォーカーのいる位置
X(t)と次にジャンプする変位
S(t)が独立な確率変数の場合なので,式
(14.11)や式
(21.7)の結果は次のようにしても得られる;
E
³
X(t+ 1)2
´
= E
³
(X(t) +S(t))2
´
=E
³
X(t)2+ 2X(t) S(t) +S(t)2
´
= E
³ X(t)2
´ +E
³
2X(t)S(t)
´ +E
³ S(t)2
´
= E
³ X(t)2
´ + 2 E
³ X(t)
´ E
³ S(t)
´ +E
³ S(t)2
´
= E
³ X(t)2
´
+ 2 µ(t) µS +E
³ S(t)2
´
(24.5)