2017
確統
II.0.1¶ ³
確率統計及び演習
II数理情報学科・
3年次配当・前期・学科固有科目・選択・2単位
µ ´
2017
確統
II.0.2ティーチング・アシスタント
(TA)授業中に行う演習の手助けをしてくれます。
助國晟也さん
a,c,d,f山田貫太さん
a,c,f,g,h箕尾暁日さん
b,c,d,e森田英俊さん
他の科目の
TA a:学科チューター
, b:微積分及び演習
, c:線形代数及び演習
, d:物理数学及び演習
, e:数理モデル基礎及 び演習
, f:計算機基礎実習
, g:プログラミング及び実習
, h:数値計算法及び実習
プリント中の
¤
£
¡
¢
これだけ
は参考文献,“ これだけはおさえたい 確率統計
(実教出版) ”を示します。¤
£
¡
統計学 ¢
は参考文献,“統計学入門
(東京大学出版会) ”を示します。¤
£
¡
数理統計 ¢
は参考文献,“数理統計学
(裳華房) ”を示します。¤
£
¡
確統I ¢
は『2016 年度確率統計及び演習
I』の講義を示します。また,以下は
1年の科目「微積分及び演習
I」での参考文献を示します:¤
£
¡
¢
桑村
は参考文献,“桑村『微分積分入門』(裳華房) ”を示します。
¤
£
¡
川薩四 ¢
は参考文献,“川野,薩摩,四ツ谷『微分積分+微分方程式』(裳華房) ”を示します。
オフィスアワー: 月曜
6講時
(1-513),木曜6講時
(1-513) url: http://www.math.ryukoku.ac.jp/ iida/lecture/lecture.html2017
確統
II.0.3★ 成績評価の方法
・予定されている
2回の小テストの両方に
60点以上をとるか,あるいは定期試験に
60点以上をとることで合格 とします。最終成績は,合格の場合は小テストの平均点と定期試験の点数の高い方,不合格の場合は定期試 験の点数,となります。
・小テストと定期試験で参考文献は持込不可です。電子機器
(電卓,携帯電話,PC等) の使用はできません。
・公式や数表等をまとめた,まとめのプリントを試験問題とともに配布します。
・解答で分数や
√は少数になおす必要はありません。答に加減乗除が現れていてもかまいません。
【例】次の確率密度関数
f(x),f(x) =
0 x <0 6x(1−x) 0≤x <1
0 1< x
, (0.3.1)
に従う確率変数
Xについて,0
≤X <1/3となる確率
Pを求めなさい。
【答】
P =
∫ 1/3 0
f(x)dx= 6
∫ 1/3 0
( x−x2
) dx= 6
[x2 2 −x3
3 ]x=1/3
x=0
(0.3.2)
= 6 (1
18− 1 81
)
(0.3.3)
= 7
27. (0.3.4)
上の例の場合は,解答は
(0.3.3)まででかまいません。
2017
確統
II.1.
1 多変数の確率分布
¤
£
¡
確統I L07¢
¨
§
¥
数理統計§4.1¦
1.1 2 変数の離散型確率分布
同時確率分布
ÂÁ
¿
À
確率変数
Xのとる値が
{x1, x2,· · · },確率変数Yのとる値が
{y1, y2,· · · },とする。『X
=xiかつ
Y =yjとなる確率』を 同時確率 あるいは 結合確率 と呼ぶ。この確率分布を記号
fXY(x, y)で表す:
P(X=x, Y =y) =fXY(x, y). ¨
§
¥
統計学(7.1)¦ (1.1)
【例
1.1】2枚のコインA,Bを無作為に投げて表裏を見る。コイン
Aが表
(裏)の場合
X = 1 (X = 0),コインBが表
(裏)の場合
Y = 1 (Y = 0),とする。同時確率 fXY(x, y)の値は次の表のようになる:
y
\
x 0 1計
0 fXY(0,0) =1
4 fXY(1,0) =1
4 P(Y = 0) =fY(0) =1 2
1 fXY(0,1) =1
4 fXY(1,1) =1
4 P(Y = 1) =fY(1) =1 2
計
P(X= 0) =fX(0) =12 P(X= 1) =fX(1) =1
2 1
表
1-1 2つのコインの同時確率分布
【例
1.2】次の6枚のカードから無作為に
1枚のカードを引く:
♥7 ♥8 ♥9 ¦8 ♠9 ♣9
X =
数,Y
= 0(赤札),1(黒札)とすると,同時確率
fXY(x, y)の値は次の表のようになる:
y
\
x 7 8 9計
0 fXY(7,0) =1
6 fXY(8,0) =1
3 fXY(9,0) =1
6 P(Y = 0) =fY(0) =2 3
1 fXY(7,1) = 0 fXY(8,1) = 0 fXY(9,1) =1
3 P(Y = 1) =fY(1) =1 3
計
P(X= 7) =fX(7) =16 P(X= 8) =fX(8) =1
3 P(X= 9) =fX(9) =1
2 1
表
1-2 6枚のカードの同時確率分布 周辺確率分布
'
&
$
%
同時確率分布
fXY(x, y)から,X や
Yの単独の確率分布が求められる:
fX(x) =∑
yj
fXY(x, yj), fY(y) =∑
xi
fXY(xi, y). ¨
§
¥
統計学(7.7)¦ (1.2)
表の周辺にあるので,それぞれ
X,Yの 周辺確率分布 と呼ばれる。
2017
確統
II.2条件付き確率
¨§
¥
これだけ§2.3¦ '
&
$
% Y =yj
が起きているという条件の下での,事象
X=xiが起きる確率
(条件付き確率
)を
P(X =xi|Y =yj)と表す。このとき,以下が成り立つ
P(X =xi, Y =yj) =P(X=xi|Y =yj)P(Y =yj) =P(Y =yj|X =xi)P(X =xi). (2.1)
また,この確率分布を記号
fX|Y(x|y)で表す:
P(X =xi|Y =yj) =fX|Y(xi|yj), P(Y =yj|X=xi) =fY|X(yj|xi). (2.2)
条件付き確率の性質
'&
$
%
∑
xi
fX|Y(xi|yj) = 1, ∑
yj
fY|X(yj|xi) = 1. ¨
§
¥
統計学(7.19)¦ (2.3)
・同時確率との関係
fXY(xi, yj) =fX|Y(xi|yj)fY(yj) =fY|X(yj|xi)fX(xi). ¨
§
¥
統計学(7.24)¦ (2.4)
fX|Y(xi|yj) = fXY(xi, yj)
fY(yj) , fY|X(yj|xi) =fXY(xi, yj) fX(xi) . ¨
§
¥
統計学(7.18)¦ (2.5)
・周辺確率との関係
fX(xi) =∑yj
fX|Y(xi|yj)fY(yj), fY(yj) =∑
xi
fY|X(yj|xi)fX(xi). ¨
§
¥
統計学(7.9)¦ (2.6)
【問
2.1】【例1.2】の確率分布について以下の問いに答えなさい。(1) E[(9Y + 1)X]
を求めなさい。
(2) 9
の札が出る
(X = 9)という条件のもとで赤札が出る
(Y = 0)条件付き確率,f
Y|X(0|9),を求めなさい。(3)
赤札が出る
(Y = 0)という条件のもとで
9の札が出る
(X = 9)条件付き確率,f
X|Y(9|0),を求めなさい。【答
2.1】(1)
E[(9Y + 1)X] = 1
6×(0 + 1)×7 + 1
3×(0 + 1)×8 + 1
6×(0 + 1)×9 +1
3 ×(9 + 1)×9 = 106
3 . (2.7) (2) (2.5)
より
fY|X(0|9) = fXY(9,0) fX(9) = 1/6
1/2 = 1
3. (2.8)
(3) (2.5)
より
fX|Y(9|0) = fXY(9,0) fY(0) = 1/6
2/3 = 1
4. (2.9)
2017
確統
II.3.
σ[sigma]シグマ,θ [theta]シータ
1.2 2 変数の連続型確率分布
X,Y
が連続型確率変数の場合は,f
XY(x, y)は 同時確率密度関数 を意味する。 『(X, Y
)が領域
Aに属する
確率』が
(和の代わりに)以下のような積分で表される:
P((X, Y)∈A) =
∫ ∫
A
fXY(x, y)dxdy . ¨
§
¥
統計学(7.5)¦ (3.1)
【例
3.1】ダーツを的に向かって投げる場合を考える。(X, Y)をダーツが的に当たった場所の座標,同時確率密度
関数を
fXY(x, y) = 1
2πσ2 e−x2 +y
2
2σ2 (3.2)
とする。このとき,ダーツが的の中心,(X
= 0, Y = 0),から半径Rの円内に当たる確率
Pは次となる:
P =
∫ ∫
x2+y2≤R2
fXY(x, y)dxdy= 1 2πσ2
∫ ∫
x2+y2≤R2
e−x2 +y
2
2σ2 = 1
2πσ2
∫ 2π 0
dθ
∫ R 0
dr r e−r
2 2σ2
= 2π
2πσ2
[−σ2e−r
2 2σ2
]r=R
r=0
= 1−e−R
2
2σ2. (3.3)
上の
3つ目の等式では,積分変数を
(x, y)から
(r, θ)に変換した
¨§
¥
桑村p.223¦¨
§
¥
川薩四§8.3¦
:
x=rcos(θ), y=rsin(θ), dxdy⇒rdrdθ . (3.4)
離散型確率変数の場合の式で,和を積分に置き換えた式が成り立つ:
'
&
$
%
・X ,Y の 周辺確率密度関数
fX(x) =∫ ∞
−∞
fXY(x, y)dy , fY(y) =
∫ ∞
−∞
fXY(x, y)dx . ¨
§
¥
統計学(7.8)¦ (3.5)
・Y
=yを与えたときの
Xの 条件付き確率密度関数
fX|Y(x|y) =fXY(x, y)fY(y) = fXY(x, y)
∫∞
−∞fXY(x, y)dx. ¨
§
¥
統計学(7.18)¦ (3.6)
・条件付き確率密度関数と周辺確率密度関数の関係
fX(x) =∫ ∞
−∞
fX|Y(x|y)fY(y)dy , fY(y) =
∫ ∞
−∞
fY|X(y|x)fX(x)dx . (3.7)
【問
3.1】次の同時確率密度関数fXY(x, y) =
√3
π e−x2+4xy−7y2 (3.8)
について,周辺確率密度関数
fX(x),fY(y)を求めなさい。
2017
確統
II.4.
【答
3.1】(3.5)より次が得られる:
fY(y) =
∫ ∞
−∞
fXY(x, y)dx=
√3 π e−7y2
∫ ∞
−∞
e−x2+4xydx=
√3 π e−7y2
∫ ∞
−∞
e−(x−2y)2+4y2dx
=
√3 π e−3y2
∫ ∞
−∞
e−z2dz=
√3
π e−3y2. (4.1)
上式の
4つ目の等式では,積分変数を
xから
z=x−2yに変換し,5 つ目の等式では以下の公式を用いた:
∫ ∞
−∞
e−z2dz=√
π . ¨
§
¥
桑村p.225¦
¨
§
¥
川薩四(8.7)¦ (4.2)
同様に
fX(x) =
∫ ∞
−∞
fXY(x, y)dy=
√3 π e−x2
∫ ∞
−∞
e−7y2+4xydy=
√3 π e−x2
∫ ∞
−∞
e−7(y−27x)2+47x2dy
=
√3 π√
7e−37x2
∫ ∞
−∞
e−z2dz=
√ 3
7π e−37x2. (4.3)
となる。上の式の
4つ目の等式では,積分変数を
yから
z=√ 7( y−2
7x )
に変換した。
確率変数の独立性
¨§
¥
これだけ§2.4¦ º
¹
·
¸
『確率変数
Xと
Yが独立』⇔ 『同時確率
(密度)関数が周辺確率
(密度)関数の積になる』,つまり次が成り 立つ:
fXY(x, y) =fX(x)fY(y) ¨
§
¥
統計学(7.22)¦ (4.4)
【例
4.1】・X と
Yが独立な場合: 【例
1.1】【例3.1】,・X と
Yが独立でない場合: 【例
1.2】【問3.1】X
と
Yが独立な確率変数の場合に成り立つ性質
'&
$
%
E[φ1(X)φ2(Y)] = E[φ1(X)]E[φ2(Y)], (4.5)
E[X Y] = E[X]E[Y], ¨
§
¥
統計学(7.26)(7.35)¦ (4.6)
V[aX+bY] = a2V[X] +b2V[Y], ¨
§
¥
統計学(7.36)’¦ (4.7)
Cov[X, Y] = 0, ¨
§
¥
統計学(7.27)¦ (4.8)
fX|Y(x|y) = fX(x), fY|X(y|x) =fY(y). ¨
§
¥
統計学(7.23)¦ (4.9)
(4.9)
は
X(Y)が起きる確率に
Y(X)の影響がないことを示す。
これは,X
(Y)が起きる確率に
Y(X)の影響がないことを示す。
注意
! Xと
Yが独立でなくても成り立つ性質:
E[aφ1(X, Y) +bφ2(X, Y)] = a E[φ1(X, Y)] +b E[φ2(X, Y)], (4.10) V[aX+bY] = a2 V[X] +b2V[Y] + 2ab Cov[X, Y], ¨
§
¥
統計学(7.37a)’¦ (4.11)
Cov[X, Y] = E[(X−µX)(Y −µY)] =E[XY]−E[X]E[Y]. ¨
§
¥
統計学(7.14)¦(4.12)
ここで,µ
X=E[X],µY =E[Y]。
2017
確統
II.51.3 ベイズの定理
¨
§
¥
これだけ§2.5¦
¨
§
¥
統計学§4.5.3¦
¨
§
¥
数理統計p.6¦
(2.4),(2.5),(2.6)
を組み合わせると
Yについての条件付き確率
fX|Y(x|y)と
Xについての条件付き確率
fY|X(y|x)の間の関係が得られる。この関係式をベイズの定理
(公式)と呼ぶ。
ベイズ
(Bayes)の定理
'&
$
%
・X と
Yが離散型確率変数の場合
fX|Y(x|y) = fY|X(y|x)fX(x)
∑
xifY|X(y|xi)fX(xi). ¨
§
¥
統計学(4.17)¦ (5.1)
・X と
Yが連続型確率変数の場合
fX|Y(x|y) = fY|X(y|x)fX(x)
∫∞
−∞fY|X(y|x0)fX(x0)dx0 . (5.2)
【問
5.1】(2013年度統計検定
2級 問
9を一部変更)
ある病気の発生率が7パーセントであることが知られている。この病気のある診断法の性能が次の表のように なっている。ある人がこの検査を受けたところ陽性であった。この人が実際に病気にかかっている確率を求めな さい。
病気の有無\診断結果 陽性 陰性 計 罹病している
0.82 0.18 1.00罹病していない
0.13 0.87 1.00表
5-1【答
5.1】確率変数Xと
Yを考え,診断結果が陽性
(陰性)の場合は
X = 0 (X = 1)とし,病気に罹患している
(していない)
場合を
Y = 0 (Y = 1)とすると,表の内容は以下のようになる;
fX|Y(0|0) = 0.82, fX|Y(1|0) = 0.18, fX|Y(0|1) = 0.13, fX|Y(1|1) = 0.87. (5.3)
また,f
Y(0) = 0.07である。これらのデータから確率
fY|X(0|0)を求める問題である。
fY|X(0|0) = fXY(0,0)
fX(0) = fX|Y(0|0)fY(0)
fXY(0,0) +fXY(0,1) = fX|Y(0|0)fY(0)
fX|Y(0|0)fY(0) +fX|Y(0|1)fY(1)
= 0.82×0.07
0.82×0.07 + 0.13×(1−0.07) ≈0.32 (5.4)
となる。
2017
確統
II.6(参考)
ベイズの定理を用いた母数の推定
¨§
¥
統計学p.79¦
例として,コインを
n回投げて
k回表が出たというデータがある場合を考えよう。このコインの表が出る確率
θを推定する。標本数
nが十分大きく,二項分布が正規分布で近似できる場合に確率
0.95で成り立つ次の不等式
θˆ−1.96
√
θ(1ˆ −θ)ˆ
n < θ < θˆ+ 1.96
√
θ(1ˆ −θ)ˆ
n , θˆ= k n
¨
§
¥
統計学(11.59)¦ (6.1)
から,母比率
θの
(信頼係数0.95の) 信頼区間を得た。
¤£
¡
確統I L12¢¨
§
¥
これだけ§7.3.6¦¨
§
¥
数理統計§9.3¦
この場合,θ の値 は定まっていて,
θˆが確率変数と考えた。
一方,θ が確率変数で,確率密度
fΘ(θ)に従い,いろいろな値をとるとする考え方があり, ベイズ統計学 と 呼ばれている。
このとき,ベイズの定理,
fΘ|D(θ|D) = fD|Θ(D|θ)fΘ(θ)
∫fD|Θ(D|θ0)fΘ(θ0)dθ0 , (6.2)
は,観測データがないときに予想した
θの確率密度,f
Θ(θ),に(n回のうち
k回表が出たという) データ
Dを付け 加えて,“より良い” 確率密度,f
Θ|D(θ|D),を得るための道具として使われる。ここで,fΘ(θ)を
(データを得る前の確率分布という意味で) 事前分布 ,f
Θ|D(θ|D)を
(データを得た後の確率分布という意味で)事後分布 と呼ぶ。また,
fD|Θ(D|θ) = nCk θk (1−θ)n−k (6.3)
は,仮定された確率モデルに含まれるパラメータ
(母数),θ,が特定の値をとる場合に,観測データ Dが生じる 確率で, 尤度関数 と呼ばれる。例えば
fΘ(θ)が区間
(0,1)の一様分布で,n
= 20,k= 5の場合の事後分布は
fΘ|D(θ|D) = 325584θ5(1−θ)15 (6.4)となる
(図6-1)。0.2 0.4 0.6 0.8 1
1 2 3 4 5
95%
|D( | )D
fΘ θ
θ2
θ1
θ
0.2 0.4 0.6 0.8 1
1 2 3 4 5
θ fΘ( )θ
࠺࠲
図
6-1事前分布
fΘ(θ)と事後分布
fΘ|D(θ|D)この場合について,f
Θ|D(θ|D)から確率
0.95となる区間を求めると
0.101 < θ < 0.456 (6.5)
となる。このような区間は
(信頼区間と区別して)信用区間 と呼ばれる。( なお,n
= 20は十分大きな標本数 ではないが,この場合の
(24.6)による信頼区間は
(0.060,0.440)である。)
ここでは説明を簡単にするためパラメータが
1個の場合を考えたが,上の手順が実際に用いられるのは,複雑
な現象を説明するための多数のパラメータを含む確率モデルを作る場合である。
2017
確統
II.7.
階乗(factorial) n! =n·(n−1)· · · ·2·1,0! = 1
nCk= n!
k!(n−k)!= n(n−1)· · ·(n−k+ 1)
k! n個のものからk個を取り出す組み合わせの数
2 モーメント母関数
期待値
E[etX]を モーメント母関数 あるいは 積率母関数 と呼ぶ。母平均
E[X]や母分散
V[X] =E[X2]− E[X]2,を求めるのには
E[Xk]の計算が必要だが,指数関数のテイラー展開
etX =
∑∞ k=0
tk
k!Xk = 1 +tX+t2
2X2+· · · (7.1)
より,モーメント母関数は全ての
E[Xk]の情報を持つ。
モーメント母関数
¨§
¥
これだけ§3.4¦
¨
§
¥
統計学§5.3¦
¨
§
¥
数理統計p.20¦ '
&
$
% MX(t) =E[etX] =
∑∞ k=0
tk
k!E[Xk]. ¨
§
¥
統計学(5.40)¦ (7.2)
MX(t) = { ∑
xifX(xi)etxi X
が離散型確率変数の場合
∫∞
−∞fX(x)etxdx X
が連続型確率変数の場合
. ¨§
¥
統計学(5.41)¦ (7.3)
MX(0) =E[1] = 1, dkMX(t) dxk
¯¯¯¯
t=0
=E[Xk]. ¨
§
¥
統計学(5.42)¦ (7.4)
『X と
Yが同じモーメント母関数を持つ』
⇐⇒『X と
Yが同じ確率分布に従う』,つまり,次が成り立つ:
MX(t) =MY(t) ⇐⇒ fX(z) =fY(z). (7.5)
【問
7.1】離散型確率変数Xが二項分布
B(n, p) ¤£
¡
確統I L08¢
¨
§
¥
これだけ§4.2¦
¨
§
¥
統計学§6.2¦
¨
§
¥
数理統計p.29¦
に従う
(確率pで表の出るコインを
n回投げた時,表の出る回数が
X)。モーメント母関数
MX(t)を求めなさい。また,(7.4) よ り,母平均と母分散を求めなさい。
【答
7.1】fX(x) =nCxpx(1−p)n−x x= 0,1,· · ·, n ¨
§
¥
統計学(6.6)¦ (7.6)
より,
MX(t) =
∑n x=0
nCxpx(1−p)n−x etx=
∑n x=0
nCx ( pet)x
(1−p)n−x= (
pet+ 1−p )n
. ¨
§
¥
統計学p.130¦ (7.7)
上の最後の等式で二項定理
(a+b)n=
∑n x=0
nCx axbn−x (7.8)
を用いた。次に,
dMX(t)
dt =
d (
pet+ 1−p )n
dt =n
(
pet+ 1−p )n−1 d
(
pet+ 1−p ) dt =npet
(
pet+ 1−p )n−1
, (7.9) d2MX(t)
dt2 = npdet dt
(
pet+ 1−p )n−1
+npet d
(
pet+ 1−p )n−1
dt
= npet (
pet+ 1−p )n−1
+npet (n−1) (
pet+ 1−p )n−2
pet (7.10)
より,
E[X] = dMX(t) dx
¯¯¯¯
t=0
=np , E[X2] = d2MX(t) dx2
¯¯¯¯
t=0
=np+n(n−1)p2 (7.11)
なので,母平均
E[X]と母分散
V[X]は以下となる:
E[X] =np , V[X] =E[X2]−E[X]2=np(1−p). ¨
§
¥
統計学(6.8)¦ (7.12)
2017
確統
II.8.
Z ∞
−∞e−z2dz=√ π (4.2)
【問
8.1】連続型確率変数Xが正規分布
N(µ, σ2) ¤£
¡
確統I L09¢
¨
§
¥
これだけ§4.7¦
¨
§
¥
統計学§6.6¦
¨
§
¥
数理統計p.36¦
に従う。モー メント母関数
MX(t)を求めなさい。また,(7.4) より,母平均と母分散を求めなさい。
【答
8.1】fX(x) = 1
√2πσ2exp (
−(x−µ)2 2σ2
) ¨
§
¥
統計学(6.19a)¦ (8.1)
より,
MX(t) = 1
√2πσ2
∫ ∞
−∞
exp (
−(x−µ)2 2σ2 +tx
)
dx= 1
√2πσ2
∫ ∞
−∞
exp (
−x2−2(µ+σ2t)x+µ2 2σ2
) dx
= 1
√2πσ2
∫ ∞
−∞
exp
−
(
x−(µ+σ2t) )2
−2µσ2t−σ4t2 2σ2
dx
= exp (
µt+σ2t2 2
) 1
√π
∫ ∞
−∞
e−z2dz= exp (
µt+σ2t2 2
)
. (8.2)
上の
4つ目の等式では積分変数を
xから
z= x−(µ+σ2t)√2σ
に変換し,(4.2 ) を用いた。次に,
dMX(t)
dt =
dexp (
µt+σ22t2 )
dt = exp
(
µt+σ2t2 2
) d (
µt+σ22t2 )
dt = exp
(
µt+σ2t2 2
) (µ+tσ2) ,(8.3)
d2MX(t) dt2 =
dexp (
µt+σ22t2 ) dt
(µ+tσ2) + exp
(
µt+σ2t2 2
)d(
µ+tσ2) dt
= ((
µ+tσ2)2
+σ2 )
exp (
µt+σ2t2 2
)
(8.4)
より,
E[X] = dMX(t) dx
¯¯¯¯
t=0
=µ , E[X2] = d2MX(t) dx2
¯¯¯¯
t=0
=µ2+σ2 (8.5)
なので,母平均
E[X]と母分散
V[X]は以下となる:
E[X] =µ , V[X] =E[X2]−E[X]2=σ2. ¨
§
¥
統計学(6.20),(6.21)¦ (8.6)
正規分布のモーメント母関数
º¹
·
¸
正規分布
N(µ, σ2)に従う連続型確率変数
Xのモーメント母関数:
MX(t) = exp (
µt+σ2t2 2
)
. ¨
§
¥
統計学p.131¦ (8.7)
【問
8.2】確率変数Xのモーメント母関数を
MX(t)とするとき,確率変数
Y =aX+b (a,bは定数) のモーメン ト母関数
MY(t)を求めなさい。また,(7.4) より,X と
Y母平均と母分散の関係を導きなさい。
【答
8.2】MY(t) =E[etY] =E[et(aX+b)] =E[etb eatX] =etb E[eatX] =etb MX(at). (8.8)
2017
確統
II.9次に
dMY(t)
dt =
d (
etbMX(at) ) dt =detb
dt MX(at) +etb dMX(at) dt
= betb MX(at) +etb dMX(s) ds
¯¯¯¯
s=at
d(at) dt =etb
(
bMX(at) +aMX0 (at) )
. (9.1)
ここで,M
X0 (t)は
MX(t)の
1階導関数を表す。また,
d2MY(t)
dt2 = d dt
( etb
(
bMX(at) +aMX0 (at) ))
=detb dt
(
bMX(at) +aMX0 (at) )
+etbd dt
(
bMX(at) +aMX0 (at) )
= betb (
bMX(at) +aMX0 (at) )
+etb (
baMX0 (at) +a2MX00(at) )
= etb (
b2MX(at) + 2abMX0 (at) +a2MX00(at) )
. (9.2)
ここで,M
X00(t)は
MX(t)の
2階導関数を表す。
従って,
E[Y] = dMY(t) dx
¯¯¯¯
t=0
=e0 (
bMX(0) +aMX0 (0) )
=bE[1] +aE[X] =b+aE[X], (9.3) E[Y2] = d2MY(t)
dx2
¯¯¯¯
t=0
=e0 (
b2MX(0) + 2abMX0 (0) +a2MX00(0) )
=b2E[1] + 2abE[X] +a2E[X2]
= b2+ 2abE[X] +a2E[X2], (9.4)
なので,母平均
E[Y] =E[aX+b]と母分散
V[Y] =V[aX+b]は以下となる:
E[aX+b] = aE[X] +b , ¨
§
¥
これだけp.66¦
¨
§
¥
統計学(5.25b,c)¦
¤
£
¡
¢
確統I L05 (9.5)
V[aX+b] = E[Y2]−E[Y]2=a2E[X2] + 2abE[X] +b2−(
aE[X] +b )2
=a2 (
E[X2]−E[X]2 )
= a2V[X]. ¨
§
¥
これだけp.66¦
¨
§
¥
統計学(5.29b,c)¦
¤
£
¡
確統I L05¢ (9.6)
【問
9.1】確率変数Xと
Yが独立な場合,Z
=X+Yのモーメント母関数を求めなさい。
【答
9.1】MZ(t) =E[etZ] =E[et(X+Y)] =E[etX etY](4.5=)E[etX] EetY] =MX(t)MY(t). (9.7)
モーメント母関数の性質
'&
$
%
・aX
+bのモーメント母関数
MaX+b(t) =etbMX(at). ¨
§
¥
これだけ(p.67)¦ (9.8)
・X と
Yが独立なときの,X
+Yのモーメント母関数
MX+Y(t) =MX(t)MY(t). ¨§
¥
これだけ(p.67)¦
¨
§
¥
統計学(7.28)¦
¨
§
¥
数理統計p.61¦ (9.9)
【問
9.2】独立な確率変数Xと
Yがそれぞれ次の正規分布に従うとする:
X ∼N(µ1, σ12), Y ∼N(µ2, σ22). (9.10)
このとき,Z
=X+Yが従う確率分布を
(9.9)を用いて求めなさい。
2017
確統
II.10.
d dt
„f(t) g(t)
«
=f0(t)g(t)−f(t)g0(t) g(t)2
【答
9.2】(8.7)より
MX(t) = exp (
µ1t+σ21t2 2
)
, MY(t) = exp (
µ2t+σ22t2 2
)
(10.1)
なので,(9.9) より
MZ(t) =MX(t)MY(t) = exp (
(µ1+µ2)t+σ21+σ22 2 t2
)
(10.2)
となる。この式と
(8.7)を比較して,Z
=X+Yは母平均が
µ1+µ2,母分散が
σ21+σ22の正規分布に従うことが わかる。
正規分布に従う独立な確率変数の和
®
© X ∼N(µ1, σ21), Y ∼N(µ2, σ22) =⇒ X+Y ∼N( ª
µ1+µ2, σ21+σ22)
. ¨
§
¥
統計学p.151¦ (10.3)
注意
!正規分布の例のように,同じ種類の確率分布に従う独立な確率変数
Xと
Yの和,
Z=X+Y, もまた 同じ種類の確率分布
(ただしパラメタは別でもよい)に従うとき, この確率分布は 再生的 であるという。
モーメント母関数の対数,log
MX(t), (キュミュラント母関数 と呼ばれる) を考えると,
d
dtlogMX(t) =MX0 (t) MX(t), d2
dt2logMX(t) = MX00(t)MX(t)−(MX0 (t))2
MX(t)2 (10.4)
となるので,以下が成り立つ:
d
dtlogMX(t)¯¯
¯¯t=0
= MX0 (0)
MX(0) =E[X], (10.5)
d2
dt2logMX(t)¯¯
¯¯t=0
=
MX00(0)MX(0)−( MX0 (0)
)2
MX(0)2 =E[X2]−( E[X]
)2
=V[X]. (10.6)
キュミュラント
(cumulant)母関数
¨§
¥
数理統計p.20¦ Â
Á
¿
À logMX(t) = tE[X] +t2
2V[X] +· · ·, (10.7)
MX(t) = exp (
tE[X] +t2
2V[X] +· · ·)
. (10.8)
独立同分布
(i.i.d.) ¤£
¡
確統I L09¢
²
±
¯
°
確率変数
{X1, X2,· · ·, Xn}が, たがいに独立で, すべて同じ確率分布に従うとする。これを
{X1, X2,· · ·, Xn}は独立同分布に従う
(i.i.d.=independent and identically-distributed)という。
【例
10.1】箱の中に入ったカードを無作為にn枚取り出す試行を考えよう。取り出したカードを毎回箱に戻す場合
(
復元抽出
),k枚目のカードの数字
Xkは独立同分布の確率変数となる。取り出したカードを箱に戻さない場 合
(非復元抽出
)も,箱の中のカードの枚数が取り出すカードの枚数に比べて十分大きい場合は,カードの数 字は近似的に独立同分布の確率変数であるとみなせる。
¨§
¥
統計学p.110¦
¨
§
¥
数理統計p.27¦
2017
確統
II.11【問
11.1】確率変数{X1, X2,· · ·, Xn}が, たがいに独立で, すべて同じ確率分布に従うとする。また,そのモーメ ント母関数を
MX(t)とする。このとき,{
X1, X2,· · ·, Xn}を標本と考えた場合の標本平均
X¯(n)=X1+X2+· · ·+Xn
n (11.1)
のモーメント母関数を求めなさい。
【答
11.1】E[ exp(
tX¯(n)
)]=E [
etX1/netX2/n· · ·etXn/n ]
= (
E [
etX1/n ])n
= (
MX
(t n
))n
. (11.2)
次に,標本数
nが大きい極限で,
X¯(n)がどんな確率分布に従うかを考える。X
1の母平均を
µ,母分散をσ2と すると,(10.8) より
MX(t)は
MX(t) = exp (
tµ+t2
2σ2+O(t3) )
(11.3)
となる。ここで,O(t
3)はランダウの記号。
注意
!ランダウ
(Landau)の記号
¤£
¡
桑村 付録E¢
¨
§
¥
川薩四p.114¦
tlim→0
¯¯¯¯g(t) tn
¯¯¯¯≤
有限の値
(11.4)であるとき,g(t) を
tnで抑えられる無限小 といい
g(t) =O(tn) (11.5)
と 書 く。O(t
n)と 表 さ れ る 部 分 が ,t
→ 0の と き
tnと 少 な く と も 同程度に小さい量 であることを示している。(O(t
n) = (何らかの係数)× tnみたいなもの。)
Oは「程度」を意味する
“order”の頭文字を表す。
以上から,
X¯(n)のモーメント母関数の標本数
nが大きい極限は以下となる:
nlim→∞
( MX
(t n
))n
= lim
n→∞
( exp
(t nµ+ t2
2n2σ2+O (t3
n3 )))n
= lim
n→∞exp (
tµ+ t2 2nσ2+O
(t3 n2
))
= exp(tµ). (11.6)
モーメント母関数が
eµtとなるのは,確率変数が確率
1で
µという値を取る場 合なので,この結果は,標本数が大きくなるにつれて,標本平均が母平均に近 い値をとる確率が
1に近づくことを意味する。これを大数の法則と呼ぶ。
(1) 1
X = X X
(4)X
(9)図
11-1大数の法則 大数の弱法則
¤£
¡
確統I L09¢
¨
§
¥
これだけ§5.2¦
¨
§
¥
統計学§8.1¦
¤
£
¡
数理統計 定理6.10¢ º
¹
·
¸
確率変数
X1, X2,· · ·, Xnが,母平均
µ,母分散σ2の独立同分布に従うとする。
∀² >0
に対して,
limn→∞P(¯¯
¯¯X1+X2+· · ·+Xn
n −µ¯¯
¯¯ < ² )
= 1 (11.7)