2019
確統
II.0.1
確率統計及び演習 II
数理情報学科・3年次配当・前期・学科固有科目・選択・2単位
2019
確統
II.0.2講義計画
No. 回数
【入力属性:◎】
【学外公開】
【入力属性:◎】担当者
【学外公開】
【入力属性:◎】学修内容
【学外公開】
キーワード
【入力属性:△】
1 L01
飯田 晋司
多変数の確率分布1:同時確率,周辺確率,条件付き確率(離散型確率変数の 場合)
2 L02
飯田 晋司
多変数の確率分布2:同時確率,周辺確率,条件付き確率(連続型確率変数の 場合),確率変数の独立性
3 L03
飯田 晋司
多変数の確率分布3:独立な確率変数の性質,ベイズの定理,モーメント 母関数1:モーメント母関数の定義
4 L04
飯田 晋司
モーメント母関数2:正規分布のモーメント母関数,キュミュラント母関 数
5 L05
飯田 晋司
モーメント母関数3:2項分布とポアソン分布のモーメント母関数,確率変 数の和の確率分布,大数の弱法則
6 L06
飯田 晋司
モーメント母関数4:中心極限定理,2つの確率変数に対するモーメント 母関数,正規母集団1:2次元正規分布の確率密度関数
7 L07
飯田 晋司
正規母集団2:2次元正規分布の母共分散行列とモーメント母関数
8 L08
飯田 晋司
正規母集団3:標本平均の従う確率分布,標準化された標本の2乗和の従う 確率分布,カイ2乗分布
9 T01
飯田 晋司
小テスト1
10 L09
飯田 晋司
正規母集団4:t分布,F分布,母数の推定1:不偏推定量,母比率の区間 推定
11 L10
飯田 晋司
母数の推定2:正規母集団の母平均,母分散の区間推定
12 L11
飯田 晋司
母数の推定3:2つの正規母集団の母平均の差,母分散の比の区間推定
13 L12
飯田 晋司
母数の推定3:対応のある2標本の母平均の差の区間推定,仮説検定1:手 順と用語の紹介
14 T02
飯田 晋司
小テスト2
15 L13
飯田 晋司
仮説検定2:適合度の検定,独立性の検定
プリント中の
確統I
は『2018 年度確率統計及び演習
I』の講義を示します。
前園
は参考文献,“
概説確率統計
(サイエンス社) ”を示します。
前園演習
は参考文献,
“詳解演習確率統計
(サイエンス社
) ”を示します。
西川
は参考文献,
“確率統計
(サイエンス社
) ”を示します。
統計学
は参考文献,“統計学入門
(東京大学出版会) ”を示します。
数理統計
は参考文献,“数理統計学
(裳華房) ”を示します。また,以下は
1年の科目「微積分及び演習
I,II」や「線形代数及び演習I,II」での参考文献を示します:
桑村
は参考文献,
“桑村『微分積分入門』
(裳華房
) ”を示します。
川薩四
は参考文献,“川野,薩摩,四ツ谷『微分積分+微分方程式』(裳華房) ”を示します。
三宅線形
は参考文献,“三宅『線形代数学』(培風館) ”を示します。
オフィスアワー: 月曜
6講時
(1-513),木曜6講時
(1-513) url: http://www.math.ryukoku.ac.jp/ iida/lecture/lecture.html2019
確統
II.0.3★ 成績評価の方法
・予定されている
2回の小テストの両方に
60点以上をとるか,あるいは定期試験に
60点以上をとることで合格 とします。最終成績は,合格の場合は小テストの平均点
(小数点以下切り上げ
)と定期試験の点数の高い方,
不合格の場合は定期試験の点数,となります。
・小テストと定期試験で参考文献は持込不可です。電子機器
(電卓,携帯電話,
PC等
)の使用はできません。
・公式や数表等をまとめた,まとめのプリントを試験問題とともに配布します。
・解答で分数や
√は少数になおす必要はありません。答に加減乗除が現れていてもかまいません。
【例】次の確率密度関数
f(x),f(x) =
0 x <0 6x(1−x) 0≤x <1
0 1< x
, (0.3.1)
に従う確率変数
Xについて,
0≤X <1/3となる確率
Pを求めなさい。
【答】
P =
∫ 1/3 0
f(x)dx= 6
∫ 1/3 0
( x−x2
) dx= 6
[x2 2 −x3
3 ]x=1/3
x=0
(0.3.2)
= 6 (1
18− 1 81
)
(0.3.3)
= 7
27. (0.3.4)
上の例の場合は,解答は
(0.3.3)まででかまいません。
2019
確統
II.1.
1 多変数の確率分布
確統I L06
前園§2.4
数理統計§4.1
1.1 2 変数の離散型確率分布
同時確率分布
確率変数
Xのとる値が
{x1, x2,· · · },確率変数
Yのとる値が
{y1, y2,· · · },とする。
『X
=xiかつ
Y =yjとなる確率』を 同時確率 あるいは 結合確率 と呼ぶ。この確率分布を記号
fXY(x, y)で表す:
P(X =x, Y =y) =fXY(x, y).
西川 定義2.2
統計学(7.1) (1.1)
【例
1.1】2枚のコイン
A,Bを無作為に投げて表裏を見る。コイン
Aが表
(裏
)の場合
X = 1 (X = 0),コイン
Bが表
(裏)の場合
Y = 1 (Y = 0),とする。同時確率 fXY(x, y)の値は次の表のようになる:
y
\
x 0 1計
0 fXY(0,0) =1
4 fXY(1,0) =1
4 P(Y = 0) =fY(0) =1 2
1 fXY(0,1) =1
4 fXY(1,1) =1
4 P(Y = 1) =fY(1) =1 2
計
P(X= 0) =fX(0) =12 P(X= 1) =fX(1) =1
2 1
表
1-1 2つのコインの同時確率分布
【例
1.2】次の6枚のカードから無作為に
1枚のカードを引く:
♡7 ♡8 ♡9 ⋄8 ♠9 ♣9
X =
数,Y
= 0(赤札),1(黒札)とすると,同時確率
fXY(x, y)の値は次の表のようになる:
y
\
x 7 8 9計
0 fXY(7,0) =1
6 fXY(8,0) =1
3 fXY(9,0) =1
6 P(Y = 0) =fY(0) =2 3
1 fXY(7,1) = 0 fXY(8,1) = 0 fXY(9,1) =1
3 P(Y = 1) =fY(1) =1 3
計
P(X= 7) =fX(7) =16 P(X= 8) =fX(8) =1
3 P(X= 9) =fX(9) =1
2 1
表
1-2 6枚のカードの同時確率分布 周辺確率分布
'
&
$
%
同時確率分布
fXY(x, y)から,X や
Yの単独の確率分布が求められる:
fX(x) =∑
yj
fXY(x, yj), fY(y) =∑
xi
fXY(xi, y).
統計学(7.7) (1.2)
表の周辺にあるので,それぞれ
X,
Yの 周辺確率分布 と呼ばれる。
2019
確統
II.2条件付き確率
西川§1.5.1
前園§1.2’
'
&
$
% Y =yj
が起きているという条件の下での,事象
X=xiが起きる確率
(条件付き確率
)を
P(X =xi|Y =yj)と表す。このとき,以下が成り立つ
P(X =xi, Y =yj) =P(X=xi|Y =yj)P(Y =yj) =P(Y =yj|X =xi)P(X =xi). (2.1)
また,この確率分布を記号
fX|Y(x|y)で表す:
P(X =xi|Y =yj) =fX|Y(xi|yj), P(Y =yj|X=xi) =fY|X(yj|xi). (2.2) 注意!
前園§1.2では条件付き確率P(X=xi|Y =yj)はP{Y=yj}({X=xi})の様に表されている。
条件付き確率の性質
'&
$
%
∑
xi
fX|Y(xi|yj) = 1, ∑
yj
fY|X(yj|xi) = 1.
統計学(7.19) (2.3)
・同時確率との関係
fXY(xi, yj) =fX|Y(xi|yj)fY(yj) =fY|X(yj|xi)fX(xi).
統計学(7.24) (2.4)
fX|Y(xi|yj) = fXY(xi, yj)
fY(yj) , fY|X(yj|xi) =fXY(xi, yj) fX(xi) .
統計学(7.18) (2.5)
・周辺確率との関係
fX(xi) =∑yj
fX|Y(xi|yj)fY(yj), fY(yj) =∑
xi
fY|X(yj|xi)fX(xi).
統計学(7.9) (2.6)
【問
2.1】【例
1.2】の確率分布について以下の問いに答えなさい。
(1) E[(9Y + 1)X]
を求めなさい。
(2) 9
の札が出る
(X = 9)という条件のもとで赤札が出る
(Y = 0)条件付き確率,f
Y|X(0|9),を求めなさい。(3)
赤札が出る
(Y = 0)という条件のもとで
9の札が出る
(X = 9)条件付き確率,f
X|Y(9|0),を求めなさい。【答
2.1】(1)
E[(9Y + 1)X] = 1
6×(0 + 1)×7 + 1
3×(0 + 1)×8 + 1
6×(0 + 1)×9 +1
3 ×(9 + 1)×9 = 106
3 . (2.7) (2) (2.5)
より
fY|X(0|9) = fXY(9,0) fX(9) = 1/6
1/2 = 1
3. (2.8)
(3) (2.5)
より
fX|Y(9|0) = fXY(9,0) fY(0) = 1/6
2/3 = 1
4. (2.9)
2019
確統
II.3.
σ[sigma]シグマ,θ [theta]シータ
1.2 2 変数の連続型確率分布
X,Y
が連続型確率変数の場合は,f
XY(x, y)は 同時確率密度関数 を意味する。 『(X, Y
)が領域
Aに属する
確率』が
(和の代わりに)以下のような積分で表される:
P((X, Y)∈A) =
∫ ∫
A
fXY(x, y)dxdy .
統計学(7.5)
前園p.31’
西川 定義3.2’ (3.1)
【例
3.1】ダーツを的に向かって投げる場合を考える。(X, Y)をダーツが的に当たった場所の座標,同時確率密度
関数を
fXY(x, y) = 1
2πσ2 e−x2 +y
2
2σ2 (3.2)
とする。このとき,ダーツが的の中心,(X
= 0, Y = 0),から半径Rの円内に当たる確率
Pは次となる:
P =
∫ ∫
x2+y2≤R2
fXY(x, y)dxdy= 1 2πσ2
∫ ∫
x2+y2≤R2
e−x2 +y
2
2σ2 = 1
2πσ2
∫ 2π 0
dθ
∫ R 0
dr r e−r
2 2σ2
= 2π
2πσ2
[−σ2e−r
2 2σ2
]r=R
r=0
= 1−e−R
2
2σ2. (3.3)
上の
3つ目の等式では,積分変数を
(x, y)から
(r, θ)に変換した
桑村p.223
川薩四§8.3
:
x=rcos(θ), y=rsin(θ), dxdy⇒rdrdθ . (3.4)
離散型確率変数の場合の式で,和を積分に置き換えた式が成り立つ:
'
&
$
%
・X ,Y の 周辺確率密度関数
fX(x) =∫ ∞
−∞
fXY(x, y)dy , fY(y) =
∫ ∞
−∞
fXY(x, y)dx .
統計学(7.8) (3.5)
・Y
=yを与えたときの
Xの 条件付き確率密度関数
fX|Y(x|y) =fXY(x, y)fY(y) = fXY(x, y)
∫∞
−∞fXY(x, y)dx.
統計学(7.18) (3.6)
・条件付き確率密度関数と周辺確率密度関数の関係
fX(x) =∫ ∞
−∞
fX|Y(x|y)fY(y)dy , fY(y) =
∫ ∞
−∞
fY|X(y|x)fX(x)dx . (3.7)
【問
3.1】次の同時確率密度関数fXY(x, y) =
√3
π e−x2+4xy−7y2 (3.8)
について,周辺確率密度関数
fX(x),fY(y)を求めなさい。
2019
確統
II.4.
【答
3.1】(3.5)より次が得られる:
fY(y) =
∫ ∞
−∞
fXY(x, y)dx=
√3 π e−7y2
∫ ∞
−∞
e−x2+4xydx=
√3 π e−7y2
∫ ∞
−∞
e−(x−2y)2+4y2dx
=
√3 π e−3y2
∫ ∞
−∞
e−z2dz=
√3
π e−3y2. (4.1)
上式の
4つ目の等式では,積分変数を
xから
z=x−2yに変換し,5 つ目の等式では以下の公式を用いた:
∫ ∞
−∞
e−z2dz=√
π .
桑村p.225
川薩四(8.7) (4.2)
同様に
fX(x) =
∫ ∞
−∞
fXY(x, y)dy=
√3 π e−x2
∫ ∞
−∞
e−7y2+4xydy=
√3 π e−x2
∫ ∞
−∞
e−7(y−27x)2+47x2dy
=
√3 π√
7e−37x2
∫ ∞
−∞
e−z2dz=
√ 3
7π e−37x2. (4.3)
となる。上の式の
4つ目の等式では,積分変数を
yから
z=√ 7( y−2
7x )
に変換した。
確率変数の独立性
前園p.9’
『確率変数
Xと
Yが独立』
⇔『同時確率
(密度
)関数が周辺確率
(密度
)関数の積になる』,つまり次が成り 立つ:
fXY(x, y) =fX(x)fY(y)
統計学(7.22)
前園(1.4)’ (4.4)
【例
4.1】・
Xと
Yが独立な場合: 【例
1.1】【例
3.1】, ・
Xと
Yが独立でない場合: 【例
1.2】【問
3.1】
X
と
Yが独立な確率変数の場合に成り立つ性質
前園p.55 '
&
$
%
E[ϕ1(X)ϕ2(Y)] = E[ϕ1(X)]E[ϕ2(Y)], (4.5)
E[X Y] = E[X]E[Y],
統計学(7.26)(7.35) (4.6)
V[aX+bY] = a2V[X] +b2V[Y],
統計学(7.36)’ (4.7)
Cov[X, Y] = 0,
統計学(7.27) (4.8)
fX|Y(x|y) = fX(x), fY|X(y|x) =fY(y).
統計学(7.23) (4.9)
(4.9)
は
X(Y)が起きる確率に
Y(X)の影響がないことを示す。
注意 ! X
と
Yが独立でない場合にも成り立つ性質:
E[aϕ1(X, Y) +bϕ2(X, Y)] = a E[ϕ1(X, Y)] +b E[ϕ2(X, Y)], (4.10) V[aX+bY] = a2 V[X] +b2V[Y] + 2ab Cov[X, Y],
統計学(7.37a)’ (4.11)
Cov[X, Y] = E[(X−µX)(Y −µY)] =E[XY]−E[X]E[Y].
統計学(7.14)(4.12)
ここで,
µX=E[X],
µY =E[Y]。
Cov[X, Y]は
Xと
Yの
(母
)共分散
(covariance)と呼ばれる。
前園p.55
西川 定義2.9
統計学(7.11)
数理統計§4.2
2019
確統
II.51.3 ベイズの定理
前園§1.4
西川§1.5.2
統計学§4.5.3
数理統計p.6
(2.4),(2.5),(2.6)
を組み合わせると
Yについての条件付き確率
fX|Y(x|y)と
Xについての条件付き確率
fY|X(y|x)の間の関係が得られる。この関係式をベイズの定理
(公式)と呼ぶ。
ベイズ
(Bayes)の定理
'&
$
%
・X と
Yが離散型確率変数の場合
fX|Y(x|y) = fY|X(y|x)fX(x)
∑
xifY|X(y|xi)fX(xi).
統計学(4.17)
前園 定理1.7’ (5.1)
・X と
Yが連続型確率変数の場合
fX|Y(x|y) = fY|X(y|x)fX(x)
∫∞
−∞fY|X(y|x′)fX(x′)dx′ . (5.2)
【問
5.1】(2013年度統計検定
2級 問
9を一部変更)
ある病気の発生率が7パーセントであることが知られている。この病気のある診断法の性能が次の表のように なっている。ある人がこの検査を受けたところ陽性であった。この人が実際に病気にかかっている確率を求めな さい。
病気の有無\診断結果 陽性 陰性 計 罹病している
0.82 0.18 1.00罹病していない
0.13 0.87 1.00表
5-1【答
5.1】確率変数Xと
Yを考え,診断結果が陽性
(陰性)の場合は
X = 0 (X = 1)とし,病気に罹患している
(していない)
場合を
Y = 0 (Y = 1)とすると,表の内容は以下のようになる;
fX|Y(0|0) = 0.82, fX|Y(1|0) = 0.18, fX|Y(0|1) = 0.13, fX|Y(1|1) = 0.87. (5.3)
また,f
Y(0) = 0.07である。これらのデータから確率
fY|X(0|0)を求める問題である。
fY|X(0|0) = fXY(0,0)
fX(0) = fX|Y(0|0)fY(0)
fXY(0,0) +fXY(0,1) = fX|Y(0|0)fY(0)
fX|Y(0|0)fY(0) +fX|Y(0|1)fY(1)
= 0.82×0.07
0.82×0.07 + 0.13×(1−0.07) ≈0.32 (5.4)
となる。
2019
確統
II.6 (参考)ベイズの定理を用いた母数の推定
統計学p.79
例として,コインを
n回投げて
k回表が出たというデータがある場合を考えよう。このコインの表が出る確率
θを推定する。標本数
nが十分大きく,二項分布が正規分布で近似できる場合に確率
0.95で成り立つ次の不等式
θˆ−1.96
√
θ(1ˆ −θ)ˆ
n < θ < θˆ+ 1.96
√
θ(1ˆ −θ)ˆ
n , θˆ= k n
統計学(11.59) (6.1)
から,母比率
θの
(信頼係数0.95の) 信頼区間を得た。
確統I L12
前園§5.4
西川§8.4
数理統計§9.3
この場合,θ の値は定まっていて,
θˆが確率変数と考えた。
一方,
θが確率変数で,確率密度
fΘ(θ)に従い,いろいろな値をとるとする考え方があり, ベイズ統計学 と 呼ばれている。
このとき,ベイズの定理,
fΘ|D(θ|D) = fD|Θ(D|θ)fΘ(θ)
∫fD|Θ(D|θ′)fΘ(θ′)dθ′ , (6.2)
は,観測データがないときに予想した
θの確率密度,
fΘ(θ),に
(n回のうち
k回表が出たという
)データ
Dを付け 加えて,“より良い” 確率密度,f
Θ|D(θ|D),を得るための道具として使われる。ここで,fΘ(θ)を
(データを得る前の確率分布という意味で) 事前分布 ,f
Θ|D(θ|D)を
(データを得た後の確率分布という意味で)事後分布 と呼ぶ。また,
fD|Θ(D|θ) = nCk θk (1−θ)n−k (6.3)
は,仮定された確率モデルに含まれるパラメータ
(母数
),
θ,が特定の値をとる場合に,観測データ
Dが生じる 確率で, 尤度関数 と呼ばれる。例えば
fΘ(θ)が区間
(0,1)の一様分布で,n
= 20,k= 5の場合の事後分布は
fΘ|D(θ|D) = 325584θ5(1−θ)15 (6.4)となる
(図6-1)。0.2 0.4 0.6 0.8 1
1 2 3 4 5
95%
|D( | )D
fΘ θ
θ2
θ1
θ
0.2 0.4 0.6 0.8 1
1 2 3 4 5
θ fΘ( )θ
࠺࠲
図
6-1事前分布
fΘ(θ)と事後分布
fΘ|D(θ|D)この場合について,
fΘ|D(θ|D)から確率
0.95となる区間を求めると
0.101 < θ < 0.456 (6.5)
となる。このような区間は
(信頼区間と区別して)信用区間 と呼ばれる。( なお,n
= 20は十分大きな標本数 ではないが,この場合の
(24.6)による信頼区間は
(0.060,0.440)である。
)ここでは説明を簡単にするためパラメータが
1個の場合を考えたが,上の手順が実際に用いられるのは,複雑
な現象を説明するための多数のパラメータを含む確率モデルを作る場合である。
2019
確統
II.7.
階乗(factorial) n! =n·(n−1)· · · ·2·1,0! = 1
nCk= n!
k!(n−k)!= n(n−1)· · ·(n−k+ 1)
k! n個のものからk個を取り出す組み合わせの数
2 モーメント母関数
期待値
E[etX]を モーメント母関数 あるいは 積率母関数 と呼ぶ。母平均
E[X]や母分散
V[X] =E[X2]− E[X]2,を求めるのには
E[Xk]の計算が必要だが,指数関数のテイラー展開
etX =
∑∞ k=0
tk
k!Xk = 1 +tX+t2
2X2+· · · (7.1)
より,モーメント母関数は全ての
E[Xk]の情報を持つ。
モーメント母関数
統計学§5.3
数理統計p.20 '
&
$
% MX(t) =E[etX] =
∑∞ k=0
tk
k!E[Xk].
統計学(5.40) (7.2)
MX(t) = { ∑
xifX(xi)etxi X
が離散型確率変数の場合
∫∞
−∞fX(x)etxdx X
が連続型確率変数の場合
.
統計学(5.41) (7.3)
MX(0) =E[1] = 1, dkMX(t) dtk
t=0
=E[Xk].
統計学(5.42) (7.4)
『
Xと
Yが同じモーメント母関数を持つ』
⇐⇒『
Xと
Yが同じ確率分布に従う』,つまり,次が成り立つ:
MX(t) =MY(t) ⇐⇒ fX(z) =fY(z). (7.5)
(参考) E[etX]ではなくE[eitX]を考える場合がある。E[eitX]を確率変数Xの 特性関数 と呼ぶ。
前園p.61 E[eitX]は存在するが,E[etX]は存在しない(期待値の級数や積分が発散する)場合がある。
【問
7.1】離散型確率変数Xが二項分布
B(n, p)確統I L09
前園p.18
統計学§6.2
数理統計p.29
に従う
(確率pで 表の出るコインを
n回投げた時,表の出る回数が
X)。モーメント母関数
MX(t)を求めなさい。また,(7.4) よ り,母平均と母分散を求めなさい。
【答
7.1】fX(x) =nCxpx(1−p)n−x x= 0,1,· · ·, n
西川(2.1)
統計学(6.6) (7.6)
より,
MX(t) =
∑n x=0
nCxpx(1−p)n−x etx=
∑n x=0
nCx
(pet)x
(1−p)n−x= (
pet+ 1−p )n
.
統計学p.130 (7.7)
上の最後の等式で二項定理
(a+b)n=
∑n x=0
nCx axbn−x
前園 定理1.5
西川p.37 (7.8)
を用いた。次に,
dMX(t)
dt =
d (
pet+ 1−p )n
dt =n
(
pet+ 1−p )n−1 d
(
pet+ 1−p ) dt =npet
(
pet+ 1−p )n−1
, (7.9) d2MX(t)
dt2 = npdet dt
(
pet+ 1−p )n−1
+npet d
(
pet+ 1−p )n−1
dt
= npet (
pet+ 1−p )n−1
+npet (n−1) (
pet+ 1−p )n−2
pet (7.10)
2019
確統
II.8.
∫ ∞
−∞e−z2dz=√ π (4.2)
より,
E[X] = dMX(t) dx
t=0
=np , E[X2] = d2MX(t) dx2
t=0
=np+n(n−1)p2 (8.1)
なので,母平均
E[X]と母分散
V[X]は以下となる:
E[X] =np , V[X] =E[X2]−E[X]2=np(1−p).
前園p.50,53
西川p.55例2.4
統計学(6.8) (8.2)
【問
8.1】連続型確率変数
Xが正規分布
N(µ, σ2)確統I L09
前園p.24
統計学§6.6
数理統計p.36
に従う。モーメ ント母関数
MX(t)を求めなさい。また,(7.4) より,母平均と母分散を求めなさい。
【答
8.1】fX(x) = 1
√2πσ2exp (
−(x−µ)2 2σ2
)
西川(3.6)
統計学(6.19a) (8.3)
より,
MX(t) = 1
√2πσ2
∫ ∞
−∞
exp (
−(x−µ)2 2σ2 +tx
)
dx= 1
√2πσ2
∫ ∞
−∞
exp (
−x2−2(µ+σ2t)x+µ2 2σ2
) dx
= 1
√2πσ2
∫ ∞
−∞
exp
−
(
x−(µ+σ2t) )2
−2µσ2t−σ4t2 2σ2
dx
= exp (
µt+σ2t2 2
) 1
√π
∫ ∞
−∞
e−z2dz= exp (
µt+σ2t2 2
)
. (8.4)
上の
4つ目の等式では積分変数を
xから
z= x−(µ+σ2t)√2σ
に変換し,(4.2 ) を用いた。次に,
dMX(t)
dt =
dexp (
µt+σ22t2 )
dt = exp
(
µt+σ2t2 2
) d (
µt+σ22t2 )
dt = exp
(
µt+σ2t2 2
) (µ+tσ2) ,(8.5)
d2MX(t) dt2 =
dexp (
µt+σ22t2 ) dt
(µ+tσ2) + exp
(
µt+σ2t2 2
)d(
µ+tσ2) dt
= ((
µ+tσ2)2
+σ2 )
exp (
µt+σ2t2 2
)
(8.6)
より,
E[X] = dMX(t) dx
t=0
=µ , E[X2] = d2MX(t) dx2
t=0
=µ2+σ2 (8.7)
なので,母平均
E[X]と母分散
V[X]は以下となる:
E[X] =µ , V[X] =E[X2]−E[X]2=σ2.
前園p.51,55
統計学(6.20),(6.21) (8.8)
正規分布のモーメント母関数
正規分布
N(µ, σ2)に従う連続型確率変数
Xのモーメント母関数:
MX(t) = exp (
µt+σ2t2 2
)
.
統計学p.131 (8.9)
【問
8.2】確率変数Xのモーメント母関数を
MX(t)とするとき,確率変数
Y =aX+b (a,bは定数) のモーメン ト母関数
MY(t)を求めなさい。また,
(7.4)より,
Xと
Y母平均と母分散の関係を導きなさい。
【答
8.2】
MY(t) =E[etY] =E[et(aX+b)] =E[etb eatX] =etb E[eatX] =etb MX(at). (8.10)
2019
確統
II.9次に
dMY(t)
dt =
d (
etbMX(at) ) dt =detb
dt MX(at) +etb dMX(at) dt
= betb MX(at) +etb dMX(s) ds
s=at
d(at) dt =etb
(
bMX(at) +aMX′ (at) )
. (9.1)
ここで,M
X′ (t)は
MX(t)の
1階導関数を表す。また,
d2MY(t)
dt2 = d dt
( etb
(
bMX(at) +aMX′ (at) ))
=detb dt
(
bMX(at) +aMX′ (at) )
+etbd dt
(
bMX(at) +aMX′ (at) )
= betb (
bMX(at) +aMX′ (at) )
+etb (
baMX′ (at) +a2MX′′(at) )
= etb (
b2MX(at) + 2abMX′ (at) +a2MX′′(at) )
. (9.2)
ここで,
MX′′(t)は
MX(t)の
2階導関数を表す。
従って,
E[Y] = dMY(t) dx
t=0
=e0 (
bMX(0) +aMX′ (0) )
=bE[1] +aE[X] =b+aE[X], (9.3) E[Y2] = d2MY(t)
dx2
t=0
=e0 (
b2MX(0) + 2abMX′ (0) +a2MX′′(0) )
=b2E[1] + 2abE[X] +a2E[X2]
= b2+ 2abE[X] +a2E[X2], (9.4)
なので,母平均
E[Y] =E[aX+b]と母分散
V[Y] =V[aX+b]は以下となる:
E[aX+b] = aE[X] +b ,
前園(3.2)
統計学(5.25b,c)
確統I L05 (9.5)
V[aX+b] = E[Y2]−E[Y]2=a2E[X2] + 2abE[X] +b2−(
aE[X] +b )2
=a2 (
E[X2]−E[X]2 )
= a2V[X].
前園 定理3.2
統計学(5.29b,c)
確統I L05 (9.6)
【問
9.1】確率変数
Xと
Yが独立な場合,
Z =X+Yのモーメント母関数を求めなさい。
【答
9.1】MZ(t) =E[etZ] =E[et(X+Y)] =E[etX etY](4.5=)E[etX]EetY] =MX(t)MY(t). (9.7)
モーメント母関数の性質
'&
$
%
・aX
+bのモーメント母関数
MaX+b(t) =etbMX(at). (9.8)
・
Xと
Yが独立なときの,
X+Yのモーメント母関数
MX+Y(t) =MX(t)MY(t).
統計学(7.28)
数理統計p.61 (9.9)
【問
9.2】独立な確率変数Xと
Yがそれぞれ次の正規分布に従うとする:
X ∼N(µ1, σ12), Y ∼N(µ2, σ22). (9.10)
このとき,Z
=aX+bYが従う確率分布を
(9.8),(9.9)を用いて求めなさい。
2019
確統
II.10.
d dt
(f(t) g(t) )
=f′(t)g(t)−f(t)g′(t) g(t)2
【答
9.2】(8.9)より
MX(t) = exp (
µ1t+σ21t2 2
)
, MY(t) = exp (
µ2t+σ22t2 2
)
(10.1)
なので,
MZ(t)(9.9=)MaX(t)MbY(t)(9.8=)MX(at)MY(bt) = exp (
(aµ1+bµ2)t+a2σ12+b2σ22
2 t2
)
(10.2)
となる。この式と
(8.9)を比較して,Z
=aX+bYは母平均が
aµ1+bµ2,母分散が
a2σ21+b2σ22の正規分布に従 うことがわかる。
正規分布に従う独立な確率変数の和
前園p35 (2.3)’
西川p.80定理3.8
統計学p.151
X ∼N(µ1, σ12), Y ∼N(µ2, σ22) =⇒ aX+bY ∼N(
aµ1+bµ2, a2σ21+b2σ22 )
. (10.3) 注意 !
正規分布の例のように,同じ種類の確率分布に従う独立な確率変数
Xと
Yの和,
Z=X+Y, もまた 同じ種類の確率分布
(ただしパラメタは別でもよい)に従うとき, この確率分布は 再生的 であるという。
モーメント母関数の対数,
logMX(t), (キュミュラント母関数 と呼ばれる
)を考えると,
d
dtlogMX(t) =MX′ (t) MX(t), d2
dt2logMX(t) = MX′′(t)MX(t)−(MX′ (t))2
MX(t)2 (10.4)
となるので,以下が成り立つ:
d
dtlogMX(t) t=0
= MX′ (0)
MX(0) =E[X], (10.5)
d2
dt2logMX(t) t=0
=
MX′′(0)MX(0)−( MX′ (0)
)2
MX(0)2 =E[X2]−( E[X]
)2
=V[X]. (10.6)
キュミュラント
(cumulant)母関数
数理統計p.20
logMX(t) = tE[X] + t2
2V[X] +· · ·, (10.7)
MX(t) = exp (
tE[X] +t2
2V[X] +· · ·)
. (10.8)
独立同分布
(i.i.d.)確統I L09
確率変数
{X1, X2,· · ·, Xn}が, たがいに独立で, すべて同じ確率分布に従うとする。これを
{X1, X2,· · ·, Xn}は独立同分布に従う
(i.i.d.=independent and identically-distributed)という。
【例
10.1】箱の中に入ったカードを無作為に
n枚取り出す試行を考えよう。取り出したカードを毎回箱に戻す場合
(復元抽出
),k枚目のカードの数字
Xkは独立同分布の確率変数となる。取り出したカードを箱に戻さない場 合
(非復元抽出
)も,箱の中のカードの枚数が取り出すカードの枚数に比べて十分大きい場合は,カードの数 字は近似的に独立同分布の確率変数であるとみなせる。
西川p.130注意6.1
統計学p.110
数理統計p.27