樋口さぶろお
龍谷大学理工学部数理情報学科
計算科学☆実習
B L03(2017-04-24 Mon)最終更新: Time-stamp: ”2017-04-24 Mon 18:24 JST hig”
今日の目標
標本から
,ランダムウォークの座標の母平均値
,母分散
,母期待値
,母比率が点
/区間推定できる
.ランダムウォークの座標の標本抽出するプログ
ラムが書ける
. http://hig3.netL02-Q1
Quiz
解答
:ランダムウォークの確率と座標の期待値
1
P(X(3) =x) =
(30)p0(1−p)3 (x= 0) (31)p1(1−p)2 (x= 1) (32)p2(1−p)1 (x= 2) (33)p3(1−p)0 (x= 3)
2 E[X(3)] = (1−p)30 + 3p(1−p)21 + 3p2(1−p)12 +p33 = 3p.
3 E[X(3)2] = (1−p)302+3p(1−p)212+3p2(1−p)122+p332= 6p2+3p.
V[X(3)] = E[X(3)2]−E[X(3)]2 = 3p(1−p).
4 E[1[X>1](X(3))] = (1−p)30 + 3p(1−p)20 + 3p2(1−p)11 +p31.
L02-Q2
Quiz
解答
:ランダムウォーカーの到達点の座標の母平均・母分散
1 µ= E[R(t)] = (−1)·59 + 0·19 + (+1)·39 =−29.
2 E[(R(t))2] = (−1)2·59 + 02·19+ (+1)2·39 = 89.E[R(t))2] = (−29)2. σ2 = V[R(t)] = E[(R(t))2]−E[R(t)]2 = 6881.
次のように直接に計算しても同じ結果になる
. V[R(t)] = E[(R(t)−µ)2] =((−1)−(−29))2·59+ (0−(−29))2·19+ ((+1)−(−29))2·39.
3 σR(t)=
√68 81 = 2
√17 9 .
4
一般に
E[X(T)] =T ·E[R(t)). T = 20とすると
, E[X(20)] = 20E[R(t)] =−409 .5
一般に
V[X(T)] =T ·V[R(t)). T = 20とすると
, V[X(20)] = 20V[R(t)] = 136081 .6 σX(20)= (V[X(20)])1/2= (136081 )1/2 = 49√ 85
L02-Q3
Quiz
解答
:ランダムウォーカーの到達点の座標の母平均・母分散
1 R(−4) +·+R(3)∼B(8,23)
が
,値
5−2 = 3をとる確率を求める
. (83) (23)3(13)5.2 E[X(3)] = E[X(−5) +R(−4) +· · ·+R(3)] = 2 + 823.
3 V[X(3)] = V[X(−5) +R(−4) +· · ·+R(3)] = 82313.
4
√ 82313.
L02-Q4
Quiz
解答
:ランダムウォーカーの到達点の座標の母平均・母分散
E[R(t)] =−29,V[R(t)] = 6881に注意する
.1 E[X(7)] = E[5 +R(4) +R(5) +R(6) +R(7)] = 5 + 4×(−29) = 379 .
2 V[X(7)] = V[5 +R(4) +R(5) +R(6) +R(7)] = 4×6881 = 27281.
3 (
4× 6881)1/2
= 49√ 17.
V[X(7)] = E[X(7)2]−E[X(7)]2
に行った人は
,そこまでは正しいけど
, E[X(7)2]を計算しようとしたら容易なことじゃないよ
. X(7)って
9通り の値をとるんだからそれ全部加えないと…
それなのに
,E[X(7)2]̸= E[R(t)2]や
,E[X(7)2] = E[(5 +R(4) +R(5) +R(6)2+R(7)2]̸=
E[R(4)2] + E[R(5)2] + E[R(6)2] + E[R(7))2]
の
̸=を
=であることにし
て計算しちゃった人が一定数いました
.そんなの成立する理由ないで
しょ
. NGワードで減点したいくらい
.確率論としても
,ウォーカーの意
味をつけて物理的に考えてもへんです
.ここまで来たよ
2
離散座標ランダムウォークの座標の確率・母平均値・母分散 ランダムウォークの座標分布の正規近似
3
ランダムウォークの座標の標本抽出と推定 標本からの推定
標本抽出するプログラム 母比率の推定の例
擬似乱数生成の仕組みとシード
独立同分布を利用して中心極限定理で近似
(Tが大きいとき
)ここでは
,X(0) = 0に限って考える
. 塚田確率統計§5.3 塚田確率統計§5.3.1 確率統計☆演習I(2016)L9中心極限定理
(いいかげんバージョン)R(1), . . . , R(T)
が母平均値
µR,母分散
σR2の独立 同分布に従うとき
,X(T) =R(1) +· · ·+R(T),
の確率分布は
, T →+∞で
,正規分布
N(T·µR, T ·σ2R)に 似る
確率統計☆演習I(2015)L09
⇝
ランダムウォークの座標
X(T)の確率分布は
,Tが大きいとき
,母平均値
T ·µR,母分散
T·σ2Rの正規分布にほぼ従う
.ここまで来たよ
2
離散座標ランダムウォークの座標の確率・母平均値・母分散 ランダムウォークの座標分布の正規近似
3
ランダムウォークの座標の標本抽出と推定 標本からの推定
標本抽出するプログラム 母比率の推定の例
擬似乱数生成の仕組みとシード
こんなこと考えたいんだった ランダムウォークの座標
X(t)について
,(
前回
)手計算で以下の母ナントカを厳密に求めよう
.(
今回
)標本から以下の母ナントカを点推定
/区間推定しよう
. E[X(2)],E[eX(2)],X(2)>1となる確率
(比率
)E[X(1002)],E[eX(1002)],X(1002)>51
となる確率
(比率
) X(50) = 12かつ
X(100) = 25となる確率
(比率
)確率シミュレーションによる母ナントカの推定
X:一般の確率変数
.母ナントカの公式は忘れたけどコンピュータはあるとする
.擬似乱数を使ってサイズ
Nの標本
X(1), X(2), . . . , X(N)を作って
,母平 均値
E[X]を標本平均値
X = 1 N
∑N n=1
X(n)
で推定すれば
?点推定
母平均値の推定
標本平均値
X = 1N(X(1)+· · ·+X(N)) = 1 N
∑N n=1
X(n)
が
,母平均値
E[X]の
‘よい
’推定値になっている
.塚田確率統計p.110母分散の推定
不偏標本分散
S2= 1N−1[(X(1)−X)2+· · ·+ (X(N)−X)2]
= N
N−1 [
1 N
∑
n
(X(n))2−( X)2
]
が
,母分散
V[X]の
‘よい
’推定値になっている
.塚田確率統計p.120母期待値の推定 標本期待値
ϕ(X) = 1 N
∑N n=1
ϕ(X(n))
が 母期待値
E[ϕ(X)]の
‘よい
’推定値になっている
.理由
:確率変数
Y =ϕ(X)の母平均値の推定と同じこと
.標比率の推定
ベルヌーイ分布
B(1, p)に従う
Yについて
,サンプルのデータ
N個中
k個が
1であるとき
,標本比率
pˆ= k Nが
Yの母比率
pのよい推定値になっている
.塚田確率統計p.130母比率の推定
サンプルのデータ
N個中
k個が「条件…を満たす」とき
,標本比率
pˆ= kN
が「…」の母比率
E[1[…](X)]のよい推定値になっている
.塚田確率統計p.130理由
ϕ(X) =1[…](X)と思えば
,Y =ϕ(X)はベルヌーイ分布にしたがう
.L03-Q1
Quiz(ランダムウォーカーの到達点の座標の母平均・母分散)
仕組みのよくわからないランダムウォークで標本抽出したところ
, X(3)(n)が
3,3,3,1,1,1,1,1,−1,−3
だった
(N = 10).1 E[X(3)]
を推定しよう
.2 V[X(3)]
を推定しよう
.3 E[X(3)3]
を推定しよう
.4 X(3)>1
となる確率
(母比率
)を推定しよう
.区間推定
ランダムウォークで
X(T)は近似的に正規分布に従う
.そこで
,正規分布を仮定した区間推定
塚田確率統計§7.3も使える
. L03-Q2Quiz(母平均値の区間推定(母分散未知)
母分散の区間推定)
あるエスプレッソメーカーの作る
1杯分のエスプレッソの体積
Xは
,未 知の母平均値
µcm3と母分散
σ2(cm3)2の正規分布にしたがう確率変数 である
. n= 3杯いれてみたところ
,体積は
,28cm3, 30cm3, 32cm3
だった
.1
母平均値
µを
, t分布を用いて
,信頼係数
1−α= 0.99で区間推定し よう
.2
母分散
σ2を
,カイ二乗分布を用いて
,信頼係数
1−α= 0.95で区間 推定しよう
.加減乗除平方根の残った未整理な形で答えてよい
.樋口さぶろお (数理情報学科) L03ランダムウォークの座標の標本抽出と推定 計算科学☆実習B(2017) 15 / 32
ランダムウォークの座標の標本抽出と推定 標本からの推定
確率シミュレーション
確率シミュレーション
確率的現象を
,擬似乱数を使ってそのままコンピュータ上で再現し
(simulate),
くり返し実行して標本抽出し
,母ナントカを推定すること
.とりあえずなんでも計算
(ていうか
推定
)
できちゃう 要
コンピュータ or 奴隷
最終的な誤差
=統計誤差
+数値計算誤差
対比される計算方法
ここまで来たよ
2
離散座標ランダムウォークの座標の確率・母平均値・母分散 ランダムウォークの座標分布の正規近似
3
ランダムウォークの座標の標本抽出と推定 標本からの推定
標本抽出するプログラム 母比率の推定の例
擬似乱数生成の仕組みとシード
ランダムウォークの座標の標本抽出と推定 標本抽出するプログラム
欲しい出力
X(t)(n) t:
時刻 , 数列の第 t 項
(n):
サンプル内通し番号
t= 0 t= 1 · · · t=T n= 1 X(0)(1), X(1)(1), · · · X(T)(1),
改行
n= 2 X(0)(2), X(1)(2), · · · X(T)(2),改行
... ... ... ... ...
n=N X(0)(N), X(1)(N), · · · X(T)(N),
改行
X(0), X(1), X(2), . . . , X(T)
の標本を抽出するプログラム
1 /∗1∗/
2 f o r( n =0; n<N ; n++){
3 /∗2∗/
4
5 f o r( t =0; t<T ; t ++){
6 /∗3∗/
7 x=x+g e t r a n d o m ( g e t u n i f o r m ( ) ) ;
8 /∗4∗/
9 }
10 /∗5∗/
11 }
12 /∗6∗/
問
: srand(seed),x=0,printf("%d,",x)はどこ
?問
:他に何がいる
?標本から推定
t= 0 t= 1 · · · t=T n= 1 X(0)(1), X(1)(1), · · · X(T)(1),改行
n= 2 X(0)(2), X(1)(2), · · · X(T)(2),改行
... ... ... ... ...
n=N X(0)(N), X(1)(N), · · · X(T)(N),
改行
Excel
の関数
: average, var, if(条件
,真のときの式
,偽の時の式
), sumExcel
を使わないで標本期待値の計算
ϕ(X(T)) = 1 N
∑N n=1
ϕ(X(T)(n))
1 /∗1∗/
2 f o r( n ){
3 /∗2∗/
4 f o r( t ){
5 /∗3∗/
6 x=x+g e t r a n d o m ( g e t u n i f o r m ( ) ) ;
7 /∗4∗/
8 }
9 /∗5∗/
10 }
11 /∗6∗/
sum1=0, sum1+=x*x*x (ϕ(x) =x3
のとき
), printf(”%f”,(double)sum1/N)?ここまで来たよ
2
離散座標ランダムウォークの座標の確率・母平均値・母分散 ランダムウォークの座標分布の正規近似
3
ランダムウォークの座標の標本抽出と推定 標本からの推定
標本抽出するプログラム 母比率の推定の例
擬似乱数生成の仕組みとシード
ランダムウォークの座標の標本抽出と推定 母比率の推定の例
1[条件](X(T))
のこと考えると…
sum1
は
count1
と名付けたほうがいいかも
.ランダムウォークの座標の標本抽出と推定 母比率の推定の例
母比率の推定の例
L03-Q3
例題
t= 2
に
x= 10から出発したランダムウォーカーが
,t= 20で
,領域
x <0にいる確率を推定しよう
.double getuniform()
と
(未知の
)int getrandom(double y)は与えら れているとして
,main()だけをかけばよい
.ランダムウォークの言葉づかいの習慣
X(2) :
初期条件
,ランダムウォーカーの出発点
(を確率変数とみたもの
)「ランダムウォーカーが時刻
t= 2に
x= 3から出発した」
⇔X (2) = 3
X (20) < 0
L03-Q4
Example
t= 0
に
x= 3から出発したランダムウォークが
,T = 10で
|X(T)|<3である確率を推定して出力するプログラムを書こう
.ここまで来たよ
2
離散座標ランダムウォークの座標の確率・母平均値・母分散 ランダムウォークの座標分布の正規近似
3
ランダムウォークの座標の標本抽出と推定 標本からの推定
標本抽出するプログラム 母比率の推定の例
擬似乱数生成の仕組みとシード
離散型擬似乱数列の生成
1 #i n c l u d e <s t d l i b . h>
2
3 /∗ 0以 上 RAND MAX 以 下 の 正 の 整 数 を ラ ン ダ ム に 選 ん で 返 す 関 数 ∗/
4 i n t r a n d ( ) ;
5 /∗ そ の 初 期 化 ∗/
6 v o i d s r a n d (u n s i g n e d s e e d ) ;
1 /∗ [ 0 , 1 ) 一 様 乱 数 ∗/
2 d o u b l e g e t u n i f o r m ( ){
3 r e t u r n r a n d ( ) / ( 1 . 0 +RAND MAX ) ;
4 }
getuniform()
の性質
‘
値域
’は
[0,1). 0≤getuniform()<1.(getuniform()< r
となる確率
)=r. (0≤r ≤1)計算機の頭の中どうなってんの
?擬似乱数列
=‘ほぼ
’ランダムな数列
(
毎回別々の
)seedを指定することは必要
seed
に応じて
,毎回異なる乱数列を得られる
.特定の乱数列に対する動作を再現できる
.デバッグでは必須
.seed
を適切に設定すると
,複数回の実行で
,別々の
(独立な
)標本抽出
が行える
.L03-Q5
Quiz(rand()の振る舞い)
次のプログラムで, seedを無作為に入力するとき, Aが出力される確率は?
1 i n t g e t r a n d o m (d o u b l e y ){
2 i f( y<1/3.0 ){
3 r e t u r n 0 ;
4 }e l s e{
5 r e t u r n 1 ;
6 }
7 }
8
9 i n t main ( ){
10 i n t s e e d ;
11 s c a n f ( ”%d ” ,& s e e d ) ;
12 s r a n d ( s e e d ) ;
13 i f( g e t r a n d o m ()== g e t r a n d o m ( ) ){
14 p r i n t f ( ”A\n ” ) ;
15 }
16 r e t u r n 0 ;
17 }
L03-Q6
Quiz(rand()の振る舞い)
次のプログラムで, seedを無作為に入力するとき, Aが出力される確率は?
1 i n t g e t r a n d o m (d o u b l e y ){
2 i f( y<2/13.0 ){
3 r e t u r n 0 ;
4 }e l s e i f ( y<6 / 1 3 . 0 ){
5 r e t u r n 3 ;
6 } e l s e {
7 r e t u r n 4 ;
8 }
9 }
10
11 i n t main ( ){
12 i n t s e e d ;
13 s c a n f ( ”%d ” ,& s e e d ) ;
14 s r a n d ( s e e d ) ;
15 i f( g e t r a n d o m ()>1 ){
16 i f( g e t r a n d o m ( )>3 . 5 ){
17 p r i n t f ( ”A\n ” ) ;
18 }
19 }
20 r e t u r n 0 ;
21 }
1 0
2 7
13
3 77
132に近い
4 121
132くらい
5 1
お知らせ
2017-04-26
水
3実習の春のプチテスト
2017-05-01
月
4臨時教室変更
3-B105実習室 チューター
/Mathラウンジ 月火水木昼
1-6142017-05-08
月 統計検定申込締切
2017-06-18