.
... 母分布と標本分布, 期待値の計算
樋口さぶろお
龍谷大学理工学部数理情報学科
計算科学☆演習II L02(2013-04-17 Wed)
今日の目標 .
..
1 母分布(確率分布)からグラフが描ける. .
2.. 標本からExcelでヒストグラムが描ける.
. ..
3 母分布から手と数式で(母)期待値が計算できる. .
..
4 標本から電卓やExcelで(母)期待値が推定で きる
Quiz
ここまで来たよ
1... ランダムウォークと擬似乱数生成 Quiz解説
2... 母分布と標本分布,期待値の計算 母分布と標本分布
(相対)度数分布表 ヒストグラム 期待値
ランダムウォークと擬似乱数生成 Quiz解説
.Quiz(疑似乱数の使いかた) ..
...
サンプルプログラムを参考に,引数 y として[0,1)一様乱数が与えられた とき,下の確率で値を返すint getrandom(double y)を書こう.
返り値 確率
−1 1/3 0 1/2 +1 1/6
Quiz解答:疑似乱数の使いかた
ソースコード 1: 乱数
1 int g e t r a n d o m ( d o u b l e y ){
2 if ( y < 1 . 0 / 3 . 0 ){
3 r e t u r n -1;
4 } e l s e if ( y < 1 . 0 / 3 . 0 + 1 . 0 / 2 . 0 ){
5 r e t u r n 0;
6 } e l s e {
7 r e t u r n +1;
Quiz
誤りの種類(深刻順) S(50%)
1 i f( y<1 . 0 / 3 . 0 ){
2 /∗ A ∗/
3 } e l s e i f ( y<1 . 0 / 2 . 0 ){
4 /∗ B ∗/
5 } e l s e {
6 /∗ C ∗/
7 }
のような誤り. Aは0≤y <1/3, Bは1/3≤y <1/2 のとき起きる. 確 率は,この区間の長さに等しいので, Aは1/3, Bは1/6の確率でおきるこ とになっちゃう. この問題でいちばん考えてほしいポイントでした. もう 1回考えてみてね.
I(19%) Cでは,a < x < bみたいな不等式は書けません(正確には別の意 味になっちゃう). 面倒でも&&でa<x && x<bと書かなきゃ.
C(31%) 1/3って書いてるけど,それCでは int 同士の整数の演算で0に
ランダムウォークと擬似乱数生成 Quiz解説
F(14%) 1/3 = 0.33 と短い桁の小数で書いちゃった. 不正確すぎ.
R(13%)
1 i f( y<1 . 0 / 3 . 0 ){
2 /∗ 何 か ∗/
3 } e l s e i f ( y>=1.0/3.0 && y<5 . 0 / 6 . 0 ){
4 /∗ 何 か 別 ∗/
5 } e l s e {
6 /∗ ま た 何 か 別 ∗/
7 }
の y>=1.0/3.0って無駄じゃない? ここに来るなら必ず成立してるよね.
E(6%) その他例外的な誤り.
ここまで来たよ
1... ランダムウォークと擬似乱数生成 Quiz解説
2... 母分布と標本分布,期待値の計算 母分布と標本分布
(相対)度数分布表 ヒストグラム 期待値
母分布と標本分布,期待値の計算 母分布と標本分布
母分布と標本分布 例A
確率分布
R 確率
1 16 2 13 3 12
ここからグラフを描く方法 ×2
母分布 標本分布
母分布と標本分布の比較
母分布 標本分布
サイズ 1つに定まっている. 本物. ‘やる’たびに違う. 実験結 果.
→ サイズ∞ → 標本サイズ を自由に決 められる
例 表
関数 Pj =f(Rj)
1個のgetrandom() 実行してみる
1個のサイコロ ふってみる 赤ひげ危機一髪 刺してみる ブラックボックス 使ってみる この他にも,母ナントカ,標本ナントカ がいろいろある. 母=population, 標本=サンプル
母分布と標本分布,期待値の計算 母分布と標本分布
母ナントカと標本ナントカの関係
母ナントカから標本ナントカを作る 標本抽出
サンプルに1個ずつデータを追加(試行という)していって作る
作るたびに異なるサンプルになる
母分布がブラックボックスでも,とりあえず使えるデータが手に入る 推定に使うため,好きなサイズのサンプルを作る
標本ナントカから母ナントカをあてる推定
正確にあたるとは限らない
サンプルが違えば推定結果も違う
母分布が(正確には)わからないとき,なるべく正確な推定をしたい.
.Quiz(母分布と標本分布) ..
...
以下のようにして得られるのは母分布?標本分布? 母分布のものを何個で も選ぼう.
.
1.. getrandom()内の定義を読んで,この値が返る確率はいくつ,と考
える. . ..
2 getrandom()をfor で何度も実行して,どの値が何回返ったか数える.
.
3.. 赤玉白玉のたくさんはいった箱から,中を見ないで取りだして,元に 戻す. このとき赤玉である確率を求めるのに,箱の中の赤玉白玉の総 数を数える.
.
4.. 宝くじのあたる確率を,宝くじを買ってみることで求める .
..
5 あるコインの表がでる確率がきっちり1/2かどうか調べるために, コインを何回も投げてみる.
母分布と標本分布,期待値の計算 (相対)度数分布表
ここまで来たよ
1... ランダムウォークと擬似乱数生成 Quiz解説
2... 母分布と標本分布,期待値の計算 母分布と標本分布
(相対)度数分布表 ヒストグラム 期待値
(相対)度数分布表 サンプル → 度数分布表→ 相対度数表 例A
母分布と標本分布,期待値の計算 ヒストグラム
ここまで来たよ
1... ランダムウォークと擬似乱数生成 Quiz解説
2... 母分布と標本分布,期待値の計算 母分布と標本分布
(相対)度数分布表 ヒストグラム 期待値
ヒストグラム (相対)度数分布表を粗くグラフ化する方法
一定幅の階級,ビン a≤r < a+dに分けて,その中に入る個数を数える. d: 階級,ビンの幅
データから Excelで描く方法→ 演習
例 ある時点で, AKB48グループから無作為に彼女1人を選んだときの, 身長の母分布のヒストグラムを描こう
145,152,153, . . ..
階級 度数 相対度数
145より大きく150以下 7 0.09 150より大きく155以下 17 0.22 155より大きく160以下 29 0.37 160より大きく165以下 19 0.24 165より大きく170以下 4 0.05 170より大きく175以下 1 0.01 175より大きく180以下 0 0.00 180より大きく185以下 1 0.01
合計 78 1.00
母分布と標本分布,期待値の計算 ヒストグラム
.Quiz(ヒストグラム) ..
...
下の1変量データについて,度数分布表とヒストグラムを作ろう. ただし, 階級は,幅が5, ‘a以上b未満’で定めよう.
X 104 108 108 108 108 112 114 115 115 118
ここまで来たよ
1... ランダムウォークと擬似乱数生成 Quiz解説
2... 母分布と標本分布,期待値の計算 母分布と標本分布
(相対)度数分布表 ヒストグラム 期待値
母分布と標本分布,期待値の計算 期待値
母期待値
R: 確率変数
例
R 確率
r1 p1 r2 p2
· · · · · · rm pm
j: とりうる値につけた番号. 当然,確率の合計
∑m j=1
pj = 1. (全事象)
f(R): R の関数
例f(R) = 2R, R2,eR,(場合分けで書かれた関数),…. .f(R)の母期待値
..
...
E(f(R)) =
∑m j=1
pj×f(rj)
.
よく使われる期待値
確率の合計 = E(1) = 1. つまりf(R) = 1, 平均値 =µ= E(R). つまり f(R) =R,
分散 =σ2= E((R−µ)2). つまり f(R) = (R−µ)2. 例A
母分布と標本分布,期待値の計算 期待値
標本から母期待値を推定する
さっきのようにして,まず母分布を推定して,そこから母期待値を計算す ることもできるが,もっと楽な方法がある.
.標本期待値 ..
...
母期待値 E(f(R))は,標本期待値
1 N
∑N i=1
f(R(i))
に近いはず. ‘母期待値を標本期待値で推定する’ (i): サンプル番号. 値に重複あり. N:サンプルサイズ.
Excel で計算する方法→ 演習
例A
母分布と標本分布,期待値の計算 期待値
.Quiz(期待値) ..
...
確率変数 R は,値R=−2を確率3/11で,値R=−1を確率1/11で,値 R= 0を確率2/11で,値R= +1を確率5/11 でとる.
.
1.. 母期待値 E(R2) を求めよう. .
..
2 母期待値 E(R)を求めよう. .
..
3 eR>0.9 となる確率を求めよう.
.Quiz(標本期待値) ..
...
ゆがんだサイコロがある. これを振ってでる目の数を確率変数R とする. 振ることによって,次のようなサンプルを得た.
1,6,1,2,1,3,4,2,2,1 .
..
1 (相対)度数分布表を作ろう .
..
2 ヒストグラムを作ろう .
3.. 期待値 E(R1)を推定しよう. .
..
4 期待値 E(R) を推定しよう.
母分布と標本分布,期待値の計算 期待値
予習復習問題これからは,
金11:05締切の予習復習問題は RaMMoodle
http://el.math.ryukoku.ac.jp/moodle→計算科学II(講義) で やってね.
水13:35 締切の予習復習問題は C-learning
http://asp.c-learning.jp/s/でやってね.