母集団・標本・標本抽出と推定
樋口さぶろお http://hig3.net
龍谷大学理工学部数理情報学科
確率統計☆演習I L10(2018-12-05 Wed)
最終更新: Time-stamp: ”2018-12-05 Wed 14:51 JST hig”
今日の目標
略解:二項分布,独立同分布の和
L09-Q1
Quiz解答:ベルヌーイ分布
1 ベルヌーイ分布 B(1,0.05)に従う確率変数をX とすると, Y = 1000X.
2 E[Y] = E[1000X] = 1000E[X] = 1000p= 50.(円)
V[Y] = V[1000X] = 10002V[X] = 10002p(1−p) = 47500. (円2) L09-Q2
Quiz解答:二項分布
1 二項分布B(100,23)に従う確率変数をX とする. P(X = 40)を求め ればいいから,100C40p40(1−p)100−40= 40!60!100! (23)40(1−23)60.
2 E[X] =n×p= 2003 . V[X] =n×p(1−p) = 2009 .
略解:二項分布,独立同分布の和
1 Y = 1000X+ 50. E[X] = 0.05. V[X] = 0.05×0.95.
2 E[U20] = 20E[Y] = 20000E[X] + 1000 = 2000(円).
V[U20] = 20V[Y] = 20×10002V[X] = 950000 (円2).
3 wを20回中のあたりの回数とすると,W は二項分布B(0.05,20)に したがう. U20= 1000W + 50×20.
4 E[U20] = E[1000W + 50×20] = 1000E[X] + 1000 =
1000×20×0.05 + 1000 = 2000(円). V[U20] = V[1000W + 1000] = 10002V[W] = 10002×20×0.05(1−0.05) = 950000(円2).
5 P(U20= 4000) =P(W = 3) = 3!17!20! 0.0530.9517.
母集団・標本・標本抽出と推定 母集団と標本
ここまで来たよ
9 略解:二項分布,独立同分布の和
10 母集団・標本・標本抽出と推定 母集団と標本
母平均値・母分散の(点)推定 母比率とその(点)推定
母集団・標本・標本抽出と推定 母集団と標本
母集団と標本 (1) 有限母集団
前園確率統計§5.1某アイドルグループの身長ふたたび
某アイドルグループ全員(→有限母集団)の身長xi の平均値 x= N1 ∑N
i=1xi を求めたい!
▶ メンバー1名を等確率で選んでくる,という試行を考えると,確率変数 X の母平均値µ= E[X].
メンバー全員分のデータがあれば定義の式使うだけ
握手会でメンバー1人ずつに質問しなければいけないとしたら? 握手会参加券40枚集めないで何とかすませたい.
⇝ 質問できたメンバー5人の身長(=標本)(独立同分布にしたがう確率変 数X1, X2,· · ·, X5) から推定したい.
5人を‘無作為に’選ぶ(=標本抽出する)
母集団サイズ 標本サイズ 標本の個数
母集団・標本・標本抽出と推定 母集団と標本
母集団と標本 (2) 離散 or 連続型確率変数
前園確率統計§5.1賞金額,個数が謎のスピードくじ(引いて賞金額を見た後で箱に戻す).
賞金額 X は離散型確率変数 → 無限母集団(何回でもひけるから).
賞金の母平均値 µ= E[X] =∑
xxf(x) を求めたい. くじの中を見れば(f(x)の式を知れば)定義の式使うだけ. しかし,中を見ることはできない.
+∞回くじを買わず,何とかすませたい.
⇝ 引いた5枚のくじの賞金額=標本)(独立同分布にしたがう確率変数 X1, X2,· · · , X5)から推定したい.
5枚を‘無作為に’選ぶ(=標本抽出する).
母集団サイズ= ,標本サイズ= ,標本の個数= .
母集団・標本・標本抽出と推定 母集団と標本
母集団・標本抽出・推定
前園確率統計§5.1母集団 population =考えたい集団. どんな分布,母平均値,母分散, などわかっていないことがあるが,全体を調べるわけにはいかない 集団.
標本 sample (名詞) =母集団から‘無作為に’とってきた一部分
標本抽出 するsample(動詞)=母集団から‘無作為に’とってくる⇝
sampling (動名詞)
推定 する estimate(動詞) =標本を調べて母集団について正しそうな
事実を見つける ⇝ estimation (名詞)
推定量 母集団のパラメタをあてるために標本から作った量(確率 変数)
推定には誤差あるかも. 標本の選び方ごとに答は違うし.
こ れ ら を 図 で 語 る と …
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
ここまで来たよ
9 略解:二項分布,独立同分布の和
10 母集団・標本・標本抽出と推定 母集団と標本
母平均値・母分散の(点)推定 母比率とその(点)推定
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
母平均値の ( 点 ) 推定
高校 数学B前園確率統計p.66,§5.1X1, X2, . . . , Xn はサイズnの標本.
各 Xi (i= 1, . . . , n)は母平均値µ= E[Xi],母分散σ2 = V[Xi]の独立同 分布にしたがう確率変数.
µ, σ2 は母集団のパラメタ.
標本平均値
前園確率統計p.71標本平均値X(n)= 1
n(X1+· · ·+Xn) =先週のWn が,母平均値 µの‘よい’推定量になっている.
母平均値は µはひとつに定まっているが,推定量(標本平均値)X(n) は確 率変数であり,試行=標本抽出のたびにかわる(X(n) は確率分布をもつ)
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
L10-Q1
Quiz(母平均値, 母分散, 母比率の点推定)
フライドチキン屋さんのフライドチキンの大量の在庫(=母集団)から,無 作為に6本のチキンを取り出したところ,重さは次のようだった.
117g, 109g, 109g, 119g, 100g, 112g.
1 重さの母平均値を点推定しよう.
2 重さの二乗の母期待値を点推定しよう.
3 重さの母分散を点推定しよう.
4 110g以上のものの母比率を点推定しよう.
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
よい推定量がもつ性質
前園確率統計§5.1不偏性 (unbiasedナントカ)
推定量の母平均値は,推定したい母ナントカに等しい 一致性 (consistency)
推定量と母ナントカに一定の差がある確率は,標本サイズを大きくす るとzeroになる
最尤性 (maximum likelihood) 確率統計II
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
母平均値の推定量 X(n) は不偏性を持つ
「標本平均値 X(n)」の不偏性
母ナントカの推定量の母平均値 =母ナントカ E[X(n)] = 1
n(E[X1] +· · ·+ E[Xn]) =µ
先週のWnの性質
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
独立同分布の性質 ( 復習 )前園確率統計§3.4
X1, . . . , Xn: 独立同分布. 母平均値E[Xi] =µ,母分散V[Xi] =σ2. 和の確率変数 Un=X1+· · ·+Xn
E[Un] =
∑n
i=1
E[Xi] =n×µ.
V[Un] =
∑n
i=1
V[Xi] =n×σ2
Un の確率密度関数 はこんな感じ?
確率変数: Wn= 1
nUn= 1
n(X1+· · ·+Xn)前園確率統計§3.2定理3.4
E[Wn] =E[1 Un]
= 1
×n×µ=µ.
Wn の確率 密 度 関 数 は こんな感じ?
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
L10-Q2
Quiz(独立同分布にしたがう確率変数の和)
ダーツで, 1回投げるごとに点数が得られ,n回投げた合計点で競うルー ルでプレイしている.
あるプレイヤーの i回目の点数を確率変数 Xi とすると,Xi は互いに独 立で同分布にしたがい,E[Xi] = 80,V[Xi] = 200だという.
このプレイヤーがn回投げた合計点を確率変数Un とする.
1 E[U10],V[U10]を求めよう.
2 E[101U10],V[101U10]を求めよう.
3 E[1001 U100],V[1001 U100]を求めよう.
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
母平均値の推定量 X(n) は一致性を持つ
X(n) と母平均値 µ が一定値離れている確率は, 標
本サイズnが大きくなると 0に近づく.
大数の ( 弱 ) 法則
∀ϵ >0 lim
n→+∞P(|X(n)−µ|< ϵ) = 1
確率的に収束 集合位相,確率統計II
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
チェビシェフの不等式 ( 復習 ) と大数の ( 弱 ) 法則の証明
チェビシェフの不等式
前園確率統計p.73X を離散型または連続型確率変数とする. µ= E[X]: 母平均値, σ2 = V[X]: 母分散
a >0: 任意の正の実数. このとき次が成立する.
P(|X−µ| ≥a×σ)≤ 1 a2
大数の弱法則の証明 前園確率統計p.74 X として X(n) (またはWn), a= nϵσ. P(|X(n)−µ| ≥ nϵ
σ ×σ
n)≤ σ2 (nϵ)2
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
母期待値の推定
Y =u(X) という新しい確率変数と思えば,標本期待値
標本期待値
u(X) = 1
n(u(X1) +· · ·+u(Xn)) が,母期待値 E[u(X)]の‘よい’推定量になっている.
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
母分散の ( 点 ) 推定
高校 数学B前園確率統計p.75不偏標本分散
不偏標本分散s2 = 1
n−1[(X1−X(n))2+· · ·+ (Xn−X(n))2]
= n n−1
[ 1 n
∑
i
Xi2−( X(n))2
]
が,母分散の不偏な推定量になっている.
n−1の理由 こうするとちょうど不偏: E[s2] =σ2.
直観的理由 X(n) はXi の重心だから,(Xi−X(n))2 は(Xi−µ)2 より小 さくなりがち(n−n1 倍)なので修正.
自分の言葉で
母集団・標本・標本抽出と推定 母平均値・母分散の(点)推定
E[s2] =σ2 をn= 2 のときに確認(証明前園確率統計定理5.2) 標本平均値を X =X(n) と略記.
左辺= 1
2−1E[(X1−X(n))2+ (X2−X(n))2]
=E[X12+X22−2(X1+X2)X(n)+ 2X2(n)]
=E[X12+X22−2X2(n)]
=E[X12]+ E[X22]−2E[X2(n)] ここで,
σ2 = V[X1] = E[X12]−(E[X1])2=E[X12]−µ2,
σ2
n = V[X(n)] = E[X2(n)]−(E[X(n)])2=E[X2(n)]−µ2 ,より, 左辺=(µ2+σ2)+ (µ2+σ2)−2(µ2+σ22)
2
母集団・標本・標本抽出と推定 母比率とその(点)推定
ここまで来たよ
9 略解:二項分布,独立同分布の和
10 母集団・標本・標本抽出と推定 母集団と標本
母平均値・母分散の(点)推定 母比率とその(点)推定
母集団・標本・標本抽出と推定 母比率とその(点)推定
比率 =ratio 前園確率統計§5.4
母集団{X} で確率 p=P(Xは…である) を考える. Y = I[…](X) とすると,Y ∼B(1, p) になる.
X∼ある分布,Y = I[…である](X),例X >10ならY = 1とか. 母集団=日本国民,国民Xの血液型がAであるなら Y = 1.
母比率
確率 P(Xは…である)を, ‘母集団の「…」の母比率’,ともいう. Y ∼B(1, p) のp に等しい
有限母集団なら,
母集団の「…」の母比率 =「…」である母集団のメンバーxの個数
= E[Y].
母集団・標本・標本抽出と推定 母比率とその(点)推定
例 母集団を,条件「…である」の成立不成立で2つに類別すると, {身長165cm未満,身長165cm以上}.
母比率 p= 身長165cm未満の人の数
母集団サイズ .
例 Y{サイコロの目が1,サイコロの目が1以上}. Y ∼B(1, p).
確率とも言えるけど,こういう状況ではxの比率という習慣 ダミー変数と言われる確率変数Y
母集団・標本・標本抽出と推定 母比率とその(点)推定
やりたいこと : 母比率の推定
母比率 p を標本から推定したい!
クラスの中で,血液型A型の人の比率は? n人に質問しただけで推定 したい.
候補者Aの得票率は何% ? n人に質問しただけで推定したい. 工場から出荷する製品のうち,何%が不良品? n個だけ抜き出して調 査したい.
このコインの表が出る確率は? n回投げるだけで推定したい.
標本比率
標本比率 pˆ=Y = I[…](X) が,「…」の母比率の‘よい’推定量になって いる.
標本のデータ n 個中 k個が「…」であるとき,
母集団・標本・標本抽出と推定 母比率とその(点)推定
連絡
Moodle
https://learn.math.ryukoku.ac.jp/
Moodleモバイルアプリ
https://download.moodle.org/mobile
起動後, URLhttps://learn.math.ryukoku.
ac.jp/moodleを登録
学期途中の振り返りのレポート. –2018-12-12水. https://manaba.ryukoku.ac.jp trialに,前回の問題と同種の問題を再出題してます(1/3くらい)
予習復習問題を,期限後も(再/初)受験できます.点数にはカウントしないけど,プチテ スト準備に活用してね.
Learn Math Moodleの予習復習問題は来週期限のものがあります. プチテストに備え
てね.
教科書の中心極限定理前園確率統計§3.4,区間推定前園確率統計§5.2,5.3,5.4読んできてね.