.
... 比率の推定
樋口さぶろお
龍谷大学理工学部数理情報学科
使える統計 ! L14(2013-01-16 Wed)
今日の目標 .
..
1
標本から , 母集団の比率の点推定 , 区間推定がで きる
http://hig3.net
樋口さぶろお (数理情報学科) L14比率の推定 使える統計!(2012) 1 / 16
Quiz 解答 : 区間推定 A.
標本平均 = 135
不偏分散 = 4 − 1 1 × 6 = 2.
よって , 母平均 µ の信頼係数 95% で信頼区間は
135 − 1.96 × √
2
4 <µ < 135 + 1.96 × √
2 4
135 − 1.39 <µ < 135 + 1.39 133.61 <µ < 136.39
B.
標本平均 = 136
不偏分散 = 4 − 1 1 × 24 = 8.
よって , 母平均 µ の信頼係数 95% で信頼区間は
136 − 1.96 × √
8
4 <µ < 136 + 1.96 × √
8 4
136 − 2.78 <µ < 136 + 2.78 133.22 <µ < 138.78
C.
標本平均 = 135
標本分散 = 8 − 1 1 × 12 = 1.71.
よって , 母平均 µ の信頼係数 95% で信頼区間は
135 − 1.96 × √
1.71
8 <µ < 135 + 1.96 × √
1.71 8
135 − 0.91 <µ < 135 + 0.91 134.09 <µ < 135.91
樋口さぶろお (数理情報学科) L14比率の推定 使える統計!(2012) 3 / 16
やりたいこと : 母比率の推定
クラスの中で , 血液型 A 型の人の比率は ? n 人に質問しただけで推定 したい .
候補者 A の得票率は何 % ? n 人に質問しただけで推定したい . 工場から出荷する製品のうち , 何 % が不良品 ? n 個だけ抜き出して調 査したい .
このコインの表が出る確率は ? n 回投げるだけで推定したい .
母比率 =(1 人取り出したときに A 型である ) 確率 p.
考え方 1: 先週と同じ推定方法
量 X を考える
X =
{
1 (A 型である ) 0 (A 型でない ) 母集団 確率分布の平均 , 分散を使って ,
X の母平均 E(X) = 1 × p + 0 × (1 − p) = p.
X の母分散 V(X) = (1 − p) 2 × p + (0 − p) 2 × (1 − p) = p(1 − p).
標本
標本サイズ n の中で k 人が A 型のとき , 標本平均 x ¯ = 1 n [1 + | · · · {z + 1 }
k
+ 0 + | · · · {z + 0 }
n − k
] = k n . 標本分散 いまは考えないでおく…
. 比率の推定 ..
...
母比率 p の推定値 = n k
中心極限定理より , 推定値は , 平均 p, 分散 n 1 p(1 − p) の正規分布に従う .
樋口さぶろお (数理情報学科) L14比率の推定 使える統計!(2012) 5 / 16
考え方 2: 2 項分布 (L08)
n 回の試行で , 確率 p の事象が k 回起きる確率 P k を与える 確率分布
P k = n C k p k (1 − p) n − k
B(30, 2 3 )
15 20 250.000.050.100.15
Binomial Distribution: Binomial trials=30, Probability of success=2/3
Number of Successes
Probability Mass
. 2 項分布の平均値と分散の公式 ..
...
E(k) = np
V(k) = np(1 − p)
サイズ n の標本で , k 個が該当するものであるとする . . 比率の推定
..
...
母比率 p の推定値 = n k
k は 2 項分布に従う . 正規分布で近似できる .
樋口さぶろお (数理情報学科) L14比率の推定 使える統計!(2012) 7 / 16
. Quiz(比率の区間推定) ..
...
クラスからサイズ ( ) の標本をとったところ , ( ) 人中 ( ) 人が 血液型 A であると答え , 残りが A 型でないと答えた .
.
1
.. クラスの , 血液型 A である比率を ( 点 ) 推定しよう .
..
2
クラスの , 血液型 A である比率の , 信頼係数 95% の信頼区間を求め よう .
.
3
.. クラスの , 血液型 A である比率の , 信頼係数 99% の信頼区間を求め
よう .
比率の区間推定
標本の中で該当するものの個数 k の分散 = np(1 − p).
k
n の分散 = n 1
2np(1 − p) = 1 n p(1 − p).
p を推定値 n k で代用する . . 比率の区間推定
..
...
信頼係数 95% の信頼区間は
k
n − 1.96 × √
1 n k
n (1 − n k ) < p < k n + 1.96 × √
1 n k
n (1 − k n ) 信頼係数 99% の信頼区間は
k
n − 2.58 × √
1 n k
n (1 − n k ) < p < k n + 2.58 × √
1 n k
n (1 − k n )
樋口さぶろお (数理情報学科) L14比率の推定 使える統計!(2012) 9 / 16
言い訳
いくつか大事なことを省略してます . 本当は補正が必要です .
有限母集団補正 母集団のサイズと標本のサイズが同じだったら , 誤差は 0 にならないとへんなのに , 母集団のサイズが考慮されてい ない
不連続補正 中心極限定理から 2 項分布が正規分布に近づくといっても ,
値が離散的だから , 端のところは正確じゃない
復習 : 正規分布 ( ガウス分布 ) のグラフに関係した面積をおぼえよう !
- 4 - 2 0 2 4
0.0 0.1 0.2 0.3 0.4
μ σ σ
1σ 2σ 3σ 0.6827 0.9545 0.9973
- 4 - 2 0 2 4
0.0 0.1 0.2 0.3 0.4
μ σ σ
1.96σ 2.58σ
0.9500 0.9900
樋口さぶろお (数理情報学科) L14比率の推定 使える統計!(2012) 11 / 16
. Quiz(比率の区間推定の性質) ..
...
標本からの母平均の区間推定について , 正しいのはどれ ? .
..
1
母分散が大きいほど , 信頼区間は大きくなる .
2
.. 標本サイズが大きいほど , 信頼区間は大きくなる .
..
3
母平均が大きいほど , 信頼区間は小さくなる .
..
4
信頼係数が大きいほど , 信頼区間は小さくなる
. Quiz(比率の区間推定の性質) ..
...
標本からの母平均の区間推定で , 標本サイズを 2 倍にしたとき , 信頼区間 の長さはどうなる ?
.
1
.. 4 倍になる
. ..
2
2 倍になる
. ..
3
1.4 倍になる
.
4
.. 変わらない .
..
5
0.7 倍になる
. ..
6
1/2 倍になる
.
7
.. 1/4 倍になる
樋口さぶろお (数理情報学科) L14比率の推定 使える統計!(2012) 13 / 16
. Quiz(比率の区間推定) ..
...
選挙で出口調査をしたところ , 50 人中 35 人が A 候補に投票したと答 えた .
.
1
.. A 候補の得票率を ( 点 ) 推定しよう .
..
2
A 候補の得票率を , 信頼係数 95% で区間推定しよう . .
..
3
A 候補の得票率を , 信頼係数 99% で区間推定しよう .
連絡
今週は授業内で Quiz 用紙を 1 枚提出 ( 過程も書こう )
今日およびこれまでの Quiz は , 1 号館 5 階 503 号室向かい側で返却 しています .
今日およびこれまでの配布資料は , 発見した誤りの訂正後 , http://hig3.net > 生活の中の統計技術 で再配布してます . 今日の Quiz の略解は , http://hig3.net > 生活の中の統計技術 で 配布してます .
履修完了宣言レポート
今週は予習復習問題はありません . e ラーニングシステム上で , 100 ピー ナッツに追加 5 ピーナッツとなる , 履修完了宣言レポート (200 字の予定 ) を書いてください . e ラーニングシステム上に説明があります . 締切 2013-01-23 水 23:55.
樋口さぶろお (数理情報学科) L14比率の推定 使える統計!(2012) 15 / 16
ファイナルトライアル計画 ! ..
日時
2013-01-23
水3 (60
分)
場所いつもと同じ3-107
形式ペーパーテスト
.
計算問題と選択肢問題の両方があります.
関数電卓持込なし.
参照A4
×1
枚両面持込可(
教務課からの掲示では持込不可と表示していますが,
この文書の情報が正しいです
).
手書き
,
コピー等何でも.
ただし縮小コピー,
貼り付けは不可.
この配布資料の大きさがA4
です. A4
未満の用紙は使わないでください(
拡大コピーすればいいだけでしょ)
A4
を縦長に置いたとき,
右上に学籍番号と名前を書いておいてください.
終了後に回収します.
配点
100
点50
ピーナッツ 公欠通常の追試規定に従います.
出題計画(
離散的)
確率分布が与えられたとき,
平均値,
分散,
標準偏差をもとめる(L08) (
連続的)
確率分布(
のグラフ)
が与えられたとき,
確率,
平均値を求める(L09)
標準とは限らない正規分布について,
どの範囲ならこんな確率,
こんな確率ならこの範 囲,
をもとめる(L10,L12)
標本が与えられたとき