計量経済学 講義
第 4 回 記述統計の基礎 Part 1
2013
年 10 ⽉ 18 ⽇(⾦)2 限
担当教員:
唐渡 広志
研究室:
経済学研究棟4階432号室
email:
[email protected]
website:
http://www3.u-toyama.ac.jp/kkarato/
講義の目的
⼀般的なデータの集約⽅法や記述⽅法につ
いて学びます。
keywords:
度数分布表,ヒストグラム,標本平
均,偏差,偏差2乗和,標本分散,標本標準
偏差
教科書: pp. 36–38, 44–50(第2章)
度数分布表とヒストグラム
(1) pp.36-38
度数分布表の作成⼿順 (Excel)
1.
【全度数】(データサイズ)を調べる[count 関数]
2.
【階級数】概算値 [1+log
2(全度数)]
3.
【最⼩値】[min 関数]
4.
【最⼤値】[max 関数]
5.
【範囲】[最⼤値-最⼩値]
6.
【階級の幅】(の⽬安) = 「範囲」/「階級数」を計算
7.
【階級の設定】(○○以上××未満)
階級数や階級の幅は⼀つの⽬安と考える。 階級の幅は区切りのよい間隔を持たせた⽅がわかりやすい。度数分布表とヒストグラム
(2)
度数を求める⽅法 階級の上限に対応した値を「区間配列」 データとして記述する。 「5 万円未満」なので,階級の上限を 4.9 とする。 frequency 関数を利⽤して,最初の 階級の度数だけを計算する。 データ配列 区間配列 = frequency (データ配列,区間配列)度数分布表とヒストグラム
(3)
いま計算した「最初の階級の度数」と「これから計算 予定の度数」のセルを選択状態にする。Ctrl
と Shift を押さえたまま Enter
数式バーの⼀番左側をクリック 完成(操作を間違えたら Esc キー) (この技のことを「配列コピー」とよぶ) ヒストグラム作成 「挿⼊」タブ 縦棒 2-D縦棒母集団と標本
pp.44-46
全体の構造 ⼀部の情報(標本) 全体の構造の予測 「推定・検定」 一部分を利用 「標本抽出」 (母集団)⼀部の情報だけを利⽤して全体の構造を予測
⺟集団の平均・分散 例(推定) : 標本から計算できる「平均」を⽤いて,⺟集団の平均を予測する。 標本から計算できる「分散」を⽤いて,⺟集団の分散を予測する。母集団(
population)
⺟集団:「観察の対象」となっている事柄のあらゆ
る「観測値」の集まり
観察の対象(例)
a.
2013
年10⽉1⽇現在の⽇本⼈の20歳の男性の体重
b.
A
市で働いている就業者(25-29歳) 2012年の年収
c.
市⻑選挙での投票結果
d.
サイコロを投げた時に出る⽬
e.
富⼭湾深海のホタルイカの卵の数
f.
B
社が作る液晶テレビの性能状態(初期不良があるか
どうか)
g.
22
世紀の C 国で⼀⼈の⼥性が⽣涯に産む⼦供の数
標本
(sample) と標本の大きさ (sample size)
標本:⺟集団の⼀部分だけを何らかの⽅法(実験,調査,観察など)で観測し た「観測値」の集まり。 標本抽出:⺟集団から「観測値」の⼀部を取り出すこと。 抽出された⼀つ⼀つの観測値のことを「観測データ」または単に「データ」ともよぶ。 母集団 就業者( 25-29歳 )の年収 標本 260,209,99,256,280, 121,286,564,457,405 標本抽出 観測値 or 観測データ or データ ⺟集団から取り出した標本内の観測データ の数のことを「標本の⼤きさ(標本サイズ, sample size)」とよぶ.標本数とはよばな い! 記号 n で標本の⼤きさを表す。 sample size: n = 10例.標本抽出(
sampling)による調査
「家計調査」(総務省)
家計の収⼊と⽀出に関する調査→家計簿的な統計
⽇本全体の世帯⼈員が⼆⼈以上の世帯数は3,400万(単⾝世帯
を含めると4,600万)
家計調査で標本抽出された⼆⼈以上の世帯数(標本サイズ)
は8,000
• 全体の 0.024% だけを利⽤している.
「労働⼒調査」(総務省)
就業状態についての調査
標本抽出される世帯数(標本サイズ)は約4万世帯(10万⼈)
2010
年の失業者数は334万⼈,就業者数は6257万⼈
標本の「数」と標本の「大きさ」(
1)
⺟集団 就業者( 25-29歳 )の年収 標本 (a) 260, 209, 99, 256, 280, 121, 286, 564, 457, 405 標本抽出 標本の大きさ(標本サイズ): n = 10 標本 (b) 253, 666, 814, 156, 625, 418, 216, 172, 208, 217 標本 (c) 235, 213, 375, 302, 486, 306, 392, 376, 526, 841 標本の数 = 3 一つの標本 = 観測値10個の塊 注意:標本抽出のたびに異なる観測値が得られる。 10個の観測値からなる標 本が3セットある状態標本の「数」と標本の「大きさ」(
2)
母集団 サイコロを投げたときに出る目標本1
22
25
43
64
26
15
標本2
31
65
21
64
11
61
標本3
14
43
11
45
41
64
標本4
56
14
46
21
46
25
標本抽出 標本の大きさ (標本サイズ) n = 12観測データ表
観測データ⼀つ⼀つに「観測番号」をつける。 任意の観測番号を i という記号で表す. 標本サイズが n = 10 のとき i = 1, 2, … ,10 第 i 番⽬の観測データを Xi という記号で表す. 観測番号順に観測データを並べた表を「観測データ表」 とよぶ.209
260
2 1
X
X
記号と値の対応
例:
観測データ表 「就業者の年収」標本(a)を例に観測データのまとめ方を考える。観測データ
X
i
X
1,
X
2,
,
X
n
データの塊を { } で括って表わす ・・・ は省略の記号 【定義】サンプルサイズ n の観測データの塊 例.
X
i
7
,
1
,
2
,
3
,
0
標本平均
(Sample Mean) (1)
n
X
X
X
X
1
2
n
4
4
16
4
6
5
3
2
4
6
,
5
,
3
,
2
,
4
4 3 2 1
X
X
X
X
X
X
n
iのとき
例.
エックス・バーと読む
:
X
の平均
観測データ
【定義】標本平均:
X
iX -2 0 2 4 6 8 10 12 14 2 3 5 6 Y -2 0 2 4 6 8 10 12 14 0 3 6 7 -2 0 2 4 6 8 10 12 14 00 3 13