第5回
分布 形
次回 い
• 次回 11月6日 講義 演習
– M31 教室 直接集合
– 情報演習室 PC ロ イン う 、ID
ワ 確認 く
– 利用 フ イル 事前 学務シ ム
プロ く 、各自確認 く
• HP プロ 行わ い
• 講義フ イル HP プロ く
– 椅子 足 い 64席 い 、 録 講者 77
名 、3人 2 PC 使う形
– 足 い椅子 教室 運
日 容
• 連続 散
• 分布
– 散 分布
– 連続 分布
• 分布 形 尺度
– 尺度 度
– 尖 尺度 尖度
前回 復習
• 日経 均
– 均 16580.61
– 標準偏差 2201.37
• ウ 均
– 均 16863.85
– 標準偏差 930.83
前回 復習
イ 基準化
• 日経 均: 均16580.61、標準偏差2201.37
– 2015 7 月 基準化 、
. − .
. = .
• ウ 均: 均16863.85、標準偏差930.83
– 2015 7 月 基準化 、
. − .
. = .
前回 復習
ウ ば い
• 標準偏差 見 、日経 均 方 ウ 均 標準偏差 大 い→ば 大 い
• 変動係数 計算 、日経 均 方 大 い→ば 大 い
日経 均 CV =
.
. ≈ . ウ 均 CV =
.
. ≈ .
• 四分位分散係数 計算 、日経 均 方 大 い→ば 大 い
日経 均 四分位分散係数 =
. − .
× . ≈ . ウ 均 四分位分散係数 =
. − .
× . ≈ .
連続 散
• 大 連続 散 分
– 連続 :連続 値
• 例 所得、支出、距 、時間
– 散 :結果 び び
• 例 コイン 投 表 裏 、あ 商品 買う 買わ い 、
移動 電車 移動 徒 移動 、
• 性質 、処理 変え 必要 あ
– 連続 1 1 値 々 扱 い
い
– 散 無理や 順序 滑 意味
い
例
• イ 時給 い ン 、
– 700 人 何人、701 人 何人、702 人
何人、 集計 い い
– 場合 、続 物 数 処理 ほう
扱いや い
• 通学手段 い ン 、
– 徒 、自転車、 、電車、 イ 、自動車 あ
– 徒 方 自動車 良い悪い、 方 電車
良い悪い、 いう い
– 徒 1、自転車 2、 … 無理や 順序
意味 い
散 分布
• 散 値 2 場合 複数 場合 あ
– コイン 表 裏 、 2 結果 表or裏 い
– 電車 徒 、 う 3 以上 値 あ あ
• 結果 便宜上数値 割 当 、整理や統計的 手法 分析 容易
– 表 出 ば1、裏 出 ば0
– 乗 ば1、電車 乗 ば2、徒 ば0
• 値 2 場合 、 均 結果 起 比率
意味
• 散 い 、中央値 あ 意味 い
• 散 い 、 注目 結果
く い 頻度 生
例
• ホ カ い ?
– 一昨 計量経済学 花田 時間 ン
• サンプルサイ 15人
• ホ 方 流 →1、 カ 方 流 →0 割 振
– ン 結果 1 9人、0 6人 – 均
+ + + + + + + + + + + + + +
=
= .• 、 均 見 0.6 割合 60% 人 ホ 方 流 いう 分
– 一方、中央値 8人目 1
• 、 あ 意味 い い い、半分以上 人 1 選 い
わ い
• 例えば、 う 8人 人 1 選 い 、15人全員 1 選 い 中 央値 1
例
• 石川県 2007 5月~2015 8月 天気 出
典:Yahoo!
– 1 月 、 雪 何回あ 数え
– 観測数 100
– 雪 日 合計 48 日
– 結果 表 1 月 最大 31
雪 回数 0 1 2 3 4 5 6 31 合 計 月数観測値 77 9 7 4 2 1 0 0 100
比率 �� � � � 0 0 1
例
• 均
× + × + × + × + ×
+ × =
– 、1 月 均0.45日 雪 あ 示
い
– 中央値 0 、や あ 意味 い
• 注意点
– Yahoo! 天気 各日 15時 う 天気
• 、 以外 時間帯 雪 降 い 、 雪 日 カウン い
散 ラフ
• 数値や選択肢 大小 意味 あ 場合 、棒 ラフ 用
い 多い
– い 目 1~6 段階的 大 く いく 、数値 大小 意味 あ
– 成績評価 S、A、B、C、D 数値 い 選択肢 順序 あ S A B C D
– う 場合 、棒 ラフ 用い 多い
• 数値や選択肢 大小 意味 い場合 、 ラフ 用
い 多い
– 徒 →0、 →1、 電車 →2、 数字 振 、
徒 や電車 劣 い わ い
– う 場合 棒 ラフ 用い 、並び方 印象 変わ く 場合 あ
– 、 ラフ 用い 多い
例
0 5 10 15 20 25 30
D C B A S
統計学最終成績分布
右 行くほ 成績 良い 、
棒 ラフ 表 全体 分 易い
入試区分 順番 い 、
41%
17% 14%
13% 6% 3%
2% 2% 1% 1%
入試区分 入学者数
一般入試 公募推薦 ン 利用
指定校推薦 CDP特待 併設校推薦 ポ 推薦 専門 総合一般 プラ 1 併設校 ン 利用
連続 分布
• ラム 書く 、連続 分布 形 知
• 分布 形 見 、 状況 把握
– 左右対称 う
– 双峰分布 い い
– 双峰分布 合成 分布 い い
– 均 周 ほ あ 分布
– ば 大 い幅 広い分布
etc.
• 、目 見 感覚 左 寄 い 右 寄 い
尖 い 主張 説得力 い
• 、分布 形 示 統計量 用い 議論
様々 分布
2014 経済数学Ⅰb期 素点
→双峰分布
勉強 人 あ い人
2014 計量経済学b成績
→左 分布
計量経済学 学生 意欲 関心 高い 、 成績 良く
0 5 10 15 20 25 30 35
0 1 2 3 4 5 6 7 8 9
尺度
• 分布 偏 い 分布 い い
う
– 裾 長い方向 い 、 表現
– 計量経済学 試験結果 右側 い →左側 裾 長い
左 い
• 分布 示 統計量 度 skewness あ
– 基準化値 3乗 均 計算
度 = N �=
� �� − �
�
– 左 分布 負 値 、右 分布 正 値
– 小 いほ 0 近 、 大 いほ 絶対値 大 く
例
• OECD 諸国 2014 2013 一人当
GDP 分布 比較
– 経済成長 進 い ば、分布
右 寄 いく 負 い あ
– 見 客観的 議論 い
5 10 15
2014
5 10 15
2013
例
• 度 計算 – 観測数 34 – 均
• 2014 :約41.9
• 2013 :約41.5
– 標準偏差
• 2014 :約24
• 2013 :約24
– 、 度 計算式
度 =
�=
�� − .
= .
度 =
�=
�� − .
= .
例
• 度 正
– 、正 分布 、左側 寄 分布
あ 統計量 示
• 2013 度 2014 度
– 、2014 方 負 分布 あ
、右側 寄 分布 あ
– 右側 いう 一人当 GDP 増え い
いう事 あ 、 一人当 GDP 測 経済成長
示 い
– 、 差 くわ あ 、誤差 範
可能性 高い
尖 尺度
• ば 少 く、 均 近く 集中 い う
分布 尖 分布 いう あ
– 尖 分布ほ ば 小 い
• 分布 尖 示 統計量 、尖度 あ
– 基準化値 4乗 均 計算
尖度 = N �=
� �� − �
� – 尖 い 分布ほ 、尖度 小 い
– 統計学 標準的 分布 正規分布 尖度 3
、 上 計算 尖度-3 尖度 呼ぶ あ
• 場合、正規分布 比 尖 い ば負、尖 い ば正
• Excel 関数 、 3 引い 値 計算 い
例
• 1 次 3 次 得単位数 比較
– 1 次 い 基 的 学生 あ 、講義
容 基 的 多い 、 得単位数 ば
少 い 考え
– 3 次 い 単位 得状況 違いや
大学 悪い意味 慣 、講義 容 高度
、 得単位数 ば 生 考
え
– 仮説 正 い ば、1 次 得単位数 方
均 近く 集中 い 尖 い あ
例
0 100 200 300 400 500 600
5 10 15 20 25 30 35 40 41以上
1 次
0 10 20 30 40 50 60 70 80
5 10 15 20 25 30 35 40 41以上
3 次
1 次 方 分布 右 寄 い →負 い う 見え 度 1 次:-2.63、3 次:-0.89
、 均 周 集中 い う くい
例
– 1 次 均 40、標準偏差 6.3、観測数 830
– 、尖度
次 尖度 =
�=
8
�
�−
. = .
– 3 次 均 32.6、標準偏差 6.6、観測数 233
– 、尖度
次 尖度 =
�=