ネ 統計
第 回
ータ 概要
グラム
統計学 種類
(1) 記述統計
(2) 推測統計
(1) 記述統計 :
■ 得 タ 特徴 抜 出 ニ
■ (例) 人口調査: マ帝国
漢 時代 中国
大化改新 頃 日本
⇒ 目的 ?
■ 現代 記述統計
17 世紀欧州
出所: 多武峰縁起絵巻 奈良県桜井市
(1) 記述統計 :
■ 国情論 , マン ン ン (独
■ 死亡表 関 自然的 政治的諸観察 ョン ン (英)
■ 政治算術 ウ ム ペ (英)
■ 死亡率 推算 エ モン ハ (英
)
⇒ 出生率や死亡率 タ 何 特徴 見出 う 試
■ 後 度数分布表 ヒ ラ 可視化手法
平均値 標準偏差 統計量 方法論 開発さ
出所: https://en.wikipedia.org/wiki/Edmond_Halley
出所: https://en.wikipedia.org/wiki/Halley's_Comet
統計学 種類
出所: https://www.slideshare.net/matsukenbook/ss-53235145
(2) 推測統計 :
■ 全体 把握 いほ 大 対象
起 未来 起 こ 推測
■ 確立 9 世紀後半 世紀初頭
■ 部分 全体 推測 いう意味
全く新 い科学
⇒ 選挙速報 保険 価格付け 等 応用
出所: https://www.slideshare.net/matsukenbook/ss-53235145
毎日新聞社
記述統計 で使う種々の概念
(1) 度数の分布 ( ヒストグラム
(2) 平均値
(3) バラツキ 分散、標準偏差
(4) 相関係数
(5) 回帰分析
種類
の
データ
種類のデータ
の関係性
1. 度数分布 グラム
■ わ わ 好む 好ま い わ
日常生活 ま ま ータ 接 い
• 成績
• 体重 身長
• 日々 客数 売上額
• 血圧 血中成分
⇒ ータ ま く無縁 暮 い 人
い い あ う
ータ 特徴 把握
例 : 身長 タ (80人分):
151 154 158 162 154 164 146 151
154 152 151 167 162 168 166 156
160 161 155 159 156 150 161 166
160 160 155 153 162 155 143 159
163 160 165 146 157 157 156 157
156 153 165 156 162 161 156 156
158 155 154 160 162 168 149 159
156 163 148 151 169 162 162 156
164 160 169 151 150 153 159 156
160 159 158 157 162 154 164 161
Q. こ ータ 特徴 ??
ータ 特徴 と ?
● 身長 個人個人 異
3m や 30cm い 数値 え い
⇒ タセ 中 数値 あ 広
分布 い
● タ 特徴 = 分布 特徴
⇒ 特徴 え方 方法 あ :
ータ 特徴を捉え 方法
(1) ラ 描くこ
分布全体 あ まま 捉え
⇒ 可視化 (Visualize)
(2) 代表的 数字 統計量
特徴 あ わ
⇒ 縮約 (要約)
( 参考): ータ 縮約
● ータ 並 い く 数字
何 基準 整理整頓 足 合わ
意味 あ 情報
け 抽出 こ
● 統計量 ータ 縮約 数値
( 例: 平均値
(1) グラフ化 特徴抽出
• ラ ?: 二次元的 数値
1 2 3 4 5 6 7
0 10 20 30 40 50 60
1 2 3 4 5 6 7
0 10 20 30 40 50 60
1 2 3 4 5 6 7
Q. うや 二次元 プロッ ?
例 : 身長 ータ (80人分):
151 154 158 162 154 164 146 151
154 152 151 167 162 168 166 156
160 161 155 159 156 150 161 166
160 160 155 153 162 155 143 159
163 160 165 146 157 157 156 157
156 153 165 156 162 161 156 156
158 155 154 160 162 168 149 159
156 163 148 151 169 162 162 156
164 160 169 151 150 153 159 156
160 159 158 157 162 154 164 161
⇒ 下 し え 必要
⇒⇒ ま 表を作成
グラム 下 し え 6 ップ
ップ1 タ 中 最 大 数値 最大値
最 小さ 数値 最小値 見 け
ップ2
(1) 最大値 最小値 近い
区切 いい数値 定
(2) 数値 間 5 個 程度
小範囲 小区間 区切 階級
ップ1. 最大値 最小値を見 け
例 : 身長 タ (80人分):
151 154 158 162 154 164 146 151
154 152 151 167 162 168 166 156
160 161 155 159 156 150 161 166
160 160 155 153 162 155 143 159
163 160 165 146 157 157 156 157
156 153 165 156 162 161 156 156
158 155 154 160 162 168 149 159
156 163 148 151 169 162 162 156
164 160 169 151 150 153 159 156
160 159 158 157 162 154 164 161
ップ1.
(1) 最大値 最小値 い 区切 良
い数値を見 け
• 最大値 169 ⇒ 170
• 最小値 143 ⇒ 141
(2) 数値 間 程度
小範囲 小区間 区切 階級
141 ~ 145
146 ~ 150
……
166 ~ 170
グラム 下 し え 6 ップ
ップ3 各階級 代表 数値 決
一般 階級 真 中 数値
選ぶこ 多い 階級値
ップ4 各階級 含 タ 数
数え
度数
ップ3 各階級を 代表する 数値を決める。
( 階級値)
ップ4 各階級 含ま ータ 数
数え 度数
階級 141 ~ 145 ⇒ 階級値 143
階級 146 ~ 150 ⇒ 階級値 148
……
階級 166 ~ 170 ⇒ 階級値 168
● ータ 並 替え 数え い
階級 141 ~ 145 ⇒ 度数
階級 146 ~ 150 ⇒ 度数
……
階級 166 ~ 170 ⇒ 度数
並び替えた ータ
143 151 154 156 158 160 162 164
146 151 155 156 158 160 162 165
146 152 155 156 159 160 162 165
148 153 155 156 159 160 162 166
149 153 155 156 159 161 162 166
150 153 156 157 159 161 162 167
150 154 156 157 159 161 163 168
151 154 156 157 160 161 163 168
151 154 156 157 160 162 164 169
151 154 156 158 160 162 164 169
グラム 下 し え 6 ップ
ップ5 階級 度数 い
全体 中 占 比率 セン 計算
こ 相対度数 呼ぶ
⇒ べ 階級 相対度数 足 1
ップ6 階級 い 階級 度
数 べ 合計 こ 累積度数 呼ぶ
⇒ 最後 階級 累積度数 全 タ数
ップ5 各階級 度数 全体 中 占め
比率を計算 相対度数
141 ~ 145 ⇒ 度数 1÷ 80 = 0.0125 (1.3%)
146 ~ 150 ⇒ 度数 ÷ 80 = 0.075 (7.5%)
151 ~ 155 ⇒ 度数 18 ÷ 80 = 0.225 (22.5%)
156 ~ 160 ⇒ 度数 29 ÷ 80 = 0.3625 (36.3%)
161 ~ 165 ⇒ 度数 19 ÷ 80 = 0.2375 (23.8%)
166 ~ 170 ⇒ 度数 ÷ 80 = 0.0875 (8.8%)
● 上 順 計算 い
■ 累積度数 = 前 階級 累積度数 +
そ 階級 度数
ップ6 階級 い ま 階級
度数を べ 合計 を 累積度数 呼ぶ
141 ~ 145 ⇒ 度数 1 累積度数 1
146 ~ 150 ⇒ 度数 累積度数 7
151 ~ 155 ⇒ 度数 18 累積度数 25
156 ~ 160 ⇒ 度数 29 累積度数 54
161 ~ 165 ⇒ 度数 19 累積度数 73
166 ~ 170 ⇒ 度数 累積度数 80
度数分布表 ップ ~6 表
階級 中央値 度数 相対度数 累積度数
141 ~ 145 143 1 1% 1
146 ~ 150 148 6 8% 7
151 ~ 155 153 18 23% 25
156 ~ 160 158 29 36% 54
161 ~ 165 163 19 24% 73
166 ~ 170 168 7 9% 80
グラム 度数分布表 グラフ
0 5 10 15 20 25 30
141 ~ 145
146 ~ 150
151 ~ 155
156 ~ 160
161 ~ 165
166 ~ 170
■ こ ータ 特徴 ?
特徴 1 :
■ 身長 階級 同 う 度数
一様 分布 い い
■ あ 階級 156 〜160 タ 集中
あ
特徴 2 :
■ 基点 眺 身長
低い方向 向 高い方向 向
同 う 傾向 度数 変化
■ 軸 左右対称 分布
ヒス グラムから読み解ける情報
(1) 数値 身長 も
実現 わけ い
(2) あ 身長 158cm 程度 近辺
ータ 集中 ー 存在
(3) ー 基点 左右対称 分布
身長 高く ほ あ い
低くく ほ 実現 くい
グラム PC 等 い 対応
● 手元 紙 い 茎葉図 使 い
例: タ (10個
1.67, 1.82, 1.75, 1.63, 1.72,
1.79, 1.84, 1.60, 1.73, 1.75
茎葉図:
茎
少数第1位まで葉
少数第2位1.6 0 3 7
1.7 2 3 5 5 9
1.8 2 4
他 基本統計量 ①
● 平均値: べ 数値 足 合わ
ータ数 割
● 中央値 ン : べ ータ 数値
順 べ え
う 中央 値
● 最頻値 ー : 度数 も も大 い
階級値 こ
要 ー 値
例題
例題 離散 ータ 個別 カウン
例題 度数分布表 累積度数分布表
例題 度数分布表 平均値を計算
例題 度数分布表 累積度数分布表
ン 2:
15 番目 値
16 番目 値 平均
最頻値( ー 0 :
F も も大 い
例題 グラム
0 1 2 3 4 5 6 7 8 9
0 1 2 3 4 5 6