• 検索結果がありません。

データの縮約値・代表値

N/A
N/A
Protected

Academic year: 2021

シェア "データの縮約値・代表値"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

データの縮約値・代表値

樋口さぶろお

龍谷大学理工学部数理情報学科

確率統計☆演習 I L02(2015-09-29 Thu)

最終更新: Time-stamp: ”2016-09-28 Wed 19:29 JST hig”

今日の目標

高校 数学 I 塚田確率統計 1.4

データから 手で平均値 , 離散データの最頻値 , ヒストグラムの最頻値が求められる

データから 手で中央値 , 四分位数が求められる

データから 手で箱ひげ図が描ける http://hig3.net

(2)

略解:データの分布

L01-Q1

Quiz 解答:度数分布表とヒストグラムを作ろう 階級 (歳) 度数

10 より大きい 15 以下 1 15 より大きい 20 以下 18 20 より大きい 25 以下 14 25 より大きい 30 以下 1 計 34

階級 (歳) 度数 12 より大きい 16 以下 2 16 より大きい 20 以下 17 20 より大きい 24 以下 13 24 より大きい 28 以下 2 計 34 このデータの場合はたまたま, 以上未満でも同じ.

AKB48の年齢分布

年齢(年)

度数

10 15 20 25 30

05101520

AKB48の年齢分布

年齢(年) 度数 05101520

12 16 20 24 28

たまたま形が似たけど, 階級の取り方でヒストグラムの形は変化する.

(3)

データの縮約値・代表値 中央値と四分位値

ここまで来たよ

1 略解 : データの分布

2 データの縮約値・代表値

中央値と四分位値

最頻値と平均値

箱ひげ図

(4)

データの縮約値・代表値 中央値と四分位値

縮約値・代表値 : データを 1 個の値で代表させたい ! 塚田確率統計 1.4

縮約値 = 代表値某国民的アイドル集団の身長はだいたい 150cm? 170cm?

データ全体 148 152 . . . 170

階級 (cm) 度数 f j

145 より大きく 150 以下 7 150 より大きく 155 以下 17 155 より大きく 160 以下 29 160 より大きく 165 以下 19 165 より大きく 170 以下 4 170 より大きく 175 以下 1

合計 77

身長の分布

身長(cm)

度数

145 150 155 160 165 170 175

0 5 10 15 20 25 30

(5)

データの縮約値・代表値 中央値と四分位値

中央値 (median) と四分位数 (quartile) データを小さい順に並び替えたものを ,

y 1 y 2 ≤ · · · ≤ y n とする . 例

データ (n = 11): 9 17 9 12 13 10 15 13 13 12 11 i 1 2 3 4 5 6 7 8 9 10 11 y i 9 9 10 11 12 12 13 13 13 15 17

i y 0 5 10 15

順にならべる i

y 0 5 10 15

(6)

データの縮約値・代表値 中央値と四分位値

四分位数のアバウトな定義 塚田確率統計 1.5.1

最小値 Q 0 = y 1 y 0 4 n

第 1 四分位数 Q 1 = y 1 4 n

第 2 四分位数 Q 2 = y 2

4 n = 中央値 塚田確率統計 1.4.1

第 3 四分位数 Q 3 = y 3

4 n

最大値 Q 4 = y 4

4 n

y 5 10 15

(7)

データの縮約値・代表値 中央値と四分位値

四分位数の正確な定義 高校 数学 I

Q 0 , Q 4 さっきのまま .

Q 2 =

 

  y 1

2 (n+1) =

真ん中の値

(n が奇 )

1 2 (y 1

2 n + y 1

2 n+1 ) =

真ん中 2 個の和 /2

(n が偶 ) Q 1 は , Q 2 の位置より前にあるデータ (Q 2 自身は除く ) の中央値 Q 2 Q 3 は , Q 2 の位置より後にあるデータ (Q 2 自身は除く ) の中央値 Q 2

Q 2 と同じ値のデータが複数あるときも 1 個だけ除く

ちょっと変えた例 : y 10 11 12 12 13 13 13 15 17

(8)

データの縮約値・代表値 中央値と四分位値

度数分布表からの中央値と四分位値の ( だいたいの ) 求め方 階級値 = 階級の ( 上限値 + 下限値 )/2

階級 (cm) 階級値 x (i) 度数 f i

145 より大きく 150 以下 147.5 7 150 より大きく 155 以下 17 155 より大きく 160 以下 29 160 より大きく 165 以下 19 165 より大きく 170 以下 4

合計 n — 77

自分の言葉でどうぞ

(9)

データの縮約値・代表値 中央値と四分位値

中央値・四分位値のヒストグラム的意味

身長の分布

身長(cm)

度数

145 150 155 160 165 170 175

0 5 10 15 20 25 30

自分の言葉でどう ぞ

i y 0 5 10 15

yの分布

y

度数

8.5 10.5 12.5 14.5 16.5

0 1 2 3 4 5

(10)

データの縮約値・代表値 中央値と四分位値

L02-Q1

Quiz(四分位値)

次のデータの四分位数 Q 1 , Q 2 , Q 3 を求めよう .

17 18 16 18 25 18 14 14 15

(11)

データの縮約値・代表値 最頻値と平均値

ここまで来たよ

1 略解 : データの分布

2 データの縮約値・代表値

中央値と四分位値

最頻値と平均値

箱ひげ図

(12)

データの縮約値・代表値 最頻値と平均値

最頻値 =mode 塚田確率統計 1.4.1

最頻値の定義

離散データの最頻値 : ‘ 離散的な ’ データのとき いちばん多く繰り返 し現れる値

ヒストグラムの最頻値 : ‘ 連続的または離散的な ’ データのとき 度数 分布表 / ヒストグラムで , 度数最大の階級の階級値

離散的な例 1(30 50 55 55 60 70 70 70 75 100) だと

70

ヒストグラムの最頻値の求め方

階級 (cm) 度数 f i

145 より大きく 150 以下 7 150 より大きく 155 以下 17 155 より大きく 160 以下 29 160 より大きく 165 以下 19 165 より大きく 170 以下 4 170 より大きく 175 以下 1

ヒストグラムの最頻値の意味

身長の分布

度数

145 150 155160 165 170175

051015202530

自分の言葉でどうぞ

(13)

データの縮約値・代表値 最頻値と平均値

平均値 =mean

平均値の定義 塚田確率統計 1.4.2

平均値 x = 1 n

n i=1

x i

x のかわりに m, m x などという記号もある . 例 1: 30 50 55 55 60 70 70 70 75 100 だと

63.5

平均値より中央値のいい点

自分の言葉で *0.4

(14)

データの縮約値・代表値 最頻値と平均値

度数分布表からの平均値の ( だいたいの ) 求め方 塚田確率統計 p.25

m 1 n

k i=1

x (i) f i

階級内の値はぜんぶ階級値に等しい , と近似しちゃう . 平均値のヒストグラム的意味

身長の分布

身長(cm)

度数

145 150 155 160 165 170 175

0 5 10 15 20 25 30

x G =

i m i x i

i m i で , m i = f i . 力学

重心 . あとは自分の言葉で *0.4

(15)

データの縮約値・代表値 最頻値と平均値

L02-Q2

Quiz(代表値) 次のデータを考える .

14cm, 14cm, 15cm, 16cm, 18cm, 18cm, 18cm, 25cm

1 四分位数 Q 1 , Q 2 , Q 3 を求めよう .

2 ( 離散データの ) 最頻値を求めよう

3 平均値を求めよう

(16)

データの縮約値・代表値 最頻値と平均値

L02-Q3

Quiz(平均値中央値最頻値) 次のヒストグラムから求めよう .

1 中央値

2 ( ヒストグラムの ) 最頻値

3 平均値

度数

9 11 13 15 17 19 21 23 25 27

0123

(17)

データの縮約値・代表値 箱ひげ図

ここまで来たよ

1 略解 : データの分布

2 データの縮約値・代表値

中央値と四分位値

最頻値と平均値

箱ひげ図

(18)

データの縮約値・代表値 箱ひげ図

箱ひげ図 (Box Plot) 塚田確率統計 p.20

150 155 160 165 170 某アイドル集団の身長の分布

身長(cm)

某アイドル集団

最 小 最 大 値 Q 0 , Q 4 , 四 分 位 点 Q 1 , Q 2 , Q 3

箱ひげ図を描く手順 高校 数学 I

Q 0 , Q 4 Q 1 ,Q 2 ,Q 3 と平均値 m を求める

Q 2 に縦線をいれる

Q 1 ,Q 3 を左右の端として箱を 描く

Q 0 ,Q 4 に短い縦線をいれ , 点線 のひげで箱とつなぐ

平均値に + 1 個描く

この他に「外れ値を○で描く」こと

もある

(19)

データの縮約値・代表値 箱ひげ図

L02-Q4

Quiz(四分位数と箱ひげ図)

下のチョコの重さのデータについて , 3 つの四分位数と平均値を求め箱ひ げ図を描こう .

7g 8g 10g 11g 12g 12g 12g 14g 15g

(20)

データの縮約値・代表値 箱ひげ図

連絡

次回は 7-002 講義室

配布資料は 1-503 向かいの引出 , http://hig3.net で再配布してい ます .

加減乗除と平方根 ( ルート ) の使える電卓持ってきてね . 関数電卓で なくてもいいです . 携帯電話の機能・アプリでもかまいません . Learn Math Moodle の予習復習問題で来週の trial に備えてね . 樋口オフィスアワー木 6 金昼 (1-502), Math ラウンジ月 - 木昼 (1-614)

https://manaba.

ryukoku.ac.jp

参照

関連したドキュメント

これ に必要な範 囲で確率論を学びます.. はじめに この授業どんなのり? 確率統計☆演習

そのか わり予習復習問題が Excel が必要なヘビーなものになる予定.. 加減乗除と平方根 (

▶ 像と核の紙レポート Learn Math

Learn Math Moodle で個人別問題を印刷して , 1–6 の全てのステップ を記入. Learn Math Moodle で個人別問題を印刷して , 1–6

週のタイムラインで見たように , 非参照 Quiz 予習問題を RaMMoodle に金 17:00 ごろまでに公開. これで来週の

配布資料は 1-503 向かいの引出 , http://hig3.net で再配布してい ます. Quiz の略解は授業終了後に

スカラー場の勾配

プチテストはそのうち返却 来週から quiz 再開. 大注意 : 予習復習問題の締切を