• 検索結果がありません。

データの位置を代表する値

N/A
N/A
Protected

Academic year: 2021

シェア "データの位置を代表する値"

Copied!
24
0
0

読み込み中.... (全文を見る)

全文

(1)

.

... データの位置を代表する値

樋口さぶろお

龍谷大学理工学部数理情報学科

使える統計

! L02(2013-10-02 Wed)

今日の目標

. ..

1

中央値

(median)

,

データ全体

,

度数分布表か

ら求められる

.

..

2

最頻値

(mode)

,

データ全体

,

度数分布表から

求められる

.

3 ..

平均値

(mean)

,

データ全体

,

度数分布表から

求められる

http://hig3.net

(2)

復習:データの分布 ヒストグラムと箱ひげ図の対応

ここまで来たよ

.

1 ..

復習

:

データの分布

ヒストグラムと箱ひげ図の対応

2 ...

データの位置を代表する値 中央値

中央値 最頻値 平均値

Excel

で代表値

and more

(3)

復習:データの分布 ヒストグラムと箱ひげ図の対応

箱ひげ図の描き方をもう一度ちょっと違う言葉で

(4)

復習:データの分布 ヒストグラムと箱ひげ図の対応

L01-Q5

Quiz

解答

:

ヒストグラムと箱ひげ図

.

1 .. Q2= (60 + 70)/2 = 65.

Q1

30 50 55 55 60

の中央値なので

55.

Q3

70 70 70 75 100

の中央値なので

70.

Q3 Q1 = 15. 15 × 1.5 = 22.5 (

これは描かない

).

55 22.5

以下や

, 75 + 22.5

以上の値は外れ値

.

0 20 40 60 80 100

V1

(5)

復習:データの分布 ヒストグラムと箱ひげ図の対応

.

2 ..

: (

以下か未満かで変わる

),

ヒストグラム

階級 度数 相対度数

30

以上

40

未満

1 0.1

40

以上

50

未満

3 0.3

50

以上

60

未満

1 0.1

60

以上

70

未満

4 0.4

70

以上

80

未満

0 0.0

80

以上

90

未満

0 0.0

90

以上

100

未満

0 0.0

100

以上

110

未満

1 0.1

合計

10 1.00

.

3 ..

Histogram of d

d

frequency

20 40 60 80 100 120

01234

(6)

復習:データの分布 ヒストグラムと箱ひげ図の対応

Q1

. Quiz(

ヒストグラムと箱ひげ図

) ..

...

このヒストグラムに対応する箱ひげ図はどれ

?

frequency

0 2 4 6 8 10

051015

0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10

(7)

復習:データの分布 ヒストグラムと箱ひげ図の対応

Q2

右に歪んだ分布

. Quiz(

ヒストグラムと箱ひげ図

) ..

...

このヒストグラムに対応する箱ひげ図はどれ

?

frequency

0 2 4 6 8 10

051015

0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10

(8)

復習:データの分布 ヒストグラムと箱ひげ図の対応

Q3

箱ひげ図のほうが情報が少ない

. Quiz(

ヒストグラムと箱ひげ図の対応

) ..

...

この箱ひげ図に対応するヒストグラムはどれ

?

0 2 4 6 8 10

Frequency

0 2 4 6 8 10

01234 Frequency

0 2 4 6 8 10

01234 Frequency

0 2 4 6 8 10

01234 Frequency

0 2 4 6 8 10

01234

(9)

データの位置を代表する値 中央値

ここまで来たよ

1 ...

復習

:

データの分布

ヒストグラムと箱ひげ図の対応

.

2 ..

データの位置を代表する値 中央値

中央値 最頻値 平均値

Excel

で代表値

and more

(10)

データの位置を代表する値 中央値

データを 1 個の値で代表させたい !

代表値

某国民的アイドル集団の身長はだいたい

150cm? 170cm 180cm?

判断のもとになる情報は

データ全体

(Quiz

の例

: 30 50 55 55 60 70 70 70 75 100)

度数分布表

(

某国民的アイドル集団の身長の例

)

ヒストグラム

のいずれかで与えられる

.

階級 度数

145

より大きく

150

以下

7 150

より大きく

155

以下

17 155

より大きく

160

以下

29 160

より大きく

165

以下

19 165

より大きく

170

以下

4 170

より大きく

175

以下

1

合計

77

Dataset$V1

frequency

145 150 155 160 165 170 175

051015202530

(11)

データの位置を代表する値 中央値

ここまで来たよ

1 ...

復習

:

データの分布

ヒストグラムと箱ひげ図の対応

.

2 ..

データの位置を代表する値 中央値

中央値 最頻値 平均値

Excel

で代表値

and more

(12)

データの位置を代表する値 中央値

中央値 (median)=Q2

データ全体からの中央値の求め方

(

復習

)

データ全体を小さい順に並べる

.

個数が奇数か偶数かに応じて 奇数個なら

,

真ん中の値

偶数個なら

,

真ん中の

2

個の和

/2

Quiz

の例

(30 50 55 55 60 70 70 70 75 100)

だと

65

(13)

データの位置を代表する値 中央値

度数分布表からの中央値の

(

だいたいの

)

求め方

端から度数を加えていって

,

データの総数の半分を超えた階級の階級値 階級値

=

階級の ( 上限値 + 下限値 )/2

階級 階級値 度数

145

より大きく

150

以下

147.5 7 150

より大きく

155

以下

17 155

より大きく

160

以下

29 160

より大きく

165

以下

19 165

より大きく

170

以下

4 170

より大きく

175

以下

1

合計

— 77

中央値のヒストグラム的意味

frequency

145 150 155 160 165 170 175

051015202530

自分の言葉でどうぞ

樋口さぶろお

(数理情報学科) L02

データの位置を代表する値 使える統計!(2013)

13 / 24

(14)

データの位置を代表する値 最頻値

ここまで来たよ

1 ...

復習

:

データの分布

ヒストグラムと箱ひげ図の対応

.

2 ..

データの位置を代表する値 中央値

中央値 最頻値 平均値

Excel

で代表値

and more

(15)

データの位置を代表する値 最頻値

最頻値 =mode

データ全体からの最頻値の求め方

離散的な

データのとき いちばん多く繰り返し現れる値

Quiz

の例

(30 50 55 55 60 70 70 70 75 100)

だと

70

連続的な

データのとき 度数分布表で考えろ 度数分布表からの

最頻値

(

だいたいの

)

求め方 いちばん度数が大きい階級の階級値

階級 度数

145

より大きく

150

以下

7 150

より大きく

155

以下

17 155

より大きく

160

以下

29 160

より大きく

165

以下

19 165

より大きく

170

以下

4 170

より大きく

175

以下

1

合計

77

(16)

データの位置を代表する値 最頻値

最頻値のヒストグラム的意味

Dataset$V1

frequency

145 150 155 160 165 170 175

051015202530

自分の言葉でどうぞ

(17)

データの位置を代表する値 平均値

ここまで来たよ

1 ...

復習

:

データの分布

ヒストグラムと箱ひげ図の対応

.

2 ..

データの位置を代表する値 中央値

中央値 最頻値 平均値

Excel

で代表値

and more

(18)

データの位置を代表する値 平均値

平均値 =mean

代表値のなかでいちばんメジャー

?

データ全体からの平均値の求め方 データのすべての値を加えて個数で割る

Quiz

の例

(30 50 55 55 60 70 70 70 75 100)

だと

63.5

度数分布表からの平均値の

(

だいたいの

)

求め方 階級値

×

度数 をすべて加えて

,

データの総数で割る

.

階級 階級値 度数 階級値

×

度数

145

より大きく

150

以下

7 1032.5 150

より大きく

155

以下

17 2592.5 155

より大きく

160

以下

29 4567.5 160

より大きく

165

以下

19 3087.5 165

より大きく

170

以下

4 670.0 170

より大きく

175

以下

1 172.5

合計

77 12507.5

平均値

=12122.5/77 = 155.4 · · · .

(19)

データの位置を代表する値 平均値

平均値のヒストグラム的意味

Dataset$V1

frequency

145 150 155 160 165 170 175

051015202530

重心 . あとは自分の言葉で

(20)

データの位置を代表する値 平均値

. Quiz(平均値中央値最頻値) ..

...

次のヒストグラムから求めよう

. .

..

1

中央値

.

2 ..

最頻値

. ..

3

平均値

Dataset$V1

frequency

10 15 20 25

0.00.51.01.52.02.53.0

樋口さぶろお

(数理情報学科) L02

データの位置を代表する値 使える統計!(2013)

20 / 24

(21)

データの位置を代表する値

Excel

で代表値

and more

ここまで来たよ

1 ...

復習

:

データの分布

ヒストグラムと箱ひげ図の対応

.

2 ..

データの位置を代表する値 中央値

中央値 最頻値 平均値

Excel

で代表値

and more

(22)

データの位置を代表する値

Excel

で代表値

and more

Excel で代表値 ( 中央値 , 最頻値 , 平均値 ), 度数分布表 , ヒストグラム

スタートボタン

>Excel 2007

オフィスボタン

> Excel

のオプション

>

アドイン

>

管理

> Excel

のアドイン

>

設定 で分析ツールにチェックを入れる

.

データ

>

分析

>

データ分析 の基本統計量

,

ヒストグラム を使う

.

データや階級の境目の値を入力したセル範囲を指定する

.

関数

avarage(

平均値

), median(

中央値

), mode(

最頻値

)

も使える

. e

ラーニングシステム

Moodle

https://moodle.media.ryukoku.ac.jp/

Excel

入門コース

https:

//moodle.media.ryukoku.ac.jp/course/view.php?id=950

情報リテラシー講座

http:

//www.seta.media.ryukoku.ac.jp/literacy/literacy.html

(23)

データの位置を代表する値

Excel

で代表値

and more

. Quiz ..

...

e

ラーニングシステム

https://moodle.media.ryukoku.ac.jp/

,

ウンロードできるデータから

Excel

で平均値を求めてみよう

.

度数分布表 とヒストグラムを作ってみよう

.

課題としてファイルを提出

. Quiz ..

...

e

ラーニングシステム

https://moodle.media.ryukoku.ac.jp/

にある

Quiz L02

をやろう

.

.

課題

(

任意

) ..

...

e

ラーニングシステムのリメディアルコース統計学

https://moodle.media.ryukoku.ac.jp/course/view.php?id=1140

テキスト

1-1, 4-3,

修了テスト第

4

章をやろう

.

(24)

データの位置を代表する値

Excel

で代表値

and more

連絡

今週は授業内で紙を提出はありません

e

ラーニングシステムでファイルを提出

+ Quiz

に回答 今回は必須の

宿題

はありません

.

来週は分散と標準偏差やります

.

余裕ある人は

e

ラーニングシステ

https://moodle.media.ryukoku.ac.jp/ >

リメディアル統計 学

>

標準偏差で予習しておこう

.

加減乗除と平方根

(

ルート

)

の使える電卓持ってきてね

.

関数電卓で なくてもいいです

.

携帯電話の機能・アプリでもかまいません

.

来週は普通教室です

.

掲示やメールに注意

.

参照

関連したドキュメント

直流電圧に重畳した交流電圧では、交流電圧のみの実効値を測定する ACV-Ach ファンクショ

浮遊粒子状物質の将来濃度(年平均値)を日平均値(2%除外値)に変換した値は 0.061mg/m 3 であり、環境基準値(0.10mg/m

[r]

(1) 建屋海側に位置するサブドレンのポンプ停止バックアップ位置(LL 値)は,建屋滞留 水水位の管理上限目標値 T.P.2,064mm ※1

古安田層 ・炉心孔の PS 検層結果に基づく平均値 西山層 ・炉心孔の PS 検層結果に基づく平均値 椎谷層 ・炉心孔の

また、 NO 2 の環境基準は、 「1時間値の1 日平均値が 0.04ppm から 0.06ppm までの ゾーン内又はそれ以下であること。」です

(注)本報告書に掲載している数値は端数を四捨五入しているため、表中の数値の合計が表に示されている合計

 本資料作成データは、 平成24年上半期の輸出「確報値」、輸入「9桁速報値」を使用