• 検索結果がありません。

データの分布

N/A
N/A
Protected

Academic year: 2021

シェア "データの分布"

Copied!
23
0
0

読み込み中.... (全文を見る)

全文

(1)

.

... データの分布

樋口さぶろお

龍谷大学理工学部数理情報学科

使える統計

! L01(2013-09-25 Wed)

今日の目標

.

..

1 1

変数の量的データから箱ひげ図が描ける

.

..

2 1

変数の量的データから度数分布表が作れる

.

3 .. 1

変数の量的データからヒストグラムが描ける

http://hig3.net

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

1 / 23

(2)

はじめに

この授業ののり

本名

生活の中の統計技術

知るというより

,

できることが目標の科目です

.

成績計算

面倒な科目かも…科目の成績

100

ピーナッツは

20

ピーナッツ

/14

回授業での活動

.

演習

,

携帯で投稿

,

自宅で予習復 習

,

など毎回内容は違うので

,

先週と違う

,

ってのは言いっこなしで

.

ただし配点の大きいことをやるときは十分事前に言います

.

30

ピーナッツ

:

プチテスト

(

予定日

2013-11-13)

50

ピーナッツ

:

ファイナルトライアル

(

予定日

2014-01-29)

現在の点数は

e

ラーニングサイトで見られるようになる予定

.

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

2 / 23

(3)

はじめに

欠席届

授業のようなミーティングに欠席するときは事前に連絡

,

が世の中的常識 ですが

,

この授業に関しては

,

自分で情報を取得して復習して補うことを 前提に

,

欠席の事前連絡は不要です

.

何回欠席しても期末試験受験資格を 失うことはありません

.

ピーナッツ的に考慮されたい場合は

,

専用用紙に事情を説明する書類を 貼って

,

授業前後各

5

分に提出

(

事前事後とも可

.

ファイナルトライアル が締切

).

授業のページ

http://hig3.net > (

左コラム

)

樋口の授業

>

生活の中の統計技術

. e

ラーニングシステムにもページがあります

.

オフィスアワー

予約なしで科目について質問相談会話できる時間です

.

火昼

(1

号館

5

1-502),

6(1

号館

5

1-539).

月金昼も在室時は訪問歓迎

.

お弁当可

.

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

3 / 23

(4)

データの分布 データとは?

ここまで来たよ

1 ...

はじめに

.

2 ..

データの分布 データとは

?

箱ひげ図 度数分布表 ヒストグラム

ヒストグラムと箱ひげ図の対応

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

4 / 23

(5)

データの分布 データとは?

1 変数の量的データ

某アイドル集団

(77

)+

某バレーボール選手

(1

)

の身長のデータ

. 148cm

148.5cm 149cm .. . 185cm

ps3id_raicho_1182

さん(最終更新日時

:2012/3/20

)投稿日:

2012/2/15 AKB48

 身長 まとめ(研究生は

12.5

期まで)

http://note.chiebukuro.yahoo.co.jp/detail/n32745

このコースの最後までいくと問えること

(

正確な表現ではありません

)

オーディションにおいて

,

身長は考慮されているか

?

チーム編成において

,

身長は考慮されているか

? .. .

自分の専攻分野に置きかえてみると

?

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

5 / 23

(6)

データの分布 データとは?

ストリップチャート

データを図解して直観的につかもう

!

150 160 170 180

V1

横軸

:

身長

(cm)

ドット

1

=

データ

1

.

ぴったり重なったら上に積み重ねていく

.

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

6 / 23

(7)

データの分布 箱ひげ図

ここまで来たよ

1 ...

はじめに

.

2 ..

データの分布 データとは

?

箱ひげ図 度数分布表 ヒストグラム

ヒストグラムと箱ひげ図の対応

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

7 / 23

(8)

データの分布 箱ひげ図

箱ひげ図 (Box Plot)

150 160 170 180

V1

横軸

:

身長

(cm)

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

8 / 23

(9)

データの分布 箱ひげ図

箱ひげ図の描き方

まず四分位数

(quartile)Q2,Q1,Q3

を求める

Q1

1

四分位数 下から数えて全体の

1/4

のデータ

Q2

2

四分位数 下から数えて全体の

2/4

のデータ

=

中央値

Q3

3

四分位数 下から数えて全体の

3/4

のデータ

. ..

1

データを小さい順に並べる

. .

..

2 Q2

を求める

.

データが奇数個なら真ん中の値

.

データが偶数個な ら

真ん中 2 個の和を 2 で割ったもの

. .

..

3 Q1

を求める

. Q2

より小さいデータの中央値

.

..

4 Q2

を求める

. Q2

より大きいデータの中央値

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

9 / 23

(10)

データの分布 箱ひげ図

四分位範囲

(interquartile range)

Q3 Q1

外れ値 (outlier)

▶ Q1

から下に

,

四分位範囲の

1.5

倍以上離れたデータ

▶ Q3

から上に

,

四分位範囲の

1.5

倍以上離れたデータ

手順

Q1,Q2,Q3

を求める

Q2

に縦線をいれる

Q1

から

Q3

まで箱を描く

外れ値を除いた最大値

,

最小値までひげを描く 外れ値を

で描く

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

10 / 23

(11)

データの分布 箱ひげ図

Q1

. Quiz( ヒストグラムと箱ひげ図を描こう ) ..

...

次のデータから作ろう

. .

1 ..

箱ひげ図

. ..

2

度数分布表

.

..

3

ヒストグラム

14 14 15 16 18 18 18 25

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

11 / 23

(12)

データの分布 箱ひげ図

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

12 / 23

(13)

データの分布 度数分布表

ここまで来たよ

1 ...

はじめに

.

2 ..

データの分布 データとは

?

箱ひげ図 度数分布表 ヒストグラム

ヒストグラムと箱ひげ図の対応

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

13 / 23

(14)

データの分布 度数分布表

度数分布表の作り方 n=

データの個数

階級

=

一定間隔で区切った区間 階級値

=

その階級のまん中の値

階級の個数

=1 + log 2 n = 1 + 3.3× (

データの個数の桁数

)

くらいに とる

.

最大値と最小値の差 を

,

この個数くらいにわける

.

きりのよい階級 幅

(1

とか

5

とか

10

とか

)

に調節してよい

度数

=

その範囲に入ってるデータの個数

相対度数

=

度数

/

データ全体の個数

(%

で書くことも

)

階級 度数 相対度数

145

より大きく

150

以下

7 0.09 150

より大きく

155

以下

17 0.22 155

より大きく

160

以下

29 0.37 160

より大きく

165

以下

19 0.24 165

より大きく

170

以下

4 0.05 170

より大きく

175

以下

1 0.01 175

より大きく

180

以下

0 0.00 180

より大きく

185

以下

1 0.01 185

より大きく

190

以下

0 0.00

合計

78 1.00

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

14 / 23

(15)

データの分布 度数分布表

見にくかったら外れ値は除いてもいい 階級の幅は一定で

自分の言葉でどうぞ

以下,以上, 未満=より小さい,より大きい

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

15 / 23

(16)

データの分布 ヒストグラム

ここまで来たよ

1 ...

はじめに

.

2 ..

データの分布 データとは

?

箱ひげ図 度数分布表 ヒストグラム

ヒストグラムと箱ひげ図の対応

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

16 / 23

(17)

データの分布 ヒストグラム

ヒストグラム

Dataset$V1

frequency

150 160 170 180

051015202530

度数分布表を棒グラフにしたもの

階級の個数

:

見やすければそれが正義

階級の幅=超大きい

長方形

1

階級の幅=超小さい

ストリップチャート

階級の取り方で印象はずいぶん変わっちゃう…

ヒストグラムのほうが箱ひげ図より多くの情報を持っていることが 多い

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

17 / 23

(18)

データの分布 ヒストグラムと箱ひげ図の対応

ここまで来たよ

1 ...

はじめに

.

2 ..

データの分布 データとは

?

箱ひげ図 度数分布表 ヒストグラム

ヒストグラムと箱ひげ図の対応

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

18 / 23

(19)

データの分布 ヒストグラムと箱ひげ図の対応

Q2

. Quiz( ヒストグラムと箱ひげ図 ) ..

...

このヒストグラムに対応する箱ひげ図はどれ

?

frequency

0 2 4 6 8 10

051015

0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

19 / 23

(20)

データの分布 ヒストグラムと箱ひげ図の対応

Q3

. Quiz( ヒストグラムと箱ひげ図 ) ..

...

このヒストグラムに対応する箱ひげ図はどれ

?

frequency

0 2 4 6 8 10

051015

0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10

右に歪んだ分布

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

20 / 23

(21)

データの分布 ヒストグラムと箱ひげ図の対応

Q4

. Quiz( ヒストグラムと箱ひげ図の対応 ) ..

...

この箱ひげ図に対応するヒストグラムはどれ

?

0 2 4 6 8 10

Frequency

0 2 4 6 8 10

01234 Frequency

0 2 4 6 8 10

01234 Frequency

0 2 4 6 8 10

01234 Frequency

0 2 4 6 8 10

01234

箱ひげ図のほうが情報が少ない

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

21 / 23

(22)

データの分布 ヒストグラムと箱ひげ図の対応

Q5

. Quiz( ヒストグラムと箱ひげ図 ) ..

...

次のデータから作ろう

.

1 ..

箱ひげ図

. ..

2

度数分布表

(30

以上

40

未満

,

みたいな感じで

) .

..

3

ヒストグラム

30 50 55 55 60 70 70 70 75 100

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

22 / 23

(23)

データの分布 ヒストグラムと箱ひげ図の対応

連絡

来週

2013-10-02

3

は臨時教室変更

. 3-B105

計算機実習室

.

Windows

のパスワード思い出しておいてね

.

今週は授業内で紙を

1

枚提出 今回は必須の

宿題

はありません

.

来週は平均値

(

と分散

?)

やります

.

余裕ある人は

e

ラーニングシステ ム

https://moodle.media.ryukoku.ac.jp/ >

リメディアル統計 学

>

平均 で予習しておこう

.

来週からは

,

加減乗除と平方根

(

ルート

)

の使える電卓持ってきてね

.

関数電卓でなくてもいいです

.

携帯電話の機能・アプリでもかまい ません

.

学期初めなので急な教室変更があるかも

.

掲示やメールに注意

.

樋口さぶろお

(数理情報学科) L01

データの分布 使える統計!(2013)

23 / 23

参照

関連したドキュメント

『中学校学習指導要領(平成29年告示)解説数学編』では,第2学年の領域「Dデータ活用」の内容(1)デー

分布の様子を表したグラフを、ヒストグラム ヒストグラム ヒストグラム ヒストグラムという。... (C)2014 Prisola

Rcmdr グラフ 色パレット インデックスプロット ヒストグラム 幹葉表示 箱ひげ図 QQ プロット 散布図 散布図行列 折れ線グラフ

• 母平均と母分散で,合成された合成データの頻度 分布(ヒストグラム)は,合成データのサイズを

度数分布表5:ヒストグラムの作成 † ヒストグラム:

データの種類 データは大きく分けて2種類 • 質的データ(category

相対度数が 0.1 以上の階級は  7  個ある。さらに, このデータによる箱ひげ図は,. 次の箱ひげ図A~Eのうち 

母分布と標本分布, 期待値の計算 (相対)