• 検索結果がありません。

代表値

N/A
N/A
Protected

Academic year: 2021

シェア "代表値"

Copied!
25
0
0

読み込み中.... (全文を見る)

全文

(1)

代表値

統計基礎

の補足資料

2019年6月13日

金沢学院大学経営情報学部

藤本祥二

(2)

量的データの分析(P.78~119)

• 分布全体の様子を知るのが目的(P.99のまとめ)

1.単峰性,2.ピークの位置と散らばり具合,

3.左右対称性,4.外れ値の存在

• 度数分布,ヒストグラムを描き形状を見る

(P.78~P.91)

• 数値で分布を要約する(P.99~P.117)

基本統計量:分布の特徴を表す数値

◦ 代表値:分布の中心を表す数値

例)平均値,中央値,最頻値

◦ 散布度:分布のばらつき具合を表す数値

例)範囲(レンジ),四分位範囲,分散,標準偏差

前回 今回 次回

(3)

§3.3(教科書P.99)

(4)

代表値

• 分布の中心を表す基本統計量

• 何をもって中心と考えるかで何種類かある

• 次の3つ(スリーM)は必須

◦ 平均値(mean)

▪ 算術平均(相加平均,arithmetic mean, average)

▪ 幾何平均(相乗平均,geometric mean)

▪ 調和平均(harmonic mean)

▪ 加重平均(weighted mean)

◦ 中央値(median)

◦ 最頻値(mode)

(5)

文字記号について

• 数値の代わりに文字記号を使うと便利

◦ 文字記号は「数値が入る入れ物」と考えれば良い

◦ 数学ではラテンアルファベット(𝑎, 𝑏, 𝑐, ⋯)やギリ

シャアルファベット(

𝛼, 𝛽, 𝛾, ⋯)の1文字を使う

(プログラミング等では1文字ではなく2文字以上

の文字列にしたものを変数として使うことも多い)

◦ 文字式の変形は数の基本法則(結合則・交換則・

分配則・等々)に従ってさえいれば自由にできる

数の基本法則を破るような文字式の変形はダメ

(分配法則,符号,ゼロ除算,等で失敗しやすい)

(6)

どの文字を使うか(慣習)

𝑥, 𝑦, 𝑧などのアルファベットの後ろの方の文字

中身の値が変わる数(変数という)や,中身の値が定まって

いない数(未知数という)を表す場合に用いることが多い

𝑎, 𝑏, 𝑐などのアルファベットの前の方の文字

中身の値が定まってる数(定数,既知数)を表す場合に用い

ることが多い

• 英単語のイニシャル

速度(velocity) には文字記号𝑣を,加速度(acceleration)に

は文字記号

𝑎を使う,というように,文字記号が何を表してい

るか意味が推測できる文字を使うことも多々ある

(7)

添え字について

𝑖, 𝑗, 𝑘, 𝑙, 𝑚, 𝑛の文字記号

整数(integer),自然数(natural number)のような飛び

飛びの値を表す場合に用いることが多い

• 添え字(index)

似通った性質の沢山の文字記号を扱う場合に便利

𝑥, 𝑦, 𝑧, 𝑠, 𝑡, 𝑢, 𝑣, 𝑤, ⋯

𝑥

1

, 𝑥

2

, 𝑥

3

, 𝑥

4

, 𝑥

5

, 𝑥

6

, 𝑥

7

, 𝑥

8

, ⋯

• 添え字を自然数や整数の変数で表すことも多い

𝑥

𝑖

, 𝑥

𝑗

,

文字が足りない 添え字で解決 𝑖 や 𝑗 には1,2,3,等の 自然数が入る 𝑥1や𝑥2 は何らかの数値が入ってる文字記号と考えれば良い

(8)

平均値(算術平均)

𝑛個のデータ 𝑥

1

, 𝑥

2

, ⋯ , 𝑥

𝑛

の平均を,記号

ҧ𝑥 で

表現する

(本によっては,

𝑚や𝜇の記号で平均を表してる)

ҧ𝑥 =

1

𝑛

𝑥

1

+ 𝑥

2

+ ⋯ + 𝑥

𝑛

• 和の記号Σを用いた書き方

ҧ𝑥 =

1

𝑛

𝑖=1

𝑛

𝑥

𝑖

合計を データ数𝑛で 等分する エックス・バー(bar) 和の記号Σは後期にやる予定だが 興味のある人は補足スライド 「和の記号Σの復習」をチェック

(9)

平均のイメージ1

• 平らに均すイメージ

例)

𝑛 = 4, 𝑥

1

= 5, 𝑥

2

= 2, 𝑥

3

= 8, 𝑥

4

= 9

ҧ𝑥 = 1 4 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 = 1 4 5 + 2 + 8 + 9 = 24 4 = 6 5 2 8 9

0

6

0

6

バラバラな 4個のデータは 平らに均すと 6が4個 なら

(10)

平均のイメージ2

• 数直線で見ると,平均値の左右で釣り合う

例)

𝑛 = 4, 𝑥

1

= 5, 𝑥

2

= 2, 𝑥

3

= 8, 𝑥

4

= 9

ҧ𝑥 = 1 4 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 = 1 4 5 + 2 + 7 + 9 = 24 4 = 6

0

𝑥

2

2

𝑥

5

1

ҧ𝑥

𝑥

8

3

𝑥

9

4

6

実際に𝑥1, 𝑥2, 𝑥3, 𝑥4の位置に同じ重さの重りを置いて, ҧ𝑥の位置を支点にすると, 釣り合いが取れる.この理由はてこの原理によって分かる 重心のイメージの方が加重平均に応用が利く 「平均」は左右の重さの釣り合いが取れる「重心の位置」に相当

(11)

トルク(てこの原理の準備)

• 軸の周りに物を回転させる作用をトルクという

(「トルク」は別名「力のモーメント」ともいう)

• トルクは支点からの距離𝑑[m

(メートル)

]と回転半径

に垂直にかかる力

𝐹[N

(ニュートン)

]の積(掛け算)で

表される.

回転軸

𝐹

距離

𝑑

時計回りに

回転させよう

とするトルク

𝑑 × 𝐹

自転車を漕ぐときの力の入れ方をイメージしてみよう

(12)

トルクと釣り合い

• 時計回りに回転させようとする

右側のトルク

反時計回りに回転させようとする

左側のトルク

が同じ大きさならば,回転せずに釣り合う

𝐹

3𝐹

距離

𝑑

距離

3𝑑

回転軸

時計回りに

回転させよう

とするトルク

3𝑑 × 𝐹 = 3𝑑𝐹

反時計回りに

回転させよう

とするトルク

𝑑 × 3𝐹 = 3𝑑𝐹

(13)

梃(てこ, laver)の原理

• (質量)×(重力加速度𝑔)が重力による力

𝑚𝑔

3𝑚𝑔

距離

𝑑

距離

3𝑑

支点

時計回りに

回転させよう

とするトルク

3𝑑𝑚𝑔

反時計回りに

回転させよう

とするトルク

3𝑑𝑚𝑔

質量

3𝑚

𝑚

力点

作用点

3倍の重さの物でも

支点から3倍離れた所に力を入れれば

1/3の力で持ち上げることができる

(14)

同じ重さの重りの釣り合い

• 支点からの

±の向きを持った距離の合計が0

になれば釣り合う

0

𝑥

2

2

𝑥

5

1

ҧ𝑥

𝑥

8

3

𝑥

9

4

6

𝑑

1

𝑑

2

𝑑

3

𝑑

4

𝑑

1

= 𝑥

1

− ҧ𝑥 = 5 − 6 = −1

𝑑

2

= 𝑥

2

− ҧ𝑥 = 2 − 6 = −4

𝑑

3

= 𝑥

3

− ҧ𝑥 = 8 − 6 = 2

𝑑

4

= 𝑥

4

− ҧ𝑥 = 9 − 6 = 3

𝑑

1

+ 𝑑

2

+ 𝑑

3

+ 𝑑

4

= 0

𝑑

𝑖

の合計

0は釣り合いを意味する

重りの質量

𝑚とする

左側のトルクの合計:

−𝑑

1

𝑚𝑔 − 𝑑

2

𝑚𝑔 = 5𝑚𝑔

右側のトルクの合計:

𝑑

3

𝑚𝑔 + 𝑑

4

𝑚𝑔 = 5𝑚𝑔

(15)

どんなデータでも平均は必ず釣り合い

の位置になる

𝑛 = 4のとき

ҧ𝑥 =

1

4

𝑥

1

+ 𝑥

2

+ 𝑥

3

+ 𝑥

4

• データと平均の差

𝑑

𝑖

= 𝑥

𝑖

− ҧ𝑥 を偏差という

𝑥

𝑖

にどのような数値データが入っていたとしても,

偏差の合計は必ず0

𝑑

1

+ 𝑑

2

+ 𝑑

3

+ 𝑑

4

= 𝑥

1

− ҧ𝑥 + 𝑥

2

− ҧ𝑥 + 𝑥

3

− ҧ𝑥 + 𝑥

4

− ҧ𝑥

= 𝑥

1

+ 𝑥

2

+ 𝑥

3

+ 𝑥

4

− 4 ҧ𝑥

= 4 ҧ𝑥 − 4 ҧ𝑥 = 0

足し算の順番変える 両辺4倍すると 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 = 4 ҧ𝑥

𝑑

𝑖

の合計が0になる事が平均が釣り合いの位置であることを意味する

(16)

平均と釣り合い(一般の場合)

• 一般の𝑛の時

ҧ𝑥 =

1

𝑛

𝑖=1

𝑛

𝑥

𝑖

• 偏差𝑑

𝑖

の合計は必ず0になる

𝑖=1

𝑛

𝑑

𝑖

= ෍

𝑖=1

𝑛

𝑥

𝑖

− ҧ𝑥 = ෍

𝑖=1

𝑛

𝑥

𝑖

− ҧ𝑥 ෍

𝑖=1

𝑛

1

= 𝑛 ҧ𝑥 − ҧ𝑥𝑛 = 0

両辺𝑛倍すると ෍ 𝑖=1 𝑛 𝑥𝑖 = 𝑛 ҧ𝑥 ෍ 𝑖=1 𝑛 1 = 𝑛 和の記号Σの公式 和の記号Σの公式は後期にやる予定だが 興味のある人は補足スライド「和の記号Σの復習」をチェック

(17)

中央値

𝑛個の大きさ順に並べ替えたデータを

𝑥

1

, 𝑥

2

, ⋯ , 𝑥

𝑛

で表し、中央値を

෤𝑥で表す

• データの順番(個数)で見た時の、真ん中の

位置が中央値に対応する

(相対累積度数で50%の位置と考えてもよい)

• データ数が奇数の場合と偶数の場合で求め

方が違う

エックス・チルダ(tilde)

(18)

中央値(奇数個データ)

• データ数𝑛 = 5の時

• データ数𝑛 = 7の時

𝑥

1

𝑥

2

𝑥

3

𝑥

4

𝑥

5

中央値

෤𝑥 = 𝑥

3

2個

2個

𝑥

1

𝑥

2

𝑥

3

𝑥

4

𝑥

5

中央値

෤𝑥 = 𝑥

4

3個

3個

𝑥

6

𝑥

7

データ数

𝑛個の時は

𝑛+1 2

番目のデータの値が中央値

(19)

中央値(偶数個データ)

• データ数𝑛 = 4の時

• データ数𝑛 = 6の時

𝑥

1

𝑥

2

𝑥

3

𝑥

4

中央値

෤𝑥 = 𝑥

2

+ 𝑥

3

/2

2個

2個

𝑥

1

𝑥

2

𝑥

3

𝑥

4

中央値

෤𝑥 = 𝑥

3

+ 𝑥

4

/2

3個

3個

𝑥

5

𝑥

6

データ数

𝑛個の時は

𝑛 2

番目のデータの値と

𝑛 2

+ 1番目のデータの値の

真ん中の値が中央値

(20)

平均値と中央値の比較

• 平均値は数値のバランス

• 中央値は個数(又は割合)のバランス

• 平均値は外れ値の影響を受けやすい

中央値

平均値

教科書図2.3.14 • 端の値が大きな外れ値だったとしても中央値は変わらないが平均値は変わる • 平均値と中央値が大きく違ってる時は注意が必要

(21)

最頻値

• 頻度が最も高いデータが最頻値(最も頻繁に出現す

るデータ)

• 例)𝑥

1

= 1, 𝑥

2

= 2, 𝑥

3

= 2, 𝑥

4

= 3, 𝑥

5

= 3,

𝑥

6

= 4, 𝑥

7

= 7, 𝑥

8

= 9, 𝑥

9

= 2

の9個のデータで,2は3回出現していて他のデータは

2回以下しか出現してないので最頻値は2である.

• 最頻値は1つに定まらずに2つ以上の複数の値にな

ることがある

1

2

3

4

7

9

最頻値

(22)

分布の歪(ひずみ)と代表値の関係

平中頻は殆ど同じ 頻<中<平 の順 平<中<頻 の順 教科書,図2.3.15 単峰性の場合 3つの代表値 ・平均値(平) ・中央値(中) ・最頻値(頻) で分布の歪が ある程度分かる

(23)

表2.3.8の平均

𝑖 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 𝑥𝑖 93 71 70 71 67 72 64 92 69 70 71 68 69 70 70 ҧ𝑥 = 1 15 𝑥1 + 𝑥2 + ⋯ + 𝑥15 = 1 15 93 + 71 + ⋯ + 70 = 1087 15 = 72.4 ሶ6 ≒ 72.5 𝑖 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 𝑥𝑖 68 90 64 67 69 68 70 68 89 67 68 67 68 12 15 20 ҧ𝑥 = 1 16 𝑥1 + 𝑥2 + ⋯ + 𝑥16 = 1 16 68 + 90 + ⋯ + 20 = 970 16 = 60.625 ≒ 60.6 月前半のデータ 月後半のデータ

(24)

表2.3.8の中央値

𝑖 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 𝑥𝑖 64 67 68 69 69 70 70 70 70 71 71 71 72 92 93 データ数は𝑛 = 15で奇数,𝑛+1 2 = 8なので8番目のデータが中央値. 𝑖 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 𝑥𝑖 12 15 20 64 67 67 67 68 68 68 68 68 69 70 89 90 月前半のデータを大きさ順に並べ替えたもの 月後半のデータを大きさ順に並べ替えたもの データ数は𝑛 = 16で偶数,𝑛 2 = 8なので8番目と9番目の中間が中央値. ෤𝑥 = 𝑥8 = 70 ෤𝑥 = 𝑥8 + 𝑥9 2 = 68 + 68 2 = 68

(25)

表2.3.8の最頻値

𝑖 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 𝑥𝑖 64 67 68 69 69 70 70 70 70 71 71 71 72 92 93 𝑖 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 𝑥𝑖 12 15 20 64 67 67 67 68 68 68 68 68 69 70 89 90 月前半のデータを大きさ順に並べ替えたもの 月後半のデータを大きさ順に並べ替えたもの 最頻値は70 最頻値は68 頻度 1 1 1 2 4 3 1 1 1 頻度 1 1 1 1 3 5 1 1 1 1

表 2.3.8 の平均
表 2.3.8 の中央値
表 2.3.8 の最頻値

参照

関連したドキュメント

5月18日, 本学と協定を結んでいる蘇州大学 (中国) の創 立100周年記念式典が行われ, 同大学からの招待により,本

 21世紀に推進すべき重要な研究教育を行う横断的組織「フ

学位の種類 学位記番号 学位授与の日付 学位授与の要件 学位授与の題目

学位授与番号 学位授与年月日 氏名 学位論文題目. 医博甲第1367号

学位授与番号 学位授与年月日 氏名

 5月15日,「泌尿器疾患治療薬(尿もれ,頻尿)の正しい

1991 年 10 月  桃山学院大学経営学部専任講師 1997 年  4 月  桃山学院大学経営学部助教授 2003 年  4 月  桃山学院大学経営学部教授(〜現在) 2008 年  4

管理画面へのログイン ID について 管理画面のログイン ID について、 希望の ID がある場合は備考欄にご記載下さい。アルファベット小文字、 数字お よび記号 「_ (アンダーライン)