基礎統計学(第
3
回)
(参考)データの偏り
歪度と尖度 · · · データの分布の左右への歪み具合、分布の尖り具合を表す指標
歪度 1
n
n
i=1
xi−x
s(x)
3
尖度 1
n
n
i=1
xi−x
s(x)
4
歪度が正のとき、「分布は右に偏っている」といい、歪度が負のとき、「分布は左に偏っている」という。ま
た、歪度が0のとき、「分布は歪みがない」という。尖度については、尖度の値が大きいほど、「分布は尖って
いる」という。
(例)20人のクラスにおける統計学の試験の得点について、平均点(算術平均)と標準偏差、歪度、
尖度をそれぞれ求めよ。
60, 75, 100, 80, 95, 40, 50, 65, 70, 40 75, 90, 100, 85, 65, 60, 80, 90, 65, 95
算術平均 x= 1
20
20
i=1
xi= 74.0
標準偏差 s(x) =V (x) =
1 20 20 i=1
(xi−x)
2
= 18.0
歪 度 1
20
20
i=1
xi−x
s(x)
3
−0.313(分布は )
尖 度 1
20
20
i=1
xi−x
s(x)
4
2.17
1.4
標準化変量と偏差値(1)標準化変量 · · · 各データの平均値(算術平均)からの差を標準偏差を基準として表した値
標準化変量 zi=
xi−x
s(x)
標準化変量はxi=xのときz = 0である。
(例)英語と数学の試験で、ある生徒がそれぞれ76点、57点という得点であった。クラスでの英語の平均点
は70点、標準偏差は10点、数学の平均点は50点、標準偏差は8点であったとすれば、相対的にどちら
の科目の方がよくできていたといえるか。
英語に関するziの値
数学に関するziの値
(2)偏差値 · · · 標準化変量から算出され、相対的評価に広く用いられている値
偏差値 50 + 10
xi−x
s(x)
偏差値はxi =xのとき50である。 偏差値とデータがある範囲に含まれる割合には、次のような関係が
ある。
偏差値40∼60: x−s(x)∼x+s(x)⇒約67 % 偏差値30∼70: x−2s(x)∼x+ 2s(x)⇒約95 % 偏差値20∼80: x−3s(x)∼x+ 3s(x)⇒約99 %
(先ほどの例)クラスでの英語の平均点は70点、標準偏差は10点、数学の平均点は50点、標準偏差は8点
であったとき、それぞれの科目において、偏差値20∼80の得点の範囲を推定せよ。
1.5
変動係数変動係数 · · · 標準偏差の平均値(算術平均)に対する比率を表した値
変動係数 CV = s(x)
x
変動係数は、データのもつ見た目の大きさに捉われることなく、データの分散度を調べるために用いられる。
(例)規模の小さい食料品小売店について、10日間の売上高(単位:万円)は次の通りである。この小売店
の変動係数CV を求めよ。
5, 3, 6, 8, 9, 8, 10, 2, 7, 4
もし、この小売店の近所にあるスーパーマーケットの変動係数が36.3%であったとすると、平均値(算術
平均)に対する相対的分散度は の方が大きい。