九州大学学術情報リポジトリ
Kyushu University Institutional Repository
代表値の平均性と中心性
鈴木, 譲
九州大学大学院人間環境学研究院人間科学部門共生社会学講座
https://doi.org/10.15017/4771870
出版情報:人間科学共生社会学. 8, pp.1-11, 2018-02-14. 九州大学大学院人間環境学研究院 バージョン:
権利関係:
1 はじめに
通常、記述統計において最初に説明される代表値は相加平均(算術平均)であり、その際、
相加平均は分布の中心性(central tendency)を示す指標として説明される(Blalock 1979: 56;
Bohrnstedt and Knoke 1988: 70; Guttman and Wilks 1965 = 1968: 58; 岡田1972: 5; 大澤2005: 19; 篠
崎1994: 19; 竹村 1997: 14; 内山2002: 8)。そしてこの中心値としての相加平均と各値との差を偏
差とよび、一連の偏差自乗値の相加平均を計算した結果が分散、その正の平方根が標準偏差で あり、分布の散布度(dispersion)を示す指標として説明される。
以上は統計学のほぼどの文献にでも見られる、いわばきわめて一般的な平均値と散布度の説 明であるが、実は代表値の平均性(mean tendency)と中心性という2つの性質が混同されてい る。本来、相加平均は平均性にもとづく指標であり、中心性はまた別の性質である。ところが ほとんどの統計学の文献では、相加平均が無条件に中心性をも有するという前提の下で論理が
代 表 値 の 平 均 性 と 中 心 性
鈴 木 譲
要 旨
相加平均は平均値として、標準偏差は散布度として、記述統計においては最もよく使われ る指標である。一般に標準偏差は、相加平均の周りの散布度を表す指標として説明される。
しかしながら、現在の代表値の説明においては平均性と中心性という2つの性質が混同され ている。平均値は平均性に関する指標、散布度は中心性に関する指標であり、この2つの指 標は本来別個に論じられるべきである。この2つの性質が混同されているために、現在の説 明では、標準偏差の代わりに平均偏差や3次以上の積率がなぜ用いられないのか、あるいは、
相乗平均の周りの散布度はなぜ用いられないのか、といった根本的な疑問には適切に答える ことができない。
本稿では平均性と中心性を別個に論じることにより、平均偏差の考え方では中心点が一般 には一意的に定まらず、また、一意的に定まる場合もその値は中央値であって相加平均では ないこと、また、3次以上の積率の考え方では中心点が相加平均には一致しないこと、そし て標準偏差と同じ手法では相乗平均の周りの散布度を定義することができないことを示す。
キーワード:相加平均、相乗平均、標準偏差、散布度、積率
展開され、散布度の指標が定義されている。
結果的には相加平均は中心性も併せ持つことが分かるので、このように分散、標準偏差を定 義しても、散布度の指標として論理的問題があるわけではない。しかしながら、初めから相加 平均をあたかも中心性の指標のごとく定義し、それを用いて散布度の指標を構成する論理構成 は決して好ましいものではない。
このような説明では、以下にあげる3つの根本的な疑問に答えることができない。第一は、
平均偏差(mean deviation, average deviation)との指標としての優劣である。散布度の指標とし て、一連の偏差の相加平均を用いることが適切でない理由は、言うまでもなく偏差の合計は必 ず0になるからである。そこで偏差に対して何らかの変換が必要になるが、偏差の自乗を考え るよりも、偏差の絶対値を考える方が自然である。一連の偏差絶対値の相加平均を計算した結 果を平均偏差とよぶが、なぜ標準偏差の方が平均偏差よりも好ましいかを説明する必要がある。
多くの文献であげられている理由は、数式で絶対値を扱う煩雑さである(Blalock 1979: 78; 西
平1985: 76-77; 岡田1972: 9)。また篠崎(1994: 27)や松原(1996: 87)では平均偏差が余り用
いられないことは述べられているが、理由については書かれていない。佐々木(1999: 27)や 内山(2002: 8)では平均偏差について述べられてはいるが、標準偏差との対比については書か れていない。しかし、絶対値の数式上の煩雑さは、平均偏差と標準偏差を散布度の指標として 比較した場合の原理的な優劣とは直接関係はない。
またBohrnstedt and Knoke (1988: 80-81)は、平均偏差を計算する場合に、相加平均よりも
中央値を用いて計算した方が値が小さくなることを理由としてあげている。確かに、後に述べ るように平均偏差の考え方では、相加平均よりも中央値の方が中心性が高くなる。しかしなが ら、Bohrnstedt and Knoke (1988)では平均性と中心性が区別されていないために、この説明だ けではなぜ平均偏差が散布度の指標として適切でないのかが明確ではない。
第二の疑問は、仮に平均偏差を使わないとしても、なぜ3次以上の積率(モーメント)を用 いないのかである。分散では偏差の自乗総和(偏差平方和)を用いて散布度を計算する。分散 は偏差平方値の平均値であるが、一般にkを自然数として、偏差のk乗総和を標本数で除した 値、つまり偏差k乗値の平均値を、平均値の周りのk次の積率とよんでいる。
松原(1996: 87)は、偏差を自乗することによってデータの散らばり具合が、平均偏差より も際立つと述べている。このように考えると、平均値、平均偏差が同じ2つの分布に対しても、
標準偏差を比較することによって散布度を比較できるように思える。そのようなデータを具体 的に構成してみる。まず標本数nが2の場合には、平均偏差と標準偏差は必ず一致し、平均値 と標準偏差が与えられれば、2つの値は「平均値±標準偏差」として一意的に決定されるから、
そのようなデータを構成することはできない。そこでnが3の場合を考え、2つの集合AとB を次のように定義する。(構成の仕方はAppendix 1を参照)
A = {0, 2, 4} B = {0, 3, 3}
AとBはともに平均値は2、平均偏差は4 / 3であるから、これだけでは散布度の大小は比較
できない。しかし、標準偏差の値はAは1.63、Bは1.41であるから、Aの方が散布度が大きい ことになる。以上をまとめると表1の通りである。
表1 相加平均と平均偏差が等しい分布 相加平均 平均偏差 標準偏差
A 2 4 / 3 1.63
B 2 4 / 3 1.41
この説明は一見分かりやすいが、このように考えると、平均値と標準偏差が同じ2つの分布 で、より高次の積率を用いないと散布度を比較できないような場合はないかが疑問として残る。
そこで、そのようなデータを具体的に構成してみる。同じくnが3の場合を考え、集合Cを次 のように定義する。(構成の仕方はAppendix 2を参照)
2つの集合BとCを比べると、ともに平均値は2、分散は2である。そこで、kを偶数とし てk次の積率を比較してみる。4次の積率はともに6で等しい。6次の積率はBが22、Cは
19.27でBの方が大きい。従って、分散と4次の積率では分からないが、6次の積率を比べると
Bの方が散布度が大きいことになる。以上をまとめると、表2の通りである。
表2 相加平均と標準偏差が等しい分布 相加平均 分散 4次積率 6次積率
B 2 2 6 22.00
C 2 2 6 19.27
しかし、このように高次の積率を用いるのでは、次数をいくらでも大きくする必要があり際 限がなく、結局散布度の指標を適切に構成することができなくなってしまう。
第三の疑問は、なぜ相乗平均(幾何平均)を用いないかである。周知の通り、平均値には相 加平均、相乗平均、調和平均がある。平均値を中心性の指標として用いる、という場合は暗黙 に相加平均を想定しており、他の平均に関しては考慮されていない。しかし、相乗平均も平均 値の一種である以上、なぜ相加平均を用いて相乗平均は用いないのか、つまり、なぜ相乗平均 の周りのデータのばらつきを考えないのかを説明する必要がある。
以上の3つの疑問は、平均性と中心性を区別して論理を展開しない限り適切に答えることが できない。以下、この2つの性質を区別して論じ、これらの疑問に対する回答を提示する。
2 平均性の指標
「平均」とは言うまでもなく「平(たいら)に均(なら)す」こと、すなわち「値の大小の凸
C= + −
1 2
11 21 4
11 21 4
, ,
凹を不揃いでないようにすること」である。今、nを自然数、1 ≦ i ≦ nとし、xiを実数とする。
任意の実数yに関して、各xiの値をyに揃えることを考える。この時、どのような演算にもと づいて値を揃えるかが問題であるが、演算としてはまず加算を考える。すなわちxiがyより大 きければその差を余剰分とし、xiがyより小さければその差を不足分とし、余剰分と不足分を 相殺して最終的に過不足を見るわけである。
相殺した結果をyの関数としてm( y) と表すと次の通りである。
この値が正ならば余剰があり、負ならば不足があるわけである。この値の絶対値は、xiをyに ならそうとしたときの不揃いの程度を示している。そこで、あらためてm( y) を次のように定義 し、集合{xi}の加算にもとづくyの不均整指数(irregularity index)とよぶことにする。この値 が小さいほど不揃いの程度が小さく、平均性が大きいといえる。この値が最小、つまり0とな る場合が平均性が最大となる場合であり、その時のyの値が相加平均である。
調和平均は、逆数を用いた形での相加平均の応用である。xiを正の実数、ti = 1 / xi , u = 1 / y と して、集合{ti}の加算にもとづくuの不均整指数を考え、平均性が最大となるuの値を求めれ ば、その時のyの値が{xi}の調和平均である。
次に、乗算を演算として用いて値を揃えるのが、相乗平均である。すなわち、xiとyを正の 実数とする時、xiがyより大きければその比率を余剰分とし、xiがyより小さければその比率 を不足分とし、余剰分と不足分を相殺して最終的に過不足を見るわけである。乗算を演算とし ているので、過不足の見方は各比率の総積(総乗)によって行い、その結果が1より大きけれ ば余剰があり、1より小さければ不足があるわけである。
そこで、m( y) を次のように定義し、集合{xi}の乗算にもとづくyの不均整指数とよぶことに する。
相加平均の場合と同様に、この値が小さいほど不揃いの程度が小さく、平均性が大きいとい える。この値が最小、つまり0となる場合が平均性が最大となる場合であり、その時のyの値 が相乗平均である。
このように、平均値は相加平均、相乗平均のいずれにおいても、あくまで平均性にもとづい て定義される代表値であり、中心性にもとづいて定義されるわけではない。
文献によっては、物理的な重心との関係で、平均を説明しているものもある(岡田 1972: 6)。
確かに、ベクトルとしての平均は物理学での重心と一致する。しかしながら重心としての説明、
あるいは、ベクトルの平均としての説明は、相加平均には適用できるが、相乗平均に関しては m y xi y
i
( )= n ( − )
∑
= 1m y xi y
i
( )= n ( − )
∑
= 1m y x
yi
i
( )= − n
∏
=1
1
適用できない。従って、この方法では平均性を相加平均、相乗平均に共通の性質として説明す ることはできない。また、重心という用語は「中心」という意味を含んでいるが、これはあく まで物理学における質点に関する中心であって、以下に述べる散布度における中心性ではない。
3 中心性の指標
分布の散布度を論じる場合、どの点の周りにデータが散らばっているかが問題であるから、
まず分布の中心点を定義する必要がある。今、nを自然数、1 ≦ i ≦ nとし、xiを実数とする。
任意の実数yに関して、yの周りに{xi}が散らばっている程度を示す関数f ( y) ≧ 0を考え、散 乱指数(scattering index)とよぶことにする。散乱指数の値が小さいほどyの周りのデータの 散らばりが小さく、yの持つ中心性が大きいと考えられる。そこでfが最小値をとるようなyが 一意的に存在するとき、このyの値を集合{xi}のfにもとづく中心点とよび、そのyに対する 散乱指数の値を、集合{xi}のfにもとづく散布度とよぶことにする。
円の中心などを想定すると、中心点としては、各値から等距離にある点、つまり各値からの 偏差が等しくなる点が望ましいように思えるが、これは正しくない。もちろん、各値からの偏 差が等しくなるような点は一般には存在しないが、たとえ存在したとしても、それは散布度を 考えるための中心点の概念とは一致しない。
たとえば、aとbを実数としa < bとする。ここで、{a, a, . . . a, b, b, . . . b}という集合を考える とa, bそれぞれの要素数には関係なく、(a + b) / 2はすべての値から等距離にある。この方法で は異なる値が何種類あるかだけが問題となる。今異なる値は2種類しかない以上、中心点は常 に (a + b)/ 2であり、散布度は常に (b - a) / 2となる。しかし、散布度を考える場合には、たとえ 同じ値であってもそれが複数ある場合には、それなりの重みづけをして考える必要がある。
従って、各値からの偏差が等しいかどうかは{xi}におけるyの中心性の判断基準として適切 ではない。散乱指数として、yの周りでの{xi}のばらつきの程度を測るためには、偏差を何ら かの形で統合する必要がある。
散乱指数として偏差平方の平均値を考えると、fは以下のように定義される。
周知の通り、fが最小値をとるyは一意的に定まり、その値は相加平均に等しい。従って、相 加平均は偏差平方の平均値にもとづく中心点である。結果として、相加平均は平均性に加えて、
中心性も併せ持つことが分かる。散布度としては上記の散乱指数の値、つまり分散を用いるわ けである。
f y n xi y
i
( )= n ( − )
∑
=1 2
1
4 平均偏差
次に散乱指数として偏差絶対値の平均値を考えると、fは以下のように定義される。
xiは昇順に並べ替えているものとする。nが奇数であるか、偶数で であれば、fは 中央値(メジアン)で最小値をとるが、nが偶数で であれば、fが最小値をとるy の値は一意には定まらず、この2値の間の任意の値で最小値をとる。つまりfにもとづく中心 点は一点には定まらない。
従って、この散乱指数を用いて散布度を測れるのは、nが奇数であるか、偶数で の 場合に限られ、しかもその際の中心点は中央値である。言い換えれば、この方式は相加平均で はなく、中央値の周りのデータのばらつきを測っている。このように見ると、平均偏差とは、
相加平均に対する上記の散乱指数の値であり、相加平均がこの散乱指数にもとづく中心点でな い以上、散布度の指標としては適切ではないことが分かる。
5 高次の積率
次にkを自然数として、散乱指数としてyの周りのk次の積率を考えると、fは以下のように 定義される。通常、積率の計算では絶対値をつけないが、ここではkが奇数の場合にも、ばら つきの程度を正の値として測れるように、絶対値をつけた形で定義している。もちろん、kが 偶数であれば絶対値をつけてもつけなくても同じである。kが1と2の場合は平均偏差と分散 に対応し、すでに述べたので、kが3以上の場合を考える。
ここでfは連続関数であり、 であるから、fは必ず最小値を持つ。た だ一般に最小値をとるyの値は、相加平均には一致しない。(詳細はAppendix 3を参照)従っ て、最小値をとるようなyの値が一意的に定まるとしても、この散乱指数の中心点は相加平均 にはならない。言い換えれば、この方式では中心としての相加平均の周りのデータのばらつき を測ることにはならない。
6 相乗平均
最後に相乗平均について考える。xiとyを正の実数とする。相乗平均の場合には、演算とし て乗算を基礎にしているから、偏差に相当する値は 1 - xi / yであり、この値の絶対値のk乗平 均を散乱指数として考えれば良く、fは以下のように定義される。
f y n xi y
i
( )= n −
∑
=1
1
xn/2=x( / )n2 1+ xn/2≠x( / )n2 1+
xn/2=x( / )n2 1+
f y n xi yk
i
( )= n −
∑
=1
1
lim ( ) lim ( )
y f y y f y
→+∞ = →−∞ = ∞
ここでfは連続関数で、 である。 また、yを十分大きくとれば、
0 < 1 - xi / y < 1 すなわち f ( y) < 1 が成り立つ。つまり横軸をy軸、縦軸をz軸とすると、y→∞
の時、z = 1が漸近線となり、かつyを十分大きくとると、fはグラフとしてはこの漸近線の下 に位置している。以上の条件から、fは必ず最小値を持つことが分かる。
しかし、一般に最小値をとるyの値は、相乗平均には一致しない。(詳細はAppendix 4を参 照)従って、この方式では相乗平均は中心点にはならず、中心としての相乗平均の周りのデー タのばらつきを測ることにはならない。
7 まとめ
本稿では、代表値の平均性と中心性の2つの性質を区別して論じ、平均値と散布度との関係 を明確にした。平均値に関しては不均整指数を、散布度に関しては散乱指数を定義し、これら の指数が最小になる場合に、平均性と中心性が最大になると考えた。このように見ると、最頻 値(モード)には対応する散乱指数がないので、散布度を考える上での中心性は持っていない ことが分かる。また、調和平均は不均整指数から直接は定義されないが、逆数を用いた相加平 均の応用であるので、平均性を持っていると解釈できる。また中央値は、nが奇数、もしくは、
偶数で中央の二項が等しい場合に限っては、中心性を持つので、限定的な中心性の指標といえ る。以上をまとめると表3の通りである。
表3 代表値の平均性と中心性 平均性 中心性 散布度 相 加 平 均 ○ ○ 標準偏差
相 乗 平 均 ○ × ―
調 和 平 均 ○ × ―
中 央 値 × △ 偏差絶対値の平均
最 頻 値 × × ―
表3から明らかなように、平均性と中心性をともに備えている代表値は相加平均のみである。
これが、相加平均と分散(標準偏差)が指標として最もよく使われる論理的理由である。
本稿では離散分布のみを扱った。積率は連続分布においても定義されるが、平均偏差と相乗 平均は連続分布においては定義されない。また、連続分布においては平均値、分散が存在する とは限らない。従って、平均性と中心性に関しての包括的な議論のためには、連続分布よりも 離散分布の方が適していると考えられる。
f y n x
yi
k i
( )= n −
∑
=1 1
1
lim ( )
y f y
→ = ∞
0 lim ( )
y f y
→+∞ =1
Appendix 1 相加平均と平均偏差が同じ分布
集合A = {0, 2, 4}は、相加平均2、平均偏差4 / 3を持つ。集合{0, x, y}が同じく相加平均2、
平均偏差4 / 3を持つようにxとyを定める。この2条件は、以下のように記述できる。
x + y = 6
x - 2 + y - 2 = 2
この2条件を整理すると、x, y ≧ 2でx + y = 6であれば、常にこの2条件を満足することが 分かる。ここでx = y = 3とすると、集合B = {0, 3, 3}を得る。
Appendix 2 相加平均と標準偏差が同じ分布
集合{a, x, y}が相加平均m、分散s2を持つとする。この時、以下の2式が成り立つ。
x + y = 3 m - a
(a -m)2 + (x -m)2 + ( y -m)2 = 3 s2
この式をxについて解くと、以下の通りである。
集合Bは相加平均2、分散2であるから、a = 1 / 2, m = 2, s2 = 2とすると、Bと同じく相加平均 2、分散2であるような集合Cを得る。
Appendix 3 3次以上の積率の最小値
n = 3として、集合{0, 1, 5}を考えると、この集合の相加平均は2である。kを3以上の自然 数とする時、k次の積率f( y) は必ず最小値を持つが、y = 2ではfは最小値とはならない。以下、
kが偶数の場合と奇数の場合とに分けて、この点を説明する。
積率において係数1 / nは定数であるから、これを省いた偏差のk乗総和について議論すれば 良い。すなわち次式を考えれば良い。
まず、kが偶数の場合を考える。fは次式に示すように、全域で微分可能な関数である。fの 1次と2次の導関数は以下の通りである。
f ( y) = y k + ( y - 1)k + ( y - 5)k
f´( y) = k( yk-1 + ( y - 1)k-1 + ( y - 5)k-1 ) f´´( y) = k(k - 1) ( yk-2 + ( y - 1)k-2 + ( y - 5)k-2 )
fの2次の導関数は常に正であるから下に凸である。従ってfは全域で最小値を持つ。その最小 値は極小値でもあるから、その時の導関数の値は0となる。しかし、kが4以上の偶数である
x=12
(
(3m a− ±) 3 2( s2− −(a m) )2)
C= + −
1 2
11 21 4
11 21 4
, ,
f y xi yk
i
( )= n −
∑
= 1から、k-1は3以上の奇数であり、y = 2の時、整数論におけるフェルマーの最終定理により、f の導関数は0にはならないことが分かる。すなわち、次式が成り立つ。
2k-1 + 1 ≠ 3k-1
次に、kが奇数の場合を考えると、fは次式で与えられる。
f ( y) = y k + y - 1 k + y - 5 k
f ( y) は式としては、(-∞, 0][0, 1][1, 5][5, ∞) の4つの区間でそれぞれ異なるが、ここでは相 加平均y = 2が含まれている [1, 5]の区間についてだけ考えれば良い。fは次式に示す通り、こ の区間で微分可能な関数である。fの1次と2次の導関数は以下の通りである。
f ( y) = y k + ( y - 1)k + (5 - y)k f´( y) = k( yk-1 + ( y - 1)k-1 - (5 - y)k-1 ) f´´( y) = k(k - 1) ( yk-2 + ( y - 1)k-2 + (5 - y)k-2 )
2次の導関数は常に正であるから下に凸であり、この区間での最小値を持つ。もし全域での最 小値がこの区間にあれば、その値はこの区間の最小値と一致し、その値は極小値でもあるから、
その時の導関数は0となる。kが3以上の奇数であるから、k - 1は2以上の偶数である。まず、
k = 3の時には、
f´(2) = 3 (22 + 12 - 32) = -12 ≠ 0
次にkが5以上の奇数であれば、k - 1は4以上の偶数であり、y = 2の時、kが偶数の場合と同 様に、整数論におけるフェルマーの最終定理により、fの導関数は0にはならないことが分か る。すなわち、次式が成り立つ。
2k-1 + 1 ≠ 3k-1
従って、この集合に関しては、3以上のいかなるkについても、積率f ( y) は相加平均y = 2で は最小値をとらないことが分かる。
Appendix 4 相乗平均の散乱指数
積率の場合と同様に係数1 / nは定数であるから、これを省いたk乗総和について議論すれば 良い。
n = 2として、集合{1, 3}を考えると、相乗平均は3の正の平方根である。kを自然数として 散乱指数は次式で与えられる。
f ( y) は式としては、(-∞, 1][1, 3][3, ∞) の3つの区間でそれぞれ異なるが、ここでは相乗平均 y ≒ 1.73が含まれている [1, 3] の区間についてだけ考えれば良い。この区間でfは微分可能な関 数である。fの導関数は以下の通りである。
f y y y
k k
( )= −1 1 + − 1 3
fの全域での最小値がこの区間にあれば、その値は極小値でもあるから、導関数は0となる。ま ず、k = 1の場合は、導関数は常に負であるから、fは極値をとらない。kを2以上として、こ の導関数が0になる値を求めると、次の通りである。
k = 2の時、y = 2.5である。yをkの関数と見て、yのkに関する導関数を計算すると、次の通 りである。
従って、yはkに関して単調減少である。また、次式が成り立つ。
今、横軸をk軸、縦軸をz軸とすると、yのグラフはz = 2を漸近線とし、常にこの漸近線よ りも上に位置している。従って、yの値が3の正の平方根、つまり、この集合の相乗平均に等 しくなることはない。言い換えれば、この集合においてはいかなるkに関しても、相乗平均の 値では散乱指数は最小値にはならない。
文 献
Blalock, Hubert M., Jr., 1979, Social Statistics, revised second edition, Boston, MA: McGraw-Hill.
Bohrnstedt, George W., and David Knoke, 1988, Statistics for Social Data Analysis, second edition, Itasca, IL: F. E. Peacock.
Guttman, I., and S.S. Wilks, 1965, Introductory Engineering Statsitics, New York: John Wiley.(= 1968,
石井恵一・堀素夫訳『工科系のための統計概論』培風館.)
松原望,1996,『わかりやすい統計学』丸善.
西平重喜,1985,『統計調査法 改訂版』培風館.
岡田泰栄,1972,『統計学概論』共立出版.
大澤秀雄,2005,『基礎から学ぶ統計学』梓出版社.
佐々木正文,1999,『社会科学系学生のための統計学』共立出版.
f y y y
k k
( )= −
+ −
1 1 3
1
′ = −
− −
− −
f y k
y y y
k k
( ) 2
1 1
1 1 3 3 1
y
k k k
= +
+
−
−
1 3 1 3
1 1
1
′ = ⋅ ⋅
− <
−
−y k k
( ) (log ) k
( )
2 3 3
1 0
1 1 2
lim ( )
k y k
→∞ =2
篠崎信雄,1994,『統計解析入門』サイエンス社.
竹村彰通,1997,『統計』共立出版.
内山敏典,2002,『計量分析のための統計解析技法』晃洋書房.