• 検索結果がありません。

~

N/A
N/A
Protected

Academic year: 2021

シェア "~"

Copied!
32
0
0

読み込み中.... (全文を見る)

全文

(1)

40 第l部 基 礎 知 識

1

.

5

集団の記述方法

3

ここでは1つの集団をいくつかの部分集団に分割し,部分と全体との関係およ び部分間の関係を,特性値を通して把纏するのがねらいである。具体的には,分 割された各部分の平均値の異同を,分散を分析することによって判断しようとす るもので,いわゆる分散分析法の考え方と同じであるが,ここでは分布に何の前 提もおかず,記述的(非確率的)な説明としたところに特徴がある。分類効果の 測定など,後記の標本設計にとっても重要な概念が含まれている。基本的な考え 方に重点を置いて説明するため,変数は単一 (X)とする。

1

.

5

.

1

集 団 の 分 割 ここに大きさNの集団があるとし,その問題とする項目について (19)のよう に表示されるものとする。今後の説明のため,この集団全体の平均,分散等を次 の形で表わしておく。 唱 N X =

Xs (65) 1 N (J2

=

(X.一王)2 (66) 唱 N μγ=

z

J

(γ孟2) (67) τ N

4

=

1

7

(X

-xy

(r孟3) (68) 式 (65)は (20)に同じ,式 (66)は (27)に閉じ ((J2の添字 zを略), 式 (67) は原点の回りのT次の積率,式 (68)は平均の囲りのT次の積率で

r=3

4

の ときそれぞれ式 (34),(35)に一致する。 いま,資料(1

9

)

をある基準により

K

個の部分集団に分割したとし,それらの 大きさと内容を次のように表わしてみる。 N(は i番目の分割の大きさで,正整 数で,かっ

N

1

+ N

2

+

+NK=N

の関係がある。また

Xtjは i番目の分割内 のj番目の単位で(1

9

)

の中のいずれかに当たる。すなわち,表

1

5

は(1

9

)

(2)

1.5 集団の記述方法 3 41 単位をある順に並べかえ,初め 15 ある基準IC 大きさ 内 容 よ る 分 割 {闘を第2分割,…というように 次の

N

2 の N

個を第1分割, N

Xll, X12, ・・・・・・・・・, X1Nl 順次区切っていったものと考え 2 N2 %21 , X22, ...x2Nz てよい。 K

N

x XK1 , XK2 I ・ ・・ ・・・・・, I U K 表15の K個の部分集団に対 しては,部分集団ごとに平均, 分散等の特性値を考えることができる。すなわち,第i分割に対して 唱 N, 王t=trt

Xtj 唱 Ni 11;2

=

す1::

(Xij一王;)2 .LV i j・1 N, μ

- d

z

:

T'!. 1¥T L.J-tJ .LVi}=1 唱 N

I1T;

=

(Xij- Xi)' とおく。これらの特性値と全体の特性値との関係を明らかにすることは, (69) (70) (71)

(

7

2

)

1.

3

節 (8頁), 1.

4

(

2

6

頁)と異なる観点から集団の記述を行うのに役立つ。まず, 平均について求めてみる(式 (70)の左辺の

t

が式(34)などにおける積率の次数と 混同するおそれはないであろう)。 1.

5

.

2

部分の平均と全体の平均との関係 第t分割における平均として ‘ N

Xi=

;

Xtj

(

7

3

)

を考える。一方全体の平均は 唱 N

1 ~ ,N NK

=

5

1

z

s

=

主主ハ

t

.

5

f

戸+

L

E

f

p

j

=

長(2w

(3)

42 第1部 基 礎 知 識 , ..N1 . . N'l ..N: 、 1 ( > T 1 叶 1~ > T 1 ':!f ¥

=万円・予

r

F

1

Z

l

j

+

N

2

X2j+'"

+

-

E

E

5

1

Z

E

j

=

(N1X1

+

N2 X2

+

.

.

.

+ぬ忌)

( 74) となる。上式の.L:tは(19)の 引 を 表15のように並べかえた後の第t分割に関 する和を表わす。 式(74)は平均に関する部分と全体との関係を表わすものである。 簡単にいえ ば,全体の平均は部分の平均の平均であるということである。別のいい方をすれ ば,平均と大きさのわかったいくつかの集団があるとき,それらの集団を合併し た場合の平均は,各集団の平均をその集団の大きさをウエイトとして加重平均し たものに等しい, ということになる。式(74)は 型 K 王

=

t

z

E

N

J

4

(75) と書くこともできる。全体の平均王は部分の平均五のうち, 最大のものを越え ることなく,最小のものを下回ることもない。 亀E 例31 問題1.3の12における:tl!軒の勤労者世帯の1か月の収入をx

(s=I.2.

.

25)と し, ζれを1万円きざみで分割してみると表16のようになる。 署 員16 基 準 大きさ 内 M廿H

ii

(以上 未満) Nj Z旬 6万円-7万円 2 69600. 61400 2 7 -8 4 70700. 72500. 77400. 73900 3 8 -9 7 881

.

86100, 84900. 80100, 80100. 80600. 872

4 9 -10 6 94400. 92200. 97100, 90100. 99500. 98500 5 10 -11 3 101700, 104700. 104300 6 11 -12 119900 7 12 -13 2 121300, 123100 表 16 により各 Xi を計算してみると • X1 =655

.

X2= 73625. 五 =83871,乙=95300, x,=103567. x.=119900, x,=122200となる。とれらをそれぞれの分割の大きさをウエイ卜 にして平均してみると

NtXj=

(2x 65500 + 4 x 73防 +7X附 1+6 x 95300 +3 x 103567 + 1 x 119900 + 2 x 122200)=叩376 となる。 ζれは元の25軒の資料から直接計算した値(問題1.3の12の答)lC:等しい。 乙れによ

(4)

43 3 集団の記述方法 1.5 り式 (75)が検証されたととになる。 部分の分散と全体の分散との関係 N Nt 式

(

6

6

)

についても,平均の場合と同様に

L

:

をいくつかの

L

:

i に分解して '=1

.

-

N

t-1 + 1

1

.

5

.

3

噌 N 1J2

=方五

(X.-X)2 みる。 、 , , 、 , EE ,

Z z l , , . 、 + f K 4 hZA 吋

+

s

+

z

z , , , 、 巧

2

4

+

s

z

e d -z , I

芋 '

, E . , ‘ . E , 、 1

N

一 一

、 目 目 、 , , E , 、 ‘ , , , -Z ・ 4J E Z , , , 、

h

Z

+

+

z

e J z r , 、

m

h

L

一 戸

+

z

dJ Z J ' E 、 M 叶

Z

同 r E E , 、 目 目 、

1

N

一 一

1K (N! 1 1K Ntr

=方五

J

E

(

z

z

J

)2J

=

京五五

t

(Xij

)

+

(

-

x

)

t

=

(Xijー王i)2+

(Xiー王 )2

+

2122(王ij-Xi)(Xi -X)

(

7

6

)

(

7

7

)

ここで上式の各項を整理すると,第1項は

1 !J,~{_ -=-\2_ _l_~lI.T.l~{_ -=-\2_1~

方五五

(Xij-X;)2

=

N

t

R

;

5

1

(

z

t

J

-

L

)

2

=

d

f

(

7

8

)

第2項は 唱 K N! 1 K

古五五(丸一五

)2

=古玉川(五一王)

3

項は n u

-、 、 . , J 一 Z , J z

m Z

M d

一 Z

Z 〆 t

K

Z

剖 2

N

一 一 一 Z

- m

r g t、 、 、 , r 一 Z dJ z r t M 叶

Z

円 K ゃ ん ︼ F 2

N

(

7

9

)

1J2はこれらを加えたものであるから 唱 K 唱 K 1J2

=

Ni

I

J

/

+

T

E

Nz(Ezー王 )2 となる。 (80) 平均,分散の 3者から合成されていることを示している。式の形からみると,第 1項は各部分 と表わすことができる。式(80)は全体の分散が,部分の大きさ,

(5)

44 第1部 基 礎 知 識 の分散の平均(部分の大きさをウエイトとした加重平均)であり,プールした内分 散ともいわれ,特に

d

J

で表わされる。すなわち 唱 k

d

=

t

T

E

N

4

6

4

2

(81) この式によれば,各部分における分散りが小さいほど

d

J

も小さくなる。した がって

d

は各部分内の当該項目 zに関する異質度を平均的に表わしているとい える。 式

(

8

0

)

の第

2

項は各部分の平均の分散(部分の平均の聞の, 大きさをウエイ トとした分散)であり,間分散または外分散ともいわれ,特に

d

J

で表わされる。 すなわち 1 N ab2

=

京玉川(王

i

-

:

X")2 (82) この式によれば,各部分における平均五が全体の平均王に近いほど

ab2は小 さくなる。したがってイは,各部分の聞の当該項目 zに関する異質度を平均的 に表わしているといえる。式 (82)はまた,次のようにも表わすことができる。 1 N ab2

=

古ENJf-

正2 これらにより式

(

8

0

)

は q2

=

a

;

+

ab2 (83) (84) と書くことができる。これは lつの集団における分散は,集団を分都することに よって,内分散と間(外)分散に分解されるということである(分散分析法におい て,総変動を級内変動と級間変動に分解する考え方と同じである)0 l1W2, (/b2に 対し

a2を全分散という。 1つの集団に対しては

a2は 固 定 値 で あ る が

6

J

d

J

は分割の仕方によって変わる量であり,しかも〆に対しては補完的関係に ある。 このようにして,全分散〆を分解する意義は

OW2と

a

b2の値に(集団の)分割 の住方がある程度反映されるからである。たとえば,分割内になるべく類似なも のが集まる意図をもって分割(分類)すると ,a~ は小さく , ab2は大きくなる。 一方,何らの意図もなしただくじ引き式に分割したような場合は,元の集団の 大きさ(N)が分類

l

数(K)にくらべてはるかに大きければ

ab2が小さくなり,

;

(6)

1.5 集団の記述方法 3 45 は大きくなって,全分散112と大差ないものになるものである。 この性質を応用 すると,すでにある意図をもって分類されたと思われる集団に対しては

GW2

I1b2を計算し,ポとの関係をみればその分類効果(分割問の差異の程度)を実証 的に評価(イが大きいほど分類効果あり)することができる。また,いくつかの 集団の類似性をみたいときは,その集団聞の分散I1b2,プールした内分散

σ

J

,全 分散112をみることによって各集団の類似性をある程度評価(ばが小さいほど類 似性あり)することができる。 これらの考え方は,絶対的なものではないが,実務的には大変役に立つもので ある。 分類効果を参考的にみるための lつの標準的尺度としては N-l _2

jN-l

_2

(N-K)

l1

t

=一一+ah2/:~

K_fVbj N__KvW -(K-l)

;

'

a

u

:

=

一一一ーキ

a

(

8

5

)

がある。 N は集団全体の大きさ

K

は分割の数である。分類の意図で集団を分 劃すれば(類似のものを集めて分割すれば)上式はふつう 1より大きくなるもの で,閉じ N,K に対しては,この式の値が大きいほど分類の効果があると考える ことができる。 乙の尺度の標準性についての詳しい説明は本書の程度を越えるので省略するが,要点は次のと おりである。確率的論議になるが,

N.K

N

jを国定して資料を無作為に分割したとき,式 (85) によるFの値が平均的にほぼ111:等しくなるという性質がある。さらに, 元の資料の分布が正 規分布をするとき,式(85)による Fの値の分布は自由度

K-l.N-K

のF 分布をする。その ため,分類効果の評価にあたっては式(85)でFの値を求めたら,参考的I1:F分布表の数字をみ て.Fの値がその数字よりも大きくなる確率を念頭におくとよい。しかし.

r

正規Jの前提が正 しくない限り,その確率は根拠に乏しくなるから,あくまで参考とすべきである。よって式(85) によるFの値がlより大きくなったとしても, ζれ以上大きければ分類効果が認められる,とい うような明確な弁別値があるわけではない。また,乙こでは確率的論議は行わないから.Fの値 が偶然的なものか必然的なものかを判定する基準もない。資料の量Nや分類の数 KILよっても 評価は異なる。資料の状況と経験から記述的に論ずるほかはない。乙れは,いわば確率ぬきの分 散分析である。 表11 分 散 表 分割 大きさ 平 均 分 散

N

X

σ12 2

N

X

σ22 K

N

K XK

a

;

(7)

46 第1部 基 礎 知 識 全分散

0

2

d

J

6

J

に分解するに当っては,表

1

5

に基づき,各分割における 特性値を表

1

7

の形にまとめ,それに基づいて02

Ob2

0';を求めるのが便利であ る。 分割 (i) 2 3 4 5 6 7 表18 大きさ 平 均 (Nt) (Xj) 2 655.00 x 10' 4 736.25 7 838.71 6 953.00 3 1035.67 1199.00 2 1222.00 分 散 ("1') 1681.00 xI0' 603.69 1066.25 1143.00 170.00

81. 00 例32 例 31における 7個の分割Kっき, O w2, 0,/を求めてみる。まず, 各分割の平 均,分散を表にしておく。そ乙で式 (81)によ りeJを求めてみると

,,~

=

N

!

.

i

:

Nj

"

1

=

(2x 1681.00 ;";;:, _." 25 +4 x 603.69

+

+2 x81.00)xI0' =830.8 x 10' となる。つぎに式 (83)により

σ

t

を求めるに, 問題 1.3の 12により

x

= 90376 (表18からも 計算できる〕であったから 2=JTN

Ef-Z2=

(2x悶 0れ 4x市 25'

+…+

2 x 1222.00') x 10' j";;:' -,-, - 25 -90376' =24882.1 x 10

となる。とれにより,全分散は σ'=σ

u

i

+

σ'b'= 830. 8 x 10' + 24882.1 x 10' = 25712.9 x 10・とな る(乙れは問題1.3の 12の 答 ポ =25713 x 10'に一致する)。そとで, ζれらの結果を表17 の分散表の形にまとめると表19のようになる。そして式 (85)の式 によって分類閣の差を測ってみるとN=25,K=7として 表19 分 散 表 F =一一一一一一=一一一-;-N - k e J 2 5ー7 2~~-;:~~ 4882.1~ x 10

~~ -1~ ~ 89. 8 K-l

"

:

7-1 830.8xl0 となって,かなり大きい値となる。もっとも,との例では分割の基 準からもわかるように, 1つの分割内の金額の幅を1万円以内IC小 さく抑えるよう分類したために

σ

t

が大きくなったもので,式 (85) の値が大きくなるのも当然といえる。

'

t

e w 2 N K 25712.9 x 10'

I

248830.8xI082.1 x 10'

I

25 7 式 (81)-(84)からも当然いえるが,各分割内の変動幅が小さくなるような方法で分割すれば, eJは小さくなると同時に

σ

t

は大きくなる。 ζのととをさらにわかりやすくするため, 図で表 わしてみよう。 例33 次のような大きさ 72の集団をモデルとして,

0

'

:

が小さくなる場合と大きくなる場合 の分割の例を示そう。図21中の7 )レは集団の構成単位の計量の大きさを表わしている。図 (b) のようにおおむね計量の大きさ別に分割すると 1つの分割内では粒揃いとなるから,各 σJが 小さくなり, したがって σJも小さくなる。一方分割どとの平均には大きな差が生じるζとにな るから σJは大きくなる。実際 IC計算してみると

K

O~.~ =すE Njσ

l

=

(4xO+l0 x 189+19X72.576+39 x9. 204)= 50.388 凶 作1-•• 72

K

~=合N;":E Nj :

-

'

.

(x-;. - -x)'= ~~ { 4 x (100 -22.

2

)

'

+ 10 x (41 -22. 2)' 72 + 19 x (18.947 -22.2)' + 39 x (11.025 -22.2)' } = 455. 785

(8)

1 .5 集団の記述方法 3 47 となり,

σ

t

よりも

σ

J

がはるかに小さくなっている。なお,式(85)を計算してみるとF=205 と大きい値になる。 初めの集団 100が4個 50が8個 20が20伺 10が40個 計72個 平均 王=22

.

2

分散 <1"=506.172

=ω0,0 =肌 0=20, 0 =10 r、 。 _f'"I 0 。 向 _0向。n

O

J

-

_

:

6三

Q

。f

J

0 _ - ; - - -

にノ。 00 ( J 0" 0 三 _u

(

-

¥...ノ ム 。

O

。 。 : 。 。 。 。 。

0

;

b

( a ) l1

i

'

立大,

d

は小

6

1

は小, 11~ ,;I::大 平均

。υ~Oυ

(

100が4個 %¥=100 分散

.

r

.

=0 100ヵ'11困 平均 、。円刊。。

0

:

:

50ヵ'21困 王¥=21.6 20ヵ'4fII 10ヵ'111困 分散 書十18イ困

r

.

.

=513.8 50が7個 平均 0

0 o。0oQ

6

20が3個 ゐ分散=41 計10個

r

.

=189 100ヵ'11固 平均

:

_

f10.

。 。 50ヵ'21困 =22.941 20ヵ'51圃 分散 10ヵ'91困 計17個

r

.

=526.643 50が1個 平均 O o o o t。 20が13個 ,%=18.947 10が5個 分散 。00 0 0。 計19個 。i=72.576 。0 0 00。 100ヵ'11困 平均

f

。:ふ。ミ位

O

J

。 。 50カ'21困 =22.2 20カ'51固 分散 10ヵ'10fll 計18個 ,rl=506.l72 20が4個 平均 -。 。 。00。J。。・・J @。a。emq.面t

z

・. ・ ・ 。。 10が35個 ,%分散=11.025 0 0 0 0 計39個 ,r,=9.204 。 。。00。 100カ'11困 平均3 0 0。。

5

50ヵ'21固 ゐ=22.105 20ヵ'61国 分散

o 。 10が101闇 言十191固 。~=479.778 o 0 00 0 合 計72個 合 計12個 (b) ( c ) 図21 図(c)のように,どの分割も雑多な集りになるようにすると, 1つの分割内での(Jt'が大き くなり,したがって

σ

J

も大きくなる。 ζれに伴って,各分割の平均の聞には差が少なくなるか ら,0,/は小さくなる。実際 IC計算してみると

(J~

=

~~

72(18 x 513.

a

+ 17 x 526. 643 + 18 x 506. 172 + 19 x 479. 778) = 505.970 σ62

=

{18x

(川一

22

.

2

)

'

+17 x (22.941-22

わ'+

18 x (22

.

2

-22

.

2

)

'

+19 x (22.105-22.2)勺=0.202 と(Jb'の方が

σ

J

よりもはるかに小さくなっている。なお,式(85)を計算してみるとF=0.0096 と小さな値になる。 実際!e:集団を分割しようとするときは, eJをできるだけ小さく (σ♂をできるだけ大きく)す るか,逆にできるだけ大きく

(

σ

J

はできるだけ小さく)するかのいずれかが自標であるととが多 く, σ'~, 0;の値の中途半端な債を目標にして分割するととは少ない。上のモデノレはσ',:, ob2を 大および小にする1つの例である。しかし,与えられた集団がいつも乙のように分割できるとは

(9)

48 第I部 基 礎 知 識 限らない。 図22はσJ,σ&'と金分散 o'との関係を図示したものである。九および内を直角三角形の P 直角をはさむ2辺とするとσは斜辺の長さとなる。また O w, 06を種々変化させると,点Pはσを直径とする円 弧の上を動く(あるいは,九,0&はσを半径とする 円周の座標11:相当すると考えてもよい)。 σJおよび

0

:

は,互 によって相対化し, 変動係数を つくる乙とができる。 O~.. cw=ーーニ (86 ) Ixl を部分集団内のプールした変動係数といい σb (87 ) Ixl を部分集団聞の変動係数という。元の集団の変動係数は c=σ/1

x

l

で表わされるから c2 =cw2

+

c♂ 図22 となる。 例 3~ 例32について C駒内を計算してみると次のようになる。 ow ,;8ヨ0.8x 10' ω =一一=ムとこ二一一一=且0319

I

x

I

90376 内 花 石82.1x 10' &=一一一一= . ~~~~:.:.~ .."V 0.175

I

xl 90376 一方全体の変動係数は,問題1.3の 12の答から o

.

r

?fi71 ?QR?d c=ー一一=ムニニニとと-=-=0.177

I

x

I

90376 となり, Lれらは c2=c;+ Cb2 の関係になっている。 十分満足している (88) 例 お 昭和51年 5月総理府が調査した「国民生活に関

I

(ア) する世論調査」によれば, iあなたは,現在の暮らしにつ

I

(イ) いて,どう思っていらっし宇いますか。乙の中ではどうで 十分とは言えないが一応 満足している

I

(ウ) しょうか」といって,右のような言葉を書いたカードを示│

I

(エ) して回答を求めたととろ,

i

十分満足している」または「十 l まだまだ不満だ きわめて不満だ 分とは言えないが一応満足している」と答えた者は,調査客体8343人のうち 5104人, 6.12% であった。そしてζれを性別,年齢別,職業(従業上の地位)別にみると,表20-22のとおりと なった。そ乙で満足感の男女差,年齢差,職業差について検討してみるとととする。まず,性別 に対してOd2,ow2をそれぞれ式 (82),(81)によって計算してみると σ&' =0.002830 ow'=0.2347 となる。そζで,式(85)による債を求めてみると, N = 8343. K担2として F=

旦坐主ニム.且旦笠盟=

100.6 2-1 0.2347 となるから,満足感の男女差はかなり大きいといえよう。

(10)

表20 1 .5 集団の記述方法 3 49 分 散 表 性別 客体数 満足の意を表明した者 人 数 平均(比率) 分 散 計 8343 5104 0.6118 0.2375 男 3652 2014 0.5515 0.2473 女 4691 3090 0.6587 且2248 σ 2

2375 σb2 0.002830 σ1U 2 且2347 N 8343 K 2 年齢別分析では内,= O. 001878.σ,]=0.2356となり,式(85)による値はN=8343.K=6と して 内 ぺ υ 内 喝 υ = 引 例 一 M w h 表 町一およ 山一旦れ -' り pnu--v

- 一

1 認 円 同 一 一 も ∞ ∞ 一 6 差 h 時 h リ な ル ﹂ 年齢別 客体数 満足の意を表明した者 人 数 平均(比率) 分 散 20~29 歳 1657 975

5884 0.2422 30~ 39 1835 1036 0.5646 0.2458 40~49 1902 1151 0.6052 0.2389 50~59 1438 915 0.6363 0.2314 60~69 1007 654 且6495 且2277 70~ 504 373 0.7401 且1924 」 一 分 散 表 11' 0.2375 σt 0.001878 6 up2 2356 K 8343 N 6 また,職業別ではσ/= O. 003370.σ

w

'

= O 2.341となり,式(85)による値は .N=8343. K=4 として n u n U 4 4 0 = る 叩 一 l れ q t u -a n 官、, qu-qup ゼ ∞一はめ

o

一(認 寸 hV 4 一 な 一tiANN U -も n o

一4

E

n n u -4 4 β ド 麟 杓 J よ J ' a . と 表22 職 業 別 客体数 満足の意を表明した者 人 数 平均(比率) 分 散 自 営 者 1562 971 0.6216 0.2352 家族従業者 856 592 0.6916 0.2133 被 傭 者 2988 1608 0.5382 0.2485 無 職 2937 1933 0.6582 0.2250 分 散 表 σ 2 0.2375 σb2 003370 σ up2 0.2341 K 8343 N 4 乙の例は . Nが大きく,分類別平均(比率)が極端に小さくも大きくもない例である。式(85) のFの値は

.N

が大きく,かっ一見して比率IC差がありそうなときは大きくなりやすい。

1

.

5

.

4

部分の特性値(

3

次以上)と全体の特性値との関係

(

7

6

)

と同様な考え方によって平均の回りの

3

次の積率113を各分割の特性値

(11)

50 第1部 基 礎 知 識 から合成してみると次のようになる。

K

0

3

=

+

Ob3

+詰玉川(丸一王 )

0

/

(

8

9

)

ただし 唱 K

仏=京五

Ni03i

(

9

0

)

可 k 0b3

=

TENt(L-E)

(91) また, 4次の積率O.については • K ~ K O.

=

+

Ob.

+

N

f

l

Ni(

五一王 )

03;

+長玉川(乙ー王

)20l

(

9

2

)

ただし 事 K O

刷=会主

Nio4j (93) 1 K OM=tzENtGt

一三ず

(94) である。式

(

8

9

)

(

9

2

)

は,全体の集団における

3

(4

次)の積率が各分割の

3

次 (4次)以下の積率により表わしうることを示している。

1

.

5

.

5

部分和に関する特性 Nj 集団を表

1

5

のように分割すれば,各分割について,その計量の合計九

=

L

:

Xij = Ni Xj (i= 1, 2,…, K)を考えることができる。すると K個 の れ が で き る が,これを新たに丸を単位とする大きさ Kの集団と考えると,れについての平 均や分散等を考えることができる。この観点からの集団の記述方法は前記の Ow' のを用いた記述方法と並んでサンプリングを理解するうえで役に立つものであ る。まず,各部分の和れと集団全体の総和T=Nxとの聞には明らかに K

T=

:

E

T

j

(

9

5

)

なる関係があることがわかる。また, 1分割あたりの丸の平均として 一ー 唱 K T =

Z

(96)

(12)

1 .5 集団の記述方法 3 51 を 定 義 す れ ば , 各 れ の

T

の回りの分散として

K _

K _

1

1

;

=

主主(丸一

T)'=

η-

T'

(

9

7

)

を考えることができる。この

1

1

;

は分割内の計量の合計の分割間分散であって, 各分割内の計量の合計がいかに一様でないかを示す尺度となる。 式(82)で 定 義 される

d

J

は各分割内の計量の平均が,分割問でいかに一様でないかを示すもの

1

1

;

と混同しない必要がある。 で, 例36 例31における 25 軒の世帯の収入別分割について Ti • T. T.σ'B'を計算してみると次 のようになる。乙の場合 K=7で.Tiは各分割内の収入の合計であるから .T

=131000. T.= 294500. T

=587100.れ =571800. T

=310700. T.= 119900. T

=2444∞である。 Tは 乙れらの合計で 2259400= NX" = 25 x 90376 Iζ等しい。 Tは1分割あたりのれの大きさだか ら2259400+ 7 =322771 Iζ等しく,とれらをもとに式(97)により σぷを求めてみると となる。 σJ=÷

(

00'+刊捌附9ω附4必50∞0山肌叩∞附2川+刊5問7 { 2259400 ¥' nnnn... • n' ーヤーーデ一一.1= 30986.43 x 10

11;と1162は共に分割聞の分散であるが,観点が違う。そこでその違いを一層わ かりやすくするために図で説明してみよう。同じ集団であっても,分割の仕方に より I1B2が大で1162が小となる場合と, その逆になる場合があるが, 次 は そ の 極 端な例である。マルは構成単位の計量の大きさを表わしている。図

2

3

の(a)では 分割内の計量の総和が分割間で差がないから I1B2は小さいが,構成単位の平均の 大きさは分割問で差が大きいから 1162は大きい。また,図(b)で は 分 割 内 の 計 量 の総和が分割問で大きく異なるので, I1B2は大となるが, 構成単位の平均の大き さは集落間で差がないので

o

J

は小さくなる。

σ

j

と1162の聞には一般に次の関係がある。 士 2K 唱 K - ー . 一 一 -I1B2

=

N 211;

+

主主

( Ni

N)2+

EN4(Nt-N)(

可一王

2)

(

9

8

)

ここに

R

1

分割の平均の大きさで

N/K

に等しい。式

(

9

8

)

はかなり複雑だが, 分割の大きさが均等のときはN i = N = Nと一定になるから* 11;

=

N21162

(

9

9

)

Nは分割の大きさが初めから均等である場合の1分割の大きさを.Nは分割の大きさが均等でない場 合のl分割あたりの平均の大きさを表わす。

(13)

。。

100が1個

o

0

50が2個

O

O

C

}

100カ<41固 T

=400 ,%=100

。。

20が5個 T

=400 ,正=22.2

10が10個 計18伺

o

0

。。 。

100が1個 20が2個

50が8個 T2=400 ゐ=50

00000

T2=200 ゐ=22.2

10が61固

計9個

o

0 0 0 0 100が11固

0

0

1 0 0

0 0 0

50が2個 20が20個 T

=400 る=20

o

0 0

20が5個 お=400 王',=22.2

0 0 0

10が10個

00 0

0

計18個 0 0 0 0 0 0 0 0 100が1個

4

Q

3

2

:

?

h

;

:

Q

d

0 0 0 0 0 0 0 0 50が4個 10が40個 T.=400 ふ=10 0 0 0 0 0 0 0 0 20が8個 T

=600 王,=22.2 0 0 0 0 0 0 0 0 10が14個 0 0 0 0 0 0 0 0 計27個 正=22.2 1'=400 N=72 N=18 K=4

.

r

.

=506.17283 .,.

a

=

o

.,.a=20000 ,7。=0 (a) (b) 図z3 柄 拘 噛 咽 ︼ 噴 出 掛 寵 幡 宮 騨

(14)

53 3 集団の記述方法 1 .5 と簡単になる。これは分割の大きさが均等ならば,いかなる分割の基準に対して も (J

i

との2は比例的であることを意味している。

B2は

T

によって相対化すると,変動係数GBが得られる。すなわち

G,

=

~主

11

I

T

I

(100) これは一般には式(87)で定義したCbとは異なるものであるが,分割の大きさが GB

=

Cbとなる。 均等の場合には一致し, 関 相 内 級

1

.

5

.

6

分割の大きさが均等な場合,分割内の等質度あるいは分割問の異質度を測るた めの標準化された尺度として級内相関係数がある。これは次の式で定義されるρ で , 既 述 の げ や

d

に関係がある。 K ( N N

L

:

l

L

:

L

:

(Xij-王)(Xik-X)l ρ一 軍

1

j

'

;

Z

1

J

ー --

KN(N-1) (J2 (101) この式における (Xij-x) (Xik -x)は同一分割内での, (全平均E を中心とす る)連闘を表わすものであり, (N主主 2) これにかかる K Z M l

K

唱 N N - -ト~

L

:

L

:

N(N -1)

;

=

:

:

;

'

1

j宇 k および (J2で割ってあるのは標準化の はそれぞれ分割内および分割聞の平均を意味する。 意味である。式(101)は次のように変形することができる。まず{ }の中は

Z J J Z 〆 f

H N

Z

州 、 ‘ , J

Z b a 晶 z

- z

, J Z , f

N Z M

RZ

一 円

一 一

、 、 , J

Z b a 陶 z r , ‘ 、 、 ‘ , J

Z Z

R z

r

NZ

一 勺

(102) N

=

N

"

2(丸一王)2-

L

:

(Xij一王 )2 ゆえに式

(

1

0

1

)

ρ

=

-

-

-

;

KN(N-1)

;

:

:

:

:

;

:

-

1

2

f

{

N

'

(

乙ー王

)2-Z(ztj-

)21 (J2t;'IL 戸~ '-"} - / J , - ー ー ・ ー 一 一 = - z iー っ(N(Jb' -(J') = / iTムー~(N(Jb'-(Jb'-(J':

t

日- 1 ) υ ( N -l)σ o ~ u

(15)

54 第1部 基 礎 知 識

一会付一語

τ

)

(1

0

3

)

と書くこともできる。これにより, ρが最大になるのは"';

=

0

, "02

=

2すなわ ち分割内が全く等質(各構成単位の計量が同一)のときで, ρ=1である。また ρ が最小になるのは,イ=

0

, "';=

2すなわち,分割聞の平均に差がない,たと えばどの1分割も全集団と構造的に同じ場合で, ρ=-1/

(N

-1)である。そし て常に ー 一 山 (104) である。また,式(1

0

3

)

により "02をρと

2で表わせば A2 【4 6b=jt{1+(N-1)ρ} (105) となる。 ρとばは互いに他の

1

次変換値である。 ρは"02の変域

0←→ ,

2を集 団の内容にかかわらず, -

1

/

(N

-1)

←→

1

の範囲内に標準化したものと考える ことができる。

000001

o

0 。

00000

δ o

0 。

。 ~IOoo 。

。 。 。 。 。

│100

0 。 K=4, N=5, p=l 応 。 。 。 (a) K=5, N=4, p=-4~1 =-0.3 (b) ここに ρ=1の場合と ρ=

-1/ (

一 1

)

の場合を例に表わ してみる。図24の(a)はρ=1 の場合に当たり,各分割内は 全 く 等 質 で あ る 。 (b)はρ= -1/(N-1)の場合で,各分割 とも全く同じ構成であり,相対 的意味で分割内の異質度が最も 高い状態である。 ~J 37 3人兄弟からなる表23の5 組について,兄弟の年齢の級内相関係 数を求めてみる。式(103)によるとと とする。級(分割)の大きさは等しく N = 3. 15人全体の平均と分散はx=32.86. <7'=396.915となる。つぎに

σJ

σ

J

を求めるた め,各級(分割)の平均と分散を計算し表24にまとめてみる。すると 図24

(16)

ェ σJ=

(6.2+4.6吐 い4.2+8.6) =6.48 σJ=tt(M2+吋 +7'+67.6' .1 +31' ) -32.86 = 390. 426 乙れにより級内相関係数pは p= 一一一一一~396.915 ¥ , 丸 山 l 1/ n -一一一l V 山 ~VV 3-1 } となる。 1 .5 集団の記述方法 表23 兄弟 年 齢 22,24,28 2 35, 36, 31 3 10, 8, 3 4 65,70,68 5 35,28,30 (閉じ兄第内の年齢l願 は問題でない) 兄弟 2 3 4 5 平均 3 55 表24 平均 分散 24.6 6.2 34 4.6 7 8.6 67.6 4.2 31 8.6 32.86 6.48 級内相関係数は N = 2のときは -1-1の聞の値をとる。しかし,ふつうの相 関係数(1

.4.3(28

頁)で記したもの)とは値も意味も違うから注意を要する。た とえば, ふつうの相関係数では兄弟の年齢の関係を測るにも,兄は兄で,弟は弟 で平均等を計算するが,級内相関係数は兄弟一緒にまとめて考える。式(53)と ( 101)からもわかるように尺度の基準はふつうの相関係数では対の各々,級内相 関係数では対をくずした全体となっている。 なお,級内が無相関の状態というのは, ρ=-1/(N-1)の場合をいう。 N がふ つう大きい数であることを考えると,ほぼ

ρ=0

の場合と考えてもよい。大きさ Nの集団を何の意図もなく N 個ずつに分割(NはN で割り切れるとして)し,各 分割を級と考えて級内相関係数を計算すると -1/(N-1)に近い値になることが 多い(後記の期待値でいえばちょうど -11(N-1)になる)。 級内相関係数に よる分析では,基本的評点としてし -1/(N-1)

-l/(N-l) の

3

点に留意 し,計算値とこの3点の位置関係によって級内の等質性などを論ずればよい。

1

.

5

.

7

2 重 分 害。 ここでは分割の次元をもう 1次元高め,

2

次元にして各分割の聞の関係を研究 することにする。そこで表

1

5

の各分割をさらにいくつかに細分割してみること にする。すなわち,第t分割に対し,Mj個の細分割をつくるとすれば, 内容は便宜上表

2

5

のような平面的な形に表わすことができる。 分割の

1

つの集団を,初めに表

1

5

のように分割し,ついで表

2

5

のように分割する とき,表

1

5

1

次分割, その細分割を 2次分割という。

2

次分割は初めの集団

(17)

56 第l部 基 礎 知 識 表25

活?

2

[

1

XIl' Xl21 XIM

l XII2 Xl22 X1M

2 -・・・・.... X n Nu X 12N12 XIMINIMI X211 X221 X2M,1 X212 Z田宮 X2M22 2 -・・... X21N21 X22N" X2M2N2II

Z主11 XX21 XKMK1 K XK12 XK盟 干KMK2 XK1NK' XX2NK2 XKMKNKJLK からみれば,

2

(2

段)の分割になっている。ここでは分割の方法や分割の数 は問題としない。また, 1つの 1次分割の細分割の方法と,他の 1次分割の細分 割の方法とは異なっていてもよい(たとえば農家を, 1次分割として地区で A, B, C,…に分け, 2次分割として, A地区については世帯の人員別, B地区に ついては耕地面積,…とするなど,分割の基準は統一されていなくてもよい)。 2次分割内の 1単位は添字七 j,

1

を用いて,XijLで表わすことができる。

i

は1次分割の番号で 1,2,…

K

をとり, jは1次分割内の 2次分割の番号で1,

2

,・・

M

iをとり

1

2

次分割内の単位の番号で1,

2

,…,N,りをとる。そし て M

L

;

N i j = Ni K

L

;

N i = N の関係がある。ここで各分割の平均,分散を次のように表わしておく。 第i1次分割について 唱 N, Xi

=

jEzzj(i=l,2, , K) (106) ( 107) (108)

(18)

1.5 集団の記述方法 3 57 唱 Ni 642=

jE(ztJ-L)2 (109) 第 i1次分割内の第j2次分割について - 1

'

j

j

zu=R7hzzjE (110) N. 市 ij l1

J

i

=

7E(zzjE-h)2

(

i

j=l

=

I

2

2, ,

K

M

)

i ( 111) これらをもとにして分割聞の関係を求めてみると,まず,初めの集団と 1次分割 の聞には式(75),(84)と同じく

Z 叫

K

Z

何 1

N

一 一一

Z (112) 2 _ A ' 21 ....2 11.=11.由

+

l1b (113) 唱 k

d=

EMdf

(114) 唱 k I1b2

=

古玉川

(Xi一王 )2 (115) である。同様な関係は1次分割と 2次分割の聞にもある。

Mj X i =

jE叫jXij (116) 2 , _ 2 l1i"

=

0;叩i"

+

l1

b

i

(117) _2_1~H_2 n 一 一 、 . 山 H vwi -Ni j

lwtJVZJ ( 118)

Mj

d =

立五叫

j(王ij-Xi)' (119) である。これらにより初めの集団と 2次分割との関係をみることができる。式 ( 112)と(116)により

K Mi X =

EJENJZJ (120)

(19)

58 第1部 基 礎 知 識 また,式(117)-(119)と(111)を (114)に結びつけることにより 市 K

K ( M i Mi

dW2

=

古玉川(ば

+

db

/

)

=

i

玉川

j

d

t

J

1

5

1的

(Xij

-xd }

1 K Mi 今 1 K M i NiJ

=

7EJENtj(Etj-L)Z+

方五五五

(Xij!

j) となる。これと式(115)により 唱 K 噌 K M

6

・=古玉川

(Xi- X)2

+

古玉玉川(王

i J - X Y 1 K M

NiJ

+

:

E

:

E

I

:

(

Xiり削

j

ρ

t

一寸王

ωz

乙ゐωりJρ) .LY i""l j=1 l-l (121) (122) が得られる。この右辺の第1項は 1次分割の平均の聞の分散(略して 1次 分 割 聞 の分散)であり, 2次分割のないときは,ふつうdb2と書かれるものであるが ,2 分割のあるときは他の分散と区別するために特に

d

1

と書くこととする。 第

2

項 はlつの1次分割内の2次分割の平均聞の分散を,すべての1次分割にわたって 平均したもので, djで表わすo djは 組 く い え ば2次分割問の分散である。第 3 項は2次分割内の分散をすべての2次分割にわたって平均したもので, せ で 表 わす。 せ は 粗 く い え ば2次分割内の分散である。このようにして, 初めの集団 の分散σ2は

d

2

=

d

1

+ dj+σ

と,

1

次分割聞の分散,

2

次分割問の分散, 2次分割内の分散の 3つに分解され ることになる。

3

つの分散に対し,初めの分散を全分散という。 なお 唱 k dj

=古玉川

dbf 市 K

K Mt

。品=京三内九

f=

万五克明

j

σ

J

と表わすこともできる。そしてこれらは,

d

J

をさらに分割したものであって

d

'

;

=

d

j

+

d~ の関係がある。 ( 123) (124) 1次 分 割 に お け る プ ー ル し た 内 分 散 (125)

(20)

1 .5 集団の記述方法 3 59 I1

L

1

1

j

I1

j

は分割の仕方によって変わる量である。しかし,112は 固 定 値 で あるから , 1つの分散をある値になるように分割すればおのずから残りの 2つの 分散のとりうる範囲は制約を受けることになる。I1

r

,I1

n

1

1

m

d

を半径とする 球面の座標に相当する。 1つの集団を 2重分割し

11

l

11

j

l1

i

を求める際には,各分割の大きさ,平 均,分散を次の形で表にまとめておくと便利で、ある。 表26

l

2 ... 2次分割 なきとき Nll N 12 NlM

~

N1 Xll X12 ...XIMl X1 σ1M2 1 N 21 N盟 N 2M

¥

N2 2 X21 X22 ... .ーー.... X2M

X2 u2i u2

J

σi NK NK2 NKMK

~

NK K XK1 XK2 ...・.... XKMK XK

uKl σki σEAK σ E 2 」 一 一

1

次,

2

次の分割をある分類基準に従っ て行ったとき, 1次分割における分類の効 果は式(85)と同じ考えで 表27 分 散 表

(N-K)

l1

i

F = . __ • A;;-:- ( 126) (K -1) (I1

n

)

で測ることができ,これが1より大きいほ

1次分類の効果が大きいことになる。評 u2 σ E 2

σi

+

ufi σ

i

+

N K 点は1で

N

K

Mi'

jを固定して何の作為もなく分割したようなときは, 上式は平均的意味で

1

に近くなる。 2次分類の効果の測定には次の 2つの方法がある。 1つは,各 1次分類(たと えば第 i1次分類)内の 2次分類の効果を個別に測るもので式(85)に準じて,各 1次分類について

(21)

60 第l部 基 礎 知 識

F

一 --

(

M

_

-

M

i)

J

I

b/ t一(Miー1)

I

J

w

l

表28 分類別分散表(第t分類)

"

i

"

d

e

ω

1

Nt

M

t

(1

2

7) を求め, 1次分類全体として効果をみようと するものである。この際表

1

7

の分散表に準 じて,左のように分類ごとに分散表をつくっ ておくと便利である。 もう

1

つは,全部の

2

次分類を通した分類 効果を総合的に測るもので,やはり式(85)と向じ考えで I K 、

(N-

.

L

;

M

i)

(

I

J

f

+吋)

F=~1

lSMt

1

)

I

J

i

(128) を適用する。上の2式とも評点は 1で,計算値が 1より大きいほど分類効果が 高いことになる。何の作為もなく

1

次,

2

次の分割を行ったようなときは,いず れも平均的意味で1に近くなるものである。 なお,式(85)に関連して述べたのと同じ恨拠で, 上の3式による計算値が 1 より大きくなったとしても,直ちに絶対的な分類効果を示すものではない。デー タの量(N)や分類の数(K,Mi)などが同じならば,比較の精度は高いが,それ らが同じでないならば,計算値が向じであっても分類効果は必ずしも同じことは いえない。データの状況と経験から記述的に論ずるほかはない。 伊~38 20戸の農家の経営耕地面積,田の面積,果樹園面積についての資料がある。乙れらの 農家を経営耕地面積別に分割(1次)し,さらに田の面積別に分割(2次)したと乙ろ.各分割の 農家の果樹園面積は表29のようになった。全平均は

x

= 14.835,全分散は,,'=17. 069275であ るeつぎに各分割の大きさ,平均,分散を表26の形にまとめると表30のようになる。乙れによ り,まず

σ

i

は 表29

2 3 4 10.5, 17.5 19.7 20.8, 18.3 11.3, 20.0 2 13.,1 16.8 18.5, 19.5 15.3 3 14.2, 14.5 5.7, 7.8 12.5 11.4 17.1 12.2 (表頭と表側は符号,表中はヘクタ- Jレ〉

(22)

表30 1 .5 集団の記述方法 3 61

日!

2 3 4 2次分割 なきとき 4 2 7 14.825 19.7 19.55 16.8714285 16.266875

1.5625 15.32775510 3 2 5 2 15.06 19 16.64 2.308 0.25 5.1984 3 3 8 3 15.26 旦56 12.5 11.4 11.925 1 .695 7.335

11.879375 σI=

(7x ( 附14加一14間 山 x(16.64 -14.835)2 +8 x川 925- 附5)2) = 5.6532107 となる。つぎに寸は次の11贋序で計算される。

1

→{

4 x (14.825 -16. 8714285)2 + 1 x (ω1ω9.7ト一

M

凶蜘船) + 2 x (19.55一16.8714285) } = 5. 5859692

心=+{

3 x (15.06 -16.64)2 +2 x (19 -16.64)2 ) = 3. 7附

ab~

=

{

3 x (15.26 -11. 925)2 + 3 x (8. 56ー11.925)2 + 1 x (山一11.925)2 + 1 x (11.4 -11 9.25)2 ) =8.4927083

σ

i

=

s

=

I

y

N

tげ 内内昨6b さらlにζ4噛品は次の!順願序で計算される内 σJ=

(4x 16. 266875+ 1 xO+2 x 1.562ト 9.7417857142 d=÷(3×2308+2×0ル 1 .4853 d=÷(3×l制+3x 7. 335 + 1 xO + 1 XO) = 3. 386 σJU =

~T

土 N

i

O'

w

!

=

(7x9. 7417857142 +5x1.4853 凪 H 1 ' w

20 +8 X3. 386) = 5.135625 以上をまとめると右のようになる。 とれら 20戸の農家の果樹園の面積が,経営耕地面積の別に どの程度の違いがあるかをみるには,式(126)にN=20,K=3 および前記の

σ

i

σ

i

e

a

をあてはめ ︽ 叫 u n H d a 川 一 削

ω

四 ワ 臼 己 一 哨 川 川 山 今 o つ ι 白 筋 ω 一 引 E 一 日 日 μ X

、 ノ 一 一 x

m

一 ト F 表31分 散 表

a

2 17.069275

a

I

5.653211 aj 6.280439 4

a

I

+

σE2 11. 933650 σj+σE 2 11.416064 N 20 K 3

(23)

62 第I部 基 礎 知 識 表32

道場

i=2 (l

i

15.3277 5.1984

σ

b

i

5.5860 3.7131

σ

ω

i

9.7418 1.4853 N企 7 5 Mj 3 2 F(7-3)X5.5860 1 =;~ :-~:: ;:.;:::-;. .1147 (3-l)X9.7418

F

2 ー=~: :~.:' (5-2)X3. 7:1:3:1: 7.499 (2-1)X1.4853 F (8-4)x8.4927 Y3一 =3.344 •• (4-1) x 3. 3867 となる。 i=3 11.8794 8.4927 3.3867 8 4 を得る。 つぎに耕地面積区分別の農家の果 樹園の面積が,田の面積(2次分類) 別にどの違いがあるかをみるため, 耕地面積区分

i

1J ,

i

2

J

i

3

J

どとに 2次分類 IC関する分散表をつくって みると表32のようになる。 そとで,式(127)に従ってFjを 求めてみると また.20戸の農家の果樹園の面積が,耕地面積と田の面積の別1<:(2次分類全体として)どの K 程度の違いがあるかをみるには,式(128)iENzm,EMgz9.および前記の

σ

i

e

i

, せ を あてはめ となる。 (20 -9)x 11.933650 F ':-:: :: .::'::::::::::-=3.195 (9 -1) x 5.135625

A

.

2

次 の 分 割 数 が 一 定 の 場 合 第 i1次分割における2 次 分 割 の 数Mjが,どの1次 分割においても等しい場合, すなわちMjがiに関係なく 一 定 (M)で あ る 場 合 を 考 え る 。 す る と 表

2

5

は , 右 の よ うな 1次 分 割K個と 2次 分 割

M

個 の ク ロ ス に る 矩 形 を なすことになる。 2次 分 割 の 大きさは特に制限せず .

N

jj

2 (*0), (i=l, 2,…

K

K j=l, 2,…

M)とする。 表

3

3

2 Xll1 Xl2l Xll2 I X122 zllNu

I

X明 2 X211 I X221 Z剖2 I X222 X'lN21 I X'2N" XXll I XX21 XX12 I XX22 Xx lNK1

I

XX2NK. M XIMl XIM2 XIMN,凶, X2Ml X'M2 X2MN211 XXMl XXM2

X

x

副 阻

(24)

1.5 集団の記述方法 3 63 さて,ここでは

2

次分割の方法が,すべての

1

次分割に対して共通であるとす る(たとえば農家を, 1次分割として地区で A,B, C,…に分け, 2次分割と して各地区について統一された世帯人員規模別に分けるなど)。 共通でない場合 は,すでに記した一般の場合に含まれるから,特に議論するほどのことはない が,共通になると新しい意味も加わってくる。すなわち,

1

次,

2

次の順序に本 質的な差がなくなり,分析の観点もそれだけ特殊なものになる。そこで表

2

6

に 準じて,各分離の大きさN

i

}

平均王i},分散lJ

j

i

の表をつくれば表

3

4

のように なる。

1

次,

2

次の分割順は問題としないので,以後

1

次分割を

A

分割,

2

次分 ¥ 〈1A¥分、分¥割割1、2BZ¥K分¥分割割¥ 〉 Nll Xll N21 2 X21 σ2i NK

K XK1 σk2l 計 N.1 (平均) X.J (1次分割なき とき) σ 2 σ I 2 aj σ E 2 σi+σi σj+1 N K M 表34 2 ... M N12 N1M X12 X1M σJ N22 N2M X22 X2M a2~ σ2k NK2 NK M XK2 XKM aK~ aK

l

!

N.2 N'M Z・2 Z・M σ』 表35 分 散 表 σ12 σE'2 e

a

i

'

+σE '2 σE'2

+

"

U

l

計 (2次分(平割均な)きとき) N1・ X1・ σ1. N2・ X2・ σi. NK • X K・ σt. N z σ 2 (Nij

*

'

0) (同左) (同左) (表34は表26と異な り,よとの小計のほ かにたての小計も必 要となる。そのため Nりのよζの小計を Nt • • たての小計を N.jと表わし区別し た。王り,eajにつ いては,よζの7ー ジナルをx

.

σt?, たての7ージナルを 言 十σ.jで表した)。

(25)

64 第1都 基 礎 知 識 割をB分割といい換えて論ずることとする。

A

分割と

B

分割の作業上の順序は

A

→ B

の順でもよいし,

B→ A

の順でも よいカ人 どちらを先にするかによって 11

i

I1

L

I1

j

の内容が違ってくる。まず, A

Bの順としてイ, I1

L

l1

i

を具体的に表わせば次のようになる。 唱 K

6

1

=

古玉川.

(

.

-

x

")2 唱 K M

6

i

=

寺L:L

:

1

、も(ゐ

-Xi.)2 " i・1j・1

K M NiJ S

=

I

E

5

1

(Xijl一王ij)2 そして,これらと全分散112との関係は 112

=

11:

+

l1

i

+

I1JU である。 (129) (130) (131) (132) A分割を分類の意図をもって行ったとき, その分類効果を測るには式(85)と同 じ考えで F(N-K)6; 一 一(K-1)

(寸+

l1

i

)

(133) を計算すればよい。これが1より大きいほどA分類の効果が大きいと考えること ができる。評点は lで

N

K

M

Nijを固定して何の意図もなく分割を行った ときは式 (133)は平均的意味で 1に近くなる。 つぎに分割の順序を変えて,

B→ A

1

1

債に分割を行ったときはイ, I1

L

I1

j

は さきと内容が変わり 唱 M I1

I

2

=

51Nj(王づ一王 )2 唱 M K l1

i

2

=京三玉川

j(王ij-X'j)2 1 M K Nij l1

i

i

=

~T

L

:

L

:

L

:

(Xり1 -

3

:

ij)2

=

I1JU " j・1i・1I・1 となる。そして,これらと全分散112との関係は 112

=

I1

I

2

+

11n'2

+

11

;

J

(134) (135) (136) (1

3

7

)

(26)

1 .5 集団の記述方法 3 65 である。 B分 割 を 分 類 の 意 図 を も っ て 行 っ た と き , そ の 分 類 効 果 を 測 る に は , 式(85) と 同 じ 考 え で け E 2 -6 , 尚 一 + 的 一

d

N

M

F

(138) を 計 算 す れ ば よ い 。 こ れ が 大 き い ほ どB分 類 の 効 果 が 大 き い と 考 え る こ と が で き る。評点は1で , 何 の 意 図 も な く 分 割 を 行 っ た と き は 式 ( 138)は 平 均 的 意 味 で1 に近くなる。 A, B 両 分 割 と も 分 類 の 意 図 を も っ て 行 っ た と き , す べ て の AxB分 類 を 通 し た 分 類 効 果 を 総 合 的 に 測 る に は 2E d

+

2E 2I

6 4

1 ノ

M

M

K

二ぽ

N

一 一

F

(1

3

9

)

を 計 算 す れ ば よ い 。 こ れ が 大 き い ほ ど 分 類 効 果 が 大 き い と 考 え る こ と が で き る 。 評 点 は1で , 何 の 意 図 も な く 分 割 を 行 っ た と き は 平 均 的 に 1に 近 く な る の が ふ つ うである。 例39 80戸の農家の年間雇用労働力を耕地面積と地区別 K調べたととろ表 36のとおりと なった。 80戸の農家全体の平均は 10.8.分散は 19.61である。 そ乙で農家の年間雇用労働力が耕地面積別地区別にどの程度の違いがあるかをみるため各分類 別の平均,分散を計算すると表 37のようになる。乙の表をもとにして σi,σi,

o

量を求めてみ ると (耕地面積階級聞の分散) σf=

(20x (6.25 -10.8)2 +25 X (10. 4ー10.8)2+ 18 x (12. 6i -10. 8)2 1 80 + 11 x (12.

e

o

-10.8)2 + 6 x (18

.

3

-10.8)2 ) = 10. 8316224 (地区聞の分散) ]-2=よ(20 x (11.4一10.8)2+ 22 x (10. ai -10.8)2 + 23 x (10.0434783 -10. 8)2 1 80 + 15 x (11.13 -10.8)勺=0.2754677 (耕地面積階級 x地区間の分散) σ品=よ(4x 3. 25 + 5 x 4.56

+…

+2 x2.25 + 1刈 )= 7. 0984375 凪 80 乙れらと全分散tJ2= 19. 61 により表 38のように分散表をつくる乙とができる。 乙れにより耕地面積別の効果をみると,式(133)Iとより (80 -5) x 10. 8316224 F= '~~

.

U

:

.

'_.".:.::_u_.:::~ 23.1355 (5-1) x8. 7783775

(27)

66 第1部 基 礎 知 識 表36 農家の雇用労働力(年間,人) 各戸別

A B C D 9人 3人 11人.7人 7人 6人 8人 5人.10人 2人 50 a未 満 7人 9人 4人.7人 9人 4人 8人 3人 (4戸) 6人 (5戸) 0人 (8戸) (3戸) 11人.6人 11人.13人 7人.11人 10人 50 a以上 8人 14人.11人 12人 12人 100 a未満 7人 15人.12人 12人 4人 13人 10人 8人 19人 9人 (6戸) 8人 (8戸) 10人 (6戸) 7人 (5戸) 8人 11人 11人 12人 100 a以上 10人 12人 10人 10人 150 a未満 14人 10人 10人 15人 16人 15人 16人 15人 15人 (5戸) (4戸) (4戸) 17人 (5戸) 17人 6人 10人 15人 150 a以上 17人 9人 13人 200 a未満 14人 12人 13人 16人 (3戸) (4戸) ( 3戸) (1戸) 20人 19人 19人 13人 17人 22人 200 a以上 (2戸) (1戸) ( 2戸〕 (1戸) 表37 農家の雇用労働力(年間)

者ぞ

A B C D 計 (平均) 4 5 8 3 20 50α未 満 6.5 6.8 5.875 6 邑25 3.25 4.56 11.609375 8.6 7目8875 50α以上 6 8 6 5 25 9 11.75 10 10.4 10.4 100α未満 5.6 4.4375 3.6 25.84 9.92 100α以上 5 4 4 5 18 12.6 12 11. 75 13.8 12.61 150α未満 9.44 3.5 6.1875 6.16 7.1625432 150α以上 3 4 3 11 16 10.75 12 15 12.90 200α未満 2 13.6875 2

10.9917355 2 2 6 200α以上 18.5 19 20.5 13 18.3 2.25

2.25

7.8 計 20 22 23 15 80 11.4 10.81 10.0434783 11.13 10.8 (平均) 20.34 13.0578512 23.0850662 21.448 19.61 上段NiJ.中段XiJ.下段

σ

d

(28)

地区別には,式(138)により F (80 -4) x O.2754677=0.3609 (4 -1) x 19.3345322 耕地面積と地区別には,式(139)により F (80-20)X 12. 5115624 (20-1) x7. 0984375 5.5660 以上の分析により,雇用労働力は,耕地面 積の別にかなりの違いがみられるが,地区 別には差がみられないζとがわかる。

B

.

分割の大きさ叫j'}JS一定の場合

a

2 σ I 2

af+σi

+aj N K

I

M

1 .5 集団の記述方法 3 67 表38 分 散 表 19.61 10.8316224

I'2 0.2754677 1 .6799400 σE'2 12.2360947 7.0984375

7.0984375 12.5115624

a

?

+

a

i

l

12.5115624 8.7783775

a

U2 +

'

1

2 l3345322 80 5 4 前節においては, AXB分割の大きさ l

jは l以上であれば特に制約はなかっ たが, ここではこれを一定(万)とした場合を論ずる。 前節にくらべ評価の仕方 がさらに特別になる。表 33に対応する表は,表 39のようになる。 各分割内の

N

個のデータの順序は間わない。また,表 34に対応する表は,

N

を分割ごとに 表示することを省略し,表 40のように表わすことができる。表 39は表 33と, 表 40は表 34と原理的に変わらない。これらの表から

aL a

j

a

j

などを求める 方法は式(129)-(131)などと同じであるが, N が一定という条件のもとでは式 (132)や(137)は特に次のように変形することに意味がでてくる。 表39

2 ".‘・・・・・." Xlll Xi21 X112 XI22 XllN X12N X211 Z盟1 2 X 212 X222 X21N X22N XKll X K抗 K XK12 XK22 XK1N XK2N M X1M1 X1M2 X1MN X2M1 X2M2 X2MN XKM1 XKM2 XKMN

a

2 = a~

+

a

j

+

a

i

=σ~ +

a

i

2 + (

a

j

-a

I

2 ) +

a

i

=

a

:

+

a

i

2 + (a~t

-an

+

a

j

(140) この右 2辺の第 3項は AxB分割聞の 分散から A(B)分割の分を除いた形 で, くわしくは次の内容となる。 唱 K M

a

j

-

a

?

=

N(Xij-Xi・)

NK(王

r

x

)2 (1

4

1) これは王ij- X i.の A 分割間の分散で あって

(29)

68 第I部 基 礎 知 識 表40

、 ご ¥

2 ・ ・- ・・ーー・・・・・・.... M (8分割(平計な均き)とき) X1I Z阻 X1M X1・ σ12 1 σ12 2 σ1M 2 σ 2 X21 X22 X2M X2・ 2 σ22 1 σ22 2 σ2M 2 σ 2 2 K XK1 XK2 XJG亜 XK.

I7K

f

σE2 Z

1

7

&

σE?

(平計均) Z・1 X.2 Z・M z

1

7

2 σ ・22 6M2 σ 2 (A分割なきとき) .1 ( N孟2) 唱 K M

走五五万(王

tj-Xt.-X・j+

)2 (142) に等しい。また, σ~ -d~ についても

イ イ = 走

Z

A

R

_X.j)2

NM(王t.-X)2 (143) は王ij一王・jのB分割聞の分散であって

tj-X.j-Xt.

+

王)2 (144) に等しい。これは式(142)と同ーのものである。そしてこれは,イと σi2がそ れぞれ

A

分割と

B

分割の効果を単独に示すのと異なり,

A

B

の 絡 み に お け る 効果(交互作用)を示すもので,特に

d

I

-

i

と表わすことがある。すなわち 02

=

o~

+

11~2

+

Od

+

o

j

(

1

4

5

)

となる。分割の方法によっては,

A

B

ともに効果がなく, その絡みにおける効 果がある場合があり, それを測るには

F=

一 一

.

.

N

K

M

Od

(K-1)(M-1)

o

j

(146) を計算すればよい。これが大きいほど

A

B

の交互作用が大きいと考えることが できる。評点は

1

,N,K,M,N

を固定して何の意図もなく分割を行ったとき

(30)

1 .5 集団の記述方法 3 69 は平均的に lに近くなるのがふつうである。 なお,各種の分散は表41の形にまとめて表わすのが便利である。 表41 分 散 表 σ 2 σ I 2 σ'I 2 a~ σE'2 。 品 4

(問左) σ

l+

σ E 2 σ?+σE '12 (同左) a~

+

σE 2 σE'2

+

"I_2 σd=σE2ーσI'2 σd=σ'

I

1

2-σi (同左) N K M 例40 性と年齢による 10区分各 5 人 , 計50人に対し甲候補を支持する か,支持しないかをたずねたと乙ろ,支 持,不支持は性,年齢の別IC表42のと おりであった。 ζれに基づいて,性,年 齢別およびその小計どとの平均と分散を 求めてみると,表43のようになる。乙 の表IC基づき,式(129)等の式によって, 分散表をつくると,表44のようになる。 そ乙で,甲候捕の支持傾向が性と年齢に よってどの程度特徴づけられるかをみる には,式(146)ICより,N= 50, K=2, M=5,σI・

j

=0.0064,σ

=0.176 と置 くと p n v 内 九 u n h v 内 4 u n H V

ω

一 間

∞ 一

r

z u n u -) m l i ご iiFFhU 9 2 r ‘ 、 一 六 り

ω

一 一

- n r ω -( 一 一 F 表42 甲候補支持・不支持の原データ

~

20 30 40 50 60 29 39

49 59

。。

。。

。。

i

N=5 1は支偽 0は不支持を表わす。 表43

20~29 30~39 40~49 50~59 60~ 計 (平均) 0.8 0.8 0.8 0.4 0.2 0.6 男 0.16 0.16 0.16 0.24 0.16 0.24 0.6 0.8 1.0 0.6 0.4 0.68 女 0.24 0.16

0.24 0.24 0.2176 計 0.7 0.8 0.9 0.5 0.3 0.64 (平均) 0.21 0.16 0.09 0.25 0.21 0.2304 上段Xij= Pii ,下段

σ

t

J

= Pij(1 -P tj )

(31)

70 第1部 基 礎 知 識 表44 分 散 表 σ 2 0.2304

a

l

0.0016

a

?

0.0464 σi 0.0528 σE'z 0.008 6 皿2 0.176 4

0.176

a

l

+

a

j- 0.0544

a

?

+

σE

12 0.0544 σj+

0.2288 ai2+

a

j

宅 0.184

ad=

aj-σ I '2 0.0064 ad=ai'-ai 0.0064

N 50 K 1 M 5 となり,性と年齢両者の絡みによる傾向は特に認められないζとがわかる。ちなみに,性別の聞 で支持率に差があるかどうかをみると,式(133)により F50-20.0016 =一一一一一・一一一一一=2-10.2288 0.3357 となり,性別でも差があるとはいえず,また,年齢別では式(138)により Fm-500464 =一一一一・一一一一 =5 -1 0.184 2.8370 表45 測 定 値 となるから,年齢別にはいくぶんの差がみられるが顕著

B, A, 2 3 A, 2 A. B, 3 2 2

2 B.

3

2 4 ではない。 例41 表45のように, A, B 2つの分類基準による 2個ずつ9種類,計18偲の測定値がある。とれをも とにして各分散を計算し,分類効果を検討してみる。ま ず,分類どとの平均と分散を計算し,表46にまとめてみ ると,<'ージナノレから明らかなように

a

l

i

'

=0であ る。そζで式(129)等によって分散表をつくると表47 表46 平均と分散

》ぷご?

B, B, B. 計(平均) (B分類なきとき) A, 2.5 2 0.5 1.6 0.25 0.25 1.2 1 .5 2 1.5 1.6 A,

0.8 0.25 2.25 A.

3 1.6 1 .5 計(平均) 1.6 1.6 1.6 1.6 (A分類なきとき)0.5

8 2.2 1.2 上段%1.j,下段a,]

(32)

1 .6 確率変数の分布 71 のようになる。分類効果はA分類, B分類とも単独では認められないがA,Bの交互作用として は式(146)により 18-3x3 0.5 F= ・ーでー=1.875 (3ーI)X(3-1) 0.6 となり,とれとてあまり顕著とはいえない。 表 47 分 散 表 <72 1.2

σf

σ E 2 0.5

E'2 0.5

0.6 σE'2 0.6 σI+ σE2 0.5 <7

e+

σ E

2 0.5 σi+σ E 2 1.2 ザ

+

a

f

i

1.2 σd=<7j-σi '2 0.5 <7d = <7I12 -<7

1

0.5 N 18 K 3 M 3

1

.

6

確率変数の分布

確率変数の分布についての基礎知識は,後述の諸理論を理解するうえに欠くこ とのできないものである。 1.

6

.

1

母集団と標本

1

変数が一群の数値をとる際,ある確率に従っているとき,確率変数という。た とえば

1

2

3

4

5

なる

5

個の数値をとるような単なる変数と,

5

枚のカード にこれらの数値を記して1枚を引き,現われる数値をとるような変数とは明らか に違いがある。その違いは,前者にはとり方の規則がなく,後者には確率とい う,とり方の規則があることである。 大きさNの集団があり,その集団の構成単位についてzな る 項 目 に 着 目 し て い る と す る 。 構 成 単 位 別 の

z

の値は Xl t X2

・・・

XN (147) と表わされることは,すでに1.3.1(8頁)で説明したヘ * (147)の各町を取るような単なる変数は小文字zで表わし, (148)の確率を伴う場合は大文字Xで 表わす。

表 2 0 1. 5  集団の記述方法 3  49  分 散 表 性別 客体数 満足の意を表明した者 人 数 平均(比率) 分 散 計 8 3 4 3  5 1 0 4  0
表 3 0 1. 5  集団の記述方法 3  61  日! 2  3  4  なきとき2次分割 4  2  7  1 4 . 8 2 5  1 9 . 7  1 9 . 5 5  1 6

参照

関連したドキュメント

(The Elliott-Halberstam conjecture does allow one to take B = 2 in (1.39), and therefore leads to small improve- ments in Huxley’s results, which for r ≥ 2 are weaker than the result

[r]

“Breuil-M´ezard conjecture and modularity lifting for potentially semistable deformations after

lines. Notice that Theorem 4 can be reformulated so as to give the mean harmonic stability of the configuration rather than that of the separate foliations. To this end it is

S., Oxford Advanced Learner's Dictionary of Current English, Oxford University Press, Oxford

this to the reader. Now, we come back to the proof of Step 2. Assume by contradiction that V is not empty.. Let u be the minimal solution with the given boundary values and let P be

At the end of the section, we will be in the position to present the main result of this work: a representation of the inverse of T under certain conditions on the H¨older

支払方法 支払日 ※② 緊急時連絡先等 ※③.