対数線形モデルと潜在クラスモデル - 教育達成過程における階層差生成のダイナミクス -選抜制度と不平等に関する計量・シミュレーションアプローチ-

複数の教育段階を用いた分析手法として，

3

章までに用いた

Mare (1980, 1981)

に端を発するトランジションアプローチが有名であり，質的差異を考慮したモデルも考案されている（Breen and Jonsson 2000; Karlson 2011 など）．これらのモデルは多くの変数を規定要因として投入することが可能であるが，選択肢の独立性の問題や階層効果とトラッキングを同時に考慮できないなどの問題を抱える．そこで本章では，出身家庭背景として多くの変数を使わずに，対数線形モデルを用いた分析を試みる．対数線形モデルにおいては出身階層の効果とトラッキングを同時に扱うことが可能となる．さらに本論では，対数線形モデルの応用として，対数乗法層化モデル，潜在クラスモデルを分析枠組みに加えていく．本節では，本章で用いるモデルの特徴を簡単に整理してく．

4.2.1

対数線形モデル

1

章でも示したように，社会学における社会移動の分析は，移動表（多元クロス表）に基づく分析を主としてきた．その基本的な方針は，限られたパラメータで移動表の度数を再現することである．対数線形モデル（Log-linear Model）

の基本モデルは以下の式であらわされる．

𝐹𝐹

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

= 𝜏𝜏

₀

𝜏𝜏

_𝑖𝑖^𝑋𝑋

𝜏𝜏

_𝑖𝑖^𝑋𝑋

𝜏𝜏

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

（4.1）

→ log 𝐹𝐹

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

= 𝜇𝜇

₀

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

(ただし 𝜇𝜇 = log 𝜏𝜏 )

変数

X

のカテゴリ

𝑖𝑖(= 1,2, … , 𝐼𝐼)

，変数

Y

のカテゴリ

𝑗𝑗(= 1,2, … , 𝐽𝐽)

に対し，2元分割表

XY

の

ij

セルの度数

F

_ijは

4

つのパラメータの積であらわされる．両辺の対数を取れば，セル度数の対数値

log 𝐹𝐹

𝑖𝑖𝑖𝑖は

4

つのパラメータ

𝜇𝜇

, 𝜇𝜇

_𝑖𝑖^𝑋𝑋

, 𝜇𝜇

_𝑖𝑖^𝑋𝑋

, 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋} の和であらわされる．式（4.1）は，

2

元分割表に対する飽和モデル（Saturated model, Full

model）と呼ばれ，IJ

個のセルに対して

IJ

個のパラメータを推定し，その度数

を完全に再現できる．ここで

∀

𝑖𝑖𝑖𝑖

; 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

= 0

との仮定を置けば，式（4.1）は

log 𝐹𝐹

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

= 𝜇𝜇

₀

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋 というように書き換えられる．このもとでは，一般的に度数は完全に再現されない．しかし，このモデルの下で予測されるセル度数と，

現実のセル度数（＝飽和モデルが予測するセル度数）を比較し，統計的に大きな逸脱がなければ，パラメータを節約したモデルでも分割表が十分に再現されたと判断する．

2

元分割表の場合は最大

IJ

個のパラメータを推定したが，3元分割表になると推定するパラメータの数も増大する．いま，変数

XY

に加えて，K個のカテゴリを持つ変数

Z

を含む

3

元分割表を作成したとすると，その際の飽和モデルは，

log 𝐹𝐹

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}

= 𝜇𝜇

₀

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋} （4.2）

となる．第

1

項が全体平均（grand mean）パラメータ，第

2～4

項が各変数の周辺度数パラメータ，第

5～7

項が

2

変数の交互作用パラメータ，第

8

項が

3

変数の交互作用パラメータである．2元分割表の際と同様に，最大

IJK

個推定されるパラメータのいずれかに制約を課しながら，飽和モデルとのかい離を検討していく ¹．

4.2.2

対数乗法層化モデル

対数乗法層化モデル(Log-multiplicative layer effect model)は，対数線形モデルの発展型である．

3

つの変数

XYZ

の

3

元分割表において，飽和モデルは式（4.2）

であらわされた．

∀

𝑖𝑖𝑖𝑖𝑖𝑖

; 𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}

= 0

とすると，

(𝐼𝐼 − 1)(𝐽𝐽 − 1)(𝐾𝐾 − 1)

個のパラメータを節約し，「どの

2

変数の関連も第

3

の変数によって影響を受けない」ということを仮定することに等しい．対数乗法層化モデルは，飽和モデルよりもパラメータを節約しながら，2変数間の関連の変動を求めるモデルである．モデル式は

log 𝐹𝐹

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}

= 𝜇𝜇

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

𝜙𝜙

_𝑖𝑖^𝑋𝑋 （

4.3

）のようにあらわされる．（4.2）では，すべてのセル

ijk

に対してそれぞれ別個のパラメータを推定したのに対し，（4.3）では，

XY

の関連を示すパラメータ

𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}に対して，Zによってのみ変動するパラメータ

𝜙𝜙

_𝑖𝑖^𝑋𝑋を乗じることにより，XYの関連が

Z

によって変動することを表現している．

𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}と

𝜙𝜙

_𝑖𝑖^𝑋𝑋が示すものの違いは，

図

4.2

ように理解すればよい．

𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}を用いて再現されるクロス表では，

Z

の値によって，

XY

カテゴリ間の関連の大きさ（図で言うとバーの高さ）の相対的な関係（パターン）の変動も許容しているのに対し，

𝜙𝜙

_𝑖𝑖^𝑋𝑋を用いて再現されるクロス表では，Zの値によって関連の大きさは変動するものの，部分分割表内部の相対的な関係は維持されたまま，比例的な変化をしている．この方法によって，

パラメータを節約しながら

XY

の関連の大きさが

Z

に制約されることを許容することができる．式（

4.2

）における末項

𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}では，パラメータを

(𝐼𝐼 − 1)(𝐽𝐽 − 1)(𝐾𝐾 − 1)

個推定したのに対し，式（4.3）の末項で推定しているパラメータ数は

(𝐼𝐼 − 1)(𝐽𝐽 − 1) + 𝐾𝐾 − 1

となる．

4.2.3

潜在クラスモデル

潜在クラスモデルは，対数線形モデルに潜在変数を含んだものとして理解される．3元クロス表

XYZ

に対して，M個のカテゴリを持つ

1

つの潜在変数

U(=1,…,m,…,M)

を用いるとき，式（

4.2

）と同じように，

log 𝐹𝐹

_{𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋}

= 𝜇𝜇

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

𝑖𝑖𝑋𝑋

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋}

とモデルを立てることができる．ただし，このモデルはすべてのパラメータを推定できない^・ ^・ ^・ ^・．なぜなら，このモデル（飽和モデル）の推定されるべきパラメータは

IJKM

個あるが，観測されている変数は

XYZ

の

3

つのみであり，推定に用いるパラメータは

IJK

個を超えることはできないからである（識別不能という）．潜在変数を用いた場合には，対数線形モデルの場合とは異なり，厳密な飽和モデルは存在せず，いずれかのパラメータに制約をかけた状態を前提とする．

個人が観測セル

ijk

に属す確率を

𝜋𝜋

_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋}とすれば，それは以下のように示される．

𝜋𝜋_{𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋} = � 𝜋𝜋_{𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋}

𝑀𝑀

𝑖𝑖=1

ただし

𝜋𝜋

_{𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋}は個人が潜在変数

U

のカテゴリ

m

に属す確率と，mによる条件付

き確率の積であらわされ，

𝜋𝜋

_{𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋}

= 𝜋𝜋

_𝑖𝑖^𝑋𝑋

𝜋𝜋

_{𝑖𝑖𝑖𝑖𝑖𝑖|𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋} である．最も基本的な潜在クラスモデルは，

図4.2 対数線形フルモデル（左）と対数乗法層化モデル（右）の違い

𝜋𝜋

_{𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋}

= 𝜋𝜋

𝑖𝑖𝑋𝑋

𝜋𝜋

_{𝑖𝑖𝑖𝑖𝑖𝑖|𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋}

= 𝜋𝜋

𝑖𝑖𝑋𝑋

𝜋𝜋

_{𝑖𝑖|𝑖𝑖}^{𝑋𝑋𝑋𝑋}

𝜋𝜋

_{𝑖𝑖|𝑖𝑖}^{𝑋𝑋𝑋𝑋}

𝜋𝜋

_{𝑖𝑖|𝑖𝑖}^{𝑋𝑋𝑋𝑋} （

4.4

）とし，X,Y,Zの分布がそれぞれ

U

との関連によってのみ決まるということを仮定する．観測された複数の変数の分布が，潜在的な変数によって決まるという考え方は，因子分析や項目反応理論と同様である．これらとの違いは，潜在クラスモデルにおいてはすべての変数がカテゴリカルであるという点である．式

（4.4）を対数線形モデルパラメータを用いて表すと，

log 𝐹𝐹

_{𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋}

= 𝜇𝜇

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

_𝑖𝑖^𝑋𝑋

+ 𝜇𝜇

𝑖𝑖𝑋𝑋

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

+ 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋} （4.5）

となる（図

4.3）． 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

= 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

= 𝜇𝜇

_{𝑖𝑖𝑖𝑖}^{𝑋𝑋𝑋𝑋}

= 0

という制約を置いている．この制約は局所独立（Local Independence）と呼ばれるが，識別可能性を担保しているという条件付きでこの制約を外すこともできる．

図4.3 潜在クラスモデル概念図

図

4.3

または式（4.5）を基礎とし，潜在クラスモデルは学歴移動表分析への応用（中澤

2011），時系列データへの応用（Hagenaars 1990）や観察されない異

質性への対処（

Mare 1993

，

1994

），欠測データへの対応（

Vermunt 1997

，安田

2000）など様々な応用可能性を持つ．本章の分析は潜在クラスモデルの持つ特

徴を多く利用する．

4.2.4

修正パスモデル・本論での分析モデル

潜在変数を用いた構造方程式モデリングにおいて行われるように，潜在クラスモデルにおいても潜在変数に対して外生変数を用いてその条件付き分布を求めることができる．図

4.4

のようにすれば，MIMICモデルと同様の構造が，カテゴリカルな変数に対して表現できる．本論では，

3

章において

MIMIC

モデルの応用である

LRPPC

モデル（およびその特殊系の

PPCC

モデル）を採用してきた．本章では図

4.4

のモデルを基礎として分析する．異なる情報を示した変数ではあるが，

3

章と同様の枠組みで検討できるモデルを採用することによって，

教育達成過程の階層差のとらえ方をより鮮明にできるからである．

図

4.4

の左側には外生変数，中央には潜在変数，右側には目的変数が並ぶ．

本章でも，3章同様，外生変数として出身家庭背景を示す変数を用い，複数の出身家庭背景の情報から，潜在的な階層変数を作成する．潜在的な階層変数が，

各段階の教育内移動に対して影響力を与えるという構図である．このモデルは，

外生変数を用いた潜在クラスモデルであり，多項選択に関する

MIMIC

モデルでもあり，

Hauser and Andrew

（2006）の

LRPPC

モデルのカテゴリ変数版でもある．

前項で説明したように，潜在変数の条件付き確率で示される顕在変数

（

Indicator

）にある局所独立の仮定は，必要に応じて外すことができる．本論に

おける中学校，高校，高等教育の

3

変数における局所従属（Local Dependence）

は，トラッキング効果に等しい．本章では，3変数に局所従属を認めたモデルを作成する．ここで用いる局所従属は，中学校－高校間の関連と，高校－高等教育間の関連である ²．

3

章と同様，本章でも階層効果の世代変化に着目する．そのために対数乗法層化モデルを用いる．潜在クラスモデルにおいても，対数線形モデルと同様に第

3

変数によって

2

変数間の関連を比例的に変化させることができる．図

4.4

のモデルは，2章で用いたモデルのうち，トランジションごとにコーホートの変動パターンの違いを認める

CDPC

モデルおよび

CDPC2

モデルと同様の構造である．

2

者の違いは各変数がカテゴリカルであることと，コーホート制約について，3章では線形および

2

次曲線としてパラメトライズされた変化を扱ったのに対し，本章ではカテゴリカルに区分されたコーホートが独立した変化をしていることを許容する．したがって，コーホートによって直線状，

2

次曲線状の変化に限らず，ジグザグな変化パターンや特定のコーホートのみで不平等が著しく変化するというようなパターンを抽出することもできる．

図4.4 本論のモデル

図4.5 階層効果とトラッキング概念図

ドキュメント内教育達成過程における階層差生成のダイナミクス -選抜制度と不平等に関する計量・シミュレーションアプローチ- (ページ 86-91)