複数の教育段階を用いた分析手法として,
3
章までに用いたMare (1980, 1981)
に端を発するトランジションアプローチが有名であり,質的差異を考慮したモ デルも考案されている(Breen and Jonsson 2000; Karlson 2011 など).これらのモ デルは多くの変数を規定要因として投入することが可能であるが,選択肢の独 立性の問題や階層効果とトラッキングを同時に考慮できないなどの問題を抱え る.そこで本章では,出身家庭背景として多くの変数を使わずに,対数線形モ デルを用いた分析を試みる.対数線形モデルにおいては出身階層の効果とトラ ッキングを同時に扱うことが可能となる.さらに本論では,対数線形モデルの 応用として,対数乗法層化モデル,潜在クラスモデルを分析枠組みに加えてい く.本節では,本章で用いるモデルの特徴を簡単に整理してく.4.2.1
対数線形モデル1
章でも示したように,社会学における社会移動の分析は,移動表(多元ク ロス表)に基づく分析を主としてきた.その基本的な方針は,限られたパラメ ータで移動表の度数を再現することである.対数線形モデル(Log-linear Model)の基本モデルは以下の式であらわされる.
𝐹𝐹
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋= 𝜏𝜏
0𝜏𝜏
𝑖𝑖𝑋𝑋𝜏𝜏
𝑖𝑖𝑋𝑋𝜏𝜏
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋(4.1)
→ log 𝐹𝐹
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋= 𝜇𝜇
0+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋(ただし 𝜇𝜇 = log 𝜏𝜏 )
変数
X
のカテゴリ𝑖𝑖(= 1,2, … , 𝐼𝐼)
,変数Y
のカテゴリ𝑗𝑗(= 1,2, … , 𝐽𝐽)
に対し,2元分 割表XY
のij
セルの度数F
ijは4
つのパラメータの積であらわされる.両辺の対 数を取れば,セル度数の対数値log 𝐹𝐹
𝑖𝑖𝑖𝑖は4
つのパラメータ𝜇𝜇
0, 𝜇𝜇
𝑖𝑖𝑋𝑋, 𝜇𝜇
𝑖𝑖𝑋𝑋, 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋 の和で あらわされる.式(4.1)は,2
元分割表に対する飽和モデル(Saturated model, Fullmodel)と呼ばれ,IJ
個のセルに対してIJ
個のパラメータを推定し,その度数を完全に再現できる.ここで
∀
𝑖𝑖𝑖𝑖; 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋= 0
との仮定を置けば,式(4.1)は81
log 𝐹𝐹
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋= 𝜇𝜇
0+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋 というように書き換えられる.このもとでは,一般的に 度数は完全に再現されない.しかし,このモデルの下で予測されるセル度数と,現実のセル度数(=飽和モデルが予測するセル度数)を比較し,統計的に大き な逸脱がなければ,パラメータを節約したモデルでも分割表が十分に再現され たと判断する.
2
元分割表の場合は最大IJ
個のパラメータを推定したが,3元分割表になる と推定するパラメータの数も増大する.いま,変数XY
に加えて,K個のカテ ゴリを持つ変数Z
を含む3
元分割表を作成したとすると,その際の飽和モデル は,log 𝐹𝐹
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋= 𝜇𝜇
0+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋 (4.2)となる.第
1
項が全体平均(grand mean)パラメータ,第2~4
項が各変数の周 辺度数パラメータ,第5~7
項が2
変数の交互作用パラメータ,第8
項が3
変数 の交互作用パラメータである.2元分割表の際と同様に,最大IJK
個推定され るパラメータのいずれかに制約を課しながら,飽和モデルとのかい離を検討し ていく 1.4.2.2
対数乗法層化モデル対数乗法層化モデル(Log-multiplicative layer effect model)は,対数線形モデル の発展型である.
3
つの変数XYZ
の3
元分割表において,飽和モデルは式(4.2)であらわされた.
∀
𝑖𝑖𝑖𝑖𝑖𝑖; 𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋= 0
とすると,(𝐼𝐼 − 1)(𝐽𝐽 − 1)(𝐾𝐾 − 1)
個のパラメータ を節約し,「どの2
変数の関連も第3
の変数によって影響を受けない」というこ とを仮定することに等しい.対数乗法層化モデルは,飽和モデルよりもパラメ ータを節約しながら,2変数間の関連の変動を求めるモデルである.モデル式 はlog 𝐹𝐹
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋= 𝜇𝜇
0+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝜙𝜙
𝑖𝑖𝑋𝑋 (4.3
) のようにあらわされる.(4.2)では,すべてのセルijk
に対してそれぞれ別個の パラメータを推定したのに対し,(4.3)では,XY
の関連を示すパラメータ𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋に 対して,Zによってのみ変動するパラメータ𝜙𝜙
𝑖𝑖𝑋𝑋を乗じることにより,XYの関 連がZ
によって変動することを表現している.𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋と𝜙𝜙
𝑖𝑖𝑋𝑋が示すものの違いは,図
4.2
ように理解すればよい.𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋を用いて再現されるクロス表では,Z
の値に よって,XY
カテゴリ間の関連の大きさ(図で言うとバーの高さ)の相対的な関 係(パターン)の変動も許容しているのに対し,𝜙𝜙
𝑖𝑖𝑋𝑋を用いて再現されるクロス 表では,Zの値によって関連の大きさは変動するものの,部分分割表内部の相 対的な関係は維持されたまま,比例的な変化をしている.この方法によって,82
パラメータを節約しながら
XY
の関連の大きさがZ
に制約されることを許容す ることができる.式(4.2
)における末項𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋では,パラメータを(𝐼𝐼 − 1)(𝐽𝐽 − 1)(𝐾𝐾 − 1)
個推定したのに対し,式(4.3)の末項で推定しているパラメータ数は(𝐼𝐼 − 1)(𝐽𝐽 − 1) + 𝐾𝐾 − 1
となる.4.2.3
潜在クラスモデル潜在クラスモデルは,対数線形モデルに潜在変数を含んだものとして理解さ れる.3元クロス表
XYZ
に対して,M個のカテゴリを持つ1
つの潜在変数U(=1,…,m,…,M)
を用いるとき,式(4.2
)と同じように,log 𝐹𝐹
𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋= 𝜇𝜇
0+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋とモデルを立てることができる.ただし,このモデルはすべてのパラメータを 推定 できない・ ・ ・ ・ .なぜなら,このモデル(飽和モデル)の推定されるべきパラメ ータは
IJKM
個あるが,観測されている変数はXYZ
の3
つのみであり,推定に 用いるパラメータはIJK
個を超えることはできないからである(識別不能とい う).潜在変数を用いた場合には,対数線形モデルの場合とは異なり,厳密な飽 和モデルは存在せず,いずれかのパラメータに制約をかけた状態を前提とする.個人が観測セル
ijk
に属す確率を𝜋𝜋
𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋とすれば,それは以下のように示される.𝜋𝜋𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋 = � 𝜋𝜋𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋
𝑀𝑀
𝑖𝑖=1
ただし
𝜋𝜋
𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋は個人が潜在変数U
のカテゴリm
に属す確率と,mによる条件付き確率の積であらわされ,
𝜋𝜋
𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋= 𝜋𝜋
𝑖𝑖𝑋𝑋𝜋𝜋
𝑖𝑖𝑖𝑖𝑖𝑖|𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋 である.最も基本的な潜在クラスモデルは,図4.2 対数線形フルモデル(左)と対数乗法層化モデル(右)の違い
83
𝜋𝜋
𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋= 𝜋𝜋
𝑖𝑖𝑋𝑋𝜋𝜋
𝑖𝑖𝑖𝑖𝑖𝑖|𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋= 𝜋𝜋
𝑖𝑖𝑋𝑋𝜋𝜋
𝑖𝑖|𝑖𝑖𝑋𝑋𝑋𝑋𝜋𝜋
𝑖𝑖|𝑖𝑖𝑋𝑋𝑋𝑋𝜋𝜋
𝑖𝑖|𝑖𝑖𝑋𝑋𝑋𝑋 (4.4
) とし,X,Y,Zの分布がそれぞれU
との関連によってのみ決まるということを仮 定する.観測された複数の変数の分布が,潜在的な変数によって決まるという 考え方は,因子分析や項目反応理論と同様である.これらとの違いは,潜在ク ラスモデルにおいてはすべての変数がカテゴリカルであるという点である.式(4.4)を対数線形モデルパラメータを用いて表すと,
log 𝐹𝐹
𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋𝑋𝑋𝑋𝑋= 𝜇𝜇
0+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋+ 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋 (4.5)となる(図
4.3). 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋= 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋= 𝜇𝜇
𝑖𝑖𝑖𝑖𝑋𝑋𝑋𝑋= 0
という制約を置いている.この制約は局 所独立(Local Independence)と呼ばれるが,識別可能性を担保しているという 条件付きでこの制約を外すこともできる.図4.3 潜在クラスモデル概念図
図
4.3
または式(4.5)を基礎とし,潜在クラスモデルは学歴移動表分析への 応用(中澤2011),時系列データへの応用(Hagenaars 1990)や観察されない異
質性への対処(Mare 1993
,1994
),欠測データへの対応(Vermunt 1997
,安田2000)など様々な応用可能性を持つ.本章の分析は潜在クラスモデルの持つ特
徴を多く利用する.4.2.4
修正パスモデル・本論での分析モデル潜在変数を用いた構造方程式モデリングにおいて行われるように,潜在クラ スモデルにおいても潜在変数に対して外生変数を用いてその条件付き分布を求 めることができる.図
4.4
のようにすれば,MIMICモデルと同様の構造が,カ テゴリカルな変数に対して表現できる.本論では,3
章においてMIMIC
モデル の応用であるLRPPC
モデル(およびその特殊系のPPCC
モデル)を採用してき た.本章では図4.4
のモデルを基礎として分析する.異なる情報を示した変数 ではあるが,3
章と同様の枠組みで検討できるモデルを採用することによって,教育達成過程の階層差のとらえ方をより鮮明にできるからである.
図
4.4
の左側には外生変数,中央には潜在変数,右側には目的変数が並ぶ.本章でも,3章同様,外生変数として出身家庭背景を示す変数を用い,複数の 出身家庭背景の情報から,潜在的な階層変数を作成する.潜在的な階層変数が,
各段階の教育内移動に対して影響力を与えるという構図である.このモデルは,
84
外生変数を用いた潜在クラスモデルであり,多項選択に関する
MIMIC
モデルで もあり,Hauser and Andrew
(2006)のLRPPC
モデルのカテゴリ変数版でもある.前項で説明したように,潜在変数の条件付き確率で示される顕在変数
(
Indicator
)にある局所独立の仮定は,必要に応じて外すことができる.本論における中学校,高校,高等教育の
3
変数における局所従属(Local Dependence)は,トラッキング効果に等しい.本章では,3変数に局所従属を認めたモデル を作成する.ここで用いる局所従属は,中学校-高校間の関連と,高校-高等 教育間の関連である 2.
3
章と同様,本章でも階層効果の世代変化に着目する.そのために対数乗法 層化モデルを用いる.潜在クラスモデルにおいても,対数線形モデルと同様に 第3
変数によって2
変数間の関連を比例的に変化させることができる.図4.4
のモデルは,2章で用いたモデルのうち,トランジションごとにコーホートの 変動パターンの違いを認めるCDPC
モデルおよびCDPC2
モデルと同様の構造で ある.2
者の違いは各変数がカテゴリカルであることと,コーホート制約につ いて,3章では線形および2
次曲線としてパラメトライズされた変化を扱った のに対し,本章ではカテゴリカルに区分されたコーホートが独立した変化をし ていることを許容する.したがって,コーホートによって直線状,2
次曲線状 の変化に限らず,ジグザグな変化パターンや特定のコーホートのみで不平等が 著しく変化するというようなパターンを抽出することもできる.図4.4 本論のモデル
図4.5 階層効果とトラッキング概念図
85