第 2 章 分析手法とデータ
2.1.1 きょうだいの学歴の分析手法: マルチレベルモデル
本研究における学歴についての実証分析には,家族的属性を第二水準(レベ
ル2),個人的属性を第一水準(レベル 1)とした2 レベルのマルチレベルモデ
ルを用いる.マルチレベルモデルとは,データが階層的な構造になっている場 合の分析手法として開発されたものである(Kreft and Leeuw 1998; Raudenbush and Bryk 2002).階層的な構造とは,たとえば個人が学校に属しており,その学 校がある地域に属しているというように,データが入れ子状になっていること を意味する.本研究ではきょうだいデータを用いるが,その構造を図にすると 図2.1のようになる.家族の中に子どもが入れ子状になっている(=ネストして いる)状態であるため,マルチレベルモデルによる推定を行うのがよい.
家族 A
レベル2
(家族的
属性)
家族 B 家族 C
個人1 個人2 個人3
個人4 個人5
個人6
レベル1
(個人的 属性)
親の学歴やきょうだい規模など家族に共通の要因 は、その家族に属する個人に同じように影響を与え ることを想定
性別や出生順位などの個人に特有の状況は、その 個人にのみ影響を与えることを想定
⊂
図2.1 データの構造
40
線形のマルチレベルモデルにおいて,たとえば従属変数を教育年数y𝑖𝑖𝑖𝑖とする 場合には以下のようなモデルを用いる.まず,切片と誤差項だけで推定を行う ヌルモデルは,
レベル1
y𝑖𝑖𝑖𝑖 = 𝛽𝛽0𝑖𝑖 +𝑟𝑟𝑖𝑖𝑖𝑖 レベル2
𝛽𝛽0𝑖𝑖 = 𝛾𝛾00+𝑢𝑢0𝑖𝑖 であり,それらを合わせて
y𝑖𝑖𝑖𝑖 = 𝛾𝛾00+𝑢𝑢0𝑖𝑖 +𝑟𝑟𝑖𝑖𝑖𝑖
で推定される.添え字のiは個人を,jは家族を意味する.β0jはレベル2であ る家族水準の切片,u0jは家族水準の誤差項,そしてrijはレベル 1である個人水 準での誤差項である.
続いて,家族的属性である父親教育年数(feduy)をレベル 2 の家族水準に,
個人的属性である性別(sex)をレベル 1の個人水準に投入したモデルは,
レベル1
y𝑖𝑖𝑖𝑖 = 𝛽𝛽0𝑖𝑖+𝛽𝛽1𝑖𝑖�sex𝑖𝑖𝑖𝑖�+𝑟𝑟𝑖𝑖𝑖𝑖 レベル2
𝛽𝛽0𝑖𝑖 = 𝛾𝛾00+𝛾𝛾01(feduy) +𝑢𝑢0𝑖𝑖 𝛽𝛽1𝑖𝑖 = 𝛾𝛾10
となる.レベル 2 に独立変数が投入されたことによって,切片β0jの推定値が 変化するようになっている.
マルチレベルモデルでは,従属変数に量的変数ではなく質的変数を用いるこ とも可能である.そこで本研究では,マルチレベル多項ロジットモデルを用い た分析を行う.たとえば学歴を教育年数ではなく卒業した学校によって分類し,
「四年制大学以上」=1,「短期大学・高等専門学校」=2,「それ以外」=3 に分類 したとしよう.加えて,先ほどと同様に子どもの性別をレベル1に,父親教育
41
年数をレベル2に投入するモデルを考えてみる.まず閾値のみで推定を行うヌ ルモデルは,以下の式で表現される.レベル1のモデルは,
P[y(1) = 1|β] = P(1) P[y(2) = 1|β] = P(2) P[y(3) = 1|β] = 1−P(1)−P(2) 四年制大学/それ以外 log [P(1)P(3)] =𝛽𝛽0𝑖𝑖(1)
短期大学・高等専門学校/それ以外 log [P(2)P(3)] =𝛽𝛽0𝑖𝑖(2)
となる.そして,レベル2 のモデルは,
𝛽𝛽0𝑖𝑖(1) =𝛾𝛾00(1) +𝑢𝑢0𝑖𝑖(1) 𝛽𝛽0𝑖𝑖(2)= 𝛾𝛾00(2) +𝑢𝑢0𝑖𝑖(2)
である.𝛽𝛽0𝑖𝑖は各カテゴリにおけるレベル 1切片の固定効果,𝛾𝛾00はレベル2切 片の固定効果,𝑢𝑢0𝑖𝑖は切片のランダム効果を示している.続いて,ヌルモデル に性別と父親教育年数を追加した場合を例として提示する.レベル1 のモデル は,
log�P(1)P(3)�= 𝛽𝛽0𝑖𝑖(1) +𝛽𝛽1𝑖𝑖�sex𝑖𝑖𝑖𝑖� log�P(2)P(3)�= 𝛽𝛽0𝑖𝑖(2) +𝛽𝛽1𝑖𝑖�sex𝑖𝑖𝑖𝑖�
と表現される.𝛽𝛽1𝑖𝑖は性別の固定効果である.また,このときのレベル2のモデ ルは,
四年制大学以上/それ以外
𝛽𝛽01= 𝛾𝛾00(1) + 𝛾𝛾01(1)(feduy) + 𝑢𝑢0𝑖𝑖(1)
42 𝛽𝛽1𝑖𝑖= 𝛾𝛾10(1) 短期大学・高等専門学校/それ以外
𝛽𝛽02= 𝛾𝛾00(2) + 𝛾𝛾01(2)(feduy) + 𝑢𝑢0𝑖𝑖(2) 𝛽𝛽1𝑖𝑖= 𝛾𝛾10(2)
と表現される.