RaschモデルとGLIM
小 島 秀 夫*・篠 原 清 夫**
(1993年10月18日受理)
Rasch Models and GLIM
Hideo KOJIMA and Sugao SHINoHARA
(Received October 18,1993)
問 題
社会学においてOtis D.Duncanの主要な貢献としては,社会調査データ解析へのパス解析の導入と Raschモデルの導入をあげることができる1)。前者のパス解析は,今日では社会調査データ解析の標 準的な手法となっている。これに対して後者のRaschモデルは,その潜在的重要性にもかかわらず,
社会調査のデータ解析においては,ほとんど使用されていない2)。わが国の社会学においては,まっ たく注目されていない。なぜ後者のDuncanの研究が注目されないのであろうか。その理由を次のよ うに考えることができるであろう。すなわち,パス解析は重回帰分析の応用であり,重回帰分析を 理解すれば統計パッケージを使用することによって,パス解析を実施することは容易である。これ に対してRaschモデルの場合には,統計パッケージを機械的に使用することによっては最適モデルが 得られるとは必らずしも限らず,モデルの改良をする必要が生じ,そのために統計パッケージのよ
り特殊な使用法の学習が強いられる。これがかなり負担になり,社会学者によるRaschモデルの使用 をさまたげる結果となっていると考えられる。同時に,Raschモデルはパス解析と比較して,モデル の表現も複雑であるため,モデル自体の理解を困難にしていることも理由の1つとして考えられよう。
本稿の目的は,Duncanによって使用されたRaschモデルの設定方法をコンピュータ・プログラム GLIM(Generalised Linear Modelling) 1を使用して,示すことである。 Duncan自身は, Raschモデルの一一 連の研究において,コンピュータ・プログラムFREQを使用しているが,すでにGLIMを使用した Raschモデルの設定方法の解明についてはいくつかの研究がなされており〃),本研究はその延長線上 に位置づけられるものである。
*茨城大学教育学部社会情報研究室(〒310茨城県水戸市文京2丁目1−1).
**常磐大学大学院(〒310 茨城県水戸市見和1丁目430−1).
Raschモデル
いま,表1のようなデータが与えられた場合に,Raschモデルの構成方法を説明しよう )。表1の 上部はパネル調査の結果であり,変数AとBはある製品のコマーシャルを見たかどうかを示すもの であり,1は「見た」,0は「見なかった」を示している。変数CとDはその製品を購入したかどう かを示すものであり,1は製品を「購入した⊥0は「購入しなかった」をそれぞれ示している。時 間的には,変数AとCは同時に測定されたものであり,変数BとDは時間をおいて同時に測定され たものである。
表1データと期待度数
C D C D C D C D
A B l l 1 0 0 1 0 0
1 1 −一一一一一一・ 83 8 22 68
1 0 −一一一一一一・ 35 7 11 28
O l _______. 25 10 8 32
0 0 −一一一一葡一・ 95 15 6 493
1 1−一一一一一一・ βδS22 βS21 βδS21 βS2。
1 0 −一一一一一一・δSi2 Sll δSII SK。
0 1 −一一一一一一・βδS、2 βSI1 βδSl、 βS1。
0 0 −一一一一一一゜δSo2 SOl δSo且 Soo
ここで,ある個人が最初の調査において変数Aに対して1と反応する確率は,
ακ!
垂窒盾aiA=11κ、)=
@ (1+ακ,)
と表わされる。同様に,その個人が次回の調査において変数Bに対して1と反応する確率は,
βκ,prob(B=11κ、)=
@ (1+βκ,)
と表すことができる。κ,は,ある個人に与えられる潜在変数上の値である。αとβは個人に関係しな いパラメータであり,調査時点の影響や時代精神など個人が他の場合と異なる反応をしていること を示すパラメータである。試験問題などの場合には,問題の難しさを示すパラメータである6)。
このモデルの特性は,個人と変数に同一の尺度が使用されていることである。尺度の起点を確定
するために,通常はα=1とする。したがって,変数AとBは潜在変数κの指標となる。同様に,変
数CとDは潜在変数yの指標となり,それぞれ P・・b(C−lly」「巻
の,prob(D=llッ,)=
@ 1+δy、
と表わされる。さらに,局所独立性を仮定すると,ある個人が変数A,B, C, Dに反応する確i率は,
βbδdκ1+byf+d
@ (M1)P、㏄d、=
@ ム
と表わされる。a, b, c, dは,それぞれ1か0の数値をとり,たとえばP1。。liはある個人が変数Aに 対して1と反応し,変数Bに対しては0,変数Cに対しては0,そして変数Dに対しては1と反応す る確率を示すものである。a+bとc+dは,それぞれ0,1,2の値をとる。分母の△は,
△、=(1+xt)(1+β銑)(1+y,)(1+δ沙,)
である。したがって,サンプル数nの場合の期待度数は,掴入 を合計することによって,
堀一熱Fびδ鷺(α+bc+dXi yi△、)
と表わされる。ここでさらにΣの右側をS。.、,。+、とすれば,この式は,
F。㏄、=βうδdS、.α,.、 (H1)
と書きかえることができる。期待度数が表1の下部に示されている。ここで,M1は個人の反応パター ンを示したものであるのに対し,H1はサンプル全体についての期待度数の形で表現されていること に留意する必要がある。GLIMで計算する場合には,表2に示されたようなデザイン・マトリックス を作る必要がある。
M1あるいはH1で示されるモデルは基本的なものであるが,因果関係を考慮したモデルを作るこ とが可能である。すなわち,M1において銑とy,のかわりに,ゴ、=β。議, y、=δ。,hy,という因果関係 を考慮したモデルである。β、,、に4つの組合せがあり,δ。、にも4つの組合せがある。パラメータβ は変数CとDに対する反応の変数Bに対する効果を示しており,同様にパラメータδは変数AとBに 対する反応が変数Dに与える効果を示している。したがって,各変数に対する個人¢の反応は,
P・・b(A=alx,)≒転
(β,,、κ,)δ 垂窒盾aiB=δ1κ、, C, D)=
@ 1+βの、κ,
ylprob(C雲oly、)=
@ 1+y,
(δ。,、y、)d 垂窒盾aiD=41y、, A, B)=
@ 1+δ。,りy,
表2デザイン・マトリックス
セル β δ S22 S、、 S、。 Sl2 SII S、。 S。2 S。1 S。。
1 1 1 1 0 0 0 0 0 0 0 0
2 1 0 0 1 0 0 0 0 0 0 0
3 1 1 0 1 0 0 0 0 0 0 0
4 1 0 0 0 1 0 0 0 0 0 0
5 0 1 0 0 0 1 0 0 0 0 0
6 0 0 0 0 0 0 1 0 0 0 0
7 0 1 0 0 0 0 1 0 0 0 0
8 0 0 0 0 0 0 0 1 0 0 0
9 1 1 0 0 0 1 0 0 0 0 0
10 1 0 0 0 0 0 1 0 0 0 0
11 1 1 0 0 0 0 1 0 0 0 0
12 1 0 0 0 0 0 0 1 0 0 0
13 0 1 0 0 0 0 0 0 1 0 0
14 0 0 0 0 0 0 0 0 0 1 0
15 0 1 0 0 0 0 0 0 0 1 0
16 0 0 0 0 0 0 0 0 0 0 1
と表わされ,局所独立性を仮定すると,個人fの反応パターンは,
β劉、δ窃誠δッ〆P、加d,= (M7) (1+x,)(1+βo、舶)(1+ッ、)(1+δの瓦y,)
と表わされる。しかしながら,このモデルM7は飽和モデルであるばかりでなく,このモデルの下で はβ囲とδ、由を求めることはできない。モデルM7においてβ、蝿=βとδ袖=δとするとモデルM1 を得ることができる。したがって,モデルM1はM7の特殊ケースといえる。モデルM7においてβ。州
=βとすると,
βδδ憲認δゾd
o舳= (M5) (1+xt)(1+β叉,)(1+ごy、X1+δの4y,)