• 検索結果がありません。

RaschモデルとGLIM 小 島 秀 夫*・篠 原 清 夫**

N/A
N/A
Protected

Academic year: 2021

シェア "RaschモデルとGLIM 小 島 秀 夫*・篠 原 清 夫**"

Copied!
15
0
0

読み込み中.... (全文を見る)

全文

(1)

RaschモデルとGLIM

小 島 秀 夫*・篠 原 清 夫**

(1993年10月18日受理)

Rasch Models and GLIM

Hideo KOJIMA and Sugao SHINoHARA

(Received October 18,1993)

問  題

社会学においてOtis D.Duncanの主要な貢献としては,社会調査データ解析へのパス解析の導入と Raschモデルの導入をあげることができる1)。前者のパス解析は,今日では社会調査データ解析の標 準的な手法となっている。これに対して後者のRaschモデルは,その潜在的重要性にもかかわらず,

社会調査のデータ解析においては,ほとんど使用されていない2)。わが国の社会学においては,まっ たく注目されていない。なぜ後者のDuncanの研究が注目されないのであろうか。その理由を次のよ うに考えることができるであろう。すなわち,パス解析は重回帰分析の応用であり,重回帰分析を 理解すれば統計パッケージを使用することによって,パス解析を実施することは容易である。これ に対してRaschモデルの場合には,統計パッケージを機械的に使用することによっては最適モデルが 得られるとは必らずしも限らず,モデルの改良をする必要が生じ,そのために統計パッケージのよ

り特殊な使用法の学習が強いられる。これがかなり負担になり,社会学者によるRaschモデルの使用 をさまたげる結果となっていると考えられる。同時に,Raschモデルはパス解析と比較して,モデル の表現も複雑であるため,モデル自体の理解を困難にしていることも理由の1つとして考えられよう。

本稿の目的は,Duncanによって使用されたRaschモデルの設定方法をコンピュータ・プログラム GLIM(Generalised Linear Modelling) 1を使用して,示すことである。 Duncan自身は, Raschモデルの一一 連の研究において,コンピュータ・プログラムFREQを使用しているが,すでにGLIMを使用した Raschモデルの設定方法の解明についてはいくつかの研究がなされており〃),本研究はその延長線上 に位置づけられるものである。

*茨城大学教育学部社会情報研究室(〒310茨城県水戸市文京2丁目1−1).

**常磐大学大学院(〒310 茨城県水戸市見和1丁目430−1).

(2)

Raschモデル

いま,表1のようなデータが与えられた場合に,Raschモデルの構成方法を説明しよう )。表1の 上部はパネル調査の結果であり,変数AとBはある製品のコマーシャルを見たかどうかを示すもの であり,1は「見た」,0は「見なかった」を示している。変数CとDはその製品を購入したかどう かを示すものであり,1は製品を「購入した⊥0は「購入しなかった」をそれぞれ示している。時 間的には,変数AとCは同時に測定されたものであり,変数BとDは時間をおいて同時に測定され たものである。

表1データと期待度数

C  D        C  D        C  D        C  D

A   B       l  l       1  0       0  1       0  0

1     1 −一一一一一一・  83       8       22      68

1     0 −一一一一一一・  35      7       11       28

O     l _______.  25      10       8       32

0    0 −一一一一葡一・  95      15       6       493

1    1−一一一一一一・ βδS22        βS21      βδS21        βS2。

1    0 −一一一一一一・δSi2       Sll       δSII       SK。

0    1 −一一一一一一・βδS、2         βSI1      βδSl、         βS1。

0    0 −一一一一一一゜δSo2       SOl       δSo且       Soo

ここで,ある個人が最初の調査において変数Aに対して1と反応する確率は,

        ακ!

垂窒盾aiA=11κ、)=

@      (1+ακ,)

と表わされる。同様に,その個人が次回の調査において変数Bに対して1と反応する確率は,

        βκ,prob(B=11κ、)=

@      (1+βκ,)

と表すことができる。κ,は,ある個人に与えられる潜在変数上の値である。αとβは個人に関係しな いパラメータであり,調査時点の影響や時代精神など個人が他の場合と異なる反応をしていること を示すパラメータである。試験問題などの場合には,問題の難しさを示すパラメータである6)。

このモデルの特性は,個人と変数に同一の尺度が使用されていることである。尺度の起点を確定

するために,通常はα=1とする。したがって,変数AとBは潜在変数κの指標となる。同様に,変

(3)

数CとDは潜在変数yの指標となり,それぞれ P・・b(C−lly」「巻

        の,prob(D=llッ,)=

@      1+δy、

と表わされる。さらに,局所独立性を仮定すると,ある個人が変数A,B, C, Dに反応する確i率は,

   βbδdκ1+byf+d

@       (M1)P、㏄d、=

@    ム

と表わされる。a, b, c, dは,それぞれ1か0の数値をとり,たとえばP1。。liはある個人が変数Aに 対して1と反応し,変数Bに対しては0,変数Cに対しては0,そして変数Dに対しては1と反応す る確率を示すものである。a+bとc+dは,それぞれ0,1,2の値をとる。分母の△は,

△、=(1+xt)(1+β銑)(1+y,)(1+δ沙,)

である。したがって,サンプル数nの場合の期待度数は,掴入 を合計することによって,

堀一熱Fびδ鷺(α+bc+dXi yi△、)

と表わされる。ここでさらにΣの右側をS。.、,。+、とすれば,この式は,

F。㏄、=βうδdS、.α,.、      (H1)

と書きかえることができる。期待度数が表1の下部に示されている。ここで,M1は個人の反応パター ンを示したものであるのに対し,H1はサンプル全体についての期待度数の形で表現されていること に留意する必要がある。GLIMで計算する場合には,表2に示されたようなデザイン・マトリックス を作る必要がある。

M1あるいはH1で示されるモデルは基本的なものであるが,因果関係を考慮したモデルを作るこ とが可能である。すなわち,M1において銑とy,のかわりに,ゴ、=β。議, y、=δ。,hy,という因果関係 を考慮したモデルである。β、,、に4つの組合せがあり,δ。、にも4つの組合せがある。パラメータβ は変数CとDに対する反応の変数Bに対する効果を示しており,同様にパラメータδは変数AとBに 対する反応が変数Dに与える効果を示している。したがって,各変数に対する個人¢の反応は,

P・・b(A=alx,)≒転

         (β,,、κ,)δ 垂窒盾aiB=δ1κ、, C, D)=

@        1+βの、κ,

       ylprob(C雲oly、)=

@      1+y,

         (δ。,、y、)d 垂窒盾aiD=41y、, A, B)=

@        1+δ。,りy,

(4)

表2デザイン・マトリックス

セル   β   δ   S22  S、、  S、。  Sl2  SII  S、。  S。2  S。1  S。。

1  1  1  1  0  0  0  0  0  0  0  0

2      1      0      0      1      0      0      0      0      0      0      0

3      1      1      0      1      0      0      0      0      0      0      0

4      1      0      0      0      1      0      0      0      0      0      0

5      0      1      0      0      0      1      0      0      0      0      0

6      0      0      0      0      0      0      1      0      0      0      0

7      0      1      0      0      0      0      1      0      0      0      0

8  0  0  0  0  0  0  0  1  0  0  0

9      1      1      0      0      0      1      0      0      0      0      0

10  1  0  0  0  0  0  1  0  0  0  0

11  1   1  0  0   0  0   1  0   0  0   0

12  1  0  0  0  0  0  0  1  0  0  0

13     0      1      0      0      0      0      0      0      1      0      0

14     0      0      0      0      0      0      0      0      0      1      0

15     0      1      0      0      0      0      0      0      0      1      0

16  0  0  0  0  0  0  0  0  0  0  1

と表わされ,局所独立性を仮定すると,個人fの反応パターンは,

      β劉、δ窃誠δッ〆P、加d,=      (M7)  (1+x,)(1+βo、舶)(1+ッ、)(1+δの瓦y,)

と表わされる。しかしながら,このモデルM7は飽和モデルであるばかりでなく,このモデルの下で はβ囲とδ、由を求めることはできない。モデルM7においてβ、蝿=βとδ袖=δとするとモデルM1 を得ることができる。したがって,モデルM1はM7の特殊ケースといえる。モデルM7においてβ。州

=βとすると,

      βδδ憲認δゾd

o舳=      (M5)  (1+xt)(1+β叉,)(1+ごy、X1+δの4y,)

が得られ,δ晒=δとすると,

(5)

       β宅,ρdκ1+占yf+d

@  (1+κ、)(1+β、,、r,)(1+:y,)(1+δly、)

が得られる。しかしながら,モデルM5においてはパラメータβを求めることができず, M6ではδ を求めることはできない。ここで,モデルM7においてβ、。=β。1,δ。1=δ。1という制約をつけると,

モデルM7は,

       β農、δ名頑+サd

@  (1+x、)(1+β,、函,)(1+y、Xl+δ。.捉ソ,)

となる。モデルM4において,δ。.、=δとするとモデルM3が得られ,β。.d=βとするとモデルM2 を得ることができる。モデルH1, H2, H3, H4のGLIMによる構成は,以下のようになる。データ の入力はスペースの関係で横に長く入力してあるが,最初の部分は分析されるデータそのままに入 力してあるので,他の部分もそれに合わせると理解が容易になる。

¥CTHIS IS GLIM RUNSTREAM FOR MODELS HLH2,H3 AND H4

¥CFOR PANEL DATA ANALYSIS

¥UNITS l6

¥DATA M

¥READ

8382268 3571128 2510832 95156493

¥CBREFERS TO PARAMETER BETA

¥DATA B

¥READ

1 1 1 1

0000

1 1 1 1

0000 ¥CDREFERS TO PARAMETER DELTA

¥DATA D

¥READ

10 10 10 1010101010

¥CDEFINE STRATUM PARAMETERS HERE

¥DATA S22

¥READ

1000000000000000

¥DATA S21

¥READ

(6)

0 1 10000000000000

¥DATA S20

¥READ

000 10 0 000 0000000

¥DATA S12

¥READ

0 0 00 1 0 0 0 10 00 0 0 0 0

¥DATA S11

¥READ

00000 11001 100000

¥DATA S10

¥READ

0000000 1000 10000

¥DATA SO2

¥READ

0000000000001000

¥DATA SO1

¥READ

0000000000000 110

¥DATA SOO

¥READ

000000000000000 1

¥CDO,DI AND D2 REFER TO DELTA PARAMETERS WITH MODIFICATION

¥DATA D2

¥READ

10 10 000 000 00000 0

¥DATA D1

¥READ

0000101010 100000

¥DATA DO

¥READ

000000000000 1010

¥CBO,BI AND D2 REFER TO DELTA PARAMETERS WITH MODIFICATION

¥DATA B2

¥READ

10000000 10000000

¥DATA Bl

¥READ

(7)

0110000001100000

¥DATA BO

¥READ

0001000000010000

¥CALC COUNT=M

¥YVARIATE COUNT

¥ERROR P

¥LINK L

¥CMODEL H1

¥FIT B十D+S22+S21十S20+S12+S11十S10+SO2十SO1十SOO

¥DISPLAY E M DR

¥CMODEL H2

¥FIT B+D2十D1十DO+S22+S21+S20+S12+S11+S10十SO2十SO1+SOO

¥DISPLAY E M D R

¥CMODEL H3

¥FIT D十B2十B1十BO十S22十S21十S20十S12十S11十S10十SO2十SOI十SOO

¥DISPLAY E M D R

¥CMODEL H4

¥FIT B2十B1十BO十D2+D1十DO十S22+S21十S20十S12十S11十S10+SO2十SO1

¥FIT+SOO

¥DISPLAYEMDR

¥STOP

ここで,因果関係の大きさを示すパラメータを導入しよう。モデルM4において,β、.、=λc+dβ,

δ。+、=μ日+bδとすると,M4は期待度数の形では,

F。加4=(λ四β)b(μα+δδ)dS。卵昭       (H4*)

と表すことができる。λとμは因果関係の大きさを示すパラメータである。H4*においてλ=1と するとモデルH2*が得られ,μ=1とするとモデルH3*が得られる。λ=μ=1の場合はモデル 1{1である。以下に,モデルH2*, H3*, H4*とH4*においてλ=μという制約条件をつけた 場合のGLIMの設定方法を示す。

¥CTHIS IS GLIM RUNSTREAM FOR MODELS H2*,H3*AND H4*

¥C FOR PANEL DATA ANALYSIS

¥UNITS 16

¥DATA M

¥READ

8382268

(8)

3571128

25 10832 95 156493

¥CBREFERS TO PARAMETER BETA

¥DATA B

¥READ

1 1 1 1

0000

1 1 1 1

0000 ¥CDREFERS TO PARAMETER DELTA

¥DATA D

¥READ

1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0

¥CDEFINE STRATUM PARAMETERS HERE

¥DATA S22

¥READ

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

¥DATA S21

¥READ

0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0

¥DATA S20

¥READ

0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0

¥DATA S12

¥READ

0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0

¥DATA S11

¥READ

0 0 00 0 1 1 00 1 1 00 00 0

¥DATA S10

¥READ

0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0

¥DATA SO2

¥READ

0 0 00 0 00 0 0 0 0 0 1 0 00

¥DATA SO1

¥READ

(9)

0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0

¥DATA SOO

¥READ

0 0 0 0 0 0 0 0 0 0 00 0 0 0 1

¥CMI REFERS TO PARAMETER MU

¥DATA M1

¥READ

3 13 1 2 12 1 2 12 1 1 1 11

¥CLREFERS TO PARAMETER LAMDA

¥DATA L

¥READ 322 1

1 1 1 1

322 1

1 1 11

¥FACTOR M13L3

¥CTHESE ARE THE CONSTRAINTS FOR MI AND L

¥CALC MX=M1

¥CALC LX=・L

¥CCONSTRAINTS FOR LAMDA=MU

¥CALC LMX=MX+LX

¥CALC COUNT=M

¥YVARIATE COUNT

¥ERROR P

¥LINK L

¥CMODEL H2*

¥FIT B+D+MX+S22+S21十S20+S12十S11+S10+SO2+SO1+SOO

¥DISPLAY EMDR

¥CMODEL H3*

¥FIT B十D十LX十S22十S21十S20十S12十S11÷S10十SO2十SO1十SOO

¥DISPLAY E M D R

¥CMODEL H4*

¥FIT D+B十LX十MX十S22+S21十S20十S12十S11十S10+SO2→−SO1十SOO

¥DISPLAY E MDR

¥CMODEL H4*WITH CONSTRAINT LAMDA=MU

(10)

¥FIT D十B十LMX十S22十S21十S20十S12十S11十S10十SO2十SO1十SOO

¥DISPLAYEMDR

¥STOP

次のモデルは,変数AとBは潜在変数κの指標であり,変数CとDは潜在変数yの指標であるとい うものであるが,各調査時点において潜在変数κとyの間に関連がみられるというものである。最初 の調査時点での個人づの反応は,

prob(A=1,C=11κ、,y,)=φ簸y,(φ+κ、+y,+φ吹y、),

prob(A=1,C=Olκi,yi)=κ、/(φ十κ、十y,十φκζyI),

prob(A=0, C=11κ、,:y、)=yノ(φ+κ,+yぎ+φκζy、),

prob(A=0, C=Olκ,,y、)=φ/(φ+κ、+y、+φ9じ{yl)

と表わされ,2回目の調査時点での個人の反応は,

prob(B=1,D=11κ、,yl)=ψβδ芯こyl(ψ+βκ1+δy,+ψβ(砒ぐyご),

prob(B=1,D=Olκ、,y、)=βκノ(ψ+βκ、+δy、+ψβδκぴ、),

prob(B=0, D=11κ y、)=δyノ(ψ+β劣、+δy、+ψβδ耽y、),

prob(B=0,D瓢Olκ,,yl)=ψ/(ψ+βκ、+δy、+ψβδ腹y,),

と表わされるものである。ここでφとψが存在しているために局所独立性は成立しない。したがっ て,変数A,B,C,Dに対する個人の反応は,

   φト1σ clψ1−1り一dlβδδ㌦f+兜y窪+d

@       △,

と表わすことができる。ここで,

△、=(φ十x:十yi十φxδノ卍)(ψ+βκ,+δy,+ψβδ腹y、)

である。以下にモデルH8のGLIMによる設定方法が示されているが,ここではφ=ψ,β=δ, S。、

=Sl。, S。、=S、。, S12=S、、という制約がある場合のものである。

¥CTHIS IS GLIM RUNSTREAM FOR MODEL H8

¥C FOR PANEL DATA ANALYSIS

¥UNITS 16

¥DATA M

(11)

¥READ 2757 16 65 19

6 1 19 14

201815436

¥CBREFERS TO PARAMETER BETA

¥DATA B

¥READ

1 1 1 1

0000 1 1 11

0000 ¥CDREFERS TO PARAMETER DELTA

¥DATA D

¥READ

10 10101010101010

¥CDEFINE STRMTUM PARAMETERS HERE

¥DATA S22

¥READ

1000000000000000

¥DATA S21

¥READ

0 1 10000000000000

¥DATA S20

¥READ

00 0 10 00000000000

¥DATA S12

¥READ

0000 1000 10000000

¥DATA SIl

¥READ

0 0 0 00 1 100 1 100000

¥DATA S10

¥READ

0 0 0 0 0 0 0 10 0 0 10 00 0

¥DATA SO2

¥READ

0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0

(12)

¥DATA SO1

¥READ

00 0 00 00 000 0 00 1 1 0

¥DATA SOO

¥READ

000000000000000 1

¥CPREFERS TO PARAMETER PH1

¥DATA P

¥READ 11 00 1 100

00 1 1 00 1 1

¥CPS REFERS TO PARAMETER PS1

¥DATA PS

¥READ 10 10

0 1 0 1

10 10

0 10 1

¥CTHESE ARE THE CONSTRAINTS FOR PARAMETERS PHI AND PS1,BETA AND

¥CDELTA

¥CALC PX=P十PS

¥CALC BX=B十D

¥CCONSTRAINTS FOR STRMTUM PARAMETERS

¥CALC SOIX=SO1+S10

¥CALC SO2X=SO2十S20

¥CALC S12X=S12十S21

¥CALC COUNT=M

¥YVARIATE COUNT

¥ERROR P

¥LINK L

¥CMODEL H8 WITH MODIFICATIONS

¥FIT BX+PX+SOIX十SO2X+S12X十S22+S11十SOO

¥DISPLAY E M D R

¥STOP

(13)

変数AとCを潜在変数wの指標とし,変数BとDを潜在変数zの指標とし,さらに変数AとB,変 数CとDに相関関係がそれぞれあるモデルを考えることができる。したがって,変数AとBに対す

る個人の反応の確率は,

prob(A=α, B=わ1ω、,g,)=ρト1α皿わ1ω劉/(ρ+ω、+z,+ρωβ1)

と表わされ,変数CとDについては,

prob(C=c, D=41ω、β1)呂σ[一に一dγcδむω£9望/(σ十γω、+δ之汁σγδωβ、)

と表わされる。したがって,全体的な反応パターンは,

P、。,α=ρ卜1面σ卜lc一σ1γ δdω野+『gl+d/A, (M10)

と表わされる。ここで,

A,=(ρ十ω、十之1十ρωβ,)(σ十γω汁δζ、十σγδω幽)

である。以下にはこのモデルの設定方法が示されているが,ここではγ=δという制約がつけられ

ている。

¥CTHIS IS GLIM RUNSTREAM FOR MODEL H10(MODIFIED VERSION)

¥C FOR PANEL DATA ANALYSIS

¥UNITS 16

¥DATA M

¥READ

1934410377 26341558 58168454 324860283

¥CDREFERS TO PARAMETER DELTA

¥DATA D

¥READ 10 10 10 10 10 10 10 10

¥CGREFERS TO PARAMETER GAMMA

¥DATA G

¥READ

1100110011001100

¥CDEFINE STRMTUM PARAMETERS HERE

(14)

¥DATA T22

¥READ

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

¥DATA T21

¥READ

0 1 0 0 10 0 00 0 0 0 0 0 0 0

¥DATA T20

¥READ

0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0

¥DATA T12

¥READ

00 1 00 0 00 10 0 0 0 00 0

¥DATA TI1

¥READ

0 0 0 1 0 0 1 00 1 00 10 0 0

¥DATA T10

¥READ

0 0 000 0 0 100 00 0 10 0

¥DATA TO2

¥READ

00 0 0000000 10 0000

¥DATA TOl

¥READ 100 1 100 1

10 0 1

100 1

¥CTHIS IS THE CONSTRAINT FOR PARAMETERS GAMMA AND DELTA

¥CALC DX=D十G

¥CALC COUNT=M

¥YVARIATE COUNT

¥ERROR P

¥LINK L

¥CMODEL H10 WITH MODIFICATIONS

¥FIT DX十R+S十T22+T21十T20十T12十T11十T10十TO2+TO1+TOO

¥DISPLAY E MDR

¥STOP

(15)

要約と結論

本稿の目的はRaschモデルをコンピュータ・プログラムGLIMを使用して構成することであった。

モデルを理解すれば,GLIMによって容易に計算できることが明らかにされた。今日,社会調査デー タ解析は,調査では直接観測されない潜在変数を想定した分析の方向に向っている。そうした動向 の中で,Raschモデルはもっと社会調査の分析に使用されてもよいものと考えられる。ここで使用さ れたデータはパネル調査のデータであるが,パネル調査のデータでなくともこうしたモデルを使用 することは可能な場合が多いと思われる。

1)社会移動の研究における貢献もよく知られている。

2)アメリカにおいてもほとんど使用されていないようである。以下の二つの研究がある程度である。Hout,M.

・・dA.M.G・eeley,・㎜e cent・・d… t h・1d・ch・・ch・ttendance i・th・U・it・d St・tes,1940−1984 」柳・伽〃5㏄如 ・8ε・・

Rεv∫εw,52(1987),pp.325−345.McRae,」.A., Rasch measurement and differences between women and men in solf一 esteem ,30cjα」3cjεηce Rθ5εα7c乃,20(1991),pp.421−435.

3)GLIMは最近4版が出された。 GLIMについては,以下の文献とそこで使用されている文献を参照せよ。

Francis,B.,M.Green,and C.Payne(eds.)η8θOLハfみ5 ε加(Oxford:Clarendon Press,1993).

4)簡単なRaschモデルのGL1Mによる構成については,以下の文献を参照せよ。小島秀夫rGLIMによるRasch モデルの測定」盛山和夫編r社会移動データ分析のためコンピュータ・プログラムの研究』(東京大学文学部 社会学研究室,1988),pp.1−19。小島秀夫rGLIMによるRaschモデル測定の研究」r茨城大学教育学部紀要

(人文・社会科学,芸術)』39,(1990),pp95−113。なお, DuncanのRaschモデルの一連の研究については,上 記の研究で使用されている文献を参照せよ。

5)ここで使用されるデータは,以下の文献でのデータである。ここでは,GLIMの使用法を示すことを目的と するのであるから,データ自体はどのようなものでもかまわない。Duncan,0.D., New light on the l 6−fold table , zl〃3εア此αη∫o配rηα」6ゾ30cめ 08γ,91(1985), PP・88−128。

6)そもそもRaschモデルは試験問題の難易度の測定のために考えられた。

参照

関連したドキュメント

ウス胎児肝中のFBPaseに対する抑制効果を示す濃

そうした試みがなされた可能性は十分にあろう

飲したこと"は、文法に叶った表現であるが、これにはいかなる事も対応しな

 小々汐では冬のボラを「ツクラ」と呼び、夏のボラを「ボラ」と呼んでいたとい

CSSS、ASSAC 及び CES-JHSA の各尺度間の因果関係を検討するために、共分散構造 分析によるモデルの検証を行った。その結果、CSSS から ASSAC へのパス係数は 0.64 で

本章では、presentment が事実上廃止されたのに、未だ大陪審は二重の機能を担う制度との認識

多変量解析手法の一つである因子分析は , 観測される変数 ( 観測変数 ) の相関構造を , 少数の観測されない変数 ( 潜在 変数

国際連合及び専門機構の内部規則 7 9