• 検索結果がありません。

コレスポンデンス分析における変数選択規準の検討

N/A
N/A
Protected

Academic year: 2022

シェア "コレスポンデンス分析における変数選択規準の検討"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

コレスポンデンス分析における変数選択規準の検討

森 裕一書,杜 暁東川,飯塚誠也***

Co ns i de r i ngv∬i a bl es e l e c t i o nc r i t e r i a i nc o n・ e s po nde nc ea na l ys i s

Y.Mori,X.Du,M.Iizuka (ReceivedDecember28,2004)

Ordinarygoodnessoffitcriteriaincorrespondenceanalysisareconsideredasvariable selectioncriteriaincasecorrespondenceanalysiswhichisoneofmultivariatemethods withoutextemalvariablescan beapplied.Thegoodnessoffitcriteriafocusedhereare proportionofcum ulativeelgenValues,proportionofcumulativesquared‑eigenvaluesand proportionofcum ulativeoff‑diagonalfitness・Eachcriterionisappliedtoacoupleofreal datasetsandevaluatedwithinterpretationoftheselectionprocessandresult(selectedsubset of variables). Four selection procedures such as backward elimination and forward‑backwardselectionarealsoperformedtocomparewith eachotheraswellaswith allpossibleselectionprocedure.Theseresultsillustratethatthecriteriacanbeusedas selectioncriteriatoselectasubsetofvariablesincorrespondenceanalysisandtoassess categoricalitems(questions)inasurvey(questiorLnaire).

1 . は じめに

コレスポンデ ンス分析 (数量化 ⅠⅠⅠ類) を用 いて分析 を行 う場合で,調査項 目や検査項 目を 減 らし,データのもつ全体的な様相 をなるべ く 少ない情報損失で単純化 したい,あるいは,無 駄な項 目を除去 したい とい う場合 を考える。デ ー タの特徴 を測 りとれ る指標 を低次元で作 ろ うとい う場面 も,実施上の観点を考 えるな らば 項 目数は少ない方がよい。このよ うな場面では, コ レスポンデ ンス分析 にお ける変数選択 を考 えることになる。

コレスポンデンス分析は,外的変量をもたな い多変量解析手法である。外的変量 とは,た と えば,回帰分析 における目的変数のよ うに,他 の変数か ら導かれ る情報 を基 に予測 あるいは 説明 され る変数のことである。これ をもたない 多変量手法には,他 に主成分分析や因子分析 な

どがある。これ らの手法における変数選択では, 回帰分析 の よ うに外的変量 を規準 とした選択 が行 えないために,その選択の規準をそれぞれ の手法に応 じて考案 してい く必要がある。実際,

+ 岡山理科大学総合情報学部

■● 岡山理科大学大学院総合情報研 究科 +++岡 山大学環境理 工学部

49

その選択 目的に応 じて,い くつかの規準が考え られてお り,た とえば,主成分分析では,Robert a

nd Escoufler (1976),Krz2LnOWSki (1987), Tanab andMori(1997),森 他 (1999)な どが, 因 子 分 析 に お い て は, Tanaka and Kodake (1981),飯塚 他 (2002)な どが, コレスポン デ ンス分析 にお い て は,Moriand Maehashi

(1996), Xia and Yang (1998),Iizuka etal. (2002b)な どがある。このよ うに,選択規準は 複数存在 し,かつ,多 くの場合,それぞれの規 準 によって選択結果が異な る (選 ばれ る変数 群が選択規準で異なる) とい うことが起 こる。

したがって,実際の選択場面においては,選択 の 目的がはっき りしていれ ばその 目的に適 し た選択規準で選択 を行 えばよい し,選択の 目的 が明確でない場合は,い くつかの手法 を試 して みてその結果を比較 ・検討す るとい うことが必 要になる。

このよ うな状況下では,次の2つのことが必 要 となる。選択規準の検討 ・考察 と各種の選択 規準が実行できる解析環境の提供である。前者 は,考え られ る目的に対応 した選択規準を考案 した り,同時にその手法の安定性な どを評価す ることである。後者 は,既存の汎用統計パ ッケ

(2)

50 岡山大学環境理工学部研究報告,10(1)2005

‑ ジで変数選 択 を行 うた めの関数 を作成 した り,ネ ッ トベースのシステムを含む変数選択 ソ フ トウェアを開発 した りす ることで ある。す で に,主成分分析 については,既存 の もの を含 む 主た る選択 手法 の検討 がな され (森 他,1999;

森 他,2000;Morieta1.,2000b;秦,飯塚,2002;

Iiz止aeta1.,2003な ど),実行環境 が整備 され て い る (Mori,1998;Morieta1.,2000a;飯塚 他 , 2001)。 因子分析 では,飯塚 他 (2002), コ レ スポ ンデ ンス分析 も森 他 (2004)な どで検討 がな され ,各手法 の各規規準が変数選択パ ッケ ー ジvASMM (VAriableSelectioninMultivariate Methods)に実装 され てい る (http://mo161. socl.ous.ac.jp/vasmm/index.html, Iizukaeta1.,2002aな ど ;主成分分析 ,因子分 柿 ,コレスポ ンデ ンス分析 の各変数選択手法 は, それ ぞれ VASpca,VASfa,VAScorresとして vASMMに実装 され てい る)。

本稿 では,前者 を 目的 として,コ レスポ ンデ ンス分析 にお ける変数選択 について検討す る。

コ レスポ ンデ ンス分析 にお け る変数選択 の研 究 は,先 に あ げた よ うに Mori and Maehashi

(1996), Xia and Yang (1998),Iizuka etal. (2002b)な どで行 われ てい る。いずれ も個体 ス コアの布 置 に注 目し,全変数 を用 いた個体 ス コ アの布 置 と選択後 の変数群 に よる個 体 ス コア の布 置 を最 も近 づ け るよ うに変数 を選 んでい る。今 回は,これ と異 な り,コ レスポンデ ンス 分 析 にお け る一 般 的 な適 合 度 規 準 (GOF, GoodnessofFit)に着 目し, これ を選択規準 と して用い るこ とを検討す る。ここでは,固有値 の累積 寄与率,平方累積 寄与率,非対角要素 に よる累積 寄与率の3つ を取 り上げ,その特徴や 選択 手順 に よる違 い な どを実デ ー タに適 用 し て考察す る。

2. コレスポンデンス分析における変数 選択

2.1 適合度規準

Yをn個 の個体 とp個 のカテ ゴ リー変数 を も つデー タ行列 とす るO このYの第k列 のカテ ゴ リー を (0,1)に指標 化 した行列 を

G

kとし て,G‑(Gl,G2,‑・,Gp),B=G'G,D=diag(B)

=dt'ag(G'G)とす る. ここで,GD‑I/2の特異 値分解GD‑1/2=UAV'を考 えるOその ランクを R+1とす る と , A は 特 異 値 の 対 角 行 列 A=diag(Ao,42,・・・,AR),対応 す る固有ベ ク ト ル は,それ ぞれU‑ (〟。,1,・.,〟R), V = (vo,vl,

,vR)とな る。 なお,i,(

j=

0,1,・.・,R)は大 き さの順 に並 んでい る とす る。

この とき,GOFと して,次 の よ うな固有値 の累積 寄与率 (PCE,ProportionorCumulative Eigenvalues),平方 累積 寄与率 (pcs,propor‑ tionofCumulativeSquared‑eigenvalues),非対 角要素 による累積 寄与率 (pco,proportionof CumulativeOff‑diagonalfitness)を計算す るこ

とができる (Greenacre,1994;Adachi,2004)。

P C E ‑ ∑1 = 1 3

pcs

‑ 皇

=

l 1 3

pco‑志

直 1'2

ただ し,rは対象 とす る次元,PCOについては,

Y 2 ‑ 皇 ノ = 1 J

=

fI 1 ノ ≠ ノ l D

I./2(B,

I ‑ C j l o , ) D

L

122,

cj 7

,は I

C (o)‑iDl/2V。V。Dl′2のB,ltこ対応す る (j,I) 部分行列

,l l ・

llEまユー ク リッ ドノル ム,ll,1で あ る。

2.2 適合度規準 を利用 した変数選択

変数選択 では,先 の Yをq個 の変数 を もつ nxq部分行列 Ylと,残 りのp‑q個 の変数 を も つnx(p‑q)部 分 行 列 Y2に分割 す る こ とに な るo Ylを選択 変数群 , Y2を削除変数群 とす る と,q個 の変数 を もつすべ ての組 み合 わせ の 中 で,2.1にあげたGOFの値 を最 も大 き くす るよ うな Ylを見つ けるこ とが 目的 とな る. ただ し, す べ て の 組 み 合 わ せ を 調 べ る 総 当 た り法

(AllPossible,Allpossiblecombinations)が最 善 の方法で あるが,計算 コス トを低減す るた めに, 一連 の変数選 択 手法 の研 究 で は,変数減少 法

(Back,Backwardelimination),変数増加 法 (For, Forwardselection),お よび変数減少法 と変数増 加 法 を 1変数 に関 して交互 に繰 り返 してい く 変 数 減 増 法 (Back‑For,Backward‑forward stepwiseselection)と変数増減 法 (For‑Back, Forward‑backwardstepwiseselection)の4つ の 選 択 手順 を採 用 してい る (各 手順 の詳細 は, Mori, 1997,森 他, 1999を見 よ).今回 もこ

の4手順 で変数選択 を行 うと同時 に,4手順そ れ ぞれ の選択結果 の比較,お よび総 当た り法 と の結果 の比較 を行 い,今 回検討す るGOF規準 の評価 と4選択手順 の利用 可能性 を考察す る。

(3)

1授業アンケー ト質問項 目 (「はい」か ら 「いいえ」までの5肢択一式)

閉居番号 アンケー ト内容

教員の声は十分聞き取れ る大 きさで したか。

教員の話 し方は適 当な早 さで したか。

教員の話 し方 は明瞭で したか。

黒板の字や図形や適 当な大 きさで したか。

黒板の字や図形は丁寧 に書かれ ていま したか。

シラバ スに沿 って授業がな され ま した。

教員は授業時間を守 っていま したか。

教科書やテキス トは適切 で したか。

教員は私語 を してい る学生 に十分な注意 を してい る と思いますか。

授業内容 をわか りやす く工夫が感 じられ ま したか。

授業の進度 は適 当で したか。

教員 は学生の理解力 を配慮 している と思います か。

教員は熱心 に教 えて くれた と思いますか。

総合的に見て, この授業 を履修 してよかったですか。

あなたは この授業に よく出席 しま したか。

あなたはシラバスをよく活用 しま したか。

あなたは時間外 に この授業の学習 を しま したか。

総合的に見て,あなたは この授業に熱心に放 り組みま したか。

3.

数値例

GOFを用いたコレスポンデ ンス分析 におけ る変数選択 を,大学2年生56名 に実施 した授 業アンケー トのデータと,軽症意識障害87例 に実施 され た軽症意識障害検査のデー タに適 用す る。それぞれのデータに対 して各規準によ る変数選択 を実施 し,Ylとして用いる変数の数 qごとの規準値 (PCE,PCS,PCO)と選択 され た変数群の比較 を行 う。なお,前者のデータに 対 しては,4手順の選択過程の考察 と総 当た り 法 との比較 も行 う。

3.1 授業アンケー トデータ

データは,実際に利用 されていた授業アンケ ー ト (表 1に示 した5肢択一の18間,現在 は 利用 されていない) を,本研究のために著者 の

1人の授業で実施 して得 られたものである。こ の うち,教師 に対す る評価部分である最初の 14間に対 して変数選択 を試み る。

表2は,14変数 をr‑2とし,変数減少法に よって選択 した過程の要約である。各qにおい て選択 され た変数群

( Y

l) か ら求 め られ る (選択の規準 となった)規準値pcE,PCS,PCO と削除 され る変数である (図 1は各規準値の 変化 をグラフ化 したもの)0

この 3つの規準によって選択 された変数群 を見 ると,PCE規準 とpcs規準の選択結果は, q‑5‑7で削除 され る変数 iv6,V8,V12)の 順番が入れ替わる以外 は同 じである。最初 に削 除 され る3変数 (v4,V7,V9)は,削除 された 順番 は異なるが 3つの規準で同 じであること 2 PCE,PCS,PCOの変化 (授業アンケー トデー タの14変数,変数減少法,r‑2)

q PCE 削除変数 PCS 削除変数 PCO 削除変数 14 0.24669 0.48825 0.55856

13 0.26026 V7 0.50805 V7 0.58386 V9 12 0.27457 V9 0.53011 V9 0.60969 V7 ll 0.28891 V4 0.54996 V4 0.63615 V4 10 0.30658 V5 0.57033 V5 0.66593 V2 9 0.32338 Vl 0.59103 V1 0.69035 Vl2 8 0.34176 V2 0.61166 V2 0.72477 V5 7 0.36597 V8 0.63206 V6 0.75446 V6 6 0.39678 V6 0.65716 V12 0.79238 VlO 5 0.43976 V12 0.69456 V8 0.84269 V8 4 0̲50785 Vll 0.73928 Vll 0.87322 V3 3 0.59016 V3 0.80765 V3 0ー96332 Vl

V13,V14 V13,V14 V13,V14

(4)

52

08

07

06

;05 04

03

02

岡山大学環境理工学部研究報告,10(1)2005

lqによるPCE,PCS,PCOの変化 (授業アンケー トデータの14変数,変数減少法,r‑2)

か ら,これ らの質問項 目は,教師の評価 に対す る寄与が低い とい うことになる。 さらに,3変 数 を削除 したq‑8の ところで見ると,〈Vl) と iv12)が入れ替わっているが,(v2,V4,V5,V7, V9)の 5変数が共通で削除 された ことがわか る。一方,最後まで含 まれていた変数 は V13 とV14であった。

次に,真の選択変数群 として,総当た り法の 結果 を示す。表 3‑5の 「Y

l

lY2」の列が総 当 た り法 によ り選 ばれ た変数群 と削除 された変 数群 で, 「AllPossible」の列がその ときの規準 値である。

同表では,変数減少法,変数増加法,変数減 増法,変数増減法の4手順がその実の選択結果 とどの程度異なるか も示 している。すなわち,

「Back」〜 「For‑Back」の各列に,各手順 によ る規準値 と総 当た り法 に よる規準値 の差 を示 した (差のあるセル に網掛 けを してある)。差 が oであるとい うことは,総 当た り法 と同 じ規 準値 を示 した とい うことだけでな く,規準値 は Ylか ら算出 され るので,規準値が同 じな らば, 選ばれ た変数群 も総 当た り法 と同 じであるこ

とが容易に想像 され る (なお,PCO規準に関 しては,q‑2の ときのみ,規準値 は一致す るが 選択 された変数は異なっている)。 これ らの表 か ら,3つの規準 とも,変数減増法 (Back‑For)

と変数増減法 (FoトBack)では総 当た り法 と 同 じ結果が得 られ ること,変数減少法 (Back) は,一部総 当た り法 と異なる変数を選んでいる こと,変数増加法 (For)については,PCE規 準 とPCS規準では違いは少 しであるが,pco 規準では異なる部分が多いことがわかる。これ

らの ことか ら,最 も時間を節約す るには変数減 少法を用いることができるが,真の変数群 に近 い変数群 を得 るには Stepwise系の変数減増法 か変数増減法 を用いれ ばよい ことが示唆 され る。主成分分析 における変数選択の数値的検討

で も変数増減法が総 当た り法 に最 も近い結果 が得 られ ることがわかっている (森 他,1999)̀

最後に,q‑9の場合で,元の変数 と選択 さ れ た変数 によるコ レスポンデ ンス分析 の結果 を個体 ス コアの布置で比較 してみ る。 図 2(a) は,全 14変数 を用いた ときの個体スコアの l 軸 と2軸のプ ロッ ト,図2(b),(C)は,それぞれ PCE/PCS規準によ り選択 された 9変数 (V2, V3,V6,V8,VIO,Vll,V12,V13,V14) とpco 規準によ り選択 された9変数 tvl,V3,V5,V6, V8,V10,Vll,V13,V14)による個体スコアの プ ロッ トである。(a)‑(b),(aト (C)を見ると, それほ ど大きな違いは見 られず,個体スコアに 関 しては,選択 された変数で も元の変数 と同等 の考察が可能 であることがわかる。 なお,(a)

と(b)お よび(C)との布 置 の 近 さを RV係 数 (RobertandEscoufier,1976)で評価す ると,RV l(a),(b)]‑0.9093,RVl(a),(C)]‑0.8611とな り, PCEnCS規準によ り選 ばれた変数 による個体 スコアの布置がpCO規準のそれ よ り元の全変 数 による布置に近い ことがわかる。qが9以外 の場合で も同様であ り,個体スコアの布置に関 しては,PCE/PCS規準の方が良い変数群 を選 んでいることがわかる。

3.2 軽症意識障害 デー タ

データは,表6に示す よ うに25項 目か らな る検査で,各間 4肢択一または2肢択一である (佐野 他,1977)。 この うち,佐野 他 (1977) な どの先行研究に したがって,全体的な構造‑

の寄与が少ない とされ る21番 と22番 を除いた 23項 目に対 して,変数選択 を実施す る。以下, 23番以降の変数番号は2を引いて表記 (旧23

‑新21,旧24‑新22,旧25‑新23)す る。

このデー タに,簡便法 として最 も良い結果が 得 られ る変数増減法を用いて選択 を行い,先行 研究 との比較 を考慮 し,q‑10の前後の結果 を 表7に表 した。

(5)

uムこし ト川, i3」i.̲L‑ト、‑T・ 盲il卜盲も、iLLL \lili'も1ヽ、i卜iLl

TL.rJ:;川1tりXih〜.II・、r‑

()川il̲ト日日 汁4.与川i(]り ミLi̲叫)川Hl u.川i川盲阜! (̲i̲:・与i̲‑[‑リ

け川)fiL}il りl亨川l川i il,州i芦もhl l‖1i柵剛 毛壬.ミいす、.く詫 り川事i.汁Iii り̲川阜!.榊! i).:t二.i̲ミIi け川j川‑)(‑t 日,i:=B川l川さ け川Iui!り i書,''t、Hqii 日、川l川.iH け(!日日州 阜声̲川棚.lil u.;̲iWi‑u/ii̲〉 もl:L葺けーt‑ i,i川糾きり Z:!り川i川i i!=川.=‑〜 i妻.榊iii川i (i̲.<りq<q̲i H.f吋州l毛妄 り川HHlL計 りり川柳事 i/日,細事i̲盲ti り̲チリ(妄lt‑ fLLJ川)州 日.川棚!り i!.H相川l け榊日日(̲B 毛I〜‑i.i・i̲i

p=(,̲...=人rlll=ト・1‑・J:∴,1‑‑・・‑1さ..1.rr.・‑.ヽ1′︻.●.‑.‑Lr‑↓、、.I/‑・・‑/.A‑I.・..I‑=日..ー卜(I■[Ll▼1≦︼y⁚JrLri‑I.ト>。■ーLヽ1..・,.‑・▲lノL

l..1‑・p.l‑‑rl"′.・⁚=,・‑■.̲ー▲Iノ.■rl︻ヽl.<}.▲1‑.■.一▼ゝPL'一し<i‑■■Llll<嶺‑.ーJづ′L'′ムー‑.t1.21..⁚⁚=∴

圭iilL.L 卜いr 批ミLTL‑卜,Tp を・、汀‑1主立主LIL ,\'ii事'、!ト、;トiL、

::1rijけりIf.Tか.F.‑・'‑I,.t

tuLI("Lliきii tき.i榊i榊 (川仙川i lきり川き川) 宅.ゝ..ii̲lポ(済 li.川盲iき抑 ii=th)tlti tきりり川̲it≒ !きりiH:糾う 1‑パ・‑lilt)モー ()川l川ifl

(L川1日Ou

i川川)川) (.)il川l川! そぼ榔仰 fLt/1̲うー葺rT̲ち

葺j.川柵きii i相川i川) i川川i桝 u川i竃h̲u.) けltir!,,チ

嘗息..J^̀●.≦ゝ>.′■...一﹀′t.Lヽ..■「..1い,‑‑、レ号・.Y・‑J⁚.,I.R.A.卜.T・日日1,▲、iこ.=7・、3!ィ.三.日.[・[/;

...‑.J....<.へ.L...

̲qIヽ一.▲▼r17■⁚‑▲

嶺‑1・・‑‑1◆‑.‑‑〜

ihL、L hlr iもふ、L‑卜'r h.汀一主もこlL、L ‑\lH‑il、、盲卜lL、 ち̲ミ 葺川Ii川)り

盲77 1,),i.11桝盲i) H E)川きliuJtき 意鎗 録サ銀牌細

り l'iil.,ti川fリ .

i ミL川!1、ii)(i

̀ tき川日日けさ

!、 ui盲川汁即 i‑ H川;・川戸り

鯵孝騨珍幽 鋳ず轍鮒窮 鎗q繊細鯵 鎗冬鎗抑 留 篭りH.H.1川を (1弓.メ川榊与 t芦川liifH‡ ti川さけを葺き 章巨も)川芦川き 蔓書iき川きii(! 串。柳 翰顧 駿腰細騨粉 け川i川!ij ち蔓i̲き弓子号aiJii,‑i

1号.く詫̲三光tl 駆*鍬轡感撃 弓り†済.喜べ S。痘痕慧轡遷 i̲争tliii̲).1や ぎl̲叫∴i叫¶

l圭tl‑1二i、し; 日もき川ゝ.二・l いき叫I.きて

Y▲ーr.、、'‑T.T.T..」..T・・・

h・・.・﹀ィYノ∵Lr・/叫,!・I‑′7′上‑‑.<‑..h.︼tI.;︻1.T1

■r̲..、‑...(V.‑1.一>J1‑‑‑・.J

‑・ 1・17・・〜■〜.⁚、1.・.」、=

(6)

54 岡山大学環境理工学部研究報告, 10(1)2005

StOd00LOSoot?LO.?

︻Nl]ニeSJ

〟.025 0.015 0.005 0.005

rs̲a"(,1 (a) 全 14変数

POdN0.000.0

︻N.]600dsJ

0.04 ‑0.03 0.02 ‑0.01 0.00 rs̲pce9【.1

(b) PCE/PCS規準で選 ばれ た9変数 (V2,V3,V6,V8,VIO,Vll,V12,V13,V14)

0.0N0.0

0

0.0

Z■︼600d

I

s

J

NO.〇

4.03 0.02 0.01

0 , 0 0

rs̲

p

co9[,1I (C)

P C

O規準で選ばれた9変数

fVl,V3,V5,V6,V8,V10,Vll,V13,V14) 2 個体スコアの散布図 (授業アンケー トデー タ)

このデータは,すでに,佐野 他 (1977,1979) TanakaandMori(1997),Iizukaetal.(2003)な

どで数値例 として変数選択が行われている。佐 野 他 (1977,1979)では,デー タを計量デー タとして扱い,全25変数の因子負荷量をプ ロ

ッ トし,(V4,V5,V6,Vll,V14,V22),(V7, V8,V9,VIO,V13),iVl,V2,V3,V12, vl5,V16,V18,V19,V20),〈V21,V23) と, 寄与のない旧21番 と旧22番の計5つのクラス ターの うち,前の3つを主要なクラスター とし て分析 を行っている。また,同時に検査 した 「意 識 レベル」を 目的変数 として通常の回帰分析 に よる変数選択 を行 い, ‡Vl,V4,V8,V14,

V19,V21)の6変数 を選択 した り,因子分析 の共通性 に基づいて,(V3,V4,V5,V8,VIO, Vll,V14,V15,V17,V18,V19,V20)の 12変数 を選択 した りしてい る。一方,Tanaka andMori(1997)とIizukaetal.(2003)でも同 様 に計量デー タとして扱い,拡張主成分分析 の 寄与率 (TanakaandMori,1997)を選択規準 と して用いた変数選択を行い,前者では,1つの 選択結果 として 13変数 〈vl,V3,V4,V5, V6,V7,V9,Vll,V12,V16,V17,V19, V22)を考察 し,後者では,最低必要な変数の 数 として6を示唆 している。今回の選択は,佐 野 他 (1977,1979)やTanakaandMori(1997)

(7)

6 軽症意識障害検査の検査項目

El E. i] El̲

1食 6見当報 (月 日) ll知 16表 21抑制欠如 (多弁)

2尿失禁 7見 当報 (時間) 12命令‑の反応 17診察中の態度 22抑制欠如 (発動)

3呼名 .挨拶‑の反応 8見 当識 (人) 131か ら20まで数 える 18自発動作 23保持傾 向

4見 当識 (場所) 9自分の病識 の程度 14計算力 19自発発語 24生年月 日が言 える

と同 じ変数を選ぶ ことが 目的ではないので,単 純に比較す ることはできないが,参考 として, pcE規準 とPCS規準について,佐野 他 (1977, 1979)による因子負荷量のクラスター と表 7 の結果を照 らし合わせてみると,どのqにおい ても,その主要な3つのクラスターか ら変数が 選ばれてお り,さらに,もう 1つのクラスター である (V21,V23)か らも選ばれていること がわかる。また,佐野 他 (1977,1979)によ る12変数やTanakaandMori(1997)による13 変数 と比較す ると,PCE規準 とPCS規準では, 5つの変数は異なっているが他 は同 じである ことがわか り,先行研究の規準 と比較 してもそ れほ ど大きく変わ らない とい うことが参考 と

していえる。

ここで,あらためて表7に注 目すると,(V5, v6,V7,V20,V22)は,どの規準においても ほとんどのqで選ばれてお り,寄与が高いこと がわかるが,q<10では,tvs,V9,Vlli と (V15,V17,V19)が選ばれ るか どうかで,声cE /pcs規準 とpco規準の結果に差が出ている。

全体 としては,授業アンケー トデータと同様 に,

PCE規準 とPCS規準では選ばれた変数の違い が少な く,pCO 規準ではそれ らとやや異なる 変数が選ばれていることがみて とれ る。

4.おわ りに

外的変量 をもたない多変量解析手法である コレスポンデ ンス分析 にお ける変数選択 とし て,3つの適合度規準を選択規準 として利用 し, 実データに適用 して検討を行った。その結果, 選択結果の解釈や選択過程 を考察す ることが できた。これ らの規準を選択規準 として採用す るか どうかについては,コレスポンデンス分析 の変数選択 において考 え られ る他の規準 との 比較を待たなくてほならないが,規準 としての 大きな問題はない といえる。ただ し,今回の手 法は,規準の算出にあたって,基 とすべき全p 変数 を使 った規準値 と比較 を しているのでは な く,利用する変数の数qを決めた ときに,最 も良いGOFを提供す るq変数 を求める方法を とっているOしたがって,全p変数が提供す る 結果にいかに近づけるか とか,q+1変数や q

‑1変数 と逐次的な比較 を行 うといった選択 7 選択された変数群 (選択された変数 軽症意識障害検査,変数増減法,‑3)

810810 10111011101110 1111

14 l 13

12

1212

1212

121212

2 2

89810 9

(8)

56 岡山大学環境理工学部研究報告,10(1)2005

手法 ではな いの で,これ らの観 点 で比較 が行 え る規 準 の考案 も今 後 は必要 にな ろ う。

一 方 ,今 回特 に触 れ なか った が , た とえば, 授 業 ア ンケー トデ ー タで は,寄与 が高 い もの と

してV13とV14が最 後 まで残 ってい るOそれ らの質 問文 は 「教 員 は熱 心 に教 えて くれ た と思 い ます か」 と 「総合 的 に見 て,この授 業 を履 修 して よか った です か」とい う総 合 的 な評価 を う な がす 文 面 で あ る こ とか ら,変 数 選 択 手 法 は, 単 に変数 を選 ぶ だ けで な く,そ の選択 過程 か ら, 質 問 が意 味 の あ る もの か ど うか な どを検 討 す る観 点 を提供 す る もの ともい え る。特 にア ンケ ー ト調 査 な どで は,冗長 な質 問や似 た性 質 を も った質 問 な どは避 け るべ きで あ り,この観 点 で の研 究 も今 後 進 めてい きたい。

コ レス ポ ンデ ン ス分 析 にお け る変 数 選 択 に つ い て は,各種 のデ ー タや選 択 後 の変数 で の再 調 査 を行 った りす る こ とで,評価 を加 えてい く

と ともに,計 算環境 と して のVASMM (コ レス ポ ンデ ンス分 析 にお け る変数 選 択VAsco汀eSに つ い て は, http://mo161.socl.ous.ac.

〕p/vascorres/index.html)‑ の 規 準 の 実装 も考 えて い く予 定 で あ る。

参 考 文 献

Adachi,K.(2004).Correctclassi月Cation ratesin multiplecorrespondenceanalyss,J.JapaneseSoc. Comp.Statist.,17,1120.

Greenacre, M. (1994). Multiple and joint correspondenceanalysis.In Greenacre,M.and Blasius,J.(eds),CoTT.eSPOndenceanalysisinthe sociaIscE'ences,14I‑161,AcademicPress. Iizuka,M.,Mori,Y.,Tanmi,T.and Tanaka,Y.

(2002a).StatisticalsoftwareVASMM forvariable selectionillmultivariatemethods.InH盈rdle,W.

a

ndR8nz,B.(eds),COMPSTAT2002Proceedings in Computatt'onal Statistics, 563‑568, Physica‑Verlag.

Iizuka,M.,Mori,Y.,Tarumi ,T.andTanaka,Y.(2002b). Some New Modules in Ⅵ汀iable Selection SoRwareVASMM.Proceedingsofthe4thARS' ConferenceoftheIASC,166‑169.

Iizuka,M.,Mori,Y.,Tarumi,T.andTanaka,Y.(2003). Computerintensivetrialstodetermi nethenumber ofvariablesin PCA.JournaloftheJapanese SocieO,ofComputalionalStatistics:SpecialIssue ofICNCB,14(2):337‑345.

Krzmowski,W.J.(1987).Selectionofvariablesto preserve multivariate data structure, uslng prlnCIPalcomponentsIAppl.Statist.,36,22‑33・

Mori,Y.(1998).StatisticalSoftware VASPCA ‑ variableSelectioninPCA‑.岡 山理科大学紀要, 33(A),329‑340.

Mori,Y.andMaehashi,A.(1996).VariableSelection

forCategoricalData.IANumeriCalInvestigation on Fatigue Data.Bulletin of KurashikiCID, College,26,25‑38.

Mori,Y.,Iizuka,M.,TaLu i,T.and Tanaka,Y.

(2000a). Statistical so氏Ware "VASPCA'‑ for variableselectioninprlnCipalcomponentanalysts. T:he14thSymposiumonCompulalionalStatistics, ShortCom unications,73・74.

Mori,Y.,Iizuka,M.,Tanmi,T.and Tanaka,Y.

(2000b).Study ofvariableselection criteriain dataanalysis.ProceedL'ngsoftheTenthJapanand KoreaJoL'ntConferenceofStatistLIcs,119‑124.

Robert,P.andEscoufier,Y.(1976).Aunifyingtool forlinear multivariate statisticalmethods:the RV‑coefficient.Appl・Statist・,25,257‑65・

Tanaka,Y.and Kodake,K.(1981).A method of variable selection in factor analysis and its numerical investigation.Behaviormetrika, 10, 49‑61.

Tanaka,YandMori,Y.(1997).Principalcomponent a

nalysisbasedonasubsetofvariables:Variable selection and sensitivity analysis. Am er.J. MathematicalandManagementScL'ences,17,1&

2,61‑89.

Xia,L.andYang,Y.(1988).A MethodofⅥ山able Selection in Hayashi's Third Me仙od or Quantification.J.JapaneseSoc.Comp.StatLIst.,I, 27‑43.

飯塚誠也 ,森 裕 一,垂水共之,田中 豊 (2001). 主成 分 分 析 にお け る変 数 選 択 プ ログ ラム の

www‑の実装.文部科学省 統計数理研 究所

「統計数理」,49(2):277‑292.

飯塚誠也 ,森 裕 一,垂水共 之,田中 豊 (2002). 因子分析 にお け る変数選択規 準 の考察.日本 計算機統計学会第16回大会論文集,68・71. 佐野圭 司 他 (1977).軽症意識 障害 の評価 方法 に

関す る統計的研 究 一断面調査 に よる特徴 的臨 床像 の抽 出.神経進歩,21,1052‑65.

佐 野圭 司 他 (1979).軽症意識 障害 の評価 方法 に 関す る統計的研 究 一経時調査お よび項 目選択 . 神経進歩,23(6),1207‑18.

森 裕 一,飯塚誠也 (2002).主成分分析 にお ける 変 数 選 択 手 法 の 考 察 .岡 山理 科 大 学 紀 要 , 38(A):105‑112.

森 裕一,飯塚誠也 ,垂水共之,田中 豊 (2000). 変数 の影響 分析 を利 用 した変数選択.日本行 動計量学会第28回大会論文集,30ト302.

森 裕一,垂水共之,田中 豊 (1999).変数 の一 部 に基づ く主成分分析 :変数選択 手法 の数値 的検討.日本計算機 統計学会 「計算機 統計学」, 11(1):1‑12.

森 裕一,杜 暁東 ,飯塚誠也 (2004).コ レスポ ンデ ンス分析 にお け る変数 選 択 規 準 の検 討 . 日本 計算機統 計学会第 18回 シンポジ ウム論 文集,9‑12.

参照

関連したドキュメント

ダンスミュージックを基調に幅広い楽曲を制作。2010 年 5 月に 2nd アルバム 『As the earth

各部名称 正面 ①プログラムボタン :EDID をプログラムします。 ② HDMI 入力端子 :ソース機器の HDMI 出力と接続します。 ③パワー LED

[r]

RFoGシステムの構成 (第 2章) 2.2 R-ONUブロック図 RF増幅 PD RF増幅 PD WDMフィルタ 分波器 WDMフィルタ 分波器 RF増幅 LD RF増幅

ことを認め,関税その他の貿易障壁を実質的に軽減し,及び国際通商における差別待遇を廃止

The approaches given here are the analogues of the standard MjGjl supplementary variable method and the analysis in Part I and we believe they should

In order to solve these issues, I decided to use FRBR model to combine bibliographic record and holdings records, and design RESTful API in order to provide unified technique