• 検索結果がありません。

多変量解析における簡便法 —Sに学ぶ—

N/A
N/A
Protected

Academic year: 2021

シェア "多変量解析における簡便法 —Sに学ぶ—"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

ぜ3

...

メモランダム

このコラムは, ORにかかわる概念,知識(手法.原理),それらの図解.よい教材や問題,実学 ORの実施経験,そこから得られた智恵やアドパイス,失敗談と教訓し新しい視点,視座,フレー ムワ 久未だ解けていない問題,面白い研究テー?などを.“新鮮にしかも“コンパクトに" 表現し,提示していただくものです.ユニークなアイディア,フレ y ンュな見方,発想.だれかと 意見をたたかわせたい問題提起など,ふるってご投稿ください. (原稿は.刷り上がり,半ページ から 3 ベ ジに納まるようにお書きくだきい.簡単に F 加筆訂正をお願いする場合があります)

多変量解析における簡便法

-$に学ぷー

上田太一郎

1

.はじめに 判別分析,数量化理論 II 類(以下 II 類)は回帰分析, 数量化理論 I 類と同様に多変量解析のなかで広〈活用 されている有効な手法です.また数量化理論III 類(以 下 III 類)も有効な手法としていろいろな分野で使われ ています.筆者もー企業の OR マンとしていろいろな 局面でパソコンソフト S を用いて適用しています.こ の S で簡単にできる判別分析(Il類)の変数(要因) 選択法を考えました.実際に適用し,有効な結果が得 られているのでご紹介します.また, III 類の簡便法に ついてもご紹介します.

2. 判別分析

II 類の変数(要因)選択法

判l 別分析はサンプル(データ)が,たとえば,合格・ 不合格のようにグループに分類きれていて,同時にサ ンプルの数値デ タが所与のとき,数値データを説明 変数として,できるだけ明確にグループ化するように 未知係数(判別関数の係数)を求める方法です.さら に所属不明なサンプルがどのグループに属すのか判別 (予測)にも使用されます. II 類と判別分析との違い は II 類は説明変数がアイテム・カテゴリと呼ばれる不 連続な定性的なデ タとなっている点です.判別分析, II 類はともに要因分析と予測に役立つ手法です. 実際に適用する上で重要な点は,判別分析では説明 変数 II 類では要因(アイテム)をいかにして選択す るか,つまり最適な説明変数,要因を求めることだと 感じています. ところで,パソコンで使用可能なソフトウェア うえだ たいちろう 三菱電機東部コンビュータシステム鮒 生産管理部 干 244 横浜市戸塚区川上町 87-1 1995 年 8 月号

SAS

,

SPSS 等では判別分析の変数選択がサポートき れています.しかしながら, II 類の要因選択はサポー トされていないようです. s でもサポートされていま せん.そこで S を用いて簡単にできる判別分析(II類) の変数(要因)選択法を考えました.実際に適用し有 効な結果が得られているのでご紹介します. 変数(要因)選択規準は,回帰分析の変数選択規準 のアナロジーから思いつきました.回帰分析の変数選 択規準の 1 つに佐和の予測用修正重相関係数 Rs があ ります[l J. Rs は次式で表わされます. Rs=l 一 (1-R2)

(n-1)

(n-2)/{(n- ρ-2) (n- ρ-1)

}

ここで n ・デ タ数(サンプル数), ρ: 変数の個数, R ・重相関係数です.この規準値が最大となる変数の 組合せを最適な変数としています. 提案する判別分析 (11 類)の変数(要因)選択規準

Du

( 仮に予測用修正正準相関係数と呼びます)は

Du=l-

(

l

-17I)

(n-

l

)

(n-2)/

{(n ρ2) (n- ρ1)

}

となります.ここで m は第 1 正準相関係数です.グ ループ数が 2 のときは判別関数は回帰式と同等(係数 が比例関係にある)であることがわかっていて [2] , しかも 171 =R です.したがって,重相関係数のかわり に第 1 正準相関係数をもってきたわけです.この Duが 最大となる変数の組み合せを最適な変数とします

[

3

]

.

II 類では Duが最大となるアイテムの組合せで す.また II 類では ρ は(カテゴリ総数ーアイテム数} です. s によるソースは以下のようになります. ルnction

(x

,

y

)

{η <-nroω (x)

ρ < -ncol(;τ)

:

syusei<-((n-2)

*

(n-I))/

(n ρ-2)/(ηρ- 1)

:

1-

s

y

u

s

e

i

*

(1-

d

i

s

c

r

(x

,

y

)

$

c

o

[

1

]

)

再 co [lJ は第 1 正準相関係数}

(49)

4

4

3

(2)

discr(x

,

y) は S の正準判別分析関数です. (相関比を 最大にする判別分析では正準相関係数のかわりに相関 比を用いることになります.)簡便法ですのでパソコン で簡単に使用できます. 2 グループはもちろん 3 グ ループ以上でも適用可能であることを強調しておきま す.

3. 適用例

3

.

1

2 グループの判別分析の例 [4J ある球団の採用テストの結果と合否の判定の結果は 表 1 のようになっています. 変数の組合せごとの Du 値, T}1 を求めると表 2 のようになります. Duが最大となる X"

X

3

,

X.

,

x

5

の組合せを最適な説 明変数とします. [4J でも変数増 減法の結果は同様に X"

X

3

,

X.

,

X

5

を選択していま す.

3

.

2

3 グループの判別分析の例 フィッシャ によるアイリス・データです. 3 種の アヤメの 4 部位の測定値 (X

1

-X.) が掲載されていま す(データは [5J を参照してください).変数の組合 せごとの Du値,引を求めると表 3 のようになります. Du が最大なのは X1-X. です (0.984).

X

2 - X. でも 0.983 とあまり違いがありませんので X

2

-X. を選択 してもよいでしょう.

-

3

.

3

2 グループの II 類の例 [4J 電子レンジ保有世帯と非保有世帯 2 グループを外的 規準とし,アイテムを世帯年収(I l) ,主婦の就業状況

(

1

2) ,家族全員での食事回数(I 3) で判別する例で す(データは表 4). アイテムの組合せごとの Du値,引 を求めると,表 5 のようになります.

1" 1

2 を選択したとき 0.619 と最大になりまた.最 適なアイテムは世帯年収,主婦の就業状況ということ です. 前述したように 2 グループのときの判別分析, II 類 は回帰分析で可能であることがわかっていますので, 念のため回帰分析でアイテム選択をやりました.

AIC

と佐和の予測用修正重相関係数 Rs によると, ともに

1" 1

2 を選択しました. II 類は判別分析の特殊なケースといわれています. 判別分析プログラムで II 類を実行するときは各アイテ ムのたとえば先頭カテゴリデ タを削除して実行し,

444 (

5

0

)

カテゴリスコアを求め,先頭カテゴリのカテゴリスコ アは O とすればよいことが知られています.したがっ て,判別分析プログラムさえあればここで紹介した簡 便法で判別分析の変数選択, II 類のアイテム選択が容 易に可能となります. -'f!iJ 別分析はパソコンでサボ ト されているので簡便法を活用きれてみてはいかがでし ょ 7 カヒ

4.

III 類と特異値分解

次のようなデータを考えます.年齢・性別の異なる 人々に好きなスポーツを回答してもらった仮想、のデー タです(表 6)

.

表 6 のデータを特性値反応、データとみなし, r もの j と「特性」との反応パターンからみて似たスポーツ同 士は近くに,そうでないスポーツは遠くに配置するよ うにしたのがIII類です(同時に年齢・性別も配置し直 してくれます). きて, III類と特異値分解とは数学的に同ーのもので あることがわかっています(鷲尾・大橋 [6J ,西里 [7],統計学辞典等).そこで,このデ タを III類と特 異値分解によりプロットしてみました(図 1 ,図 2). ここで, III類ではん(第 2 固有値)とんに,特異値分 解ではぬ(第 2 特異値)とぬとに対応させています (d

2

とぬとに対応させたのがミソです ).図 1 を見ると右 にいくほど高齢,左にいくほどヤングになっています. 上半分は女性,下半分は男性がフ。ロットきれています. このようにヨコ軸,タテ軸て解釈することもできます. また,たとえばスキー,サッカ ,女 20 未満,男 20 未 満,男 21-30 は比較的近くにプロットされていること がわかるのでパターン分類をする手法ともいえます. 図 2 でも同様な解釈が可能なことがわかります.簡単 な例だと目視でも可能でしょうが,表 6 のデータでさ えコンビュータのカが必要になります. r もの」ゃ「特 性j が多くなると,コンビュータプログラムにたよら ざるをえないことになります. このように数量化理論III類は大変有用であるにもか かわらず,コンビュータプログラムがない等の理由で 利用したくても必ずしもうまく利用されているとは言 えないようです.特異値分解は FORTRAN , C 言語等 でサブルーチンとしてサポートされている(たとえば [8J) ので活用されてみてはいかがでしょうか. 謝辞 原稿を読んでいただき,貴重なコメントをい ただきました編集委員会に感謝いたします. オベレーションズ・リサーチ © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(3)

電子レンジ保有・非保有世帯 電子レン ;i柑紺帯 !齢制 J 伺噸

i

世帯年取 !眠糊 J 錦噸 表 4 採用テスト結果と合否

1

:合格 表 l 電子レンヲ躍有世帯 世帯刊

2

4

6

8

1

0 0

0

0

9

0 0

0

0

9

¥

¥

¥

i

7

7

i

3

5

7 円 円 9

9

9

1

t

t

1

9 9

9 上 下万万万 円円円 ハUnununununv'i'inununununvnunu'invnununU AHunHVAHunHV'EA'ESAHV 《HV-E-. , EAnHVAHunHvnHUAHVAHVAHV'EAAHV ・, A 咽 1 唱 I 唱i 唱 inunununwnunu'i ・ 1 咽i'l'IAHV'inu'lnU nvnunUAUnunununvnununvnunu'i'i'l'I'I'i'i nunuovnvnununU 咽 i'i'I'l 唱i'inUAUAUnununUAU nHunHU'E--唱 EA'EA 唱 E4 ・ EAAHunHvnHυnHUAHunHunHvnHUAuunHUnHunHU 《HU 曹 i'inunununununUAUAHVAununununvnunununvnu nUAUnunununununUAUnunUAUAunununUAUAUnunu

1

:不合格 合百 祖力握力 100m走ポー!段ボー J~ t 'Yトエラ思量 速度 量一量目量

x3 x4 x5 x6

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

一一一----一一一

x7 x8

《 Un3nLoonUAUρDnnunL 『 uokuρ07 ・円 υ の LnURun3ndnL ooqfquauEdnf 戸 DqdtU4 せ ηiηtn 官民 uηfFDA せ『 UA 官民 d nunLrDnBnLqJnL 必せ qtu--nLRυ 司 unHvndn 日 QU8aznORυ

••.•••••••••••••••••

'i'l'IAU 咽 i 咽 i'i'i 咽 i'I14 唱 I 唱 i 咽 I'inunU 唱 i 噌 i 咽 I 'inLAHWOOFhunvηLnURununU 唱 i 。 JRuzun4067 ・ quηL qtqdn49 白 A を qdqbATtiti-‘ quti'ATA9U9h14quA を 。, unU 咽 i 咽InuvinLAUnuqu ・-咽 lnfu'iqJnLnLnunJnU 司 uqhtAqdqh1& 戸 DnU4-nu 『 u ワ臼 'A 。 LAYnuqdtAnunJ

x2

nUAUra'innunkunEntnvAUAU7 ・ ηLAHvn3nLAUAUnuna qL 。 Jn 日 a 唖 ηL'invonvηL'invnL 唱 iqdnBAUnJ'iηLnL

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

4nuqdnnunBoonJηdnfunununL7 ・町、 unBquntoEOKV 唱 i oDquRun 百円 fnxunERuqunIntnnvnnuρ 口円 tRvn ,・ 7 ・ RV06 nEηLa せ ntququn3nURunLnInJRυqunU7ERυηLnun3

..•••••••••••••••••.

ηdnLqdnLnL'inURunLaaI 唱i'iηJa 吐 zuaaτnruqd8 品znL

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

'inLqd 必せ RuρnuntnnuqunU14nL 『 ua 品ZRupontnon3nU 唱 i 唱 i 咽 1 ・ 1 唱 i 唱 i 唱 i'i 唱 i'IηL 出所.菅民郎『初心者がらくらく読める多変量解析の 実践(上)1

p

.

9

4

表 2 変数の組合せと Du 値, 変数の組合せ

Du

0

.

9

1

3

0

.

9

1

3

0

.

9

0

8

0

.

9

0

7

0

.

8

8

5

0

.

9

0

1

0

.

8

8

0

出所:菅民郎『初心者がらくらく読める多変量解析の 実践(下)J

p

.

4

4

111 111 表 5 アイテムの組合せと Du{1直. 111 アイテムの組合せ 力テゴリ総数

Du

111

0

.

7

2

9

0

.

7

7

4

0

.

7

9

8

0

.

8

2

6

0

.

8

1

3

0

.

8

3

8

0

.

8

2

8

X

1

-X

8 X1-Xト

X

1

-X.

X

1

- X

5

X

1

-X

,

X"

X,. ぷ .

X

5 X1

X,.

X

,

0

.

6

0

5

0

.

7

3

5

0

.

6

1

9

0

.

5

9

0

0

.

4

4

2

7

1

,

1

2

1

"

1

2.

0

.

7

1

2

0

.

7

0

8

5

6

111 表 3 変数の組合せと Du 値, 変数の組合せ

Du

111

3

0

.

5

2

5

X

1

-X

,

X

1

-X

,

X

2

-X

,

X" X

,.

X

,

0

.

9

8

5

0

.

9

8

1

0

.

9

8

4

0

.

9

8

2

0

.

9

8

4

0

.

9

8

0

0

.

9

8

3

0

.

9

8

1

(

51

)

445

1995 年 8 月号 © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(4)

表 6 スポーツの好み 1 はい

o

:いいえ

か尽き

テニススキ サッカ一野球 コソレフ 男 20未満

1

1

1

1

。 男 21-30 。

I

1

1

。 男 31-40 。

1

1

1

男 41 以上

I

。 。

l

1

女20未満

1

l

1

。 。 女21-30

1

1

。 。 。 女31-40

l

1

。 。 。 女41 以上

1

。 。 。

1

参考文献

[

l

J

佐和隆光: I計量経済学の基礎J (1970) ,東洋経済 新報社. 0.5 立 21- 30 女 31-40 テニス 立 4 1 以上 立 2 0 未満 . スキ 男 2 0 来満 男 4 1 以上 サ y カ 男 21- 3 0

-,

女 2 0 来満 スキー 男 31- 40 野球 図 1 数量化 3 績によるプ口 y ト 図 l テニス 立 21-30 官 4 1 以上 立 3 1-~ 0 ゴルフ

[

2

J

奥野・久米・芳賀・吉津「多変量解析法J 0.0 サ y カー ゴルフ

(1971)

, 日科技連出版社.

[

3

J

上回太一郎,小林整功 (1994) :“ソフトウェア業界 の特質についてー判別分析変数選択規準とその適用 例情報処理学会第 49 回(平成 6 年後期)全国大会 予稿集.

[

4

J

菅 民郎「初心者がらくらく読める多変量解析の 実践上下 J (1993) ,現代数学社.

[

5

J

東大教養学部統計学教室編「自然科学の統計学」 (1992) ,東大出版会.

[

6

J

鷲尾・大橋「多次元データの解析J (1989) ,岩波書 店.

446 (

5

2

)

男 21-30 男 31 -40 -0.5 野球 一0.4 ・0.2 0.0 0.2 0.4 0.6 0.8 図 2 特異値骨解によるプ口 y ト 図 2

[

7

J

西里静彦「質的データの数量化J (1982) ,朝倉書 店.

[

8

J

渡部他監修 IFORTRAN 77 による数値計算ソフ トウェア J ,丸善.

会合記録

6 月 1 日(木) 名簿刊行委員会 5 名 6 月 3 日(土) 機関誌編集委員会 13名 6 月 9 日(金) 企業サロン企画委員会 4 名 6 月 28 日(水) 表彰委員会 6 名 6 月 29 日(木) OA 化委員会 3 名 オベレーションズ・リサーチ © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

表 6 スポーツの好み 1 はい o  :いいえ か尽き テニススキ サッカ一野球 コソレフ 男 20未満 1  1  1  1  。 男 21-30 。 I  1  1  。 男 31-40 。 1  。 1  1  男 41 以上 I  。 。 l  1  女20未満 1  l  1  。 。 女21-30 1  1  。 。 。 女31-40 l  1  。 。 。 女41 以上 1  。 。 。 1  参考文献 [ l J  佐和隆光: I計量経済学の基礎J (1970) ,東洋経済 新報社

参照

関連したドキュメント

 学部生の頃、教育実習で当時東京で唯一手話を幼児期から用いていたろう学校に配

○齋藤第一部会長 もう一度確認なのですが、現存の施設は 1 時間当たり 60t の処理能力と いう理解でよろしいですよね。. 〇事業者

以上の基準を仮に想定し得るが︑おそらくこの基準によっても︑小売市場事件は合憲と考えることができよう︒

けることには問題はないであろう︒

 学部生の頃、教育実習で当時東京で唯一手話を幼児期から用いていたろう学校に配

・ホームホスピス事業を始めて 4 年。ずっとおぼろげに理解していた部分がある程度理解でき

3月 がつ を迎え むか 、昨年 さくねん の 4月 がつ 頃 ころ に比べる くら と食べる た 量 りょう も増え ふ 、心 こころ も体 からだ も大きく おお 成長 せいちょう

3.1.6 横浜火力 横浜火力 横浜火力 横浜火力5 5 5号機 5 号機 号機における 号機 における における における定格蒸気温度 定格蒸気温度 定格蒸気温度 定格蒸気温度の の