• 検索結果がありません。

メーカー 電鉄

ドキュメント内 スライド タイトルなし (ページ 83-118)

モデルの仮説

観客動員数

セントラルリーグ パシフィックリーグ

首都圏 関西 その他 新聞社

メーカー

モデルのあてはめ

数量化理論第Ⅰ類の結果(1)

カテゴリスコア

リーグ [ パ ] の係数=-リーグ [ セ ] の係数

= -60.76087 本拠地 [ 首都圏 ] の係数

=-本拠地 [ 関西 ] の係数

-本拠地 [ その他 ] の係数

= 4.333333 + 42.24638 = 46.57971

アイテムの有意性の判定 アイテムのレンジ

=アイテムのカテゴリスコアの

最大値 - カテゴリスコアの最小値

数量化理論第Ⅰ類の結果(2)

アイテム カテゴリー 頻度 カテゴリースコア レンジ

リーグ セ 6 60.76087 121.5217

パ 6 -60.76087

本拠地 首都圏 6 46.579713 88.82609

関西 4 -4.333333

その他 2 -42.24638

親会社業種 新聞 2 34.081522 108.7825

メーカー 5 -4.679239

市 2 -69.09239

電鉄 3 39.690107

前年度成績 A 5 24.92029 42.1087

B 4 -7.731884

C 3 -17.188406

残差の分析

• 残差の分析からどのようなことが言えるであろうか?

数量化理論第Ⅰ類の応用

• 2003 年度のデータを使用してプロ野球の観客動員数の予測を

行ってみなさい。

• 兵庫県市町データを用いて、数量化理論第Ⅰ類を適用した分

析を考えてみなさい。

判別関数分析

カード使用者の使用状態に関するプロフィールデータ

サンプル番号 カード使用状態 家族構成数 年齢 年収

1 3 30 347

2 4 55 383

3 5 50 615

4 4 54 435

5 6 60 751

6 5 39 377

7 3 42 430

8 6 64 672

9 2 70 702

10 4 35 398

11 × 3 41 552

12 × 3 37 306

13 × 2 40 408

14 × 2 30 301

15 × 3 42 315

16 × 4 37 308

17 × 4 33 375

18 × 2 34 578

19 × 3 39 357

20 × 5 30 422

一変量の分布(層別ヒストグラム)

• カード使用状況とその他の変数との間には、どのような関係が存在するか?

層別散布図(1)

層別散布図(2)

• 「多変量の相関」で散布図行

列を表示させ、2つの変数を

用いてカードの使用状況が判

別できそうかどうかを検討す

る。

回転プロット

判別関数分析(1)

• 外的基準(説明したい変数)を0-1型の変数に変換する。

判別関数分析(2)

• JMP 4Jには判別関数 分析が用意されていな いので、外的基準を0

-1型変数に変換した 上で、この外的基準を 目的変数とする重回帰 分析を行うと、判別関 数分析が行える。

0-1型に変換された 外的基準

• JMP 5Jでは、「分析」

→「多変量」→「判別分

析」を選択

判別関数分析(3)

判別関数分析(4)

判別関数分析(5)

0-1型変数の総平均を越えているかどうかで判別 0.5 以上であれば正常(○)

未満であれば異常(×)

判別関数分析(6)

判別関数分析(7)

マハラノビスの汎距離 による判別式を得るに は、外的基準 y の値と して

Ⅰ群に n

2

/ (n

1

+ n

2

)

Ⅱ群に –n

1

/ (n

1

+n

2

)

を与える。こうすれば、

外的基準の値の総平 均が0となり、予測値の 正負で判別が可能にな る。

また、重回帰分析の変

数選択や偏回帰係数

の有意性の検討が判

別関数分析にも応用で

きる。

判別関数分析(8)

z = -1.362 + 0.116 x

1

+ 0.0218 x

2

と なる直線(線形判別関数)

Ⅰ群(正常○)に判別

Ⅱ群(異常×)に判別

判別関数分析(9)

MANOVA(多変量分 散分析モデル)を指定

説明変数を指定

外的基準を指定

判別関数分析(10)

• 判別結果をデータテーブルに

保存する

判別関数分析(11)

各群の重心からオブザベーション までのマハラノビスの距離

オブザベーションが各群に

含まれる確率 判別結果

判別関数分析(12)

説明変数として、家族構成員数と年齢に加えて、年収も入れて 分析を行ってみよ。

年収は判別に寄与していない!

数量化理論第Ⅱ類(1)

• ダミー変数のみを用いた判別関数分析と同等

• リーグを外的基準にして、リーグの違いを分析してみよ。

C メーカー

首都圏 パ

78 ロッテ

B 電鉄

関西 パ

88 南海

B メーカー

首都圏 パ

124 日本ハム

A 電鉄

関西 パ

123 阪急

A 電鉄

首都圏 パ

181 西武

C 電鉄

関西 セ

213 阪神

B 市

首都圏 セ

154 大洋

B メーカー

首都圏 セ

222 ヤクルト

A 市

その他 セ

112 広島

A 新聞

その他 セ

201 中日

A 新聞

首都圏 セ

304 読売

前年度成績 親会社業種

本拠地 リーグ

観客動員数

1987年度プロ野球観客動員数と球団属性一覧

数量化理論第Ⅱ類(2)

リーグを0ー1

型変数または

0.5と-0.5の値

をとる変数に

変換。

数量化理論第Ⅱ類(3)

*2

=1-(S

/(n-p-1))/(S

/(n-1))

分析結果を解釈してみると?

数量化理論第Ⅱ類(3)

主成分分析(1)

多数の変数データから、変数間の内部関連に基づく少数の主成分と呼ばれる合成変数を構成する分析法

学生番号 国語 社会 数学 理科 音楽 美術 保健体育 技術家庭 英語

1 55 59 38 66 29 32 29 36 61

2 36 49 35 57 63 62 55 66 45

3 53 58 16 41 67 54 50 50 48

4 78 80 42 65 85 75 69 76 70

5 6 19 38 59 49 47 43 57 26

6 41 43 49 66 74 64 63 75 49

7 73 78 57 77 61 62 53 65 73

8 21 29 38 58 64 58 52 65 32

9 50 55 22 51 58 58 51 46 52

10 61 69 57 71 68 61 53 64 63

11 73 80 66 88 43 48 42 60 80

12 56 69 79 91 55 50 50 72 73

13 56 53 30 50 73 72 63 62 45

14 35 43 35 49 57 53 45 47 38

15 37 52 54 71 81 72 70 80 51

16 61 66 53 74 69 62 56 74 63

17 39 55 56 69 82 70 68 78 52

18 37 41 23 42 53 50 37 44 37

19 40 45 60 72 73 67 59 76 48

主成分分析(2)

主成分分析(3)

•x 1 、x 、‥‥、x のp個の変数から新しい変数z 、z 、‥‥、z を 作成することを考える。

1 =a 11 +a 12 +‥‥+a 1p =a 21 +a 22 +‥‥+a 2p

: : : : :

=a m1 +a m2 +‥‥+a mp

ここで、z からz へと順にx からx までの情報が最大限に集約 されるように係数a ij を決めたい。

•もとの変数の分散共分散行列の固有値と固有ベクトルを計算す

ることに帰着される。

主成分分析(4)

• 通常は相関係数行列 からを選択

• 分散共分散行列から

を選択すると変数のス

ケールのとり方に依存

して分散共分散行列の

値が変化する。

主成分分析(5)

固有値の総和=p (分散共分散行列からの場合は各変数の分散の総和)

第k主成分の寄与率=第k主成分の固有値/p

どこまでの主成分を考えるかの基準

第1から第9までの主成分

主成分分析(6)

主成分分析の結果(各主成分の重み 係数=主成分負荷量=固有ベクトル)

を保存

1行ずれている!

主成分分析(7)

主成分の解釈(主成分の意味の検討)

各主成分の散布図行列から各主成分のもつ意味を検討する。

主成分分析(8)

ドキュメント内 スライド タイトルなし (ページ 83-118)

関連したドキュメント