モデルの仮説
観客動員数
セントラルリーグ パシフィックリーグ
首都圏 関西 その他 新聞社
メーカー
モデルのあてはめ
数量化理論第Ⅰ類の結果(1)
カテゴリスコア
リーグ [ パ ] の係数=-リーグ [ セ ] の係数
= -60.76087 本拠地 [ 首都圏 ] の係数
=-本拠地 [ 関西 ] の係数
-本拠地 [ その他 ] の係数
= 4.333333 + 42.24638 = 46.57971
アイテムの有意性の判定 アイテムのレンジ
=アイテムのカテゴリスコアの
最大値 - カテゴリスコアの最小値
数量化理論第Ⅰ類の結果(2)
アイテム カテゴリー 頻度 カテゴリースコア レンジ
リーグ セ 6 60.76087 121.5217
パ 6 -60.76087
本拠地 首都圏 6 46.579713 88.82609
関西 4 -4.333333
その他 2 -42.24638
親会社業種 新聞 2 34.081522 108.7825
メーカー 5 -4.679239
市 2 -69.09239
電鉄 3 39.690107
前年度成績 A 5 24.92029 42.1087
B 4 -7.731884
C 3 -17.188406
残差の分析
• 残差の分析からどのようなことが言えるであろうか?
数量化理論第Ⅰ類の応用
• 2003 年度のデータを使用してプロ野球の観客動員数の予測を
行ってみなさい。
• 兵庫県市町データを用いて、数量化理論第Ⅰ類を適用した分
析を考えてみなさい。
判別関数分析
カード使用者の使用状態に関するプロフィールデータ
サンプル番号 カード使用状態 家族構成数 年齢 年収
1 ○ 3 30 347
2 ○ 4 55 383
3 ○ 5 50 615
4 ○ 4 54 435
5 ○ 6 60 751
6 ○ 5 39 377
7 ○ 3 42 430
8 ○ 6 64 672
9 ○ 2 70 702
10 ○ 4 35 398
11 × 3 41 552
12 × 3 37 306
13 × 2 40 408
14 × 2 30 301
15 × 3 42 315
16 × 4 37 308
17 × 4 33 375
18 × 2 34 578
19 × 3 39 357
20 × 5 30 422
一変量の分布(層別ヒストグラム)
• カード使用状況とその他の変数との間には、どのような関係が存在するか?
層別散布図(1)
層別散布図(2)
• 「多変量の相関」で散布図行
列を表示させ、2つの変数を
用いてカードの使用状況が判
別できそうかどうかを検討す
る。
回転プロット
判別関数分析(1)
• 外的基準(説明したい変数)を0-1型の変数に変換する。
判別関数分析(2)
• JMP 4Jには判別関数 分析が用意されていな いので、外的基準を0
-1型変数に変換した 上で、この外的基準を 目的変数とする重回帰 分析を行うと、判別関 数分析が行える。
0-1型に変換された 外的基準
• JMP 5Jでは、「分析」
→「多変量」→「判別分
析」を選択
判別関数分析(3)
判別関数分析(4)
判別関数分析(5)
0-1型変数の総平均を越えているかどうかで判別 0.5 以上であれば正常(○)
未満であれば異常(×)
判別関数分析(6)
判別関数分析(7)
マハラノビスの汎距離 による判別式を得るに は、外的基準 y の値と して
Ⅰ群に n
2/ (n
1+ n
2)
Ⅱ群に –n
1/ (n
1+n
2)
を与える。こうすれば、
外的基準の値の総平 均が0となり、予測値の 正負で判別が可能にな る。
また、重回帰分析の変
数選択や偏回帰係数
の有意性の検討が判
別関数分析にも応用で
きる。
判別関数分析(8)
z = -1.362 + 0.116 x
1+ 0.0218 x
2と なる直線(線形判別関数)
Ⅰ群(正常○)に判別
Ⅱ群(異常×)に判別
判別関数分析(9)
MANOVA(多変量分 散分析モデル)を指定
説明変数を指定
外的基準を指定
判別関数分析(10)
• 判別結果をデータテーブルに
保存する
判別関数分析(11)
各群の重心からオブザベーション までのマハラノビスの距離
オブザベーションが各群に
含まれる確率 判別結果
判別関数分析(12)
説明変数として、家族構成員数と年齢に加えて、年収も入れて 分析を行ってみよ。
年収は判別に寄与していない!
数量化理論第Ⅱ類(1)
• ダミー変数のみを用いた判別関数分析と同等
• リーグを外的基準にして、リーグの違いを分析してみよ。
C メーカー
首都圏 パ
78 ロッテ
B 電鉄
関西 パ
88 南海
B メーカー
首都圏 パ
124 日本ハム
A 電鉄
関西 パ
123 阪急
A 電鉄
首都圏 パ
181 西武
C 電鉄
関西 セ
213 阪神
B 市
首都圏 セ
154 大洋
B メーカー
首都圏 セ
222 ヤクルト
A 市
その他 セ
112 広島
A 新聞
その他 セ
201 中日
A 新聞
首都圏 セ
304 読売
前年度成績 親会社業種
本拠地 リーグ
観客動員数
1987年度プロ野球観客動員数と球団属性一覧
数量化理論第Ⅱ類(2)
リーグを0ー1
型変数または
0.5と-0.5の値
をとる変数に
変換。
数量化理論第Ⅱ類(3)
R
*2=1-(S
E/(n-p-1))/(S
T/(n-1))
分析結果を解釈してみると?
数量化理論第Ⅱ類(3)
主成分分析(1)
多数の変数データから、変数間の内部関連に基づく少数の主成分と呼ばれる合成変数を構成する分析法
学生番号 国語 社会 数学 理科 音楽 美術 保健体育 技術家庭 英語
1 55 59 38 66 29 32 29 36 61
2 36 49 35 57 63 62 55 66 45
3 53 58 16 41 67 54 50 50 48
4 78 80 42 65 85 75 69 76 70
5 6 19 38 59 49 47 43 57 26
6 41 43 49 66 74 64 63 75 49
7 73 78 57 77 61 62 53 65 73
8 21 29 38 58 64 58 52 65 32
9 50 55 22 51 58 58 51 46 52
10 61 69 57 71 68 61 53 64 63
11 73 80 66 88 43 48 42 60 80
12 56 69 79 91 55 50 50 72 73
13 56 53 30 50 73 72 63 62 45
14 35 43 35 49 57 53 45 47 38
15 37 52 54 71 81 72 70 80 51
16 61 66 53 74 69 62 56 74 63
17 39 55 56 69 82 70 68 78 52
18 37 41 23 42 53 50 37 44 37
19 40 45 60 72 73 67 59 76 48