163 20.2 プログラムの利用法
1.2 順序ロジスティック回帰
順序ロジスティック回帰には、累積ロジットモデル、隣接カテゴリ―ロジットモデル、連続比ロジ ットモデルなどがあるが、ここでは最も扱いやすく、プログラムで取り入れている累積ロジットモデ ルについて説明する。他のモデルについては、プログラムに導入次第報告する。
累積ロジットモデル
累積ロジットモデルでは、以下の比の対数を線形関数で予測する。
1 1
2 J
p e
p p
, 21 2
3 J
p p
p p e
,… , 11 J 1 J
J
p p
p e
これは、連続した複数のカテゴリーの出現確率と残りのカテゴリーの出現確率のオッズ比を説明変数 の線形関数で予測することに相当する。
上の関係を以下のように書き換え、
2 1
1
p p
Jp e
, 3 21 2
p p
Jp p e
,… , 1 1 J1J J
p e
p p
1 2
q
p p p
と定義すると、以下の関係が示される。1
1 2 1
1 p p p
J p e
より、1
1 1 1
1
p e q
e
1 2
2 1
(
1 2)
p p e
p p e
より、2 1
2
1 1
1 1
p e
e
,2
1 2 2 2
1
p p e q
e
3 2
3
(
1 2) (
1 2 3)
p p p e
p p p e
より、3 2
3
1 1
1 1
p e
e
,3
1 2 3 3 3
1
p p p e q
e
同様にして、
1 2
1
1 1
1
J1
Jp
Je
e
,1
1 1 1 1
1
J
J J J
p p e q
e
また、
1 1
1 1 1
1 1
1 ( ) 1 1
1
J1
JJ J J
p p p q
e
e
多値ロジスティック回帰/多変量解析
171
これらより、
q
について考えれば、各カテゴリー
について独立に、q
と1 q
の2項分布として
の値を推定できることが分かる。そのためこれは2値ロジスティック回帰の拡張として捉える ことができ、各カテゴリp
( 1, 2, , J
)については以下のように与えることができる。1 1
,
1,
J1
J 1p q p
q
q
p q
1.3 プログラムの利用法
メニュー[分析-多変量解析等-判別手法-多値ロジスティック回帰]を選択すると図 1 のような 多値ロジスティック回帰分析の分析実行メニューが表示される。
図 1 分析実行メニュー 複数列形式のデータの例を図 2 に示す。
図 2 複数列形式のデータ
「目的変数」グループボックスの「複数列形式」を選択し、変数選択ですべての変数を選択し、「名 義ロジスティック」の設定から図 3 のように基準に「重要でない」を選択する。
多値ロジスティック回帰/多変量解析
172
図 3 複数列目的変数の名義ロジスティック設定
ここでは、「重要でない」カテゴリーの確率で、他のカテゴリーの確率を割った対数オッズを説明変 数の線形関数で推定することになる。
「多値ロジスティック回帰」ボタンをクリックすると図 4 のような分析結果が表示される。
図 4 対数オッズの推定
ここでは、オッズ比推定の偏回帰係数、標準化偏回帰係数、偏回帰係数の標準誤差、偏回帰係数が 0 となる検定確率、偏回帰係数の下限と上限、説明変数単位量の変化によるオッズ比の変化量が表示さ れる。
「適合性」ボタンをクリックすると、図 5 のように各種の適合性指標が表示される。
図 5 適合性指標
「予測確率と予測値」ボタンをクリックすると、図 6 のような結果が表示される。
多値ロジスティック回帰/多変量解析
173
図 6 予測確率と予測値
これには 3 つのカテゴリーについての実測値、予測確率、予測値が表示される。「表示変数」を1つ 選んで、「実測/予測散布図」ボタンをクリックすると、図 7 のような散布図が表示される。
図 7 実測/予測散布図
同じデータを順序尺度として、順序ロジスティックの累積ロジットモデルで分析すると図 8 のよう な結果を得る。
図 8 累積ロジットモデルでの結果
これは最初が「重要でない」を「重要」と「とても重要」を足したカテゴリーで割った対数オッズ、
次が「重要でない」と「重要」を足したカテゴリーを「とても重要」で割った対数オッズについての 説明変数の線形関数での推定である。
多値ロジスティック回帰/多変量解析
174
最後に目的変数が同じファイル 2 頁目の「1 列形式」(ファイルは異なる)で与えられる場合、「適 合性」の結果に図 9 のように誤判別確率の値が表示される。
図 9 1 列形式の場合の適合性結果
参考文献
[1] Annette J. Dobson著, 田中豊他訳, 一般化線形モデル入門 原著第2版, 共立出版, 2008.
K-平均法/多変量解析
175
22.K-平均法
K-平均法は、非階層的なクラスター分析の代表的な手法の1つで、多数のデータで
も高速に分類できる特徴を持っている。データx
iは
番目( 1, , N
)の個体のi
番目(i 1, , p
)の変数を表している。K-平均法はこの個体をある決められたK
個 のクラスターに分類する。ここではプログラム中で使ったこの手法の手順を示してお く。データはそのままでも標準化してもよいが、データの大きさや単位が異なる場合は 標準化して使用する方がすべての変数を同等に扱える。ここでは標準化したデータも