順序ロジスティック回帰 - 163 20.2 プログラムの利用法 - 目次. 実験計画法.... 重回帰分析判別分析主成分分析因子分析クラスター分析正準相関分析数量化 Ⅰ 類

163 20.2 プログラムの利用法

1.2 順序ロジスティック回帰

順序ロジスティック回帰には、累積ロジットモデル、隣接カテゴリ―ロジットモデル、連続比ロジットモデルなどがあるが、ここでは最も扱いやすく、プログラムで取り入れている累積ロジットモデルについて説明する。他のモデルについては、プログラムに導入次第報告する。

累積ロジットモデル

累積ロジットモデルでは、以下の比の対数を線形関数で予測する。

1 1

2 J

p e

p p





 

^， ²

1 2

3 J

p p

p p e





  

^，…^， ¹

1 J 1 J

p p

p e

_

 





これは、連続した複数のカテゴリーの出現確率と残りのカテゴリーの出現確率のオッズ比を説明変数の線形関数で予測することに相当する。

上の関係を以下のように書き換え、

2 1

p p

p e



  

^， ³ ²

1 2

p p

p p e



  



^，…^， ₁ ₁ ^J¹

J J

p e

p p

_



  

1 2

q

_

 p  p   p

_と定義すると、以下の関係が示される。

1 2 1

1  p  p   p

 p e

^^ より、

1 1 1

1 p e q

e











1 2

2 1

(

1 2

)

p  p e

^^

 p  p e

^^ より、

2 1

1 1

p  e

^^

 e

^^

 

^，

1 2 2 2

1 p p e q

e



 







3 2

(

1 2

) (

1 2 3

)

p  p  p e

^^

 p  p  p e

^^ より、

3 2

1 1

p  e

^^

 e

^^

 

^，

1 2 3 3 3

1 p p p e q

e



  







同様にして、

1 2

1 1

1 p

e

^ ^

e

^^







 

^，

1 1 1 1

1

J J J

p p e q

e





  

   



また、

1 1

1 1 1

1 1

1 ( ) 1 1

1

J J J

p p p q

e

^^

e

^^

  

        

 

多値ロジスティック回帰／多変量解析

171

これらより、

q

_について考えれば、各カテゴリー



^{について独立に、}

q

_^と

1  q

_^の²^{項分布とし}

て



_の値を推定できることが分かる。そのためこれは2値ロジスティック回帰の拡張として捉えることができ、各カテゴリ

p

_（

  1, 2, , J

）については以下のように与えることができる。

1 1

,

1

_J 1

p  q p

_

 q

_

 q

__

p   q

_

1.3 プログラムの利用法

メニュー［分析－多変量解析等－判別手法－多値ロジスティック回帰］を選択すると図 1 のような多値ロジスティック回帰分析の分析実行メニューが表示される。

図 1 分析実行メニュー複数列形式のデータの例を図 2 に示す。

図 2 複数列形式のデータ

「目的変数」グループボックスの「複数列形式」を選択し、変数選択ですべての変数を選択し、「名義ロジスティック」の設定から図 3 のように基準に「重要でない」を選択する。

多値ロジスティック回帰／多変量解析

172

図 3 複数列目的変数の名義ロジスティック設定

ここでは、「重要でない」カテゴリーの確率で、他のカテゴリーの確率を割った対数オッズを説明変数の線形関数で推定することになる。

「多値ロジスティック回帰」ボタンをクリックすると図 4 のような分析結果が表示される。

図 4 対数オッズの推定

ここでは、オッズ比推定の偏回帰係数、標準化偏回帰係数、偏回帰係数の標準誤差、偏回帰係数が 0 となる検定確率、偏回帰係数の下限と上限、説明変数単位量の変化によるオッズ比の変化量が表示される。

「適合性」ボタンをクリックすると、図 5 のように各種の適合性指標が表示される。

図 5 適合性指標

「予測確率と予測値」ボタンをクリックすると、図 6 のような結果が表示される。

多値ロジスティック回帰／多変量解析

173

図 6 予測確率と予測値

これには 3 つのカテゴリーについての実測値、予測確率、予測値が表示される。「表示変数」を１つ選んで、「実測/予測散布図」ボタンをクリックすると、図 7 のような散布図が表示される。

図 7 実測/予測散布図

同じデータを順序尺度として、順序ロジスティックの累積ロジットモデルで分析すると図 8 のような結果を得る。

図 8 累積ロジットモデルでの結果

これは最初が「重要でない」を「重要」と「とても重要」を足したカテゴリーで割った対数オッズ、

次が「重要でない」と「重要」を足したカテゴリーを「とても重要」で割った対数オッズについての説明変数の線形関数での推定である。

多値ロジスティック回帰／多変量解析

174

最後に目的変数が同じファイル 2 頁目の「1 列形式」（ファイルは異なる）で与えられる場合、「適合性」の結果に図 9 のように誤判別確率の値が表示される。

図 9 1 列形式の場合の適合性結果

参考文献

[1] Annette J. Dobson著, 田中豊他訳, 一般化線形モデル入門原著第2版, 共立出版, 2008.

K-平均法／多変量解析

175 ２２．K-平均法

K-平均法は、非階層的なクラスター分析の代表的な手法の１つで、多数のデータで

も高速に分類できる特徴を持っている。データ

x

_i_^は



^番目（

  1, , N

^{）の個体の}

i

番目（

i  1, , p

）の変数を表している。K-平均法はこの個体をある決められた

K

個のクラスターに分類する。ここではプログラム中で使ったこの手法の手順を示しておく。

データはそのままでも標準化してもよいが、データの大きさや単位が異なる場合は標準化して使用する方がすべての変数を同等に扱える。ここでは標準化したデータも

x

i_で表すことにする。

ドキュメント内目次. 実験計画法.... 重回帰分析判別分析主成分分析因子分析クラスター分析正準相関分析数量化 Ⅰ 類数量化 Ⅱ 類数量化 Ⅲ 類コレスポンデン (ページ 172-177)