• 検索結果がありません。

163 20.2 プログラムの利用法

1.2 順序ロジスティック回帰

順序ロジスティック回帰には、累積ロジットモデル、隣接カテゴリ―ロジットモデル、連続比ロジ ットモデルなどがあるが、ここでは最も扱いやすく、プログラムで取り入れている累積ロジットモデ ルについて説明する。他のモデルについては、プログラムに導入次第報告する。

累積ロジットモデル

累積ロジットモデルでは、以下の比の対数を線形関数で予測する。

1 1

2 J

p e

p p

 

2

1 2

3 J

p p

p p e

  

,… 1

1 J 1 J

J

p p

p e

 

これは、連続した複数のカテゴリーの出現確率と残りのカテゴリーの出現確率のオッズ比を説明変数 の線形関数で予測することに相当する。

上の関係を以下のように書き換え、

2 1

1

p p

J

p e

  

3 2

1 2

p p

J

p p e

  

,… 1 1 J1

J J

p e

p p

  

1 2

q

pp   p

と定義すると、以下の関係が示される。

1

1 2 1

1  pp   p

J

p e

より、

1

1 1 1

1

p e q

e

1 2

2 1

(

1 2

)

pp e

pp e

より、

2 1

2

1 1

1 1

pe

e

 

2

1 2 2 2

1

p p e q

e

 

3 2

3

(

1 2

) (

1 2 3

)

ppp e

ppp e

より、

3 2

3

1 1

1 1

pe

e

 

3

1 2 3 3 3

1

p p p e q

e

  

同様にして、

1 2

1

1 1

1

J

1

J

p

J

e

e

 

1

1 1 1 1

1

J

J J J

p p e q

e

   

また、

1 1

1 1 1

1 1

1 ( ) 1 1

1

J

1

J

J J J

p p p q

e

e

        

 

多値ロジスティック回帰/多変量解析

171

これらより、

q

について考えれば、各カテゴリー

について独立に、

q

1  q

2項分布とし

の値を推定できることが分かる。そのためこれは2値ロジスティック回帰の拡張として捉える ことができ、各カテゴリ

p

  1, 2, , J

)については以下のように与えることができる。

1 1

,

1

,

J

1

J 1

pq p

q

q

p   q

1.3 プログラムの利用法

メニュー[分析-多変量解析等-判別手法-多値ロジスティック回帰]を選択すると図 1 のような 多値ロジスティック回帰分析の分析実行メニューが表示される。

図 1 分析実行メニュー 複数列形式のデータの例を図 2 に示す。

図 2 複数列形式のデータ

「目的変数」グループボックスの「複数列形式」を選択し、変数選択ですべての変数を選択し、「名 義ロジスティック」の設定から図 3 のように基準に「重要でない」を選択する。

多値ロジスティック回帰/多変量解析

172

図 3 複数列目的変数の名義ロジスティック設定

ここでは、「重要でない」カテゴリーの確率で、他のカテゴリーの確率を割った対数オッズを説明変 数の線形関数で推定することになる。

「多値ロジスティック回帰」ボタンをクリックすると図 4 のような分析結果が表示される。

図 4 対数オッズの推定

ここでは、オッズ比推定の偏回帰係数、標準化偏回帰係数、偏回帰係数の標準誤差、偏回帰係数が 0 となる検定確率、偏回帰係数の下限と上限、説明変数単位量の変化によるオッズ比の変化量が表示さ れる。

「適合性」ボタンをクリックすると、図 5 のように各種の適合性指標が表示される。

図 5 適合性指標

「予測確率と予測値」ボタンをクリックすると、図 6 のような結果が表示される。

多値ロジスティック回帰/多変量解析

173

図 6 予測確率と予測値

これには 3 つのカテゴリーについての実測値、予測確率、予測値が表示される。「表示変数」を1つ 選んで、「実測/予測散布図」ボタンをクリックすると、図 7 のような散布図が表示される。

図 7 実測/予測散布図

同じデータを順序尺度として、順序ロジスティックの累積ロジットモデルで分析すると図 8 のよう な結果を得る。

図 8 累積ロジットモデルでの結果

これは最初が「重要でない」を「重要」と「とても重要」を足したカテゴリーで割った対数オッズ、

次が「重要でない」と「重要」を足したカテゴリーを「とても重要」で割った対数オッズについての 説明変数の線形関数での推定である。

多値ロジスティック回帰/多変量解析

174

最後に目的変数が同じファイル 2 頁目の「1 列形式」(ファイルは異なる)で与えられる場合、「適 合性」の結果に図 9 のように誤判別確率の値が表示される。

図 9 1 列形式の場合の適合性結果

参考文献

[1] Annette J. Dobson著, 田中豊他訳, 一般化線形モデル入門 原著第2版, 共立出版, 2008.

K-平均法/多変量解析

175

22.K-平均法

K-平均法は、非階層的なクラスター分析の代表的な手法の1つで、多数のデータで

も高速に分類できる特徴を持っている。データ

x

i

番目(

  1, , N

)の個体の

i

番目(

i  1, , p

)の変数を表している。K-平均法はこの個体をある決められた

K

個 のクラスターに分類する。ここではプログラム中で使ったこの手法の手順を示してお く。

データはそのままでも標準化してもよいが、データの大きさや単位が異なる場合は 標準化して使用する方がすべての変数を同等に扱える。ここでは標準化したデータも

x

iで表すことにする。