二値選択モデルの推定
報告日:2009年11月4日 報告者:寺脇 拓
1. トクホ商品購入の規定要因 1. トクホ商品購入の規定要因
2
1. トクホ商品購入の規定要因二値選択モデルの推定 2009年度演習II(10)
1 1 デ タ
1.1 データ
• Microsoft Excel 4.0 ワークシート形式で保存。
• データのすぐ上の行に変数名が来るように配置する。
• 次の情報をメモしておく
• 次の情報をメモしておく。
データセットの左上角(upper left corner)
のセルアドレス
変数の数
変数の数
観測値の数• サンプルデータ(data tokuho.xls) サンプルデ タ(data_tokuho.xls)
二値選択モデルの推定 2009年度演習II(10)
左上隅のセル
変数名群 隅
変数名 内容 定義
表1: 変数定義
1、0にコーディング
変数名 内容 定義
被説明変数
BUY
トクホ食品の購入経験 買ったことがある=1, 買ったことがない=0 説明変数HEALTH
健康食品の利用頻度 とらない=1, 必要な時だけ取っている=2, 日常的にとっている=3JOG
運動の頻度 運動していない=1, 時々運動している=2, 日常的に運動している=3TOBACCO
タバコを吸う頻度 吸わない=1, 時々吸っている=2, 日常的に吸っている=3SAKE
酒を飲む頻度 飲まない=1, 時々飲む=2, ほぼ毎日飲む=3KNOW
トクホ制度に関する知識 全く知らない=1,
トクホの名前だけ知っている=2,
表示制度があることは知っている=3, 審査基準まで知っている=4
TRUST
トクホ食品の健康効果に対する信頼度 全く信頼できない=1, どちらかといえば信頼できない=2,どちらともいえない
=3, ,
どちらかといえば信頼できる=4, ,
非常に信頼できる=5GENDER
性別 女性=1, 男性=0AGE
年代 数量データJOB
職業 会社員、公務員=1, その他=0JOB
職業 会社員、公務員1, その他 0
5
1. トクホ商品購入の規定要因1 2 デ タのインポ ト
1.2 データのインポート
1. File → New → Workfile の順にクリック。 順
2. Workfile structure type で Unstructured/Undated を選択。
Ob
> Observation のフィー ルドに観測値数 ( この例 では86)を入力。
では86)を入力。
> OKをクリック。
6
1. トクホ商品購入の規定要因二値選択モデルの推定 2009年度演習II(10)
3 次のウインドウが開く 3. 次のウインドウが開く。
4. Procs→Import→Read Text-Lotus-Excelの順にク リック。
二値選択モデルの推定 2009年度演習II(10)
5 データが入力されたエクセルファイルを選択して開 5. デ タが入力されたエクセルファイルを選択して開
く。
6 Upper-left data cellのフィールドにデータ左上隅の 6. Upper left data cellのフィ ルドにデ タ左上隅の
セルアドレス(この例ではA2)を入力。
> Names for series or Number if names in fileの
> Names for series or Number if names in fileの フィールドに変数名の数 ( この例では 11) を入力。
> OKをクリック。
9
1. トクホ商品購入の規定要因7 データがインポートされ 7. デ タがインポ トされ、
変数名群がWorkfileウイ ンドウに現れる。
8 File→Save As(あるいはSave)の順にクリックし 8. File→Save As(あるいはSave)の順にクリックし、
“Double precision”をチェックして ファイルを保 存する。
Save
:保存。 Save As
:名前をつけて保存。10
1. トクホ商品購入の規定要因二値選択モデルの推定 2009年度演習II(10)
1 3 プロビットモデルの推定
1.3 プロビットモデルの推定
1. Object→New Objectの順にクリック。 j j 順
2. Name for objectのフィール ドに推定結果を出力するオブ ジェクトの名前を入力 ( この ジェクトの名前を入力 ( この
二値選択モデルの推定 2009年度演習II(10)
3 Equation Specification 3. Equation Specification のフィールドに、従属変 数、定数項、独立変数 1 独立変数2 独立変数 1、独立変数2、独立変数 3のように変数名を入力 する。
する。
c
は定数項を意味する。
各変数の間は半角空ける。4. Method で Binary を選択
し Binary estimation
し、Binary estimation
5 モデルの推定結果が 5. モデルの推定結果が
現れる。
probit1 p
というオブ ジェクトがWorkfile ウインドウに作成さ れる。係数推定値
t統計量 p値
p
値が0.1
よりも小さ ければその係数は10
%水準で有意とい10
%水準で有意とい うことになる。 AIC
は通常この出力 された値にサンプル された値にサンプル サイズ(
ここでは86)
をかけたものが用い されるAIC
される。
出力結果はコピーし てエクセルに貼り付 けることができるマクファーデンのR2
13
けることができる。
1. トクホ商品購入の規定要因
1 4 変数選択
1.4 変数選択
• p p 値の高い変数から順に削除していき、どのモデル 変数 順 ( どの変数の組み合わせ ) が望ましいか検討しよう。
1. Workfile ウインドウの probit1にカーソルを あわせ、右クリックで Object copy を選択。
Object copy を選択。
14
1. トクホ商品購入の規定要因二値選択モデルの推定 2009年度演習II(10)
2 Destinationで新しいオ 2. Destinationで新しいオ ブジェクトの名前を入力 (この例ではprobit2)。
> OK をクリック。
3. 新たに作られた probit2 をダブルクリック。
このオブジェクトを作業 用に使う。二値選択モデルの推定 2009年度演習II(10)
4 Equation Specificationのフィールドから 最もp値 4. Equation Specificationのフィ ルドから、最もp値
が高かった trust を削除。
> OK をクリック。
> OK をクリック。
trustを削除
5 trustが独立変数群から削除されたモデルの推定結果
5. trustが独立変数群から削除されたモデルの推定結果
が現れる。
AIC
が改善され( (
より小さくなっている) )
、このモデルの方が より十分にデータを説明しているといえる。> 同様の作業を繰り返し、各モデルのAICを比較してみ よう
よう。
表2: 変数削除に伴うAICの変化
デ 出力されたAIC AIC(出力されたAIC 86)追加的 削除された変数 最も大きな 値 モデル 出力されたAIC AIC(出力されたAIC×86)追加的に削除された変数 最も大きなp値
1 1.1384 97.9
なし0.9928(trust)
2 1.1152 95.9 trust 0.9142(know)
3 1 0920 93 9 know 0 7742(job)
3 1.0920 93.9 know 0.7742(job)
4 1.0697 92.0 job 0.6815(gender)
5 1.0484 90.2 gender 0.5054(sake)
6 1 0304 88 6 sake 0 1123(age)
6 1.0304 88.6 sake 0.1123(age)
7 1.0373 89.2 age 0.2899(c)
8 1.0271 88.3 c (定数項) 0.0327(tobacco)
17
1. トクホ商品購入の規定要因0 8 0.9 1 98.0
100.0
0.6 0.7 0.8
94.0
96.0
最も
A
大0.3 0.4 0.5
90 0
92.0
きな
p
値I
C
0 0.1 0.2 0.3
86 0 88.0
90.0
値0 86.0
1 2 3 4 5 6 7 8
モデル モデル6 7 8あ
図2: 変数削除に伴うAICの変化 最も大きなp値
AIC
モデル6、7、8あ たりがよさそう。
18
図2: 変数削除に伴うAICの変化1. トクホ商品購入の規定要因
二値選択モデルの推定
2009年度演習II(10) 2009年度演習II(10) 二値選択モデルの推定
6 p値(係数の有意性)とAIC
6. p値(係数の有意性)とAIC から望ましいモデルを選 択する。
定数項が20
%水準でも有意 でないので、モデル7
を選 択することは適当でない。択
AIC
が最小で、全ての変数 が10%
水準で有意という 点ではモデル8
がベスト 点ではモデル8
がベスト。 10%
水準で有意でない変 数が含まれるが、それらの値は
0 1
に近いこと そしp
値は0.1
に近いこと、そし表3: 推定結果の表記例(モデル6のケース)
係数推定値
t統計量 p値
定数項
1.134 1.613 0.107
変数
HEALTH
(健康食品の利用頻度)1.092 4.066 0.000
JOG
(運動の頻度)-0.521 -2.314 0.021 TOBACCO
(タバコを吸う頻度)(タ コを吸う頻度)-0.795 -2.429 0.015
AGE
(年代)-0.017 -1.588 0.112
McFaddenのR
2AIC
0.285 88 612 AIC
標本サイズ
88.612 86
21
1. トクホ商品購入の規定要因1 5 限界効果の計算
1.5 限界効果の計算
1. 最終的に選択した推 最終 選択 推 定結果を表示させた 状態で、 View→Categorical View→Categorical Regressor Stats の 順にクリック。
22
1. トクホ商品購入の規定要因二値選択モデルの推定 2009年度演習II(10)
2 モデルに含まれる 2. モデルに含まれる 独立変数の平均値 ベクトルを選択 し ピ する し、コピーする。
> これをエクセルに 貼り付け 「二値 貼り付け、「二値 選択モデル」のレ ジュメ p.19 p の式に 従って、限界効果 を計算する。
標準正規分布に従
標準正規分布に従 うX
について、X=a
の密度関数 の値はの値は、
=NORMDIST(a, 0,1,FALSE)
で計 算される算される。
二値選択モデルの推定 2009年度演習II(10)