• 検索結果がありません。

一般化線形モデル

N/A
N/A
Protected

Academic year: 2021

シェア "一般化線形モデル"

Copied!
40
0
0

読み込み中.... (全文を見る)

全文

(1)

Lec08

一般化線形モデル

I. Takeuchi, ML, DSML-08 1/35

(2)

実数変数の予測モデル(復習)

車体重量(xi) 燃費(yi)

1.22 41.2

1.25 40.5

1.35 40.8

1.36 39.6

1.38 38.3

1.40 39.4

1.48 38.7

1.53 37.6

1.55 36.5

1.62 37.3

1.2 1.3 1.4 1.5 1.6

36373839404142

Car Weight

Fuel Efficiency

(3)

実数変数の予測モデル(復習)

車体重量(xi) 燃費(yi)

1.22 41.2

1.25 40.5

1.35 40.8

1.36 39.6

1.38 38.3

1.40 39.4

1.48 38.7

1.53 37.6

1.55 36.5

1.62 37.3

1.2 1.3 1.4 1.5 1.6

36373839404142

Car Weight

Fuel Efficiency

I. Takeuchi, ML, DSML-08 2/35

(4)

二値変数の予測モデル

価格(xi) 自動運転(yi)

1.25 0

1.36 0

1.52 1

1.55 0

1.64 0

1.74 1

1.82 0

2.01 1

2.27 1

2.35 1 1.0 1.5 2.0 2.5

01

Car Price

Auto−Driving Equipment

(5)

二値変数の予測モデル

価格(xi) 自動運転(yi)

1.25 0

1.36 0

1.52 1

1.55 0

1.64 0

1.74 1

1.82 0

2.01 1

2.27 1

2.35 1

1.0 1.5 2.0 2.5

01

Car Price

Auto−Driving Equipment

I. Takeuchi, ML, DSML-08 3/35

(6)

二値変数の予測モデル

価格(xi) 自動運転(yi)

1.25 0

1.36 0

1.52 1

1.55 0

1.64 0

1.74 1

1.82 0

2.01 1

2.27 1

2.35 1

1.0 1.5 2.0 2.5

01

Car Price

Auto−Driving Equipment

(7)

カウント変数の予測モデル

人口密度(xi) 死亡事故(yi)

1000 0

1120 2

1350 3

1420 4

1560 3

1780 4

1920 6

2050 5

2130 7

2180 9 500 1000 1500 2000 2500

012345678910

Population Density

Death by Car Accident

I. Takeuchi, ML, DSML-08 4/35

(8)

カウント変数の予測モデル

人口密度(xi) 死亡事故(yi)

1000 0

1120 2

1350 3

1420 4

1560 3

1780 4

1920 6

2050 5

2130 7

2180 9

500 1000 1500 2000 2500

012345678910

Population Density

Death by Car Accident

(9)

カウント変数の予測モデル

人口密度(xi) 死亡事故(yi)

1000 0

1120 2

1350 3

1420 4

1560 3

1780 4

1920 6

2050 5

2130 7

2180 9

500 1000 1500 2000 2500

012345678910

Population Density

Death by Car Accident

I. Takeuchi, ML, DSML-08 4/35

(10)

一般化線形モデル

連続変数

計量値 正規分布 最小二乗回帰

生存率 指数分布 指数回帰

· · ·

離散変数

二値 ベルヌーイ分布 ロジスティック回帰

カウント値 ポアソン分布 ポアソン回帰

· · ·

(11)

ベルヌーイ分布

二値変数の確率モデル

P[yi= 1] =q, P[yi= 0] = 1q

確率分布

P[yi=y] =qy(1q)1y

I. Takeuchi, ML, DSML-08 6/35

(12)

ベルヌーイ分布の期待値と分散

ベルヌーイ分布の期待値

E[yi] =q

(証明)

ベルヌーイ分布の分散

V[yi] =q(1q)

(証明)

(13)

ベルヌーイ分布の最尤推定

尤度

L(q) =

n

i=1

qyi(1q)1yi

最尤推定(基本問題1)

ˆ

q= arg max

q L(q) = 1 n

n

i=1

yi

I. Takeuchi, ML, DSML-08 8/35

(14)

二値変数の線形モデル

価格(xi) 自動運転(yi)

1.25 0

1.36 0

1.52 1

1.55 0

1.64 0

1.74 1

1.82 0

2.01 1

2.27 1

2.35 1

1.0 1.5 2.0 2.5

01

Car Price

Auto−Driving Equipment

0E[yi]1でなければならない

(15)

ロジスティック関数

h(z) = 1

1 + exp(z)

−5 0 5

0.00.20.40.60.81.0

z

Logistic Function

I. Takeuchi, ML, DSML-08 10/35

(16)

ロジスティック回帰モデル

確率モデル

P[yi= 1] = 1

1 + exp(wxi), P[yi= 0] = exp(wxi)

1 + exp(wxi)

期待値の予測モデル

E[yi] =P[yi= 1]×1 +P[yi= 0]×0 = 1

1 + exp(wxi)

(17)

ロジスティック回帰モデルの例

価格(xi) 自動運転(yi)

1.25 0

1.36 0

1.52 1

1.55 0

1.64 0

1.74 1

1.82 0

2.01 1

2.27 1

2.35 1

1.0 1.5 2.0 2.5

01

Car Price

Auto−Driving Equipment

I. Takeuchi, ML, DSML-08 12/35

(18)

基本問題1

パラメータqのベルヌーイ分布に従ってn個の観測値y1, . . . , ynが得ら れたとする.パラメータqの最尤推定量が

ˆ q= 1

n

n

i=1

yi

と表されることを示せ.

(19)

基本問題1の解答

I. Takeuchi, ML, DSML-08 14/35

(20)

二項分布

ベルヌーイ分布からm個ランダム変数を生成 y1, . . . , ym

二項分布:m個の二値変数のうち,1k個,0mk個であ る確率

P[k] = (m

k )

qk(1q)mk, k= 1, . . . , m

(21)

二項定理

二項分布

P[k] = (m

k )

qk(1q)mk, k= 1, . . . , m

は確率分布であり,和が1,すなわち,

m

k=0

(m k )

qk(1q)mk= 1

(証明)

I. Takeuchi, ML, DSML-08 16/35

(22)

二項分布の期待値と分散

二項分布Bi(m, q)の期待値

E[k] =mq

(証明)

二項分布Bi(m, q)の分散

V[k] =mq(1q)

(証明)

(23)

個数(m)が大きく頻度(q)が小さい場合

(例)人口:n= 10000人,1人が交通事故にあう確率:q= 0.0005 Bi(10000,0.0005)

交通事故が7件ある確率 (10000

7 )

(0.0005)7(0.9995)9993

ポアソン分布:mqλとなるように,m→ ∞,q0の極限を 考える

(m k )

qk(1q)mk eλλk k!

I. Takeuchi, ML, DSML-08 18/35

(24)

二項分布からポアソン分布へ

二項分布Bi(m, q)において,mqλとなるように,

m→ ∞, q0の極限をとると,ポアソン分布となること,すな わち,

mlim→∞

(m k

) (λ m

)k( 1 λ

m )mk

eλλk k!

(証明)

(25)

ポアソン分布の期待値と分散

ポアソン分布の期待値(基本問題2)

E[yi] =λ

ポアソン分布の分散(基本問題2)

V[yi] =λ

I. Takeuchi, ML, DSML-08 20/35

(26)

ポアソン分布の最尤推定

尤度

L(λ) =

n

i=1

eλλyi yi!

最尤推定

ˆλ= arg max

λ L(λ) = 1 n

n

i=1

yi

(証明)

(27)

カウント変数の線形モデル

人口密度(xi) 死亡事故(yi)

1000 0

1120 2

1350 3

1420 4

1560 3

1780 4

1920 6

2050 5

2130 7

2180 9

500 1000 1500 2000 2500

012345678910

Population Density

Death by Car Accident

0E[yi]でなければならない

I. Takeuchi, ML, DSML-08 22/35

(28)

指数関数

−2 −1 0 1 2

0246

z

Exp Function

(29)

ポアソン回帰モデル

カウント変数の期待値

E[yi] = exp(wxi)

カウント変数の確率モデル

P[yi=y] =eexp(wxi)exp(wxi)y y!

I. Takeuchi, ML, DSML-08 24/35

(30)

ポアソン回帰モデルの例

人口密度(xi) 死亡事故(yi)

1000 0

1120 2

1350 3

1420 4

1560 3

1780 4

1920 6

2050 5

2130 7

2180 9

500 1000 1500 2000 2500

012345678910

Population Density

Death by Car Accident

(31)

基本問題2

ポアソン分布

P[yi=y] = eλλy y!

の期待値と分散が,どちらも

E[yi] =λ, V[yi] =λ

と表されることを示せ.ただし,任意のaRに対し,

exp(a) =

ℓ=0

a ℓ!

を利用してよい.

I. Takeuchi, ML, DSML-08 26/35

(32)

基本問題2の解答

(33)

一般化線形モデル

車体重量(xi) 燃費(yi)

1.22 41.2

1.25 40.5

1.35 40.8

1.36 39.6

1.38 38.3

1.40 39.4

1.48 38.7

1.53 37.6

1.55 36.5

1.62 37.3

価格(xi) 自動運転(yi)

1.25 0

1.36 0

1.52 1

1.55 0

1.64 0

1.74 1

1.82 0

2.01 1

2.27 1

2.35 1

人口密度(xi) 死亡事故(yi)

1000 0

1120 2

1350 3

1420 4

1560 3

1780 4

1920 6

2050 5

2130 7

2180 9

1.2 1.3 1.4 1.5 1.6

36373839404142

Car Weight

Fuel Efficiency

1.0 1.5 2.0 2.5

01

Car Price

Auto−Driving Equipment

500 1000 1500 2000 2500

012345678910

Population Density

Death by Car Accident

(a)正規線形回帰 (b) ロジスティック回帰 (c) ポアソン回帰

I. Takeuchi, ML, DSML-08 28/35

(34)

一般化線形モデルの考え方

入力変数 中間変数 パラメータ 確率分布

(35)

一般化線形モデルの構成要素

線形予測子(linear predictor)

zi=

d

j=1

wjxij

リンク関数(link function)

g:θi 7→zi, g1:zi7→θi

確率モデル(probability model)

P(yi;θi)

I. Takeuchi, ML, DSML-08 30/35

(36)

一般化線形モデルの例

正規線形モデル

線形予測子 リンク関数 確率モデル zi=d

j=1wjxij θi=g1(zi) =zi 1

2πσ2exp((yiθ2i)2)

ロジスティック回帰モデル

線形予測子 リンク関数 確率モデル zi=d

j=1wjxij θi=g1(zi) =1+exp(1z

i) θiyi(1θi)(1yi)

ポアソン回帰モデル

線形予測子 リンク関数 確率モデル zi=d

j=1wjxij θi=g1(zi) = exp(zi) exp(yθiyii

i!

(37)

一般化線形モデルの性質

指数型分布族

P(yi;θi) = exp (a(yi)b(θi) +c(θi) +d(yi))

モデルのパラメータ推定は最尤推定

( ˆw1, . . . ,wˆd) = arg max

w1,...,wd

n

i=1

P(yi;g1(

d

j=1

wjxij))

統計的性質

一致性(漸近的に不偏)

漸近有効性

漸近正規性

統計的検定

Wald検定

スコア検定

尤度比検定

I. Takeuchi, ML, DSML-08 32/35

(38)

一般化線形モデル

車体重量(xi) 燃費(yi)

1.22 41.2

1.25 40.5

1.35 40.8

1.36 39.6

1.38 38.3

1.40 39.4

1.48 38.7

1.53 37.6

1.55 36.5

1.62 37.3

価格(xi) 自動運転(yi)

1.25 0

1.36 0

1.52 1

1.55 0

1.64 0

1.74 1

1.82 0

2.01 1

2.27 1

2.35 1

人口密度(xi) 死亡事故(yi)

1000 0

1120 2

1350 3

1420 4

1560 3

1780 4

1920 6

2050 5

2130 7

2180 9

1.2 1.3 1.4 1.5 1.6

36373839404142

Car Weight

Fuel Efficiency

1.0 1.5 2.0 2.5

01

Car Price

Auto−Driving Equipment

500 1000 1500 2000 2500

012345678910

Population Density

Death by Car Accident

(a)正規線形回帰 (b) ロジスティック回帰 (c) ポアソン回帰

(39)

基本問題3

正規分布,ベルヌイ分布,ポアソン分布は指数型分布族である.

それぞれの分布における

a(θi), b(yi), c(yi), d(θi) を求めよ.

上記の3つの分布以外に指数型分布族に属する確率分布を探し,

対応する

a(θi), b(yi), c(yi), d(θi) を求めよ.

I. Takeuchi, ML, DSML-08 34/35

(40)

基本問題3の解答

参照

関連したドキュメント

△結線形3倍 周波数逓倍器 を選 び,Crnと... Sudni:"Theory

c加振振動数を変化させた実験 地震動の振動数の変化が,ろ過水濁度上昇に与え る影響を明らかにするため,入力加速度 150gal,継 続時間

Power spectrum of sound showed a feature near the upper dead point of shedding motion when healds collided the heald bar.. Superposing sound pressure signals during several periods

劣モジュラ解析 (Submodular Analysis) 劣モジュラ関数は,凸関数か? 凹関数か?... LP ニュートン法 ( の変種

 Charles Carlson, Karthekeyan Chandrasekaran, Hsien-Chih Chang, Naonori Kakimura, Alexandra Kolla, Spectral Aspects of Symmetric. Signings,

地域の名称 文章形式の表現 卓越もしくは変化前 断続現象 変化後 地域 風向 風向(数値) 風速 風力 起時

In this paper, we consider the discrete deformation of the discrete space curves with constant torsion described by the discrete mKdV or the discrete sine‐Gordon equations, and

[r]