• 検索結果がありません。

正規分布と線形分類器

N/A
N/A
Protected

Academic year: 2021

シェア "正規分布と線形分類器"

Copied!
20
0
0

読み込み中.... (全文を見る)

全文

(1)

ニューラル情報処理第 07

正規分布と線形分類器

竹内一郎

名古屋工業大学

(2)

前回の課題の解答

(3)

ベイズ決定規則による分類

ベイズの公式

P

j

| x) = p(x | ω

j

)P (ω

j

)

p(x) , j = 1, 2

事前分布

P

1

) = 0.4, P (ω

2

) = 0.6

クラス条件付確率

p(x | ω

1

), p(x | ω

2

)

(4)

本日の講義の目標

クラス条件付き確率 p(x | ω

j

) が正規分布であるときの ベイズ分類規則を導出する

0 0.05 0.1 0.15 0.2

15 20 25 30 35 40 45 50

Probability Density

Feature x

(5)

1 次元正規分布

確率密度関数

p(x; µ, σ

2

) = 1 2πσ

2

exp

( (x µ)

2

2

)

パラメータ

µ: 平均, σ

2

: 分散, σ: 標準偏差

0 0.1 0.2 0.3 0.4 0.5

-5 -4 -3 -2 -1 0 1 2 3 4 5

Probability Density

Feature x

(6)

さまざまな 1 次元正規分布

N(µ, σ

2

), µ: 平均 , σ

2

: 分散 (σ: 標準偏差 )

0 0.2 0.4 0.6 0.8 1

-10 -8 -6 -4 -2 0 2 4 6 8 10

Probability Density

Feature x

0 0.2 0.4 0.6 0.8 1

-10 -8 -6 -4 -2 0 2 4 6 8 10

Probability Density

Feature x

N ( 5, 1

2

) N (3, 1

2

)

0 0.2 0.4 0.6 0.8 1

-10 -8 -6 -4 -2 0 2 4 6 8 10

Probability Density

Feature x

0 0.2 0.4 0.6 0.8 1

-10 -8 -6 -4 -2 0 2 4 6 8 10

Probability Density

Feature x

N (0, 0.5

2

) N (0, 2

2

)

(7)

なぜ正規分布が重要なのか

中心極限定理

同一分布にしたがうランダム変数の和や平均は極限で 正規分布になる

最小二乗法

誤差が正規分布の場合、最尤推定と最小二乗法が一致

エントロピー最大

同じ平均と分散を持つ分布のなかでは正規分布のエン

トロピーが最大

(8)

サイコロ 2 個の平均

サイコロを 1 回振って出た目の分布

1 2 3 4 5 6

サイコロを 2 回振って出た目の平均の分布は?

1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6

(9)

中心極限定理の例

サイコロを T 回振って出た目の平均値の分布

1 2 3 4 5 6 1 2 3 4 5 6

1 回 2 回

1 2 3 4 5 6 1 2 3 4 5 6

4 回 10 回

(10)

多次元正規分布

d 次元正規分布の確率密度関数

p(x; µ, Σ) = 1

(2π)

d/2

| Σ |

1/2

exp (

1

2 (x µ)Σ

1

(x µ) )

平均ベクトル : µ R

d

µ = [

µ

1

. . . µ

d

]

R

d

分散共分散行列 : Σ R

d×d

Σ =

 

 

Var(x

1

) Cov(x

1

, x

2

) · · · Cov(x

1

, x

d

) Cov(x

2

, x

1

) Var(x

2

) · · · Cov(x

1

, x

d

)

.. . .. . . .. .. .

Cov(x

d

, x

1

) Cov(x

d

, x

2

) · · · Var(x

d

)

 

  R

d×d

(11)

多次元正規分布の等高線

多次元正規分布の等高線は楕円となる

N ([ 1

2 ]

, [ 1 0

0 1 ])

N ([ 1

1 ]

, [ 2 0

0 1 ])

N ([ 0

1 ]

,

[ 1 1/2 1/2 2

])

(12)

誤分類率を最小化する 2 クラス分類問題の識別関数

識別関数

G(x) = P

1

| x) P

2

| x)

事後確率の大きなクラスへ分類する :

G(x) > 0 クラス ω

1

と分類 G(x) < 0 クラス ω

2

と分類

ベイズの定理を使うと : G(x) = p(x | ω

1

)P (ω

1

)

p(x) p(x | ω

2

)P (ω

2

) p(x)

対数識別関数 :

g(x) = log p(x | ω

1

) log p(x | ω

2

) + log P

1

) log P

2

)

(13)

練習問題

クラス条件付確率 p(x | ω

1

), p(x | ω

2

) がそれぞれ多次元正規 分布 N

1

, Σ), N

2

, Σ) に従うものとする ( 共分散行列 Σ が等しいことに注意 ).

このとき , 対数識別関数 g(x)g(x) = w

0

+ w

x

x の線形関数となり , w

0

R と w R

d

w

0

= 1

2 (µ

1

Σ

1

µ

1

µ

2

Σ

1

µ

2

) + log P

1

) log P

2

), w = Σ

1

1

µ

2

).

と表されることを示せ .

(14)

練習問題の解答

(15)

クラス条件付確率分布が正規分布のときのベイズ識別関数

Case1: Σ

1

= Σ

2

= σ

2

I

d

(d- 次元単位行列 ) の場合

Case2: Σ

1

= Σ

2

= Σ の場合

Case3: Σ

1

̸ = Σ

2

の場合

(16)

Case 1

Σ

1

= Σ

2

= σ

2

I

d

(d- 次元単位行列 ) の場合

-4 -2 0 2 4

-4 -2 0 2 4

Feature x2

Feature x1

(17)

Case 2

Σ

1

= Σ

2

= Σ の場合

-4 -2 0 2 4

-4 -2 0 2 4

Feature x2

Feature x1

(18)

Case 3

Σ

1

̸ = Σ

2

の場合

-4 -2 0 2 4

-4 -2 0 2 4

Feature x2

Feature x1

(19)

最終課題

事前確率が

P

1

) = P

2

) = 0.5, クラス条件付確率が

µ

1

= [ 2

1 ]

, µ

2

= [ 1

0 ]

, Σ

1

= Σ

2

= Σ =

[ 2 1

1 2 ]

と与えられているとき , 誤分類率を最小化する識別関数の方

程式を求め , 図示せよ .

(20)

最終課題の解答

参照

関連したドキュメント

地図 9 “ソラマメ”の語形 語形と分類 徽州で“ソラマメ”を表す語形は二つある。それぞれ「碧豆」[pɵ thiu], 「蚕豆」[tsh thiu]である。

生殖毒性分類根拠 NITEのGHS分類に基づく。 特定標的臓器毒性 特定標的臓器毒性単回ばく露 単回ばく露 単回ばく露分類根拠

事務情報化担当職員研修(クライアント) 情報処理事務担当職員 9月頃

区分 項目 内容 公開方法等 公開情報 地内基幹送電線に関する情報

[r]

処理処分の流れ図(図 1-1 及び図 1-2)の各項目の処理量は、産業廃棄物・特別管理産業廃 棄物処理計画実施状況報告書(平成

分別 保管 収集 運搬 再生 処分 排出事業者

受入都道府県 搬出側 相手方 種類 数量(万トン) 備考 茨城県 石巻ブロック 民間事業者 可燃物等 調整中. 東京都 石巻ブロック 民間事業者 混合廃棄物