• 検索結果がありません。

分類問題とベイズ決定理論

N/A
N/A
Protected

Academic year: 2021

シェア "分類問題とベイズ決定理論"

Copied!
15
0
0

読み込み中.... (全文を見る)

全文

(1)

ニューラル情報処理第 06

分類問題とベイズ決定理論

竹内一郎

名古屋工業大学

(2)

前回の課題の解答

Ichiro Takeuchi, Nagoya Institute of Technology 2/1

(3)

クラス分類 (= パターン認識 ) 問題とは

特徴ベクトル

xRd

からクラスラベル

y

を決定する

1:

文字認識

xR16×16:

画素値

y∈ {0,1, . . . ,9}:

文字コード

2:

遺伝子診断の例

xR10000:

遺伝子発現量

y∈ {

健康

,

病気

}

(4)

クラス分類問題の定式化

誤った決定をすればコストが生じる

郵便番号認識の失敗

誤配達

遺伝子診断の失敗

副作用

,

症状の悪化

クラス分類問題はなぜ難しいのか?

パターン

x

にはバラツキがある

パターンのバラツキを確率を使って表現する

ベイズ決定理論

Ichiro Takeuchi, Nagoya Institute of Technology 4/1

(5)

例題 : 鮭と鱈を分類せよ

鮭 鱈

(6)

事象、確率、事前確率

,

鱈を観測する事象をそれぞれ

ω1,ω2

とする

事前確率

P1) = 0.4:

鮭が穫れる確率が

40%

P2) = 0.6:

鱈が穫れる確率が

60%

P1), P(ω2)

などを事前確率

(prior probability)

という

あとで

,

事後確率

(poteroir probability)

と呼ばれるもの

も出てくる

Ichiro Takeuchi, Nagoya Institute of Technology 6/1

(7)

魚を見ないで認識したら

P1) = 0.4, P2) = 0.6

どのような決定規則が最適か?

誤分類率

= (

誤分類数

)/(

すべての分類した数

)

誤分類率が最小になる決定規則

ω=

{ ω1 if P1)> P2) ω2 if P1)< P2)

誤分類率

= 0.4

(8)

特徴量とクラス条件付確率

事前確率のみを用いて分類するのは現実的でない

特徴量

x (

長さ

,

,

眼の位置

,

ヒレの位置

, etc)

特徴量

x

にはバラツキがある

:

特徴量

x

の確率分布

p(x)

を考える

特徴量の確率分布が鮭と鱈で異なっている

Ichiro Takeuchi, Nagoya Institute of Technology 8/1

(9)

確率の復習

確率の復習

確率

P(ω1),P2),p(x)

同時確率

P1,x),P2,x)

条件付確率

P1|x),P2|x),P(x1),P(x2)

同時確率と条件付確率の関係

P1,x) =P1|x)p(x) =P(x1)P(ω1) P2,x) =P2|x)p(x) =P(x2)P(ω2)

例題に戻って

鮭の特徴量の分布

p(x|ω1)

鱈の特徴量の分布

p(x|ω2)

(10)

事後確率とベイズの公式

事後確率

P1|x),P2|x)

事前確率を用いたクラス分類

ω=

{ ω1 if P1)> P2) ω2 if P1)< P2)

事後確率を用いたクラス分類

ω=

{ ω1 if P1|x)> P2|x) ω2 if P1|x)< P2|x)

ベイズの公式

Pj|x) = p(x|ωj)P(ωj)

p(x) , j = 1,2

Ichiro Takeuchi, Nagoya Institute of Technology 10/1

(11)

練習問題

ベイズの公式を導出せよ

(12)

ベイズの公式の意味

ベイズの公式

Pj|x) = p(x|ωj)P(ωj)

p(x) , j = 1,2

事前確率

Pj)

から事後確率

Pj|x)

を求める方法

特徴量

x

を観察する前後で鮭と鱈の確率がどのように 変わるか?

ベイズ決定規則

ω=

{ ω1 if P1|x)> P2|x) ω2 if P1|x)< P2|x)

誤分類率

P(error|x) =

{ P1|x) if we decide ω=ω2 P2|x) if we decide ω=ω1

ベイズ決定規則は誤分類率を最小にする

Ichiro Takeuchi, Nagoya Institute of Technology 12/1

(13)

ベイズ決定規則による分類

ベイズ決定規則により分類を行うだけなら

,

特徴量の確 率

P(X)

を知る必要はない

P1|x)> P2|x)

⇐⇒ p(x|ω1)P(ω1)

p(x) > p(x|ω2)P(ω2) p(x)

⇐⇒ p(x|ω1)P(ω1)> p(x|ω2)P(ω2)

ベイズ決定規則の誤分類率は以下のように計算される

x

P(x) min{P1|xk), P(ω2|xk)}dx

特徴量が離散値

x1, x2, . . . , xK

をとる場合

,

K

k=1

P(xk) min{P1|xk), P(ω2|xk)}

(14)

最終課題 ( その 1)

鮭と鱈である事象をそれぞれ

ω1,ω2

とし、それぞれの 事前確率が

P1) = 0.4, P(ω2) = 0.6

であるとする. また, それぞれのクラス条件付き確率は 以下のように与えられているとする

0 0.1 0.2 0.3 0.4 0.5 0.6

20 25 30 35 40 45

Frequency

Length Salmon

0 0.1 0.2 0.3 0.4 0.5 0.6

20 25 30 35 40 45

Frequency

Length Tilesius

Ichiro Takeuchi, Nagoya Institute of Technology 14/1

(15)

最終課題 ( その 2)

1.

この問題に事前確率のみを用いた分類を行ったときの 誤分類率を求めよ

.

2. x= 20,25,30,35,40,45

それぞれにおいて

,

ベイズ識別 規則を用いると鮭と鱈どちらに分類されるか答えよ.

3. x= 20,25,30,35,40,45

それぞれに対する事後確率

P1|x), P2|x)

を求めよ

.

4.

この問題にベイズ決定規則を用いた分類を行ったとき

の誤分類率を求めよ

.

参照

関連したドキュメント

生殖毒性分類根拠 NITEのGHS分類に基づく。 特定標的臓器毒性 特定標的臓器毒性単回ばく露 単回ばく露 単回ばく露分類根拠

例えば,立証責任分配問題については,配分的正義の概念説明,立証責任分配が原・被告 間での手続負担公正配分の問題であること,配分的正義に関する

例えば,立証責任分配問題については,配分的正義の概念説明,立証責任分配が原・被告 間での手続負担公正配分の問題であること,配分的正義に関する

する議論を欠落させたことで生じた問題をいくつか挙げて

〃o''7,-種のみ’であり、‘分類に大きな問題の無い,グループとして見なされてきた二と力判った。しかし,半

• 問題が解決しない場合は、アンテナレベルを確認し てください(14

非自明な和として分解できない結び目を 素な結び目 と いう... 定理 (

• また, C が二次錐や半正定値行列錐のときは,それぞれ二次錐 相補性問題 (Second-Order Cone Complementarity Problem) ,半正定値 相補性問題 (Semi-definite