• 検索結果がありません。

サポートベクターマシンの 手書き数字認識への応用

N/A
N/A
Protected

Academic year: 2021

シェア "サポートベクターマシンの 手書き数字認識への応用"

Copied!
31
0
0

読み込み中.... (全文を見る)

全文

(1)

サポートベクターマシンの 手書き数字認識への応用

宗久・丹沢研究室

T04KF011

大原 牧

(2)

サポートベクターマシン(以下

SVM)

,

パター ン認識性能の優れた2クラス判別の手法.

• SVM

は現在最も強力な学習機械の一つで

あると認められている.

本研究では

,SVM

について学習し

,

手書き数 字認識へと応用していく.

(3)

• SVM

では

,

訓練サンプルの中で最も他クラス と近い位置のもの(サポートベクトル)を基準 とし

,

そのユークリッド距離が最も大きくなるよ うな場所に識別境界を定める.つまり

,

1つの クラスから他のクラスへの距離を最大にする ようにする(マージン最大化).

(4)

マージン

X2

X1

サポートベクトル

(5)

線形

SVM

線形

SVM

とは

,

与えられた

2

クラスのデータを 線形に分離することが可能である場合の

SVM.

線形識別関数を

,

以下のように定義する.

  

f(x)=sign(g(x))

  ただし 

g

(x)=

w

x+

h

       

(6)

sign(g(x))

,g(x)

0

のとき1

, g(x)

0

のとき  

-

1をとる符号関数である.

• x

は入力ベクトル

,

ベクトル

w

とスカラー

h

は識 別関数を決定するパラメータとなっている.

(7)

学習データ数を

n,

学習データを

x i (i=1,2,…n)

とする.教師信号を

y i

とし

,

以下のように定義 する.

 

 ただし

,X1,X2

は学習データの属するクラス.

 

 

= ∈

2 1

1 1

X x

if

X x

y if

i i

i

    

  

  

(8)

• y i =1

の学習データに対しては

g(x) 1

, y i =- 1

の学習データに対しては

g(x) - 1

を満たす と定義する.

この定義により

,

マージン領域は   で  表される.

|| ||

2

w

(9)

マージン最大化の基準に沿った識別関数を学 習するために解くべき問題は,式(1),(2)の 制約付き最適化問題に帰着される.

 

min

         (1)

 

 

s.t y

i

(w

t

x

i

+h)-1 0 ≧

(2)

 

2

2 ) 1

( w w

G =

(10)

(

),(

)

Lagrange

未定乗数法によって問題を 書き直すと

,

以下のような双対問題を得る.

max  

  

s.t

  

       ( λi 0         

 

これを

,

最急降下法を使って最適解

λ

を求め

,

ラメータ

w,

hを得ることができる.

 

( ) ∑ ∑

= = =

=

N

i

N j i

j t i j i j i i

D

y y x x

L

1

2

1, 1

1 λ λ λ

λ

=

=

N

i

i i

y

1

0 λ

(11)

非線形SVM

SVMでは

,

線形分離不可能な問題に対して

,

高次元写像空間での線形分離を適用する.

 このような

SVM

,

非線形

SVM

という.

非線形SVMの識別関数は次のように定義さ れる.

       

f(x)=sign(g(x))

   ただし

g(x)=

t Φ

(x)+h     

(12)

Φ(x)

,

元の特徴空間に存在する学習データ のベクトルを,線形分離が可能となるように 高次元空間へ変換する写像である.

  

   

Φ

(x)

=(Φ

1

(

),Φ

(x)

,…,Φ

d

(x)) t    

(13)

Φ(x)

を新たなパターンとみなし

,

今までのxを

Φ(x)

によって変換する.これにより

,

変換後の 空間において線形

SVM

を適用したことに相 当する.

・変換後の空間における線形識別境界はxの元 の特徴空間では非線形な識別境界をなす.

(14)

・計算コストを小さくするために

,

以下を満たす 関数

K

を学習と識別に導入する.

Φ(x

1

) t

Φ

(x2

=K(x

1

,x

2

)

このような

K

のことをカーネルと呼ぶ.

・代表的なカーネル関数に

,

ガウス型カーネル  などがある.

 

  − −

=

1 22 2

2

1

2 *

||

exp ||

) x ,

K(x σ

x

x

(15)

手書き数字認識への応用

• SVM

を利用して

,

手書き数字の認識について

実験する.

数字は

0~9

10

文字で

,

これを

SVM

を多クラ スの識別が可能なように拡張して識別する.

(16)

画像データは

,MNIST

のデータベースを用いる.

画像編集ソフトを用いて画像を縮小し

,

その画素の 輝度を特徴次元として抽出し

,SVM

を適用する.

28pixel

28pixel

(17)

文字のかすれた部分を補正するために

,

各画素の輝 度を

x

とすると

,

     に変換する.

255 255 x

(18)

識別方法の比較

• SVM

を多クラス識別できるように拡張するた

めには

,1

1

の識別を複数組み合わせるか

,1

対他の識別を行うかのどちらかがある.今回

1

1

の識別を複数組み合わせることにし た.

• 1

1

の複数の組み合わせによる識別方法と して

,

多数決形式とトーナメント形式の

2

つを用 いて

,

比較する.

(19)

・多数決形式

 クラスの組み合わせの回数分

(45

回)識別を行

,

最も識別された回数の多いものを識別結 果とするもの.

 最大識別回数が等しい場合は

,

識別関数の出  力の合計が最も大きいものを識別結果とする

(20)

・トーナメント形式

1

1

の識別をトーナメントで

9

回行い

,

最後まで 残ったクラスを識別結果とするもの

.

   0 1 2 3 4 5 6 7 8 9

(21)

多数決形式とトーナメント形式でそれぞれ識別を 行った.

 特徴次元 

14*14(196

)次元  各数字の学習データ数 

300

 各数字のテストデータ数 

100

0.9 94.6

 トーナメント

3.3 94.5

 多数決

1

文字あたりの 認識時間(

s

 識別率

(%)

 識別形式

(22)

学習データ数の比較

学習データ数によって識別率にどのような影 響があるか調べるため

,

各数字の学習データ 数をそれぞれ

100,300,500,750

とした時の識 別率を求めた.

 特徴次元 

14*14(196

)次元  各数字のテストデータ数 

100

 識別形式 トーナメント形式

(23)

   

241

   

95.5

   

750

   

71

   

95.3

   

500

   

18

   

94.6

   

300

   

8

   

92.9

   

100

学習時間

(m

  識別率

(%)

学習データ数

(24)

特徴次元数の比較

画像を

7*7pixel,14*14pixel

に縮小したものと

,

元の画像

(28*28pixel)

の3つから

,

それぞれの 画素の輝度を特徴次元として抽出し

,SVM

適用して比較した.

 各数字の学習データ数 

750

 各数字のテストデータ数 

100

 識別形式 トーナメント形式

(25)

3.8 601

  

95.5%

28*28(784)

1.0 241

  

95.5%

14*14(196

0.3 115

  

90.1%

7*7(49

1

文字あたりの 識別時間

(s)

学習時間

m)

 識別率

特徴次元

(26)

794

次元での各数字の識別率

89 9

94 4

95 8

95 3

95 7

97 2

97 6

100 1

95 5

98 0

識別率

(%)

クラス

識別率

(%)

  クラス

(27)

最も識別率の低かった

9

のクラスで

,

識別に失 敗した画像は以下のものである.

(28)

まとめ

多数決形式とトーナメント形式では

,

識別率 に差はなかったが

,

識別時間ではトーナメン ト形式が多数決形式の  程度となった.

学習データ数の増加が進むにつれ

,

識別率 の上昇は緩やかになったのに対し

,

学習時 間は飛躍的に増えていった.

4

1

(29)

次元の増加による識別率の向上は見られた

,196

次元と

784

次元では

,

識別率に変化は なかった.

数字によって識別率の高いものと悪いものが 存在した.

今後の課題としては

,

異なる特徴抽出法の導 入や文字の傾きの補正による

,

識別率の向上  などが考えられる.

(30)

参考文献

(1)

[1]Nello Cristianini,John Shawe-Taylor

 “サポートベクターマシン入門” 

2005

  

P129-P163

[2]

青葉雅人:

Support Vector Machine

ってな に?

(online)

<http://www.neuro.sfc.keio.ac.jp/~masato/st

udy/SVM/index.htm>

(31)

参考文献

(2)

[3]

篠原正一

:

サポートベクターマシンの花品種 識別への応用

(2007)

参照

関連したドキュメント

AUTHENTICATING OFFICER 認証官 Date 日付 USFJ Case Number 書類番号 Signature 署名. Title and/ or Rank 肩書及び/又は階級 Agency, Unit or Activity

紀陽インターネット FB へのログイン時の認証方式としてご導入いただいている「電子証明書」の新規

    pr¯ am¯ an.ya    pram¯ an.abh¯uta. 結果的にジネーンドラブッディの解釈は,

安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 他社の運転.

(3) 貨物の性質、形状、機能、品質、用途その他の特徴を記載した書類 商品説明書、設計図面等. (4)

安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 他社の運転.

(注)

安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 安全性は日々 向上すべきもの との認識不足 他社の運転.