実験結果および考察

7. 特徴ベクトルの次元削減

7.3 実験結果および考察

主成分分析における固有値（全分散）および累積寄与率の計算結果を図20^，図 21に示す．寄与率とは一つの主成分が元の全変数が持っている情報の何％を説明できるかということを表す指標であり，第1^{主成分から第}m^{主成分までの寄与率}

の合計を累積寄与率という．累積寄与率は識別に適用する次元数を決定するのに用いられる．図21^{より，次元数が}600次元で累積寄与率がほぼ100^{％になってい}

る．つまり600次元の主成分で全変数が持つ情報の大部分を説明できることを示しており，認識に必要な次元数は600次元程度であることが確認できる．

主成分分析によって次元削減し，各次元数に対して行った認識実験の結果を表3^，

図22^{に示す．表}3^，図22の各次元数における認識率結果で示すとおり，元の次元数1024^{次元における認識率が}87.3％に対し，主成分分析によって半分の次元数である512次元に削減した場合でも認識率は87.6％という結果が得られた．よって次元数を半分に削減した場合でも認識率が低下しないことが確認できた．この次元数を削減した特徴ベクトルを文字認識に採用することにより，計算量やメモリ使用量を削減することができる．また適切な次元削減を行うことによって，識別に有効な別の特徴量を付加することができるので，さらなる認識率向上も可能である．

5章では累積方向を変更することによって次元削減を行い，全方向累積1024^次

元で86.2％であるのに対し，平行以外の累積768^次元では90.8^{％という結果が得}

られた（フィルタ方向数:4^{方向，分割領域数}16^{領域の場合）．}1024^{次元から識別}

に有効でない特徴を削除することで認識率が向上したと考えられる．見方を変えれば，1024^{次元には有効な特徴}768次元が含まれているにもかかわらず，識別に有効でない次元が含まれているために認識率が低下したと見ることができる．本章で行った主成分分析による次元削減によって識別に有効でない特徴次元を削減することになり認識率の向上が期待されたが，表3^，図22^{の実験結果から最高の}

認識率は700^次元で88.1^％と，5章での最高認識率である90.8^{％には及ばなかっ} 37

た．これは今回行った全分散の大きい主成分から選択する方法では，必ずしも識別に有効な特徴軸が選択されていないためと考えられる．また，特徴軸は同一であっても全分散の大きい主成分から特徴を選択するのではなく，各主成分のクラス内分散とクラス間分散を求め，分散比（F比）の大きい主成分から順に選択する方法も考えられる [21]．この方法はクラス内分散も考慮するため，今回行った方法よりも識別に有効な特徴が得ることが可能であり，認識率の向上が期待できる．

また他の方法として，複数のクラスに対して分散比（F^{比）を最大にする基底}

軸を求める手法である正準判別分析[23]による次元削減が考えられる．この方法によって得られる特徴ベクトルはカテゴリ数^;1 と少ないため，本論文で対象としているアルファベット大文字の26カテゴリの場合，得られる特徴ベクトルは

25次元までと少ないため有効でない．しかし，多くのカテゴリがある漢字認識の場合には有効であると考えられるので，映像内の漢字認識を行う場合の特徴ベクトル次元数削減には正準判別分析は有効であると考えられる．

"cè»c+é

Õo

図 20 主成分分析における固有値の計算結果

40è»+é

¥Í¸èæé

図 21 主成分分析における累積寄与率の計算結果

表 3 主成分分析による次元数削減した特徴ベクトルに対する認識実験の結果特徴ベクトルの次元数認識率(%)

1024 87.3

900 87.6

794 87.6

768 87.0

700 88.1

650 87.5

600 87.3

512 87.6

400 86.3

300 85.3

256 83.8

100 81.0

64 79.1

z¸èæé

図 22 主成分分析による次元数削減した特徴ベクトルに対する認識実験の結果

8. ^むすび

本論文では，多値の文字画像からの直接特徴を得る特徴抽出法を提案した．本手法は，多値文字画像に対してエッジ方向成分射影法を局所領域内で適用することにより，低解像画像に対しても有効で，位置ずれに頑健な特徴抽出を可能にする．

本手法の映像内文字に対する有効性を検証するため，映画７本のエンドロールから手動で切り出した文字865文字に対して文字認識実験を行った．これにより以下のことが確認できた．

多値画像からの認識と2値画像からの認識を比較実験し，平均認識率が2^値

画像認識で77.0％に対し，多値画像認識で84.4％という結果を得た．これにより映像内の文字認識において多値画像による認識が有効であることが確認した．

エッジ方向成分射影法を局所領域内で適用することにより，認識率を90.8

％まで高めることが可能である．

位置ずれがある文字画像に対しても認識実験を行い，累積方法を変更することによって文字幅の5％程度までは位置ずれに頑健にできることを確認した．

本手法で得られた特徴ベクトルに対して主成分分析による次元削減を行い，

認識率を低下させずに特徴ベクトル次元数を半分にすることが可能であることを確認した．

これにより本手法を映像内の文字認識の特徴抽出に適用して動画像のインデクシング等に応用が期待される．

謝辞

本研究は，本学および松下電器産業（株）の協力により開設された連携講座：

人間・ネットワーク系学講座（二矢田勝行教授，栄藤稔助教授，松下電器産業

（株）先端技術研究所）で行われたものです．筆者は基幹講座として本学のソフトウェア基礎講座にも所属し終始暖かい御指導・御助言を頂きました．

本研究を進めるにあたり，主指導教官として様々な御指導・御助言を頂きましたソフトウェア基礎講座横矢直和教授に深く感謝いたします．

非常に恵まれた環境で研究する機会を与えてくださり，研究において御助言を頂きました人間・ネットワーク系学講座（松下電器産業（株）先端技術研究所）

二矢田勝行教授に厚く御礼申し上げます．

また副指導教官として適切な御指導・御助言を頂きました像情報処理講座千原國宏教授に深く感謝致します．

本研究への貴重な助言や指針を与えて頂き, 研究に対する姿勢や論文の書き方を懇切丁寧に御指導頂いた人間・ネットワーク系学講座（松下技研（株）情報ネットワーク研究所）栄藤稔助教授に深く感謝の意を表します.

本研究において様々な御助言・御指導を頂いたソフトウェア基礎講座竹村治雄助教授，岩佐英彦助手，山澤一誠助手に深く感謝致します．

日々の研究の中で常に適切な研究方針を示していただき，基礎から懇切丁寧に御指導頂きました松下電器産業（株）先端技術研究所近藤堅司氏に深く感謝の意を表します．

本研究を進めるにあたり暖かく多大な御助言・御指導を頂きました松下電器産業（株）先端技術研究所目方強司氏，今川太郎氏，松川善彦氏，芳澤伸一氏に深く感謝いたします．

本研究において，プログラム作成，論文執筆の基礎を御指導頂きました松下電器産業（株）宗續敏彦氏，畑幸一氏，野口栄治氏，青木利道氏に深く感謝いたします．

本研究を進めるにあたり多大な御指導・御助力を頂いたソフトウェア基礎講座の佐藤哲氏，神原誠之氏 ,松宮雅敏氏に深く感謝致します.

日々の研究室活動を支えていただいた, 福永博美女史に深く感謝致します. 43

この２年間互いに励まし合い, 有意義な研究生活を共に過ごすことのできたソフトウェア基礎講座の戎野聡一氏，島村潤氏，林一成氏，藤井博文氏，町田貴史氏，松川昌洋氏，安居亮氏，山下敏行氏，山口晃一郎氏，吉森勇人氏に深く感謝致します.

本研究を進めるにあたり様々な面で支えていただいたソフトウェア基礎講座の

OB^の皆様，M1諸氏に深く感謝いたします.

参考文献

[1] R. Lienhart : \Automatic text recognition for video indexing", Proc. ACM Multimedia 96, pp. 11-20^，1996^．

[2] L. Wang and T. Pavlidis: \Direct gray-scale extraction of features for char-acter recognition", IEEE Trans. Pattern Analysis and Machine Intelligence^， Vol. 15^，No. 10, pp. 1053-1067^，1993^．

[3] J. C. Pettier and J. Camillerapp: \Script representation by a generalized skeleton", Proc. 2nd. International Conference on Document Analysis and Representation, pp. 850-853^，1993^．

[4] S. W. Lee and Y. J. Kim: \Direct extraction of topographic features for gray scale character recognition", IEEE Trans. Pattern Analysis and Machine Intelligence^，Vol. 17^，No. 7, pp. 724-729, July^，1995^．

[5] H. Nishida: \ Boundary extraction from gray-scale document images based on surface data structures", Graphical Models Image Process.^，Vol. 60^，No.

1, Jan. , pp. 35-45^，1998^．

[6] G. Srikantan, S.W. Lam, and S.N. Srihari: \Gradient-based contour en-coding for character recognition", Pattern Recognition, Vol. 29, No. 7, pp.

1147-1160^，1996^．

[7] D.Gabor : Theory of communication ^，J. Institute of Elec. Eng. , Vol. 93, pp. 429-457^，1946^．

[8] W. Freeman, E. Adelson: Steerable lters for early vision Image Analysis and Wavelet Decomposition, pp.406-415, Proc. 3rd International Conference on Computer Vision, 1990^．

[9] ^{山田敬嗣，津雲淳}: Gabor特徴の安定性考察と文字認識，信学技報， PRU92-112^，pp. 75-82^，Jan. ^，1993^．

[10] 浜本義彦，政水克典，内村俊二，富田眞吾: 手書き漢字認識のためのGabor

特徴，信学論（D-II^），Vol. J79-D-II^，No. 2^，pp. 202-209^，Feb. ^，1996^． [11] 渡辺政典，安田哲也，浜本義彦，富田眞吾 : Gabor^{特徴を用いた手書き数}

字認識，信学技報，PRMU96-27^，Jun. ^，1996^．

[12] ^栄藤稔 : パターン位置決め装置とパターン類別装置，日本国特許公開

H04-329488^，1991.

[13] 吉村浩至，近藤堅司，栄藤稔，横矢直和: 字幕パターン認識におけるエッジ方向成分射影法の有効性検討，情報処理学会第59^{回全国大会論文集}(2)^， p. 215^，1999.

[14] 萩田紀博，内藤誠一郎，増田功: 外郭方向寄与度特徴による手書き漢字の識別，信学論（D^），Vol. J66-D^，no. 10^，pp. 1185-1192^，Oct. ^，1983^． [15] 鶴岡真治，栗田昌徳，原田智夫，木村文隆，三宅康二: ^{加重方向指数ヒス}

トグラム法による手書き漢字・ひらがな認識，信学論（D^），Vol. J77-D^， No. 7^，pp. 1390-1397^，July^，1987^．

[16] 孫寧，田原透，阿曽弘具，木村正行 : 方向線素特徴量を用いた高精度文字認識，信学論（D-II^），Vol. J74-D-II^，No. 3^，pp. 330-339^，March^，1991^． [17] J.G.Daugman : Complete discrete 2-D gabor transforms by neural networks

for image analysis and compression ^，IEEE Trans. on Acoustics Speech and Signal Processing^，Vol. 36^，no. 7^，pp. 1169-1179^，July^，1988^．

[18] ^大津展之 : 判別および最小２乗規準に基づく自動しきい値選定法，信学論，Vol. J63-D No. 4^，1980^．

[19] 小島良宏，香田敏行，丸野進，坂上茂生，山本浩司，〆木泰治: ^{構造化ニュー}

ラルネットワーク（NARA）によるマルチフォント漢字認識，信学技報，

NC91-31^，pp. 9-16^，1991^．

ドキュメント内 ( ) (ページ 45-55)

7. 特徴ベクト ルの次元削減

7.3 実験結果および考察

8. むすび

謝辞

参考文献

7. 特徴ベクトルの次元削減

8. ^むすび