7. 特徴ベクト ルの次元削減
7.3 実験結果および考察
主成分分析における固有値( 全分散)および累積寄与率の計算結果を図20,図 21に示す.寄与率とは一つの主成分が元の全変数が持っている情報の何%を説明 できるかということを表す指標であり,第1主成分から第m主成分までの寄与率
の合計を累積寄与率という.累積寄与率は識別に適用する次元数を決定するのに 用いられる.図21より,次元数が600次元で累積寄与率がほぼ100%になってい
る.つまり600次元の主成分で全変数が持つ情報の大部分を説明できることを示 しており,認識に必要な次元数は600次元程度であることが確認できる.
主成分分析によって次元削減し,各次元数に対して行った認識実験の結果を表3,
図22に示す.表3,図22の各次元数における認識率結果で示すとおり,元の次元 数1024次元における認識率が87.3%に対し,主成分分析によって半分の次元数 である512次元に削減した場合でも認識率は87.6%という結果が得られた.よっ て次元数を半分に削減した場合でも認識率が低下しないことが確認できた.この 次元数を削減した特徴ベクトルを文字認識に採用することにより,計算量やメモ リ使用量を削減することができる.また適切な次元削減を行うことによって,識 別に有効な別の特徴量を付加することができるので,さらなる認識率向上も可能 である.
5章では累積方向を変更することによって次元削減を行い,全方向累積1024次
元で86.2%であるのに対し,平行以外の累積768次元では90.8%という結果が得
られた(フィルタ方向数:4方向,分割領域数16領域の場合).1024次元から識別
に有効でない特徴を削除することで認識率が向上したと考えられる.見方を変え れば,1024次元には有効な特徴768次元が含まれているにもかかわらず,識別に 有効でない次元が含まれているために認識率が低下したと見ることができる.本 章で行った主成分分析による次元削減によって識別に有効でない特徴次元を削減 することになり認識率の向上が期待されたが,表3,図22の実験結果から最高の
認識率は700次元で88.1%と,5章での最高認識率である90.8%には及ばなかっ 37
た.これは今回行った全分散の大きい主成分から選択する方法では,必ずしも識 別に有効な特徴軸が選択されていないためと考えられる.また,特徴軸は同一で あっても全分散の大きい主成分から特徴を選択するのではなく,各主成分のクラ ス内分散とクラス間分散を求め,分散比(F比)の大きい主成分から順に選択する 方法も考えられる [21].この方法はクラス内分散も考慮するため,今回行った方 法よりも識別に有効な特徴が得ることが可能であり,認識率の向上が期待できる.
また他の方法として,複数のクラスに対して分散比(F比)を最大にする基底
軸を求める手法である正準判別分析[23]による次元削減が考えられる.この方法 によって得られる特徴ベクトルは カテゴ リ数;1 と少ないため,本論文で対象 としているアルファベット大文字の26カテゴ リの場合,得られる特徴ベクトルは
25次元までと少ないため有効でない.しかし,多くのカテゴ リがある漢字認識の 場合には有効であると考えられるので,映像内の漢字認識を行う場合の特徴ベク トル次元数削減には正準判別分析は有効であると考えられる.
38
"cè»c+é
Õo
図 20 主成分分析における固有値の計算結果
40è»+é
¥Í¸èæé
図 21 主成分分析における累積寄与率の計算結果
39
表 3 主成分分析による次元数削減した特徴ベクトルに対する認識実験の結果 特徴ベクトルの次元数 認識率(%)
1024 87.3
900 87.6
794 87.6
768 87.0
700 88.1
650 87.5
600 87.3
512 87.6
400 86.3
300 85.3
256 83.8
100 81.0
64 79.1
40
40
z¸èæé
図 22 主成分分析による次元数削減した特徴ベクトルに対する認識実験の結果
41
8. むすび
本論文では,多値の文字画像からの直接特徴を得る特徴抽出法を提案した.本 手法は,多値文字画像に対してエッジ方向成分射影法を局所領域内で適用すること により,低解像画像に対しても有効で,位置ずれに頑健な特徴抽出を可能にする.
本手法の映像内文字に対する有効性を検証するため,映画7本のエンド ロール から手動で切り出した文字865文字に対して文字認識実験を行った.これにより 以下のことが確認できた.
多値画像からの認識と2値画像からの認識を比較実験し,平均認識率が2値
画像認識で77.0%に対し,多値画像認識で84.4%という結果を得た.これ により映像内の文字認識において多値画像による認識が有効であることが 確認した.
エッジ方向成分射影法を局所領域内で適用することにより,認識率を90.8
%まで高めることが可能である.
位置ずれがある文字画像に対しても認識実験を行い,累積方法を変更する ことによって文字幅の5%程度までは位置ずれに頑健にできることを確認 した.
本手法で得られた特徴ベクトルに対して主成分分析による次元削減を行い,
認識率を低下させずに特徴ベクトル次元数を半分にすることが可能である ことを確認した.
これにより本手法を映像内の文字認識の特徴抽出に適用して動画像のインデクシ ング等に応用が期待される.
42
謝辞
本研究は,本学および松下電器産業( 株)の協力により開設された連携講座:
人間・ネットワーク系学講座( 二矢田 勝行 教授,栄藤 稔 助教授,松下電器産業
( 株)先端技術研究所)で行われたものです.筆者は基幹講座として本学のソフ トウェア基礎講座にも所属し終始暖かい御指導・御助言を頂きました.
本研究を進めるにあたり,主指導教官として様々な御指導・御助言を頂きまし たソフトウェア基礎講座 横矢 直和 教授 に深く感謝いたし ます.
非常に恵まれた環境で研究する機会を与えてくださり,研究において御助言を 頂きました 人間・ネットワーク系学講座 ( 松下電器産業( 株)先端技術研究所)
二矢田 勝行 教授に厚く御礼申し上げます.
また副指導教官として適切な御指導・御助言を頂きました 像情報処理講座 千 原 國宏 教授 に深く感謝致します.
本研究への貴重な助言や指針を与えて頂き, 研究に対する姿勢や論文の書き方 を懇切丁寧に御指導頂いた 人間・ネットワーク系学講座 ( 松下技研( 株) 情 報ネットワーク研究所)栄藤 稔 助教授に深く感謝の意を表します.
本研究において様々な御助言・御指導を頂いたソフトウェア基礎講座 竹村 治 雄 助教授, 岩佐 英彦 助手, 山澤 一誠 助手に深く感謝致します.
日々の研究の中で常に適切な研究方針を示していただき,基礎から懇切丁寧に 御指導頂きました 松下電器産業( 株) 先端技術研究所 近藤 堅司 氏に深く感謝 の意を表します.
本研究を進めるにあたり暖かく多大な御助言・御指導を頂きました松下電器産 業( 株) 先端技術研究所 目方 強司 氏, 今川 太郎 氏, 松川 善彦 氏, 芳澤 伸 一 氏に深く感謝いたします.
本研究において,プログラム作成,論文執筆の基礎を御指導頂きました 松下 電器産業( 株) 宗續 敏彦 氏, 畑 幸一 氏, 野口 栄治 氏, 青木 利道 氏に深く 感謝いたします.
本研究を進めるにあたり多大な御指導・御助力を頂いたソフトウェア基礎講座 の 佐藤 哲 氏,神原 誠之 氏 ,松宮 雅敏 氏に深く感謝致します.
日々の研究室活動を支えていただいた, 福永 博美 女史に深く感謝致します. 43
この2年間互いに励まし合い, 有意義な研究生活を共に過ご すことのできたソ フトウェア基礎講座の戎野 聡一 氏,島村 潤 氏,林 一成 氏,藤井 博文 氏,町 田 貴史 氏,松川 昌洋 氏,安居 亮 氏,山下 敏行 氏,山口 晃一郎 氏,吉森 勇 人 氏に深く感謝致します.
本研究を進めるにあたり様々な面で支えていただいたソフトウェア基礎講座の
OBの皆様,M1諸氏に深く感謝いたし ます.
44
参考文献
[1] R. Lienhart : \Automatic text recognition for video indexing", Proc. ACM Multimedia 96, pp. 11-20,1996.
[2] L. Wang and T. Pavlidis: \Direct gray-scale extraction of features for char-acter recognition", IEEE Trans. Pattern Analysis and Machine Intelligence, Vol. 15,No. 10, pp. 1053-1067,1993.
[3] J. C. Pettier and J. Camillerapp: \Script representation by a generalized skeleton", Proc. 2nd. International Conference on Document Analysis and Representation, pp. 850-853,1993.
[4] S. W. Lee and Y. J. Kim: \Direct extraction of topographic features for gray scale character recognition", IEEE Trans. Pattern Analysis and Machine Intelligence,Vol. 17,No. 7, pp. 724-729, July,1995.
[5] H. Nishida: \ Boundary extraction from gray-scale document images based on surface data structures", Graphical Models Image Process.,Vol. 60,No.
1, Jan. , pp. 35-45,1998.
[6] G. Srikantan, S.W. Lam, and S.N. Srihari: \Gradient-based contour en-coding for character recognition", Pattern Recognition, Vol. 29, No. 7, pp.
1147-1160,1996.
[7] D.Gabor : Theory of communication ,J. Institute of Elec. Eng. , Vol. 93, pp. 429-457,1946.
[8] W. Freeman, E. Adelson: Steerable lters for early vision Image Analysis and Wavelet Decomposition, pp.406-415, Proc. 3rd International Conference on Computer Vision, 1990.
[9] 山田敬嗣,津雲淳: Gabor特徴の安定性考察と文字認識 ,信学技報, PRU92-112,pp. 75-82,Jan. ,1993.
45
[10] 浜本義彦,政水克典,内村俊二,富田眞吾: 手書き漢字認識のためのGabor
特徴 ,信学論(D-II),Vol. J79-D-II,No. 2,pp. 202-209,Feb. ,1996. [11] 渡辺政典,安田哲也,浜本義彦,富田眞吾 : Gabor特徴を用いた手書き数
字認識 ,信学技報,PRMU96-27,Jun. ,1996.
[12] 栄藤稔 : パターン 位置決め装置とパターン 類別装置 ,日本国特許公開
H04-329488,1991.
[13] 吉村浩至,近藤堅司,栄藤稔,横矢直和: 字幕パターン認識におけるエッ ジ方向成分射影法の有効性検討 ,情報処理学会第59回全国大会論文集(2), p. 215,1999.
[14] 萩田紀博,内藤誠一郎,増田功: 外郭方向寄与度特徴による手書き漢字の 識別 ,信学論(D),Vol. J66-D,no. 10,pp. 1185-1192,Oct. ,1983. [15] 鶴岡真治,栗田昌徳,原田智夫,木村文隆,三宅康二: 加重方向指数ヒス
トグラム法による手書き漢字・ひらがな認識 ,信学論(D),Vol. J77-D, No. 7,pp. 1390-1397,July,1987.
[16] 孫寧,田原透,阿曽弘具,木村正行 : 方向線素特徴量を用いた高精度文字 認識 ,信学論(D-II),Vol. J74-D-II,No. 3,pp. 330-339,March,1991. [17] J.G.Daugman : Complete discrete 2-D gabor transforms by neural networks
for image analysis and compression ,IEEE Trans. on Acoustics Speech and Signal Processing,Vol. 36,no. 7,pp. 1169-1179,July,1988.
[18] 大津展之 : 判別および 最小2乗規準に基づく自動しきい値選定法 ,信学 論,Vol. J63-D No. 4,1980.
[19] 小島良宏,香田敏行,丸野進,坂上茂生,山本浩司,〆木泰治: 構造化ニュー
ラルネットワーク(NARA)によるマルチフォント漢字認識 ,信学技報,
NC91-31,pp. 9-16,1991.
46