• 検索結果がありません。

文字画像 の修復 によ る低解 像度 印刷漢字 の認識

N/A
N/A
Protected

Academic year: 2021

シェア "文字画像 の修復 によ る低解 像度 印刷漢字 の認識"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

長崎大学工学部研 究報告 第32 第59 平成

1 4

7

79

文字画像 の修復 によ る低解 像度 印刷漢字 の認識

胡 彦*・松 山 繁史 **・松 田 和生*

中村 千秋***・宮原 末治*

Lo w‑ Re s o l ut i o nKa n j iPr i n t e dCha r a c t e rRe c og nl t l On by Re s t o r a t i o nofCha r a c t e rI ma ge

b y

Ya nHU* , Sh i g e f u miMATS UYAMA* * , Ka z u oMATS UDA*

Ch i a k iNAKAMURA* * * , S u e h a r u MI YAHARA*

A r e s t or a t i onme t hodi spr es ent e df orl ow‑ r es ol ut i onpr int e dka n j ic ha ra c t e rr e c ognl t 1 0n・Fi r s t ,c ha r a c t e ri ma ge sa r e c onv e r t e di nt obi na r yc ha r a c t erpa t t e r nsa f t e re xpa ndi nga ndbl umng.Ne xt ,t hebi na r yc ha r a c t e rpa t t e msa remodi f i e d byt hes ys t e m us l ngr idgepol nta ndr a vi neon e

Thef e a t ur eve c t or soft hemodi f i e dc ha r a c t e rpa t t e mswhi c hi n c l ude t hei nf or ma t i onofs pa t i a ls t r uc t ur ea r ee x t r a c t e dbyphr a s ef e a t ur edi s t r ibut i onme t hoda ndt he ya r ef e di na nc l a s s i f i e r . I ti sve r if i e dbye xpe r iment sus l ngt heda t a bas eETL2t ha tpr opos e dme t hodi mpr ov e dr e c ognl t 1 0na c c ur a c yf r om 8 9. 1

%

t o99

.4%.

1

. は じめに

デ ィジ タル カメラや デ ィジ タル ビデ オな どの普及 に 伴 い, カメラ画像 か らの文字認識 の要求が高 まってい る川̀2'. しか しなが ら, 現 在 実 用 化 され て い るOCR

( opt i c a lCha r a c t e rRea de r )

は , ス キ ャナか ら取 り込 んだ高解像 度 の文字 画像 を読取対 象 と してい るため, 既存 の認識技術 をその まま適用す る こ とは困難 と思 わ れ る.その主 な原 因 は, よ り多 くの情報 を読 み取 ろ う と して, カメラか らの入力画像 の視野 を広 く取 ろ うと す るため,文字部分が低解像 度 の画像 になるこ とに起 因す る もの と考 え られ る.低解像度 の画像 は,文字 パ ター ンの文字縁 に段差 が生 じた り,細 か な部分 がつぶ れ た り,かす れた りす るため, これ らの画像 をその ま ま使 って認識 させ る と,高 い認識精度 を実現 で きない こ とが多 い.

これ らの問題 に対 して, これ まで に文字パ ター ンを わず か に移動 させ , それ らの差分 を とる こ とで文字線 縁 の傾 きを精度 よ く検 出す る移動差分法

̀

3や ,線形 フ イ

ル タを用 いた画素 間の補 間 と凸判定 に よ り品質の よい 文字パ ター ンを得 る 2値化法‑4'な どが提 案 されて きた.

これ らの手法 は低解像度 の画像 を修復 し,読 みやす い 文字パ ター ンを得 る方法 と して一定 の効果 を上 げてい るが,汎用性 や認識精度 の点 で は十分 であ る と言 えな い .

本稿 では, デ ィジ タル カメラやデ ィジ タル ビデ オ画 像 か らの文字認識 を目的 と し,低解像度文字画像 の修 復 を多段 に行 うこ とに よ り文字画像 の画 質 を改善 し, それ を用 いて高精度 に文字認識す る方法 につ いて提案 す る.提案手法では,低解像度 の入力文字画像 に対 し, 文字 パ ター ンの拡大 とぼか しの処理 を行 い, さらに 2 倍 化 の際 に尾根 点 ・谷点 の検 出 に よ り文字パ ター ンに 補 正 を施 し̀5',修復 した文字パ ター ンに対 して位 相特 徴 分布法̀6'に よ り文字線縁 の局所 的 な傾斜特徴 に位 置 情報 を付与 して特徴 ベ ク トル を形成 し,識別 を行 う.

実験 デ ー タ と して,産総研 (旧 電総研 ) が公 開 し て い る多債 の印刷 漢字 デ ー タベ ー スETL2̀7'を擬 似 的

平成

1 4

4月1 9

日受理

*大学 院生産科学研 究科

( Gr a dua t eSc hoolorSc i en c ea ndTe c hnol ogy)

**富士 ソフ ト

ABC(

秩)

( Fu j i s of tABC I nc. )

***教育学部

( Fa c ul t yofEduc a t i on)

(2)

に解像度 を落 として

1 6×1 6

画素の低解像度文字 デー タ として使用 した.以下

, 2

章では修復手法

, 3

章では 特徴抽 出 と識別

,4

章では評価実験 と考察 について報 告す る.

2.

修復手法

カメラな どで入力 された画像 は一般 に濃淡画像であ り,文字認識ではそれ を

2

倍化 して用いる.2億化処 理 は,各画素の濃度値が予め定め られた しきい値や, 自動的に求め られた しきい値 との大小関係 を比較 して 行 われる. しか し, これ らの方法 を低解像度 の文字画 像 に対 して適用す る と,つぶれやかすれ,ジャギーな どが発生す る.そ こで本箱 では

,2

億化処理の前 に文 字 の拡大 とぼか し処理 を行い,2倍化の際 に尾根点 ・ 谷点の検 出 と補正 によって,2億化 される文字パ ター

ンに修復 を行 う方法 を提案する.本手法の処理の流れ を図

1

に示 し,画質改善のための修復 の処理 を破線 の 枠 内に表す.

1 文字認識処理 における修復処理の手順

2. 1

文字の拡大 とばか し処理 による補完

ジャギーは,文字パ ター ンを少 ない画素で表現 しよ うとしたため に生 じた ものである.そこで文字パ ター ンの拡大 と,ぼか し処理 とを同時 に行い,見掛 け上の 解像度 を上げることで輪郭部の凹凸を除去 し,原画像 の文字縁 を滑 らかにす る. この処理 により擬似 的 に高 解像度文字画像 を得 ることがで きる.

処理では, まず入力 された濃淡画像の各画素 を

mx n

画素 に拡大 し,次 にmXmの フィル タでほか し処理 を行 う.図

2

に例 として,3倍 に拡大 して

( n ‑ 3

),

il i d

( a) ( b) ( C)

原画像 拡大 した画像 ぼか し処理後 2 文字パ ター ンの拡大 とぼか し処理

3× 3

の フィル タ

( m‑ 3)

をかけた場合 を示す.す なわち2× 2画素の原画像

( a)

は,拡大の処理 によ り

6×6

画素 の画像

( b)

になる.次 に拡大 した画像 の全 ての画素 に

3×3

のマス クをかけ,そのマス ク内で濃 度値の平均 をとって中央画素の濃度値 を求める.処理 結果 を図2

( C)

に示す.

以上の処理で原画像の濃度値 を保存 し,かつジャギー の除去 と同時 に原画像 よ り大 きさが縦横

3

倍 になるほ か しパ ター ンが生成 される.入力 された原画像が

1 6×

1 6

画素 な らば

,3

倍 に拡大 してぼか しをかけた文字パ ター ンは

48×48

画素の大 きさになる.原画像 を大津の 手法 を用 いて

2

倍化 した場合の一例 を図

3 ( a)

に,文 字パ ター ンを拡大 し

(n=3)

, ぼか し処理

(m=3)

を施 して2億化 した文字パ ター ンを図3(b)に示す.

l r q

原パ ター ン 拡大 とほか し処理 した 文字パ ター ン

3

拡大 してほか し処理 を施 した後

2

倍化 した文字パ ター ン

2 . 2

尾根点 ・谷点 による補正

かすれは文字線 の漉度 と同 じ濃度 になるはずの濃度 が本来の値 よ りも低 くなる事 によ り生 じ,つぶれは文 字線の間隙部分でかすれ と逆の現象が生 じたために起 きる もの と考 えることがで きる. この ように文字線 に つぶれやかすれが生 じた場合で も文字線部分では周囲 と比べ て濃度が高 くな り,文字線の間隙部分では周囲 より低 くなることか ら,文字画像の濃度値の凹凸 を調 べ ることによ り,文字線や文字線 間隔部分 をその周辺 部分 と区別することがで きる.そ こで,本稿では大津 の方法で求めた しきい値で2倍化 を行 うと同時 に,各 画素の

8

近傍 の濃度 を調べ,濃度億の高い方 を尾根点 と,低 い方 を谷点 として検 出 し,その検 出結果 に基づ いて

2

億化の結果 に対 し補正 を行 う.

(3)

文字画像 の修復 による低解像度印刷漢字の認識

2. 2. 1

尾根点 ・谷点の積 出

尾根点,谷点 の抽 出 には図4に示す ような3× 3 素 のマ ス クを用 い る. 中心 点Ⅹ。が尾根 点 か谷 点 かの 判定 は, Ⅹ。とその8近傍 ,す なわ ち Ⅹ.8の濃淡 値 の分布の状態 によって決定す る.

X

4

X3x 2 XSX o X1 X6X

7

XC

4 8

近傍

5 4

方向

5

の ように,縦 ,横 ,左斜 め,右斜 めの

4

方向 を 考 え, 各 々の方 向で 中央 の Ⅹ。の濃 淡値 が ,両側 の2 点の濃淡値 よ りも大 きい時,その方向で中央極大であ る とす る. また,

X

の濃淡値 が両側 の2点 の濃淡値 よ り小 さい時,その方向で中央極小 である とす る.

以上の ような中央極大 となる ような方向が2つ以上 あ る点 を尾根点,中央極小 となる方向が2つ以上ある 点 を谷点 とす る.ただ し,中央極大,中央極小 となる 方 向がそれぞれ

2

つ な らば尾根点で も谷点で もない も の とす る.

さらに,文字背景 の部分 にノイズによる尾根点が生 じることや,文字線上 に, ノイズに よる谷点が生 じる ことがある. これ らを防 ぐため,明 らか に文字背景の 濃度値 の時 は,尾根点 とは しない とす る尾根点 しきい

OTH

を設 け る. また明 らか に文字線 部分 の濃度値 の ときは谷点 としない とす る谷点 しきい値

m

を設 け, この しきい値 による処理 を行 い, ノイズの混入 を防い でいる.

2. 2. 2

文字パ ター ンの補正

大津 の手 法で求めた しきい値 を用 いて2億 化 した文 字パ ターンに対 し,尾根点が 白になっているものを尾根 点エラー,谷点が黒 になっているものを谷点エラーとす る.このエラーを検 出 して反転 させ,尾根点 を黒 に,谷 点 を白に強制 的に変更する.その一例 を図

6

に示す.

竺 胆 竺l 担

原画像 2倍化画像 補正画像

6

原画像 と修復画像 の比較

81

3.

特徴抽 出 と識別

本手法の評価のため に,低解像度文字パ ター ンを識 別す るための特徴 と しては,文献<3'で文字線 の傾 き特 徴が有効 な特徴であることが示 されているので,本稿 で も同様 な文字線縁 の傾 き特徴 をマス ク処理で容易 に 抽 出で きる方法 として,印刷漢字 の認識 に実績のある 位相特徴分布法(6'を使用す ることに した.

3. 1

特徴抽 出

認識実験 に使用す る特徴 としては,文字線縁の傾 き に着 目 した傾斜特徴 と黒点量 を用 いる.

3. 1 . 1

傾斜特徴 の抽 出

修復処理が施 された文字パ ター ンに対 し,文字線 の 縁 の部分 に

3× 3

のマス クを当てはめ,周囲の黒画素 の状 態 を調べ , 文字線縁 の局所 的 な傾斜 を示 す特 徴 (記号 と して表 した

H,V,L,R

点の中の一つの特徴 ) を付与す る. この処理 によ り,文字線縁 のすべ ての黒 点 には水平(H),垂直(Ⅴ),左斜 (L),右斜(R)4 の特徴 のいずれかが付与 され傾斜特徴が形成 される.

識別 では この4つの特徴 に加 え,黒点量(B)も求め,

5

̀っの特徴 を用 いる.

3. 1. 2

スムージング

L

または

R

の傾 斜符号 を有 す る黒点 にお いて,料 め前後 に

H

V

の傾斜符号 を有 す る黒点が存在 す る 場 合, その黒点 に

H

V

の傾斜符号 を付加 し,一つ の点 に

3

種類 の特徴 を持 たせ る. この処理 に よって文 字線 の交差 に よって生 じる不安定 な特徴 の影響が低減

される.

3. 1. 3

ブロ ック分割

文字線 部 に抽 出 された特徴 に位置情 報 を付加するた めに,文字パ ターンの外接枠 を基準 にして,文字パ ター ンを

rx s

の領域に分割 して扱 う.この分割により,各々 の傾斜特徴 の存在する位 置が,文字パ ターン上の配置 として表現 されるようになり,特徴相互の関連付 けとそ の分布の状態 を知 ることがで きる. ここで分割数 を多 く すると文字パ ターンの位置情報が より詳細 に表現で きる が,文字パ ターンが変形 した り,劣化 した場合,あるい は文字パ ターンの周辺部が欠けた りした場合 にその影響 を受 けやす くなる.図

7

に示す ように

r‑ S‑ 8

の場 合 を例 とすると,特徴抽 出によって32

0

次元 (8× 8× 5) の特徴ベク トルが得 られる.得 られた特徴 は正規化のた めに,傾斜特徴量

( H,V,L,良)

は分割領域の周 囲 長で,黒点量

( B)

は分割領域の面積で正規化する.

(4)

〆 . ‑ ‑S =

8

+

‑ 8

. ・ ‑ , 日 脚 三 ,

!

...4‑

. 冒} :

.鷲.: :. 図 7 ブ ロ ック分割

3. 2

実験では,ユー クリッ ド距離 を用 い,距離値の近い ものか ら順 に答 え として出力 した.

4.

評価実験 と考察

1 6×1 6

画素で表れされた低解像度の印刷文字 と本手 法によって修復 された印漢字 とに対 し,認識実験の正 解率によって,修復の改善効果を調べる方法を採用 した.

4. 1

実験データ

実験 デー タ と して, 産総研 印刷 漢字 デー タベ ース

ETL2

の中か ら明朝体 の印刷漢字21

36

カテゴリーを使 用 した.評価実験では表 1に示す ように, カテゴリー あた り10パ ター ンであ り,前半

6

パ ター ンを学習デー

タとし,後半4パ ター ンをテス トデー タとした.

低解像度画像の作成 は,元 の解像度が60×60画素の

ETL2

の文字画像 に対 し,中央の48×48画素 を有効 な 部分 と して取 り出 し, この部分 に

3× 3

画素 を

1

画素 に変換す る処理で1

6×1 6

画素 に落 とした.以後 この画 像 を原画像 と呼ぶ.

1

の原画像 を もとに して,評価実験 のために表

に示す

6

種の画像 を用意 した.デー タ

1

は原画像 を大 津の手法で

2

億化 した文字パ ター ンである. デー タ

2

は原画像 を

2

倍 に拡大 し,ほか し処理 を施 した文字パ ター ンである.デー タ

3

は原画像 を

3

倍 に拡大 し,ほ か し処理 を施 した文字パ ターンである.データ4はデー 1に尾根点 ・谷点 による補正 を施 した文字パ ター ン である.デー タ

5

はデー タ

2

に尾根点 ・谷点 による補

1

実験 デー タ仕様

カテ ゴリ一致

21 3 6

パ ター ン数/カテゴ リー

6

(学習)

,4

(テス ト)

25 6

階調

原画像 の画素数

1 6×1 6

画素

( 6 0×6

0画素

正 を施 した文字パ ター ンである.デー タ

6

はデー タ

3

に尾根点 ・谷点 による補正 を施 した文字パ ター ンであ る.表2の右端 に文字パ ター ンの大 きさを画素数で表 している. また,それ と同 じ箇所 に認識結果 と対応 を とるために,学習デー タをA ・Bとし,テス トデー タ をC・Dと区別 して,デー タ番号 と実験状態 との関係 を示 している.図

8に1 6×1 6

画素の文字画像の例 を示 す.比較のために,図

8

の1

6×1 6

画素の文字画像 を大 津の手法で

2

億化 した文字パ ター ンの例 を図

9

に示す.

また,本手法で修復 した48×48画素の文字パ ター ンを 縮小 した例 を図10に示す.

2 実験 デー タの種類

データ

番 号 修練の内容 学習/ テス ト大 きさ(画素) 1 原 画像 に大津 の手 法で

2

1 6×1 6

化 した文字パターン

l A, l B/ l C, 1 D 2

原画像 を

2

倍に拡大 し,ほか

32×32

し処理を施 した文字パターン

2A/2C 3

原画像 を

3

倍に拡大 し,ぽカ、

48×48

し処理 を施 した文字パターン

3 A/3 C 4

データ

1

に尾根点 .谷点によ

1 6×1 6

る補正を施 した文字パターン

4B/4D 5

テし

夕2

に尾板点 .谷点によ

32×32

る補正を施 した文字パターン

5B/5D 6

データ

3

に尾根点 .谷点によ

48×48

8

多億の文字画像

( 1 6×1 6

画素)

峡嵐削 島循岳 悪患店蕗 愚憂愁忙悦悔他 l E i ・ 悼慌

デー タ

1

9

大津の手法 を用いた文字パ ター ン

( 1 6×1 6

画素)

峡嵐嵩嶋塘忌忍愚意慈 愚憂思忙悦悔恨悼 悼惜

デー タ

6

図1

0

本手法 を用いた文字パ ター ン

( 48×48

画素)

(5)

文字画像の修復 による低解像度印刷漢字の認識

4. 2

実験結果

評価実験 は表

2に示 した仝 6

種類の実験 デー タに対

,3

章で述べ た特徴抽 出 と識別処理 を行 った.特徴 抽 出では文字 パ ター ンに対 し, 3.

1

項 に示 したマス ク を用 いてすべ での黒画素 に傾斜符号 を付与 した後,文 字パ ター ンの外接枠 を基準 として

8× 8にブロ ック分

割 して特徴 を計 数 した.その結果,識別 に用 いる特徴 ベ ク トルは,320 (8× 8× 5)次元 となった.

識別結果 を第

1

位正解率 と候補

5

位 までの累積正解 率 とに分 けて,図

1

1か ら図1

4

に示す . 縦 軸 は正解率 を,横軸 は文字パ ター ンの修復 の状態 を示すデー タ番 号 を表 してい る. 第

1

位 の正解 率 を実線 で ,候 補

5

位 までの累積正解率 を破線 で示す.図

1

1と図1

2

は学習 デー タに対す る認識結果であ り,国 1

3

と図1

4

はテス ト

‑ : : こ : : . ‑ : I . : : J て て こ ∴

‑.∴:.:..

・ ‑.‑ . .

.:

‑ ●第15ii

li.I...::::::: I:I:/A.

データ

1

データ

2

データ3

11

学習デー タの認識結果

A

(拡大 ,ほか し処理)

9 8. 0

#9 6 . 0

#

#9 4. 0 畔

#

#9 也 9 8 2. 0. 8. 0 0 0

p ‑ = a

一一ト ー一幕1線檎

‑‑ ‑.事5侯禰

T‑‑タ1 デ‑タT‑‑タ5 デ‑タ6

図1

2

学習デー タの認識結果 B (尾根点 ・谷点 による補正)

83

デー タに対す る認識結果 を示 している.両者 を比較す る と,正解率 はテス トデー タの方が全体的 に低 い こと が分か る.

テス トデー タの実験結果では,図

1

3に示す ように, 本手法 を用 いる こ とに よ り第

1

位 の正解率が89.

1 %か

ら99.

1 %へ , 5

位 候 補 までの累積正解 率 が95.

1 %か ら 99. 8%‑改善 してい る. また, 図1 4

に示す ように第

1

位 の正解率が89.

1 %か ら 99. 4%へ約1 0%,5

位候補 まで の累積正解率が95.

1 %か ら 99. 9%へ,約 5

%向上 してい

る.

4. 3

本手法 を低解像度の文字パ ター ンに適用 した場合,

9

の文字パ ター ンと図10の比較か ら視覚 的 に も画質

9 8 . 0

(

)

Jt

8 9 ‑9 6 ‑ 0

#

控一

・ # 9 嶋

# 9

rt

l9 8 0. 4. 2. 8 . 0 0 0 0

: . ; こ ㌻ : : :

::.;=::;:

こ ; . =

: : : . . I ■

:.I

: .: I :

I 1.:L.= ‑:::I:.:I: A;::::::==t:::Lf

≡ . . . p p

;:.i:p

・ ;

::

・ : : I ノ

:::::pl ・:: :.:.

■ ■

; I

: : . : I

:.p. I.:::I::

i

I ;

.:.:.:.:

1..

: : i . >

::::::A .;.:

p

事1 第5侯at 候補

‑●‑

データ

1

データ

2

デ‑タ

3 1 6×1 6

32×32 48×48

図 13 テ ス

トデ ー タ の 認 識 結 果 C

(拡 大

, ば か し 処 理 )

9 8 . 0

(

写 ‑ . >

¥:.,.̲̲

I ‑ . . 3

■亡

# 96. 0

輩ttl 欝 94.0 l推 称

# 92.H 90.88.000

I : ‑ , 一 記 ‑

*l ●'

完訳≡ 害 監

監慧慧書芸至芸≡欝農

I

■‑ 7t第5

1

侯樽候補>

IH一.1

′.:

データ1 データ4 データ5 データ6

14 テ ス ト デ ー タ の 認 識 結 果 D (尾 根 点 ・谷 点 に よ る 補 正 )

(6)

の改善効果が確認で きる.定量的な評価のために行 っ た文字認識実験の結果か ら,次の ようなことが分かっ た.

(1)詩織精度の比較 :

1 6×1 6

画素の学習デー タとテス トデー タとの比較で は,図11と図13,お よび図

1 2

と図1

4

に見 られるように, 正解率 に大 きな差が生 じた. これは学習デー タ数が少 な くて,入力デー タのバ ラツキを十分吸収することが で きなかったため と考 え られる.

(2)拡大 とぼか し処理の効果 :

図13に示す ように,拡大 とぼか し処理で第1位正解 率 は,8

9. 1 % (lC)

か ら

99. 1 % (3C)へ大幅 に改善

された. この原因は,① これ まで不安定であ った斜め 成分の特徴

(L

お よびRの特徴)が安定化 されたこと,

1 6×1 6

画素の文字パ ター ンでは,文字線の帽が

1

素の場合が多 く生 じ,文字線縁 の特徴が不安定であっ た ものが拡大の処理で文字線の幅が常 に2画素以上 と なったこと,(影文字パ ター ンが拡大 されたことによ り ブロ ック分割 によ.る特徴の変動が少な くなったこと, などが考 え られる.

( 3 )

尾根点 ・合点 による補正の効果 :

図1

4

に示す ように,尾根点 ・谷点 による補正で1

1 6

画素の原画像 の正解率 が89.

1 %か ら91 . 6%に向上 し

た. なお, (

2)

の手法 と併用 した場合 に99.4%まで向 上 させ ることがで きた. これは尾根点 ・谷点 による補 正が漉淡画像の文字線の漉度分布 を反映 してお り,大 津の

2

億化の手法で得 られた文字パ ター ンをさらに改 善 して くれた もの と考 えられる.

識別実験 の結果 に,候補

5

位 までに出現せず に誤認 識 になった文字パ ター ンの例 を図1

5

に示す.その主 な 原因は,つぶれやかすれが多 く存在 し,特徴が大 きく 変化 した ものか と考 え られる.

5.

まとめ

デ ィジタルカメラやデ ィジタル ビデオカメラな どか ら入力 された低解像度の印刷漢字 を精度 よ く認識す る ために,劣化 した文字パ ター ンの修復法,す なわち

( 1 )大 きさが1 6×1 6

画素の多値の低解像度文字画像 に

対 し

,2

億化の際 に拡大 とほか し処理 を施 して文 字パ ター ンの ジャギーを少な くす る方法,

(2)文字画像の局所的な尾根点や谷点の検出を行 って, 注 目画素の周囲の状況 を見 なが ら,黒画素,白画 素 を補正する文字パ ター ンの修復方法,

について検討 した.

修復方法の評価 では,産総研 デー タ

ETL2に対 し,

( a)

原画像

1 6×1 6

画素

( b)

修復 した文字パターン

48×48

画素

1 5

誤認識の文字パ ター ンの例

解像度 を6

0×6

0画素か ら1

6×1 6

画素 に落 として,擬似 的な低解像度の印刷漢字 を作成 して使用 した.認識実 験では位相特徴分布法 を用い,正解率 による評価 を行 っ た.その結果,本稿で提案 した文字パ ター ンの修復法 に よって, テス トデー タで正解率 が8

9. 1 %の もの を 99. 4%まで,約 1 0%向上 させ ることがで きた.また第 5

位 までの累積正解率 で は,95.

1 %の もの を9 9. 9%まで

向上 させ ることがで き,本手法の有効性 を確認す るこ

とがで きた.

今後はマルチ フォン ト文字 に対す る本手法の適用効 果,文字線のつぶれやかすれの影響 をさらに少 な くす る方法 な どについて検討す る予定である.

参考文献

(1)蘇,挿木 :低品質文字の認識手法 とその応用 に関 す るサーベ イ,信学技報

,pRMU2 0 0 1 ‑ 275,p. 2 5

40( 2 0 02) .

( 2)N.Na ka j i ma,N.T

a

na ka

,K

.Ya m a da:Doc ume nt Re c ons t r uc t i on a nd Re c ogm it ion 丘. om a n I ma ge Se que nc e,I CPR,p. 922‑ 925( 1 9 98).

( 3)小佐井,山本,他 :低解像度 における文字認識手

法の提案,MI

RU98‑7,p. 257‑ 262( 1 998).

( 4)

鈴木,窪田 :補 間 と凸判定 に基づ くス トローク抽 出を用いた低解像度文書画像の二値化

, 2

∝X)年信 学総合大,No.D‑

1 2‑ 3 4,p. 2 糾 ( 2 ( X氾).

( 5)岡田,坂井,他 :尾根点 ・

谷点方式 に よる文書画 像の前処理付入力装置,EC82

5,p. 45‑ 5 4( 1 98 2).

(6)宮原,川谷,他 :位相特徴分布法 による印刷漢字 認識,昭和57年債学稔全大,No.

1 33 4,p. 5( 1 98 2).

( 7)ETL2:ht t

p:

/ / www. e t l . go. j p / 〜e t l c db/ i n de x. ht m

参照

関連したドキュメント

そこで本解説では,X線CT画像から患者別に骨の有限 要素モデルを作成することが可能な,画像処理と力学解析 の統合ソフトウェアである

仏像に対する知識は、これまでの学校教育では必

HORS

画像の参照時に ACDSee Pro によってファイルがカタログ化され、ファイル プロパティと メタデータが自動的に ACDSee

管理画面へのログイン ID について 管理画面のログイン ID について、 希望の ID がある場合は備考欄にご記載下さい。アルファベット小文字、 数字お よび記号 「_ (アンダーライン)

( 同様に、行為者には、一つの生命侵害の認識しか認められないため、一つの故意犯しか認められないことになると思われる。

大阪府では、これまで大切にしてきた、子ども一人ひとりが違いを認め合いそれぞれの力

るものの、およそ 1:1 の関係が得られた。冬季には TEOM の値はやや小さくなる傾 向にあった。これは SHARP