• 検索結果がありません。

シェーディングのかかった文字画像の二値化: University of the Ryukyus Repository

N/A
N/A
Protected

Academic year: 2021

シェア "シェーディングのかかった文字画像の二値化: University of the Ryukyus Repository"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

Title

シェーディングのかかった文字画像の二値化

Author(s)

山川, 毅; 山城, 毅; 渡久地, 實

Citation

琉球大学工学部紀要(63): 63-68

Issue Date

2002-11

URL

http://hdl.handle.net/20.500.12000/1478

Rights

(2)

63 琉球大学工学部紀要第63号,2002年

シェーディングのかかった文字画像の二値化

山jll毅蝋山城毅**渡久地変幹

BmarizationMethodfbrCharacterlmagewithShadmg

TsuyoshiYAMAKAwA*TsuyoshiYAMAsHIRo**andMinoruToGuoHI**

Abstract BinarizationofCharacterimageisveryimportantpreprocessingfbrautomaticrecognitionofcharaEters orsigns・Asfbrtheimagethatw顕shotwithaCODcamera,ashadowresultsduetolightingunevenness Tbdecreacetheinnuenceoftheshadow,wedividedthecharacterimagemsomesmaUareaautomatically duetoitslightmgunevennessEachsmallareawassetupindifTerentthresholdmdividually、Thelmear fUnctionswereusedtosetupthethresholdeEusily・WeimprovedthelinearfUnctions,andcouldobtamed thebetterbinarizedimage、Wealsocomparedourresearchwitjhothermethodologycalledtheptne method1andourmethodshowedmoreeHectivefbrbinarizatio、. KeyWOrds:binarization,threshold,shadmg,CODcamera 最大とする判別規準を用いた大津の方法[51,得られた二 値画像についての複雑さを尺度とした最小複雑二値化法

161,二値化したときの連結成分のまとまりの良さを尺度

とした平均隣接によるしきい値決定法[71などがある.し かしこれら提案されている手法は手続きの複雑さとそれに 伴って膨大な計算量を必要とするものや,手法としては単 純ではあるが,良質な二値画像が得られていないものがあ る.本研究では文字画像の大部分をしめる白領域の明るさ に着目し,扱いを簡単にする二値化法について検討した. シェーデイングのかかった文字画像は,シェーデイング による影響で単一しきい値では良好な二値画像は得られ ないためシェーデイングに応じた分割を行う必要がある. 分割は画像の外枠の濃度差に着目し,濃度差の大小により 画像を小領域に分割した.このようにして分割した各領域 にしきい値を設定を行ない,二値化した.これによりほと んど良質な処理結果を得ることはできるが,文字と背景と の間の濃度差が少ない暗い画像に対しては良い結果が得ら れにくい傾向があった.そこでしきい値式を見直すために ある条件のもとでサンプル画像の二値化を実験的に行い, 最適なしきい値と背景の平均濃度との相関関係を得た.こ れらの相関関係によりしきい値式を改良したことで上記の 問題を解決した. 2.シエーディングの影響 通常の自然照明の条件下で得られた文字画像Figlの濃 度ヒストグラムはFig2のようになり,濃淡分布に広がり が少なく,文字部分と背景部分とに濃淡分布の山がはっき り分けれるために,文字部分と背景部分との間に単一しき

い値を設定することで二値化が容易に行える.シェーデイ

ングとは,照明ムラにより画像上に濃度差が生じ明るさが 一様でない状態のことである.Fig.3にシェーデイングの かかった文字画像およびその濃度ヒストグラムをFig.4に 1.まえがき 量近のハードウェア技術はめざましく,特にハードウェ アの小型化は並列処理を可能とし,時間や記憶容量の問 題で従来は不可能であった大容週かつ高速な画像処理が可 能となった.また我々の日常生活おいてはスキャナ)ディ ジタルカメラ,ピデオカメラなどといった手軽で簡単に扱 えるディジタル商品が増えたことに伴い,コンピュータを 用いた画像処理がますます盛んになっている.画像処理と いってもその用途や目的によって様々な手法があるが,そ の中の二値化は,画像内から処理の対象を形として抽出す るための最も基本的な手法である.二値化とは対象画像を あるしきい値により0と1の二値に変換する操作である が,このとき問題となることが二値化するためのしきい値 の決定であり,これまで良質な二値画像を得るために様々 な手法が提案されている[11~ll2l, 通常,画像のデータには照明ムラなどによりシェーディ ングといった濃淡レベル変動が存在するために固定しきい 値では対応しきれないそこで有効な方法として動的しき い値処理があり,画像ごとにしきい値を自動決定する必要 がある.その方法としては濃度ヒストグラムにおける濃度

値の確率分布p%の点をしきい値とするp-タイル法141,

濃度値の確率密度関数の谷(極小点)に対する濃度値をし

きい値とするモード法[11,対象物の輪郭付近の濃淡の変

化に着目しているラプラシアンヒストグラム法および微分

ヒストグラム法[11、濃度ヒストグラムのクラス分離度を

受理:2001年12月10日 趣子情報通信学会2001年情報・システムソサエイテイ大会にて発表. ・大学院理工学研究科懲気危子工学専攻 (GraduateStudent,Electrk氾landE1ectronicEng.) .、愈気愈子工学科 (Dept、ofEIectricalandElectronicEngineenng,Fhc、ofEng.)

(3)

64 山川・山城・渡久地:シエーデイングのかかった文字画像の二値化 示す.Fig.4のような濃度ヒストグラムの濃淡分布に広が りがあるFig.3の画像は,シェーデイングのかかり具合が きついことを示している.このような画像を単一しきい値 で二値化を行うとFig.5のようなツブレやカスレ出て良い 結果は得られないこのような問題を解決するために本稿 では画像を分割し,分割した各領域ごとにしきい値を設定

**Sample----NO1**

琉球友学工学部電気電子

BCI」 することにした. Fig.5.単一しきい値による二値化 3.画像の分割 シェーデイングのかかった文字画像を二値化するために

は,明るさが一様でない画像を幾つかの小領域に分割し,

Fig6のように明るい領域、暗い領域それぞれに応じたし きい値を設定する.Fig.6を分割し各々の小領域で濃度ヒ ストグラムを見ると背景部分と思われる濃淡分布の広がり が狭くなり,Fig.4の濃度ヒストグラムと比較しても文字 部分と背景部分との濃度差がはっきりしている.このこと

から更に細かく画像を分割を行なうと,より文字部分と背

景部分が分割されることが予想される.Fig.7は2×2分

割による二値化であるが,Fig.5の単一しきい値しきい値

による二値化よりも処理結果が改善されていることがわ かる. Fig.1.自然照明でtR影した画像

繩迦麺廼麺麺岬mm0

020釦608010Dl2Dl40I60180200220240 Fi9.2.自然照明での濃度ヒストグラム 魎釦知麺、0 しきい値 麺、脚、印0 O6010015020D250、50100150200250 Fig.3.シエーデイングのかかった文字画像 、函、仰、血、0 mmm0

}

抑迦mm0 O50100150200250060100150200250 Fig.6.分割した各儘】域の濃度ヒストグラム O20dD6080100」20MO160180mO220既O Fig.4.89度ヒストグラム b-- L_ しきい値 凹 凸 1 0 」 」

lA

しきい値

し き い 値 一■■

'し

(4)

琉球大学工学部紀要第63号,2002年 65 い画像に対しては細かく分割することなく二値化が行える ので処理時間の短縮にもつながる.

\SampleNo2琉

大学工学部あいうえ緯

しきい値の決定は,長嶺ら[10]が求めたしきい値式4.しきい値の設定 (2) Tb=LO5xkd-37.53

I÷ニサシヱ・ヒソ…〔?'〕EFGUnJDKup

麺…鵬護艤……索*鐵

凸。 を用いる.

ここで,式(2)における1cdの決定には,分割した各領域

の平均濃度を用いる,一般に文字画像の文字比率(IEble、1) を求めると約80%は背景部分で,残りの約20%が文字 部分とされているため,平均濃度kdを求める際には文字 部分と思われる画素分の濃度はカットし,残りの背景部分 と思われる画素分の濃度により求める. このようにしてしきい値式から求まったしきい値は,し きい値濃度として分割した画像領域の背景としてしきい 値面と定義する.このしきい値面と原画像の濃度差を比較 し,その濃度差が正ならば黒,負ならば白にすることで二 値化している. Fig.7.2×2分割による二値化 3.1自動分割法 画像を分割する場合には,その画像のシェーデイングに 応じた自動分割数が望ましいシェーデイングのかかった 文字画像は画像上の至るところで濃度差が生じており,そ の濃度差は画像の外枠にも存在する。このことから画像の 外枠の濃度差を用いて画像を分割することにした.  ̄X

濃度 y 、珈珈抑、”、0 220 副0 20406080100120140160180200 Fig.9.平均M1度化。 文字の比率 nAFlLnl Fig.8.自動分割法

まず,Fig8のようにzノーOにおける⑳座標上の濃度差

Mを一定間隔mごとに式(1)より求める.

(1)

|池"十km,O)一昨、,O)|=〃

kを1,2,…と増やしていき,濃度差Mがある任意に

決めた濃度値よりも大きくなった点を,シェーデイングに

よる明暗の差が大として分割点となる.同様にして、=O

におけるy座標上の分割点を求め,得られた分割点を起

点として画像を小領域に分割する.

実際に画像を分割する際には経験的に求めた結果から

間隔、=10画素,濃度差」W=10としている.また,こ

の方法による画像の自動分割は,背景部分の濃度差が小さ

5.処理結果 本手法による処理結果を以下に示す.原画像Fig.10を

自動分割し,しきい値式から得られたしきい値面がFig.11

対象画像 の種類

鶴K認

距殿【mnI 文字の比率I9q 対象画像の種類 カメラと対 象画像との 距鍾[、m] 文字の比率 Pq 日本文 の文字 150 250 350, 450 55ロ 副巫到、餌 斬囲 掴麺郵靭郵 22222 44555 英文の 文字

画麺麹靭麺

21111 09987

の 卸麺麺籾郵 1111155677 格子模橡 150 350 団翠 ざら紙上 の文字 150350 空泪

(5)

66 山川・山城・渡久地:シェーディングのかかった文字画像の二値化 となる.更に原画像としきい値面との濃度差を比較して得

あらかじめ画像を分割して用いている.原画像Fig.13(a)

に対して,本手法による処理結果がFig.13(b),p-タイル

法による処理結果がFigl3(c)となる. シェーデイングのかかった文字画像の場合,文字比率が わかっていたとしてもシェーデイングによる影響から必ず しもその文字比率が最適なしきい値になるとは限らない. また原画像Fig`13(a)のような文字の大きさが異なる文字

画像では分割した領域ごとに文字比率がことなるので,p-

タイル法による二値化はFig.13(c)のような雑音を残す結 果になりやすいよって本手法による二値化がp-タイル られた処理結果がFig.12となる. 法による二値化よりもより良い結果が得られている. 3.nm[ELNⅢ【】 Fig.10.原画i像 蝋蝋 (a)原画像

1SampleNoZ琉

大学工学部あいうえぉ

Fig.11.しきい値面 けこサシスセソABcmT旺田DKR』[

西口…雁瀞カタカナP#☆★§司

一+企甲グー鉤÷、ヨーァKr二・ (b)本手法による処理緒呆 中■。、L■、!~■■■■■、、、■、。Tも、●●●p寸叩■P-U、、、。、、n町●■・coOop■▼..、GOD・・・、.■■.、OL、1-←~・キー、や、、、、‐。.、.、...。.むち.-℃七句句句.、UOP.L、DbUU.。\O0PU--Lも,?、+,.

**Sample----Nm**

琉球大学工学部電気電子

工学科ABCDEFGHIJK

OVWXYz漢字ひらが竃

あいうえおかざしすせぞ

弥毎カナダチツテト

lSampleN⑫琉

域学工輸鰄ぅ惑

嘗こ彌童蝋蕊cmwn鰯。智

Fig.12.本手法による二値化

画…僻鮮愈……☆§テ

L:÷+」と$鍵n$。、為P戸bGb由。~哲腱冒筐謡 6.p-タイル法との比較

本手法による二値化の有効性を示すために今回はp-タ

イル法との比較を行った.p-タイル法とは濃度ヒストグ ラムにおける濃度値の確率分布p%の点をしきい値として 二値化する手法である.実際にこの手法を用いる場合にも (cルータイル法による処理jMi采 Fig.13.p-タイル法による処理結果

(6)

67 琉球大学工学部紀要第63号,2002年 7.しきい値式の改良

長嶺らが求めたしきい値式(2)による二値化は,処理結

果およびp-タイル法との比較から良い結果が得られてい

る.しかし,背景と文字との間の濃度差が少ない暗い画像

Fig.15(a)に対する二値化ではFigl5(b)のようにに文字

が掠れてしまう.これはしきい値面を決定する際のしきい

値式に問題があると思われるので,しきい値式を再度検討

することにした.

新たなしきい値式を検討するために,画像の背景の濃淡

分布がなるぺく均一になっている画像を単一のしきい値で

二値化する.このとき二値化された処理結果を視覚的な判

断および,あらかじめ原画像から求めていた黒画素の比率

と処理結果の黒画素の比率による比較の判断から最適なし

きい値を決定する.これを様々な背景濃度パターンについ

てそれぞれJ量的なしきい値を測定した.測定結果がFigl4

となり,新たなしきい値式として式(3)が得られた、

(a)暗い原画像

SaIIrpleNO1球大学

ABCDEI1GHIJI

VWXYZ漢字ひら:

いうだおさし寸撞ゼ

ナタチツテ1,群-熟:

(3) Tb=O87xkd-6.42 (b)長嶺らのしきI'極式による処理結果

§'60

い 値’40 120 100 60 60 40 20 0

SampleNO1球大学.

ABCDE田距lHIJm

VWIHZ、漢字ひら:j

_いう毘おきし本せ電

□。.gの

ナタチヅテ・ト電.気濯

200 湿度 150 100 50 0 Fig.14.しきい値の測定糖果 に)新たなしき1,値式による処理lMi采 Fig.15.暗い画像での比較

8.新たなしきい値式を用いた処理結果

まず,背景の濃淡分布が暗い画像Fig.15(a)を従来用い

ていたしきい値式で処理した結果がFigl5(b)で,今回

新たに得られたしきい値式で処理した結果はFig.15(c)で

ある.このFig.15(b)とFig.15(c)を見てもわかるように,

Figl5(c)には細かい雑音はあるがFig.15(b)よりもはっき

りと文字を出力させていることがわかる.一方,背景の濃

淡分布が明るい原画像Fig.16(a)を従来用いていたしきい

値式で処理した結果がFig.16(b)で,今回新たに得られた

しきい値式による処理結果はFigl6(c)となる.この場合

は処理結果を比較してもさほど差がないことがいえる.こ

れらのことから,今回得られた新たなしきい値式は濃淡分

布の明るい画像と暗い画像に十分対応できるその有効性が

示せた.

1lii1iiliiiii1iiiiiijliiiliiil11ii1iili1i;iililii

(a)明るい原因像

(7)

68 山川・山城・渡久地:シェーデイングのかかった文字画像の二値化 しかし,長嶺らの求めたしきい値式では暗い画像に対し ては良い結果が得られない傾向があったので,データを再 検討し,新たなしきい値式を求めることで本手法による二 値化を改善した. 今後は,文献[11~[7]の手法と本手法による二値化の比 較評価,今回は自動分割における間隔mは経験的に求め た値を用いているが,この間隔mもその画像に応じて求 めることで完全に自動化すること,また更に良好な二値画 像を得るためにしきい値面の改良などがあげられる.

1SampleNo2琉

大学工学部…えぉ

除ニサシヱセソABC、湿旺臼LDP[皿[

、…早雁澪カタカナP#☆★67

-÷企、且グー雁・杵÷cゴー丁L臣・ (b)長嶺らのしきい値式による処理結果 参考文献 [11高木幹男]下田陽久:唾画像解析ハンドブック",東京大学出版会, 1991 '2]安居院症,中鯛正之:“画像1W鴬1処理'',森北出版株式会社,2000. [31鳥脇純一郎:“画像理解のためのディジタル画像処理(1)'1,株式会 社昭晃堂,1988. l41外山直子,伊藤正安:“輝度分布の形状を利用した図面の二値化手 法'',愈子情報通信学会践文鰭,VOLJ74-D-n,No.5,pp、648-654, 1991.. '5]大津展之:``判別および最小2乗規準に基づく自動しきい値遇定法'', 愈子IHi報通憤学会騰文麓,VbLJ63-D,No.4,pp、349-356,1980 [61谷口倫一郎1河ロ英二:“二値画像の複雑さと多値画像のしきい値 処理に関する考察'',電子情報通償学会鹸文隣,VbLJ70-D,No.1, ppl64-17491987・ '71掴Ⅱ耕一,黒田伸一,池j;1重樹:“平均隣接数に着目したしきいiB【決 定法'',電子1W報通信学会餓文麓,VbLJ73-D-II,No.3,pp、360-366, 1990. '81尾崎賊,三藤雅俊,小林富士夫,尾関孝史:鰹、i路中心線を利用し た市街地地図の道路網抽出,',画像電子学会麓,第30巻,第3号, pp、242-249,2001. '91大山航,若林哲史,木村文隆,掴岡信治,関岡澗次:“2窟しきい 値法を用いた超音波診断層からの心内膜輪郭lil抽出とその信頼性の 検討',愈気学会鶴文鰭,VbL121-C,No.9,1448-14566,2001. [10l長嶺銀河,山城毅,安富祖忠個:“CCDカメラで取り込んだ文字 画像の二値化に関する研究",琉球大学工学部紀要,第54号,1997, pP67L72. [111:除川幸子,山城毅,渡久地文:“シェーディングのある文字画 像の二値化に関する研究,',琉球大学工学部紀要,57号,pp、41-45, 1999. 112]山川毅,山城毅,渡久地文:“シェーデイングのかかった文字画 像の二lH化''’2001年愈子情報通憤学会情報・システムソサイエテイ 大会簿演瞼文集,D-11-83,pp、168,2001.

lSamlPleNo2琉

大学工学部あいうえお

げこサシスセソABcmJET旺皿1m」正

.…=月醇カタヵナク#☆★§7

1-歪、■グーLc卉争-1-了Lに、 (c)新たなしきME【式による処理結果 Fig.16.明るい画像での比較 9.まとめ シェーデイングのかかった文字画像は, シェーテイングのかかった文字画像は,シェーデイング による影響から単一しきい値では良好な二値画像は得られ

ないそこで画像を分割し,分割した各領域に独自のしき

い値式を用いてしきい値を設定して二値化した.しきい値

式による処理結果と10-タイル法による処理結果を比較を

行い,その有効性を示した.

参照

関連したドキュメント

Instagram 等 Flickr 以外にも多くの画像共有サイトがあるにも 関わらず, Flickr を利用する研究が多いことには, 大きく分けて 2

児童について一緒に考えることが解決への糸口 になるのではないか。④保護者への対応も難し

 今日のセミナーは、人生の最終ステージまで芸術の力 でイキイキと生き抜くことができる社会をどのようにつ

 筆記試験は与えられた課題に対して、時間 内に回答 しなければなりません。時間内に答 え を出すことは働 くことと 同様です。 だから分からな い問題は後回しでもいいので

自分ではおかしいと思って も、「自分の体は汚れてい るのではないか」「ひどい ことを周りの人にしたので