Title
CCDカメラで取り込んだ文字画像の二値化に関する研
究
Author(s)
長嶺, 銀河; 山城, 毅; 安冨祖, 忠信
Citation
琉球大学工学部紀要(54): 67-72
Issue Date
1997-09
URL
http://hdl.handle.net/20.500.12000/1468
Rights
琉球大学工学部紀要第54号,1997年 67
CCDカメラで取り込んだ文字画像の二値化に関する研究
長嶺銀河一山城毅…安富祖忠信**ASl】1〔|v()「}jinaT1zali()11M(、''1(〕(川〔〕『(illal・actTTImageTal[elrlwit}ICCl)(lamera
●.'(+illgハNAGAM1NF津’「月11yoHhiYAMAsHIRo-(1)lus1liTlAFuso…
Abstract '111F'・gILl・僧vari()lIHwiw名l()}〕illlM・izPiIIIillli吟sauloIl1fLlic(LI1y・OUI.s(udVis}IowIobiniLriizec11aracIel・illla8⑤s巴 一 Wl】i(P11wぞ】・PtIHI《俗IIIlII(]e「}》iM11i811Iill8〔9olIdiliollswil11(V(1[)cal11el・a、Wel)roposea]iIl色iLr⑧qIlatiolD(1〔)r llII・閉l1old孔11.(11倍代(liLl》liv俗illllLB⑧能811〕笠IIla(iolLTilFdvllalllicII1】・esholdiIlg1》ythisI11eI1l()(llnakesl11eseC slIfLdilIgilllag曙wP11l〕ilMLI・iIHMill(l(l几lilV.、 K《DyWOrds:dvIIIlllli〔・’''1.←51]Cl(IiIIg、11&lIlill:〔POI,(IiIiolI,(1(11)can】俗「a,slladiIlgも の 的に求め,これより妓適しきい値と濃度レベルとのH1関lkl 係を得る.これらのイ|l関関係によ')得られたしきい値決定 法(相関式をもちいたしきい値決定法)と,ズ」・象lllli像のイテ 最領域の濃度レベルの変動に適応したlilji像平IIiの分割処fM (|lli像の適応的分割処理)の組合せで構成される.この組 み合わせは,入力機器からの画像取り込みの際の照明条件 による恕影響を考慮して設計されたもので,特にCCDカ メラなどの自由度の高い人力機器から取り込んだillUi像を-: 値化するときに効果的である. 2.しきい値処理 本研究で提案するしきい値処理の手法は,濃度ヒストグ ラムから,あらかじめ予想されたしきい値と適切に定義し た規準値(濃度レベル)との相関を,線形関数で近似して 定式化し,その関数から最適しきい値を算出する方法であ るⅢ 2」相関式を用いたしきい値決定法 」しレベルの濃度スケールを持つ11,像において,レベルj (/ES,S=(I,…,L})の濃度を持つIuli索の和を〃iとすると,このときの全画素数/v=EjEs"`であトノ,’1;規
化ヒストグラムpiは,式(1)で表せる.
I.はじめに :値化乎,低レベル'1ml像処&''1のfi上の多くは,認識をす るような,より高次の,1,i像L''1解のための前処』'1として,良 好な,1M像をイリしることを']「円として研究されている.またlji 処J111という性格からすれば,下続きの櫛iiiざと処理lL1f間の 虹縮も通妥な妥素となる. 本イリト先では,文字認識などにおいて軍安な'iii処LIMである IIhi像の「lmill1lti化について検討した.画像の、動二値化に関してはさまざまな〃lム[l]~['9]が提案されている・・
般的に収')込まれたIllli像は,iii-しきい値で]'1(化すると うまくいかない.その場合Iii1リr的なしきい('{〔を定めて動的 にえI1fI化することになるが,これまで捉案さノしたTii」〈で は,アルゴリズムに改蒋を'Ⅱ'えた結采,下続きの複雑さと それにともなう処JM''洲jの噸h'1を招いている.そノLでも, ,Ihi像によってはうまく11((化できないことがある・従米のノJu〈による動的二値化[]o]は、あらかじめ決めた大きさ
に聯分lIi1lされた各領域に対してその'''心のしきい値を求 め、さらに各釧域の''1心しきいIIliを結ぶようにして,線形 #1,i,1,1によ})lIm素ごとのしきい値を算')している。この〃法 は、背景領域に濃淡むらが入きい」lMi介幡に有効であるが、 灰,hi,線勝,')間によ})'t成されるしきい値は濃淡の微細な 変動まで捉えてしまい適切なしきい値lHiを埖成できない場今がある[13]また,Lii純にシェーディングのような雑音
を取り除く力法もあるが,処jM効率がいちじるしく落ち, ,IHI質のmでも問題がある. これらの問題点を改蒋するために,しきい値選定i」:と M所領域の決め刀の:ノ'【について検討・した.腿案する下法 は,まず,ある条件のもとでサンプルiilIi像の1t[化を'ノミ験’'`=詩(にM>0,,'二')(I1
1jE.g ここで,重なりのほとんどない二つの正規分布の刑1で衣 せるような統計的分布をもつ理想画像lについて考える (Fig.1).画像ノのjE規化ヒストグラムpiにおいて,最適しきい
値&*を-:つの分布の部分に定め,A、と適当な濃度レベ ルAIの間に簡単な相関の式力を考える. A*=ハ(』。)=⑩.i`【+β(2) もし,理想画像/と検査対・象の実画像Rの画素の統iI・ 的分ハブがほぼ同様であるならば,実画像Rにおける適切 なしきい値、r/,は,iiii述のホlj関ハから決定できる. 受H1:191)7年5)j2(ill I臼i像変換技ilV行lijⅡi)1究会r柵(イ鳶イ|渡(i1Ii1l1繩)にIlrlDf修Ili ・人';:ルビl:学(i)f究ドト烟気・ll1j朧lil学11J攻 ((lradllatバネIudcmt,DCP1..F脆《可triぐalalldInfbmlatin11F''9) ..’:'デ:部iE気巡「・]:学「:} (DCI)t・厄にパ1.i《7aIalldF1o,可trn11irF1lgFar.(Dfnng.)68 長嶺・山城・安富祖:CCDカメラで取り込んだ文字画像の二値化に関する研究 backgzound I- ̄ ̄ ̄ ̄-- ̄--気 p(i)
洲
ユ Fig.3.ごまつぶ雑商の様fと5%他 -=ロきしちにひZ
かさたなは津
こそとのほ土
けせてねへ洗釧
くずついふ鈴く
ぎしちにひZ
か塞尼な辻士
Fig.1.珊想的な文佛llM像のi腱脛ヒストグラム 騨鍵蕊 雨⑭欝霞町
f(i) 土エ一 印⑪鋤卸 [厩塵]■Z軸J頂頃 超士 士 (b)毎$瀞.
毎$瀞.
司氷十Tl別珊孵昨則
一回』い》吟川跡Ⅱ汕降]剖岼郡小御刊討
泳秘『川峅Ⅲ門川パトトトr愉肺脈窪」,.
、州別川副ⅢMH山Ⅲ釧小斗卦斗外Ⅱ尉門
痢割到Iレトト隅F1卜)・》》小川剛Ⅲ『
》▲・・・低 》エ+》上上客アニ Thid 深度ヒストグラムThid 深度ヒストグラム邦
+ + 、 <d) 、 102,如帥靴mij lゲラF(から5%の面i1E研W【した漣皮【財釦 に) Fig.2.しきい(!〔と5%他との柵1町のil1l1定結IIL Fig.4.測定にIF|いた画像(スケールはそれぞれ異なる) とに逐次二値化処理する手法が述べられているが,水力式 は,この作業を一括して行いえる. 3.動的二値化 提案する手法は,対象Ⅲ像を適切に定めた制約条件に より部分領域に分割し,各領域ごとにしきい値を決める動 的二値化である.この二値化では,必要に応じて画像を分 割するため,しきい値面作成のための計算iiiが少なくてす む.また,濃淡の変動が少ない領域は分割しないため,濃 淡の微細な変動による雑音がほとんどない. 31画像の適応的分割処理 Fig.1のような濃度ヒストグラムで濃度の岐大値を, 771=ノノ(』《')(3) すなわち,規準となる内,を適切に定義し,理想画像ノ においてイ'1関関数ノノをあらかじめ求めることにより,処 理対象の実画像ノiIにおける適切なしきいIi,!(Tハが式(3) により簡単に求まる.次節で求まる」E規介Jljからノノを解析的に求めることも
できるが、今lIjlは,処理jIj象のいくつかのサンプル画像を実測して得られた結采(Fi8.2)から式(4)をノノとして
使用した. Tハーノノ(』。)=0.79.jd-().73(しきい値決定式)(4)j‘は,実画像上でのごまつぶ雑音などの影響(Fig.3)
を考えて,ヒストグラムの分布のうち背景にあたると考えられる部分の端から5%累積した位置の濃度である[l1
Table.lは四つの異なる文字画像から測定により導かれ た係数である.。βは,処理対象の画像の特徴により変 化する係数であるが,文字画像の場合は表より各画像とも 似たような値が算出されているのがわかる. なお,文献[6]では,処理対象の画像を対象物と白紙画 像の今成画像であるとし,対象物を取り出すように画像ご TABLEIしきい値決定式の測定結果 β -0.73 -118 -114 -077 (a)日本語文字 化)新聞記事 (c)工工四楽譜 (。)格子模様琉球大学工学部紀要第54号,1997年 69 ロ:matrixril上er ←Mx-し ノノ(j,川)=''1<lxl'(j)ソ とする.ここでO<ノノ<|としたとき, (5) ↑冒↓
!Ⅲ昨{IlliilIIli二iwl側
を考える.また,。「(i,、ル)=ルールによりクMj形状を,認 織し, (ノ(ルル)>「(ルリ約パラメータ)(7) であるときシェーディングが人として|Ilii像、Miを小鋭域 に分11;Iする. 文字uhi像の場合画像全体に対する文字の割合は,比較的 少い[11よって,分布形状に対する制限は,特に背景領 域にあたるであろう多数を11iめる濃淡レベルのクMiに対し てイj効になる. いま,しきい値処珊に適した分布となるヒストグラムと して,,|i現分布を仮定し,以ドの乎順によ})制約パラメー タ(,lf)を求める(Figl). まず、11{規分布関数, Fig.5.しきい値、の平滑化'㈹=志鰐蝋Ⅲ(-宅竺)側
を考える.ここでノは確lr変数,似はj1A均値,ケコは分 散である.〃(j)=ノノI,(ノノ)(...」)({')=P(4,&))としたとき, jについて股開すると, Fig.6.原画像 この処理により,局所的に急激な変化があるしきい値面 をなだらかに改変する.しきい値面の実際の様子は次節に 'jくす. 4実験 Fig6にCCDカメラで取り込んだ683×512pixeL256 階調の文字画像を,Fig.7にその濃度ヒストグラムを水す. まず,固定しきい値処理(しきい値TA=144:ノWの方法[2]を使用)によってで二値化した結果をFig.8に水
す.シェーディングの影響でカスレやつぶれが出ており, Iii-のしきい値ではうまく二値化できないことがわかる. また,同じ画像を従来の動的二値化(文献[101[13]に 準じた方法)によって生成されたしきい値面(Fig.9)で二 値化した結果をFig.10に示す.画像の端の部分を除けば 良好に二値化できている.ただし,このモジュールでは, 双峰性評価に大津の方法を用い,しきい値算lI1に前述の相 関式を用いたしきい値決定法を使用した. Fig」I及び'2に,Fig.6を本手法によって二値化する際 にi]姓されたしきい値面の様子を.それぞれ平iIザ化前のし きい値面と平滑化後のしきい値iHiでj'Jくす.また,このよう にして得られたしきい値により~己値化した紡采を,Fig.13 に'」くす.単一のしきい値及び従来の動的二|if(化によるしき い値1iiiと比べて,適切なヒストグラムが得られる局所鋭域 を選択したので,生成されたしきい値面はなめらかにな り,うまく二値化できているのがわかる.メーノ』千V2ヶ2'1M;mIP(似))
八(9)のiの+のUXを'1.,-の項をノ,と Iljll約パラメータEは,;M3により獄Ⅱ}される. (9) したとき, ビールーj,(or2.〃)(10)エヒ(8,9)でローO,’ノー{02,05}とし,ヮを変化さ
せたときの制約パラメータfを求める. 我々の笈験では,25611fliiilMの画像において〃=49のと き(,ノ1,(1)=(().2,172),(〃2,『2)=(0.5,1'3)を用いLW な結果が得られた 3.2しきい値面の平滑化 部分頒域ごとに導かれたしきい値からなるしきいI11ilm に対して,雌小の部分領域のサイズを-iii化とした,;lx;) のマトリクスフィルタによる。}z滑化処J1I1をjijう(Fig5). フィルタの‐マスのサイズは、'1i成された厳小の部クMr 形緬域(w/)の大きさ(’三H'三MY’’三V≦jvy)と 群しいものとする.また、i(’三i≦9)番Hのマスに含 まれるlIIIi索のしきい値は、''ハル,、U)とする(Fig5)。マ トリクス内のしきい値の、r均値をマトリクスの11]心7鵬 の新たなしきい値にする。ソルw)=拉加,≦,EMM,≦`ミルバ
ノ=1 (]l)長嶺・山城・安富祖:CCDカメラで取り込んだ文字画像の二値化に関する研究 70 _ ̄ ̄ ̄ ̄ ̄1 20000 石河a』ごロ 10Gmm E■⑩。 0 050100150200250 10-回I Fig.11.しきい値面の様子(平滑化処理なし) Fig.7.濃度ヒスグラム(25(i階調.Tl'=卜14)
Aiiiiii■
Fig.12.しきい値面の様子(平滑化処理あり) Fig.8.固定しきい値処理による二値化(大津の方法使用)mmpleData(サンプルデータ
ABCDEFGHIJKLMNOPQRS
abcdefghijkllnnopqrs
あいうえおかきぐけこ
サシスセソタチツテト
山城研究室画像処理
Fig.13.二値化結果 Fig.9.従来の動的二値化におけるしきい値面の様子 実験結果から,固定しきい値処理でうまく二値化でき い画像が,動的二値化により二値化できた.品質の面で ない画像が,動的二値化により二値化できた.品質の面で は,従来の方法と同程度かそれより良い結果となった. 処理速度は,画像の再生などのオーバーヘッドを含む モジュール全体の処理時間が,動作クロック150MHzの PC上で従来の動的二値化が6秒,本稿の手法が3秒弱, SUNSpark互換WS上での実験でも,それぞオL7秒,4 秒弱であり,本手法は高速であった. 付録として,Fig.14~22にその他の画像を本手法と従 来の手法で二値化した結果を示す. Fig.10.二値化結果琉球大学工学部紀要第54号,1997年 71 5.むすび Lしきい値処理に,相関式を1Nいたしきい値決定法を 11」いた. 2濃度ヒストグラムの分布形状に制限をつけることで, 適応的に画像平lHiを分割した. 3.|Z記の二つの手法の組合せによる動M二Ilii化により, シェーディングのあるサンプル画像が適切に,また高 速に-2値化できた. 4.既存のいくつかの力法との比較により,本手法のイ1. 効性が示せた. 今後は,文献[7],[19]の万法などを参考にし,定量評{llli を行う予定である.
付録
参考文献 [1]長嶺銀河,拳地俊之,山城銑安薗iU忠循,“cc、カメラで取 I)込んだi1hi像の2値化に関する研究",信学校報IE96-21,V⑪1.96, No.11⑥,1996. [2]大津展と.`Ⅲ判別および蝋小2乗恭準に藤づく自動しきい値選定法',、 信学1滴.VoLJ63-D・lVo.`1.]980. [3]谷|]傭・郎,河口英二,‘`r:値画像の複雑さと多値画像の域値処理 に|蜘する巷察",信学論.VoLJ7U-DNo.'‘pp・'64-17`1.1387. トリ塩昭夫.“情蹴中文字の検出のための動的二値化処理法,'・信学論, WlJ71-D・No.5.pp、86:1-873.1,88. [51鳥/に隆,埼瀬洋道,後藤敏付,``蹟小値フィルタを用いた2値化のし きい値選択法,,、信学論D-II,Vol・J72-D-IINo」1,1〕p、1800-1806. 1981). [G1上野祐而’四祷巳,“自動llf用ガラスマークの検査方法'''第21回 画像工学コンフアレンス,lり90. [7]笹Ⅱ|耕一,黒11]伸一,他端重樹ロ英保茂,‘`しきい値決定法の性能 比較評価",信学論,VolJ76-D-nNo」0,pp、2185-2195.1993. [8]後藤敏行,鳥生隆,’輪郭とエッジの一致性評価に基づく濃度しき い値とエッジ検出しきい値の再帰的決定法",信学論D-ILVolJ77-D-II,No.9.pp・'727-1734,199鎧I. [g]佐野睦夫,奥平雅土全j・隙,‘1MISE規準に催づくしきい値決 定法",[血i像電子学会誌,第23巻.第6号,pp706-715,1994 [10]C、K(Ihow,TI〈an1eko,"AlltomaticBoundaryDetectionofthe L⑧ftVclltTiclcfi・omCineall鳶iograms"・ComputGu弼nndBiomed- icalRG門Ga1℃h,5,pp:l8&、''011972. [11]SadakazuWatanabc、TIIECYBESTGROUP,副AnAuto‐ matF(lAppaTatusfbTCml仁eTPTes⑥T笹GnimgI(qYBEST",Com- pn(ICT〔jral>hicsandlmageP】℃cegsing,:1,pP、350-358.197`I. [12]』.S、WeSzka,R(.Nage1,A、RCS⑧n化】。.“AThresholdScIectiom Tc《lmi〔11】の、,JFEET1nns-ComputeT,NC」2,pp」322-1326.1974. [I3IYasuoNakagawa,AzriclRosen化1.,“SomoEmerimentson VariableThr鶴lloldilDg、1,F孔ttGruu研emgmtioll,VoLlI1pp、191- 201,1,79. [ルI]J、M・WI1ite,GDrIolIrer.‘`ImagoThrc属h・ldingbrOpti‐ CaUCharacterRGcognitionaB1dOtluerApp1i厄fLtioBusRequiTing CbaTacteTimageExtraction、IJBMJ・RESDEVELOP,V〔)1.27, No.`1.pp,400-411Ju]yl98il [15]J・NKapnr,PJ(.Sah。。,八.K、C、Won9,“ANewMetbodlk〕r (BTay-IJewlPictbu】reThresho]航11gURi】UgthGE1ut1℃pyo「the Ili月tgram'1,CVGIP,Z91pp.Z73-285,]985. [16]J,Kittle山Lnlingworth."MinimumErro1・Tllresholding",Pat‐ tel・uURecognitio11、VOL19,N0.1,pp、41-`17.1986. [l7ISD、Ya]1(,witz,A・MBruckstein,“ANewMethodfbrlmage ScgmG11taIj0,,,‘CVOIP.‘16,Pp、82-95,1980. [18]⑭iviI,《lDuoTiier,ToTfhmTaxt、“TmpTovemcntof“Inte- gratcdFlm仁tio11AlgoritJ1m,lfbrbiu1al・izatiollofdom1mcntim-ageFi",Patt⑧rl1R“ogllitbionL伯tte1.s:l69pp、277-283.lIj95. [19]Divin「1DueTI・ier、AnilKJajn,“〔loal-Dire(?t、cdEvaluatioI1 nrBil1ariza1.ioI1Metll⑪。日.,JEnFパOL17.m⑪」2.pp」’91-1201, 199(). Fig.14.原画像(668x480pixeL256色)、寵爾冨■…-…
{
》》』準
一
》
》鼬
一
一
8m出 ●歯ユ膝
■姻戚beご』■dユiA:X慨H:霊:畠…………
bchbdBd■山: 。■■■麺丘坤0m鈩鈎■山・■■、b■.‘:{鵜熟礒wWY.w苧…函■
》鰯』
Fig.15.従来の方法による二値化 やⅥ ̄●0 ̄■の ●T⑫IJF■□C”■『■画P■” NDT■80 (、)FⅥ、ロ(l■c脳。』■BPh・”毎石Puc ̄ ̄)mEP3ロ ムー辺…b・芭包町凶暉如掬・■. (2)EqB邨狛ロ■図■beか■ご“■。■、■■鈴bp症 &P■宇凹■睦oBEP■山口`四.埣慰mnCr瞳■■ しTEC&FPli…ぬ■Z…画邑口埠0 ̄。…図也匹B ⑧Tb囮L○・§…し.。。、面bPdGq…-.些呼雪 庖山ebodyof山●■皿低回PL・uU ̄■…■==(i{
い》麺》
』
0m し》
》》》
》
》
●しユ エエlbc-J工凸ユビョLEHq11験蔑:聖`………-
be独bdDdm心 ・■■-可PO ̄廿帥ね。■画b■:HH;&rWh…………
●Dhm鯰面靱L(DBM.PC他■■A-NmCPc暉■ 」一》一一一
J mD1U Fig.16.本手法による二値化長嶺・山城・安富祖:CCDカメラで取り込んだ文字画像の二値化に関する研究 72 Fig.20.原画像(668x480pixel,256色) Fig.17.原画像(312x243pixeL256色) ■■■}●l■■’■■ ̄ ̄