• 検索結果がありません。

シェーディングのある文字画像の二値化に関する研究: University of the Ryukyus Repository

N/A
N/A
Protected

Academic year: 2021

シェア "シェーディングのある文字画像の二値化に関する研究: University of the Ryukyus Repository"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

Title

シェーディングのある文字画像の二値化に関する研究

Author(s)

除川, 幸子; 山城, 毅

Citation

琉球大学工学部紀要(57): 41-45

Issue Date

1999-03

URL

http://hdl.handle.net/20.500.12000/1470

Rights

(2)

琉球大学工学部紀要第57号,1999年 41

シェーデイングのある文字画像の二値化に関する研究

除川幸子*山城毅*

AStudyofBinarizationMethodfbrCharacterlmagewithShading

SachikoYoKEGAwA*TsuyoshiYAMAsHIRo*

Abstract BinarizationofChara心terlmageslsveryimportantpreprocessingfbrchar江terrecoginitionsystem・And toreduceprocessingtimeisveryimportant・Ourstudyishowtobinarizechar巫teriInageswhichwCre takenwithCCDcameraCCDcamerahassomeadvantagesofsuchasitsimputareaisfreeanda』soinput speedisfast・Butasweakpoint,ithasshadingfbrbadlightmgconditions・Therefbre,wCstudiedhowto Binarizecharacterimageswithshading・Wedecidedthethresholdbysegmentatethereglonandbythe proposedsimplemethodprocesstimewasreduce。 KeyWOrdS:threshold,binamzationshading,segmentation,CCDcamera,characterimage 1.まえがき 近年,様々なデジタル画像入力機器の発達により一般に 本研究では,文字認識等において以後のデータ量を減ら し扱いを簡単にするための重要な前処理である二値化につ いて検討した.一般的に取り込まれた画像は照明ムラ等に よりシェーディングが発生するために,固定しきい値決定

法[11や自動しきい値決定法[2]を用いて決定された単一

しきい値を用いて二値化するとうまくいかない.そのよう

な場合には,部分画像分割法[2]のように画像をいくつか

の領域に分割[4][6]した後に領域ごとにしきい値を決定し

動的に二値化を行うことになる.しかし,手続きは複雑に なり,それに伴い処理時間も増加する傾向にある.

本手法[7]は,画像全体の濃淡差が一様ではないシェー

ディングのある文字画像を領域分割し二値化を行ってい る.シェーディングの影響は,画像を分割することで緩和 できる.しかし,画像をすべて同じ大きさに領域分割した 場合には,領域によっては濃淡の変化が顕著なためにさら に分割した方が良い部分と,分割しすぎているために処理 時間が必要以上にかかってしまう部分ができてしまう場合 がある.そこで,画像をあらかじめ2x2に分割しそれぞ れの場所で分割数を決定して処理を行う.本研究では,よ り簡単な汎用性のある処理を行い処理時間を短縮すること を目的としている. 広く画像を扱う機会が増えている.特に,ホームピデオや イメージ・スキャナ,またデジタルカメラ等の手軽で自由 度の高い製品の利用分野や活用法は多岐にわたる.この ような状況のもと画像処理は重要な役割を持つと考えら れる. 一言に画像処理と言っても様々な分野があるが,パター ン認識等で最も基本的でありかつ重要な前処理として二値 化がある.二値化とは,濃淡画像を対象領域と背景領域と に分離する処理であり,あるしきい値によりoと1のバイ ナリパターンに変換する操作である.その際,適切なしき い値を設定することが重要である.対象領域と背景領域の 濃度値が既知の場合には経験的に固定しきい値を設定する

ことは有効である[11が,実際には微妙な濃淡の変化があ

るのでしきい値を安定に求めるために自動しきい値決定

法が提案されている[21.自動しきい値決定法にはpタイ

ル法,大津の方法[31,KittIerの方法,ラプラシアンヒス

トグラム法,微分ヒストグラム法等がある.また,シェー ディングにより背景の濃淡レベルが変動している場合には 各画素ごとにしきい値を変える,移動平均法や部分画像分

割法等の動的しきい値決定法が用いられている[21.この

ような方法を用いた二値化の研究は現在までにほぼ一段落 した感があり,多くの方法が実用段階で利用されている.

しかし,その中には膨大な計算量を必要とするもの[41や,

計算量は少ないものの良好とは言えない結果を得ているも

のがある[51.また,文字認識の分野において種々の条件

下で二値化を論じているものは少ない[6}

2.処理の概要 処理の概要をFig.1に示す. ・本手法では,まず画像を2x2に分割しそれぞれの領域 の濃淡分布によりシェーディングの影響を調べ再分割を行 う.その後,それぞれの領域でしきい値決定用の小領域を 抽出し,その範囲でしきい値を決定し二値化処理を施す. 受理:1998年12月1日 平成10年度電気関係学会九州支部連合大会にて発表済み ・工学部電気電子工学科 (Dept・ofElectricalandElectronicEngineering,F泡c,ofEng.)

(3)

42 除川・山城:シェーデイングのある文字画像の二値化に関する研究 START 08642086420000000000 JJj0JJ 2ll1ll 拐○E①□の桾閨 greylevel Fig.3.シニーデイングのある文字面161の濃度ヒストグラム background Character 曾目①ワの輯 0 graylevel Fig、4.双峰l生の濃度ヒストグラム niTwn面巫 ?UPI…・躍駆」P・… ̄~。、座wL烈月懇・↓・ 繩球入学1頁:灘'1鐘fiiir霞卜 嘉.. T学科ABCD願(JJJIJK DVWXY脇溌.14%談、餅雰’ミ めいうえ萬緯か悪iLJ・ボー職.:f カタカナゲチツヂ:、 i球大学工学部電気電r 二学科ABCDEFGHnK VWXYZ漢字ひらがな 〕いうえおかさしすせそ Iタカナタチツテト Fig.1.処理の概要 シエーディングとその影響 3. シェーディングとは,照明ムラにより発生し画像中の濃淡

差のために明るさが一様でない状態のことである.Fig.2.1

にシェーディングのある文字画像示す.このような文字画 像を一様に二値化すると,Fig.2.2のようにつぶれやかす

れがみられる.Fig.2.1を濃度ヒストグラムで表すとFig3

のように濃度分布の幅が広くなり,文字部分と背景領域を 区別することが困難なために起こる.もし,濃度ヒストグ ラムがFig,4のように双峰性の文字画像であれば,文字部 分と背景領域とに区別できる.Fig.5.1のようなシェーデ ングのない理想的な画像の濃度ヒストグラムは,谷が顕著

になりその谷をしきい値とすれば,Fig.5.2のように良好

な二値化結果が得られる[11[4}

Fig.5.1.シェーデイングのないFig.5.2.シェーデイングのない 文字画像文字面{iRの二個上 4.画像の分割 4.1領域分割 本手法では,シェーディングの影響を緩和するために 画像の分割を試みた.画像を2×2分割することにより,

Fig.3の濃度ヒストグラムはFig.6(a)から(。)のように

なる.分割後の濃度ヒストグラムから濃淡分布の幅が狭 くなっており,文字部分と背景領域は分割前より判りやす くなっていることが解る.これは,分割により小領域での シェーディングの影響が少なくなり,それぞれの濃度の幅

が狭くなっているためであると考えられる.Fig.2.1の画

像を2x2に分割した後にFig.7.2に示すしきい値により 二値化したものをFig.7.1に示す. Fig.2.2の結果より良好な結果が得られていることが判 る.このように,画像を小領域に分割すればシェーディン

グの影響を少なくできる.領域分割の設定をFig.8に示す.

ただし,x1,x2,yl,y2は式(1)から式(4)で求めた.

Fig02.1.シエーデイングのある 文字画像 Fig.2.2.シエーデイングのある文字画像の二値化

(4)

琉球大学工学部紀要第57号,1999年 43 。.O〕浬梯 250 ZOO

;15.

且'00 50 0 4.2小領域 本手法では,処理速度の短縮のためにしきい値決定領域 として小領域を設けた.小領域は,Fig8のように領域分 割後のX軸,Y軸をさらに二分の-にしているため処理 速度を向上させることができる. 小領域を採用することにより,しきい値決定の情報は減 少するがFig.9の処理結果より全領域の場合と比較して もこ値化結果に大きな差異はみられない.これは,領域分 割により分割された領域がさほど大きくないために背景領 域の濃度には考慮するほどの影響が与えられないためと思 われる. 050100150200250 厘BylWd (b)(1,0) (a)(0,0) ユ.】〕磨伍 (0.1)蝋初 332211 冑]【■■U山 叩皿汕汕、0 群】5戸田山 0 50 1001502m25 睡白yleVd ロ泊yleTeU に)(0,1)(。)(1,1) Fig.6.画像分割後の濃度ヒストグラム Fig.9.1(a) Fig.7.1.領域分割後の二個上Fig.7.2.領域分割後のしきい値 Fig.9.2.(b)しきい値(小領域)Fig.9.3.(c)しきい値(全領域) nt

墨;I妻;;鱒;蕊1,

:簔欝欝鰯

あし錨うえおかさしすせji

錘タカナタチツテ] Fig.9.2.(b)二in[化(小領域)Fig.9.2.(c)二値化(全傾城) Fig.9.小領域と全領域との比較 Height (a)rCgionscgmcntation (b)■:th1℃sholddccision Fig、8.領域分割としきい値決定領域 5.しきい値決定

しきい値の決定は,長嶺ら[81が求めたしきい値式

肺雌峨峨 99dd ・2・2・8’8

匪匪WWK

xxx× へ 1 3131

lKlKlKlKl-

。』 ・2x・Ox・jx・jx, x4x4x4x4K 4444 へ 1 一一 一一 一一 一一 一一 1212i yyz皿 Tb=αxKd-β(5)

(α=105,β=-37.53)

を用いた. ,通常,文字部分は黒画素に近い濃度域に存在すると考え られるので,二値化を行う際のしきい値決定には背景領域 の濃度値の代表が解れば良い文字画像を形成する画素の 約80%は背景にあたり,Fig.1Oのように濃度ヒストグラ ムの右端の濃度値を画面上の背景の濃淡を特徴づける基 準値をKdとして設定した.ただし,実画面上でのゴマ塩 1111 1234 1Iくく 60 00 50 00 50 00 50 0 050】00150200露0 今Ⅱ ■ ◆ ■ ワdo■■山。■●■■■d0q□ C ● ●■ ■ ■■ 心』 け ●

IIい

。 ①g■ マリOUJ00U0①550中へ.□、 ……!……・{……} ……i……十……| ……i…-1-…1 -…i……・》……i

b[…!……!……!

--1 ■d・尹与pいい□いい■酢 。

■d・尹与pいい□いい■酢

■d・尹与pいい□いい■酢

腰:!

(5)

44 除川・山城:シェーデイングのある文字画像の二値化に関する研究 雑音などによる変動を防ぐために,この端の濃度値から5 %累積した位置の濃度をKdとした. FIL Width Width 血 p(i) background

:jlM1

-8--Width

■:5%

nonze H雫ht KdL (a) (b)

11,麺J:(!:掴i鵯、

Fig.12 分割数の自動決定法 画像を分割するには,まず画像のシェーディングの状況 を知る必要がある.このため,全領域中に分散した9つの 小領域の濃淡分布によりシェーデイングの程度を調べる.

しきい値を求める9つの領域はFigl2の1から9の小

領域であり,その小領域より得られたしきい値を比較する ことにより分割数を決定した.また,処理速度の短縮のた めにしきい値を決定する際に,1ピクセルおきに濃度をみ ている. 比較は,

.X軸方向がO~弩竺,Y軸方向がO~』Z響些のとき

1と21と4,1と5,2と4 definedgraylevel Fig、10.背景領域の濃度値の代表Kd 6.分割数の自動決定 固定した分割数で領域分割し処理を行うと,必要以上 に分割されているために処理時間を余計に要している領 域と,まだ濃淡差が大きいためにさらに分割をしなければ いけない領域ができてしまう.そこで,あらかじめ画像を 2x2分割し,それぞれの範囲内で濃度分布の状態を調べ 分割数を決定する. 6.1分割数の決定法 処理の流れをFigllに示す.

.X軸方向が弩竺~Wjdt九Y軸方向がO~竺學型の

とき 2と3,3と6,3と5,2と6 ST Extractionof ThreBhO1dDeBionArea

.X軸方向がO~箪樂,Y軸方向が些響1~Hejghtの

とき 7と8,4と7,4と8,5と7 mpuLClmmcterlmage Segmentatiom(2x2) PC=O; KIPol:=O; SeL:=O・ Ph:=26 1,c(P。; PC:1bo4

.X軸方向が些樂~WMth,Y軸方向が響些~

Hej9htのとき 8と9,6と9,5と9,6と8 AutomaLicanydeci8ion ofSGgmentnumbeT nPb]

“`×(i鰍,GxPm

HBightx(2+ix7yu6xPi のそれぞれのしきい値の差を求めて行った.ただし,数

値はFig.12.(a)の値を示す.しきい値の差はシエーデイ

ングの大小に関係するので,差が最大のときの値を分割数 の決定に用いた. 差と分割数の設定はIable、1に示す. Ima駅Segmentation (nPbIXX【POI)

W、`hX(』鞠,oXpln;、

_Hidthx(2+jx7y(l6xpi 上:=O; TYreBholdTh[t]:=O; Inc(DB=。; TYnr巴BhddDecb且icn

T1l(Sc上。  ̄Inc(、;へt:=ltoX[Pb]xIqPb] TEblel・分割数の設定

四河回用臣罰巴ロ四

回■掴■■■■■■

nreBholdD⑨cigmn Th化) 6.2二値化結果

自動分割を用いた結果をFig13.1~Figla3に示す.

画像をあらかじめ4分割し、そのあとでそれぞれの範囲 でしきい値の差により再分割数を決定する方法を用いたこ とで高速で良好な二値化結果が得られていることが判る. COmpmiBonofnr巴⑧hold Fig.11.自動分割数決定のフローチャート

しきい値 の差 ~40 ~8040 80 ~120 120 ~160 160 ~200 200~ 分割数 2 3 4 5 6 7 rV L」

(6)

琉球大学工学部紀要第57号,1999年 45 7.まとめ 画像をあらかじめ4分割しそれぞれの領域の濃淡差によ り分割数を決定することで,固定した分割数で一様に二値 化するよりも格段に良好な二値化結果が得られた.また, しきい値を求める範囲を分割中の小領域に限ったことや, 領域内において1ピクセルごとに画素濃度をみたことで処 理時間の短縮ができた. 今後は,領域間の補間について検討し精度を向上させる 予定である.また,汎用性を持たせるために入力画像の大 きさによる分割数の設定変更や,分割数による小領域の大 きさの割合を変化させることを検討したい. Fig.13.1.自動分劉数決定法に用いた原画像 参考文献 I11尾上守夫: “画像処理ハンドブック''’昭晃堂,pp、278-280,1989. [21高木幹雄,下田陽久: ‘`画像解析ハンドブック,,,東京大学出版会,pp、502-505,1991. 131大津展之: “判別および最小基準に基づく自動しきい値週定法",侭学鈴, VOLJ63-D,No.4,pp、349-356,1980. 14]谷ロ偽一郎,河口英二: “二値画像の複雑さと多値画像の閾値処理に関する考察",憎学鶴, VblJ70-D0No,1,pp、164-173,1987. l51笹川耕一,黒田伸一,池蝋重樹: j"平均隣接数に着目したしきい値決定法'',憎学論,Vb1.J73. ,,N0.3,pp360.366,1990. l61HK昭夫: “情景中文字検出のための動的二値化処理醤,信学論,VbLJ71‐ D,No50pp、863-873,1988. 17]除川幸子,山城毅: “シェーディングのある文字画bitの二値化に関する研究",平成10年 度尅気関係学会九州支部連合大会講演輪文集,No.433,p213,1998. 18l長嶺銀河,山城毅,安富祖忠侭: “CCDカメラで取り込んだ文字画像の二値化に関する研究",琉球 大学工学部紀要第54号,1997年,pp67-72. 1h分ね操岸制

**Sample---Nm**

琉球大学工学部電気電子

工学科ABCDHFGHmK

OVWXYZ漢字ひらが歯

あいうえおかざしすせ詔

カーターカナタチツテI

Fig.13.3.自動分割数決定法による二値化

参照

関連したドキュメント

外声の前述した譜諺的なパセージをより効果的 に表出せんがための考えによるものと解釈でき

  「教育とは,発達しつつある個人のなかに  主観的な文化を展開させようとする文化活動

1 月13日の試料に見られた,高い ΣDP の濃度及び低い f anti 値に対 し LRAT が関与しているのかどうかは不明である。北米と中国で生 産される DP の

Instagram 等 Flickr 以外にも多くの画像共有サイトがあるにも 関わらず, Flickr を利用する研究が多いことには, 大きく分けて 2

第二期アポーハ論研究の金字塔と呼ぶべき服部 1973–75 を乗り越えるにあたって筆者が 依拠するのは次の三つの道具である. Pind 2009

「海洋の管理」を主たる目的として、海洋に関する人間の活動を律する原則へ転換したと

LF/HF の変化である。本研究で はキャンプの日数が経過するほど 快眠度指数が上昇し、1日目と4 日目を比較すると 9.3 点の差があ った。

「TEDx」は、「広める価値のあるアイディアを共有する場」として、情報価値に対するリテラシーの高 い市民から高い評価を得ている、米国