九州大学学術情報リポジトリ

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

デイジタルズケイノジョウホウアッシュクトソノニンシキニカンスルケンキュウ

金子, 照之

神戸芸術工科大学デザイン学部ビジュアルデザイン学科 : 准教授 : 情報工学 : コンピュ-タ・グラフィックス, パターン認識, 画像処理

https://doi.org/10.11501/3110734

出版情報：Kyushu Institute of Design, 1995, 博士（工学）, 課程博士バージョン：

権利関係：

(2)

氏名・本籍（国籍）金子照之（熊本県）

学位の種類博士（工学）

学位記番号甲第4号学位授与の日付平成8年3月18日

学位授与の要件学位規則第4条第Ｉ項該当

学位論文題目ディジタル図形の情報圧縮とその認識に関する研究審査委員会幹事教授瀧山龍三

委員教授長島健次委員教授浦濱喜一論文内容の要旨

計算機の進歩によって、大量のデータを高速に処理できるようになり、様々な分野で計算機は活用されるようになった。画像処理も計算機の進歩によって急速に発展している分野である。画像処理の中でも、画像に関するパターン認識すなわち画像認識は、人工知能とも深く関って、近年益々その応用の範囲が拡がりつつある。実際、産業分野においては、

手書き文字認識、顔画像検出、個人識別、魚種識別、医用画像やプリント基板の自動検査、

3次元情報の自動解析に関する計算機ビジョンなど、画像認識処理は不可欠なものとなっている。

画像認識の中でも、工業部品などの比較的単純な画像の認識は、特に図形認識と呼ばれる。図形認識の際には、図形の輪郭線が認識のための重要な手がかりとなる。輪郭線には、

認識に有用な多くの情報が含まれているからである。さらに輪郭線を用いれば、2次元の画像情報をそのまま処理するよりもはるかに少ない処理データを扱うだけで済むという利点もある。しかしながら多くの場合、この輪郭線データは、これにもとづく様々な計算を容易にするために、更に圧縮されることが望ましい。しかも、輪郭線による図形認識システムを構築するためには、この圧縮された輪郭線データを用いて、互いに相似な曲線の認識、

つまり、シフト、スケーリング、回転に不変な曲線の認識法を確立しておく必要がある。

本論文は、上述のディジタル図形の情報圧縮とその認識に関する研究をまとめたものであり、5章から構成されている。

第1章は序論であり、本論文で扱っている問題の概要と論文の構成について述べている。

第 2 章では、ディジタル曲線の認識のための特徴抽出における従来法を概説し、それらの方法における問題点を示す。ここでは従来法として、フーリエ記述子、モーメント不変量、及びＣＳＳ（曲率尺度空間）を用いる 3 種類の方法を代表として取り上げている。フーリエ記述子とモーメント不変量とは、曲線認識の際にしばしば用いられている特徴量であるが、形の異なる曲線であっても、それらの値が同じになることがある。また、モーメント不変量は標本化誤差の影響を受け易い。一方、ＣＳＳ法では、曲線を平滑化の程度を種々換えて平滑化し、それぞれの平滑化された曲線から変曲点を抽出するので多くの時間を要し、更に抽出された特徴量の比較も難しい。また、これら従来法はいずれも単連結曲

(3)

線のみを扱っており、複数個の曲線を同時に処理することは困難である。これらの方法では、図形を構成する点列の順序に関する情報が必要であるが、これは一般に与えられないからである。更にこれら従来法では、特徴抽出のための入カデータとして多数の点を必要とするので、冗長な情報を含みやすい。従って、効率的なデータ表現の観点から、少数個の特徴点によって輪郭線を記述するのが望ましい。

第 3 章では、ディジタル曲線から特徴点を抽出するための従来の方法を概説し、それらの問題点を示すと共に一つの方法を提案する。一般に特徴点としては曲率関数の極値点や変曲点が用いられる。ディジタル曲線の曲率は、注目画素とその前後の近傍画素とを結ぶ2 直線の成す角度として定義される。ところが、与えられたディジタル曲線から直接曲率を求めると、雑音や曲線抽出の誤差を受け易い。そこで、本論文では再アナログ平滑化という新しい概念を導入して、ディジタル曲線を平滑化し、それによって得られる滑らかな曲率関数によって特徴点を抽出する方法を提案する。この方法においては、ディジタル曲線の平滑化のために、各輪郭点の座標（整数値）を、その点とある近傍点とに挟まれる輪郭点列の座標の平均値（実数値）によって置き換える。

その際の近傍点は、ディジタル曲線を構成する全画素数を考慮に入れて決めている。このようにして平滑化したディジタル曲線の曲率を測ることによって、特徴点の抽出に適した滑らかな曲率関数が得られる。この曲率関数を用いて変曲点を抽出し、さらに変曲点に挟まれた区間で曲率が最も大きな点を極値点として抽出する。この方法を用いると、互いに相似なディジタル曲線から同じ個数の特徴点を安定して抽出できることを実験例によって示す。

第4章では、特徴点の座標値のみを入力情報とするディジタル曲線の認識法を提案する。

ここで提案する方法は、代数方程式を利用して、与えられた特徴点から曲線の特徴量を求めるものである。ディジタル曲線の特徴点を複素平面上の点集合とみなすと、この点集合を解に持つ代数方程式が 1 つ定まる。この方程式をある処理にもとづいて正規化すると、

互いに相似な図形は同じ係数を持つ方程式で表現することができる。また逆に、同じ係数を持つ方程式で表現される図形は互いに相似である。従って、提案している方法は、シフト、スケーリング、回転変換に対して不変な図形認識に用いることができる。また、代数方程式は点集合の順序に依存しないので、従来法で扱うことが困難な 2 重図形等の複数の曲線の同時処理にも適用できる。さらに、提案している方法による図形の具体的な認識法について述べ、種々の実験結果を示す。

第5章では、結論を述べ、今後の課題について論じる。

論文審査の結果の要旨

画像認識技術は近年様々な分野において、その応用の拡がりを見せているが、まだ解決すべき問題も多い。画像認識の中では、比較的単純であるとされる図形認識に限っても、

克服すべき課題は多いが、種々の利用技術面からの期待は大きい。図形認識は、適切な前処理が行われた後には、線図形の処理・認識に帰着される場合が多い。本論文は、ディジ

(4)

タル図形認識における上述の処理・認識を、効率的に実行する方法を研究した結果をまとめたものである。すなわち、この分野でのこれまでの研究結果を調査すると共に、ディジタル線図形の情報圧縮法を提案し、その圧縮された情報のみを用いて線図形を認識する新しい方法を更に提案している。

第1章においては、問題の背景と意味及び論文の目的とを明かにしている。

第 2 章においては、ディジタル曲線の記述法として、しばしば用いられている、フーリエ記述子、モーメント法、曲率尺度空間法を概説し、これらの方法における問題点を具体的な実験を通して示している。更に特徴点によるディジタル曲線記述について述べ、これの望ましい性質と、特徴点に基づく図形認識の方法の望ましい性質とを整理して述べている。

第 3 章においては、ディジタル曲線から特徴点を抽出する際、従来用いられている方法の問題点を前章の考察をもとに明らかにしている。更にこの上に立って、新しい特徴点の抽出法として再アナログ平滑化法を考案し、この方法が従来用いられてきた諸方法に比べて、より安定して特徴点を抽出できることを豊富な実験を行って実証している。そこでは特に互いに相似な図形からは同じ個数の特徴点が、互いに相似な関係をもって抽出されることが示されていて興味深い。

第4章においては、前章の方法で抽出された特徴点のみを用いた曲線の認識法を考案し、

複素代数方程式を用いる独自の手法を提案している。この方法は、ディジタル曲線の特徴点を複素平面上の点集合とみなすと、そのような点集合を解に持つ代数方程式が 1 つ定まるということに着目して、点集合を代数方程式の係数集合に一旦変換する。この係数集合を適当な処理にもとづいて正規化すると、互いに相似な図形（点集合）は同じ係数で表現され、この逆も又成り立つ。このことを利用して本論文ではシフト、スケーリング、回転に対して不変な図形認識を行うことが出来ることを明確に示している。この方法によれば、

従来の方法では取り扱いの極めて難しい 2 重図形なども、容易に処理出来ることも示されている。更に本章では、第 3 章で提案されている特徴点抽出法と、本章での認識法とを統合した実験を多くの場合について実行し、極めて良好な結果が得られたことを具体的かつ合理的に示している。

最後に第 5 章では、本論文のむすびとしての結論を述べ、今後の課題について論じている。なお本論文の第 2章から第4 章までの各章の末尾には、それぞれに関連するプログラムを付録として掲げ、関係研究者への利便を図っている。

以上要するに、著者の研究はディジタル図形認識のために解決すべき問題のうち重要な2 つ、すなわち線図形の情報圧縮法とそれにもとづく不変認識法を提案し、その有効性を実証したものであり、実用的な見地からも画像工学上寄与するところが大きい。よって本論文は博士（工学）の学位論文に価するものであると認められる。最終試験の結果の要旨本論文の全般にわたって著者の説明を受けた後、審査委員が口頭により試問を行った。

すなわち(1)再アナログ平滑化の理論的意味、(2)情報圧縮の程度と処理時間との関係、(3)

(5)

代数方程式の係数の正規化における計算誤差の影響、(4)認識実験の結果の一般性、(5)今後残された問題、などについて質問があり、何れに対しても明快な回答が得られた。

次の本論文についで情報伝達専攻主催の公開発表会が開かれ、本学関係研究室、他大学及び地元企業等から多数の出席者があった。著者の発表の後の討議では、既存の方法と著者の考案した方法の性能上の違い、実験データの処理法、情報圧縮の意味、適用可能の範囲などについて活発な質問がなされ、著者の説明によっていずれに対しても十分な理解が得られた。以上の結果から、著者は最終試験に合格したものと認めた。

(6)

(7)

(8)

(9)

(10)

(11)

(12)

(13)

(14)

(15)

(16)

(17)

(18)

(19)

(20)

(21)

(22)

(23)

(24)

(25)

(26)

(27)

(28)

(29)

(30)

(31)

(32)

(33)

(34)

(35)

(36)

(37)

(38)

(39)

(40)

(41)

(42)

(43)

(44)

(45)

(46)

(47)

(48)

(49)

(50)

(51)

(52)

(53)

(54)

(55)

(56)

(57)

(58)

(59)

(60)

(61)

(62)

(63)

(64)

(65)

(66)

(67)

(68)

(69)

(70)

(71)

(72)

(73)

(74)

(75)

(76)

(77)

(78)

(79)

(80)

(81)

(82)

(83)

(84)

(85)

(86)

(87)

(88)

(89)

(90)

(91)

(92)

(93)

(94)

(95)

(96)

(97)

(98)

(99)

(100)

(101)

(102)

(103)

(104)

(105)

(106)

(107)

(108)

(109)

(110)

(111)

(112)

(113)

(114)

(115)

(116)

(117)

(118)

(119)

(120)

(121)

(122)

(123)

(124)

(125)

(126)

(127)

(128)

(129)

(130)

(131)

(132)

(133)

(134)

(135)

(136)

(137)

(138)

(139)

(140)

(141)

(142)

(143)

(144)

(145)

(146)

九州大学学術情報リポジトリ