早稲田大学大学院国際情報通信研究科
博 士 論 文 概 要
論 文 題 目
ベクタ化による人工画像の 高能率符号化
Efficient Coding of Artificial Still Images by Vectorization
申 請 者
河村 圭
Kei KAWAMURA
国際情報通信学専攻
オーディオビジュアル情報生成技術の研究Ⅱ
2 0 1 3 年 2 月
電子ペーパ(ePaper)や高精細液晶ディスプレイ(LCD)の実用化によって,電子書籍 のための読書端末が世界中で使われることが予想される.電子ペーパは消費電力が著しく 少ないが4階調や16階調のグレースケールで170ppiから200ppi程度と高解像度である.
液晶ディスプレイは消費電力は多いが24bit カラーで270ppi から300ppi程度とさらに高 解像度である.このように読書端末では複数種類の解像度が広く利用されている.
解像度の異なる高精細出力装置が登場すると,電子書籍や電子コミックを閲覧端末の解 像度に適応させる必要がある.文字は様々な解像度に対するフォントが整備されているが,
文字以外の要素を含むコミックは解像度変換が必須である.単純な解像度変換はアーティ ファクトの発生によって電子コミックの画像品質を低下させる.従って,電子コミックを 効率よく蓄積・配信するためには,高い圧縮率(高能率符号化)だけでなく,解像度変換 の容易性という性質が重要である.
端末が持つ出力装置の特性に合わせた表示が可能な画像表現方式として,ベクタ表現が ある.例えば,アウトラインフォントといわれるベクタ表現に基づくフォントを利用する と,拡大してもジャギーノイズが発生せず,さらにPCディスプレイのような低解像度な出 力装置(例えば 72ppi)とプリンタのような高解像度な出力装置(例えば 600dpi)の両方 に対応できる.したがって,ベクタ表現のコンテンツ需要が今後増大していくと考えられ る.
既存のコンテンツは大部分がラスタ表現で制作・蓄積・配信されている.一方で,ベク タ表現のコンテンツは,制作可能なクリエイタが少ない.そこで,既存のラスタ表現コン テンツを自動的にベクタ表現に変換する技術が求められている.このような技術を活用す ると,紙面をスキャナやディジタルカメラによりラスタ表現コンテンツとして取得(ディ ジタル化)した後に,ベクタ表現へ変換できる.すなわち既存コンテンツをベクタ表現の コンテンツとして活用可能となる.
本論文では,コミックを代表とする紙面を含む既存の人工画像を対象に,ベクタ表現へ 変換するベクタ化を中核とした高能率符号化方式の具現化について考察する.すなわち,2 値画像やグレースケール画像を対象にベクタ表現に適した成分に分離,分解する画像のモ デル化を検討する.さらに,発生符号量の大きなベジエ曲線の座標情報を対象に,符号量 制御の実現方法を明らかにする.ベクタ表現の主たる対象となる平面曲線について,スケ ール不変特徴量を提案する.これを用いてベクタ変換の編集性を評価する.また,コミッ ク画像には,セリフなどの文字やコマレイアウトなど利用価値の高いメタデータが存在し ている.これを自動取得する手法を検討する.
以下,各章ごとの概要を述べる.
第1章「序論」では,本研究の背景と目的,研究の概要について述べる.
第 2 章「ベクタ変換技術と画像表現方式」では,本論文で前提とする以下の技術につい て整理し,問題点を明らかにする.まず,ベクタ化に関連してベクタ表現の種類や標準的 なファイルフォーマットに述べる.また,既存のベクタ変換方式やベクタ表現の基本ツー ルであるベジエ曲線について,編集のしやすさ(編集性)を明確にし,既存方式では編集 しにくいことを述べる.次に,ベクタ化による高能率符号化を実現する上で障害となる網 点についてまとめ,高解像度2値画像からは原理的に抽出できないという課題をまとめる.
また,低解像度グレースケールの画像に起因する問題を述べる.ベクタ化の対象を 2 値画 像などから一般的なグレースケール,またはカラー画像に広げる手法を述べ,全変動最小 化フレームワークにおける従来手法は離散化が不十分であり,反復処理の計算コストが高 いという課題を述べる.ベクタ化により得られるベクタ表現(ベジエ曲線)の編集性を評 価するため,平面曲線の特徴量である曲率についてまとめ,開曲線(輪郭素片)には適用 できない課題を述べる.符号化の結果得られるビットストリームの利用価値を向上させる ため,本論文における人工画像の代表例であるコミック画像を対象として抽出可能なメタ データを説明する.
第3章「網点分離による画像分解方式」では,高解像度 2値画像,もしくは本来2値画 像である印刷物をスキャンして電子化した低解像度グレースケール画像を対象として,網 点を含む画像を効率良くベクタ化する方式を提案する.
まず,網点手法が解像度変換にともなうアーティファクト発生の原因であることを示す.
高解像度 2 値画像において輝度変化の周期を取得する方法を提案する.また,これを用い て網点領域を分離し,元の濃淡階調を復元して線形勾配で近似する手法を提案する.
次に,低解像度グレースケール画像において,網点を分離する手法と精度の高い線画を 生成する手法を提案する.前者について,2値画像向けの提案手法とグレースケール画像向 けの従来手法を,網点中心を取得するという観点で統合する.後者について,高解像度化 と2値化手法におけるパラメータを最適化する.
最後に,提案手法の有効性を示すために,網点の分離特性,網点の検出濃度の精度,モ アレ低減の検証,2値・多値画像からの網点中心の検出,高解像度2値化手法について,評 価実験を行う.
第 4 章「線形勾配成分の抽出方式」では,グレースケール画像やカラー画像に対象を拡 張し,ベクタ化による高能率符号化を実現するための画像モデルを提案する.入力画像を,
ベクタ表現可能な線形勾配(グラデーション)領域・成分と,残差であるテクスチャ成分 に分離する
本モデルに対応した線形勾配成分の領域を取得するため,全変動最小化フレームワーク を適用する.本研究では,数値計算に必要な離散化の改善手法と反復処理が容易な計算モ デルを提案する.また,計算コストの大きな除算,乗算の回数を削減し,収束速度の高い パラメータ設定により,従来手法と同等の分離性能を維持したまま,計算時間を大幅に削 減する.
最後に,提案手法の有効性を示すために,全変動最小化の高速計算手法の性能,線形勾 配領域の抽出量,グラデーションメッシュによる符号化について,評価実験を行う.
第 5 章「曲線の不変特徴量と編集性」では,人工画像のベクタ化対象の中核となる平面 曲線(線画)に着目する.まず,平面曲線におけるスケール不変特徴量を整理し,特徴点 の探索が必要なことや開曲線(輪郭素片)には適用できないという問題点を明らかにする.
次に,SIFTアルゴリズムのアナロジーとして前記問題点を解消する不変特徴量を提案す る.そして,この特徴量を用いて曲線の頂点を定義し,ベジエ曲線の編集性を定量的に評 価する方法を示す.また,この評価方式を用いて,これまで提案している最適多角形の辺
を曲線で置換するという,ベクタ変換を評価する.
最後に,提案手法の有効性を示すために,スケール不変性の安定性と頑健性,特徴点の 位置特性,曲率と曲線の頂点,ベクタ変換の編集性について,評価実験を行う.
第 6 章「コミック画像からのメタデータ抽出方式」では,高能率符号化により得られた ビットストリームの活用を促進するため,人工画像の代表例であるコミック画像からメタ データの抽出手法を述べる.具体的には文字とコマ配置を対象とする.
まず,コミック画像からの文字の切出しは,線画やテクスチャが混在しており,さらに 文書と異なり文字数も少ないという困難性がある.そこで,文字と文字列の特徴のみを用 いて切出す手法を提案する.次に,コマ配置の取得には,コミック画像を再帰的に 2 分割 してコマに分割し,さらに高速に探索する手法を提案する.最後に,文字切出しの再現率,
コマ分割精度,コマ分割処理時間について,評価実験を行う.
第 7 章「コミック画像符号化」では,本論文の提案手法に基づくコミック画像符号化の フレームワークを述べる.コミック画像は効率的な画像符号化のために網点と線画,テク スチャへ分離する.また,符号化の一機能としてレート制御手法が必須である.曲線統合 に基づくアンカ点の削減と座標精度の量子化によるレート制御手法を提案する.提案した フレームワークはレート歪み特性の観点で,JBIG方式やその関連方式などの従来手法より も効率的である.また,提案したフレームワークは既存のベクタファイル形式を用いて大 きな液晶ディスプレイを搭載する一般的なPDA上で実現できることを示す.
第8章「結論」では,本論文で得られた成果を総括し,結論を述べる.
以上のように本論文では,取得が容易なラスタ表現の画像コンテンツを自動的にベクタ 表現に変換し,高能率符号化を具現化する手法について論じる.すなわち,既存の蓄積コ ンテンツを将来の高精細出力装置での鑑賞に堪えうる品質に,低コストかつ自動で変換可 能であることを示す.また,得られたベクタ表現は編集が容易であるため,修正が必要な 場合にも作業者の負荷を大幅に低減できる.コミック画像においてはメタデータとして文 字情報を抽出しているため,画像に含まれるキーワードによって画像を検索できる.本論 文で検討したベクタ化はコミック画像だけでなく,一般的な自然画像にも拡張できること を示し,さらなる発展の余地があることも示す.