早稲田大学大学院国際情報通信研究科
博士論文審査報告書
論 文 題 目
ベクタ化による人工画像の 高能率符号化
Efficient Coding of Artificial Still Images by Vectorization
申 請 者
河村 圭
Kei KAWAMURA
国際情報通信学専攻
オーディオビジュアル情報生成技術の研究Ⅱ
2013年 2 月 氏 名
コース・プロジェクト名 (課程内のみ)
近年,高精細ディスプレイを搭載する電子端末は書籍や文書などを閲覧するためのツール として急速に普及しつつある.これらの端末は電子書籍や電子コミックなどのコンテンツ需 要を増加させている.上記の閲覧端末に搭載された電子ペーパは,170~200dpi 程度と解像 度が高く,電源を切っても表示内容が保存され,消費電力が少ないという利点を持つ.しか しながら,階調特性は4 階調や16 階調のグレースケールである.一方,タブレット端末に 搭載された液晶パネルは,250~300ppi 程度と電子ペーパよりも解像度が高く,滑らかな階 調表現やカラー表現が可能である.
このように解像度の異なる高精細ディスプレイが登場すると,電子書籍や電子コミックを 閲覧端末の解像度に適応させる必要がある.文字については様々な解像度に対するフォント が整備されているが,文字以外の要素を含む電子コミックは解像度変換が必須となる.しか しながら,単純な解像度変換はアーティファクトを発生させ,電子コミックの画像品質を低 下させる.したがって,電子コミックを効率よく蓄積・配信するためには,高い圧縮率をも たらす高能率符号化が必要なだけでなく,解像度変換が容易であることが要求される.
端末が持つ表示装置の特性に合わせた表示が可能な画像表現方式として,ベクタ表現があ る.例えば,ベクタ表現に基づくアウトラインフォントやベクタグラフィックスにより作成 された画像は,拡大してもジャギーノイズが発生しない.これらの利点からベクタ表現のコ ンテンツ需要が今後増大していくと考えられる.しかし,既存のコンテンツは大部分がラス タ表現で制作・蓄積・配信されている.そこで,大量に蓄積されている既存のラスタ表現コ ンテンツを自動的にベクタ表現に変換する技術が求められている.
本論文は,ラスタ表現の代表的な画像であるコミック画像を主な対象に,ベクタ化を中核 とした高能率符号化方式の具現化について論じたものである.ベクタ化のための画像モデル として,コミック画像に対して網点分離による画像分解を提案している.また,グレースケ ール画像に対して線形勾配成分の抽出方式を提案している.さらに,線画像の信号レベル解 析として,曲線の不変特徴量と編集性について検討している.コミック画像の高レベル分析 として,コマ配置情報の取得及び文字認識のための文字領域抽出手法を提案している.最後 に,本論文で提案された個々の要素技術を統合して高能率符号化を具現化する仕組みを示し ており,符号量制御やエントロピー符号化についても言及している.
本論文は,筆者が本学大学院国際情報通信研究科に在学中に行った研究成果をまとめたもので あり,以下各章ごとに概要を述べ評価を加える.
第 1 章「序論」では,本研究の背景と研究課題及び研究対象を明らかにすると共に,本論 文の目的及び論文の構成を示している.
第 2 章「ベクタ変換技術と画像表現方式」では,ラスタ表現における線画を多角形近似と 曲線置換によりベクタ表現に変換する技術を説明している.既存のベクタ変換手法を線画以 外の画像に適用すると,主観品質が著しく低下するという問題点を示している.次に,網点 の特徴とその分離手法についてまとめ,ベクタ表現での階調再構成が考慮されていないこと を明らかにしている.また,階調画像から骨格成分と呼ばれる輝度が均一な成分を取得する
全変動最小化フレームワークを説明し,計算コストが高いことを定性的に示している.加え て,グラデーションメッシュによるベクタ表現取得方法について示すと共に,曲率や曲率尺 度空間などの平面曲線における特徴量の扱いを整理している.さらに,コミック画像から取 得できるメタデータとしてコマ配置と文字切出しについて述べ,その自動抽出手法の問題点 を示している.本章は,ベクタ変換に関連する既存手法を精査しており,問題点が多く存在 することを明確にしている点で重要である.
第 3 章「網点分離による画像分解方式」では,高解像度2値画像と低解像度グレースケー ル画像を対象として,網点を含む画像を効率良くベクタ化する方式を提案している.まず,
網点の周期と解像度変換の比率とが整数倍でない場合にモアレが生じることを示し,この性 質を用いて高解像度 2 値画像において輝度変化の周期を取得する方法を提案している.得ら れた網点周期を用いて網点領域を分離し,元の濃淡階調を復元して線形勾配で近似する手法 を提案している.テストチャートを用いた実験により,提案手法は汎用的な網点に適用可能 であることが示されている.また,低解像度グレースケール画像に対して,網点を分離する 手法と精度の高い線画を生成する手法を提案している.網点の分離特性,網点の検出濃度の 精度,モアレ低減の検証,2値・多値画像からの網点中心の検出,高解像度2値化手法につい て,評価実験により提案手法の有効性を示している.
2値画像のベクトル化に際し,網点分離を行うことによりモアレの問題を解決できることを 示したことは新規性が高く,さらにグレースケール画像への拡張では,実験によりその有効 性が示されている点で高く評価できる.
第 4 章「線形勾配成分の抽出方式」では,高能率符号化を実現するために二つの画像モデ ルを提案している.一つは入力画像をベクタ表現可能な線形グラデーション領域とラスタ表 現に適しているテクスチャ成分へ分離する画像モデルであり,もう一つは入力画像をグラデ ーションメッシュとテクスチャ成分に分離する画像モデルである.前者のモデルについては,
線形グラデーション領域を取得するために,画像に全変動最小化のフレームワークを適用し,
高速計算手法を提案している.分離性能と処理時間について従来手法と比較評価がなされて いる.後者のモデルについては,目的関数を最小化するための 2 種類の手法について,近似 性能と計算時間が評価されている.
多値画像を,汎用ベクタ形式に含まれるパラメタで記述可能な線形グラデーション領域と テクスチャに分解する手法の高速化は独自の考え方に基づくものであり高く評価できる.ま た,多値画像をグラデーションメッシュで粗く表現しようという試みは,ベクタ表現にとっ て今後有力なアプローチとなる可能性を示した点で重要である.
第 5 章「曲線の不変特徴量と編集性」では,ベクタ表現で利用される平面曲線に対して,
スケール不変な特徴量を提案している.この特徴量は閉曲線のみならず開曲線からも抽出で きる.曲線の頂点という主観的な特徴量を用いて,頂点とベクタ表現の通過点が一致してい るほど編集しやすいことを示し,編集性を改善するベクタ変換手法を提案している.尺度正 規化曲率を用いることで曲線の頂点を定量的に検出でき,ベクタ変換により得られたベジエ
曲線の定量的な評価実験を行っている.
開曲線からも抽出できるスケール不変特徴量を考案し,実験によりその信頼性を示したこ とは新規性が高いといえる.スケール不変特徴量によるベクタ変換の編集性の定量的な評価 は,従来直観的に理解されていたことを客観的な知見として示した点で高く評価できる.
第 6 章「コミック画像からのメタデータ抽出」では,対象コンテンツをコミックに限定し て,コマ配置情報や文字情報といったメタデータの取得手法を示している.具体的には,画 像分割に基づくコマ閲覧順序の取得手法及び手書き文字認識技術を応用した文字領域の切り 出し手法を示している.
コミック画像に含まれるコマ配置情報や文字情報といったメタデータの有効な抽出手法を 示したことで,メタデータを用いた電子コミックの配信・閲覧システムの実現という新しい 分野を開いたことが評価できる.
第 7 章「コミック画像符号化」では,本論文で提案された個々の要素技術を統合するフレ ームワークを述べている.特に,網点分離処理やベクタ変換をはじめとする符号化技術と,
コミック画像から取得可能なメタデータの統合を示している.さらに,高能率符号化の実用 化に必須となる符号量制御の実現方法を提案している.
提案された個々の要素技術を統合して高能率符号化を具現化し,実際に携帯端末上で表示 する段階まで達成したことで,その有効性と実現性が高く評価できる.
第8章「結論」では、本論文の成果についてまとめている.
以上要するに本論文は,取得が容易なラスタ表現の画像コンテンツを自動的にベクタ表現 に変換し,高能率符号化を具現化する手法について論じたものであり,既存の蓄積コンテン ツを将来の高精細表示装置での鑑賞に堪えうる品質に低コストかつ自動で変換可能であるこ とを示した点に意義がある.本論文で得られた知見は今後急速な進展が予想される電子書籍 や電子コミックの配信システムを支える技術の進展に資することが期待されるものであり,
国際情報通信学の発展に寄与するところは極めて大きい.よって,本論文は博士(国際情報 通信学)の学位を授与するに値するものであると認める.
2013年2月13日 審査員
(主任) 早稲田大学教授 工学博士(北海道大学) 渡辺 裕 早稲田大学教授 工学博士(早稲田大学) 亀山 渉 早稲田大学教授 博士(工学)(東京大学) 甲藤 二郎 早稲田大学教授 工学博士(東京大学) 津田 俊隆