• 検索結果がありません。

深層学習の画像処理・生成への応用

N/A
N/A
Protected

Academic year: 2021

シェア "深層学習の画像処理・生成への応用"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)Vol.2017-CVIM-208 No.16 2017/9/15. 情報処理学会研究報告 IPSJ SIG Technical Report. 深層学習の画像処理・生成への応用 飯塚里志† 概要:近年,多層のニューラルネットワークを利用した深層学習は画像処理や画像生成に広く応用されている.これ はコンピュータグラフィクスやコンピュータビジョン分野を中心に高い関心を集めており,今後さらに発展していく ことが予想される.本講演では,入力画像から目的の画像を直接出力するような畳み込みニューラルネットワークモ デルに焦点を当て,そのモデルを利用した白黒写真の自動色付けと画像補完を中心にその応用事例を紹介する.また, 画像処理に関連する深層学習の現状の問題点についても考察する. キーワード:深層学習、画像処理、画像生成. 1. はじめに 近年,深層学習は様々な研究分野で大きな注目を浴びて いる.深層学習は多層のニューラルネットワークを用いた 機械学習であり,特に画像を対象とした研究では,シーン 認識や物体検出,セグメンテーション,画像処理などに応 用され,目覚ましい成果を挙げている.これらの技術は世 界中で盛んに研究が行われており,今後さらに発展してい くことが予想される. 本講演では,画像処理に畳み込みニューラルネットワー ク(Convolutional Neural Network, CNN)を応用した研究に 焦点を当て,その研究事例を解説する.特にこれまでの研 究成果の中から「白黒写真の自動色付け」と「画像補完」. (a) 入力画像. (b) 出力画像. について,それぞれの研究背景やモデル構造,得られる結. 図 1:深層学習による白黒写真の自動色付け(上),および. 果,問題点をより具体的に説明する.これらの研究はそれ. 画像補完(下).. ぞれ使用しているモデルや学習フレームワークが異なり, それぞれの問題で適切な結果を得るための工夫やモデル構 築のノウハウなどを解説する.. ニューラルネットワークによる画像補完[2].CNN を用 いて,シーンの大域的かつ局所的な整合性を考慮した画像. 白黒写真の自動色付け[1].この研究では,CNN を用い. 補完を行う手法を提案した(図 1 下).提案する補完ネット. てグレイスケール画像をカラー画像に自動変換する手法を. ワークは全層が畳み込み層で構成され,任意のサイズの画. 提案した(図 1 上).提案手法では,画像の大域特徴と局所. 像における自由な形状の「穴」を補完できる.この補完ネ. 特徴を考慮した新たな畳み込みネットワークモデルを用い. ットワークに,シーンの整合性を考慮した画像補完を学習. ることで,画像全体の構造を考慮した自然な色付けを行う. させるため,本物の画像と補完された画像を識別するため. ことができる.提案モデルにおいて,大域特徴は画像全体. の大域識別ネットワークと局所識別ネットワークを構築す. から抽出され,局所特徴はより小さな画像領域から計算さ. る.この 2 つの識別ネットワーク両方を「だます」ように. れる.これらの特徴は“結合レイヤ”によって一つに統合 され,色付けネットワークに入力される.このモデル構造 は入力画像のサイズが固定されず,どんなサイズの画像で も入力として用いることができる.また,モデルの学習の ために既存の大規模な画像分類のデータセットを利用し, それぞれの画像の色とラベルを同時に学習に用いることで, 効果的に大域特徴を学習できるようにしている.提案手法 により,100 年前の白黒写真など,様々な画像において自 然な色付けを実現できる.色付けの結果はユーザテストに よって評価し,約 90%の色付け結果が自然であるという回 答が得られた. † 早稲田大学 Waseda University. ⓒ 2017 Information Processing Society of Japan. 補完ネットワークを学習させることで,シーン全体で整合 性が取れており,かつ局所的にも自然な補完画像を出力す ることができる.提案手法により,人間の顔の一部を補完 するような,複雑な画像補完を実現した.. 参考文献 [1]. Satoshi Iizuka, Edgar Simo-Serra, Hiroshi Ishikawa. “Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification”, ACM Transaction on Graphics (Proc. of SIGGRAPH 2016), 35, 4, 110:1-110:11, 2016. [2] Satoshi Iizuka, Edgar Simo-Serra, and Hiroshi Ishikawa. "Globally and Locally Consistent Image Completion", ACM Transaction on Graphics (Proc. of SIGGRAPH 2017), 36, 4, 107:1-107:14, 2017.. 1.

(2)

参照

関連したドキュメント

Although the picture element (pixel) in conventional image sensors are placed in the form of a lattice for ease of implementation, the lattice place- ment of pixels intrinsically

In numerical simulations with Model A of both the deSTS and ETS models, CFD showed the presence of a recirculation zone in the heel region, with a stagnation point on the host

The goods and/or their replicas, the technology and/or software found in this catalog are subject to complementary export regulations by Foreign Exchange and Foreign Trade Law

The denoising results for pixels near singularities are obtained by nonlocal means in spatial domain to preserve singularities while the denoising results for pixels in smooth

Key words and phrases: Linear system, transfer function, frequency re- sponse, operational calculus, behavior, AR-model, state model, controllabil- ity,

We remarked at the end of the proof of Theorem 3.6 that each residue map on a two- dimensional, complete, normal local ring is continuous with respect to the adic topology on the

Although PM method has very similar smoothing results to the shock filter, their behavior has two differences: one is the PM method will not stop diffusion at corner while shock

Key words: Brownian sheet, sectorial local nondeterminism, image, Salem sets, multiple points, Hausdorff dimension, packing dimension.. AMS 2000 Subject Classification: Primary