• 検索結果がありません。

“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”の学習報告

N/A
N/A
Protected

Academic year: 2021

シェア "“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”の学習報告"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会研究報告 IPSJ SIG Technical Report. Vol.2017-CG-167 No.5 2017/9/19. ‘‘Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks’’の学習報告 杉山 拓海 1 概要: これまで深層学習を用いた画像から画像への変換学習では、ペアとなった訓練データセットが 大量に用意できないような変換は学習が難しいという問題があった。この論文ではペアとなった訓練デ ータセットを必要としない学習モデル Cycle-Consistent Generative Adversarial Networks(CycleGAN)を提案 し、従来の学習手法との比較と、変換学習における汎用性の検証を行っている。比較では、ペア学習に は劣るものの実用的なレベルの結果を示し、また汎用性検証では画像スタイル、模様変化、風景写真の 季節など様々な変換実験を用いて汎用性を示している。. 学習には損失(loss)と呼ばれる値を使用する。CycleGAN. 1. 学習構造. で使用する全体の損失は以下の式で示される。. CycleGAN ではペア学習[1]で使用されていた図1左のよ. ℒ(G, F, DX , DY ) = ℒ𝐿𝑆𝐺𝐴𝑁 (𝐺, 𝐷𝑌 , 𝑋, 𝑌). うな1対1に対応付けされたデータセットではなく、図1. + ℒ𝐿𝑆𝐺𝐴𝑁 (𝐹, 𝐷𝑋 , 𝑌, 𝑋). 右のような画像群 X と画像群 Y という構造のデータセッ. + 𝜆ℒ𝑐𝑦𝑐 (𝐺, 𝐹). トを使用する。. (1). 2. 学習結果 CycleGAN を用いた学習結果を図3に示す。高速道路な ど細かい部分まで正確に変換することは難しいが、緑地帯 や道路の構造など全体的に特徴を捉えた変換は行えている。. 図 1. 訓練データセット. CycleGAN における学習の特徴は元画像から変換、復元 を行った復元画像と元画像を比較するという部分にあり、 図 2 は生成器 G で写真から地図を生成、生成器 F で地図か ら写真に戻したあと復元画像と元画像を比較という. 図 3. CycleGAN の学習結果(写真⇔地図). CycleGAN での学習の流れを示している。 また、この論文ではペア学習で訓練データセットを用意す ることが困難だった変換についていくつか実験を行い、モ デルの汎用性検証も行っている。変換の内容によってはう まく学習できないものもあるが、それでも幅広い種類の変 換が期待できる。. 図 2. 1. CycleGAN の概略図. 参考文献 [1] P. Isola, J.-Y. Zhu, T. Zhou, and A. A. Efros. Image-toimage translation with conditional adversarial networks. arXiv preprint arXiv:1611.07004, 2016. 静岡大学 工学部 数理システム工学科 〒 432-8561 静岡県浜松市中区城北 3-5-1. ⓒ2017 Information Processing Society of Japan. 1.

(2)

参照

関連したドキュメント

We compared CT image qualities of iNoir with FBP and ASIR using phantom tests corresponding to pediatric abdominal CT and a human observer test using clinical images..

Although the picture element (pixel) in conventional image sensors are placed in the form of a lattice for ease of implementation, the lattice place- ment of pixels intrinsically

The denoising results for pixels near singularities are obtained by nonlocal means in spatial domain to preserve singularities while the denoising results for pixels in smooth

Although PM method has very similar smoothing results to the shock filter, their behavior has two differences: one is the PM method will not stop diffusion at corner while shock

A class of nonlinear fourth-order telegraph-di ff usion equations TDE for image restoration are proposed based on fourth-order TDE and bilateral filtering.. The proposed model

Several characterizations of finite matrices that are image partition regular over N were found in [8], and one of these characterizations was in terms of the kernel partition

The master then generates a (re)start condition and the 8-bit read slave address/data direction byte, and clocks out the register data, eight bits at a time. The master generates

使用テキスト: Communication progressive du français – Niveau débutant (CLE international).