「Real-Time Hair Rendering using Sequential Adversarial Networks」の実装
2
0
0
全文
(2) Vol.2018-CG-171 No.17 2018/9/30. 情報処理学会研究報告 IPSJ SIG Technical Report ლ⬸⢸ᇁ. ഞനകヮ. ೝ೭ᮞ. ⍜㻢ᐲ಄⢸ᇁ. ഡറ⢸ᇁ. ⢠᳭ⷮₒ. た印象になるのを防ぐため,通常の判別器 (Discriminator) と合わせてパッチ判別器 [2] も用いた.これにより,髪に より詳細な流れの情報が現れることが確認できた.. 4. まとめ 本稿では Wei らが ECCV 2018 で発表した CNN を用い た頭髪の実時間レンダリングに関する論文 [7] の実装結果 について報告した.今回は学習データに LFW データセッ トを用いて 20 エポック分の学習を実施したが,データセッ 図 2 LFW データセットを用いた実験結果.実験に用いた例示画像. トを著者らと同様に CelebA-HQ に変更し,更に長時間の. は Flickr のユーザ Ana¨ıs Nannini (1 行目) ならびに Qsimple. 学習を行うことで,今回報告した結果よりも良好な結果が. (2, 3 行目) のものを使用.. 得られることが期待される. また,元論文の結果ならびにデモ動画を確認すると,Wei. の学習のために,データセット中の 3,000 枚の画像につい. らの提案法に関する問題がいくつか見て取れる.第一に彼. て髪の領域を表すラベルが手付けされたデータを作成した.. らの手法は例示画像と実際にレンダリングされる頭髪画像. しかし,この髪領域ラベルつきのデータは未公開であるた. の見た目がある程度近い必要がある.今回の実装を用いた. め,今回は予め髪領域のラベルがついた Labeled Faces in. 実験においても,特に例示画像とレンダリング画像で毛髪. the Wild (LFW) データセット [4] を用いて実験を行った.. 部分のスケールが大きく異なる場合に不自然な結果が得ら. LFW には 250 × 250 画素の画像が約 13,000 枚含まれてお. れることが確認できた.また,グレースケール画像を生成. り,そのうち約 3,000 枚に意味的領域分割ラベルが付与さ. する際には例示画像に含まれる光源環境の情報を十分な反. れている.今回は実装の都合上,これらの画像を 256 × 256. 映が難しいようで,全体的に環境光が支配的な例示画像で. 画素にリサイズして用いた.また,今回の実装ではエン. ないと良好な結果が得られないことも分かった.今後は,. コーダの学習を簡単にするため,ResNet の代わりに単純. この問題に関して,より発展的な手法の開発が望まれる.. な畳み込み層と活性化層からなるネットワークをエンコー ダに用いた.ネットワークは NVIDIA GeForce 1080 Ti 二. 参考文献. 台を用いておよそ半日間で 15 エポック分学習した.. [1]. 3. 結果と考察 今回の実装により得られた結果を図 2 に示す.この結果. [2]. を見ると,エッジ活性化画像ならびに毛髪向き画像は学習 データに近い良好な見た目が得られていることが分かる. その一方で,グレースケール画像ならびにレンダリング結. [3]. 果画像においては,やや見た目がボケた印象となっている. さらに,レンダリング結果の髪色に注目すると,例示画像 の髪色をあまり正しく反映できていないことが分かる.こ. [4]. の問題は LFW データセットに含まれる画像が全体的にボ ケていること,ならびにデータセットに含まれる画像が黒. [5]. や茶などの髪色を多く含んでいることが原因と考えられる. また,今回の実装にあたり,論文に書かれている内容から いくつかの変更を加えているので,その内容について考察. [6]. する.一点目に生成画像 Ik′ (k = 0, 1, 2, 3) に対する損失関 数の定義である.元論文を見ると,損失関数を定義する際 の. Ik′. [7]. は全て I4 から順次ネットワークにより生成されたも. ののように見えるが,このように学習すると I2′ や I1′ など, より後半で生成される画像の品質がなかなか上がらない問 題があった.そこで今回の実装では I4 から生成された画像 とは別にデータセット中の Ik−1 から生成した Ik′′ も損失関. [8]. He, K., Zhang, X., Ren, S. and Sun, J.: Deep residual learning for image recognition, IEEE Conference on Computer Vision and Pattern Recognision (CVPR), pp. 770–778 (2016). Isola, P., Zhu, J.-Y., Zhou, T. and Efros, A. A.: Imageto-Image Translation with Conditional Adversarial Networks, IEEE Conference on Computer Vision and Pattern Recognision (CVPR) (2017). Karras, T., Aila, T., Laine, S. and Lehtinen, J.: Progressive Growing of GANs for Improved Quality, Stability, and Variation, International Conference on Learning Representations (ICLR) (2018). Learned-Miller, E., Huang, G. B., RoyChowdhury, A., Li, H. and Hua, G.: Labeled Faces in the Wild (LFW) Dataset, http://vis-www.cs.umass.edu/lfw/part labels/. Luo, L., Li, H., Paris, S., Weise, T., Pauly, M. and Rusinkiewicz, S.: Multi-view hair capture using orientation fields, IEEE Conference on Computer Vision and Pattern Recognision (CVPR), pp. 1490–1497 (2012). Ronneberger, O., Fischer, P. and Brox, T.: U-Net: Convolutional Networks for Biomedical Image Segmentation, arXiv preprint arXiv:1505.04597 (2015). Wei, L., Hu, L., Kim, V., Yumer, E. and Li, H.: Real-Time Hair Rendering using Sequential Adversarial Networks, European Conference on Computer Vision (ECCV) (2018). Zhao, H., Shi, J., Qi, X., Wang, X. and Jia, J.: Pyramid Scene Parsing Network, IEEE Conference on Computer Vision and Pattern Recognision (CVPR) (2017).. 数の定義に用いた.二点目として髪の流れが全体的にボケ ⓒ 2018 Information Processing Society of Japan. 2.
(3)
図
関連したドキュメント
CN 割り込みが発生した場合、ユーザーは CN ピンに対応する PORT レジスタを読み出す
太湖、金寨等、20 数カ所で窯跡が発見され、いくつかの窯跡の採集品は簡報で発表された ()。2002 年 月
1 モデル検査ツール UPPAAL の概要 モデル検査ツール UPPAAL [19] はクライアント サーバアーキテクチャで実装されており,様々なプ ラットフォーム (Linux, windows,
In external radiotherapy, there is concern regarding the relationship between image quality and total patient dose during real-time tumor tracking, because it is necessary to
Scival Topic Prominence
ている。本論文では、彼らの実践内容と方法を検討することで、これまでの生活指導を重視し
なお︑本稿では︑これらの立法論について具体的に検討するまでには至らなかった︒
Proceedings of EMEA 2005 in Kanazawa, 2005 International Symposium on Environmental Monitoring in East Asia ‑Remote Sensing and Forests‑.