GANを用いたデータ拡張
5
0
0
全文
(2) Vol.2017-CVIM-207 No.14 2017/5/10. 情報処理学会研究報告 IPSJ SIG Technical Report. 図 1 Adversarial Exmaples [5].. 図 2. CIFAR-10 dataset の一例.. 2.2 GAN Adversarial Exmaples によって,ネットワークをだます. 画像が生成できる Stacked GAN [4] を用いる.. 画像が解析的に求まることが判明した [1,5].その技術を応. まず,GAN を任意の数と画像を識別するために事前に. 用することによって,任意のクラス画像を生成する方法が. 訓練されたボトムアップ Deep Neural Network(DNN) を. 考案された.任意のノイズ分布を入力とする生成関数 G(z). エンコーダとして用意する.それぞれの GAN を個別に訓. と,正しいデータ分布で生成される画像を入力とする識別. 練させたあとに,全ての GAN を共通に訓練する.生成器. 関数 D(x) をそれぞれニューラルネットワークで定義する.. は個別訓練時に連結されたエンコーダと,上位に連結され. D(x) は正しい入力画像を識別できるように学習し,G(z). た GAN の生成器から条件入力を受け取り学習を行う.最. は D(x) が正しい画像であるかのように見せかける画像を. 下位の生成器が生成したものが得たい画像となる.この. 生成するように学習をする.このようにして画像を生成. ようなネットワーク構造の GAN を Stacked GAN と呼ぶ.. する手法を Generative Adversarial Network(GAN) [6] と. GAN の連結数を増やせば増やすほど高解像度,高精細な. いう.. 画像を生成することができる.. 2.3 深層畳み込み GAN. 3. データ拡張の手法. GAN では学習が不安定なために複雑な画像が生成でき. CNN で学習をする際にはデータセットとして大量の学. ないという問題があった.そこで,GAN のネットワーク. 習サンプルが必要となる.しかし,識別対象によっては十. 構造を深層畳み込みニューラルネットワークに変え,以下. 分な数のデータが集められないことがある.そこで,GAN. の変更を加えることでより自然な画像を生成することに成. を用いて画像を機械的に生成することでデータ拡張を行. 功した.. う.本章では本研究に用いるデータセットと画像の生成方. • 畳み込み層のストライド幅を小さくする. 法について詳しく述べる.. • BatchNormalization を導入する • 全結合層の隠れ層を取り除く • 生成器では ReLU の代わりに LeakyReLU [7] を導入 する. • 識別器では ReLU の代わりに Tanh を導入する. 3.1 データセット 本研究ではデータセットとして The CIFAR-10 dataset. [8] を用いる.CIFAR-10 は 80Million Tiny Images から 10 クラス各 6000 枚,合計 60000 枚の画像を抽出してラベル. このようなネットワーク構造の GAN を特に深層畳み込み. 付けしたデータセットである.画像は 32 × 32[pixel],RGB. GAN [3] と呼ぶ.. カラーで,クラスは airplane, automobile, bird, cat, deer,. dog, frog, horse, ship, truck となっている.データセット 2.4 Stacked GAN. の一例を図 2 に示す.. 深層畳み込み GAN ではエッジのぼやけた不鮮明な画像. 今回は少数のデータセットのシミュレーションを行うた. が生成されることが多いという欠点がある.データ拡張を. め,各クラスからランダムで 600 枚ずつを抽出する.抽出. する際には元画像と似たような画像が生成されることが望. したデータのうち,500 枚をトレーニングデータ,100 枚. まれる.そこで,深層畳み込み GAN よりも元画像に近い. をテストデータとして使用する.. c 2017 Information Processing Society of Japan ⃝. 2.
(3) Vol.2017-CVIM-207 No.14 2017/5/10. 情報処理学会研究報告 IPSJ SIG Technical Report. (a) 幾何変形.. (b) 深層畳み込み GAN で生成し. (c) 深層畳み込み GAN で生成し. た TP データ.. た FP データ.. (d) Stacked GAN で生成した. (e) Stacked GAN で 生 成 し た. TP データ.. FP データ. 図 3. 各手法で生成したデータの一例.. 3.2 生成方法 各クラス 500 枚のトレーニング用データを元のデータ セットとして用い,幾何変形と深層畳み込み GAN で各ク. チャンネルの画像を出力として得る.今回は生成器,識別 器ともに 100 エポック学習させる.. 3.2.3 Stacked GAN を用いた画像生成. ラス 500 枚の画像を生成する.さらに深層畳み込み GAN. エンコーダは畳み込み 1-プーリング 1-畳み込み 2-プー. よりも精細な画像を生成できる Stacked GAN を用い,各. リング 2-全結合層-出力からなる.生成器は 2 段重ねで,. クラス 500 枚の画像を生成する.各手法で生成した例を図. それぞれ逆畳み込み層 4 層と全結合層からなる.上段の生. 3 に示す.. 成器は 50 次元の一様乱数を,下段の生成器は 16 次元の一. 3.2.1 幾何変形. 様乱数を入力とし,32 × 32[pixel],3 チャンネルの画像を. 画像の切り抜き,拡大,平行移動などの幾何変形や,輝 度値変化,彩度変化などの画像加工を用いてデータ拡張を. 出力として得る.今回は生成器,識別器ともに 200 エポッ ク学習させる.. 行う.今回は特に画像の切り抜き及び拡大を用いてデータ 拡張を行う.具体的には以下のような方法で画像を生成 する.. • 32 × 32[pixel] の画像からランダムに 24 × 24[pixel] の 画像を切り出す.. • 24 × 24[pixel] の画像を 32 × 32[pixel] の画像に拡大 する.. 3.2.2 深層畳み込み GAN を用いた画像生成. 3.3 データの選別 深層畳み込み GAN 及び Stacked GAN で画像を生成し た際に,学習に用いたデータ画像からかけ離れた画像が生 成されることが起こる.それらの画像を用いて CNN で学 習を行うと分類正解率の低下を招く恐れがある.そこで, 画像を生成する際に CIFAR-10 データセットで事前学習済 みの CNN を用いて画像の識別を行い,ラベルとクラスが. 今回のネットワーク構造は生成器が 4 層の逆畳み込み層. 一致した画像と一致しなかった画像を出力する.一致した. と全結合層,識別器が 4 層の畳み込み層と全結合層からな. 画像セットを True Positive(TP) データ,一致しなかった. る.100 次元の一様乱数を入力として,32 × 32[pixel],3. 画像セットを False Positive(FP) データと表記する.. c 2017 Information Processing Society of Japan ⃝. 3.
(4) Vol.2017-CVIM-207 No.14 2017/5/10. 情報処理学会研究報告 IPSJ SIG Technical Report. GAN. TP(True Positive). CNN. েਛ൸भছঋঝٙ ଈȅ. FP(False Positive) 図 4 データ選別の流れ.. 実験では TP データ,FP データともに各クラス 500 枚,. いるものは,それぞれ 2500 枚ずつ用意し,あわせて 5000. 合計 10000 枚を生成する.それぞれをデータ拡張に用い,. 枚を追加している.表 2 の「正解率」は,それぞれの組み. CNN で学習をした際に正解率にどう影響するかを検証す. 合わせに対する 10 クラス全体での正解率を表している.. る.データの選別の流れの図を図 4 に示す.. 4. 正解率比較実験. 4.2 考察 ベースラインとなる CIFAR-10 データセットを学習し. GAN によって生成した画像をデータセットに加えるこ. たものが正解率 61.7%だったのに対し,一番正解率の高い. とでデータ拡張に使えるかを検証する.生成には深層畳み. Stacked GAN+TP データ+幾何変形データでは 70.6%と. 込み GAN と Stacked GAN を用い,幾何変形とどの程度. 8.9%正解率が向上した.さらに幾何変形データを加えて学. 正解率に違いがあるかを比較する.. 習したものに対して Stacked GAN+TP データで学習した ものでは 1.0%正解率が向上した.もともとのデータが少. 4.1 実験手順と実験結果 データセットの 6000 枚の内,各クラス 500 枚,合計 5000 枚をトレーニングデータ,各クラス 100 枚,合計 1000 枚. なかったため,データ数が増えるにしたがって正解率は上 昇していったが,その中でも特に Stacked GAN+TP デー タは幾何変形のみよりも効果が高いといえる.. をテストデータとして予め切り離しておく.次に,5000 枚. 深層畳み込み GAN に対する TP データと FP データを. のトレーニングデータに対して,3.2 節のデータ拡張およ. 比較すると TP データのほうが正解率が向上している.事. び 3.3 節のデータ選別を施したうえで,表 1 の構成の CNN. 前学習済みの CNN が有効なデータであると判断したほう. を学習させ,テストデータに対する正解率を算出する.こ. が学習データとしての質が高いことがいえる.ただし,元. のとき,どのデータ拡張やデータ選別が有効かを検証する. のデータセットにおいてクラスとクラスの境界線となる. ために,表 2 に示す組み合わせで評価した.. FP データを加えたほうが正解率の上昇が大きいと考えて. 表 2 において,「Method」はデータ拡張に用いる生成. いた.しかし,実際には TP データのみを加えた場合のほ. 器, 「データ数」はトレーニングデータ数を表す.ただし,. うが正解率がより上昇していた.この問題は今後実験等を. 「CIFAR-10」は GAN を用いず元のデータセットを用いる. して考察をしていく必要がある.Stacked GAN に関して. ことを表す.また, 「FP」 , 「TP」および「幾何変形」列の. は,TP と FP だけを加えた場合はほとんど違いがなかっ. 丸印は,各処理を施したデータをトレーニングデータに加. た.これは Stacked GAN のエンコーダが本研究で行った. えたことを表す.したがって, (表頭を除き)1 行目ですべ. データの選別と同じ効果を持っているからだろうと推測. ての列に丸印がついていないことは,データ拡張をせず元. した.. の 5000 枚のデータで学習したことを意味し,提案手法に. 深 層 畳 み 込 み GAN と Stacked GAN を 比 較 す る と. 対するベースラインを表す.他にも例えば,4 行目では,. Stacked GAN で画像を生成したほうが正解率は高くなっ. 深層畳み込み GAN を生成器として用い,FP データと幾何. た.これは Stacked GAN が生成器を重ねることにより局. 変形データをそれぞれ 5000 枚用意し,元のデータ 5000 枚. 所的な特徴と大局的な特徴両方を深層畳み込み GAN より. とあわせて合計 15000 枚のトレーニングデータを用いたこ. も取れるためであろう.GAN をさらに重ねることで同じ. とを表す.ただし, 「FP」と「TP」の両方に丸印がついて. データ数で,さらなる正解率の向上が期待される.. c 2017 Information Processing Society of Japan ⃝. 4.
(5) Vol.2017-CVIM-207 No.14 2017/5/10. 情報処理学会研究報告 IPSJ SIG Technical Report 表 1 層. CNN の構成. 出力. 入力. 32 × 32 × 3. 畳み込み 1. 32 × 32 × 64. Method CIFAR-10. 表 2 使用した手法と正解率. FP TP 幾何変形. データ数. 5000. 61.7 ○. 10000. 畳み込み 2. 32 × 32 × 64. 10000. ○. プーリング 1. 16 × 16 × 64. 15000. ○. 畳み込み 3. 16 × 16 × 128. 畳み込み 4. 16 × 16 × 128. プーリング 2. 深層畳み込み GAN. 8 × 8 × 128. 全結合 1 全結合 2. 1024 10 Stacked GAN. GAN でのデータ生成と幾何変形を組み合わせた場合更. 10000. ○. 15000. ○. 10000. ○. ○. 15000. ○. ○. 10000. ○. 15000. ○. 10000. ○. 15000. ○. 10000. ○. ○. 15000. ○. ○. 本研究ではデータ拡張の方法として GAN を用いる方法 を提案した.その結果,縮小した CIFAR-10 データセット に対して最大で 8.9% の正解率の上昇が確かめられた.ま た,深層畳み込み GAN で画像を生成したときに,TP デー. [6]. タと FP データに分割すると,正解率が上昇することを確 認した.Stacked GAN で画像を生成するときはエンコー ダが同等の働きをしているためなのか,正解率の上昇は望. [7]. めなかった. データの集めづらいクラスに対して CNN で学習を行う ときに,本研究での提案手法を用いることで従来の手法よ. [8]. 64.8 65.0. ○. 65.6 63.9. ○. 64.8 65.0. のかを今後調査していきたい.. [5]. 64.7 62.7. ○. に正解率が上がったので,どの程度の比率で混ぜればよい. 5. おわりに. 正解率 (%). ○. 68.2. ○. 70.6. 65.7 66.9 ○. 69.4. 2016. Christian Szegedy, Wojciech Zaremba, Ilya Sutskever, Joan Bruna, Dumitru Erhan, Ian J. Goodfellow, and Rob Fergus. Intriguing properties of neural networks. CoRR, Vol. abs/1312.6199, , 2013. Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. Generative adversarial nets. In Advances in neural information processing systems, pp. 2672–2680, 2014. Andrew L Maas, Awni Y Hannun, and Andrew Y Ng. Rectifier nonlinearities improve neural network acoustic models. In Proc. ICML, Vol. 30, 2013. Alex Krizhevsky and Geoffrey Hinton. Learning multiple layers of features from tiny images. 2009.. りも正解率を向上させる手助けとなるだろう.ただし,幾 何変換に比べて事前処理時間が長くかかるので考慮する必 要がある. 今後,さらなる正解率向上のために,データの生成数を 増やした場合にどうなるか,Stacked GAN において,GAN を 3 個以上重ねた場合どうなるかなどを調査していきた い.また,さらに少数のデータにおいて同様の実験を行っ た場合にも効果があるのか,データを増やしたときに頭打 ちとなる生成数はどの程度なのかを実験していく. 謝辞 本研究は JSPS 科研費 JP16K00231 の助成を受け たものです. 参考文献 [1]. [2]. [3]. [4]. Ian J. Goodfellow, Jonathon Shlens, and Christian Szegedy. Explaining and harnessing adversarial examples. CoRR, Vol. abs/1412.6572, , 2014. Leon Sixt, Benjamin Wild, and Tim Landgraf. Rendergan: Generating realistic labeled data. CoRR, Vol. abs/1611.01331, , 2016. Alec Radford, Luke Metz, and Soumith Chintala. Unsupervised representation learning with deep convolutional generative adversarial networks. CoRR, Vol. abs/1511.06434, , 2015. Xun Huang, Yixuan Li, Omid Poursaeed, John E. Hopcroft, and Serge J. Belongie. Stacked generative adversarial networks. CoRR, Vol. abs/1612.04357, ,. c 2017 Information Processing Society of Japan ⃝. 5.
(6)
図
関連したドキュメント
市場を拡大していくことを求めているはずであ るので、1だけではなく、2、3、4の戦略も
大きな要因として働いていることが見えてくるように思われるので 1はじめに 大江健三郎とテクノロジー
仏像に対する知識は、これまでの学校教育では必
Instagram 等 Flickr 以外にも多くの画像共有サイトがあるにも 関わらず, Flickr を利用する研究が多いことには, 大きく分けて 2
子どもの学習従事時間を Fig.1 に示した。BL 期には学習への注意喚起が 2 回あり,強 化子があっても学習従事時間が 30
ピアノの学習を取り入れる際に必ず提起される
支援級在籍、または学習への支援が必要な中学 1 年〜 3
課題 学習対象 学習事項 学習項目 学習項目の解説 キーワード. 生徒が探究的にか