深層学習の基礎と導入に向けて

(1)

深層学習の基礎と導入向けて

モラドー 2018 年 3 月 20 日火早稲田大学

(2)

自己紹介

• 2015

年

7

月

BarcelonaTech

博士号取得

• 2015

年

8

月

2017

年

3

月早稲田大学研究院助教

• 2017

年

4

月同大学研究院講師

• 2018

年

4

月科学技術振興機構さ専任研究者 1

(3)

1.

深層学習歴史

2.

深層学習基礎 • モデル • デー • 学習

3.

必要環境 • ハッド • フレームワー

4.

例：ラフッ線画化

5.

例：白黒写真色付 ε !

(4)

(5)

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

Mark I Perceptron機

(6)

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

Fukushima, K. Neocognitron: a self organizing neural network model for a

mechanism of pattern recognition unafected by shift in position. Biological cybernetics, 1980.

(7)

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

Rumelhart et al. Learning Representations by Back-Propagating

(8)

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

LeCun et al. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 1998.

(9)

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

Krizhevsky et al. Imagenet classiication with deep convolutional neural networks. Advances in neural information processing systems, 2012.

(10)

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

Silver et al. Mastering the game of Go with deep neural networks and tree

search. Nature, 2016.

(11)

深層学習の歴史

•

深層学習現代人工ニューラルネットワー

•

深層学習？ • 様々問題対応 • 圧倒的性能

•

今色々使え？ • GPU 計算効率 • 大規模デーット

(12)

深層学習の歴史

•

深層学習現代人工ニューラルネットワー

•

深層学習？ • 様々問題対応 • 圧倒的性能

•

今色々使え？ • GPU 計算効率 • 大規模デーット

(13)

(14)

教師あ学習

顔

顔ではない

訓練データ

"顔"

または

"顔ではない"

4

(15)

深層学習

• f (x) = σ(Wx)

層重構造

•

パラメー学習

(16)

従来の機械学習

•

手動決特徴入力

•

機械学習モデル特徴出力変換学習

•

特徴精度制限特徴抽出機械学習入力出力

•

深層学習特徴抽出機械学習モデル一緒学習

•

ヒューリテッ避、デー依存深層学習入力出力 6

(17)

従来の機械学習

•

手動決特徴入力

•

機械学習モデル特徴出力変換学習

•

特徴精度制限特徴抽出機械学習入力出力

•

深層学習特徴抽出機械学習モデル一緒学習

•

ヒューリテッ避、デー依存深層学習入力出力

(18)

深層学習のよくあ問題

•

デー集 • 量、室、ノテーョン …

•

モデル構造決 • CNN、深さ、レヤ種類…

•

モデル学習 • 学習週報、学習率、バッ …

入

正

7

(19)

深層学習のよくあ問題

•

入

CNN

出

正

(20)

深層学習のよくあ問題

•

ロス

逆

習

入

CNN

出

正

7

(21)

深層学習のよくあ問題

•

モデル学習 • 学習週報、学習率、バッ … ハパーパラメーさ決いいい！

(22)

深層学習の例・分類

•

順伝播推定 • 入力対推定

•

逆伝播学習 • 誤差関数モデル出力正解デー比較 • 誤差関数最終化うモデルパラメー更新ニューラルネットワーク 23.8% Music Store 15.3% Basement 7.9% Cathedral 2.1% Airport ... 推定順伝播 8

(23)

深層学習の例・分類

•

順伝播推定 • 入力対推定

•

逆伝播学習 • 誤差関数モデル出力正解デー比較 • 誤差関数最終化うモデルパラメー更新ニューラルネットワーク 23.8% Music Store 15.3% Basement 7.9% Cathedral 2.1% Airport ... 推定順伝播 0.0% Music Store 100% Basement 0.0% Cathedral 0.0% Airport ... 誤差正解逆伝播

(24)

(25)

人工ニューラルネットワー

•

レヤ重構造

•

レヤ線形変換非線形活性化関数

•

行列書ベトル計算表現 ... ビアス前層ニューロン重み（学習するもの）非線形活性化関数

(26)

人工ニューラルネットワー

•

レヤ重構造

•

レヤ線形変換非線形活性化関数

•

行列書ベトル計算表現 ... ... 行列ベクトル 9

(27)

非線形活性化関数

•

非線形関数近似性能

•

色々種類、

ReLU

メン

Sigmoid

Tanh

ReLU

モド関数双曲線正接関数ランプ関数

σ

_Sigmoid

(

x) =

1 1 + e

−x

σ

tanh

(

x) = e

x

₋

_e

−x

e

x

₊

_e

−x

σ

ReLU

(

x) = max(0, x)

https://github.com/torch/nn/blob/master/doc/transfer.md

(28)

ソフトマッ

ス関数

•

出力確率分布変換 • 要素和 • 全要素正数

•

分類問題等適切

σ

_softmax

(

x) =

P

n

1

i=1

e

xi

[

e

x1

_,

e

x2

_{, . . . ,}

e

xn

_]

⊺ 11

(29)

畳込ニューラルネットワー

•

視覚野対応う形配置

•

空間的フル共有モデルパラメー減少

•

プーリン畳込層計算効率 INPUT 32x32 Convolutions Subsampling Convolutions C1: feature maps 6@28x28 Subsampling S2: f. maps 6@14x14 S4: f. maps 16@5x5 C5: layer 120 C3: f. maps 16@10x10 F6: layer 84 Full connection Full connection Gaussian connections OUTPUT 10 LeNet-5 [LeCun+ 1998]

(30)

プーリン層

•

解像度圧縮

•

小さい移動不変性マッ平均

Lp

y = max

x∈P

x

y = 1

|

P|

X

x∈P

x

y =

1 |

P|

X

x∈P

x

p

!

1_p 13

(31)

畳込層

•

レヤいフル使用

•

ハパーパラメー：ーネル、パッデン、トラド • 重ーネル表現 • パッデン解像度不変化 • トラド解像度変化

(32)

畳込層

•

ハパーパラメー：ーネル、パッデン、トラド • 重ーネル表現 • パッデン解像度不変化 • トラド解像度変化出力入力 14

(33)

畳込層

•

ハパーパラメー：ーネル、パッデン、トラド • 重ーネル表現 • パッデン解像度不変化 • トラド解像度変化出力入力

(34)

畳込層・解像度変換

トラド数三種類畳込レヤー

1. Convolution

• ーネル3 × 3，パデン 1 × 1，トラド

2. Downsampling Convolution

• ーネル3 × 3，パデン 1 × 1，トラド

3. Upsampling Convolution

• ーネル3 × 3，パデン 1 × 1，トラド1_/₂ Down-convolution Flat-convolution Up-convolution stride stride stride 15

(35)

CNN レヤついて

•

畳込層 • 空間配置保護 • パラメー少い • 解像度変換可

•

プーリンレヤ • 小さい移動不変性 • トラドあ畳込層ういい

•

全結合層 • 入力固定 • パラメー多い • 画像出力不必要

(36)

残差の学習

•

関数

f (x)

代わ残差関数

∆

f (x)

学習

∆

f (x) = f (x) − x

•

仮定：出力入力類似

•

重

0

恒等写像

• ILSVRC2015

画像分類コンペテョン優勝 Neural Network

Input

Output

17

(37)

残差の学習

•

関数

f (x)

代わ残差関数

∆

f (x)

学習

∆

f (x) = f (x) − x

•

重

0

恒等写像

• ILSVRC2015

画像分類コンペテョン優勝 Neural Network

Input

Output

(38)

残差の学習

•

関数

f (x)

代わ残差関数

∆

f (x)

学習

∆

f (x) = f (x) − x

•

重

0

恒等写像

• ILSVRC2015

画像分類コンペテョン優勝

He et al. Deep Residual Learning for Image Recognition. CVPR, 2016.

(39)

全層畳込ニューラルネットワー

•

畳込層使用

•

任意解像度処理可

•

ンコーデーコー型 • メモリー減 • 空間解像度上 Flat-convolution Up-convolution 2×2 4×4 8×8 4×4 2×2 × × Down-convolution

(40)

空間解像度

•

出力一個画素計算入力範囲

•

レヤ、ーネルや解像度決定

•

画像処理問題重要 Object Ω Ω Spatial Support Ω Ω 19

(41)

モデルの容量ついて

•

覚え能力

•

モデルパラメー決定 • 普段 100 万以上

•

学習難度関係

•

使用メモリや計算時間増加少モデル

(

少いレヤやャンネル

)

•

小容量

•

学習簡単

•

訓練デー少いい大モデル

(

多いレヤやャンネル

)

•

大容量

•

学習困難

•

大規模デー必要

(42)

モデルの容量ついて

•

覚え能力

•

モデルパラメー決定 • 普段 100 万以上

•

学習難度関係

•

使用メモリや計算時間増加少モデル

(

少いレヤやャンネル

)

•

小容量

•

学習簡単

•

訓練デー少いい大モデル

(

多いレヤやャンネル

)

•

大容量

•

学習困難

•

大規模デー必要 20

(43)

(44)

デープラーニン

向いてい問題ついて

•

デー重要

•

デープラーニン万能い

•

問題選ぶ大事

•

適切問題い • 入力出力決い、情報処理問題 • 正解一問題人間 • デー集 21

(45)

デープラーニン

向いてい問題ついて

•

デー重要

•

デープラーニン万能い

•

問題選ぶ大事

•

適切問題い • 入力出力決い、情報処理問題 • 正解一問題人間 • デー集

(46)

向いてい問題・画像分類

•

画像分類 • 入力：画像 • 出力：ラ確率

•

デープラーニン代表的問題

•

入力出力決い

•

大規模デーあ

ImageNet

Krizhevsky et al. ImageNet Classiication with Deep Convolutional Neural Networks. NIPS, 2012.

(47)

向いてい問題・画像分類

•

画像分類 • 入力：画像 • 出力：ラ確率

•

デープラーニン代表的問題

•

入力出力決い

•

大規模デーあ

ImageNet

(48)

向いてい問題・領域分割

•

領域分割 • 入力：画像 • 出力：画像各領域ラ確率

•

デー作成難い

•

ラ数少い

• ImageNet

学習済モデル利用可

Chen et al. The Role of Context for Object Detection and Semantic Segmentation in the Wild. CVPR, 2014.

(49)

向いてい問題・領域分割

•

領域分割 • 入力：画像 • 出力：画像各領域ラ確率

•

デー作成難い

•

ラ数少い

• ImageNet

学習済モデル利用可

(50)

向いてい問題・超解像度

•

超解像度 • 入力：画像 • 出力：高解像度画像

•

デー集やい

•

解決問題

•

画像処理問題扱い

Kim et al. Accurate Image Super-Resolution Using Very Deep Convolutional Networks. CVPR, 2016

(51)

向いていい問題・画像補完

•

画像補完 • 入力：画像＋マ • 出力：画像

•

画像作出苦手

•

高解像度苦手

•

決形出力苦手

N. Komodakis and G. Tziritas. Image completion using eicient belief propagation via priority scheduling and

(52)

向いていい問題・画像補完

•

画像作出苦手

•

高解像度苦手

•

決形出力苦手

Pathak et al. Context Encoders: Feature Learning by Inpainting. CVPR, 2016.

(53)

向いていい問題・画像補完

•

画像作出苦手

•

高解像度苦手

•

決形出力苦手

(54)

向いていい問題・画像生成

•

画像生成 • 入力：ランムノ • 出力：画像

•

教師学習苦手

•

出力固定

•

解像度低い

(55)

向いていい問題・画像生成

•

画像生成 • 入力：ランムノ • 出力：画像

•

教師学習苦手

•

出力固定

•

解像度低い

(56)

デープラーニン

向いてい問題のとめ

向いい問題

•

デー多い

•

正解デー決い

•

入力出力固定さい

•

学習済モデル利用向いいい問題

•

デー少い

•

教師学習

•

入力出力固定さいい

•

ユーー編集

•

高解像度 27

(57)

データついて

•

必要？ • 情報流い考えい • ララベル情報少い　→　100 万枚以上使用 • 領域分割ラベル情報多い　→　 1 万枚未満

•

品質大事

•

デー増加 • 反転、回転、明度、コントラト、ーリン …

vs

(58)

データついて

•

品質大事

•

デー増加 • 反転、回転、明度、コントラト、ーリン … Cat Cat

Lin et al. Microsoft COCO: Common Objects in Context. arXiv, 2014.

(59)

データついて

•

品質大事

•

デー増加 • 反転、回転、明度、コントラト、ーリン …

(60)

データ収集ついて

•

公開デーット

(ImageNet, Places2, …)

• 著作権問題 • 相応いデーット存在

•

公開デー

(Flickr, Twitter, …)

• 著作権問題 • ラベルい

•

自分デー集 • 時間金 • 正確ラベル難い • 多量デー必要

デー自体価値あ！！！

29

(61)

データ収集ついて

•

公開デーット

(ImageNet, Places2, …)

• 著作権問題 • 相応いデーット存在

•

公開デー

(Flickr, Twitter, …)

• 著作権問題 • ラベルい

•

自分デー集 • 時間金 • 正確ラベル難い • 多量デー必要

デー自体価値あ！！！

(62)

(63)

学習の基礎

1.

デーット訓練用検証用テト用分 1.1 訓練用デーモデル重学習さ 1.2 検証用デーハパパラメー決 1.3 テト用デー最後評価！

2.

デーットランム順番

3.

バッ学習さ 3.1 小さ不安定 3.2 大遅さ精度さ 3.3 問題違う分類〜128、領域分割〜8

4.

誤差逆伝播法ロ関数最小化

5.

二点問題点 5.1 ンーフッテン 5.2 ーバーフッテン過学習

(64)

学習の基礎

1.

2.

3.

4.

5.

二点問題点 5.1 ンーフッテン 5.2 ーバーフッテン過学習 30

(65)

学習の基礎

1.

2.

3.

4.

5.

二点問題点 5.1 ンーフッテン 5.2 ーバーフッテン過学習

(66)

誤差逆伝播法

•

パラメー更新：

w

_ji

←

w

_ji

− λ

∂L ∂w_ji

•

誤差出力入力逆伝播さ

∂

L

∂

w

_ji

=

∂

L

∂

x

n

∂

x

n

∂

x

n−1

. . .

∂

x

i

∂

w

_ji ニューラルネットワーク 23.8% Music Store 15.3% Basement 7.9% Cathedral 2.1% Airport ... 推定順伝播 0.0% Music Store 100% Basement 0.0% Cathedral 0.0% Airport ... 誤差正解逆伝播 31

(67)

誤差関数

•

平均二乗誤差

(Mean Squared Error

MSE)

• y: モデル出力 • y∗: 正解

L(y, y

∗

) =

1 n

n

X

i=1

(

y

i

−

y

i∗

)

2

•

負対数尤度

(Negative Log-Likelihood

NLL)

• y: モデル出力対数尤度 • l: 正解ラベル

L(y, l) = −y

l

(68)

モデルパラメータの更新

•

確率的勾配降下法

(Stochastic Gradient Descent

SGD)

• 一ハパーパラメー重更新: wi j ←wji− λ∂∂wL_ji

•

慣性

(Momentum)

• wi j wji vt vt vt 1 _wLi j

• Adagrad

• 重更新率異

• RMSprop

• Adagrad 最新版

• Adam

• 慣性やバ調整

• Adadelta

• ラーニンレート自動設定 33

(69)

モデルパラメータの更新

•

確率的勾配降下法

(Stochastic Gradient Descent

SGD)

• 一ハパーパラメー重更新: wi j ←wji− λ∂∂wL_ji

•

慣性

(Momentum)

• wi j ←wji−vt vt = γvt−1+ λ∂∂wL_ji

• Adagrad

• 重更新率異

• RMSprop

• Adagrad 最新版

• Adam

• 慣性やバ調整

• Adadelta

• ラーニンレート自動設定

(70)

モデルパラメータの更新

Alec Radford さニメーョン

(71)

(72)

モデルパラメータの更新・一番いい？

•

大概、精度高い

•

ラーニンレート重要

•

個人的、

Adadelta

使用

SGD

慣性

Adadelta

Adam

超解像度領域分割色付画像生成

[Dong+ 2014] [Nor+ 2015] [Iizuka+ 2016] [Radford+ 2016]

(73)

汎化能力

Generalizing Training

• Dropout

[Srivastava et al. 2014]

• 学習間ノードランムロ • モデル特定ノード依存い

•

バッ正規化

(Batch Normalization)

[Iofe and Szegedy 2015]

• 各層出力 N (0, 1) 正規化 • モデル中使用

•

デー増加 • 反転 • 小さい回転 • ロップ

(74)

学習の問題点

•

学習間ロ監視 • 低いロ必一番いいモデルい！！！ • 検証用デー精度使う

•

ンーフッテン • モデル重足い • 解決方法：重増や

•

ーバーフッテン • デー足汎化性能さ • 解決方法： dropout、デー増加… イテレーションモデル１訓練用データのロス 36

(75)

学習の問題点

•

ーバーフッテン • デー足汎化性能さ • 解決方法： dropout、デー増加… モデル１訓練用データのロス訓練用データのロスモデル２

(76)

学習の問題点

•

ーバーフッテン • デー足汎化性能さ • 解決方法： dropout、デー増加… イテレーションモデル１訓練用データのロスモデル１検証用データの精度訓練用データのロスモデル２検証用データの精度モデル２ 36

(77)

学習の問題点

•

ーバーフッテン • デー足汎化性能さ • 解決方法： dropout、デー増加… 訓練用データのロスロスが高い検証用データの精度訓練用データの精度精度が同じ

(78)

学習の問題点

•

ーバーフッテン • デー足汎化性能さ • 解決方法： dropout、デー増加… イテレーション訓練用データのロスロスが低いイテレーション検証用データの精度訓練用データの精度精度が大分違う 36

(79)

学習済のフルタ

•

低レベル：角、縁、色…

•

中レベル：テャ …

•

高レベル：犬顔、鳥足…

Layer 1 Layer 2 Layer 3 Layer 4

Low-Level Mid-Level High-Level

(80)

フ

ンチューニン

•

大規模デーモデル学習

•

最終層新い層入替え

•

新いデー学習続

•

小さいデーット性能向上

•

覚え忘さいう小さい学習率

•

最終層学習率大い ... ... ... Input Output Training 38

(81)

フ

ンチューニン

•

最終層学習率大い ... ... Input Output New!

(82)

フ

ンチューニン

•

最終層学習率大い ... ... ... Input Output Small Dataset Training 38

(83)

(84)

とめ

•

デー • 学習始前解析 • デー増加

•

モデル • バッ正規化 • 最初解像度減

•

学習 • 過学習気 • 検証用デー使用 • 解像度下い

•

学習 • ーバーフッテン気 • 学習中ロや検証用デー精度監視 39

(85)

(86)

ハッド

ついて

•

基本的

Nvidia

GPU

マン

• GPU

ああいい • 分散コンピューテン • ハパーパラメー・ューニン

• GPU

選択肢 1. ラドコンピューテン 2. Nvidia Tesla ーバー用 3. Nvidia GeForce 民生用

•

現在値段不安 40

(87)

ラドコンピューテン

•

長所 • 使う分払う • ーバー室不必要

•

短所 • 値段不安定 • デーット移動大変 NIPS @Reza_Zadeh

(88)

サーバー設置

•

電源工事必要ーバー一台

200V/30A

•

ーバー室重要点 • ラッ型 • 無停電電源装置 • 温度管理 • ネット速度 NAS 等

•

ーバー重要点 • デーット読込専用SSD • デー増加等 CPU • RAM 速度 42

(89)

サーバー設置

•

電源工事必要ーバー一台

200V/30A

•

ーバー室重要点 • ラッ型 • 無停電電源装置 • 温度管理 • ネット速度 NAS 等

•

ーバー重要点 • デーット読込専用SSD • デー増加等 CPU • RAM 速度

(90)

サーバー設置

(91)

Tesla 対 GeForce

注意：

Nvidia

ランデーンー

Tesla

使用可

• Tesla

• V100、 P100、 K80、 … + 高性能 + 低発熱量 - 値段高い - 不必要機能 FP64

• GeForce

• 1080、 Titan X、 … + 安い約割 - 高発熱量 - 壊やい

(92)

(93)

基本環境

•

基本的全部

Linux Ubuntu

LTS

等

•

線型代数学ラブラリ：

OpenBlas / Intel MKL

• Nvidia

深層学習ラブラリ

CUDNN

• Python

環境：

Anaconda

、

Docker

、 …

(94)

深層学習フレームワー

その

• Cafe

• C 言語 python 可 • 硬い、速効率的 • Cafe2 置換え

• PyTorch / Chainer

• Python 言語 • 動的ラフ定義 • 研究焦点当

• Tensorlow

• Python 言語 • 静的動的ラフ • 生産焦点当 45

(95)

深層学習フレームワー

その

• Cafe

• PyTorch / Chainer

• Tensorlow

• Python 言語 • 静的動的ラフ • 生産焦点当

(96)

深層学習フレームワー

その

• Cafe

• PyTorch / Chainer

• Tensorlow

• Python 言語 • 静的動的ラフ • 生産焦点当 45

(97)

深層学習フレームワー

その

• Cafe2

• C++言語 • PyTorch 補足

• Torch

• Lua 言語 • ラブラリ少い • PyTorch 置換え

•

さあ！

(98)

深層学習フレームワー

その

• Cafe2

• Torch

•

さあ！ 46

(99)

深層学習フレームワー

その

• Cafe2

• Torch

•

さあ！

(100)

ONNX: Open Neural Network Exchange

•

モデルフーマット

•

複数フレームワー対応

• python

モデル学習、

C++

ンドロド等デプロ

•

全部レヤ対応いい

学習

モデルモデル

デプロイ

47

(101)

(102)

ラフスッチの線画化

(103)

ラフスッチの線画化

(104)

ラフスッチの線画化

ラフッ線画ラフッ線画

(105)

最初の結果

•

簡単モデル定義

•

デー揃え学習さ

(106)

最初の結果

•

簡単モデル定義

•

デー揃え学習さ

•

ラフッ正解デー合わ

(107)

逆方向データ制作

•

デー品質重要

•

ラフ線画化合わい通常デー作成

•

線画ラフ化ぴ逆方向デー作成

(108)

ラフスッチデータセット

• 68

枚ラフッ線画ペ

• 5

人ラトレーー

• 424 × 424

画素画像パッ使用・・・ Extracted patches Sketch dataset ・・・ 53

(109)

データ拡大

• 68

枚デーット足い

•

訓練デー画像ーリン

•

学習間ランム回転反転

•

入力画像さ加工：トーン調整、ぶ、ノ入力トーン調整ぶノ

(110)

全層畳込ニューラルネットワー

トラド数三種類畳込レヤー

1. Flat-convolution

1.1 ーネル3 × 3，パデン 1 × 1，トラド

2. Down-convolution

2.1 ーネル3 × 3，パデン 1 × 1，トラド

3. Up-convolution

3.1 ーネル4 × 4，パデン 1 × 1，トラド1_/₂ Down-convolution Flat-convolution Up-convolution stride stride stride 55

(111)

モデル

• 23

層

•

出力解像度入力同

•

ンコーー・デーコーー型 • メモリー減 • 空間解像度上 Flat-convolution Up-convolution 2×2 4×4 8×8 4×4 2×2 × × Down-convolution

(112)

学習

•

全層ランム重学習

•

損失関数重平均二乗誤差使用

•

バッ正規化

[Iofe and Szegedy 2015]

必要

• ADADELTA [Zeiler 2012]

最小化

入力出力正解

(113)

実験環境

• Intel Core i7-5960X CPU (3.00GHz)

• NVIDIA GeForce TITAN X GPU

•

学習時間約

3

週間

• GPU

使う一秒以内処理可能解像度画素数

CPU (

秒

) GPU (

秒

)

加速

320 × 320

102,400

2.014

0.047 42.9×

640 × 640

409,600

7.533

0.159 47.4×

1024 × 1024 1,048,576

19.463

0.397 49.0×

(114)

比較

入

力

Potrace

Adobe Live Trace

提

案

手

法

(115)

比較

入

力

Potrace

Adobe Live Trace

提

案

手

(116)

結果

(117)

(118)

(119)

自動色付け

(120)

データついて

•

簡単作

•

現代ラー写真白黒

• MIT

Places

デーット使用

[Zhou et al. 2014]

Abbey Airport terminal Aquarium Baseball field

Dining room Forest road Gas station Gift shop

⋯

(121)

問題の難度

•

パッ見空天井区別い

•

モデル改良必要

(122)

問題の難度

•

• ？

正解デー普通

CNN

63

(123)

問題の難度

•

(124)

モデルの改造

•

モデル色予想、白黒写真加え

•

問題パッ情報足い

•

解決方法：大域特徴利用

•

提案統合レヤパッ大域特徴結合彩度マップ中レベル特徴抽出ネットワーク色付けネットワーク輝度マップ（入力画像）低レベル特徴抽出ネットワーク 64

(125)

モデルの改造

•

モデル色予想、白黒写真加え

•

問題パッ情報足い

•

解決方法：大域特徴利用

•

提案統合レヤパッ大域特徴結合彩度マップ中レベル特徴抽出ネットワーク色付けネットワーク輝度マップ（入力画像）低レベル特徴抽出ネットワーク大域特徴抽出ネットワーク統合レイヤ

(126)

統合レヤ

•

大域特徴局所特徴統合層

• W

、

b

学習さ

•

大域特徴局所特徴練込

•

解像度対応大域特徴抽出ネットワーク統合レイヤ

...

色付けネットワーク中レベル特徴抽出ネットワーク統合レイヤ 65

(127)

モデルと学習

•

全層ランム学習

• ADADELTA

使用

•

ロ使用 • MSE ロ色付学習さ • 分類誤差大域特徴学習支援彩度マップ中レベル特徴抽出ネットワーク色付けネットワーク輝度マップ（入力画像）低レベル特徴抽出ネットワーク大域特徴抽出ネットワーク統合レイヤ

(128)

モデルと学習

•

全層ランム学習

• ADADELTA

使用

•

ロ使用 • MSE ロ色付学習さ • 分類誤差大域特徴学習支援彩度マップ中レベル特徴抽出ネットワーク色付けネットワーク輝度マップ（入力画像）低レベル特徴抽出ネットワーク大域特徴抽出ネットワーク統合レイヤ 20.60% 庭園 16.13% アーチ 13.50% 修道院 7.07% 植物園 6.53% ゴルフ場推定シーン分類ネットワーク 66

(129)

(130)

比較

入力画像 [Larsson+ ’16] [Zhang+ ’16] [Iizuka+ ’16]

(131)

比較

(132)

比較

入力画像 [Larsson+ ’16]

[Zhang+ ’16] [Iizuka+ ’16]

(133)

とめ

•

自動線画化 • モデル簡単 • デー作成難い Flat-convolution Up-convolution 2×2 4×4 8×8 4×4 2×2 × × Down-convolution

•

自動色付 • 大規模デー • 普通モデルあういい彩度マップ中レベル特徴抽出ネットワーク色付けネットワーク輝度マップ（入力画像）低レベル特徴抽出ネットワーク統合レイヤ 20.60% 庭園

(134)

おわ

•

理論経験大事

•

い考えいいい • デー調 • モデル構想 • 学習実装

•

デープラーニン機械学習民主化

•

いう

•

研究ペー恐い

•

いい試経験積う 70

(135)

おわ

•

理論経験大事

•

いう

•

研究ペー恐い

•

いい試経験積う

(136)

おわ

•

理論経験大事

•

いう

•

研究ペー恐い

•

いい試経験積う 70

(137)

補助資料

•

モラドー

http://hi.cs.waseda.ac.jp/˜esimo/

•

自動線画化試

http://hi.cs.waseda.ac.jp:8081/

深層学習の基礎と導入に向けて

深層学習の基礎と 導入 向けて

自己紹介

• 2015

7

BarcelonaTech

• 2015

8

2017

3

• 2017

4

• 2018

4

目次

1.

2.

3.

4.

5.

深層学習の歴史

•

1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

深層学習の歴史

• 1957 Perceptron

•

1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

•

1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

•

1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

• 2016 AlphaGo

• …

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

•

2012 AlexNet

•

2014 GoogleNet / VGG

• 2016 AlphaGo

• …

深層学習の歴史

• 1957 Perceptron

• 1980 Neocognitron

• 1986 Backpropagation

• 1998 LeNet

• 2012 AlexNet

• 2014 GoogleNet / VGG

•

2016 AlphaGo

深層学習の基礎と導入向けて

教師あ学習

深層学習のよくあ問題

深層学習のよくあ問題

深層学習のよくあ問題

深層学習のよくあ問題

深層学習の例・分類

深層学習の例・分類

人工ニューラルネットワー