• 検索結果がありません。

通信理論に特化した深層学習 第6回ゼミ資料 誤差逆伝播法

N/A
N/A
Protected

Academic year: 2021

シェア "通信理論に特化した深層学習 第6回ゼミ資料 誤差逆伝播法"

Copied!
8
0
0

読み込み中.... (全文を見る)

全文

(1)

通信理論に特化した深層学習 第6回ゼミ資料

誤差逆伝播法

豊橋技術科学大学 電気・電子情報工学系

准教授 竹内啓悟

(2)

勾配の計算

損失関数を局所最小化するためには、順伝播型ネットワークに含まれるすべ てのパラメータに関する損失関数の偏微分を効率的に計算する必要がある。

「深層」合成関数のパラメータに関する偏微分を効率的に計算する問題

「深層」合成関数

𝒈𝒈 𝑡𝑡 ⋅, 𝜽𝜽 𝑡𝑡 : ℝ 𝑁𝑁

𝑡𝑡−1

× ℝ 𝑁𝑁

𝑡𝑡をパラメータ

𝜽𝜽 𝑡𝑡

を持つ微分可能なベクトル値関数とし、

𝑮𝑮 𝑡𝑡 𝑡𝑡

12

𝒛𝒛, 𝚯𝚯 𝑡𝑡 𝑡𝑡

12

= 𝒈𝒈 𝑡𝑡

2

∘ 𝒈𝒈 𝑡𝑡

2

−1 ∘ ⋯ ∘ 𝒈𝒈 𝑡𝑡

1

(𝒛𝒛, 𝜽𝜽 𝑡𝑡

1

), 𝚯𝚯 𝑡𝑡 𝑡𝑡

12

= 𝜽𝜽 𝑡𝑡

1

, … , 𝜽𝜽 𝑡𝑡

2

.

注意

𝑁𝑁 𝑇𝑇 = 1

として、スカラー関数

𝑔𝑔 𝑇𝑇 ⋅, 𝜽𝜽 𝑇𝑇 : ℝ 𝑁𝑁

𝑇𝑇−1

→ ℝ

に損失関数を含める。

(3)

偏微分の計算 偏微分の連鎖測

𝜕𝜕

𝜕𝜕𝜃𝜃 𝑖𝑖 𝑡𝑡 𝐺𝐺 1 𝑇𝑇 𝒙𝒙, 𝚯𝚯 1 𝑇𝑇 = �

𝑛𝑛=1 𝑁𝑁

𝑡𝑡

𝜕𝜕 𝑛𝑛 𝐺𝐺 𝑡𝑡+1 𝑇𝑇 𝒛𝒛 𝑡𝑡 , 𝚯𝚯 𝑡𝑡+1 𝑇𝑇 𝜕𝜕𝑔𝑔 𝑛𝑛 𝑡𝑡

𝜕𝜕𝜃𝜃 𝑖𝑖 𝑡𝑡 𝒛𝒛 𝑡𝑡−1 , 𝜽𝜽 𝑡𝑡 , 𝑔𝑔 𝑛𝑛 𝑡𝑡 = 𝒈𝒈 𝑡𝑡 𝑛𝑛 . 𝐺𝐺 1 𝑇𝑇 𝒙𝒙, 𝚯𝚯 1 𝑇𝑇 = 𝐺𝐺 𝑡𝑡+1 𝑇𝑇 𝒈𝒈 𝑡𝑡 𝒛𝒛 𝑡𝑡−1 , 𝜽𝜽 𝑡𝑡 , 𝚯𝚯 𝑡𝑡+1 𝑇𝑇 , 𝒛𝒛 𝑡𝑡 = 𝑮𝑮 1 𝑡𝑡 𝒙𝒙, 𝚯𝚯 1 𝑡𝑡 .

上記の表現の両辺を

𝜃𝜃 𝑖𝑖 𝑡𝑡 = 𝜽𝜽 𝑡𝑡 𝑖𝑖

に関して偏微分すると、

後者の因子は順伝播時に計算可能

𝐺𝐺 𝑡𝑡+1 𝑇𝑇 ⋅, 𝚯𝚯 𝑡𝑡+1 𝑇𝑇 𝒈𝒈 𝑡𝑡 (⋅, 𝜽𝜽 𝑡𝑡 )

𝑮𝑮 1 𝑡𝑡−1 ⋅, 𝚯𝚯 1 𝑡𝑡−1

𝒙𝒙 𝒛𝒛 𝑡𝑡−1 𝒛𝒛 𝑡𝑡

𝑡𝑡

番目の関数のパラメータ

𝜽𝜽 𝑡𝑡

に注目する。

(4)

𝐺𝐺 𝑡𝑡 𝑇𝑇 𝒛𝒛, 𝚯𝚯 𝑡𝑡 𝑇𝑇 = 𝐺𝐺 𝑡𝑡+1 𝑇𝑇 𝒈𝒈 𝑡𝑡 𝒛𝒛, 𝜽𝜽 𝑡𝑡 , 𝚯𝚯 𝑡𝑡+1 𝑇𝑇

𝜕𝜕 𝑛𝑛 𝐺𝐺 𝑡𝑡 𝑇𝑇 𝒛𝒛 𝑡𝑡−1 , 𝚯𝚯 𝑡𝑡 𝑇𝑇 = �

𝑁𝑁

𝑡𝑡

𝜕𝜕 𝑛𝑛 𝑔𝑔 𝑡𝑡

𝒛𝒛 𝑡𝑡−1 , 𝜽𝜽 𝑡𝑡 𝜕𝜕 𝑛𝑛

𝐺𝐺 𝑡𝑡+1 𝑇𝑇 𝒛𝒛 𝑡𝑡 , 𝚯𝚯 𝑡𝑡+1 𝑇𝑇

逆伝播

𝐺𝐺 𝑡𝑡+1 𝑇𝑇 ⋅, 𝚯𝚯 𝑡𝑡+1 𝑇𝑇 𝐺𝐺 𝑡𝑡 𝑇𝑇 ⋅, 𝚯𝚯 𝑡𝑡 𝑇𝑇

𝒈𝒈 𝑡𝑡 (⋅, 𝜽𝜽 𝑡𝑡 ) 𝒛𝒛 𝑡𝑡−1

上記の表現の両辺を

𝑧𝑧 𝑛𝑛 = 𝒛𝒛 𝑛𝑛

に関して点

𝒛𝒛 = 𝒛𝒛 𝑡𝑡−1

で偏微分すると、

𝒛𝒛 𝑡𝑡

表記法

関数

𝑓𝑓

𝑛𝑛

番目の変数に関する偏微分を

𝜕𝜕 𝑛𝑛 𝑓𝑓

と書く。

(5)

誤差逆伝播法(

Back propagation

𝐺𝐺 𝑡𝑡+1 𝑇𝑇 ⋅, 𝚯𝚯 𝑡𝑡+1 𝑇𝑇 𝒈𝒈 𝑡𝑡 ⋅, 𝜽𝜽 𝑡𝑡

𝑮𝑮 1 𝑡𝑡−1 ⋅, 𝚯𝚯 1 𝑡𝑡−1

𝒙𝒙 𝒛𝒛 𝑡𝑡−1 𝒛𝒛 𝑡𝑡

𝜕𝜕 𝑛𝑛 𝐺𝐺 𝑡𝑡+1 𝑇𝑇 𝒛𝒛 𝑡𝑡 , 𝚯𝚯 𝑡𝑡+1 𝑇𝑇 {𝜕𝜕 𝑛𝑛 𝐺𝐺 𝑡𝑡 𝑇𝑇 𝒛𝒛 𝑡𝑡−1 , 𝚯𝚯 𝑡𝑡 𝑇𝑇 }

逆伝播により、出力側から勾配を順に計算する。

𝜕𝜕

𝜕𝜕𝜃𝜃 𝑖𝑖 𝑡𝑡 𝐺𝐺 1 𝑇𝑇 𝒙𝒙, 𝚯𝚯 1 𝑇𝑇

手順1

順伝播により、

𝒛𝒛 𝑡𝑡 , 𝜕𝜕𝒈𝒈 𝑡𝑡 𝒛𝒛 𝑡𝑡−1 , 𝜽𝜽 𝑡𝑡 /𝜕𝜕𝜃𝜃 𝑖𝑖 𝑡𝑡 , 𝜕𝜕 𝑛𝑛 𝒈𝒈 𝑡𝑡 𝒛𝒛 𝑡𝑡−1 , 𝜽𝜽 𝑡𝑡

を計算する。

手順2

(6)

計算グラフ

計算結果が誤差逆伝播法による計算結果と等価になるように、

ノード間でやり取りされるメッセージを定義する。

𝑔𝑔 𝑛𝑛 𝑡𝑡−1 𝑔𝑔 𝑛𝑛 𝑡𝑡

𝑔𝑔 𝑡𝑡+1 𝑔𝑔 1 𝑡𝑡+1

𝛿𝛿 𝑛𝑛←𝑛𝑛 𝑡𝑡

𝛿𝛿 𝑛𝑛 𝑡𝑡+1

←1

𝛿𝛿 𝑛𝑛 𝑡𝑡+1

←𝑁𝑁

𝑡𝑡+1

𝛿𝛿 𝑡𝑡 = 𝜕𝜕 𝑔𝑔 𝑡𝑡 (𝒛𝒛 𝑡𝑡−1 , 𝜽𝜽 𝑡𝑡 ) �

𝑁𝑁

𝑡𝑡+1

𝛿𝛿 𝑡𝑡+1 𝑔𝑔 𝑡𝑡−1

𝑔𝑔 1 𝑡𝑡−1

𝑧𝑧 1 𝑡𝑡−1

𝑧𝑧 𝑁𝑁 𝑡𝑡−1

𝑡𝑡−1

関数

𝑔𝑔 𝑛𝑛 𝑡𝑡

𝑡𝑡

𝑛𝑛

番目のノードに対応付ける。

𝛿𝛿 𝑛𝑛←𝑛𝑛 𝑡𝑡

𝑡𝑡

𝑛𝑛

番目のノードから

𝑡𝑡 − 1

𝑛𝑛

番目のノードに送られるメッセージ

・・ ・

・・ ・ ・・ ・

(7)

計算結果の等価性

𝛿𝛿 𝑛𝑛←𝑛𝑛 𝑡𝑡

= 𝜕𝜕 𝑛𝑛 𝑔𝑔 𝑛𝑛 𝑡𝑡

𝒛𝒛 𝑡𝑡−1 , 𝜽𝜽 𝑡𝑡 𝜕𝜕 𝑛𝑛

𝐺𝐺 𝑡𝑡+1 𝑇𝑇 𝒛𝒛 𝑡𝑡 , 𝚯𝚯 𝑡𝑡+1 𝑇𝑇 .

誤差逆伝播法

𝜕𝜕 𝑛𝑛 𝐺𝐺 𝑡𝑡 𝑇𝑇 𝒛𝒛 𝑡𝑡−1 , 𝚯𝚯 𝑡𝑡 𝑇𝑇 = �

𝑛𝑛

=1 𝑁𝑁

𝑡𝑡

𝜕𝜕 𝑛𝑛 𝑔𝑔 𝑛𝑛 𝑡𝑡

𝒛𝒛 𝑡𝑡−1 , 𝜽𝜽 𝑡𝑡 𝜕𝜕 𝑛𝑛

𝐺𝐺 𝑡𝑡+1 𝑇𝑇 𝒛𝒛 𝑡𝑡 , 𝚯𝚯 𝑡𝑡+1 𝑇𝑇 .

計算グラフ

𝛿𝛿 𝑛𝑛←𝑛𝑛 𝑡𝑡−1

= 𝜕𝜕 𝑛𝑛 𝑔𝑔 𝑛𝑛 𝑡𝑡−1

(𝒛𝒛 𝑡𝑡−2 , 𝜽𝜽 𝑡𝑡−1 ) �

𝑛𝑛

′′

=1 𝑁𝑁

𝑡𝑡

𝛿𝛿 𝑛𝑛 𝑡𝑡

←𝑛𝑛

′′

= 𝜕𝜕 𝑛𝑛 𝑔𝑔 𝑛𝑛 𝑡𝑡−1

𝒛𝒛 𝑡𝑡−2 , 𝜽𝜽 𝑡𝑡−1 𝜕𝜕 𝑛𝑛

𝐺𝐺 𝑡𝑡 𝑇𝑇 𝒛𝒛 𝑡𝑡−1 , 𝚯𝚯 𝑡𝑡 𝑇𝑇 .

帰納法による証明のスケッチ

三つの添え字を持つメッセージ

𝛿𝛿 𝑛𝑛←𝑛𝑛 𝑡𝑡

(3階のテンソル)が計算グラフ上を流れる。

TensorFlow

の名前の由来

最後の等号は、帰納法の仮定と逆伝播の定義式から従う。

(8)

計算グラフによる勾配計算

𝑔𝑔 𝑛𝑛 𝑡𝑡 ・・ ・

𝜃𝜃 𝑖𝑖 𝑡𝑡

𝑔𝑔 1 𝑡𝑡+1

𝑔𝑔 𝑁𝑁 𝑡𝑡+1

𝑡𝑡+1

入力メッセージの和を取り、宛先ノードに関する偏微分をかける。

𝛿𝛿 𝑛𝑛←1 𝑡𝑡+1

𝛿𝛿 𝑛𝑛←𝑁𝑁 𝑡𝑡+1

𝑡𝑡+1

𝜕𝜕𝑔𝑔 𝑛𝑛 𝑡𝑡

𝜕𝜕𝜃𝜃 𝑖𝑖 𝑡𝑡 𝜕𝜕 𝑛𝑛 𝐺𝐺 𝑡𝑡+1 𝑇𝑇

𝜃𝜃 𝑖𝑖 𝑡𝑡

𝑔𝑔 1 𝑡𝑡

𝑔𝑔 𝑁𝑁 𝑡𝑡

𝑡𝑡

・・ ・

𝜕𝜕𝑔𝑔 1 𝑡𝑡

𝜕𝜕𝜃𝜃 𝑖𝑖 𝑡𝑡 𝜕𝜕 1 𝐺𝐺 𝑡𝑡+1 𝑇𝑇

𝜕𝜕𝑔𝑔 𝑁𝑁 𝑡𝑡

𝑡𝑡

𝜕𝜕𝜃𝜃 𝑖𝑖 𝑡𝑡 𝜕𝜕 𝑁𝑁

𝑡𝑡

𝐺𝐺 𝑡𝑡+1 𝑇𝑇

入力メッセージの和を取る。

参照

関連したドキュメント

   騒音:伝播 ぱ

2 学校法人は、前項の書類及び第三十七条第三項第三号の監査報告書(第六十六条第四号において「財

添付資料4 地震による繰り返し荷重を考慮した燃料被覆管疲労評価(閉じ込め機能の維持)に

添付資料 4.1.1 使用済燃料貯蔵プールの水位低下と遮へい水位に関する評価について 添付資料 4.1.2 「水遮へい厚に対する貯蔵中の使用済燃料からの線量率」の算出について

添付資料 4.1.1 使用済燃料貯蔵プールの水位低下と遮へい水位に関する評価について 添付資料 4.1.2 「水遮へい厚に対する貯蔵中の使用済燃料からの線量率」の算出について

添付資料 4.1.1 使用済燃料プールの水位低下と遮蔽水位に関する評価について 添付資料 4.1.2 「水遮蔽厚に対する貯蔵中の使用済燃料からの線量率」の算出について

添付資料1 火災の影響軽減のための系統分離対策について 添付資料2 3時間耐火壁及び隔壁等の耐久試験について 添付資料3

添付資料 2.7.3 解析コード及び解析条件の不確かさの影響評価について (インターフェイスシステム LOCA).. 添付資料 2.7.4