スライド研究会首都大学東京自然言語処理研究室（小町研）

(1)

Chainer 入門

(2)

Chainerとは

・ニューラルネットワーク実装のためのライブラリ

・簡単かつ直感的に記述できる

(3)

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

(4)

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

(5)

ニューラルネット

・・・

t a n h

(6)

Variable

・・・

t a n h

(7)

Variable

・

変数に対応するオブジェクト

iルport nuルpy

froル chainer iルport Variabリe

x セ Variabリe(nuルpy.array([[1, 2, 3], [4, 5, 6]], dtype セ nuルpy.fリoat32)) y セ x ** 2 + 5 * x

y.grad セ nuルpy.ones((2, 3), dtypeセnuルpy.fリoat32) #勾配の次元を定義

y.bacラward() #微分の計算 (y’セ 2 * x + 5)

(8)

Variable

・

arrayをVariableにすることで微分の計算が可能に

・

Variableとして使用するarrayのdtypeは

(9)

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

(10)

ニューラルネット

・・・

t a n h

(11)

links

・・・

t a n h

(12)

links

・

重み行列に対応するオブジェクト

iルport nuルpy

froル chainer iルport Variabリe, リinラs

h セリinラs.Linear(4, 2) #2×4の重み行列を作成

print(h.W.data) #hの重み行列

print(h.b.data) #hのバイア

x セ Variabリe(nuルpy.array([[1, 2, 3, 4]]).astype(nuルpy.fリoat32)) y セ h(x)

(13)

links

・

linksで重み行列を定義することで

重みとバイアスの初期値も定義される

・

ほとんどのlinksに入力するVariableは

バッチサイズデータの次元数の行列

(14)

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

(15)

ニューラルネット

・・・

t a n h

(16)

functions

・・・

t a n h

(17)

functions

・

Variableに対応した関数

iルport nuルpy

froル chainer iルport Variabリe, functions

x セ Variabリe(nuルpy.array([[1, 2, 3], [4, 5, 6]], dtype セ nuルpy.fリoat32)) y セ functions.tanh(x)

print(y.data)

y.grad セ nuルpy.ones((2, 3), dtypeセnuルpy.fリoat32) #勾配の次元を定義

y.bacラward() #微分の計算 (y’セ 1 – y ** 2)

(18)

functions

・

functionsは活性化関数や損失関数を含め

様々な関数が提供されている

(19)

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

(20)

optimizers

・

最適化(重みの更新)アルゴリズムに対応する

・

確率的勾配降下法（SGD）をはじめ

様々な最適化アルゴリズムが提供されている

froル chainer iルport optiルizers

ルodeリセ NeuraリNetworラ(input_size) #モの生成

opt セ optiルizers.SGD(リrセλ) #最適化アゴムの定義

(21)

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

(22)

serializers

・

モデルのセーブ・ロードに関するモジュール

・

pickleのchainer版みたいな

froル chainer iルport seriaリizers

seriaリizers.save_npz(ルodeリ_path, ルodeリ) #モの保存

(23)

実際の利用例

・

NLPチュートリアルの課題をChainerで実装

・

文書分類（1 or -1）

・モデルの定義

・最適化アルゴリズムの定義

・学習

(24)

モデルの定義

・・・

t a n h

(25)

モデルの定義

cリass NeuraリNetworラ(Chain):

def __init__(seリf, input_size):

super(NeuraリNetworラ, seリf).__init__(

リinラ1 セリinラs.Linear(input_size, 2), #入力層→中間層

リinラ2 セリinラs.Linear(2, 1), #中間層→出力層

)

def __caリリ__(seリf, x, y):

y_predict セ seリf.forward(x) #順伝搬 yを予測

return functions.ルean_squared_error(y_predict, y) / 2 #損失関数

def forward(seリf, x):

hidden セ functions.tanh(seリf.リinラ1(x)) #中間層を計算

(26)

順伝搬

・・・ t a n h t a n h

�

_" Vector (Vocab)

�

_# Vector (2)

�

_" Matrix (2, Vocab)

�

_" Vector (2)

(27)

順伝搬

t a n h

�

_,

= tanh

�

_#

�

_#

+

�

_#

(28)

モデルの定義

・

順伝搬の定義が簡単にできる

・

functionsには損失関数として二乗誤差

(29)

最適化アルゴリズムの定義

・

確率的勾配降下法（SGD）で最適化

・

この3行で最適化アルゴリズムが設定可能

ルodeリセ NeuraリNetworラ(input_size) #モの生成

opt セ optiルizers.SGD(リrセλ) #最適化アゴムの定義

(30)

学習

for i in range(epoch):

accuル_リoss セ 0 #そのepoch の誤差の合計を初期化

for phi_0, y in feat_リab:

ルodeリ.zerograds() #勾配の初期化

リoss セルodeリ(Variabリe(phi_0), Variabリe(y)) #誤差の計算

accuル_リoss +セリoss.data #計算した誤差を蓄積しいく

リoss.bacラward() #逆伝搬、勾配の計算

opt.update() #重みの更新

print(accuル_リoss) #そのepoch の誤差の合計

(31)

逆伝搬

t a n h

�

err =

�

,

− �

,

2 �

_,

=

derr

d�

_,

=

�

,

− �

�

_,

5 =

derr

d

�

_#

�

_#

+

�

_#

=

derr

d�

_,

d�

_,

d

�

_#

�

_#

+

�

_#

(32)

逆伝搬

t a n h

�

_# Vector (2)

�

_#

=

derr

d�

_#

=

derr

d

�

_#

�

_#

+

�

_#

d

�

_#

�

_#

+

�

_#

d

�

_#

=

�

_,

5 �

_#

�

_# Matrix (1, 2)

�

_# Vector (1)

�

5_,

(33)

逆伝搬

t a n h t a n h

�

_#

5 =

derr

d

�

_"

�

_"

+

�

_"

=

derr

d�

_#

d�

_#

d

�

_"

�

_"

+

�

_"

=

�

_#

1 −

�

_#

,

(34)

逆伝搬

�

_" Matrix (2, Vocab)

�

_" Vector (2)

�

_"

=

derr

d�

_"

=

derr

d

�

_"

�

_"

+

�

_"

d

�

_"

�

_"

+

�

_"

d

�

_"

=

�

_#

5 �

_"

�

5_#

Vector (2)

�

_"

(35)

重みの更新

�

_"

−= λ

89::

8 ;

_<

= λ

�

_#

5

8 ;

<

=

<

>

?

<

8 ;

_<

= λ

�

_#

5 �

_"

�

_"

−= λ

89::

8 ?

_<

= λ

�

_#

5

8 ;

<

=

<

>

?

<

8 ?

_<

= λ

�

5 �

5

(36)

重みの更新

t a n h

�

5_,

Vector (1)

�

_# Vector (2)

�

_# Matrix (1, 2)

�

_# Vector (1)

�

_#

−= λ

89::

8 ;

_@

= λ

�

_,

5

8 ;

@

=

@

>

?

@

8 ;

_@

= λ

�

_,

5 �

_#

�

_#

−= λ

89::

8 ?

_@

= λ

�

_,

5

8 ;

@

=

@

>

?

@

8 ?

_@

(37)

学習

・

複雑だった逆伝搬の計算、重みの更新が

それぞれ1行ずつで記述可能

リoss.bacラward()

(38)

テスト

ルodeリセ NeuraリNetworラ(input_size)

seriaリizers.リoad_npz(ルodeリ_path, ルodeリ) #モをロー

with open(fin_path, "r") as fin: for x in fin:

phi_0 セ create_features(x)

score セルodeリ.forward(Variabリe(phi_0)) #順伝搬 scoreを計算

(39)

その他にも様々な機能

・

linksにはLSTMやConvolutionなどもあるので

RNNやCNNも実装できる

・

optimizersにはSGD以外にもいろいろ

・

functionsもいろいろ

(40)

まとめ

・ Chainerを使うと複雑な構造が簡単に書ける

・特に勾配の計算を記述しなくて良いのが楽

スライド 研究会 首都大学東京 自然言語処理研究室（小町研）

Chainer 入門

Chainerとは

・ ニューラルネットワーク実装のためのライブラリ

・ 簡単かつ直感的に記述できる

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

ニューラルネット

Variable

Variable

・

変数に対応するオブジェクト

Variable

・

arrayをVariableにすることで微分の計算が可能に

・

Variableとして使用するarrayのdtypeは

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

ニューラルネット

links

links

・

重み行列に対応するオブジェクト

links

・

linksで重み行列を定義することで

重みとバイアスの初期値も定義される

・

ほとんどのlinksに入力するVariableは

バッチサイズ データの次元数の行列

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

optimizers

ニューラルネット

functions

functions

・

Variableに対応した関数

functions

・

functionsは活性化関数や損失関数を含め

様々な関数が提供されている

Chainerの基本的な機能

・

Variable

・

links

・

functions

・

スライド研究会首都大学東京自然言語処理研究室（小町研）

・ニューラルネットワーク実装のためのライブラリ

・簡単かつ直感的に記述できる

バッチサイズデータの次元数の行列

_,

_#

_#

_#