比較モデル

第 5 章筆者照合手法の高精度化に向けた検討

5.2 Metric Learning 手法による照合性能の比較

5.2.1 比較モデル

先行研究では，いずれも画像を直接入力して End-to-End モデルによる学習，

照合が行われている．End-to-Endによる処理では，最終的なモデルの出力（今回の場合であれば筆者の同一性）に沿った一連のモデルとして性能の高いモデルの構築が可能になると考えられる．ただし，本研究にあたっては，モデルの解釈可能性を考慮して，字種非依存型筆者照合の問題を字種非依存の特徴抽出部と照合部に分けてモデルを構築し，各モデル及びモデル全体での処理を把握することとした．そのため，第4章と同様にHFEM による特徴抽出で得られる潜在特徴 z を字種非依存な筆跡特徴とし，z 空間上での筆者照合モデルに用いる

Metric Learning手法について照合性能の比較を行う．

図 5.8に示す第4章で提案したSiamese Network構造のネットワーク（Siamese モデル）は，重み共有により学習される関数f(z)を通して得られる特徴について差の絶対値をとることで，入力ペアの特徴を統合する．さらに演算を通し，最終

的にSigmoid関数によって0～1に確率化された値として入力ペアが同一人であ

るか否かの確率を出力する．

Weight shared

f (z)

D1 D1-BN W-Out F-D2 F-D1-BN F-Act

D1 D1-BN W-Out

Same=0 Different=1 BCE

PReLU Batch Normalization

Dense Sigmoid

| f (zq)－f (zr) |

－

図 5.8 Siameseモデルのネットワーク構造

114

Triplet Network 構造のネットワーク（Triplet モデル）を図 5.9，Quadruplet Network 構造のネットワーク（Quadruplet モデル）を図 5.10に示す．文献 [68]

の Triplet Network の学習方法を参考に，表 5.6 で示す重み共有のネットワーク

dpositive

Weight shared

zanchor

zpositive

znegative

g (z)

D1 D1-BN Act1 D2 D2-BN Act2

Weight shared

D1 D1-BN Act1 D2 D2-BN Act2

Wpositive

Wanchor

Wnegative

dnegative

Softmax [0,1]

MSE

PReLU Batch Normalization

Dense Sigmoid

図 5.9 Tripletモデルのネットワーク構造

g (z)

d_positive Weight shared

zanchor

zpositive D1 D1-BN Act1 D2 D2-BN Act2

D1 D1-BN Act1 D2 D2-BN Act2

Weight shared

Wpositive

Wanchor

znegative-1 D1 D1-BN Act1 D2 D2-BN Act2 Wnegative-1

dnegative

Softmax [0,1]

MSE

PReLU Batch Normalization

Dense Sigmoid

znegative-2 D1 D1-BN Act1 D2 D2-BN Act2 Wnegative-2

Weight shared

図 5.10 Quadrupletモデルのネットワーク構造

115

g(z)を通して得られる特徴 W について，サンプル間でのユークリッド距離

（dpositive：同一人ペアの距離，dnegative：他人ペアの距離）を算出し，それらを連

結したものをSoftmax関数によって正規化した値（Ppositive，Pnegative）と教師データ（{0,1}）間の誤差を，式（5.1）に示す平均二乗誤差（Mean Squared Error; MSE）により求める．式（5.1）中のpは出力値，rは教師データ{0,1}を表し，MSEを

Triplet モデル及び Quadruplet モデルを学習するときの誤差逆伝搬に用いる誤差

関数とする．図 5.11 のように dpositiveと dnegativeを正規化した Ppositive と Pnegative

（Ppositive+Pnegative=1）について最適化（Ppositiveは0，Pnegativeは1に近づくように学習）することで，同一人ペアについてはdの値を小さく，他人ペアについてはd の値が大きくなるような特徴空間を得ることを目的とする．

𝑊𝑊𝑀𝑀𝐶𝐶 = 12�(𝑝𝑝

² ^𝑖𝑖

− 𝑝𝑝

_𝑖𝑖

)

𝑘𝑘=1

(5.1)

Output shape unit size

Input Input Input_dim

D1 Dense z dim

D1-BN BatchNormalization

Act1 Activation Activation=PReLU

D2 Dense z dim

D2-BN BatchNormalization

Output(Act2) Activation(Output) Activation=Sigmoid

Layer name Layer type Parameters

g(z) Model

表 5.6 g (z)の各層の詳細

1 P_negative 0

P_positive

N A

d_positive d_negative

N A

d_positive d_negative

1 P_negative

0 P_positive Optimize

図 5.11 最適化の流れ

116

Siameseモデルでは，TripletモデルとQuadrupletモデルとは異なり，類似性を

確率値で出力する処理を行っていることから，類似性を特徴空間内でのユークリッド距離により評価する方法とは本質的に異なる．そのため，図 5.12に示すユークリッド距離で評価するSiamese Network構造のモデル（Siamese_Distモデル）を加えた 4 モデルの Metric Learning 手法について比較を行う．なお，

Siamese_DistモデルはTripletモデル，Quadrupletモデルとは異なり1ユニットの出力であるため，Siameseモデルと同様に誤差関数にはBinary Cross Entropy（BCE）を用いる．

ドキュメント内深層学習を用いた特徴表現に基づく字種非依存型オフライン筆者照合に関する研究 (ページ 127-130)

第 5 章 筆者照合手法の高精度化に向けた検討

5.2 Metric Learning 手法による照合性能の比較

5.2.1 比較モデル

𝑊𝑊𝑀𝑀𝐶𝐶 = 12�(𝑝𝑝

− 𝑝𝑝

)

(5.1)

第 5 章筆者照合手法の高精度化に向けた検討