第 6 章 光相関システムの応用Ⅱ:クロスドメイン検索システム 93
6.2 スケッチベース画像検索システムの基本構成
図6.1に構築したスケッチベース画像検索システムの基本構成を示す.本システムは 大きく分けて特徴量抽出器,光相関用変換モジュール,光相関器の3つで構成される.
まず,特徴量抽出器によって用途に合わせた特徴量を抽出する.第2に,光相関用変 換モジュールにより光相関用のデータに変換する.第3に,本論文で構築した光相関 器によってデータ照合を行う.
94
6.2スケッチベース画像検索システムの基本構成
入力(クエリ)
特徴量抽出器 光相関器
ハンドクラフト 特徴抽出器
学習済み 特徴抽出器
変換モジュール 相関結果
相関演算
ホログラフィック光ディスク
(データベース)
図6.1:光相関用変換モジュールを導入したデータ照合システムの基本構成 光相関用変換モジュールを導入した本システム構成は,様々な特徴量抽出器に適用 展開が期待でき,電子コンピュータに於ける深層学習の研究で構築済みのモデルをそ のまま転用して特徴量抽出器として用いることが可能であることも魅力である.
6.2.1 光相関用変換モジュールの学習
図6.2に光相関用変換モジュールの構成を示す.光相関用変換モジュールはその実数 で構成された特徴量の近似を行い,その後バイナリ化し光相関器の開口サイズに合わ せた円形のレイアウトに再配置する機能を持つ.
第6章 光相関システムの応用Ⅱ:
クロスドメイン検索システム
autoencoder
入力層 中間層
出力層
変換モジュール 学習
二値化 光相関用再配置
図6.2: autoencoderの学習に基づいて構築した光相関用変換モジュール.
ここで,2値化に向けた近似の層生成法としてニューラルネットワークの一種であ
るautoencoder [145]を用いて学習したことは特徴的である.通常の深層学習におい
ては要素数削減に用いるautoencoderであるが,本光相関用データ変換モジュールに おいてはバイナリ化における情報損失を可能な限り抑制するための要素数拡大に用い るため,中間層の次元数が入力層より大きいautoencoderを採用した.本実験で用い
たautoencoderは出力データが入力データをそのまま再現する3層のニューラルネッ
トワークである.autoencoderの学習の過程では入力されたデータは入力層から中間 層,出力層に向けて伝播され,中間層は
u=
w11 w12 ··· w1i
w21 w22 ··· w2i ... ... . .. ... wj1 wj2 ··· wji
a1
a2 ... ai
+
b1
b2 ... bj
, (6.1)
m=f(u) (6.2)
96
6.2スケッチベース画像検索システムの基本構成
と表される.ここで,mは入力層の出力に対して重みをかけ,バイアスを加算した結 果を活性化関数に入力した際の出力である.学習の過程では2乗和誤差
Loss(a, ˜a)=1 2
∑i k=1
( ˜ak−ak)2 (6.3)
を損失関数として用いて,出力層が入力データと同じ値を持つように,誤差逆伝搬
法[146]によって,重みとバイアスを更新していく.本システムでは,バイナリ近似
のために,活性化関数として
f(u)=1/(1+exp (−gu−c)) , (6.4) を用いた.ここで,gとcはそれぞれ入力値とオフセット値であり,この式(6.4)中の ゲインgを1より大きな数に設定することによって,シグモイド関数をステップ関数 に近づけることができる.本実験ではg=1000を採用した.また,autoencoderの出力 層の活性化関数に用いた活性化関数は,
f˜( ˜u)=tanh( ˜u) (6.5)
である.
autoencoderを用いてバイナリ化のための近似を行う層を生成することによって,任
意の行列サイズのバイナリ特徴量への変換が可能となる.これは,空間光変調器のサ イズやレンズの開口サイズに合わせた要素数で最適化したバイナリ変換器を生成する ために有効である.このように,中間層に対して制約を加えた状態で学習させること により,制約を満たした光相関用バイナリ近似で用いる重みとバイアスを自動的に獲 得可能である.autoencoderを学習させた後は,出力層を取り外し,中間層の出力を利 用することで光相関用変換モジュール中のバイナリ近似機能として作用させることが
できる(図6.2).また,2値化した特徴量を光相関器の開口サイズに合わせた円形のレ
イアウトに再配置するのは,光相関器においてSLM領域を最大限に利用できるデー タサイズで演算を行えるようにするためである.
第6章 光相関システムの応用Ⅱ:
クロスドメイン検索システム