スケッチベース画像検索システムの基本構成

第 6 章光相関システムの応用Ⅱ：クロスドメイン検索システム 93

6.2 スケッチベース画像検索システムの基本構成

図6.1に構築したスケッチベース画像検索システムの基本構成を示す．本システムは大きく分けて特徴量抽出器，光相関用変換モジュール，光相関器の3つで構成される．

まず，特徴量抽出器によって用途に合わせた特徴量を抽出する．第2に，光相関用変換モジュールにより光相関用のデータに変換する．第3に，本論文で構築した光相関器によってデータ照合を行う．

6.2スケッチベース画像検索システムの基本構成

入力（クエリ）

特徴量抽出器光相関器

ハンドクラフト特徴抽出器

学習済み特徴抽出器

変換モジュール相関結果

相関演算

ホログラフィック光ディスク

（データベース）

図6.1:光相関用変換モジュールを導入したデータ照合システムの基本構成光相関用変換モジュールを導入した本システム構成は，様々な特徴量抽出器に適用展開が期待でき，電子コンピュータに於ける深層学習の研究で構築済みのモデルをそのまま転用して特徴量抽出器として用いることが可能であることも魅力である．

6.2.1 光相関用変換モジュールの学習

図6.2に光相関用変換モジュールの構成を示す．光相関用変換モジュールはその実数で構成された特徴量の近似を行い，その後バイナリ化し光相関器の開口サイズに合わせた円形のレイアウトに再配置する機能を持つ．

第6章光相関システムの応用Ⅱ：

クロスドメイン検索システム

autoencoder

入力層中間層

出力層

変換モジュール学習

二値化光相関用再配置

図6.2: autoencoderの学習に基づいて構築した光相関用変換モジュール.

ここで，2値化に向けた近似の層生成法としてニューラルネットワークの一種であ

るautoencoder [145]を用いて学習したことは特徴的である．通常の深層学習におい

ては要素数削減に用いるautoencoderであるが，本光相関用データ変換モジュールにおいてはバイナリ化における情報損失を可能な限り抑制するための要素数拡大に用いるため，中間層の次元数が入力層より大きいautoencoderを採用した．本実験で用い

たautoencoderは出力データが入力データをそのまま再現する3層のニューラルネッ

トワークである．autoencoderの学習の過程では入力されたデータは入力層から中間層，出力層に向けて伝播され，中間層は







w₁₁ w₁₂ ··· w_1i

w₂₁ w₂₂ ··· w_2i ... ... . .. ... w_j1 w_j2 ··· w_ji











 a₁

a₂ ... a_i





 +





 b₁

b₂ ... b_j







, (6.1)

m=f(u) (6.2)

6.2スケッチベース画像検索システムの基本構成

と表される．ここで，mは入力層の出力に対して重みをかけ，バイアスを加算した結果を活性化関数に入力した際の出力である．学習の過程では２乗和誤差

Loss(a, ˜a)=1 2

∑i k=1

( ˜a_k−a_k)² (6.3)

を損失関数として用いて，出力層が入力データと同じ値を持つように，誤差逆伝搬

法[146]によって，重みとバイアスを更新していく．本システムでは，バイナリ近似

のために，活性化関数として

f(u)=1/(1+exp (−gu−c)) , (6.4) を用いた．ここで，gとcはそれぞれ入力値とオフセット値であり，この式(6.4)中のゲインgを1より大きな数に設定することによって，シグモイド関数をステップ関数に近づけることができる．本実験ではg=1000を採用した．また，autoencoderの出力層の活性化関数に用いた活性化関数は，

f˜( ˜u)=tanh( ˜u) (6.5)

である．

autoencoderを用いてバイナリ化のための近似を行う層を生成することによって，任

意の行列サイズのバイナリ特徴量への変換が可能となる．これは，空間光変調器のサイズやレンズの開口サイズに合わせた要素数で最適化したバイナリ変換器を生成するために有効である．このように，中間層に対して制約を加えた状態で学習させることにより，制約を満たした光相関用バイナリ近似で用いる重みとバイアスを自動的に獲得可能である．autoencoderを学習させた後は，出力層を取り外し，中間層の出力を利用することで光相関用変換モジュール中のバイナリ近似機能として作用させることが

できる(図6.2)．また，2値化した特徴量を光相関器の開口サイズに合わせた円形のレ

イアウトに再配置するのは，光相関器においてSLM領域を最大限に利用できるデータサイズで演算を行えるようにするためである．

第6章光相関システムの応用Ⅱ：

クロスドメイン検索システム

ドキュメント内ホログラフィック光相関システムとその応用に関する研究 (ページ 108-112)

第 6 章 光相関システムの応用Ⅱ：クロスドメイン検索システム 93

6.2 スケッチベース画像検索システムの基本構成

第 6 章光相関システムの応用Ⅱ：クロスドメイン検索システム 93