• 検索結果がありません。

第 3 章 提案手法

3.3 認証システムの実装

3.3.5 ユーザ共通識別器

使用する識別器はガウシアンカーネルを導入したSVMである.本研究ではユーザ個々に 識別器を生成するのではなく,全ユーザ共通の識別器により本人認証を行う手法を採用す

67

る.この理由は,識別器を構成する際の問題として,開発者側がシステムを使用するユー ザの歩行信号を予測し,ユーザごとに類似の他人の信号を収集することが困難なためであ る.精度の高い識別器を作成するためには,歩行信号が著しく異なる人物のみを学習デー タとして使用するよりも,認証する人物と信号が類似している人物の信号を,拒否すべき 他人の信号として学習し,各種距離に対する適切なパラメータを決定する必要がある.し かし,測定した信号から実際の歩行動作を予測することは難しく,そのような類似の信号 を有する人物を選んで,他人の信号として収集をすることは,ユーザの信号がシステムへ 登録された後であっても困難であると考えられる.したがって,そのユーザのみの事前登 録信号だけでは,類似の人物との間で学習データを生成することは,歩行認証においては 困難であると予測される.

署名のオンライン認証に関する研究[89]において,ユーザごとに,その人物のなりすまし 署名を大量に収集することは困難であることから,訓練データからユーザ依存性を無くし,

ユーザ共通識別器を構成することで認証精度を高める手法が報告されている.この操作に より,ユーザの区別が無い本人・他人の 2 クラス問題とし,他のユーザのなりすまし署名 も訓練データとして識別器の学習に利用ができる様になる.この研究を基に,本研究にお いても識別器は距離を基に認証すべき人物であるかを判定する 2 クラス分類を行うユーザ 共通の識別器として構成する.本研究においてはこの研究と異なり,なりすまし者の訓練 データを増やすことはできないが,学習データ生成の際に,本人信号として利用する人物 を増やすことができる.したがって,事前登録した信号の中で訓練データを生成する際,

本人信号が 1 名である個別識別器と比較した場合,本人-他人の組み合わせが増えること から,類似性の高い他人の信号との間で計算した距離が得られる可能性を高められる.類 似性の高い他人を訓練データとして取得することにより,識別器の高精度化が実現できる 可能性があるとの考えのもとに,このユーザ共通識別器を採用した.

本研究の識別器は,テンプレート信号と入力信号との間で計算された距離が同一人物の 信号間で計算されたのか,異なる人物の信号間で計算されたのかの識別を行う.同一人物 と判定された場合は認証要求を受け入れ,異なる人物間の距離の場合は認証を拒否する.

信号間距離の標準化

計算された距離が同一人物の信号間で計算されたのか,異なる人物の信号間で計算され たのかのみを識別するユーザ共通の識別器を構築するため,訓練データからは個人に依存

68

した特徴を排除する必要がある.そのため,DTWにより得られた信号間距離𝐷(𝑿, 𝒀)に対し て,Z標準化を適用する.距離𝐷(𝑿, 𝒀)にZ標準化を適用した距離𝐷𝑠(𝑿, 𝒀)は以下の式で計算 することが出来る[90].

𝐷𝑠(𝑿, 𝒀) =𝐷(𝑿, 𝒀) − 𝐷(𝒀)̅̅̅̅̅̅̅

𝜎(𝒀) (3.12)

𝐷(𝒀)̅̅̅̅̅̅̅は,𝒀をテンプレート信号とした場合の登録ユーザ全ての事前登録信号との距離平均

値を示す.𝜎(𝒀)は,𝒀をテンプレート信号として計算した場合の,全ての登録ユーザの登録 信号との間で計算された距離の標準偏差を示す.これにより,各ユーザのテンプレートと 入力信号との間で計算された距離の集合は,平均が0,標準偏差1となる.この計算で必要 となる平均値や標準偏差は事前登録信号を基に計算されるため,入力信号を含めた場合,

本来の値とは異なる可能性が存在する.しかしながら,バイオメトリクス認証において,

入力信号は事前に得られないため,事前登録信号のみを基に算出されたものを使用して各 値の決定が行われる [59].

学習に使用するデータ数の調整

本人信号間については 1 個の準周期信号をテンプレート信号,残りを入力信号とする全 ての組み合わせで学習に使用するデータである距離(本人距離)を算出する.一方,他人 の信号との間の距離(他人距離)については,他ユーザの全ての事前登録信号との準周期 信号の組み合わせについて距離計算を行う.結果として他人距離算出の信号の膨大な組み 合わせ数となり,正例(本人距離)の数と,負例(他人距離)の数に偏りが生じる.この 様なデータを不均衡データと呼び,SVMやニューラルネットワーク,決定木のようなアル ゴリズムにおいて,識別精度が悪化することが知られている.そのため,本人・他人を高 い精度で識別できる識別器を構築するためには,クラスの偏りを解消してから学習を行う ことが必要とされる.これを解決するために,間引きを行い,データ数を調整する方法や,

クラスごとに異なるペナルティを設定し,学習を制御する方法[91]が提案されている.

本研究では k-最近傍法により得た近傍の同クラスの訓練データとの間に,新たに訓練デ ータを追加する手法であるSynthetic Minority Over-sampling Technique (SMOTE) [92]を適用 した.数が少ない正例は学習データを増加させ,数が多い負例はランダムに間引きを行い,

69

それぞれのクラスに属する学習データ数を同数に近づけてから識別器の学習を行った.