4.6.1 照合範囲の調整
不均衡データ集合における照合範囲の拡大
照合範囲の更新において,図4.13の左図のように,クラス0とクラス1と分類で きる事前データが得られた際にそのデータに偏りが存在してしまう場合,ECS は 右図の様に一般化をしてしまうため,クラス0の事前データを用いた一般化された exemplarはクラス1の領域にまで及んでしまう過剰一般化(Over Generalization) により,適切な分類が困難となってしまう問題が生じる.そこで,ここでは更に,
データ集合に偏りが生じる問題において,シグモイド関数を用いた範囲の更新法を 提案する.
図4.13 不均衡データ集合に対する一般化の問題点
事前知識として得られるデータ集合におけるバランスの比率を使用して多数の入力 を持つデータ群に関しては,ゆっくり範囲を更新(拡大)していき,逆に少数の入 力データ群については,大きめに範囲を更新していく.
図4.14にシグモイド関数を示す.図4.14のxはデータ集合におけるバランスの比 率を,f(x)は更新量の係数をそれぞれ示す.例えば,データ集合において比率が 等しい場合は,全てのexemplarや生成exemplarの範囲の更新量は相手との距離
4.6. 不均衡データへのためのECS 第4. EXEMPLAR-BASED LCS
図4.14 シグモイド関数
となるが,データ入力のバランスが偏っている場合,少数入力のデータは範囲の更 新量は相手との距離となり,逆に,図4.15と4.16に示されるように,多数入力の データは相手との距離d と自身の範囲r との差にデータ入力の比率で算出される シグモイド関数を掛けた量が範囲の更新量となり,少しづつ範囲を拡大するように なる.
図4.15 多数データの範囲の更新イメージ
図4.16 少数データの範囲の更新イメージ
f(x)をς(x) としてシグモイド関数による範囲の更新度合いは以下の式で計算さ れる.
ς(x) = 1
1 +e(−αx) (4.4)
第4. EXEMPLAR-BASED LCS 4.6. 不均衡データへのためのECS
ここで,αはゲインと呼ばれ,ゲインが1の時は標準シグモイド関数を示す.さら に,あるexemplarもしくは生成されたexemplarをの範囲をri,近傍の違う出力
をもつexemplarとの距離をdとした時,以下の更新式で範囲を更新してカバーで
きる領域を拡大させる.
r ←r+ς(x)·(d−r) (4.5)
これにより,多数データの入力に照合するexemplar や生成exemplarの過剰な一 般化を抑制し少数データの入力に対して適切に領域を確保する効果を狙う.
偏りのあるデータ集合に対する新たなexemplarの生成・削除
偏りのあるデータ集合においては,少数データのexemplar群では領域をカバー しきれず,多数データの過剰一般化を許容してしまう可能性があるため,偏りのあ るデータ集合を扱う際に,新しく領域をカバーするexemplarの生成方法を導入す る.さらに,生成のみではexemplarの母集団サイズが肥大化していくため,削除 を実行し母集団の肥大化を抑える.
4.6.2 生成・削除の導入
シングルステップ問題における生成方法
ECSのシングルステップ問題における生成方法として,図4.17のように,
データ集合に偏りが生じ,多数データを表す青のexemplarと少数データを表
す赤のexemplarがあるとした場合,赤のexemplarは各軸方向に対し,違う
出力を持つexemplarとの距離を計算し,その中点に生成するexemplarの中 心点を決定する.そして,その範囲は近傍の同じexemplarかもしくは,近傍 の違う出力をもつexemplar との距離を用いて範囲の更新式に従い決定され る.このとき,近傍として選択されるexemplarは距離の大きいほうが選ばれ る.さらに,exemplar生成の発動条件として閾値のθGAを設定し,exemplar の照合回数であるM atchCountがそれを超えた場合に実行されるが,データ に偏りがある場合は,データの比率を考慮する.具体的には多数データ: 少数 データ=n: 1の時,多数データの閾値はn·θGA とする.これにより,少数 データの領域において,領域をカバーするexemplarの生成を早め,多数デー タの領域からの過剰な一般化を抑制する.
シングルステップ問題における削除方法
4.6. 不均衡データへのためのECS 第4. EXEMPLAR-BASED LCS
図4.17 シングルステップ問題におけるexemplar生成の概要
ECSにおける削除は図4.18の様に,母集団数の上限値N を設定し,上限値 N を超えた場合にexemplarを削除していく.削除の対象となるのは,適応度 の低い範囲の小さいexemplarが対象となる.また,事前知識として導入され
たexemplarよりも新しく生成したexempalrのほうが優先的に削除される.
図4.18 削除の概要
マルチステップ問題における生成方法
ECSのマルチステップ問題における生成方法として,図 4.19に示すよう に,ステップtにおける入力に照合するexemplarが存在しない場合に,新た なexemplarを生成する.まず,入力状態をexempalrの条件(if)部として設
第4. EXEMPLAR-BASED LCS 4.7. メカニズムの特徴
定し,次に,問題の変数空間上で最もユークリッド距離の近いexemplarの行 動を新たに生成するexemplar の行動(then)部として設定する.さらに,新 たに生成されたexemplarの行動とは違う行動をもつ最も近いexemplarとの 距離の半分を初期の照合範囲として設定する.
図4.19 マルチステップ問題におけるexemplar生成の概要
マルチステップ問題における削除方法
マルチステップ問題における削除はシングルステップ問題における削除と同 様に実行される.