議論 - UCI リポジトリ - Exemplar の生成と一般化に基づく学習分類子システムに関する研究

6.2 UCI リポジトリ

6.2.3 議論

表5.1にあるirの値と表6.3の結果をみてみる．UCIリポジトリのデータセットを用いた実験を通した結果から，チェッカーボード問題に比べて，高いirにおいても偏りを考慮した照合範囲の更新や生成・削除を導入したECSの効果が見られなかったことについてまず考察していく．チェッカーボード問題とUCIリポジトリの検証方法では，大きく異なる点として，検証用のテストデータにも偏りを加えているかどうかが挙げられる．

チェッカーボード問題では，学習段階において事前データである教師ありデータには偏りが存在するが，検証用のテストデータにはクラスの偏りがなく均一にデータを用意した．

これは，不均衡な事前データから少数データに対する汎化能力を測るためである．そこでまず，チェッカーボード問題のテストデータに偏りを加えた状態で(1)従来ECS，(2)偏りを考慮した範囲更新を導入したECS，そして(3)生成・削除を導入したECSの分類成功率を追加で比較実験した．

図 6.12に示すように，少数データのみの分類成功率に絞ってみてみると，ir が低いケースでは，従来のECSや偏りを考慮した範囲更新を導入したECSの分類精度は9割近い．一方で，irの値が高くなると，従来のECSは徐々に下がりir = 7では，5割以下の分類精度であるが，偏りを考慮した範囲更新を導入したECSは5割以上の分類精度を保っている．また，生成・削除を導入したECSはirが０の時以外は，irが高くなるに連れて徐々に分類精度が向上している．このことから，ir = 7のような偏りが相当厳しい状況でないと，少数データの領域において生成機能が効果的に働いていないことを示している．また，テストデータに偏りをもたせた場合，その成果が全体の分類精度にほとんどあらわれないのは，ir=7の場合，少数データの割合はがテストデータ全体の0.7%程度しか占めておらず，評価にほとんど影響を与えることなく，多数データの分類精度のみで評価されている状況に等しい．このことから，テストデータに偏りがある場合は，各クラスの評価を実施すること，そして各クラスの全テストデータにおける比率を考慮し，各クラスの分類精度の全体評価への影響を把握して評価を実施する必要がある．

さらに，図6.13は各データ集合におけるECSのP opulationsizeの平均推移を示している．各図の縦軸はexempalrの総数であるP opulationSizeを示し，横軸は学習回数を示す．どのデータ集合の場合においても，学習初期においてほとんど収束している．ただし，GlassやSegmentの分類クラスの数が多いデータ集合ほど，P opulationsize の収束が遅い傾向がみられる．これは1回の学習回数が 1つの入力に相当するため，分類クラスの少ない問題と比べて分類クラスの多い問題では，exemplarの照合回数および実行回数の頻度が下がり，照合範囲を拡大し一般化の進行が遅れてしまうためであると考えられる．

6.2. UCI リポジトリ第 6. 計算機実験:シングルステップ問題

(a) ir = 0 (b) ir = 1 (c) ir = 2

(d) ir = 3 (e) ir = 4 (f) ir = 5

(g) ir = 6 (h) ir = 7

図6.11 不均衡なテストデータを用いた結果

第6. 計算機実験:シングルステップ問題 6.2. UCIリポジトリ

図6.12 各ir値における少数データのみの分類精度

6.2. UCI リポジトリ第 6. 計算機実験:シングルステップ問題

(a) Balance−scale^の populationsize^の平均推移

(b)Bupa^のpopulationsize^{の平均推移}

(c)Glassのpopulationsizeの平均推移 (d) Irisのpopulationsizeの平均推移

(e) P ima−indiansの populationsizeの平均推移

(f)Segmentのpopulationsizeの平均推移

第6. 計算機実験:シングルステップ問題 6.2. UCIリポジトリ

(g)Sonorのpopulationsizeの平均推移 (h)V ehicleのpopulationsizeの平均推移

(i)W ineのpopulationsizeの平均推移

図6.13 各データ集合におけるECSのP opulationsizeの平均推移

第 7 ^章

計算機実験 : ^{実数値マルチステップ}

問題

ドキュメント内 Exemplar の生成と一般化に基づく学習分類子システムに関する研究 (ページ 77-82)

議論

6.2 UCI リポジトリ

6.2.3 議論

第 7 章

計算機実験 : 実数値マルチステップ

問題

第 7 ^章

計算機実験 : ^{実数値マルチステップ}