• 検索結果がありません。

博士論文審査結果報告書

N/A
N/A
Protected

Academic year: 2021

シェア "博士論文審査結果報告書"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

早稲田大学大学院情報生産システム研究科

博士論文審査結果報告書

論 文 題 目

Parameter Estimation for Binary Classification by Particle Swarm Optimizations and Its Applications

申 請 者

Zhenyuan XU

情報生産システム工学専攻 経営工学研究

2 0 15 年 9 月

(2)

2

問題のデータを分類することは意思決定の中心的な機能である。データセットを 2 群に 分類する場合、分類は二項分類と呼ばれ、分類ルールを用いることにより、新たに得たイ ンスタンスが2群のうちのどちらに分類されるかを予測することができる。

二項分類においては、その分類ルールを学習することが主な課題の一つである。この時、

分類ルールを学習するためのモデルのパラメータ選択や対象の学習空間選択が分類ルール の学習効率や分類精度に影響を及ぼす。特に、2 群に分類されるべきデータ数が極端に不 均等なインバランス・データセットである場合、分類対象のデータセットが線形分離不可 能な大規模なデータセットである場合、および、データ項目が多次元でノイズを含むデー タセットである場合には、従来の二項分類ルール学習方法で得られる分類ルールでは、十 分な分類精度を実現するのが困難であり、高い分類精度を実現することができていない。

本学位論文は、上述した特徴を有するデータセットに対して、より高精度な二項分類ル ールを学習する新しい方法を提案している。すなわち、本学位論文では、従来提案されて い る 機 械 学 習 法 に よ る 二 項 分 類 方 法 で あ る サ ポ ー ト ベ ク タ ー マ シ ン ( Support Vector Machine:SVM)、およびニューラルネットワーク( Neural Network:NN)における学習パ ラ メ ー タ の 値 を 、 メ タ ヒ ュ ー リ ス テ ッ ク 手 法 で あ る 粒 子 群 最 適 化 手 法 ( Particle Swarm Optimization:PSO)を用いて最適化する手法を用いた新しい二項分類ルール学習方法を提 案している。提案手法のメリットは、従来提案されている機械学習法による二項分類ルー ル学習におけるオーバフィッテングを軽減したことである。これにより、上述した3つの 特徴を有するデータセットに対する2項分類において、従来提案されている機械学習法に よる二項分類ルール学習に対して、提案手法の方が分離精度で約 10%から 20%程度優れてい ることを、3つの実問題への応用実験によって示している。

本学位論文の構成は次の通りである。

第 1 章 [はじめに:Introduction] では、本学位論文の背景、扱っている問題、技術的 な課題と目的、および学位論文の全体構成を説明している。

第 2 章 [基本的な概念:Preliminary concepts] では、従来の機械学習手法(SVM、およ び NN) の 原 理と 方 法 、お よ び 、本 論 文 で用 いて い る メタ ヒ ュ ーリ ステ ィ ッ ク最 適 化 方法 (PSO)について、それらの機械学習手法における学習パラメータの値を最適化する原理と方 法を説明している。

第 3 章 [本学位論文の方法:Approach of the thesis] では、上述した3つの特徴を有 するデータセットに対して、従来の機械学習手法(SVM、および NN)を適用する場合の2 項分類精度が低下する問題点とそれを解決する方法を明らかにするとともに、上述の特徴 を有する 3 種類のデータについて方法をそれぞれ新たに提案し、それらを数学的に定式化 して説明している。すなわち

(提案方法1)従来の機械学習方法である SVM における二項分類ルール学習モデルに最 適係数選択と学習空間選択を行う機能を加えた二重 PSO-SVM を提案し、2 群に分類される べきデータ数が極端に不均等なインバランス・データセットに対する二項分類精度を向上 させる方法を提案している。ほぼ均等なデータサイズからなる 2 群の二項分類問題の解法 として従来の SVM が高い精度を実現してきたことに留意し、最適係数値選択を行う PSO-1 と、学習空間最適分割により学習空間選択を処理する PSO-2 からなる2つの PSO 機能を従 来の SVM と組合せ、SVM カーネル関数のパラメータを最適化する二重 PSO-SVM を提案して

(3)

3

いる。実際の LSI のインバランス・データセットを用いた数値実験により、従来の SVM に 比べ提案手法の分類精度が約 20%向上したことを示した。

(提案方法2)従来の機械学習方法である SVM と NN をともに用いて異なる解像度の2項 分 類 機 能 を 組 み 合 せ 、 か つ 、 そ れ を ( 提 案 方 法 1 ) で 述 べ た ア イ デ ア と 融 合 さ せ た PSO-NN-SVM を提案し、対象データセットが線形分離不可能な大規模なデータセットに対す る二項分類精度を向上させる方法を提案している。SVM は多くの線形および非線形の小規 模データセットの分類問題に用いられているが、学習速度が遅いために大規模時系列デー タベースを分類することは困難であった。一方で、NN は、単純な学習規則に基づいて、大 局的な年傾向値や月傾向値を効率的に学習することができる。(提案方法1)で述べた二 重 PSO-SVM に放射基底関数ニューラルネットワーク( RBFNN)を組み込むことで、RBFNN で 大きな変動をまた二重 PSO-SVM で日変動や時変動の微細な変動を予測して、大規模時系列 データセットの2項分類問題を解く二項分類ルール学習を効率化するとともに予測精度を 向上させている。

(提案方法3)(提案方法1)をベースにして PSO の探索精度の改善を行った PSO-粒子 フィルタを用いることにより、データ項目が多次元でノイズを含む画像データセットに対 する二項分類精度を向上する方法を提案している。

第 4 章 [粒子群最適化に基づくサポートベクトルマシーンを用いたインバランスデー タ 分 類 問 題 の 解 法 : Solving the imbalanced data classification problem with the particle swarm optimization based support vector machine]では、上述した(提案方法 1)を、高い精度のインバランスデータセット分類が要求される実際の LSI 評価データ2 項分類問題に適用し有効性を評価している。全 169,913 件の LSI 製品の品質検査のデータ を用いた実験によって(提案方法1)の二重 PSO-SVM モデルが高い精度でインバランスデ ータセット分類問題を処理できることを示した。真陽性率(True Positive Rate,TPR)と 真陰性率(True Negative Rate、TNR)が常に 0.8 以上であり、従来手法である ANN,SVM-RBF

(Radial Basis Function)および LSSVM(Least Square SVM)による分類精度がそれぞれ 63.4%、79.0%および 82.4%であるのに対し、提案方法の分類精度が 88.4%であった。

第 5 章 [粒子群最適化に基づく混合ニューラルネットワークとサポートベクトルマシー ン に よ る 短 期 負 荷 予 測 問 題 の 解 法 : Solving short term load forecasting problem by using particle swarm optimization based hybrid neural network and support vector machine] では、上述した(提案方法2)を、安全性と経済的運用を要する電力システムに と っ て 重 要 な 研 究 課 題 の ひ と つ で あ る 短 期 負 荷 変 動 予 測 問 題 ( short term load forecasting problem、STLF)に適用しその有効性を評価している。STLF は大規模・時間 変動・非線形性を持つ時系列データセットの2項分類問題であり、高い予測精度が要求さ れる。短期負荷変動予測問題を解決するために、提案手法 PSO-NN-SVM を適用した結果とし て、日負荷変動および時刻負荷変動の消費電力予測で提案手法は従来用いられている手法 に比べ高い精度を実現した。1996 年から 2009 年間の 30 分間隔の 227,904 件のデータを用 いた実験で、提案手法は平均絶対誤差率( MAPE)値で 3.20%、二乗平均平方根誤差(RMSE)

値で 3.65%を実現しており、従来手法である RBFNN(MAPE6.39%、RMSE7.82%)、カルマンフ ィルタ(MAPE6.63%、RMSE7.20%)、PSO-SVM(MAP14.26%、RMSE17.27%)と比較して最も優 れていることを示した。

(4)

4

第 6 章 [ヒューマントラッキングのための PSO―粒子フィルタによる対象物計測:PSO- particle filter-based dimension measurement of object for human tracking] では、

画像データによる対象物の検出とトラッキング問題に(提案方法3)を適用した。対象物 の検出とトラッキングにおいて高い精度要求を満たすためには、膨大な数のピクセルの値 を用いて探索を行う必要があり計算機時間の負荷が大きすぎるため、限られた時間で十分 な検出精度が得られないことが問題となっている。複数の人物が歩行で移動する様子を録 画した 50sec のビデオ画像データを用いた実験結果では、PSO-粒子フィルタを用いた提案 手法はトラッキング精度が 95.4%であったのに対し、従来の粒子フィルタやカルマンフィ ルタを用いた場合は、トラッキング精度がそれぞれ 91.7%と 87.3%であった。一方で、それ らのトラッキング精度を出すために必要な計算時間は PSO-粒子フィルタが 1 フレームを 15.6msec の処理時間で最小であり、従来方法による最大 CPU 時間の 36.5%で処理できてお り高い効率性を示した。1 秒 25 フレームの映像ではフレーム間隔が 40msec で十分実用に 耐える計算速度である。また歩行における複数人物の重なり(occlusions)が有る場合にも 十分良好なトラッキング精度 82.1%が得られることを示した。

第 7 章 [むすびと残された問題:Conclusion and future works]では、最後の章として、

本論文の結果をまとめ、残された問題を整理している。

以上を評価するに、本論文は意思決定に広く利用される二項分類問題における高精度な 分類ルールを効率的に学習する法として、メタヒューリステック(PSO)と機械学習(SVM,NN)

を組合せたオリジナルな3つの方法を提案し、これらの方法を実問題に適用して、それら の提案手法が従来手法よりも高い分類精度を実現でき、十分実用的であることを示した。

特に、これまで十分な分類精度を得ることが難しかった、分類されるべきデータ数が極端 に不均等なインバランス・データセットの分類問題、分類対象のデータセットが線形分離 不可能な大規模なデータセットの分類問題、および、データ項目が多次元でノイズを含む データセットである場合の分類問題において、メタヒューリステックと機械学習を組み合 せた新しい分類ルール学習方法を提案し、従来方法に勝る高精度な分類ルール学習方法と その実用性を示した点で評価できる。これらは今後の経営工学の分野の発展に、またオペ レーションズリサーチの発展に寄与するところが大である。よって、本論文は博士(工学)

の学位論文として価値あるものと認める。

2015年9月7日

主査 早稲田大学 教授 工学博士(大阪府立大学)和多田淳三 早稲田大学 教授 工学博士(東京工業大学)村田 智洋 早稲田大学 教授 工学博士(早稲田大学) 李 羲頡

九州工業大学 教授 理学博士(九州大学) 酒井 浩

参照

関連したドキュメント

今日、出版や放送、インターネット等の多様なメディアが編棒し、新たな情報配信サ

事例研究・実証分析・政策評価の各方面からアプローチし、明確な結論を示した意欲的な

安定期に移行した後のリーダーシップ・スタイルは、シェア

第 9 章では、本研究の理論的貢献と実践的貢献が議論され、今後の研究の方向性を打ち

産業・企業政策などの分野で独立して個々に論じられていたが、これらの研究分野を知的

置換なし可変ノードサイズ GNP と固定ノードサイズ GNP に比較し、平均適合度 がそれぞれ約 12% 、

第 2 章では、 PSC と PRTS および講義受講者への各種質問項目との相関分析を 行い、 PSC は PRTS および 13

現在までに、1画面内の処理(空間予測)に対して、隣接ピクセルの値から推定する Lai-Man Po