• 検索結果がありません。

PDFファイル 2F3 「機械学習による非定常性と異常検知」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 2F3 「機械学習による非定常性と異常検知」"

Copied!
4
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

2F3-1

特徴学習を用いた車両の早期故障検出・要因解析支援法

Feature Learning to Support Fault Detection and Analysis of Vehicle

田川 貴章

∗1

Takaaki Tagawa

佐藤 守一

∗1

Shuichi Sato

佐野 範佳

∗1

Noriyoshi Sano

∗1

株式会社豊田中央研究所

TOYOTA CENTRAL R&D LABS., INC.

This paper proposes a new approach which can both detect and analyze unknown faults precisely. Our approach uses Overcomplete Independent Component Analysis for fault detection and analysis and strongly assists experts to diagnose complex and extensive systems. In contrast to conventional approaches which have pursued fault detection performance at the expense of fault analysis ability, our approach succeeded to achieve both high fault detection and analysis performances without relying on any prior information about the faults. Using driving data, change detection experiments have shown that the fault detection performances of our approach are competitive to or outperform other conventional methods even if they are non-linear models such as kernel-based or mixture-based models. Additionally, our fault analysis approach could extract the combinations of attributes which express the essential differences between nominal data and test data.

1.

はじめに

車載システムへの高い信頼性を確保するため,開発者はリ リース前に多岐に渡るテストを行う必要がある.その際に1つ でも不明な故障が見つかった場合,それらは解析・特定され対 策が取られる.これらの故障検出・要因解析プロセスは基本的 に専門家知識に基づいて行われる.しかしながら,車載システ ムが今後複雑化・大規模化していくに連れて専門家知識に基づ く解析は高コストになる恐れがある.

そうした背景の中,データに基づく故障検知・要因解析支援技

術に注目が集まっている.この技術の利用により専門家知識に 負う所が少なくなるため,解析コストの低減が期待される.想 定する問題設定は,正常とみなされた機器より得られるデータ よりモデルの学習を行い,そのモデルを用いて正常かどうかが 不明な同様の機器より得られたテストデータを評価する事でそ の機器に故障が発生しているか否か、発生しているならば具体 的にどの部分において故障が発生しているかの判断を,データ

の観点から支援する事である.関連技術としてはMultivariate

Statistical Process Monitoring(MSPM)がある.この技術は

主に化学プラント等のプロセス管理技術として広く用いられ て い る .主 な 手 法 と し て はPrincipal Component Analysis (PCA)に基づく手法があり,T2統計量並びにQ統計量を用い

てデータ評価を行うのが特徴である.特に,Q統計量に基づき,

検出された故障データに対し,観測している系列においてどの 系列が最もその故障へ寄与しているかを解析する事が可能であ る.診断者はこの寄与度の分布に基づき原因の推測をより容易

に行う事が可能になる[Ge 12].しかしこの手法は学習する正

常データに対してガウス性を仮定しており,車両の走行データ などの非ガウス性を持つデータに対しては十分な性能を発揮す る事が難しい.そのため学習するデータ分布に対してガウス性 を仮定しないIndependent Component Analysis (ICA)に基

づく手法も提案されている.故障検出はICAにより抽出され

た特徴空間上で行われ,しきい値の設定,あるいは多変量カー ネル密度推定やSupport Vector Data Description (SVDD)

連絡先:田川 貴章,株式会社豊田中央研究所,愛知県長久手

市横道41-1,tagawa@mosk.tytlabs.co.jp

といった手法を用いて監視する事で検出を行う[Ge 12].これ

らの手法は故障検出性能が向上するが,いずれも特徴空間への 写像を行う関係より元のデータとの関連が複雑で要因解析を行

う事が困難である.一方PCAを区分線形混合モデルへ拡張し

たMixture of Probabilistic Principal Component Analysis (MPPCA)[Tipping 99]は各コンポーネント上ではPCAに基

づいているため上記PCA単独による手法と同じく要因解析を

行う事が出来る.ただこの手法での要因解析がどの程度有効な ものかは現状深く考察されてはない.

本論では上記背景に基づき,高い故障検出性能及び要因解析

能力を有する解析支援技術の提案を行う.この手法では

Over-complete Independent Component Analysisを用い元のデー

タ系列数のより多い数の独立成分を抽出する事で特徴抽出性能 を向上させ,また各独立成分を別々に単変量のKernel Density Estimatorを用いて評価する事で全体の故障確率を評価する.

さらに各独立成分毎に正異常判定を行う事で正常な成分のみを 抽出、擬似逆行列により元データ空間へ再構成し元データとの 差分を取る事で異常に寄与した部分のみを抽出し高性能な要因 解析を可能にした.さらに,データ点毎の解析ではなくデータ 群に対してまとめて要因解析を行い散布図にて可視化する事 で,従来のデータ点毎の解析では見えない動的な変化を分かり やすく診断者へ提示する.

本論の構成は以下の通りである.まず次章にて提案する手

法について述べる.続く3章にて今回行った車両走行データ

を用いた実験内容及び結果について述べる.4章で実験に対す

る考察をまとめ,最後5章にて結論を述べる.

2.

提案手法

本章では提案する故障検出・要因解析手法について述べる. 最初にベースとなる技術であるOvercomplete Independent Component Analysis (OICA)及びKernel Density Estima-tor (KDE)の概要について述べる.その後,これら技術を用

いた故障検出・要因解析技術を提案する.

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

2.1

Overcomplete

Independent

Component

Analysis

OICA は Independent Component Analysis (ICA)[Hyv¨arinen 00] を 過 完 備 (Overcomplete) な モ デ

ルに拡張したものとなる.今,i.i.d.なn個の正常な観測デー

タ サ ン プ ル{x(1), . . . ,x(

n)}

が 得 ら れ た と す る .こ の 時 ,各 サ ン プ ル はm個 の 系 列x = {x1, . . . , xm}で 構 成 さ れ る と

する.また各系列は平均0,分散1へ標準化が行われている

ものとする.ICAでは,k(≤m)個の互いに独立な独立成分 s={s1, . . . , sk}を仮定し,以下で示すモデルを仮定する.

x=As. (1)

ここでAは混合行列と呼ぶ.ここで混合行列A及びsを同

時に求める代わりに上式を

s=Wx, (2)

と変換する事で独立成分sの独立性を最大化するようなW=

A−1

を求める問題に帰着させる.この最適化に当たっては,す

でに様々な手法は提案されている([Hyv¨arinen 00]参照).

上記ICAに対し,OICAでは独立成分の個数が元のデータ

系列数より多い場合(k > m)を想定する.このモデルを用い

るに当たって,独立成分へ事前分布を仮定する.今回Laplace

分布を事前分布として採用し,以下に示す生成モデルを定式化 する.

p(x) = ∏k

i=1exp (−|wix|)

Z . (3)

ここでwiは分離行列W={wT1, . . . ,wTk}Tの各行成分を表

し,Zはは正規化定数を表している.ここでZは解析的に計

算不可なため最適化が困難であるが,今回Score Matching法

に基づくスコア関数を最小化する事でZを計算する事なく最

適化計算が可能になる[Hyv¨arinen 05].

2.2

Kernel Density Estimator

Kernel Density Estimator (KDE)[Silverman 86]はカーネ

ル関数を用いる事で単変量分布を精度良く近似する事が出来

る.今回提案する手法は前節で述べたOICAによる抽出された

独立成分sの各成分毎の単変量分布を学習するために用いる.

今,n個の正常な観測データサンプルに対して得られたi番

目の独立成分を{s

(1)

i , . . . , s

(n)

i }とする.ここで新たなテスト

サンプルs

(n+1)

i が得られたとするとその確率密度は以下で推

定される.

f(s(in+1)) = 1

nh

n

l=1 kh

(

s(in+1)−s

(l)

i

h

)

. (4)

ここでhはハイパーパラメータである.kh(·)はカーネル関数 であり,以下に示す標準ガウス関数を用いた.

kh(s( n+1)

i ) =

1 √

2πexp

( −1

2(s

(n+1)

i )

2)

. (5)

2.3

故障検出支援法

本提案手法における故障検出支援はOICAにより抽出され

た独立成分の同時確率に基づいて行う.この時,各独立成分

si, i= 1, . . . , k,に対し独立性を仮定し以下に示すように負の 対数同時確率を近似的に計算する.

−logp(s)≈ −log

k

i=1

p(si) =− k

i=1

logp(si). (6)

この値を今回故障確率とし,値が大きいほど故障している可能 性が高いと診断者は判断出来るこの時p(si)の計算にはUKE を用いて近似的に行う.

2.4

要因解析支援法

要因解析支援ではOICAによる抽出された各独立成分si

れぞれに対して正異常判定を行い,正常と判定された因子のみ でデータ再構成を行い、元データとの差分を取る事で異常に寄 与した部分のみを抽出する.

今,各独立成分に対する負の対数確率−logp(si)に対しし

きい値tiを設定する.今回,正常データに対して得られる故

障確率−logp(si)の最大値をしきい値として用いる.今m系

列のテストサンプルxが与えられた際,それに対応するi番目

の独立成分siにおいて−logp(si)> tiであった場合にそのi

番目の独立成分は異常であると判定する.ここで少なくとも1

つの独立成分が異常と判定された場合、つまりk1(< k)個の 独立成分が正常と判定された場合を考え、正常な因子のみで構

成される独立成分をs1とおく.次に分離行列Wに対する混

合行列Aを擬似逆行列によりA= (WTW)

−1WT

で近似す

る.この中で,抽出された正常な独立成分s1に対応する部分

行列をA1∈R

m×k1

とすれば,正常な独立成分を用いた再構 成データx1

x1=A1s1, (7)

で与えられる.ここで元データとの差分x−x1は異常な独立

成分で構成されるため,これを解析する事でどの部分が異常に 寄与しているか精度良く見積もる事が可能になる.具体的に は,各データ系列毎に差分データの大きさを計算し,それが大 きい順に異常への寄与度が高いとみなす.

2.5

複数サンプルへの要因解析

本手法における要因解析では複数サンプルへまとめて要因 解析を行う事を想定する.複数サンプルに対する要因解析を行 う事で分布レベルの変化を抽出する事が可能になる.

複数サンプルへの要因解析は前節で述べた寄与度計算に基 づき,以下のように行う.

1. 各サンプル毎に各データ系列毎の寄与度を算出し,最も

大きく寄与した上位1,2位の系列を抽出する;

2. 全サンプルで抽出した2つの系列組が何回抽出されたか

カウントする;

3. 抽出数が多い順に各系列組の散布図を,学習正常データ

と解析したデータに対して表示する.

今回上位2位までの系列に限ったのは,後に散布図として表

示する事が可能だからである.散布図は統計に詳しくない診断 者でも理解しやすく,また分布レベルの違いを捉える事が容易 である.

3.

車両走行データによる実験

本節では,走行環境の変化を擬似的に故障として扱う事で、 提案手法の故障検出・要因解析性能を評価した結果を述べる.

3.1

実験データ

自動車用の故障診断テスターを用い自動車の走行データ取得

を行った.取得した信号系列は全部で43系列である.データ

取得に当たってはいくつかの走行条件を設定し,それに基づい

て1名のドライバのみで全てのデータ取得を行った.各データ

の名前及び対応する取得条件,取得サンプル数を表.1にまと

(3)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

める.ここでControlにあるPower,Eco,Normal,Brake, Neutralはそれぞれ自動車の走行制御設定等を示し自由に選択

可能である.データはStraight,Upslope,Downslope,Curve それぞれの道路条件にて同様の加速,減速走行を行った.た

だしSlow走行では通常の直線走行時よりも弱い加速,減速を

行った.またWeightデータでは200[kg]の重りを積載して走 行し,DtoNデータでは加速後にNeutralへ変更して走行して いる.Powerデータは今回正常データとして想定し,前処理

として正常データに対し平均0,分散1になるよう標準化を行

い,整合性を取るため同じ処理を他のデータにも適用した.

表1: 実験条件

Name Condition Control Samples

Power Straight Power 1450

Eco Straight Eco 561

Normal Straight Normal 608

ShiftB Straight Brake 591

Slow Straight Power 737

DtoN Straight Neutral 418

Weight Straight, Normal 406 200[kg] loaded

Curve Curved Power 214

Down Downslope Power 92

Up Upslope Power 100

3.2

比較手法

今回比較に用いた手法を表.2にまとめる.OICA-KDEは

今回提案する手法で独立成分数をk= 200としてOICAを学

習した.この時OICAを適用する前にPCAによる白色化及

び1[ %]ノイズ除去を行っている[Hyv¨arinen 00].またKDE

に関して(4)式にあるハイパーパラメータhはヒューリスティ

クスに基づく式

h= (

σ5

3n

) 1 5

, (8)

で求めた[Silverman 86].ここでnは学習に用いた正常デー タサンプル数,σˆは標本分散である.OICA-SVDDはKDE の 代 わ り に ,MSPM に お い て 良 く 用 い ら れ る 従 来 手 法 で あ る Support Vector Data Description (SVDD)[Tax 04] を 用 い た も の で あ る .SVDD の ハ イ パ ー パ ラ メ ー タ C は

{0.001,0.01,0.1,1,10,100}の間で最も故障検出性能が良かっ たものを採用した.また利用するカーネル関数として以下に示

すRBFガウスカーネルを用いた.

k(x(i),x(j)) = exp (

−||x

(i)

−x(j)

||2 2σ2

)

. (9)

ハイパーパラメータのσはmedian{||x(p)−x(q)||}により求め た.ここでx(

p)

はp番目の正常データサンプルを示す.

Ker-nel Principal Component Analysis (KPCA)[Hoffmann 07]

はカーネルに同じくRBFガウスカーネルを用い,主成分空間

における次元数dはスクリープロットに基づきながら{2, . . . ,9} のうちで最も故障検出性能が良かったものを採用した.最後 にMixture of Probabilistic Principal Component Analy-sis (MPPCA)[Tipping 99]は次元数dと共にクラスタ数cを

{2, . . . ,9}の間で変化させ最も故障検出性能が良かったものを

採用した.

表2:比較手法

Approaches Parameters OICA with KDE (OICA-KDE) k, h

OICA with SVDD (OICA-SVDD) k, σ, C

KPCA d, σ

MPPCA c, d

3.3

実験結果

3.3.1 故障検出性能実験

この実験では走行条件の変化を故障として擬似的に扱い,そ の違いをどの程度まで検知出来るかをいくつかの手法で比較 した.Powerデータを正常データとして学習し,それ以外の データを解析対象データとして評価を行った.

評価手法としては問題を2クラス分類問題として扱いROC

(Receiver Operating Characteristics)曲線によるAUC(Area Under the Curve)を用いてその分類性能を評価した.ただし

過剰適合を防ぐため正常データの8割をランダムに選択し学

習データとし,残り2割と各解析対象データを組合せたもの

を検証データとする.この試行は各解析対象データに対し10

回繰り返し行い,AUCはそれらの平均値を用いた.以上の実

験において得られたAUCの値を表.3にまとめる.

表3: AUC OICA with

SVDD KDE KPCA MPPCA

Eco 0.5486 0.5963 0.5186 0.5753

Normal 0.5114 0.5478 0.4903 0.5471

ShiftB 0.6283 0.5847 0.5436 0.5750

Slow 0.4906 0.6209 0.4811 0.6801

DtoN 0.7002 0.7239 0.5827 0.7052

Weight 0.5484 0.5945 0.5320 0.5827

Curve 0.8374 0.8711 0.8258 0.8791

Down 0.8502 0.8505 0.7563 0.8393

Up 0.8949 0.9378 0.8807 0.9384

3.3.2 要因解析性能実験

この実験では走行条件変化の原因を要因解析によりどの程 度抽出可能かその性能を従来手法と比較した.特に事前知識な く要因解析が行え,かつ高性能な故障検出能力も報告されてい るMPPCA[乾09]を比較手法にし,提案するOICA-KDEに よる要因解析結果との比較を行った.今回学習において今回正 常データを特に分割せず全てを用いてモデルを学習した.解析

対象は前節の故障検出性能実験において,MPPCAが

OICA-KDEより良い結果を出したSlowデータに対して今回要因解

析を行った.要因解析は第2.5節で述べた複数サンプルの要因

解析法に基づきSlowデータ全サンプルに対して行い,それぞ

れの手法により抽出された系列組の上位4位までをそれぞれ

表示させ比較を行った.この時得られた要因解析結果を図.1

へまとめた.

4.

考察

4.1

故障検出性能

表.3を見ると比較した手法は全て非線形な手法にも関わら

ず,提案手法はEco,Normal,DtoN,Weight,Downにおいて

(4)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

3 3.2 3.4 3.6 3.8 4 −1

−0.5 0 0.5 1 1.5

No.1 Contribution (MPPCA)

Accumulator Pressure Zero−Point Corrected Steering Angle Sensor

−1 −0.5 0 0.5 1 1.5 0

2 4 6 8 10

No.2 Contribution (MPPCA)

Zero−Point Corrected Steering Angle Sensor

Purge Rate

3.2 3.4 3.6 3.8 4 −1

−0.8 −0.6 −0.4 −0.2 0 0.2 0.4

No.4 Contribution (MPPCA)

Accumulator Pressure

Lateral G Sensor

3.2 3.4 3.6 3.8 4 0.8

0.9 1 1.1 1.2 1.3

No.3 Contribution (MPPCA)

Accumulator Pressure

Real Air/Fuel Ratio

Power Slow Power

Slow Power

Slow Power Slow

0 20 40 60 80

−4 −3 −2 −1 0 1 2 3

Accelerator Position

Front Rear G Sensor

No.1 Contribution (OICA−KDE)

Power Slow

0 20 40 60 80

0 10 20 30 40 50

Accelerator Position

Required Engine Output

No.2 Contribution (OICA−KDE)

Power Slow

0 2 4 6 8 10

−10 0 10 20 30 40

Purge Rate

Ignition Timing

No.3 Contribution (OICA−KDE)

Power Slow

0 10 20 30 40 50 −150

−100 −50 0 50 100 150

Intake Air Volume

Real Engine Torque

No.4 Contribution (OICA−KDE)

Power Slow

図1: 上位4位までの寄与系列組(上:MPPCA,下:OICA-KDE)

最も良い結果を,その他のデータにおいても拮抗する結果を出 す事が出来た.またSVDDとKDEの比較ではShiftB以外

はすべてKDEがより良い結果を得ている.これはOICAに

より抽出される独立成分がより高い独立性を持っているため,

(3)式で示す互いの依存関係を無視した積のモデルによる評価

で十分な性能が得られると考えられる.またSVDDは(9)で

示すRBFガウスカーネルを用いているが,この時ノルムによ

り各変数は和の形で叩き込まれる.すなわち独立成分間の独立 性は大きな影響を持たず活用できていないと考えられる.

4.2

要因解析性能

図.1で示されるMPPCA及びOICA-KDEによる要因解

析結果を比較すると,MPPCAで抽出された系列組は互いに

相関を持たないような組が多いのに対し,OICA-KDEで抽出

された系列組は相関を持つものが多く抽出された.MPPCA

は,PCAによる要因解析がデータの主要な相関を表す主成分

空間から直交した距離に基づいたものになるため,それらは互 いに相関をもたないようなものが多く,抽出される系列組もそ

のようなものが多いと考えられる.OICA-KDEは,異常と判

定された独立成分を抽出して解析しており,これら独立成分は それぞれ正常データにおいて学習された特徴になる事から,抽 出される系列組も何かしらの特徴,つまり相関関係を持ったも のが多くなると考えられる.実際の解析においては,診断者は 主に主要な相関上における相関関係の崩れを故障として観測

したいため,OICA-KDEによる要因解析結果は診断者に有益

な情報であると言える.実際OICA-KDEの結果で,1番目に

寄与が高かった系列組での散布図は,データの変化を本質的に 表しておりアクセルに対する加速特性の変化があった事が理 解出来る.また今回複数サンプルに渡って同時に要因解析を した事から分布レベルの変化を抽出する事が出来ている.特 にOICA-KDEの結果で2,4位の系列組を見ると,サンプル 点単体では大きなズレはないものの,分布レベルで見ると明ら

かな変化がある事が分かる.こうした変化はサンプルを1つ

1つ解析する場合だと見つけ辛いものであるため,本手法によ

りそれらも効率良く抽出出来たと考えられる.

5.

結論

本論では,Overcomplete Independent Component Anal-ysis (OICA)及びKernel Density Estimator (KDE)を用い

た故障検出・要因解析支援法を提案した.車両走行データによ る実験より,この手法は非線形性を考慮しないにも関わらず従 来の非線形手法に対して拮抗する,またはより良い故障検出性 能を出した.加えて要因解析では複数サンプルの解析でデータ の動的な変化を散布図で分かりやすく可視化出来た.

参考文献

[Ge 12] Ge, Z., & Song, Z. (2012). Multivariate Statisti-cal Process Control: Process Monitoring Methods and Applications. Springer.

[Hoffmann 07] Hoffmann, H. (2007). Kernel PCA for nov-elty detection. Pattern Recognition, 40(3), 863-874.

[Hyv¨arinen 00] Hyv¨arinen, A., & Oja, E. (2000). Indepen-dent component analysis: algorithms and applications. Neural networks, 13(4), 411-430.

[Hyv¨arinen 05] Hyv¨arinen, A., & Dayan, P. (2005). Esti-mation of Non-Normalized Statistical Models by Score Matching. Journal of Machine Learning Research, 6(4).

[Silverman 86] Silverman, B. W. (1986). Density estima-tion for statistics and data analysis (Vol. 26). CRC press.

[Tax 04] Tax, D. M., & Duin, R. P. (2004). Support vector data description. Machine learning, 54(1), 45-66.

[Tipping 99] Tipping, M. E., & Bishop, C. M. (1999). Mix-tures of probabilistic principal component analyzers. Neural computation, 11(2), 443-482.

[乾09] 乾稔,矢入健久,河原吉伸,町田和雄.次元削減の再構

成誤差を用いた異常検知手法の比較,人工知能学会,2009.

参照

関連したドキュメント

Optimal stochastic approximation algorithms for strongly convex stochastic composite optimization I: A generic algorithmic framework.. SIAM Journal on Optimization,

Dual averaging and proximal gradient descent for online alternating direction multiplier method. Stochastic dual coordinate ascent with alternating direction method

テューリングは、数学者が紙と鉛筆を用いて計算を行う過程を極限まで抽象化することに よりテューリング機械の定義に到達した。

これらの定義でも分かるように, Impairment に関しては解剖学的または生理学的な異常 としてほぼ続一されているが, disability と

※ 硬化時 間につ いては 使用材 料によ って異 なるの で使用 材料の 特性を 十分熟 知する こと

注)○のあるものを使用すること。

• 使用済燃料プール壁 ※1 は、非常に厚いうえに、プール全体は、非常に厚い壁 ※2

平成 28 年度は 4 月以降、常勤 2