1.は じ め に
観測データ集合から規則性やパターンを発見的に抽出 する方法論は,データマイニングとして知られている. データマイニングのタスクにおいて,データ集合を類似 するデータ群に分割するクラスタリング [Everitt 11, Xu 08]や,アイテム集合から頻出する組合せや順列を抽出 する頻出パターンマイニング [Agrawal 94, Han 00] に関 する研究が数多く行われている. 本稿では,多次元の特徴量で表現される事象系列デー タから,事象間の「共起性」をキーワードに,頻出する クラスタ対のパターンを抽出するアルゴリズムを紹介す る.共起とは,異なる種類の事象が系列上で近接して現 れることである.本方式は,データ空間上の類似データ のクラスタリングと,系列データの頻出パターン抽出の 両方の特徴を併せもつ.このような共起パターンは,必 ずしも事象間の相互作用を表すとは限らないものの,抽 出された共起パターン群の中には重要な相互作用が含ま れている可能性がある. 率直な方法として,まずデータ空間上でクラスタリン グを行い,続いてクラスタ ID をそのデータ点のラベル として頻出パターン抽出を適用する方法が考えられる. しかし,この方法ではクラスタリングの段階において 系列上の共起性については全く考慮されていないため, データ空間上のクラスタの一部分で共起している場合 や,複数のクラスタにまたがって共起している場合はそ れらを正確に抽出することは難しい. 上述の問題に対して,著者らを中心として共起クラ スタマイニング(Co-occurring Cluster Mining:CCM) と名付けたアルゴリズムを提案している [稲場 12].提 案法では,階層型クラスタリングによって候補となる共 起パターンを生成し,評価関数に従ってある条件を満た すパターン群を列挙する.抽出される共起パターンは, クラスタの対から構成され,各クラスタ内の事象は類似 性が高く(データ空間上で密集),かつ互いのクラスタ に含まれる事象同士は系列上で共起性の高いパターンと なっている. 事象系列データに対するクラスタリングは主にクラ スタの時間経過を追跡する目的 [福井 08, Hahsler 11, O’Callaghan 02, Zhang 97]がほとんどであり,上記の 共起性とは異なる.また,頻出パターン抽出において実 数値を扱う研究として,<age, 27> といった数値アイテ ムに対して部分空間クラスタリングを用いた頻出アイテ ム集合抽出法 [Agrawal 98, 光永 06] や,時間間隔をク ラスタリングによって求めて頻出系列パターンを抽出す る方法 [Guyet 11] などは提案されているものの,いず れも事象間の共起性には着目していない.一方,時空間 データマイニングでは,例えば地理的に近い地域におい て,ある期間において事象の発生がアウトブレイクする ような,地域と期間の組を抽出することが行われている [Kulldorff 01].以上のように,共起するクラスタのペア をパターンとして抽出すること自体,これまでほとんど 行われていないものと見られる.本稿ではこのような共 起パターンは,事象間の関係性を発見する手掛かりにな ることを実例から紹介する. 本稿では,次章で問題の定義と共起クラスタマイニン グのアルゴリズムを紹介し,続いて二つの応用例を紹介 する.一つ目の応用例は,燃料電池の損傷パターン分析 に関する研究であり,燃料電池の部材にき裂やはく離な どの微細な損傷から発生する弾性波事象の系列から,部 材の損傷間の相互作用を推定した [稲場 12].二つ目の事象系列データからの共起性マイニング
─燃料電池の損傷間および地震間の相互作用抽出─
Mining Co-occurrences from Event Sequence Data
─ Extracting Damage Pattern in Fuel Cell and Occurrence Patternin
Earthquakes ─
福井 健一
大阪大学産業科学研究所Ken-ichi Fukui The Institute of Sientific and Industrial Research, Osaka University.
[email protected], http://www.ai.sanken.osaka-u.ac.jp/
沼尾 正行
(同 上)Masayuki Numao [email protected]
Keywords:
hierarchical clustering, co-occurrence, fuel cell, earthquake. 「データ中心科学」応用例は,地震の発生パターン分析に関する研究であり, 震源リストデータから異なる地域で発生した地震の相互 作用を推定した [Fukui 14].なお,[稲場 12] では人工デー タを用いた提案法の定量評価も行っているため,興味の ある読者は参照されたい.
2.共起クラスタマイニング(CCM)
2・1 問 題 定 義 本章では,対象とする問題・用語および抽出するパター ンの要求条件を定義する. 【定義 1】(事象系列).N 個の事象がそれぞれ v 次元の データ点 xi=(xi, 1, …, xi, v),(i=1, …, N)で表現され, かつデータ点は順序 x1 … xNをもつとき,D を事 象系列と呼ぶ . 【定義 2】(区間).事象系列は一定の規則に従う区間に 分けられているものとする. D = [x1,· · ·, xi][xi+1,· · ·, xj]· · · [xk,· · ·, xN] ここで,“[・]”は区間を表す.区間の長さは一定であ る必要はなく,応用領域ごとに意味のある規則に従っ て区切ればよい. 次に,抽出パターンの要求条件を下記に示す. 要求 1(共起性).事象の二つの集合 A, B D に対して, 同一の区間内に A, B が現れているとき,A と B は共 起しているといい,共起しない区間に比べて共起する 割合の高い集合 A, B が望まれる. 要求 2(頻出性).共起する回数が多い集合 A, B が望ま れる. 要求 3(類似性).集合 A, B 内の事象 x A(B)は集合 A, B内でそれぞれ類似性が高いことが望まれる. ここで,要求 1 および要求 2 はクラスタが与えられた もとでの系列上の頻出パターンに関する要求で,要求 3 はデータ空間上のクラスタリングに関する要求である. そして,抽出目標とする共起パターンは以下のように定 義される. 【定義 3】(共起クラスタ).クラスタ A, BD が,上述 の要求 1 から要求 3 を満たすとき,A, B はそれぞれ 共起クラスタと呼ぶ. 【定義 4】(共起パターン).共起クラスタの対 P(A, B)= {A, B|A B= } を共起パターンと呼ぶ. 2・2 評 価 関 数 提案法では,前節の要求条件に沿った評価関数を設 定し,候補パターンについて評価を行い評価値上位のパ ターンを列挙するアルゴリズムになっている.本章では, 評価関数の枠組みを説明する.具体的な関数は応用領域 ごとに適切に設計する必要がある.ここで,クラスタ A, B D が候補パターンであるとして,候補パターンに対 する評価関数 L(A, B)は次式で定義される. (1) L(A, B) = F(A, B)α · G(A, B)(1−α) 関数 F(A, B)[0, 1] は,要求 1 の共起性に関する評 価関数であり,例えば,区間内に現れる事象を集合と して Jaccard 係数により評価する.一方,関数 G(A, B) [0, 1] は,要求 3 の類似性に関する評価関数であり, 例えば,クラスタ重心からの平均二乗誤差を規格化して 用いる.共起性もしくは類似性が高いほど,F や G の 値が高くなるように関数を設計する.ここで,α [0, 1] は共起性と類似性のどちらを重視するかを調整するパラ メータである.特に意図がない場合,α=0.5 に設定す ればよい.類似性と共起性のどちらも高い共起パターン を抽出したいため,F と G の積の形で総合評価関数を定 義している.なお,要求 2 に関しては,最小支持度をし きい値として設定して頻出性を満たす. 2・3 ア ル ゴ リ ズ ム 提案アルゴリズムでは,まずいったん,事象の順序は 無視してデータ空間上で階層型クラスタリングを行い, 候補となるパターン群を生成する.候補パターンは,階 層型クラスタリングで得られた併合過程(デンドログラ ム)を用いて,包含関係を除くすべての取り得るクラス タのペアにより生成する.階層型クラスタリングを用いAlgorithm 1 Co-occurring cluster mining algorithm Input: event sequence with segments:
D = [x1,· · ·, xi][xi+1,· · ·, xj]· · · [xk,· · ·, xN]
dendrogram by hierarchical clustering from D = {xk}Nk=1:HC
minimum evaluation function value:Lmin
minimum support value: Suppmin Output: Co-occurrence patterns:
P = {Pk(A, B)|A ∩ B = ∅, A, B ⊆ D}
1: //Step 1: Generate sub-clusters
2: Generate possible sub-clusters fromHC: H1, H2,· · · , HN−2⊂ HC;
3: //Step 2: Evaluate candidate patterns
4: Initializek← 0;
5: for all combinations ofH do
6: if Hi∩ Hj=∅ and L(Hi, Hj)≥ Lmin and Supp(Hi, Hj)≥ Suppmin then
7: Pk(A, B)← {Hi, Hj};
8: k← k + 1; 9: end if
10: end for
11: //Step 3: Eliminate co-occurrence patterns with inclu-sion relation
12: for all combinations ofP do
13: ifPl∩ Pm=∅ then
14: RemovePifromP such that
i = arg min{L(Pl),L(Pm)};
15: end if
ることで,多様な粒度のクラスタを一度に取得できるこ とを利用するとともに,クラスタの形状は制限されるも のの,候補パターンの探索空間を大幅に削減できる.デー タ点数 N に対して,取り得るクラスタは N−2 個であ るため,候補パターン数は O(N2)である. 共起クラスタマイニングの擬似コードおよび概念図を Algorithm 1と図 1 に示す.まず,階層型クラスタリン グによって候補パターン群を生成する(図1(a)).そして, 式(1)による評価関数に従って各パターンの評価値を計 算する(図 1(b)).このままでは,高い評価値をもつパター ンに類似するパターンが大量に得られてしまうため,候 補パターン間の包含関係をチェックして,二つの共起ク ラスタのいずれも包含している場合は,評価値の低いパ ターンを除去する(図 1(c)).ここで,擬似コード中 の Pl Pm(l. 13)は,AlAm,AlBm,BlAm,BlBm
のいずれかを表している. 2・4 動 作 例 次に,簡単な例を用いてアルゴリズムの動作を示す. 以下に示す事象系列が与えられたとする. D = [x1, x2, x3][x4, x5, x6][x7, x8, x9, x10] そして,D{xk}10k=1に対して階層型クラスタリングによ る併合過程が図 2 のように得られたとする. ステップ 1 では,クラスタの併合過程から可能な候補 パターン(クラスタのペア)をすべて列挙する.例えば, 図 2 において,クラスタペア B−B′は,BB′である ので,このようなペアは除く.次に,ステップ 2 では各 候補パターンの評価を行う.図 2 の候補パターン P(A, B) について見ていく.D において,x1, x7, x9 A および x2, x8 B が割り当てられると, [x(A)1 , x (B) 2 , x3][x4, x5, x6][x (A) 7 , x (B) 8 , x (A) 9 , x10] となる.クラスタ A, B の事象は三つの区間のうち 二つ で共起している.この回数に基づいて共起度合いを計算 し,評価値 L が Lmin以上,かつ共起回数(この例では 2回)が最小支持度 Suppminを上回っているとき,この P(A, B)は共起パターンである.1 しかし,P(A, B′2 )も同様に条件を満たしたとすると, 類似するパターンが抽出されてしまう.そのため,パター ン間でクラスタの包含関係をチェックして,A は同一 かつ BB′であるため,評価値 L が高いほうのみを採 用する.ここで,包含関係のチェックは,P(A, B)と 1 P(A, C)のように,一方のクラスタが包含関係にない3 場合は異なるパターンとして数える.
3.応用 1:燃料電池の損傷パターン抽出
次に,本提案法を燃料電池の損傷パターン分析に応用 した例を紹介する.もともと,本手法は燃料電池の損傷 評価に関する研究を進める中で発想に至り,コア部分を 一般化したものである. 3・1 背 景 と 経 緯 本研究では,燃料電池の中でも高発電効率で産業 用・業務用として期待されている固体酸化物型燃料電池 (SOFC)を対象としている.名前からもわかるように, SOFCの構成部材はすべて固体のセラミックスでできて おり,熱膨張や還元膨張により部材に応力が生じるため, 運転状況によってはき裂やはく離が生じて電池の性能 にも影響を及ぼすことが知られている [Krishnamurthy 04,水崎 09]. そのような SOFC の物理的な劣化に関して,早くか ら東北大学のグループでは非破壊検査として知られるア 図 1 共起クラスタマイニングアルゴリズムの概念図(a)step1:候補パターンの生成 (b)step2:候補パターンの評価 (c)step3:パターン間の包含関係チェック
コースティックエミッション(AE)法に着目し,損傷信 号の計測を行っていた [Sato 05].その後,我々との共 同研究を開始し,カーネル化した Self-Organizing Map (SOM)を用いて,AE 事象群の分類および可視化を 行った.AE 事象の発生密度分布の推移から,大まかな 損傷の種類とその損傷過程が可視化できることを示した [Fukui 11].上述の研究に続いて,我々は AE 事象系列 から部材間の相互作用の推定を目的として,本稿で紹介 する共起クラスタマイニングの発想に至った.このよう な損傷の事象系列から相互作用の帰納的な推定は,我々 の知る限り類似研究はないようであり,SOFC の国際シ ンポジウムで発表 [Fukui 13] した際には大変興味をもっ ていただいた. 3・2 実 験 条 件 図 3 に共同研究を行っていた東北大学グループの SOFC試験装置の概略図を示す.燃料電池は,電解質を 電極材で挟んだ 3 層構造になっており,アルミ管を通じ て酸素と水素を供給して発電を行う.本試験装置では, 電解質材とアルミ管はリング状のガラスシールで気体が 漏れないようにパックされている.なお,実用されてい るものは,このセルをスタック化し発電量を大規模化し ているが,本試験装置はシングルセルで小型のものであ る.約 10 時間かけて 800℃付近まで温度を上昇させ, 約 40 時間通常運転した後,約 10 時間かけて室温まで下 降させた.本試験は,損傷試験のため通常より急に温度 を下降させることで,部材の収縮により意図的に損傷を 生じさせた.AE センサは広帯域型のセンサ*1(サンプ リング周波数 1 MHz)を使用し,アルミ管上部に接着 し計測を行った.炉の内部は高温になるため,離して計 測する必要がある. 3・3 前 処 理 まず,常時計測されている AE 信号から Kleinberg の バースト抽出法 [Kleinberg 02] を応用し,ノイズから信 号のバースト部分の切出しを行った.60 時間の計測デー タから,1 429 個の AE 事象が抽出された.エネルギー の高い損傷が生じると,構成材材の内部状態が大きく変 化すると仮定し,一定以上のエネルギーをもつ AE 事象 により,AE 事象の系列を区間に分割した(図 4).バー スト抽出法により検出した後の AE 事象系列を Dae=
{ ei|e1…eN}Ni=1,ei=(zi, 1, …, zi, p)とする.ここで,
zi, jは AE センサの圧電計測値(mV)である.そして, 各 AE 事象のエネルギーは計測値の二乗和で定義した. Ei= j z2i, j.そして,区間への分割のエネルギーしきい 値は Eσ=1 500(mV2)とした.なおしきい値については, [Ohsawa 02]を参考に区間数や区間内の事象数から経験 的に決定した. 各 AE 事象は,FFT により周波数パワースペクトル に変換し,パワースペクトルの離散点(4 000 点)を各 AE事象の入力データ Dae={xi} ℝ4 000×1 429とし,カー ネル SOM によって学習を行った.SOM は高次元の データ空間上でのデータ点分布をニューロンの位相に保 存し,低次元平面へ射影することで,データ点間の類 似性を反映した可視化を行うことができる.本研究で は,パワースペクトルの分布形状を確率分布とみなし, Kulback-Leibler情報量に基づくカーネル関数を SOM に用いることで,パワースペクトルの分布の類似性を反 映した学習を可能にしている.カーネル SOM によって 得られた位相空間上の共起性を共起クラスタマイニング によって抽出した.なお,カーネル関数を用いているた め,CCM で階層型クラスタリングを行う際のクラスタ 間距離に変更を加えている(詳細は [稲場 12] を参照). 3・4 評価関数の設計 本章では,共起パターンの評価関数 L の中身について 説明する.まず,共起性に関する F(A, B)は,以下の ように Jaccard 係数により定義した. (2) F(
A
,B
) =count(A
∩B
) count(A
∪B
) ここで,count(A)は区間内に現れる xA の数を表し ている.ただし,同一区間内に複数回 xA の事象が現 れたとしても,1 回と数えることとした.これは,連続 して頻出する事象よりも,比較的長期にわたる共起性を 抽出したいためである. 次に,クラスタ内の類似性に関する G(A, B)につい ては,次式に示すように SOM によって得られた位相空 間上の密集度に基づいて定義した. *1 PACUT-1000:http://www.pacndt.com 図 3 SOFC 損傷試験装置概略 図 4 AE 事象系列の区間分割の例(3) (4) (5) (6) ここで,NAは A に属する事象数,c(i)は xiに対する勝 者ニューロン(最適合ノード)の ID を,そして dc(i),c(j) は c(i),c( j)間の位相空間上のユークリッド距離を表 している.すわなち,dc(i),c( j )が小さいほど xiと xjは 類似していることを表している. 3・5 損傷共起パターン例 カーネル SOM の位相は,15×15 の正方格子に設定 した.ここで,SOM はデータ点の分布を捉える目的で あるため,ニューロン数は解像度に相当し,最適なニュー ロン数というものは存在しない.なお,カーネル SOM による可視化結果は,以前の研究成果 [Fukui 11] に基 づいて,損傷事象の解釈にも用いた. 共起クラスタマイニングの抽出しきい値のパラメータ は,それぞれ Lmin= 0.47 と Suppmin= 0.04 に設定した.
その他,評価関数内に制御パラメータも存在している. これらについては本稿では省略するが,パラメータ調査 も行っており,安定する範囲では上位パターンはほぼ同 じであることを確認している.これらのパラメータのも とで抽出された,全 29 の共起パターンの概略を表 2 に まとめる.それぞれのアルファベットは共起クラスタが 表す損傷タイプを示しており,内容は表 1 に示すとおり である.例えば,“(B)-(D)2”というのは,「初期欠陥 の進展によるき裂」と「電解質のき裂」に関する共起パ ターンが 2 種類抽出されたことを示している.なお実行 速度は,Intel Xeon CPU 2.66 GHz,6 GB RAM の計算 機(CCM は C で実装)を用いて,およそ 25.6 秒であった. § 1 SOFC の専門家から見て妥当な結果 図 5 の損傷パターン 1 は,領域(B)「初期欠陥の進 展によるき裂」と領域(D)「電解質のき裂」の共起パター ンである.初期欠陥は,電解質および電極材の不均一性 や不純物によるものであり,それらに起因して強度の弱 い箇所にき裂が生じると考えられる.一方,領域(D) は初期欠陥に直接は起因しない電解質のき裂の事象であ るが,この共起パターンは,初期欠陥の進展に応じて同 じ電解質内で新たにき裂が生じたことを示していると考 えられる.さらに,表 2 を見ると,領域(B)を含む共 起パターンが数多く抽出されており,初期欠陥のひずみ が各部材に影響を及ぼしていることがわかる.純度の高 いセルを作成することが重要であることと一致する結果 が得られた. 次に,図 5 の損傷パターン 2 は,領域(E)「ガラス シール材の損傷」と領域(F)「電極材のはく離を伴うき 裂」の共起パターンである.ここで,領域(E)の左側 から右側に移るに従って,AE 事象の周波数帯は少しず つ変化しており,我々は温度変化に伴うガラスシール材 の凝固過程の推移に対応するものと推察している.損傷 パターン 2 が示している共起クラスタは,領域(E)の 右側に位置しており温度が十分下降したときの事象であ る.そのため,ガラスシール材は凝固しており,一方で, 図 5 主要な損傷パターン例. 同じ色で示されたクラスタのペア(上 2 か所が赤,左 2 か 所が緑,右 2 か所が青)が一つの共起パターンを表している. カーネル SOM による位相空間上に描画している 表 1 カーネル SOM による主要な損傷タイプの分類 [Fukui 11]. 各領域は図 5 に対応 領域 損傷タイプ (A) 上温期間の部材のきしみ音(安定運転時) (B) 初期欠陥の進展によるき裂 (C) (B)に伴う部材のきしみ音 (D) 電解質のき裂 (E) ガラスシール材の損傷 (F) 電極材のはく離を伴うき裂 表 2 抽出された共起パターン数. 中間領域の損傷タイプは“{,}”で表している 損傷パターン 数 損傷パターン 数 (B)-(B) 2 (E)-(F) 5 (B)-(C) 3 (E)-{(A),(D)} 3 (B)-(D) 2 (E)-{(D),(E)} 1 (B)-(E) 2 (F)-{(A),(D)} 1 (C)-(C) 1 (F)-{(D),(E)} 1 (D)-(D) 1 {(A),(D)}-{(B),(D),(E)} 1 (D)-(E) 1 {(D),(E)}-{(D),(E)} 1 (E)-(E) 4 G(
A
,B
) = 1− daveAd2 · daveB aveALL daveA= xi,xj∈A dc(i),c(j) NA daveB= xi,xj∈B dc(i),c(j) NB daveALL= xi,xj∈D dc(i),c(j) ND電極材は収縮するため応力が生じて相互に損傷を起こし ていることを示すパターンであると推察される. § 2 専門家にとっても興味深い結果 一方で,専門家にとっても興味深い結果も得られた. 一つめは,電解質と電極材は物理的に接しているにもか かわらず,力学的な相互作用を示す共起パターンは一つ も抽出されなかった(表 2).電解質─電極材間は,ガラ スシール材ほど固着しているわけではないので,応力が 生じにくいと後付けで考えられるが,本研究以前は影響 を及ぼしているか不明であった.共起性が抽出され「な い」ことで,新たな知見が得られることもある. さらに,図 5 の損傷パターン 3 は,領域(B),(D), (E)の間と領域(A),(D)の間の共起パターンである. 単一の出現密度からは発見できなかったクラスタであっ た.これらのクラスタに対応する損傷タイプは不明で あったが,有意に共起パターンとして抽出されたことか ら,再現実験・検証実験を行う必要があるものの,次に つながる結果が得られた.
4.応用 2:地震発生パターン抽出
続いて,地震発生パターンの分析に応用した例を紹介 する.本応用例では,地震の震源リストデータから,異 なる地域間で発生した地震の共起パターンを抽出するこ とで,互いに影響を及ぼし合っている地域を同定する. 将来的には,地震の発生機構の解明の手掛かりになれば 幸いと考えているが,現状は著者らによって地震学の文 献と照らし合わせて整合性や解釈を行うに留まっている. 4・1 震源リストデータ 解析には 2011 年 1 月 1 日∼ 2012 年 12 月 31 日まで の,2 年間分の震源リストデータを用いた*2.特に東日 本大震災後は,余震活動が多く力学的な関係が表に現れ ていると考えられるため,この期間を対象とした.各地 震事象 eiは,< xi, ti, Mi >のタプルで表現される.ここで, xi=(lati, loni)は緯度と経度,tiは発生時刻,Miはマグ ニチュードである(震源の深度も提供されているが,同 じ地域において深度に差はあまり見られなかったため, 本研究では用いなかった).北緯 23 ∼ 50 度,東経 129 ∼ 156 度の範囲で,マグニチュード 4 以上の 5 954 回 の地震を対象とした.これらの地震の震源地を図 6 にプ ロットする. 地震事象の系列の区間分割は,大澤らの研究 [Ohsawa 02]を参考に,燃料電池応用と同様にマグニチュードを しきい値として分割を行った.大震災後で比較的大きな 地震が多数起こっていたため,マグニチュードのしきい 値は Mσ=6.0 とした.また,本震直後は大きな地震が 頻発しており,同一のしきい値では多くの短い区間に分 割されてしまうため,分割の際に最小期間を 1 時間とした. 4・2 評価関数の設計 共起パターンの評価関数 L は以下のように設計した. 共起性に関する F(A, B)は燃料電池の応用と同じく Jaccard係数に基づいて定義した.シグモイド関数にか けることで非負のパラメータβによって感度を調整でき るようにしている. (7) (8) クラスタの類似性に関する G(A, B)はクラスタ内平 均二乗誤差 SSW に基づいて定義した.ガウス関数にか けることで F と同様に非負のパラメータσ によって感 度を調整できるようにしている.G(A, B) = exp −SSW(A)
2+ SSW(B)2 σ (9) 上述の感度パラメータは,評価値が広く [0, 1] に分布し て上位パターンと下位パターンの区別が容易になるよう に調整を行った. 4・3 震源共起パターン例 図 7 に代表的な共起パターンを示す.片方の共起クラ スタが同一もしくは包含関係にあるクラスタを連結して グラフで表示している.このように表示することで,影 響度の高い地域が同定できる.宮城県の北東部沖から岩 手県沖にかけて多くの共起パターンが得られ(図 7(a), (b)),かつ共起クラスタは共有しているため影響度の高 い地域が見て取れる.また,いわき市周辺の内陸の共起 パターンも抽出された(図 7(d)).いわき市周辺は大 震災後に群発地震が発生しており,これらを共起として 抽出したものと考えられる.北方地域のプレート境界で も多くの共起パターンが抽出された(図 7(e)).P23は かなり離れた共起パターンが抽出されているが,同じプ レート境界上にある. *2 http://www.jmbsc.or.jp 図 6 2011 ∼ 12 年の震源(M4.0 以上) F(A, B) =1 + exp( 1 −βJ(A, B) − 0.5) J(A, B) =count(A∩ B) count(A∪ B)
4・4 地理的な計測との比較 図 8 は 1997 から 2001 年の GPS 計測から推定された 固着領域分布である.北方地域,宮城県・岩手県沖,い わき周辺と図 7 の共起パターンが多く抽出された地域と 一致している.震災後,応力が蓄積していた固着領域の エネルギーが解放され,連動して地震が行ったものと推 察している. 現在,地震学ではプレート境界地震においてアスペ リティモデルが有力視されている.プレート境界には強 く固着しているアスペリティ部分とゆっくりと滑ってい る部分が存在し,アスペリティにひずみエネルギーが蓄 積し,限界を超えるとエネルギーが解放され大きな地震 が起こると考えられている [松澤 09].図 9 は,本震前, 本震と同時期,本震後における滑り分布を示しており, 図 7(a),(b),(c)の高影響度領域を重ね合わせている. 領域(1)は本震前,領域(2)は本震前と本震後,領域(3) は本震と同時期の滑り領域に入っている.これらは偶然 かもしれないが,推定された高影響領域がアスペリティ の位置を表しているとしたら大変興味深い.三次元の物 理シミュレーションによってプレートの沈み込み帯にお けるアスペリティ間の相互作用を示した研究 [Ariyoshi 09]もあるため,共起性からアスペリティの位置を推定 できるかもしれないが,さらなる調査・検討が必要であ る.
5.お わ り に
本稿では,センサデータなど多次元の事象系列データ から,事象間の「共起性」に着目してクラスタのペアを 抽出する共起クラスタマイニングについて紹介した.さ らに,燃料電池の損傷評価の応用では,弾性波の事象系 列から部材間の物理的な相互作用を推察できることを示 し,地震発生パターンの応用では,震源リストから高影 響度領域を同定しアスペリティとの関係を示唆した. 本手法により燃料電池においては,破壊メカニズムの 一部が解明されるとともに,開発段階おいて材料の選定 や,運転時には適切な運転制御やセルの交換時期の同定 などに役に立てたら幸いである.地震応用においては, 予測・予知まではなかなか難しいが,アスペリティの位 図 7 代表的な震源共起パターン(東日本大震災後:2011 ∼ 12 年) (a)高影響領域 1 (b)高影響領域 2 (c)高影響領域 3 (e)プレート境界のパターン (f)その他 (d)内陸のパターン 図 8 1997 ∼ 2001 年の GPS 計測から 推定された固着領域分布 (出典:[Suwa 06])置同定や発生メカニズム解明の一部に貢献できれば幸い である. 謝 辞 本稿は,主に稲場大樹氏(現在(株)リコー勤務)に よる大阪大学大学院情報科学研究科在籍時の研究成果を まとめている.また,東北大学大学院工学研究科佐藤 一永准教授ならびに同大学水崎純一郎名誉教授において は,燃料電池の損傷評価について貴重な実験データの提 供ならびに考察に関して有益な議論をいただいた.な お,本稿で紹介した研究の一部は科研費挑戦的萌芽研究 (24650068)の支援を受けて行われた.ここに感謝の意 を表す.
◇ 参 考 文 献 ◇
[Agrawal 94] Agrawal, R. and Srikant, R.: Fast algorithms for mining association rules, Proc. 20th Int. Conf. on Very Large
Databases(ICVLD), pp. 487-499(1994)
[Agrawal 98] Agrawal, R., Gehrke, J., Gunopulos, D. and Raghavan, P.: Automatic subspace clustering of high dimensional data for data mining applications, Proc. 1998
ACM SIGMOD Int. Conf. on Management of Data(ICMD), pp. 94-105(1998)
[Ariyoshi 09] Ariyoshi, K., Hori, T., Ampuero, J.-P., Kaneda,Y., Matsuzawa, T., Hino, R. and Hasegawa, A.: Influence of interaction between small asperities on various types of slow earthquakes in a 3-D simulation for a subduction plate boundary, Gondwana Research, Vol. 16, pp. 534-544(2009) [Everitt 11] Everitt, B. S., Landau, S., Leese, M. and Stahl, D.:
Cluster Analysis, 5th Edition, Wiley(2011)
[福井 08] 福井健一,斉藤和巳,木村昌弘,沼尾正行:自己組織化ネッ トワークによる動的クラスタの可視化編纂,人工知能学会論文 誌,Vol. 23, No. 5, pp. 319-329(2008)
[Fukui 11] Fukui, K., Akasaki, S., Sato, K., Mizusaki, J., Moriyama, K.,Kurihara, S. and Numao, M.: Visualization of damage progress in solid oxide fuel cells, J. Environment and
Engineering, Vol. 6, No. 3, pp. 499-511(2011)
[Fukui 13] Fukui, K., Sato, K., Hashida, T., Mizusaki, J. and Numao, M.: Intelligent analysis for evaluating physical degradation using acoustic emission, Proc. 13th Int. Symp. on
Solid Oxide Fuel Cells(SOFC-XIII)(ECS Transactions), Vol. 57, pp. 571-580(2013)
[Fukui 14] Fukui, K., Inaba, D. and Numao, M.: Discovering seismic interactions after the 2011 Tohoku Earthquake by co-occurring cluster mining, Trans. Japanese Society for
Artificial Intelligence, Vol. 29, No. 6, pp. 493-502(2014) [Guyet 11] Guyet, T. and Quiniou, R.: Extracting temporal
patterns from interval-based sequences, Proc. Int. Joint Conf.
on Artificial Intelligence(IJCAI-11), pp. 1306-1311(2011) [Hahsler 11] Hahsler, M. and Dunham, M. H.: Temporal
structure learning for clustering massive data streams in real-time, Proc. 11th SIAM Int. Conf. on Data Mining(SDM’11), pp. 664-675(2011)
[Han 00] Han, J., Pei, J. and Yin, Y.: Mining frequent patterns without candidate generation, Proc. ACM SIGMOD Conf. on
Management of Data, pp. 1-12(2000)
[稲場 12] 稲場大樹,福井健一,佐藤一永,水崎純一郎,沼尾正行: 燃料電池における損傷パターン抽出のための共起クラスタマイ ニング,人工知能学会論文誌,Vol. 27, No. 3, pp. 121-132(2012) [Kleinberg 02] Kleinberg, J.: Bursty and hierarchical structure
in streams, Proc. 8th ACM SIGKDD Int. Conf. on Knowledge
Discovery and Data Mining(KDD’02), pp. 91-101(2002) [Krishnamurthy 04] Krishnamurthy,R.and Sheldon,B.
W.: Stresses due to oxygen potential gradients in non-stoichiometric oxides, J. Acta Materialia, Vol. 52, pp. 1807-1822 (2004)
[Kulldorff 01] Kulldorff, M.: Prospective time periodic geographical disease surveillance using a scan statistic, J.
Royal Statistical Society, Series, A, Vol. 164, pp. 61-72(2001) [松澤 09] 松澤 暢:プレート境界地震とアスペリティ・モデル,地 震,Vol. 61, pp. S347-S355(2009) [光永 06] 光永悠紀,鷲尾 隆,元田 浩:適応的密度基準に基づく 部分空間クラスタリングを用いた定量的多頻度アイテム集合の マイニング,人工知能学会論文誌,Vol. 21, No. 5, pp. 439-449 (2006)
[Miyazaki 11] Miyazaki, S., McGuire, J. J. and Segall, P.: Seismic and aseismic fault slip before and during the 2011 off the pacific coast of Tohoku Earthquake, Earth Planets Space,Vol. 63, pp. 637-642(2011)
[水崎 09] 水崎純一郎:固体酸化物燃料電池(SOFC)の最近の進 展,課題そして展望,Ceramics Japan, Vol. 44, No. 4, pp. 262-266(2009)
[O’Callaghan 02] O’Callaghan, L., Meyerson, A., Motwani, R., Mishra, N. and Guha, S.: Streaming-data algorithms for high-quality clustering, Proc. 18th Int. Conf. on Data Engineering (ICDE’02), pp. 685-694(2002)
[Ohsawa 02] Ohsawa, Y.: KeyGraphas risk explorer in earthquake-sequence, J. Contingencies and Crisis Management, 図 9 震災前後での本震付近の滑り分布(出典:[Miyazaki 11])と共起クラスタを共有する高影響度領域との関係
Vol. 10, No. 3, pp. 119-128(2002)
[Sato 05] Sato, K., Hashida, T., Yashiro, K., Yugami, H., Kawada, T. and Mizusaki, J.: Mechanical damage evaluation of solid oxide fuel cells under simulated operating conditions, J.
Ceramic Society of Japan,Vol. 113, No. 8, pp. 262-264(2005) [Suwa 06] Suwa, Y., Miura, S., Hasegawa, A., Sato, T. and
Tachibana, K.: Interplate coupling beneath NE Japan inferred from three-dimensional displacement field, J. Geophysical
Research, Vol. 111, p. B04402(2006)
[Xu 08] Xu, R. and Wunsch-II, D. C.: CLUSTERING, IEEE Press Series on Computational Intelligence(2008)
[Zhang 97] Zhang, T., Ramakrishnan, R. and Livny, M.: BIRCH: A new data clustering algorithm and its applications, Data
Mining and Knowledge Discovery, Vol. 1, pp. 141-182(1997) 2015年 1 月 29 日 受理
著 者 紹 介
福井 健一(正会員) 2003年名古屋大学大学院人間情報学研究科物質・生 命情報学専攻博士前期課程修了.博士(情報科学). 大阪大学産業科学研究所特任助手を経て,2010 年 より大阪大学産業科学研究所助教.IEEE Computer & Information Technology 2008 Best Paper Award,2011年度(第 25 回)全国大会優秀賞.2012 年度研
究会優秀賞など受賞.訳書:Abraham, A., Grosan, C., and Ramos, V. 著:群知能とデータマイニング,東京電機大学出版局 (2012).応用指向のデータマイニング基礎的研究に従事.AI による環境 貢献に向けた研究を行う.IEEE Computer Society,情報処理学会,進 化計算学会各会員. 沼尾 正行(正会員) 1982年東京工業大学工学部電気電子工学科卒業. 1987年同大学院情報工学専攻博士課程修了.工学博 士.東京工業大学大学院情報理工学研究科計算工学 専攻助教授を経て,2003 年より大阪大学産業科学研 究所教授.1989 ∼ 90 年スタンフォード大学 CSLI 客員研究員.人工知能,機械学習,関数型言語など の研究に従事.日本認知科学会,日本ソフトウェア 科学会,電子情報通信学会,AAAI,ACM 各会員.