DEIM Forum 2016 G4-2
既存月震分類の機械学習を用いた妥当性の検証
加藤 広大
†山田 竜平
††山本 幸生
†††横山 昌平
††††石川
博
††††††
首都大学東京システムデザイン学部
〒 191–0065 東京都日野市旭が丘 6–6
††
国立天文台 RISE 月惑星探査検討室 〒 181-8588 東京都三鷹市大沢 2–21–1
†††
宇宙航空研究開発機構宇宙科学研究所
〒 252–5210 神奈川県相模原市中央区由野台 3–1–1
††††
静岡大学情報学部
〒 432–8011 静岡県浜松市中区城北 3–5–1
†††††
首都大学東京大学院システムデザイン研究科 〒 191–0065 東京都日野市旭が丘 6–6
E-mail:
†
[email protected],
††
[email protected],
†††
[email protected],
††††
[email protected],
†††††
[email protected]
あらまし アポロミッションによって,1969 年から 1977 年の間,膨大な月震 (月の地震) データが取得された.月震
の解析は,月の内部構造や月震の発生原因などを解析するうえで非常に重要であり,約 40 年が経過した現在も解析が
続けられている.これまで月震は波形の類似性から,その種類や震源位置の分類が行われてきた.しかし,この月震
の分類結果に対する妥当性に疑問が残ることが示唆されており,分類結果に誤りがある可能性や,分類をより細分化
できる可能性がある.そこで,本研究では,機械学習を用いて,従来手法による震源に関する月震分類の妥当性を検
証する.その結果,同一の震源から複数種類の月震波形が生じているケースや,異なる震源で月震波形の特徴が類似
しているケースを発見することができた.
キーワード
波形解析,クラスタリング,月地震
1.
は じ め に
NASAが行った,月への有人宇宙飛行計画であるアポロミッ ションの目的のひとつには,月への観測装置の設置があった.Apollo Lunar Surface Experiments Package (ALSEP) と呼
ばれる観測装置群が月面に設置され,その中には地震計も含ま
れていた.この地震計を用いて,Passive Seismic Experiment
(PSE)と呼ばれる,月の地震,すなわち月震の連続観測が行わ れた.これらのデータは全てWeb上で公開され,データの閲 覧,取得が可能になっている[1](注1). PSE実験によって取得されたデータは,月の研究上貴重な データであり,約40年経った現在でも解析が行なわれており, 月震の発生原因や,月の内部構造の推定に利用される[2], [3]. これまでの解析から,月震は地球の地震とは,大きく異なる 性質を持つ事がわかってきている.まず,地球での地震の発生 要因となるプレート運動が月には存在しない.そして,月震は その発生要因から,深発月震,浅発月震,隕石衝突,熱月震な どに分類されている.特に,発生頻度の多い深発月震は,同一 の震源から繰り返し発生しており,震源ごとに月震波形が類似 していることが知られている.深発月震は走時データに加え て,その月震波形の類似性から震源位置の違いが判別されてい る.そして,深発月震の震源には,震源ラベルが付与されてい る(A1,A6のようにAxxとラベリングされる). 月震波形の類似性の観点において,従来,深発月震は時系 列波形の相互比較から分類が行われてきた[4],[5].しかし,月 震データは非常に多くのノイズが含まれており,月震によって
(注1):DARTS at ISAS/JAXA http://darts.jaxa.jp
は,ラベルを付与することが困難であったり,誤ったラベルが
付与されてしまう可能性がある.最近の後藤ら[6]の研究では,
Self-Organizing Map (SOM)を用いた月震の可視化を通じ,従
来の手法で行われたラベル付与の正確さや妥当性に疑問が残る ため,分類を細分化できる可能性が示唆されている.また,従 来の手法とは異なる分析によって,未知の月震が検出された例 もあり[7], [8]従来の震源分類に対する妥当性を検証することが 求められている. そこで,本研究では,機械学習を用いて,従来の手法で分類 された震源ラベルの妥当性を検証する.図1にA1震源とされ ている3つの月震波形を示す.従来の震源分類によって,図1 の全ての月震波形はA1震源と分類されている.図1上段の月 震波形では類似度を目視で判断することは難しい.図1下段に,
本研究で特徴量として用いたPower Spectral Density (PSD)
をそれぞれの月震波形に対して適用した結果を示す.結果とし て,同じA1震源の月震であっても,特徴に差異があることが わかる.以上のことから,従来手法とは異なる観点に基づいて, 震源分類の検証を行うことの有用性は明らかである.また,本 研究では,同一の震源から発生する月震に,特徴の差異が存在 する可能性や,同一の震源の月震を,さらに細かいサブクラス に分類できる可能性が存在するという仮定のもと実験を行う. 本論文は,以下の構成に従う.2章では,本研究に関連する 研究について述べる.3章では,深発月震の分類の妥当性の検 証の提案手法について述べる.4章では,実験結果と考察につ いて述べる.5章では,まとめと今後の課題について述べる.
2.
関 連 研 究
本章では,これまでの月震分類手法について述べる.0 2 4 6 8 10 12 14 Time [minutes] −3 −2 −1 0 1 2 3 Amp litud e 0 2 4 6 8 10 12 14 Time [minutes] −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 Amp litud e 0 2 4 6 8 10 12 14 Time [minutes] −4 −3 −2 −1 0 1 2 3 4 Amp litud e 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Fre uency [Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (N orma lize d) 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Fre uency [Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (N orma lize d) 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Fre uency [Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (No rma lize d) 図 1 A1 震源とされている月震波形 (上段) と,本論文で計算した月震波形の特徴量 (下段) の例 ALSEPによってデータが取得された1970年代当初は,同一 の震源から発生する月震波形が類似することに着目し,目視で 分類を行っていた.その後,計算機の発達に伴い,Nakamura ら[5]による,月震波形の相互相関係数を用いた最短距離法に 基づく階層的クラスタリングを用いて月震分類が行われた.こ れが,現在の月震分類の基準となっている.さらに,月震波形 の前処理を改良することで,Bulowら[8]は,新しいA1震源 の月震をを多数発見している.また,Endrunら[7]は,隠れマ ルコフモデルを用いた手法で,大規模な月震データベースから, これまでに発見されていなかった新たな月震を検出することに 成功している.これらの機械学習を用いた研究より,これまで 発見されていなかった月震の検出,未分類であった月震の分類 がなされている.そのため,機械学習により,これまでに目視 で発見,分類されていた従来の月震波形の検出手法や,分類の 基準を改良することが可能であると考えられる. また,後藤ら[6]によるSOMを用いた月震の可視化システ ムでは,従来の,月震波形の相互相関係数ではなく,周波数成 分を特徴量として,教師なし学習のひとつであるSOMによる 深発月震の分類を可視化した.SOMの結果より,従来の深発 月震の震源分類の結果に対する妥当性への疑問を示唆している. 後藤らの研究により,複数の震源で類似している月震が存在 する可能性や,分類が細分化できる可能性があげられているこ とや,前述したBulowら[8]やEndrunら[7]の研究により新 たな月震などが発見されていることから,本研究では,“従来 の分類の妥当性”と“サブクラスの有無”の2つの検証を行う.
3.
提 案 手 法
3. 1 従来の分類の妥当性の検証 従来の分類結果の妥当性を検証する手法を述べる.本研究で は,従来と異なる特徴量を用いて,教師あり機械学習手法のひとつであるSupport Vector Machine (SVM) [9]を適用し,従
来の震源分類の妥当性の評価を行う.また,月震は,地震と違 い,1時間以上揺れが続くものも存在する.従って,震源ごと の特徴の差異が現れやすい時刻を,切り出し位置を推移するこ とで検証する. 本研究では,機械学習により用いる特徴量として,PSDを用 いる.PSDは周波数毎の振幅強度を計算したものである(注2). PSD計算の際に用いたセグメント長は512点とし,窓関数に hanning窓を用いた.セグメント長の半分ずつ,約15分間の 月震波形データをシフトして計算したPSDの平均値を導出す る.導出されたPSDをベクトル長が1になるよう正規化した ものを最終的な特徴量とする. 生成した特徴量に基づいて,従来の震源分類による震源ラベ ルがSVMによって再現可能かを確認する.このとき,従来の 震源分類による震源ラベルの一部をトレーニングデータとし, 残りの震源ラベルをテストデータとし,交差検定を行う.SVM のクラスは従来の目視によるラベルとする.その結果として, SVMによる分類結果と,従来の目視によるラベルの多くが一 致していれば,従来の震源分類の性能の妥当性は高いと考えら れる. SVMの実装には,scikit-learn [10]のSVCを用いた.多ク ラス分類法には,one-versus-the-restを用いた.また,不均衡 データに対応するため,データ数に応じて自動で重みをつける ようclass-weightパラメータを“balanced”に設定した 3. 2 サブクラスの有無の検証 各震源の月震波形をサブクラスに分割が可能である仮定を 検証する手法を述べる.本研究では,検証の手法として,
Hi-erarchical Agglomerative Clustering (HAC) [11]を適用する.
HACは教師なし学習のひとつであり,クラスタリングを適用 する各要素をひとつのクラスタとみなし,ある基準となる距離 に基づいて,距離が近い順にクラスタを生成する手法である. 階層的クラスタリングの特徴として,クラスタ数を変化させた 時の,各クラスタに包含関係が成立することがあげられる.ま た,非階層的クラスタリングでは一般的にクラスタ数を指定す ることが前提である.しかし,近年の研究において新たな月震 (注2):http://www.cygres.com/OcnPageE/Glosry/SpecE.html
!
"!
!
#!
!
$!
!"! !#! !$! !#! !#! !#! !$! !"! サブクラス !"!!
"!
A1-0!
#!
A1-2 !#!!
$!
A7-1!
#!
A7-2 !$! A6-0 A6-1 A6-2!
"!
!
#!
!
$!
図 2 サブクラスの作成方法 表 1 データセットの内訳 震源 A1 A6 A7 A8 A9 A10 合計 データ数 173 32 29 39 62 35 370 が発見されるなどの研究段階であり,適切な月震のクラスタ数 を判断することは難しい.階層的クラスタリングでは,クラス タ数を事前に指定する必要がない.距離の閾値を変化させるこ とでクラスタ数を変化させることができる.そのため,本研究 では,階層的クラスタリングが適していると判断した.特徴量 は,3. 1節と同様に,PSDを用いる.類似度の算出にはユーク リッド距離を用い,クラスタの併合方法にWard法[11]を用い る.クラスタリングの実装には,scipy [12]を用いた. クラスタリング結果と,従来の震源ラベルを用いてサブクラ スを定義する.図2にサブクラス生成の例を示す.C0,C1,C2 は,本節で述べた手法によって得られたクラスタとする.C0は 震源がA1とA6の月震で構成される.C1は震源がA6とA7 の月震で構成される.C2は震源がA1,A6,A7の月震で構成 される.C0内のA1月震をA1–0,C1内のA1月震をA1–1, A7月震をA7–1といったように,クラスタと従来の震源ラベ ルを組み合わせてサブクラスを定義する.サブクラスを用いて, SVMによる5交差検定を行う. しかし,クラスタリング結果のみでは,C0内のA1月震と, C2 内のA1月震の間に本質的な特徴の差が存在するかわから ない.また,C1内のA6月震とA7月震の特徴に十分な差が存 在するのかも同様にわからない.しかし,サブクラスを用いた 教師あり学習を行えば,同一クラスタ内での震源ごとの差異や, 異なるクラスタにある同一震源の差異を定量的に評価すること ができると考えられる.つまり,分類性能が高いクラスの月震 は,サブクラス固有の特徴があり,分類性能が低いクラスは, 他のクラスと比較して,固有の特徴を持たないため,サブクラ スとして成立しないクラスであると評価する.4.
実 験 結 果
4. 1 データセット 表1に,実験に用いたデータセットを示す.本研究では,3. 1 0 1 2 3 4 5 6 time[m] 0.0 0.2 0.4 0.6 0.8 1.0 f1-me asu re 図 3 P 波到達時刻からの切り出し時刻と F 値の推移 表 2 SVM による 5 交差検定結果 震源 適合率 再現率 F 値 A1 0.93 0.91 0.92 A6 0.90 0.84 0.87 A7 0.96 0.86 0.91 A8 0.82 0.79 0.81 A9 0.87 0.84 0.85 A10 0.55 0.74 0.63 節,3. 2節ともに,月震データセットの中から,アポロ12号の ミッションで取得された,6震源370個の深発月震のデータを 用いる.本データセットは,比較的月震イベントが多く観測さ れた震源から,人手でノイズの少ない月震を選定している.ま た,前処理として,平均引き,トレンド引き,0.3-1.5Hzのバ ンドパスフィルタ処理,スパイク除去処理を行った長周期地震 計のZ軸成分(LPZ)のデータを実験に用いた. 4. 2 従来の分類の妥当性の評価 本節では,3. 1節の手法を用いた,従来の分類の妥当性の評 価の結果について述べる. はじめに,図3に,P波到達時刻と切り出し開始時刻の差と, SVMによる5交差検定のF値の推移を示す. 図3は,PSD を特徴量としたときに,P波到達時刻からの切り出し開始時刻 の推移に伴う,F値の推移を示しており,月震の開始直後が, 最も震源ごとの特徴の差異を持っていることを示している.そ のため,以後の実験ではP波到達時刻直後のデータを用いる. また,図3における,P波到達時刻直後から約15分間の月 震波形を用いたSVMの5交差検定の各震源別の結果を表2に 示す.従来の手法とは異なる特徴量を用いても,従来の分類結 果に準ずる結果を得られたことから,従来の手法による分類結 果はおおよそ妥当であると考察できる.また,震源分類におい て高い分類性能を表2で示していることから,PSDは特徴量と して適切である.しかし,表2のF値が1.0でないことから, • 特徴量と手法の組み合わせが適切でない • 従来の分類基準とSVMによる分類基準が一部異なる • PSDで捉えることができない特徴が月震に含まれている といった考察が可能である.従って,従来の分類基準を異なる 特徴量を用いて厳密に定義できることが推察できる.0 1 2 3 4 Cluster ID 0.0 0.2 0.4 0.6 0.8 1.0 P ro po rti on A1 A10 A6 A7 A8 A9 図 4 クラスタ数 5 における震源別の月震の内訳 表 3 図 4 のサブクラス別の SVM の結果 サブクラス 適合率 再現率 F 値 A1–0 0.97 0.97 0.97 A1–2 0.60 0.57 0.59 A1–3 0.94 0.96 0.95 A1–4 0.62 0.54 0.58 A6–0 0.88 0.88 0.88 A6–2 0.90 0.83 0.86 A7–0 1.00 1.00 1.00 A7–4 0.94 0.88 0.91 A8–1 1.00 0.93 0.97 A8–4 0.77 0.77 0.77 A9–1 0.92 1.00 0.96 A9–2 0.93 0.89 0.91 A9–4 0.50 0.40 0.44 A10–2 0.58 0.78 0.67 A10–3 0.79 0.88 0.83 A10–4 0.10 0.14 0.12 4. 3 サブクラスの有無の評価 本節では,3. 2節の手法を用いた,各震源のデータが,サブ クラスに分割が可能かどうかの評価の結果について述べる.図 4,図5,図6,図7に,クラスタ数を5,10,15,20と指定し た際の,各クラスタ内の震源別の月震の内訳を示す.図4,図 5,図6,図7において,グラフの横軸はクラスタ番号であり, 縦軸は,ある震源におけるクラスタ内のデータ数を,ある震源 におけるデータの総数で割った値である.図4,図5,図6,図 7のサブクラスを用いたSVMの5交差検定のF値を,それぞ れ表3,表4,表5,表6に示す.ただし,データ数が5未満の クラスにおいては,本実験では5交差検定の対象に含めないも のとする. 図4から,各クラスタが複数の震源で構成されており,A1, A6,A7で構成されるクラスタ0や,主にA6,A9で構成され るクラスタ2など,クラスタを構成する震源は大きく異なるこ とがわかる.図5,図6,図7と,クラスタ数を増やしていっ た場合も同様のことがいえるが,クラスタ数が増加するにつれ, 単一の震源で構成されるクラスタが増えている.これは,図4 におけるクラスタ0が図5におけるクラスタ0,クラスタ1,ク 0 1 2 3 4 5 6 7 8 9 Cluster ID 0.0 0.2 0.4 0.6 0.8 1.0 P ro po rti on A1 A10 A6 A7 A8 A9 図 5 クラスタ数 10 における震源別の月震の内訳 表 4 図 5 のサブクラス別の SVM の結果 サブクラス 適合率 再現率 F 値 A1–0 1.00 1.00 1.00 A1–6 0.59 0.62 0.60 A1–7 0.99 0.86 0.92 A1–9 0.57 0.71 0.63 A6–2 1.00 1.00 1.00 A6–6 0.73 0.83 0.78 A7–2 1.00 1.00 1.00 A7–8 0.92 1.00 0.96 A7–9 0.67 0.40 0.50 A8–3 1.00 1.00 1.00 A8–9 0.93 0.64 0.76 A9–4 1.00 1.00 1.00 A9–5 0.93 0.91 0.92 A9–9 0.50 0.40 0.44 A10–6 0.58 0.78 0.67 A10–7 0.68 0.88 0.77 A10–9 0.18 0.29 0.22 ラスタ2に分割されている例などから,クラスタ数が少なかっ た場合に分割されなかったクラスタが分割され,単一の震源で 構成されているためである. 表3において,クラスタ0,クラスタ1,クラスタ3は,そ れぞれのサブクラスのF値は高い.しかし,クラスタ2につ いてはA1とA10のサブクラスが,クラスタ4は,A1,A9, A10について,F値が低い.これらは,クラスタ数が少なかっ たため,特徴を十分に細分化できていなかったことが理由であ ると推察される. 図5について,従来の分類手法によりA1震源とされている 月震は,クラスタ0,クラスタ6,クラスタ7,クラスタ9に分 割されている.また,クラスタ2に着目すると,A6震源とA7 震源の月震で構成されていることから,クラスタ2のA6震源 の月震とA7月震は非常に近い特徴を持つことがわかる.また, A7震源の月震は,クラスタ2とクラスタ8に多く含まれるこ
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Cluster ID 0.0 0.2 0.4 0.6 0.8 1.0
Pro
po
rtio
n
A1 A10 A6 A7 A8 A9 図 6 クラスタ数 15 における震源別の月震の内訳 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Cluster ID 0.0 0.2 0.4 0.6 0.8 1.0Pro
po
rtio
n
A1 A10 A6 A7 A8 A9 図 7 クラスタ数 20 における震源別の月震の内訳 とから,A7震源は,少なくとも2種類の異なる特徴を持つ月 震を発生させる可能性があることがわかる.また,図5につい て,A8月震や,A6月震など,多くの月震に同じことが言える. そのため,1つの震源から発生する月震でも,複数の特徴を持 つことがわかる.図9に,A1–0,A1–6,A1–7,A1–9の月震波形と特徴量の
例を示す.A1–0とA1–6は特徴量の違いが図9からも顕著で ある.また,表4の交差検定の分類性能も高いことから,A1–0 とA1–6のサブクラスには分割可能である.しかし,A1–6と A1–9は交差検定の分類性能が低い.分類性能が低い理由と して, • 従来の分類が誤りであるものが含まれている • 他クラスに併合されるべきクラスである
が考えられる.A1–6はA1–7やA6–6に誤分類されており,
A1–9はA1–7やA8–9に誤分類されている.よって,A1–6,
A1–9のクラスはサブクラスとして成立せず,A1–7に併合され るべき特徴であると推察される. 図8に,A6–2とA7–2の月震波形と特徴量の例を示す.同 一クラスタにあることから,これらの月震は非常に近い性質を 持っている.しかし,表4より,A6–2,A7–2共に交差検定の 分類性能が高いことから,クラスタ2におけるA6月震とA7 月震は近い性質を持っているが,はっきりとした特徴の差異が あることが示されている.従って,A6–2とA7–2はサブクラ スとして成立する. 次に,階層性に着目した考察を行う.A6–2とA7–2は,図7 におけるクラスタ3とクラスタ4に分割される.図5において, クラスタ2が複数の震源で構成されるものであっても,表4, 表6の結果と,図7で単一の震源のクラスタに分割されている
表 5 図 6 のサブクラス別の SVM の結果 サブクラス 適合率 再現率 F 値 A1–0 1.00 1.00 1.00 A1–1 1.00 1.00 1.00 A1–7 0.46 0.60 0.52 A1–8 0.75 0.82 0.78 A1–9 0.97 0.85 0.91 A1–10 0.88 0.93 0.90 A1–11 0.90 0.82 0.86 A1–13 0.60 0.60 0.60 A1–14 0.68 0.79 0.73 A6–3 1.00 1.00 1.00 A6–7 0.94 0.85 0.89 A7–3 1.00 1.00 1.00 A7–12 0.92 1.00 0.96 A7–14 0.67 0.40 0.50 A8–4 1.00 1.00 1.00 A8–13 0.86 0.75 0.80 A8–14 0.92 0.86 0.89 A9–5 1.00 1.00 1.00 A9–6 0.97 0.91 0.94 A10–8 0.73 0.89 0.80 A10–11 0.75 0.94 0.83 表 6 図 7 のサブクラス別の SVM の結果 サブクラス 適合率 再現率 F 値 A1–0 1.00 1.00 1.00 A1–1 1.00 1.00 1.00 A1–9 0.64 0.70 0.67 A1–11 0.83 0.91 0.87 A1–12 0.90 0.93 0.91 A1–13 0.90 0.69 0.78 A1–14 0.93 0.93 0.93 A1–15 0.82 0.82 0.82 A1–17 0.50 0.40 0.44 A1–18 0.67 0.67 0.67 A1–19 0.29 0.29 0.29 A6–3 1.00 1.00 1.00 A6–9 0.91 1.00 0.95 A7–4 1.00 1.00 1.00 A7–16 0.92 1.00 0.96 A7–19 0.50 0.20 0.29 A8–5 1.00 1.00 1.00 A8–17 0.86 0.75 0.80 A8–18 0.75 0.82 0.78 A9–6 1.00 1.00 1.00 A9–7 0.91 0.87 0.89 A9–8 0.76 0.80 0.78 A10–10 1.00 0.62 0.77 A10–15 0.80 1.00 0.89 ことから,サブクラスとして成立するものであることは明らか である.また,図5におけるクラスタ7は,主にA1とA7で 構成されているが,クラスタ数を増やした図6では,クラスタ 9,クラスタ10,クラスタ11に分割される.表4では,A1–7 0 2 4 6 8 10 12 14 Time[minutes] −4 −3 −2 −1 0 1 2 3 4 Amp litu de 0 2 4 6 8 10 12 14 Time[minutes] −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 Amp litu de 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Frequency[Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (N orma lize d) 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Frequency[Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (N orma lize d) 図 8 A6–2 (左),A7–2 (右) の月震波形 (上段) と特徴量 (下段) の例 0 2 4 6 8 10 12 14 Time[minutes] −2.0 −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 2.0 Amp litu de 0 2 4 6 8 10 12 14 Time[minutes] −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 2.0 Amp litu de 0 2 4 6 8 10 12 14 Time[minutes] −20 −15 −10 −5 0 5 10 15 20 Amp litu de 0 2 4 6 8 10 12 14 Time[minutes] −3 −2 −1 0 1 2 3 Amp litu de 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Frequency[Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (N orma lize d) 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Frequency[Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (N orma lize d) 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Frequency[Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (N orma lize d) 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Frequency[Hz] 0.0 0.2 0.4 0.6 0.8 1.0 PSD (N orma lize d) 図 9 左から A1–0,A1–6,A1–7,A1–9 の月震波形 (上段) と特徴量 (下段) の例
のF値は0.92であるが,表5におけるA1–9,A1–10,A1–11
のF値はそれぞれ0.91,0.90,0.86である.そのため,クラス タ数を増加させることで,さらに月震波形の特徴を細分化する ことが可能であると考えられる.しかし,どこまで細分化する ことが適切であるかは,この結果から判断することは難しい. しかしながら,クラスタリング方法の改善などにより,十分な 特徴量をもつサブクラスの半自動的な決定が可能であると考え られる.
5.
ま
と
め
本研究では,機械学習による,従来の分類結果の妥当性の検 証と,1つの月震から複数の性質の月震波形が生成されると仮 定したサブクラスの検証を行った.従来の分類結果の妥当性の 検証には,SVMにより従来の分類結果が再現可能かを実験し た.その結果として,従来の目視による分類は,ほとんど再現 可能であり,妥当であると考えられる.しかし,一部,誤りが 含まれる可能性があることがわかった.また,サブクラスの検 証については,HACによるクラスタリング結果をSVMで検 証した.結果として,多くの震源について,SVMで分類可能 な程度の複数の特徴を持つことがわかった. 今後の課題として,月震の階層型クラスタリングにおけるサ ブクラスとなるクラスタの定義を行うこと,特徴量を変更して 同様の実験を行った際に,似たような傾向の結果が現れるかを 検証することがあげられる.他の特徴量を用いて,同じような クラスタリング,分類がされる場合は,PSDの性質に依存しない震源の汎用的な性質であるということが明らかになるからで ある.また,本研究のデータセットに含まれていない震源や, 月震のX軸,Y軸成分や,アポロ12号以外のデータ,及び潮 汐力など様々な条件を考慮した統合的な分析を行うことも課題 のひとつである.
謝
辞
本稿の執筆にあたって多数の有益な助言を頂いた,大分工業 高等専門学校情報工学科助教の廣田 雅春氏,首都大学東京特任 助教の江原 遥氏に感謝いたします. 本研究(の一部)は傾斜的研究(全学分)学長裁量枠戦略的研 究プロジェクト戦略的研究支援枠「ソーシャルビッグデータの 分析・応用のための学術基盤の研究」による 文 献 [1] 山田竜平, 山本幸生, 桑村潤, 中村吉雄. アポロ月地震データ公開 システムの開発. 宇宙科学情報解析論文誌宇宙航空研究開発機構 研究開発報告, No. 1, pp. 121–131, 2012.[2] Y. Nakamura, G. V. Latham, and H. J. Dorman. Apollo lunar seismic experiment—final summary. Journal of Geo-physical Research: Solid Earth (1978–2012), Vol. 87, No. S01, pp. A117–A123, 1982.
[3] P. Lognonn´e, J. Gagnepain-Beyneix, and H. Chenet. A new seismic model of the moon: implications for structure, ther-mal evolution and formation of the moon. Earth and Plan-etary Science Letters, Vol. 211, No. 1, pp. 27–44, 2003. [4] Y. Nakamura, G. V. Latham, H. J. Dorman, and J.
Har-ris. Passive seismic experiment long-period event catalog. Galveston Geophysics Laboratory Contribution, Vol. 491, , 1981.
[5] Y. Nakamura. New identification of deep moonquakes in the apollo lunar seismic data. Physics of the Earth and Planetary Interiors, Vol. 139, No. 3, pp. 197–205, 2003.
[6] 後藤康路, 山田竜平, 山本幸生, 横山昌平, 石川博. 階層型 som
に基づいた大規模月地震波形の可視化システム. 第 6 回データ 工学と情報マネジメントに関するフォーラム,E1-4, 2014. [7] B. Knapmeyer-Endrun and C. Hammer. Identification of
new events in apollo 16 lunar seismic data by hidden markov model-based event detection and classification. Journal of Geophysical Research: Planets, Vol. 120, No. 10, pp. 1620– 1645, 2015.
[8] R. C. Bulow, C. L. Johnson, and PM Shearer. New events discovered in the apollo lunar seismic data. Journal of Geo-physical Research: Planets (1991–2012), Vol. 110, No. E10, 2005.
[9] Vladimir Naumovich Vapnik and Vlamimir Vapnik. Statis-tical learning theory, Vol. 1. Wiley New York, 1998. [10] F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel,
B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, J. Vanderplas, A. Passos, D. Cournapeau, M. Brucher, M. Perrot, and E. Duchesnay. Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, Vol. 12, pp. 2825–2830, 2011.
[11] 神嶌敏弘. データマイニング分野のクラスタリング手法 (1). 人
工知能学会誌, Vol. 18, No. 1, 2003.
[12] E. Jones, T. Oliphant, and P. Peterson. {SciPy}: open source scientific tools for{Python}. 2014.