PCセンサデータマイニングによるHDD故障予兆検出
2
0
0
全文
(2) 情報処理学会第 75 回全国大会. 二値判別モデルを構築するアルゴリズムとして、本稿で はブースティング(LogitBoost)を用いた。 モデル評価 図 4 は、HDD 故障予兆モデルの ROC 曲線である。縦 軸 は TP/(TP+FN) 、 横 軸 は FP/(FP+TN) で あ る 。 10-fold cross validation による評価結果を示した。故障 HDD のう ち 83.3%は故障前に予兆検出することが可能である。ま た、正常 HDD のうち 90.8%は正常と判定される。. 5.おわりに. 故障予兆あり. 故障予兆なし. 故障 HDD. true positive (TP). false negative (FN). 正常 HDD. false positive (FP). true negative (TN). 本稿では、PC センサデータの時系列変化に関する特 徴量を説明変数とし、PC 修理データを教師信号とした ブースティングによる HDD 故障予兆検出モデルの構築 を示した。これまでメーカーが提供できるサービスは、 修理センターに持ち込まれた PC の修理が中心であった。 しかし、稼動データを活用することによって、故障発生 前の情報提供など新しい価値を提供できる(図 6)。実 運用を通じて今後、提案手法のさらなる効果検証と技術 改善を行っていく。提案手法は過去の HDD のデータを 使用して性能検証を行ったものであり、新たな HDD で も同様の精度であるか、検証していく。. 1. true positive rate. 0.9 0.8 0.7. 0.6 0.5 0.4 0.3 0.2 0.1 0. 0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9. ここで、データ損失量は最終バックアップから故障まで の経過時間に比例すると仮定して、経過日数で表した。 さらに、詳細は講演資料に掲載するが、データ損失コス ト(データ損失量に比例すると仮定)とバックアップ実 施コスト(バックアップ実施回数に比例すると仮定)の 和を最小とするような、最適バックアップ間隔を求める ことも可能である。. 1. false positive rate. 図4. M2Mネットワーク. 稼動データ 修理データ. HDD 故障予兆モデルの ROC 曲線 データマイニングによる診断モデル構築. 異常診断モデル. 4.故障予兆検出に基づくデータバックアップ バックアップを定期的に行っていないユーザが多い理 由に、適切なバックアップ頻度がわからない、というこ とが挙げられる。バックアップの実施は PC に負荷がか かり、ユーザの手間もかかることから、なるべく少ない 方がよい。そこで、故障予兆に応じたバックアップを実 施することで、不要なバックアップの手間をかけずにデ ータ損失の削減効果が得られる。あるいは、故障予兆有 無に応じてバックアップ頻度を変更することで、データ 損失量を増やさずにバックアップ頻度を削減することが 可能である。図 4 に示したモデル精度の条件下でシミュ レーション評価を行ったところ、故障予兆発生後にバッ クアップ頻度を 毎月→毎日 に切り替えることで、毎週 バックアップ実施する場合と比較して同程度のデータ損 失量(平均 11%減)でバックアップ頻度を平均 61%削減 (52→20 回)することが可能である(図 5)。. 50. 2.5. 2.2. 2.5. 40. 2. 30. 52. 20 10. 3. 20. 半減以下. 1.5 1 0.5. 0. 0 予兆発生後にバックアップ 頻度切替 (毎月→毎日). 喪失データは何日分か (故障PC平均). 年間バックアップ回数 (全PC平均). 60. 毎週バックアップ. 確実に修理できる (現象非再現の減少). 修理の高精度化. ユーザーが故障リスクを把握 HDD LCD FLインバータ CPU Fan・冷却モジュール ACアダプター キーボード バッテリー メモリ 基板 ODD. 故障前に警告が でると安心. 異常確率. コールセンターで遠隔診断 電話では分からない情報がわかる →短時間で問題解決. 図6. 稼動データの活用によるサービスの実現. 6.参考文献 [1] Eduardo Pinheiro, Wolf-Dietrich Weber and Luiz André Barroso, "Failure Trends in a Large Disk Drive Population", Proceedings of the 5th USENIX Conference on File and Storage Technologies (FAST „07), 2007 [2] G. Hamerly, C. Elkan, “Bayesian approaches to failure prediction for disk drives,” Proc. 18th ICML, pp.202-209, 2001. [3] J. Murray, G. Hughes, and K. Kreutz-Delgado, “Machine learning methods for predicting failures in hard drives : a multiple-instance application,” JMLR Vol.6, pp.783-816, 2005. [4] 西川武一郎, 原貫三, “市場品質の監視による早期対策 からプロアクティブな品質保全とサービスへ”, 東芝レビ ュー, Vol.64, No.8, 2009.. 年間バックアップ回数(全PC平均) 喪失データは何日分か(故障PC平均). 図5. 故障予兆検出に応じたバックアップの実施. 1-280. Copyright 2013 Information Processing Society of Japan. All Rights Reserved..
(3)
図
関連したドキュメント
肝障害に腎障害が併存することは,予後不良 の指標となる.特に,肝硬変に腎不全を合併し た際には 1 カ月生存率は 50%,6
る、関与していることに伴う、または関与することとなる重大なリスクがある、と合理的に 判断される者を特定したリストを指します 51 。Entity
特に、その応用として、 Donaldson不変量とSeiberg-Witten不変量が等しいというWittenの予想を代数
・会場の音響映像システムにはⒸの Zoom 配信用 PC で接続します。Ⓓの代表 者/Zoom オペレーター用持ち込み PC で
CPU待ち時間 PCとPSWを 専用レジスタ
パスワード 設定変更時にパスワードを要求するよう設定する 設定なし 電波時計 電波受信ユニットを取り外したときの動作を設定する 通常
すべての Web ページで HTTPS でのアクセスを提供することが必要である。サーバー証 明書を使った HTTPS
各テーマ領域ではすべての変数につきできるだけ連続変量に表現してある。そのため