• 検索結果がありません。

センサデータ向けデータ圧縮ロード方式

N/A
N/A
Protected

Academic year: 2021

シェア "センサデータ向けデータ圧縮ロード方式"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)情報処理学会第 74 回全国大会. 2C-1. センサデータ向けデータ圧縮ロード方式 立床. 雅司†. 山岸. 三菱電機株式会社. はじめに. 1. 周期的に発生する大量のセンサデータに対し てデータ圧縮機能を備えたデータベースに格納 するデータ圧縮ロード方式について述べる.本 方式では,センサデータの遅延時間およびデー タベースのデータ圧縮処理の同時実行数の制約 を考慮することにより,遅延時間短縮のための 負荷分散を実現する.電力データを用いた評価 により,本方式の有効性を検証した.. 背景. 2. 製造現場や社会インフラにおいて日々発生す るセンサデータを長期間蓄積し,異常検知や生 産効率改善,省エネルギーに利用する試みがな されている.このようなセンサデータは,デー タ圧縮処理を備えたデータベースに格納するこ とでストレージコストが削減できる.我々が開 発しているセンサデータベース[1]上に実装した センサデータロード方式[2](以降,従来方式と 呼ぶ)では,データロード時にセンサデータ圧 縮方式[3]を適用してきた.. センサデータロードにおける制約. 3. 多数の収集周期が存在しデータ量が膨大とな る場合,図 1に示すようなデータ圧縮処理の競 合によるセンサデータの遅延時間超過が発生す る.遅延時間超過の原因となるセンサデータロ ードの制約を収集周期,遅延時間,並列実行数 の観点から述べる. T1. ロード. 圧縮. ロード 圧縮終了待ち. 圧縮. T2 遅延時間. 遅延時間超過. 図 1 センサデータロードの制約による課題 3.1 センサデータの収集周期 センサデータは計測対象や重要度により複数 の収集周期に分けられる.複数の収集周期を 1 つのテーブルにまとめる場合,周期の短いセン サデータの欠落がないように格納すると,周期 A Load Balancing Method with Data Compression for Sensor Data †Masashi Tatedoko, Yoshinori Yamagishi, Mitsunori Kori Information Technology R&D Center, Mitsubishi Electric Corporation. 義徳†. 郡. 光則†. 情報技術総合研究所† の長いセンサデータに欠損値が格納され疎なテ ーブルとなる.周期の長いセンサデータに欠損 値を格納しないようにすると,周期の短いセン サデータが欠落する.これらの理由から,周期 が同一のセンサデータを 1 テーブルにまとめる. そのため,製造現場のような大量のセンサデー タを扱う場合,複数のテーブルに分割して格納 する必要がある. 3.2 遅延時間 遅延時間とは,データの登録からデータが参 照可能となるまでの時間を指す.センサデータ では短い遅延時間が要求されるが,遅延時間を 満たそうと細かい粒度で圧縮すると圧縮処理の 効率が低下するため,まとまった粒度で圧縮で きるよう圧縮処理を工夫する必要がある. 3.3 圧縮処理並列実行 ロード処理に含まれる圧縮処理は内部処理の 並列度が高く,主記憶の消費量も大きいため, 圧縮処理の並列実行可能数を制約する必要があ る.圧縮処理が並列実行可能数を超えた場合は, 圧縮処理の終了を待つロード処理が発生し,並 列実行の効率が低下していた.. 4. センサデータロード方式. センサデータロードにおける制約下で,遅延 時間を平準化するセンサデータロード方式を実 現する.本方式では,ロード処理において圧縮 処理の実行判定を行い,圧縮処理が可能な場合 のみ圧縮処理を実施する.本方式は(1)競合時の 圧縮処理対象テーブルの決定,(2)圧縮対象以外 の圧縮処理スキップ,(3)圧縮粒度の微細化を特 徴とする. 4.1 圧縮処理対象テーブルの決定 複数のロード処理が競合した場合,競合した テーブルの優先度 p を求め,並列実行可能数に 達するまで最も優先度高いテーブルの圧縮処理 を実施する.これにより,テーブルの圧縮処理 回数の平準化を図る.優先度 p は,圧縮処理ス キップと残り遅延時間の観点から算出する.圧 縮処理スキップ回数 f skip に関連するパラメータ を圧縮処理スキップ回数 c ,蓄積データ量 r ,テ ーブル ID i とし,残り遅延時間 f remain に関するパ ラメータをテーブル毎に設定された遅延時間 t d ,. 1-541. Copyright 2012 Information Processing Society of Japan. All Rights Reserved..

(2) 情報処理学会第 74 回全国大会. 収集周期 t c ,前回圧縮処理時間 t l とすると優先 度 p は,次式にて求める.. p  f skip c, r , i   f remain t d , t c , t l . (1). 5.3 評価結果と考察 本方式および従来方式を用いて評価データの ロードを行った.ロード件数の最も多いテーブ ルにおける各手法による遅延時間の比較を図 2 に示す.. 遅延時間 [秒]. 4.2 圧縮処理スキップ 従来方式では,圧縮処理を実施するタイミン 40 グで圧縮処理並列実行数を超過した場合,圧縮 本方式 35 処理が実行可能となるまで待機していた.本方 従来方式 30 25 式では,圧縮処理対象テーブルとならなかった 20 場合,圧縮処理を行わずにロード処理を終了す 15 る.スキップされた圧縮処理は,次回以降のロ 10 ード処理にて実施する. 5 4.3 圧縮粒度の微細化 0 圧縮処理にかかる時間は,圧縮後のデータサ 0 500 1000 1500 2000 イズである圧縮粒度に比例する.従来方式では, ロード時間 [秒] 圧縮効率を高めるため圧縮粒度を大きくしてい 図 2 遅延時間比較 た.本方式では,遅延時間の制約を考慮して既 従来方式では,ロード処理の競合により遅延 定のサイズを従来手法より微細化し,圧縮処理 時間が拡大しており,870 秒程度経過した段階で 時間の縮小を図る. 遅延時間である 30 秒を超過している.本方式で 5 評価 は,遅延時間が平準化され,最大でも 10 秒以下 本方式と従来方式との比較により有効性を評 に圧縮処理が完了している.圧縮率と検索処理 価した.ロード処理の遅延時間と圧縮率および 時間の比較を表 3に示す.検索時間は,5 件のセ 検索処理時間を評価対象とした.圧縮率は次式 ンサの合計値を求める問合せを 10 回繰り返し, にて求めた. 処理時間の平均値により得た.圧縮率は,本方 圧縮率 = 1 - 圧縮後サイズ/圧縮前サイズ (2) 式が 94.3%であり従来方式の 93.3%より向上した. 5.1 評価データ また,検索時間は,本方式と従来方式ともに 表 1は,評価データの収集周期,テーブル数, 0.02 秒であり,違いは見られなかった.以上よ テーブルあたりのロード件数である.評価デー り,本方式の有効性を確認した. タは電力データを用いた.1 テーブルあたり 960 表 3 圧縮率,検索時間比較 個のセンサを割り当て,合計 15 個のテーブルを 本方式 従来方式 用意した.全体のセンサ数は 14,400 点である. 圧縮率 94.3 % 93.3 % 収集周期は 4 種類とした.各テーブルの遅延時 検索時間 0.02 秒 0.02 秒 間は 30 秒とした.各テーブルは 1 秒周期で 6 まとめ 2,000 秒間繰り返しロードした. センサデータ向けのデータ圧縮ロード方式を 表 1 評価データ センサデータベース上に実装し,その有効性を 収集周期 テーブル数 ロード件数/テーブル 検証した.今後は,より大規模なデータで評価 4ms 3 480,000,000 件 し,圧縮処理対象の判定精度の向上を検討する. 10ms 3 192,000,000 件 参考文献 40ms 3 48,000,000 件 [1] 山岸 義徳ほか:高速集計検索エンジンとセン 100ms 6 19,200,000 件 サデータベースへの応用,三菱電機技報, 5.2 評価環境 Vol.83,No.12, pp.11-14(2009). 表 2に示すPCサーバを用いて評価した.デー [2] 竹田 義聡ほか:環境情報データベース向けリ タをロードするクライアントとデータベースサ アルタイムセンサデータロード方式,情報処 ーバとは同一のPCサーバ上で動作させた. 理 学 会 第 73 回 全 国 大 会 講 演 論 文 集 , pp1表 2 評価用 PC サーバ 555— 1-557(2011) . OS Windows Server 2008 R2 Standard SP1 [3] 加藤 守ほか:環境情報データベース向け高性 CPU Xeon E5620 x2 能センサデータ圧縮方式,情報処理学会第 73 Memory 16 GB 回 全 国 大 会 講 演 論 文 集 , pp1-559— 1Storage SAS2.0,450GB,10000rpm x4,RAID5 561(2011) .. 1-542. Copyright 2012 Information Processing Society of Japan. All Rights Reserved..

(3)

参照

関連したドキュメント

て当期の損金の額に算入することができるか否かなどが争われた事件におい

長期入院されている方など、病院という枠組みにいること自体が適切な治療とはいえないと思う。福祉サービスが整備されていれば

越欠損金額を合併法人の所得の金額の計算上︑損金の額に算入

本判決が不合理だとした事実関係の︱つに原因となった暴行を裏づける診断書ないし患部写真の欠落がある︒この

い︑商人たる顧客の営業範囲に属する取引によるものについては︑それが利息の損失に限定されることになった︒商人たる顧客は

本格納容器破損モードに至るまでの事象進展への対応,本格納容器破損モ

原子炉本体 原子炉圧力容器周囲のコンクリート壁, 原子炉格納容器外周の壁 放射線遮蔽機能 放射線障害の防止に影響する有意な損

SFP冷却停止の可能性との情報があるな か、この情報が最も重要な情報と考えて