• 検索結果がありません。

関する共同研究」2年目

N/A
N/A
Protected

Academic year: 2021

シェア "関する共同研究」2年目"

Copied!
11
0
0

読み込み中.... (全文を見る)

全文

(1)

「巨大時系列データの高速アクセスに 関する共同研究」2年目

2021.02.19

山本幸生(宇宙科学研究所)

古庄晋二、生座本義勝、小林正英、早部秀一(エスペラントシステム)

飯沢篤志、長尾正

1

(2)

アジェンダ

• これまでの活動

• テレメトリデータ活用の課題

• Zap-Over による解決

• 実現可能になったサービス形態

• 操作デモの説明

• デモムービー

• 100 年間利用可能にするために

• まとめ

2

(3)

これまでの活動

1998

年~

外部のデータ構造を使わず、データに内在する性質を使う自然数インデックスの特許出願

インメモリデータベースエンジン Zap-Inを開発

2013

年~

ネットワーク越しにビッグデータファイルを接続して高速に検索・ブラウズする技術 ... Zap-Overを開発

2019

年 共同研究1年目(

Zap-Over

• Apollo 11号~17号が月に設置した地震計データを用いてZap-Overの実用化研究

• Zap-Overが定めるファイル形式D5A の圧縮技術の開発

(多次元)座標の高速検索技術の開発

2020

年 共同研究2年目(

Zap-Over

ビッグデータファイル群の組み合わせを簡便に行う改良

• UNIONJOINを一気に行うCOMBINE技術の開発

3

テーマ『100年後も使える(使われる)ビッグデータのアーカイブ技術』

(4)

1. 100年使える(使われる)フォーマットがない 2. インターネット経由で簡単にアクセスできない 3. データを組み合せることが簡単でない

4. レコード数・カラム数が多く扱いにくい 5. 毎日データが発生して作業負担がある

4

テレメトリデータ活用の課題

Zap-Over で1~4の解決の目処ができた

(5)

Zap-Over (D5A) の利用方法

データ提供者: ...

テレメトリデータをD5Aファイル化(コンテンツ化)する

表形式(最大数兆レコード、10万カラム)データを

D5A

ファイルにして ファイルサーバに配置する。

データ利用者:

... D5Aファイルを選んで組み合わせる

ネットワーク上の所望の

D5A

ファイルを選んで組み合わせ、望むスキーマ にする。

検索・ソートして必要な部分を取り出す。

意義:

1.

ビッグデータをインターネットのコンテンツとして利用できる。

2.

ビッグデータを組み合わせて利用できる。

3.

ビッグデータを低コストで利用可能にする。

5

(6)

JAXA

クラウド環境

NASA

国立天文台

仮想

D5A

D5A D5A

D5A D5A D5A

D5A

D5A

D5A

D5A D5A D5A

D5A D5A

D5A

D5A

操作

検索

ブラウズ

ダウンロード

D5A

とは、

ビッグデータのテーブルのフォーマット。

すべてのカラムで、

瞬時のソート・高速検索を可能にする。

簡単・低コスト・DBサーバレス

仮想

D5A

とは、

選んだD5Aファイル群を仮想的に統合したもの。

単独のD5Aと同等の機能を持つ。

(パフォーマンスの低下も少ない。)

目的に応じて「D5Aを組み合わせて使える」

6

IoT IoT IoT

実現可能になったサービス形態

クラウド間 で結合可能

(7)

デモ操作

操作デモの説明

7

1

億レコード

10 D5A

80

億レコード

1 D5A

1350

億レコード

40 D5A

検索

表示

レイアウト変更 データロード さまざまなデータ型の確認

単一

D5A

の表示・操作

多数

D5A

の表示・操作 巨大レコード数

数千~数万カラムの操作

10

万カラム

(8)

時刻をキーに一気に結合: COMBINE

8

検索範囲

130 < x < 150

カラム選択して

縦結合 同一時刻を探し、

同一時刻のデータを 横に並べる

COMBINE COMBINE =

系列毎に 時刻で検索し、

時刻でソート。

そして、時刻をキー に横に並べる。

カラム選択して 縦結合

(9)

デモムービー

9

AMAZON EC2

においた

APOLLO

11号の地震計データと、

手元の

SSD

においた

APOLLO

12号~16号の地震計の データ、全部で40個、リアルタイムに結合しました。

即座に約1350億レコードのテーブルを作成。

それを検索・ソート・表示するデモを行いました。

また上記テーブルの所望の一部を

COMBINE

で切り出す デモも行いました。

(10)

100 年間利用可能にするために

• https://zap100.github.io/

• 100 年間の継続的な技術供給体制の確立

• オープンで非営利でアカデミックな形で活動し、持続 性とその条件である世界的広がりを達成する。

• 当面の利用人口の確保

• JAXA などのデータを早期に D5A 化し、多くの人に Zap- Over に触れてもらう。

10

(11)

まとめ・謝辞・雑感

• インターネット上に散在するデータを組み合わせて使う研究が易 しく便利になった。

• 宇宙科学情報解析シンポジウムという開かれた場があったおかげ でここまでたどり続けることができた。特に山本幸生先生のご指 導に感謝します。

• また、 Apollo 11 号~ 17 号が観測した地震計のデータがあったこと

がこの2年間の研究を推進した。観測データが幅広い分野の進歩 を促していると実感している。

本研究は、総務省戦略的情報通信研究開発推進事業( SCOPE )の独 創的な人向け特別枠「異能 vation 」プログラムの支援を受けたもの です。

11

参照

関連したドキュメント

責任者の 顔写真 責任者 佐原 亮二 物質・材料研究機構 構造材料研究拠点 中核研究者:

日本常民文化研究所 所員・職員 (全員) 、客員研究員 (橋村修・横山貴史)

「研究会」の三種があります.これらの共同研究は,所外の研究者と所内の教官(客員部門の教

7 ‑学部教育 におけ るカ リキュ ラム改革 の方 向性 PPNn8‑TP

JAIST Repository https://dspace.jaist.ac.jp/ Title 研究大学における戦略的研究マネジメントに関する考 察 Author(s) 柿田, 佳子

小売業のロジスティクス戦略に関する研究 著者 雑誌名 巻

107