• 検索結果がありません。

Microsoft Word - SWO予稿 d1.docx

N/A
N/A
Protected

Academic year: 2021

シェア "Microsoft Word - SWO予稿 d1.docx"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

01-01

セマンティック

Web と高解像度可視化技術の融合の一提案

A Proposal of High-resolution Data Visualization Synchronized with Semantic Web

村田

健史

1

渡邉

英伸

1

是津

耕司

1

黒澤

2

小嶋

浩嗣

3

鵜川 健太郎

4

木村 映善

5

建部 修見

6

田中 昌宏

6

Ken T. Murata

1

Hidenobu Watanabe

1

Koji Zettsu

1

Takashi Kurosawa

2

Hirotsugu Kojima

3

Kentaro Ukawa

4

, Eizen Kimura

5

, Osamu Tatebe

6

, and Masahiro Tanaka

6 1

情報通信研究機構

1

National Institute of Information and Communications Technology

2

株式会社日立ソリューションズ東日本

2

Hitachi Solutions East Japan, Ltd.

3

京都大学

3

Kyoto University

4

株式会社セック

4

Systems Engineering Consultants Co., LTD.

5

愛媛大学

5

Ehime University

6

筑波大学

6

University of Tsukuba

Abstract: The NICT Science Cloud is one of the science clouds proposed for development of sciences. A variety of science data are collected and stored in the science cloud to be analyzed interdisciplinary. After the Internet is widely used, new concept and information technology haves shown up; semantic web and linked open data (LOD). These technologies enable information on the Internet machine readable. In many science fields, it is pointed out that the semantic web will play an important role for the interdisciplinary research works. However, there have been few ideas to be ever proposed as a methodology or roadmap to the interdisciplinary science using semantic web. Herein we present a concept of professional knowledge and academic knowledge following collective knowledge proposed as a Web 2.0. Based on the concept, we design an application for interdisciplinary science.

はじめに

現在欧米を中心にサイエンスクラウドに関する取 り組みが行われているが,特定の研究目的に設計さ れたものや,民間のクラウドを模したシステムも多 い.その結果,汎用性が高く複数の大規模プロジェ クトで成果を達成したサイエンスクラウドはほとん どない.NICT サイエンスクラウド[1]は,あらゆる 科学分野でほとんどのデータがディジタル化されて いる現在,科学研究の第1 の柱(観測・実験),第 2 の柱(理論),第3 の柱(計算機シミュレーション) によるあらゆる科学データを収集・保存・可視化・ 解析・公開データ処理する第4 の柱であるデータ指 向型科学研究環境として設計された(図1). 20 世紀後半のインターネットの普及に伴い,Web が重要な役割を果たしている.Web の発展を背景と して,21 世紀に入ってセマンティック Web や LOD (Linked Open Data)技術が登場した.これらは,人

間可読であるWeb 情報を機械可読な記述とすること

により,幅広い分野の情報を連携・融合することを 目的の一つとしている.この連携・融合の動きは特 に近年のLOD で進んでおり,2011 年の LOD Cloud diagram では,政府情報,地理情報,マスメディア, ライフサイエンス,図書館・教育,ユーザ作成デー タがDBPedia を介してグローバルに接続されている [2]. 人工知能学会研究会資料 SIG-SWO-A1302-01

(2)

01-02

科学研究分野でも,学際研究(Interdisciplinary) や分野横断研究の重要性が指摘されている.セマン ティックWeb や LOD の概念も領域横断に有効であ ることから,学術および科学研究分野への応用が期 待される.しかし,セマンティックWeb や LOD は 分野横断での情報交換や情報流通の基盤技術であり, そこからどのような科学が生まれるかについては明 確ではない. そこで,本研究では,まず,セマンティックWeb による科学研究が目指す方向について提案する.そ の概念に基づき,LOD を含むセマンティック Web 技術を活用した研究手法について,そのアプリケー ションを提案する.

集合知・専門知・学術知

Web2.0 では,インターネットを通じて複数の一般 ユーザが情報を蓄積・交換し,それをもとに新しい 知識・知見を確立する集合知という概念が提唱され た.集合知を科学研究データに適用することで集合 知の概念を拡張することができると著者らは考えて いる[3, 4]. 図2 は,著者らが考える専門知,学術知の概念で ある.集合知では,情報の提供者と集合知の利用者 はともに一般ユーザである.専門知では,情報提供 者は研究者となる.研究者は研究成果や議論などを ネットワーク上で行い,そこに総合的な専門知識が 蓄積される.この知識は専門知としてWeb 等を通じ て一般利用者に提供される.例えば,筆者(村田) の専門分野である太陽地球系物理研究分野では,大 規模フレア現象の地球への影響と言った事象の判断 や,太陽風が地球磁気圏にどのように影響を及ぼす かという基礎研究知識は単独の研究者によって判断 されることは少なく,一般には複数の研究者がデー タ等から判断する.このような判断情報は専門知識 を有する研究者以外では容易ではない.ここでは, 専門家の知識が融合することと同時に,その知識や 判断,情報が一般市民にも理解できるような形にブ レークダウンすることが肝要となる. さらに進んだ形として学術知がある.これは,専 門家が知識を共有し,その結果を専門家が学術的な 知識として利活用するイメージである.専門性が高 いほど情報の収集と融合から学術知を生み出すこと は容易ではなく,著者の知る限り学術知の創出に成 功した事例はない.しかし,サイエンスクラウドの 視点からは,学術知の成功は究極的な目標の一つで ある.

科学データ収集とビッグデータ処理

データ収集と

DB 化

NICT サイエンスクラウドでは,インターネット上 で公開されている様々な科学データファイルのクロ ーリングシステム(NICTY)[5]を開発・構築・運用 し,これに基づいたRDF データベースを構築してい る.現在,400 種類以上のデータファイルを 40 の研 究機関から定常的に収集し,1300 万を超えるデータ ファイルをサイエンスクラウド上のデータベースで 管理している.さらに,これらの収集データファイ ルをカプセル化し,研究者がデータファイル構造や ファイル情報を意識せずにデータ(数値データおよ び画像データ)を読み出すためのクラスライブラリ を開発した[6, 7].このクラスライブラリは,NICT サ イ エ ン ス ク ラ ウ ド に お い て STARS (Solar-Terrestrial data Analysis and Reference System) の一環として開発したものである.さらに,このク ラスライブラリを活用し,Widnows 上で動作するデ ータプロットアプリケーション(STARS Windows App)を実装した. STARS が対象とするデータは,サイズ,種類とも に増加しており,データ処理速度の向上が求められ ている.NICT サイエンスクラウドは,分散ファイル 図1 NICT サイエンスクラウドコンセプト 図2 集合知から専門知,学術知へ

(3)

01-03

システム(Gfarm)と Gfarm のために開発されたタ スクスケジューラ(Pwrake)による並列分散処理技 術開発も進めてきた.Pwrake を活用することにより, たとえばGEOTAIL 衛星のプラズマ波動データ(PWI データ)処理をこれまでの100 倍以上の速度で行う ことに成功した[8].本研究でも,GEOTAIL 衛星の 20 年間の観測データを用いて画像ファイルを作成 し,これによるアプリケーションを実装する.

ビッグデータ表示

上記のように収集・可視化されたデータを科学研 究で利活用するためには,それらのデータの表示が 必要となる.これまでの手法では,パーソナルコン ピュータ上で画像ファイル表示やグラフツールによ るデータ表示を行い,研究を進めるスタイルが一般 的である.しかし,本研究が対象とするビッグデー タについては,情報量が膨大であり,既存の方法で の表示は容易ではない.さらに,これらにLOD で公 開されているデータを重畳して表示する場合には, その表示方法に工夫が必要である. 本研究では,二つの方法によるデータ表示を行う. 一つは超高解像度ディスプレーであるTDW(タイル ドディスプレー)にデータ表示を行う手法,もう一 つはポータブル・ユビキタス環境においてデータを 容易に閲覧または検索できるタブレット(スレート) PC を対象とした Web アプリケーションである.

TDW(タイルドディスプレー)

タイルドディスプレー(TDW: Tiled Display Wall) は,既存のディスプレーを複数枚連続配置し,一面 の高解像度ディスプレーとして利用する.ディスプ レー枚数は10 枚から 100 枚程度が多く,数 100 枚の 大規模な TDW も存在する.図 3 は NICT に設置さ れたTDW の例である. TDW を利用するためのミドルウェアが様々提案 されている.たとえばてevl (electronic visualization laboratory)で開発された SAGE(Scalable Adaptive Graphics Environment)などがある.これらのミドル ウェアの多くは汎用性が高く設計されているが,一 方で,大容量の高精細データ(画像)を連続して送 信する場合には制約が大きい.例えば,非圧縮の静 止画像を図3 の 36 面 TDW に 1 秒間 30 枚送信する ためには50Gbps 以上の転送レートが必要であるが, このような高速伝送レートは一般的な TDW のミド ルウェアではサポートされていない.また,これら のデータをストレージから読み出すためには同等の I/O 速度が必要であるが,5GB/sec 以上のデータ読み 出し速度を有するストレージは一般的ではなく,並 列ストレージシステムや分散ストレージシステムが 必要となる. NICT サイエンスクラウドでは,TDW に高精細(非 圧縮)画像データを高速ネットワークにより並列伝 送するための技術開発を行っている[9].この技術で は,ストレージと高速データ伝送を同期されて並列 化することにより,TDW への高精細画像の連続送信 と表示を可能としている.

Ajax による Web アプリケーション

Web ブラウザに実装されている JavaScript の HTTP 通信機能を使い,Web ページのリロードを伴わずに サーバと XML 形式のデータのやり取りを行って処 理を進める対話型Web アプリケーションの実装形態

がAjax であり,Jesse James Garrett が 2005 年に提案 された.Ajax では,指定した URL から XML ドキュ メントを読み込む機能を使い,ユーザの操作や画面 描画などと並行してサーバと非同期に通信を行うこ とで,サーバの存在を感じさせないシームレスな Web アプリケーションを実現できる.これにより Google Maps に代表される,情報をディスプレー上 に連続的に表示する Web アプリケーションが Ajax により開発されてきた. Ajax 技術は,科学研究でも有効である.例えば, 地球科学や宇宙科学では科学衛星や地上観測により 図3 TDW(タイルドディスプレー)の例:NICT 研究開発用36 面 TDW(上)と NICT 小金井本部 本館TDW(下)

(4)

01-04

時系列にデータを取得する.長期観測では観測期間 が長期となるため,研究者は長期データを連続的に 閲覧したい. また,現象の時間スケールへの対応も重要である. 例えば,宇宙環境では太陽の活動周期(11 年)に連 動する現象,地球の公転に連動する既設依存性(1 年),地球の自転に連動する現象(1 日)などの比較 的長期な現象から,オーロラ現象(数時間),電子の 運動に伴うプラズマ現象(数秒以下)など,様々な 時間スケールの現象がデータに含まれている.これ までの研究手法では,時間スケールに合わせたデー タプロットを作成していたために,スケールが異な る現象を同時に解析するのは容易ではなかった. Ajax 技術により,時間スケールに応じた現象を連続 的に閲覧することが可能となる. NICT サイエンスクラウドには,冗長化された Web サーバが設置されており,また,目的に応じた大規 模データストレージも利用できる.したがって,科 学研究データ(高解像度画像や長期データ画像)を クラウド上に保存し,それを参照するWeb アプリケ ーションの実装が可能である.

科学ビッグデータ表示とセマンティ

ック Web による情報追加表示

本研究では,前節までに紹介した NICT サイエン スクラウドの技術を融合的に活用して,科学ビッグ データ表示とセマンティックWeb による情報追加表 示を行うシステム提案する.図4 はシステム概要で ある.サイエンスクラウド上に管理された科学ビッ グデータを高解像度ディスプレー(TDW)やポータ ブルPC(タブレット PC)などに表示する.これら の情報に連動して各分野のセマンティックWeb デー タベースから取得した情報をオーバーレイ表示する. 本稿執筆時点では TDW アプリケーションおよび タブレット用Web アプリケーションは開発中である. 本稿では,開発中の Ajax によるタブレット用 Web アプリケーションを紹介する. 図5 は,開発中の STARS touch をタブレット PC で捜査している様子である.STARS touch は Ajax に

より実装した太陽地球系物理分野のデータ表示Web

アプリケーションである.STARS touch では,STARS Web App を活用してあらかじめ長期間データを様々 な時間分解能で可視化し,それらの画像ファイルを 用いて作成したWeb アプリケーションである.現在 は対象データを GEOTAIL プラズマ波動データとし ているが,今後,様々なデータの登録を計画してい る. 図6 は,STARS touch により時間方向にデータ表 示を行っている様子である.タッチパネル上で横方 向(時間方向)にドラッグすることでデータを時間 方向に連続で表示することができる.また,図には ないが,垂直方向にデータをドラッグすることで, 周波数方向へのデータの移動も可能である. 図7 は,STARS touch で時間方向(水平報告)に データを拡大表示する様子である.タブレット PC 上で水平方向にピンチアウトすることで時間表示を 拡大することができる.(ピンチインすることで縮小 も可能である.) 図8 は,周波数方向(垂直方向)にデータ表示を 拡大する場合である.タブレット PC 上で垂直方向 にピンチアウトすることで周波数表示を拡大するこ とができる.(ピンチインすることで縮小も可能であ る.)

考察

本稿では,太陽地球系科学分野を対象に,科学ビ ッグデータの表示技術とセマンティックWeb データ ベースを活用した異分野情報の融合表示について提 案を行った.また,現在開発中の Ajax による Web 図4 科学ビッグデータ表示とセマンティック Web による情報追加表示システムの概要 図5 タブレットで動作する STARStouch

(5)

01-05

アプリケーションについて紹介した.本研究では, アプリケーションの開発を進めると並行して,様々 なデータの融合表示を検討している.図9 はそのイ メージを表している.研究者は,アプリケーション を通じて NICT サイエンスクラウドの様々なデータ を閲覧する.複数の研究者がこれらの情報を同時に 閲覧し,情報交換を行うことで専門知および学術知 への発展が期待できると考えている.

おわりに

セマンティック Web は,人間可読な Web 情報を 機械可読にすることにより,膨大なデータを処理し, 連携するという本来の技術だけではなく,それによ る様々な推論や知識の発見が期待されるWeb 技術で ある.一方で,学術研究は本来人間が知恵を絞るこ とにより発展する分野であり,機械(コンピュータ とネットワーク)のみにより新しい科学的知見が得 られることは考えにくい.機械が主役であるセマン ティックWeb と人間が主役である科学研究をどのよ うに埋めるのかは,これからのセマンティックWeb 技術を考える際に重要である. 筆者(村田)は宇宙環境や地球環境といった自然 環境研究分野の研究であり,上記の問題についてこ の研究分野の視点から検討を行った.その解決方法 の一つとして,本研究では,ビッグデータ処理の基 盤となる NICT サイエンスクラウドを活用して,基 盤情報(研究者の主要研究テーマ)に関連情報(LOD から取得される情報)を連動表示するアプリケーシ ョンの開発を試みた.具体的には,TDW(タイルド ディスプレー)やタブレットといった大規模高精細 ディスプレーやポータブル・ユビキタスなユーザビ リティーの高いディスプレーに基盤情報と関連情報 を表示する試みである. 関連分野や異分野の情報を連携・連動して研究者 に提示する方法は,言い換えると多種多様で大量の データを同時に研究者に提示することを意味してい る.分野融合の視点では様々なデータが連動して提 示されることは望ましいが,一方でそれらをどのよ うに整理して提示するかが重要となる.複数の情報 を乱雑に提示しても,研究者がそれをもとに新たな 知見を得ることにはつながらない.また,提示情報 量が増大するということはネットワークを流れる情 報量が増大することを意味しており,大容量データ を伝送する技術との融合も無視できない. TDW は高解像度ディスプレーであるために多く の情報を同時に掲載できるが,一方でデータ伝送量 が無視できない.NICT サイエンスクラウドでは LFN

(Long Fat Network)上でビッグデータ伝送を行う技 術開発を行っている[9].さらにこれらの伝送デー

タ・情報をTDW に表示するシステム開発中である.

(6)

01-06

本稿執筆時点ではシステム開発中であるが,近日中 にはプロトタイプが完成する予定である. タブレット PC(スレート PC)は,Windows や Macintosh に代表される一般的なパーソナルコンピ ュータと比べて可搬性と操作性がよい.多くのタブ レット PC は無線ネットワークでインターネットに 接続され,研究を含む日常生活のあらゆる場所で利 用ができる.高い操作性と狭帯域ネットワークは TDW の対極となるが,本研究では TDW と同様に, 基盤研究情報と関連研究情報をタブレット PC で閲 覧するための Web アプリケーション(仮称 STARS touch)を開発中である.本稿執筆時には Web アプリ ケーション開発段階であるため本文では議論してい ないが,今後,STARS touch を研究分野で公開し, その有効性や利便性,問題点などを検証したい.

謝辞

本研究は NICT サイエンスクラウドを活用して行わ れました.データ作成にご協力いただいた井上健二 さんと戸田智恵さんに感謝します.

参考文献

[1] Murata, K. T., Watari, S., Nagatsuma, T., Kunitake, M., Watanabe, H., Yamamoto, K., Kubota, Y., Kato, H., Tsugawa, T., Ukawa, K., Muranaga, K., Kimura, E., Tatebe, O., Fukazawa, K. and Murayama, Y., A Science Cloud for Data Intensive Sciences, Data Science Journal, Vol. 12, pp.WDS139-WDS146, Apr., 2013. [2] LOD クラウドダイアグラム(The Linking Open Data

cloud diagram), http://lod-cloud.net/, 2011.

[3] Murata, K. T., Kimura, E., Yamamoto, K., Watari, S., Kato, H., Morioka, Y., Zettsu, K., Kidawara, Y. and Shimojo, S., An STP Semantic Web Technique and Service Using RSS 1.0 and RDF, Journal of the National Institute of Information and Communication Technology, Vol.56, No.1-4, pp.519-520, 2009. [4] 村田健史,木村映善,山本和憲,亘慎一,加藤久雄, 森川靖大,是津耕司,木俵豊,下條真司,RDF を用 いたデータ収集技法による太陽地球系科学セマンテ ィックWeb 構築の試み,情報通信研究機構季報,Vol. 55, Nos.1-4, pp.471-491, 2010. [5] 石倉諭, 村田健史, 久保卓也, 木村映善, 山本 和憲, 篠原育, RSS1.0 を利用した科学衛星・地上 観測データのメタデータ自動収集, 電子情報通信学 会論文誌(B), Vol.J91-B, No.4, pp.499-509, Apr. 2008.

[6] Murata, K. T., Yahara, H. and Toyota, K., Software design via object-oriented methodology and network database for solar-terrestrial observation data, Information Processing Society of Japan DataBase System, 123-5, database, pp.31-36, 2001. [7] Murata, K. T., A Software System Designed for

Solar-Terrestrial data Analysis and Reference via OMT Methodology, Today and Tomorrow of the Science and Technology Exchange between Ehime University-Japan and Ecole Centrale de Nantes-France, pp.16-22, 2002. [8] Ken T. Murata, Hidenobu Watanabe, Kazunori Yamamoto, Eizen Kimura, Masahiro Tanaka, Osamu Tatebe, Kentaro Ukawa, Kazuya Muranaga and Yutaka Suzuki, A high-speed data processing technique for time-sequential satellite observation data, submitted to ComEX, IEICE, 2013.

[9] UDT を用いた並列ファイル転送ツール基本性能評価, 渡邉英伸 , 黒澤隆, 村田健史, 木村映善, 建部修見, 電 子 情 報 通 信 学 会 信 学 技 報 Vol.113 No.256 , 2013-10-15,IA2013-42,2013.

(7)

01-07

(8)

01-08

(9)

01-09

図 9  宇宙地球科学セマンティック Web
図 6  STARS touch ダンプイメージ図(1):時間方向へのスライド
図 7  STARS touch ダンプイメージ図(2):時間方向(水平方向)への拡大
図 8  STARS touch ダンプイメージ図(3):周波数方向(垂直方向)への拡大

参照

関連したドキュメント

AMS (代替管理システム): AMS を搭載した船舶は規則に適合しているため延長は 認められない。 AMS は船舶の適合期日から 5 年間使用することができる。

 当第2四半期連結累計期間(2022年3月1日から2022年8月31日)におけるわが国経済は、ウクライナ紛争長期化

(a) ケースは、特定の物品を収納するために特に製作しも

評価する具体的な事故シーケンスは,事故後長期において炉心が露出す

平均的な交通状況を⽰す と考えられる適切な時期 の平⽇とし、24時間連続 調査を実施する。.

これまで、実態が把握できていなかった都内市街地における BVOC の放出実態を成分別 に推計し、 人為起源 VOC に対する BVOC

予測の対象時点は、陸上競技(マラソン)の競技期間中とした。陸上競技(マラソン)の競 技予定は、 「9.2.1 大気等 (2) 予測 2)

Sugata: Contributions of Condensable Particulate Matter to Atmospheric Organic Aerosol over Japan, Environ.. Sugata: Contributions of Condensable Particulate Matter to