yamamoto_hadoop.pptx

(1)

大規模な月惑星データの扱いについて

∼

Hadoop Streamingによる分散処理の適用∼

宇宙航空研究開発機構

(2)

クラウドとは

?

•  インターネットの先にあるシステムという意味で使う人

–  ネットワーク図でよくインターネットを表すときに雲の図が使われ、インターネットの先には何か便利なものがあって、それらがクラウドでできている、と主張

•  サービスのことを言う人

–  SaaS (So5ware as a Service)

•  エンドユーザ向けのサービス(ウェブメール,ブログ etc.)

–  PaaS (Pla?orm as a Service)

•  サービス提供者向けのサービス(Google App Engine, セールスフォース・ドットコム, Mixi Appli etc.)

–  IaaS (Infrastructure as a Service)

•  レンタルサーバを仮想マシンで置き換えたようなサービス(Amazon EC2)

•  ハイパーバイザ型仮想化システムのことを言う人

–  VMWare ESX, Hyper-‐V, Xenなどハードウェア構築の負担を減少させた仮想化システム (弾力性と言う人も) –  プライベートクラウド導入しませんか∼？という売り文句はだいたいこの仮想化システムのこと •  グリッドコンピューティングの別名と主張する人 –  グリッドコンピューティングとは複数の場所に散在するコンピュータをネットワーク上でつなげてリソース(CPU,ネットワーク,ストレージetc.)を共有する仕組み –  実際にクラウドと呼ばれるハードウェアやソフトウェアの機能はグリッドコンピューティングと区別がつけにくい •  一時的に不完全な状態を許したのがクラウドと主張する人 –  1万円をA銀行からB銀行に振り込む処理で「A銀行の1万円減額」「B銀行の1万円増額」を同時にやるのがこれまでのシステム途中で「B銀行の1万円増額」が遅れても最終的に同じであればよしと考え、分散に伴うリスクとして遅延があることを前提に設計されているのがクラウド

人によって「クラウド」という言葉の意味が違う

お互いが想像する意味が違ってもだいたい会話が通じる。なぜ？「大規模な処理をこなせるシステム」という意味で意見が一致 Googleや Amazonはクラウドや_! クラウド

(3)

Hadoopはクラウドだ！

•  3つの概念から構成

–  分散ファイルシステム(Hadoop Distributed File System; HDFS)

•  複数のマシン上でデータを共有し冗長化するためのファイルシステム。ネットワーク上で構成された RAIDのようなもの。FUSEを使ってmountすると一般のファイルシステムとほぼ同等に扱える。 –  分散処理(Map/Reduce) •  複数のマシン上で処理を分散し、分散処理された結果を最後に集めて集計する。 –  分散データベース(hBase/HyperTable) •  Google BigTableのようにカラム型データベースを実現する。 •  上記のどれかにだけ注目して利用することも可能 –  RAIDの代わりにHDFSのみ利用してデータの冗長化をしたい –  分散処理だけ利用したい（※ Hadoopで分散処理するにはHDFS上にファイルを置いた方が分散性があがる) –  HDFSを使わずカラム型データベースだけ利用したい結局_{Hadoopで何ができるの？という問いには…} データの冗長化ができる Google BigTableのようなものを自社環境で利用できる(改造もＯＫ) 汎用的な_{PC数台で構築できる} 分散処理を少ない手間で記述・実行できる（分散性の高い処理に限る₎ ※ 構築・運用コストは安くないので自前で構築する場合は要注意

(4)

Hadoop Streamingとは?

• _{Hadoop
StreamingはHadoopを基盤とし分散}

処理

(Map/Reduce)を

標準入出力

を利用して

実行可能

•  標準入出力を利用するため、開発言語の選

択肢が多い

(FORTRAN,C言語,Perl, etc.)

研究者が

Hadoopを利用する場合には、

Hadoop Streamingが使いやすい

(5)

MAP/REDUCEアルゴリズム

•  Hadoop Streamingを使うと概念を掴みやすい

–  Hadoop Streamingは標準入出力を利用してMap/Reduceを実現する(inetdに似ている) –  例えば次のスクリプトで書けるものはHadoop Streamingですぐに処理できる

$ cat input1.txt | map.sh > mid1.txt $ cat input2.txt | map.sh > mid2.txt $ cat input3.txt | map.sh > mid3.txt

$ cat mid1.txt mid2.txt mid3.txt| reduce.sh > output.txt

•  ポイント

–  mid1, mid2.txt, mid3.txtの順序を入れ替えても正しく動作するようにreduce.shを作る

–  中間ファイルであるmid1.txt等は標準では取り出すことはできない(reduceをなくせば取り出せる) –  入力ファイルはHDFS上に置く必要があり、また出力ファイルもHDFS上に置かれる –  外部ファイルを必要とする場合は要注意処理A (map) 処理B (reduce) input1 input2 input3 処理したいファイル群 output 処理Aは各ファイルを加工する処理 mid1.txt mid2.txt mid3.txt 処理_A (map) 処理_A (map) 処理Bは加工されたファイルを集めて解析し出力するこの形式に該当する処理はHadoop Streamingで分散処理可能

(6)

実行環境

•  システム構成(ハードウェア)

–  Mac mini x 16台 + Gigabit Ether Switch

•  HDFS Namenode x 1台 (NFSサーバ, バイナリ作成と兼用) •  Map/Reduce JobTracker x 1台

•  Slave x 14台 (HDFS Datanote兼Map/Reduce TaskTracker)

–  Mac miniの利点

•  Hadoopに必要なOS/Java/sshがインストール済み (買ってきてすぐnodeの一部にできる) •  場所を取らず省電力

•  OpenCLが利用可能

–  Mac miniの欠点

•  不要なものが多い(Bluetooth, Wireless LAN, SuperDrive etc.) •  標準のコンパイラ(X-‐code)でstafcコンパイルができない •  ラックマウントでないので今のところ地震に弱い •  インストールしたソフトウェア –  X-‐Code (コンパイラ, 1台目のみ) –  Hadoop-‐0.21.0 (全台数,rsyncで複製) •  その他 –  パスワードなしでsshでログインできるよう設定 Mac mini x 16台 GIGABIT SWITCH Mac mini Spec.

•  CPU: 2.4GHz Core2Duo •  Memory 2GB

(7)

(8)

Mac-‐mini-‐001 開発環境X-‐code をインストール実行手順 1.  標準入出力で動作するプログラムを作成 2.  標準入力として入力するファイル群をHDFSにアップロード 3.  外部ファイルとして使用するファイル群をNFSマウントされたディスクに配置 4.  プログラムの実行 Mac-‐mini-‐002

Mac-‐mini-‐003 Mac-‐mini-‐004 … Mac-‐mini-‐016

Master Slave •  ユーザはMac-‐mini-‐001にログインして実行するのみ！ •  コンパイラなどの開発環境はMac-‐mini-‐001にのみインストール HDFS Namenode M/R JobTracker HDFS Datanode

M/R TaskTracker HDFS Datanode M/R TaskTracker HDFS Datanode M/R TaskTracker

NFSサーバとしても動作各_{NFSクライアント}Slaveマシンは

Hadoop Streamingの実行手順

設定ファイルは全台_rsyncで共通のものを複製して使用

(9)

システム構成と処理方式

Machine1 Machine2 Machine3

NFSで各マシンからマウント

ﬁle:// + ファイルパスでアクセス

Machine1 Machine2 Machine3

HDFS上にデータ配置 (1) データは外部ストレージに置き、処理のみHadoopで分散 (2) データをHDFSに置き、処理もHadoopで分散 HDFS メリット・分散効率が最も高い・スケーラビリティが良い(スケールアウトする) デメリット・HDFS上にデータを置くのに時間がかかる・小さい大量のファイルをHDFS上に置きにくい (Heapメモリの枯渇) 処理方法案・ディレクトリを引数にしてディレクトリ内のファイルを一括処理メリット・他のシステムと連携しやすい・_{HDFS上の制約に捕らわれない} デメリット・台数が増えるとNFSがボトルネック(スケールアウトしにくい) ・処理するためにファイルリストを作る必要があるが、ファイル数が少ない場合にはファイルリストのサイズも小さく、結果として分散数が減少してしまう処理方法案・処理対象となるファイルリスト一覧を作成し引数で与える・_{TextInputFormatを用いてファイルパスをvalueにセットする} 外部ストレージ用途に応じて_{(1),(2),(1)+(2)の方式を使い} 分けることが現実的

(10)

科学衛星運用系と解析・公開系処理

局マージ処理リアル_/リプロマージ処理 SIRIUS 時刻変換処理アンテナ軌道決定処理軌道データ衛星受信データ Re-‐formaier Level 0処理 Level N処理 … 処理済みデータ公開処理検索用 DB作成検索要求応答処理公開用データ作成工学値変換処理 EDISON QL機能 DL機能 QL装置ストリーミング処理 FTPリレー処理衛星運用系解析・公開系衛星運用系は・リアルタイム性・信頼性・可用性を重視

(11)

科学衛星運用系と解析・公開系処理

局マージ処理リアル_/リプロマージ処理 SIRIUS 時刻変換処理アンテナ軌道決定処理衛星受信データ Re-‐formaier Level 0処理 Level N処理 … 処理済みデータ公開処理検索用 DB作成検索要求応答処理公開用データ作成工学値変換処理 EDISON QL機能 DL機能 QL装置ストリーミング処理 FTPリレー処理衛星運用系解析・公開系衛星運用系は・リアルタイム性・信頼性・可用性を重視 EDISONは衛星運用系だがリアルタイム性が低く、また処理の分散性が高いため分散処理の第一候補 SIRIUSはマージ処理でデータの遅延、重複を考慮した設計となっているため、分散処理設計には向いているが、源泉データを多く取り扱うため、性能・運用・拡張性まで含めた高信頼性が必要 Re-‐Formaierは分散処理で十分に実施できる可能性を秘めているが、既存ソフトウェアを作り替えるほどのメリットを見いだせていない解析・公開系処理は従来のウェブサイトとほぼ同等のシステムであり、技術習得という意味で非常によい対象。失敗時のリスクも小さい。

(12)

衛星データの特徴とテクノロジーの選択

VCDU CCSDS L0∼L1 L2∼ ファイルサイズ：小(数100byte) ファイル長：固定長数量：多 _(大量) その他：時系列データファイルサイズ：小(∼2048) ファイル長：固定長が多い数量：多その他：時系列データ HBase 日時とVCDU Counterからキーを作成しパケットそのものを格納 (RDBMSにおけるBLOBの使い方) ファイルサイズ：小∼大ファイル長：固定長、可変長数量：普通その他：時系列が多い Map/Reduce HBase VCDU CCSDS APIDおよびTIをもとにキーを作成し CCSDSパケットそのものを格納 (RDBMSにおけるBLOBの使い方) VCDUからCCSDSを抽出する処理を Map/Reduceで実施 Map/Reduce Map/Reduceが利用できれば高速化が期待できるが、観測機器チームに Map/Reduceを強いるのは困難? Map/Reduce HDFS Local Disk L0/1 HBase HDFS L2 Data Meta data (注) 現在はHBaseを安定に運用する方法を見つけられていないのでプロセッシングのみ用い、_{HBase部分は} NFSマウント先のディスクを利用ファイルサイズ：小∼大ファイル長：固定長、可変長数量：普通その他：様々

(13)

Hadoop Streamingを使った月惑星シミュレータの分散化

設定ファイル (lua) mpsim_se 天体リスト (xml) mpsim_ig 画像 (FITS) mpsim_se_stdio 設定ファイル (標準入力) 天体リスト (標準出力) SPICE Kernel (外部ファイル) SPICE Kernel (外部ファイル) SPICE Kernel (外部ファイル) 天体リスト

(標準入力) mpsim_ig -‐i -‐ -‐o -‐

画像 (標準出力) ・読み込まれる設定ファイル群は予め用意して_{hdfs上の同じディレクトリにアップロードする} ・プログラムは標準入力と標準出力で動作するように改造する・外部ファイルとなる_{SPICE
KernelはNFSでマウントされたディスク上に配置する} ・外部ファイルを読み込む部分のパスを全て変更する_{(ここでは設定ファイルのパスを変更)} 時刻を入力すると探査機の軌道・姿勢・観測機器視野から視野内に映る天体をシミュレーションするエンジン(数10秒かかる) シミュレートされた結果を読み込みレンダリング画像_{(FITSフォーマット)を出力する} (1秒以内で終了する処理) Venus Texture (外部ファイル) Moon Texture (外部ファイル) Earth Texture (外部ファイル) Hadoop Streaming用にプログラムを変更月惑星シミュレータの動作動画を作る場合にはこの動作を数百∼数千回繰り返す

(14)

(15)

(16)

Hadoop Streaming使用上のコツ

•  マシンは全て同じアーキテクチャ –  Hadoop自身はJavaベースでアーキテクチャへの依存性が低いが、Hadoop Streamingは実行ファイルを各マシンに配布するため、実行ファイルがバイナリの場合、全てのアーキテクチャが同じ必要がある •  コンパイルはstafcコンパイル –  実行ファイルは各マシンで動作する必要があるため、可能であればstafcコンパイルをしてライブラリの実行時読み込みを避ける –  もしstafcコンパイルができない場合は、全台数に必要なライブラリをインストールする •  外部ファイルを読み込む方法は3種類 1.  全てのマシン上から同じディレクトリ構造でアクセス可能なパスに配置 (NFS等) 2.  HDFS上にファイルを配置し実行時にローカルのworkingディレクトリにコピー 3.  jarファイル等でジョブ投入時にコピー •  標準入力の入力ファイルはASCII形式 –  バイナリファイルを読み込む必要がある場合は、標準入力ではなく、外部ファイルとして読み込んだ方がトラブルが少ない –  どうしてもバイナリファイルを標準入力として取り扱う必要がある場合にInputFormatをjavaで作成するなど工夫が必要

(17)

まとめ

•  研究者にも利用しやすい標準入出力を利用

した

Hadoop Streamingを紹介した

•  惑星探査の処理において

_{Hadoop
Streaming}

(18)

Mac mini Speciﬁcafon

$ uname -a

Darwin Mac-mini-001.local 10.3.3 Darwin Kernel Version 10.3.3: Wed Apr 7 20:48:41 PDT 2010; root:xnu-1504.6.1~3/RELEASE_I386 i386

$ java -version

java version "1.6.0_17"

Java(TM) SE Runtime Environment (build 1.6.0_17-b04-248)

Java HotSpot(TM) 64-Bit Server VM (build 14.3-b01-101, mixed mode) $ df -h

Filesystem Size Used Avail Capacity Mounted on /dev/disk0s2 298Gi 11Gi 287Gi 4% /

devfs 107Ki 107Ki 0Bi 100% /dev map -hosts 0Bi 0Bi 0Bi 100% /net

(19)

(20)

(21)

Shell Script

#!/bin/sh

export HADOOP_HOME=/Users/yukio/Hadoop/hadoop-‐0.21.0

$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/mapred/contrib/ streaming/hadoop-‐0.21.0-‐streaming.jar \ -‐input hdtv/inputs \ -‐output hdtv/outputs \ -‐mapper mk_footprint \ -‐reducer NONE \ -‐ﬁle mk_footprint \ -‐ﬁle selene.meta

yamamoto_hadoop.pptx

大規模な月惑星データの扱いについて

∼

Hadoop Streamingによる分散処理の適用∼

宇宙航空研究開発機構

クラウドとは

?

人によって「クラウド」という言葉の意味が違う

Hadoopはクラウドだ！

Hadoop Streamingとは?

•

Hadoop StreamingはHadoopを基盤とし分散

処理

(Map/Reduce)を

標準入出力

を利用して

実行可能

• 標準入出力を利用するため、開発言語の選

択肢が多い

(FORTRAN,C言語,Perl, etc.)

研究者が

Hadoopを利用する場合には、

Hadoop Streamingが使いやすい

MAP/REDUCEアルゴリズム

実行環境

Hadoop Streamingの実行手順

システム構成と処理方式

科学衛星運用系と解析・公開系処理

科学衛星運用系と解析・公開系処理

衛星データの特徴とテクノロジーの選択

Hadoop Streamingを使った月惑星シミュレータの分散化

Hadoop Streaming使用上のコツ

まとめ

• 研究者にも利用しやすい標準入出力を利用

した

Hadoop Streamingを紹介した

• 惑星探査の処理において

Hadoop Streaming

Mac mini Speciﬁcafon

Shell Script

• 

_{Hadoop
StreamingはHadoopを基盤とし分散}

•  標準入出力を利用するため、開発言語の選

•  研究者にも利用しやすい標準入出力を利用

•  惑星探査の処理において

_{Hadoop
Streaming}