スケーラブルな
ストレージソリューション
日本ヒューレット・パッカード株式会社
テクノロジーコンサルティング統括本部
コアテクノロジー部
大矢
俊夫 氏
オンプレミスからパブリッククラウドまで、
Agenda
• ストレージに求められているもの
•
ニアライアン・ストレージ
• スケーラブルなストレージソリューション
•
Red Hat Storageとは
•
Red Hat Storageのアーキテクチャ
•
適用領域
•
特徴
•
大容量・スケーラブルであること
•
簡単にアクセスできること
•
耐障害性が高いこと
•
耐災害性が高いこと
ストレージに求められているもの
• ストレージに求められているもの
•
ニアライアン・ストレージ
• スケーラブルなストレージソリューション
•
Red Hat Storageとは
•
Red Hat Storageのアーキテクチャ
•
適用領域
•
特徴
•
大容量・スケーラブルであること
•
簡単にアクセスできること
•
耐障害性が高いこと
•
耐災害性が高いこと
既存のストレージ
ストレージに求められているもの
• オンライン・ストレージ
•
サーバと直接接続している、高速かつ頻繁なファイルアクセスを必要とするストレージ
•
SAS/SATAディスク
•
Storage Area Network(SAN)接続ストレージ
•
問題点:
•
基本的に1サーバからしかアクセスできない
•
一定以上の容量強化が難しい
• オフラインストレージ
•
大量のデータをアーカイブとして長期間保存可能なストレージ
•
テープドライブ
•
光学メディア
•
問題点
•
読み出しが非常に低速で、メディアの交換等が必要
オフライン・ストレージ
オンライン・ストレージ
サーバ
SANストレージ
ローカル
ディスク
最近問い合わせの多いストレージの用途
ストレージに求められているもの
• 用途
• コンテンツ
/メディアサーバ用のストレージ
• ログ保管用ストレージ
• バックアップ用ストレージ
• 共通する特徴
• ファイルサイズは比較的大きい~巨大
• 保存するファイル数は、増大していく
• 1つのファイルを1度配置(書き出し)したら、変更はほとんどなく、読み出しのみ発生する
• 多数のクライアントから読み書きが行われる
• 必要な時に目的のファイルに素早くアクセスしたい
• その他要件
• データのロストは可能な限り避けたい(耐障害性、耐災害性)
最近問い合わせの多いストレージに共通する特徴
ストレージに求められているもの
• 大容量かつスケーラブルであること
• 大容量のファイルを格納でき、またファイルの増加に容易に対応できてほしい。
• 多数のクライアントからアクセス可能であってほしい。
• 簡単にアクセスできること
• オフラインストレージよりも容易に、素早く目的のファイルにアクセスできてほしい。
• オンラインストレージよりは高速でなくても良い。
• 耐障害性が高いこと
• 格納されているデータの消失は可能な限り発生しないでほしい。
• 耐災害性が高い
• 災害対策として、別サイトに複製(レプリカ)を作成できてほしい。
どんなストレージが必要なのか?
ストレージに求められているもの
•
オンライン・ストレージよりも容量が大きくて、スケーラブルなストレージがほしい
•
オフライン・ストレージよりもファイルへのアクセスが高速なストレージがほしい
•
答え:
(スケーラブルな)ニアライン・ストレージ
•
サーバに直接接続しているオンライン・ストレージと、テープデバイスや光学ディスクのようなオフラインストレージの中間
的な性質を持つストレージのことです。
•
例えばNAS(Network Attached Storage)やオブジェクト・ストレージです。
ニアライン・ストレージ
オフライン・ストレージ
オンライン・ストレージ
サーバ
SANストレージ
ローカル
ディスク
アクセス速度
容
量
高速
低速
大
小
ニアライン・ストレージ
ストレージに求められているもの
•
NFS/CIFSベースのNAS
• オンライン・ストレージを、NFSプロトコルまたはCIFSプロトコルで接続するクライアントに対して公開
• スケーラビリティは製品にもよるが限界がある
•
OpenStack Swift
• RESTでアクセス可能なオブジェクト・ストレージ
• スケーラビリティは高いが、ファイルへのアクセスがRESTベースのみとなる
•
Red Hat Storage/GlusterFS
• 複数のサーバを利用して、スケールアウト型の分散ファイルシステムを構築する
• NFS/CIFS/REST/Hadoop API/Nativeといった各種プロトコルでアクセス可能
スケーラブルなストレージソリューション
• ストレージに求められているもの
•
ニアライアン・ストレージ
• スケーラブルなストレージソリューション
•
Red Hat Storageとは
•
Red Hat Storageのアーキテクチャ
•
適用領域
•
特徴
•
大容量・スケーラブルであること
•
耐障害性が高いこと
•
耐災害性が高いこと
•
Red Hat Storageでできること
Red Hat Storageとは
スケーラブルなストレージ・ソリューション
• 製品について
• オープンソースの分散ファイルシステム・ソフトウェアGlusterFSをRed Hatが製品化したものです
• 最大64ノードで8PBまでの仮想的な巨大なネットワークストレージを構成するストレージ・ソリューション
• ストレージとしての特徴
最大容量
8ペタバイト(レプリケーション時4ペタバイト)
最大ノード台数
64ノード(最小4ノード)
アクセス方法
FUSE(Nativeプロトコル), NFSv3, CIFS, REST(OpenStack Swift)など
メタデータ管理
中央管理サーバのない、分散管理
耐障害性
RAID6構成、同期レプリケーションによる二重化が可能
Red Hat Storage のアーキテクチャ
スケーラブルなストレージ・ソリューション
Native
NFSv3
CIFS
REST (Swift)
仮想的な巨大ファイルシステム(最大8PB)
クライアント
クライアント
クライアント
クライアント
ブリック
ブリック
ブリック
ブリック
ブリック
ブリック
Red Hat Storage
Red Hat Storage
Red Hat Storage
実際のファイルは
各サーバのブリッ
クに分散して格納
サーバとブリックを追
加することで容量を増
強(最大64台)
管理用メタデータを各
サーバが分散保持
クライアントからRHSは
NASのように見えます
スケーラブルなストレージ・ソリューション
Red Hat Storage向きのシステム
一度書き込んだファイルを何度も読みだすアプリケー
ションに向きます。
• デジタルコンテンツ・マルチメディア
• ビデオ、オーディオ、画像ファイル
• 例)コンテンツ配信システム
• 例)オンラインラジオ配信
• 大規模な非構造化ファイル用のストレージ
• バックアップ、リストア
• 一般的なファイル共有
• 一般用途のオブジェクトストレージとしての
Dropbox
Red Hat Storage
向きではない
システム
同一ファイルやディレクトリへの平行書込みが多発
するアプリケーションや、ディレクトリ名の変更が多
発するアプリケーションには向きません。
• データベースのようなトランザクション処理が多
いシステム
• IOPS インテンシブなシステム
• 書き込みの多いシステム
• CIFSを使うWindowsシステム
最近問い合わせの多いストレージに共通する特徴
ストレージに求められているもの(再掲)
• 大容量かつスケーラブルであること
• 大容量のファイルを格納でき、またファイルの増加に容易に対応できてほしい。
• 多数のクライアントからアクセス可能であってほしい。
• 簡単にアクセスできること
• オフラインストレージよりも容易に、素早く目的のファイルにアクセスできてほしい。
• オンラインストレージよりは高速でなくても良い。
• 耐障害性が高いこと
• 格納されているデータの消失は可能な限り発生しないでほしい。
• 耐災害性が高い
• 災害対策として、別サイトに複製(レプリカ)を作成できてほしい。
大容量かつスケーラブルであること
スケーラブルなストレージ・ソリューション
• 大容量
• 最大で8PBまでのファイルシステムをサポートします。(レプリケーション時は4PB)
• クライアントからは1つのファイルシステムとしてアクセス可能です。
• Swift互換のオブジェクトストレージとしても利用可能です。
• スケーラブル
• サービス提供中に動的にディスクおよびノードの追加による容量増強が可能です。
• ノードを増強することで、多数のクライアントからのアクセス性能
が向上します。
• オンプレミスだけでなく、プライベート・クラウド
やパブリック・クラウド
(Amazon EC2)への展開も
可能です。
最大
8PB
NFSv3, CIFS, GlusterFSを利用
してNASとしてアクセス可能
Swift互換のオブジェクトスト
レージとしても利用可能
ブリック ブリック ブリック ブリック ブリック ブリッククライアント
Amazon EC2上でRed Hat Storageを利用する
AMI(Amazon Machines Image)として
提供されます
スケーラブルなストレージ・ソリューション
• FUSE(Native)
• RHSのNativeプロトコル(GlusterFS)で、ClientとRHSボリュー
ムを構成する全ノード間で通信を行います。
• 通常のファイルシステムとしてアクセスできます。
• NFSv3
• ClientからRHSボリュームをNFSマウントします。
• RHSボリュームを構成する各ノードはNFSサーバとして動
作します。
• CIFS
• ClientからRHSボリュームをCIFSでマウントします。
• REST API
• OpenStack Swift互換のREST APIでRHSボリュームにアクセ
スします。
簡単にアクセスできること
Client
GlusterFSClient
NFSv3Client
CIFSClient
REST APIGlusterd
CIFS SwiftRHS
(RHEL6.2)Glusterd
CIFS SwiftRHS
(RHEL6.2)Glusterd
CIFS SwiftRHS
(RHEL6.2)グローバル名前空間 ファイルシステム
RHS ボリューム
ブ リッ ク ブ リッ ク ブ リッ ク ブ リッ ク ブ リッ ク ブ リッ クブリック
耐障害性が高いこと
スケーラブルなストレージ・ソリューション
• 耐サーバ障害
• 集中管理サーバがないためノード障害が発生しても、残存ノードのみでサービスの継続が可能
•
1分程度のアクセス停止が発生します。
• NFSv3およびCIFS用に仮想IPベースのFailover機能を提供しています。
• データ保全
• RAID 6構成のため、1ブリックあたりディスク2本までの障害に対応します。
• レプリケーション構成にすることで、データ破損が発生した場合でも別サーバに複製を保持
し、サービスを継続します。
ブリック ブリック ブリック ブリック ブリッククライアント
レプリケーション
RAID6構成
仮想IP1
仮想IP2
仮想IP N
仮想IP1
Failover
耐災害性が高いこと
スケーラブルなストレージ・ソリューション
• パブリック・クラウド上での展開
• パブリック・クラウド上にRHSを構築することで、災害に対して強いストレージを構成できます。
•
Geo-Replicationによる他サイトへのデータ・レプリケーション
• RHSのGeo-Replication機能により、他サイトまたはパブリック・クラウド上のRHS上に、非同期コピーを可能
にします。
Native NFSv3 CIFS REST (Swift)
仮想的な巨大ファイルシステム(最大8PB)
クライアント クライアント
クライアント クライアント
Red Hat Storage Red Hat Storage Red Hat Storage
Native NFSv3 CIFS REST (Swift)
仮想的な巨大ファイルシステム(最大8PB)
クライアント クライアント
クライアント クライアント
Red Hat Storage Red Hat Storage Red Hat Storage