• 検索結果がありません。

パフォーマンスレポート PCIe-SSDs ioDrive®2

N/A
N/A
Protected

Academic year: 2021

シェア "パフォーマンスレポート PCIe-SSDs ioDrive®2"

Copied!
21
0
0

読み込み中.... (全文を見る)

全文

(1)

ホワイトペーパー

FUJITSU PRIMERGY サーバ

パフォーマンスレポート

PCIe-SSDs ioDrive

®

2

この資料では、一部の PRIMERGY サーバで使用できる ioDrive

®

2 PCIe-SSD のディスク

I/O パフォーマンスについて詳しく説明します。

測定結果とともに、測定方法と測定の実施環境についても簡単に説明します。

バージョン 1.0b 2013-07-04

(2)

目次

ドキュメントの履歴

バージョン 1.0 初回報告版 バージョン 1.0a マイナー修正 バージョン 1.0b マイナー修正 ドキュメントの履歴 ... 2 基本情報と製品データ ... 3 測定方法 ... 5 測定環境 ... 6 測定結果 ... 7 単体の PCIe-SSD ... 7 2 つの PCIe-SSD ... 11 4 つの PCIe-SSD ... 13 公称容量の影響 ... 14 ベストプラクティス ... 16 現在のプロセッサ周波数の最適化 ... 16 プロセッサ割り当ての最適化 ... 18 サーバの選択 ... 18 他のストレージ媒体との比較 ... 19 結論 ... 20 関連資料 ... 21 お問い合わせ先 ... 21

(3)

基本情報と製品データ

PCIe-SSD は、PRIMERGY サーバ用の革新的な非揮発性ストレージ媒体です。特定のケースにおいて、 SAS または SATA インターフェースを持つ「ハードディスクドライブ」(HDD)または「ソリッドステー トドライブ」(SSD)の代わりに論理ハードディスクドライブとして使用できます。PCIe-SSD ストレージ 媒体は PCIe バスと直接結合されているため、非常に高いトランザクションレートを発揮し、遅延を削減で きます。このストレージ媒体は、以下のような非揮発性の環境に保存されているデータへの高速アクセスを 可能します。  データベース  Web 2.0 サーバ  ページファイル(特にページファイルがメモリ管理コンセプトで重要な役割を果たす仮想環境で有 効です) 製品データ 現在発売されている PCIe-SSD は、マルチレベルセル(MLC)NAND タイプのメモリをベースとしたフラ ッシュメモリです。現在は 2 種類の PCIe-SSD が用意されており、公称容量はそれぞれ 785 GB と 1.2 TB です。 ストレージ媒体自体に強力なコントローラーが内蔵されているため、RAID コントローラーを別途用意する 必要はありません。サーバへのバスインターフェースは PCIe 2.0、x4 タイプで、最大約 1720 MB/s の実効 スループットが得られます。『Fusion-io® ioDrive®2 ソリッドステートストレージデバイス』データシート によると、これらの PCIe-SSD の最大スループット値は次のとおりです。 負荷プロファイル 最大スループット ioDrive ® 2 PCIe-SSD PCIe-SSD 785GB MLC PCIe-SSD 1.2TB MLC 100 %リード、1 MB ブロックサイズ 1.5 GB/s 1.5 GB/s 100 %ライト、1 MB ブロックサイズ 1.1 GB/s 1.3 GB/s 本書で取り上げている ioDrive® 2 PCIe-SSD は、この PRIMERGY サーバ用ストレージメディアの第 2 世代 です。その第 1 世代(ioDrive®)のパフォーマンスに関しては、ホワイトペーパー『パフォーマンスレポー ト PCIe-SSD』で説明しています。ioDrive® 2 PCIe-SSD の重要な最大パフォーマンス値は、次の表の 『Fusion-io® ioDrive®2 ソリッドステートストレージデバイス』データシートの値が示すように、第 1 世代 と比較して約 2 倍になっています。 負荷プロファイル 最大スループット ioDrive ® PCIe-SSD PCIe-SSD 320GB MLC PCIe-SSD 640GB MLC 100 %リード、64 KB ブロックサイズ 735 MB/s 750 MB/s 100 %ライト、64 KB ブロックサイズ 510 MB/s 550 MB/s PCIe-SSD は起動ドライブとして使用できません。 管理ソフトウェア PCIe-SSD には、グラフィカル管理ソフトウェアの「ioSphere®」が付属しています。このソフトウェアに は、ストレージ媒体のフォーマットを行うための「Format Low-Level」メニューと設定オプションなどが含 まれています。標準で使用される設定では、ライト性能とストレージ容量をバランス良く調整しています。

(4)

 最大容量: 媒体の実際のストレージ容量を増やします。ライト速度とリザ ーブブロックのストックが減るため、ライトサイクルが多すぎ るとブロック切れが発生します。  パフォーマンスの改善: ストレージ容量を 10 %使用してライトパフォーマンスを上げ ます。  高パフォーマンス: ストレージ容量を 20 %使用してライトパフォーマンスを最高 レベルまで引き上げます。 さらに「カスタム」選択により、任意の公称容量率を設定することも可能です。PCIe-SSD の再フォーマッ トを行うと、処理中にストレージ媒体が再構築されるため、保存されているデータが必然的に削除されます。 ストレージ容量は、PCIe-SSD を選ぶ際に特に重要な要素になります。フォーマットオプションに応じて、 実際のストレージ容量は公称容量から次のように変化します。 公称容量 フォーマットオプション 実際のストレージ容量 785 GB 高パフォーマンス 628 GB パフォーマンスの改善 706.5 GB 出荷時容量 785 GB 最大容量 ~845 GB 1.2 GB 高パフォーマンス 964 GB パフォーマンスの改善 1084.5 GB 出荷時容量 1205 GB 最大容量 ~1294 GB

PCIe-SSD をページファイルとして使用する場合は、最適なパフォーマンスが得られるように、[Page File Support(ページファイルサポート)]セクションの標準設定である[Disable Page File Support(ページフ ァイルサポートを無効にする)]をオフにして、[Enable Page File Support(ページファイルサポートを 有効にする)]をオンにする必要があります。この設定は、PCIe-SSD の他の用途のパフォーマンスには影 響しません。

(5)

測定方法

測定方法とディスク I/O パフォーマンスの基本については、「ディスク I/O パフォーマンスの基本」ホワイ トペーパーで説明しています。 標準では、PRIMERGY サーバのディスクサブシステムのパフォーマンス測定は、既定の測定方法で行われ ます。この測定方法では、仕様に基づいて、実際のアプリケーションシナリオのハードディスクアクセスを モデル化します。 必要な仕様は次のとおりです。  ランダムアクセス/シーケンシャルアクセスの比率  リード/ライトアクセスタイプの比率  ブロックサイズ(KB)  パラレルアクセスの数(処理待ち I/O の数) これらの仕様値を組み合わせたものを「負荷プロファイル」と呼びます。以下の 5 種類の標準負荷プロファ イルを一般的なアプリケーションシナリオに割り当てることができます。 異なる負荷強度でパラレルにアクセスするアプリケーションをモデル化するには、「処理待ち I/O の数」を 1、3、8 と増やしていき、最終的に 512 まで引き上げます(8 以降は 2 の乗数で増加します)。 この資料の測定は、これらの標準負荷プロファイルに基づいています。 測定の主な結果は以下のとおりです。  スループット [MB/s] 1 秒あたりのデータ転送量(メガバイト単位)  トランザクション [IO/s] 1 秒あたりの I/O 処理数  遅延 [ms] 平均応答時間(ミリ秒単位) 通常、シーケンシャルな負荷プロファイルでは「データスループット」が使用され、小規模なブロックサイ ズを使用するランダムな負荷プロファイルでは「トランザクションレート」が使用されます。スループット とトランザクションは互いに正比例の関係にあるので、次の計算式で相互に算出できます。 スループット [MB/s] = トランザクション [IO/s] × ブロックサイズ [MB] トランザクション [IO/s] = スループット [MB/s] / ブロックサイズ [MB] 標準負荷 プロファイル アクセス方法 アクセスの種類 ブロックサイズ [KB] アプリケーション リード ライト ファイルコピー ランダム 50 % 50 % 64 ファイルのコピー ファイルサーバ ランダム 67 % 33 % 64 ファイルサーバ データベース ランダム 67 % 33 % 8 データベース(データ転送) メールサーバ ストリーミング シーケンシャル 100 % 0 % 64 データベース(ログファイル) データバックアップ ビデオストリーミング(一部) リストア シーケンシャル 0 % 100 % 64 ファイルのリストア

(6)

測定環境

本書で示すすべての測定は、次のハードウェアとソフトウェアのコンポーネントを使用して行いました。 SUT(System Under Test:テスト対象システム)

ハードウェア モデル PRIMERGY RX300 S7 × 1 PRIMERGY RX900 S2 × 1 プロセッサ PRIMERGY RX300 S7: Xeon E5-2643(3.3 GHz)× 2 Xeon E5-2603(1.8 GHz)× 2 PRIMERGY RX900 S2: Xeon E7-8850(2.0 GHz)× 4 データ媒体 PCIe-SSD ioDrive®2 1.2 TB MLC × 4 PCIe-SSD ioDrive®2 785 GB MLC × 1 ソフトウェア BIOS PRIMERGY RX300 S7: 1.12.0 PRIMERGY RX900 S2: 01.09 BIOS 設定 PRIMERGY RX300 S7: 「パフォーマンス」タイプの測定:

Execute disable bit = Disabled; Frequency Floor Override = Enabled; Power Technology = Custom; Energy Performance = Performance; CPU C6 Report = Disabled; Package C State limit = C0

「デフォルト」タイプの測定:

Execute disable bit = Enabled; Frequency Floor Override = Disabled; Power Technology = Energy Efficient; Energy Performance = Balanced Performance; CPU C6 Report = Enabled; Package C State limit = No Limit PRIMERGY RX900 S2:

Performance/Watt=Performance; Hyper-Threading=Disabled, NX Memory Protection=Disabled

オペレーティングシ ステム

Microsoft Windows Server 2008 R2 Enterprise オペレーティング

システム設定

AFFINITY:

ディスク I/O(= 使用した測定方法の dynamo)を作成するプロセスの AFFINITY は最適な CPU に設定されました。

電源プラン:

「パフォーマンス」タイプの測定:

Select a power plan = High performance; 「デフォルト」タイプの測定:

Select a power plan = Balanced; ファームウェア PCIe-SSD ioDrive®2:v7.0.2, rev 108609

ドライバ PCIe-SSD ioDrive®2:iomemory-vsl.sys 3.1.5 build 126 管理ソフトウェア PCIe-SSD ioDrive®2:ioSphere® 3.2.2

RAID アレイの初期化 RAID アレイは、測定前に 64 KB の基本ブロックサイズ(「ストライプサイズ」)で初期 化 ファイルシステム NTFS 測定ツール Iometer 2006.07.27 測定データ 32 GB の測定ファイル 国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

(7)

測定結果

ここでは、「データベース」、「ファイルサーバ」、「ファイルコピー」、「ストリーミング」、「リスト ア」という 5 つの標準負荷プロファイルを使用します。プロファイルについては、PCIe-SSD のパフォーマ ンスを検証するための「測定方法」を参照してください。ストレージ媒体へのアクセス図でさまざまな負荷 強度を考慮する場合、富士通テクノロジー・ソリューションズでは、「処理待ち IO の数」で負荷強度を指 定します。負荷強度が低いアプリケーションの場合は処理待ち IO の数を 1 に設定し、負荷強度が高い場合 は処理待ち IO の数を 512 に設定します。

単体の PCIe-SSD

基本的な留意事項を明らかにするために、まず公称容量 1.2 TB の単体の PCIe-SSD について検証します。 最初にランダムアクセスの負荷プロファイルを検証し、その後、シーケンシャルアクセスの負荷プロファイ ルを検証します。 ランダムアクセス ランダムアクセスの場合、パフォーマンスの測定基準として IO/s 単位でトランザクションレートを示しま す。次の図は「データベース」負荷プロファイル(ランダムアクセス、67 %リード、8 KB ブロックサイズ) のトランザクションレートを示したもので す。低い負荷強度の場合、PCIe-SSD は、 すべてのフォーマットオプションで 8000 ~9000 IO/s の値を示します。負荷強度が 高まるにつれ、トランザクションレートは 非常に高い負荷強度において 50000 IO/s 弱に到達するまで均等に上昇します。ここ でのパフォーマンスは、使用したフォーマ ットオプションには左右されません。 0 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs Factory Capacity Maximum Capacity Improved Performance High Performance

1 × PCIe-SSD 1.2 TB、負荷プロファイル「データベース」

(8)

0 2000 4000 6000 8000 10000 12000 14000 16000 18000 20000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs Factory Capacity Maximum Capacity Improved Performance High Performance

次の図は「ファイルサーバ」負荷プロファイル(ランダムアクセス、67 %リード、64 KB ブロックサイズ) の トラ ンザ クシ ョン レート を示 した もの です 。低い 負荷 強度 の場 合、 トラン ザク ショ ンレ ート は約 5000 IO/s です。負荷強度が高まるにつれ、 トランザクションレートも上昇します。処 理待ち IO = 約 64 からパフォーマンスの 上昇は横ばい状態になり、最高の負荷強度 で最大約 19000 IO/s に到達します。この 最 大 ト ラ ン ザ ク シ ョ ン レ ー ト は 、 1190 MB/s のデータスループットに相当す るブロックサイズを使用した場合であるこ と は 興 味 深 い 点 で す 。 こ の 値 は す で に ioDrive®2 PCIe-SSD の最大値に近づいて いるため、横ばい状態になることがわかり ます。この負荷プロファイルでのパフォー マンスも、使用したフォーマットオプショ ンには左右されません。 次の図は「ファイルコピー」負荷プロファイル(ランダムアクセス、50 %リード、64 KB ブロックサイズ) の トラ ンザ クシ ョン レート を示 した もの です 。低い 負荷 強度 の場 合、 トラン ザク ショ ンレ ート は約 6500 IO/s です。負荷強度が高まるにつれ、 トランザクションレートも上昇します。処 理待ち IO = 約 64 からパフォーマンスの 上昇は横ばい状態になり、最高の負荷強度 で最大約 18000 IO/s に到達します。この 場合のパフォーマンスも、使用したフォー マットオプションには左右されません。 0 2000 4000 6000 8000 10000 12000 14000 16000 18000 20000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs Factory Capacity Maximum Capacity Improved Performance High Performance

1 × PCIe-SSD 1.2 TB、負荷プロファイル「ファイルサーバ」 1 × PCIe-SSD 1.2 TB、負荷プロファイル「ファイルコピー」

(9)

シーケンシャルアクセス PCIe-SSD は、実稼動アプリケーションのシーケンシャルアクセス用途ではほとんど使用されません。これ は、通常のハードディスクがこの用途で既に高いパフォーマンスを達成しているからです。しかし、完全を 期すために、この資料ではこの負荷プロファイルについても説明します。シーケンシャルアクセスでは、ト ランザクションレートはパフォーマンスの測定基準として使用されず、スループットが MB/s 単位で示され ます。達成できるスループット値を理解するには、ストレージ媒体の最大値を知ることが必要不可欠です。 上述したように、『Fusion-io® ioDrive®2 ソリッドステートストレージデバイス』データシートによると、 1 MB ブロックサイズの最大値は次のとおりです。 負荷プロファイル 最大スループット ioDrive ® 2 PCIe-SSD PCIe-SSD 785GB MLC PCIe-SSD 1.2TB MLC 100 %リード、1 MB ブロックサイズ 1.5 GB/s 1.5 GB/s 100 %ライト、1 MB ブロックサイズ 1.1 GB/s 1.3 GB/s これらの値は、以下の分析の基準として使用されます。 次の図は「ストリーミング」負荷プロファイル(シーケンシャルアクセス、100 %リード、64 KB ブロック サイズ)のスループットを示したものです。負荷強度が最も低い状態では、すべてのフォーマットオプショ ンにおいて約 450 MB/s のスループットが 得られます。負荷強度が処理待ち IO = 16 まで上昇すると、スループットは急速に 1300 MB/s まで達します。この値でほぼ 最大値に達しており、最高の負荷強度ま で 、 さ ら に デ ー タ ス ル ー プ ッ ト は 約 1400 MB/s まで上昇します。この場合の パフォーマンスも、使用したフォーマッ トオプションには左右されません。 0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 1 2 4 8 16 32 64 128 256 512 Th ro u g h p u t [M B/ s ] # Outstanding IOs Factory Capacity Maximum Capacity Improved Performance High Performance

1 × PCIe-SSD 1.2 TB、負荷プロファイル「ストリーミング」

(10)

次の図は「リストア」負荷プロファイル(シーケンシャルアクセス、100 % ライト、64 KB ブロックサイ ズ)のスループットを示したものです。低い負荷強度の場合、データスループットは約 700~770 MB/s に 到達します。負荷強度が処理待ち IO = 2 まで上昇すると、すぐに約 1000 MB/s の 最大データスループット値に到達します。 この負荷プロファイルでは、異なるフォー マットオプションによる大幅な違いはあり ません。 フォーマットオプションのパフォーマンスに関する総合比較 その先行世代とは異なり、ioDrive® 2 PCIe-SSD は、通常、パフォーマンスの理由から標準フォーマットの 「出荷時容量」以外を使用する必要はありません。このため、以降のセクションでは「出荷時容量」以外の フォーマットオプションに関する説明は必要ではありません。 これらの標準以外のフォーマットオプションは特殊な場合にのみ検討されます。 0 100 200 300 400 500 600 700 800 900 1000 1100 1 2 4 8 16 32 64 128 256 512 Th ro u g h p u t [M B/ s ] # Outstanding IOs Factory Capacity Maximum Capacity Improved Performance High Performance

 

1 × PCIe-SSD 1.2 TB、負荷プロファイル「リストア」

(11)

2 つの PCIe-SSD

他の論理ドライブと同様に、RAID アレイは、オペレーティングシステムレベルで PCIe-SSD から構築する こともできます。フェールセーフを高めるには、RAID 1 を使用します。ライトプロファイルにそれほど特 化していない負荷プロファイルでは、この RAID レベルでアクセスのリード比率のパフォーマンスを高める こともできます。フェールセーフよりもパフォーマンスの高さを重視するアプリケーションでは、2 つの PCIe-SSD から RAID 0 アレイを構築することもできます。ここからは、単体の PCIe-SSD(ここでは 1.2 TB バージョンを例として使用)におけるさまざまな負荷強度に対応する RAID 構成を、5 つの標準負荷 プロファイルでそれぞれ比較します。 「データベース」負荷プロファイル(ラン ダムアクセス、67 % リード、8 KB ブロ ックサイズ)の場合、最低の負荷強度では、 RAID 1 ア レ イ (  ) と RAID 0 ア レ イ ()は単体 PCIe-SSD()と同じトラ ンザクションレート、約 8000~9000 IO/s になります。負荷強度が処理待ち IO = 512 まで上昇すると、トランザクションレ ートは次第に離れた値になります。単体 PCIe-SSD()は約 50000 IO/s、RAID 1 アレイ()は約 60000 IO/s、RAID 0 ア レイ()は約 68000 IO/s まで上昇しま す。 「ファイルサーバ」負荷プロファイル(ラ ンダムアクセス、67 %リード、64 KB ブ ロックサイズ)の場合、両方の RAID アレ イ( と )のトランザクションレート は、最低の負荷強度において約 5000 IO/s で、単体 PCIe-SSD()とまったく同じ 値になります。負荷強度が上昇すると、両 方の RAID アレイ、単体 PCIe-SSD() のいずれもトランザクションレートが増加 し 続 け ま す 。 最 大 の 負 荷 強 度 で は 、 RAID 0 ア レ イ (  ) は 約 35000 IO/s 、 RAID 1 アレイ()は約 26000 IO/s、単 体 PCIe-SSD()は約 19000 IO/s に到 達します。RAID 1 のトランザクションレ ートは、すべての負荷強度において、常に 単体 PCIe-SSD と RAID 0 のトランザクシ ョンレートの中間に位置します。 0 4000 8000 12000 16000 20000 24000 28000 32000 36000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs 1 × PCIe-SSD RAID 1 RAID 0 - 2

0 10000 20000 30000 40000 50000 60000 70000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs 1 × PCIe-SSD RAID 1 RAID 0 - 2

負荷プロファイル「ファイルサーバ」 フォーマット「出荷時容量」 負荷プロファイル「データベース」 フォーマット「出荷時容量

(12)

「ファイルコピー」負荷プロファイル(ラ ンダムアクセス、50 %リード、64 KB ブ ロックサイズ)の場合も、「ファイルサー バ」負荷プロファイルと同様の結果を示し ます。2 つの RAID アレイ( と )は、 最低の負荷強度で約 6000~7000 IO/s で、 単体 PCIe-SSD()とまったく同じ値で す。負荷強度が上昇すると、両方の RAID アレイ、単体 PCIe-SSD()のいずれも トランザクションレートが増加し続けます。 最大の負荷強度では、RAID 0 アレイ() は約 32000 IO/s、RAID 1 アレイ()は 約 21000 IO/s、単体 PCIe-SSD()は約 18000 IO/s に到達します。RAID 1 のトラ ンザクションレートは、すべての負荷強度 において、常に単体 PCIe-SSD と RAID 0 のトランザクションレートの中間に位置し ます。 「ストリーミング」負荷プロファイル(シ ーケンシャルアクセス、100 %リード、 64 KB ブ ロックサイズ)の場合、 2 つの RAID ア レ イ (  と  ) お よ び 単 体 PCIe-SSD()は、最低の負荷強度では、 データスループットは 400~500 MB/s の 範囲内にあります。負荷強度が処理待ち I/O = 512 まで上昇すると、RAID 0 は最大 2770 MB/s に達し、単体 PCIe-SSD は最大 1390 MB/s に達します。RAID 0 の最大値 は、処理待ち I/O = 32 で到達する値とほぼ 同じになります。単体 PCIe-SSD は、処理 待ち I/O = 16 での最大値にすでに到達して います。RAID 1 のスループットは、処理 待ち I/O = 4 まで単体 PCIe-SSD と同様の 動きを見せ、処理待ち I/O = 約 8 からは RAID 0 とほぼ同じスループットとなりま す。 「リストア」負荷プロファイル(シーケン シャルアクセス、100 %ライト、64 KB ブ ロックサイズ)の場合、単体 PCIe-SSD ()は、処理待ち I/O = 1 で約 760 MB/s に達します。これよりも高い負荷強度では、 約 1030 MB/s の最大スループットに到達 します。RAID 1()のスループットは、 す べ て の 負 荷 強 度 に お い て 、 単 体 PCIe-SSD よりも約 160 MB/s 低い値とな ります。最高値は継続的に RAID 0() で 到 達 さ れ 、 処 理 待 ち I/O = 1 で 約 900 MB/s で、それより高い負荷強度では、 約 1900 MB/s まで急速に上昇します。さ らに負荷強度が高くなると、スループット はわずかに低下して約 1800 MB/s になり ます。 0 300 600 900 1200 1500 1800 2100 1 2 4 8 16 32 64 128 256 512 Thr o u g h p u t [M B /s ] 1 × PCIe-SSD RAID 1 RAID 0 - 2

0 300 600 900 1200 1500 1800 2100 2400 2700 3000 1 2 4 8 16 32 64 128 256 512 Thr o u g h p u t [M B /s ] # Outstanding IOs 1 × PCIe-SSD RAID 1 RAID 0 - 2

0 3000 6000 9000 12000 15000 18000 21000 24000 27000 30000 33000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs 1 × PCIe-SSD RAID 1 RAID 0 - 2

負荷プロファイル「ファイルコピー」 フォーマット「出荷時容量」 負荷プロファイル「ストリーミング」 フォーマット「出荷時容量」 負荷プロファイル「リストア」 フォーマット「出荷時容量」

(13)

4 つの PCIe-SSD

多数の PRIMERGY サーバ 、PRIMERGY RX900 S2 などに最大 4 つの PCIe-SSD を搭載できます。このよ うな場合は、すべての PCIe-SSD から RAID アレイが必ず構築されるわけではありません。ディスク I/O を 作成する複数のプロセスまたはアプリケーションがあり、それらを個別の PCIe-SSD で実行することを希望 する場合がよくあります。このような場合、利用可能なディスク I/O パフォーマンスは、サーバ内の PCIe-SSD の数に応じて異なります。次の 2 つの図は、並列負荷( RAID アレイ以外)で、どちらも PRIMERGY RX900 S2 内にある、単体 PCIe-SSD と 4 つの PCIe-SSD のパフォーマンスの比較例を示して います。各 PCIe-SSD およびその負荷プロファイルの測定方法により作成される負荷強度は、曲線のすべて の点において同一です。各負荷プロファイルに対して、すべての負荷強度(処理待ち I/O の数)の平均スケ ーリング係数(Q)が図に入力されます。 最初の図はランダムアクセスを示しています。前と同じ標準負荷プロファイルを使用しています。「データ ベース」(ランダムアクセス、67 %リード、8 KB ブロックサイズ)、「ファイルサーバ」(ランダムアク セ ス 、 67 % リ ー ド 、 64 KB ブロックサイズ)、 および「ファイルコピー」 ( ラ ン ダ ム ア ク セ ス 、 50 %リード、64 KB ブ ロックサイズ)。 2 番目の図はシーケンシャルアクセスを示しています。ここでも前と同じ標準負荷プロファイルを使用して います。「ストリーミング」(シーケンシャルアクセス、100 %リード、64 KB ブロックサイズ)と「リス トア」(シーケンシャルアクセス、100 % ライト、64 KB ブロックサイズ)。 0 20000 40000 60000 80000 100000 120000 140000 160000 1 2 4 8 16 32 64 128 256 512 1 2 4 8 16 32 64 128 256 512 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs 4 × PCIe-SSDs 1 × PCIe-SSD Database File server File copy

Q = 3.79 Q = 3.65 Q = 3.80

4 × PCIe-SSD 1.2 TB、ランダム負荷プロファイル (Q:負荷プロファイルごとの

をで割った平均

) 1200 1500 1800 2100 2400 2700 3000 3300 3600 Thr o u g h p u t [M B /s ] 4 × PCIe-SSDs 1 × PCIe-SSD Streaming Restore Q = 2.91 Q = 3.90

4 × PCIe-SSD 1.2 TB、シーケンシャル負荷プロファイル (Q:負荷プロファイルごとの

をで割った平均

(14)

全体として、1~4 つの PCIe-SSD のスケーリング係数 Q は、ほとんどの場合 4.00 をわずかに下回ってい ます。4 つの PCIe-SSD が搭載されたサーバでは、トランザクションレートは最大 155527 IO/s、データス ループットは最大 3165 MB/s が全体として可能です。

公称容量の影響

それ以外はすべて同一ですが、容量バージョン 785 GB~1.2 TB 間のパフォーマンスにも若干の違いがあり ます。次の図では PRIMERGY RX300 S7 に搭載された単一 PCIe-SSD でのこの違いを示しています。 容量が大きいバージョンの利点は、ライト比率のある負荷プロファイルでより顕著な傾向があります。この ような場合、通常、この利点は 4 %~10 %の間です。 0 2000 4000 6000 8000 10000 12000 14000 16000 18000 20000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs 1.2TB 785GB

0 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 55000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs 1.2TB 785GB

負荷プロファイル「データベース」 フォーマット「出荷時容量」 負荷プロファイル「ファイルサーバ」 フォーマット「出荷時容量」

(15)

600 700 800 900 1000 1100 Thr o u g h p u t [M B /s ]

0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 1 2 4 8 16 32 64 128 256 512 Thr o u g h p u t [M B /s ] # Outstanding IOs 1.2TB 785GB

0 2000 4000 6000 8000 10000 12000 14000 16000 18000 20000 1 2 4 8 16 32 64 128 256 512 Tr a n s a c tion r a te [ IO/ s ] # Outstanding IOs 1.2TB 785GB

負荷プロファイル「ファイルコピー」 フォーマット「出荷時容量」 負荷プロファイル「ストリーミング」 フォーマット「出荷時容量」 負荷プロファイル「リストア」 フォーマット「出荷時容量」

(16)

ベストプラクティス

サーバのすべての I/O コンポーネントと同様に、PCIe-SSD もサーバのハードウェア条件に依存します。特 にプロセッサ、メインメモリ、および PCIe バスはここで重要な役割を果たします。サーバの選択、構成、 および設定が適切な場合は、PCIe-SSD のパフォーマンスが改善されます。

現在のプロセッサ周波数の最適化

実際のプロセッサ周波数は、PCIe-SSD のパフォーマンスに影響を与えます。PRIMERGY システムにでき る限り高い公称周波数のプロセッサタイプが搭載されていることが理想的です。しかし、最近のプロセッサ はターボモードや省電力機能などのテクノロジーを使用して、公称周波数と比較して実際の周波数を一時的 に増減できるため、公称周波数自体はそれほど重要ではありません。削減は 、演算処理要件の低いアプリ ケーションなどで発生します。アプリケーションで省電力よりもパフォーマンスが重要である場合は、この 周波数の低減は設定を変更することで防止できます。次の例は、CPU 周波数の最適化により実現できるパ フォーマンス効果を説明しています。 測定する最初の点は、高い公称周波数のプロセッサを選択することによる影響です。この目的で、次の図で は適切な BIOS とオペレーティングシステム設定(「測定環境」のリストを参照)を最高のパフォーマンス となるように調整した PRIMERGY RX300 S7 に搭載された PCIe-SSD 1.2 TB を測定しています。この図で は、選択した負荷プロファイルに対する、1.8 GHz の CPU と 3.3 GHz の CPU のデータスループットを比 較しています。 図は 8 KB までのブロックサイズでは、高い公称周波数によって大幅な改善が見られることを示しています。 低い公称 CPU 周波数は、リード/ライトアクセス混合の負荷プロファイル、および大きなブロックサイズ に対しては何も影響がありません。 図ではランダムアクセスは単に例として選択されており、図に示す情報はシーケンシャルアクセスにも適用 されます。 0 30000 60000 90000 120000 150000 4 kB 8 kB 64 kB 4 kB 8 kB 64 kB 4 kB 8 kB 64 kB Tr a n s a c tion r a te [ IO/ s ] 1.8 GHz 3.3 GHz 67% read 0% read 100% read 2 つの CPU 周波数の PCIe-SSD(1.2 TB)の最大トランザクションレート さまざまなライト共有とブロックサイズ、ランダムアクセス

(17)

2 番目の点として、次の図では低いプロセッサ使用率による CPU 周波数の一時的な低下の影響を測定して います。図に示すデータ系列は次を表しています。  デフォルト設定、低いプロセッサ使用率(デフォルト)  デフォルト設定、平均プロセッサ使用率(デフォルト + CPU 負荷)  パフォーマンス設定、低いプロセッサ使用率(パフォーマンス) 「デフォルト」および「パフォーマンス」は、「測定環境」に記載される BIOS とオペレーティングシステ ム設定を指します。 この図は、プロセッサ使用率が低い状況で、最大 CPU 周波数を引き起こすことで、パフォーマンスの向上 を達成できることを示しています。小さなブロックサイズのリード優位の負荷プロファイル(≤ 8 KB)では、 3 倍以上のパフォーマンスの向上を見ることができます。2 通りの方法で最大 CPU 周波数を引き起こすこ とができます。最適なパフォーマンス設定を選択するか(「パフォーマンス」)、PCIe-SSD の割り込みを 処理する CPU に適切なプロセスを割り当てます(「デフォルト + CPU 負荷」)。この割り当てられたプ ロセスには、特定の最小演算処理要件が必要です。しかし、その CPU はピーク負荷状況に影響されない必 要があります。「パフォーマンス」の場合、BIOS パラメータ「Frequency Floor Override」により、CPU は常に最大周波数で機能します。「デフォルト + CPU 負荷」の場合、これはプロセスで実行されます。 この影響は、大きなブロックサイズのライト優位のアクセスではわずかなものでしかありません。 この図でもランダムアクセスは単に例として選択されており、図に示す情報はシーケンシャルアクセスにも 適用されます。 0 30000 60000 90000 120000 150000 4 kB 8 kB 64 kB 4 kB 8 kB 64 kB 4 kB 8 kB 64 kB T ran s ac tion rat e [I O/ s ] Default

Default + CPU load Performance

67% read 0% read 100 %read

さまざまな設定の PCIe-SSD(1.2 TB)の最大トランザクションレート さまざまなライト共有とブロックサイズ、ランダムアクセス

(18)

プロセッサ割り当ての最適化

ディスク I/O を最適な CPU に作成するプロセスの割り当ては、PCIe-SSD のパフォーマンスに大きな影響 を与えます。この割り当ては、Windows オペレーティングシステムでは 、「start /affinity」またはタスク マネージャーを使用してプロセスを開始することで実行でき 、Linux ではこの目的にユーティリティ 「numactl」を使用します。最適な CPU は、PCIe-SSD の割り込みを処理する CPU です。次の図は、 PRIMERGY RX300 S7 に搭載された PCIe-SSD 1.2 TB において「適切な CPU」(この場合は CPU 0)と 「不適切な CPU」(この場合は CPU 1)の状況を比較しています。 ライト率が非常に高い負荷プロファイルでは、適切なプロセッサ割り当てが影響することが明白です。この 影響は、8 KB のブロックサイズで最も顕著です。この場合、最大 80 %パフォーマンスが向上します。大き なブロックサイズにおいても大きな影響があります。 この図でもランダムアクセスは単に例として選択されており、図に示す情報はシーケンシャルアクセスにも 適用されます。

サーバの選択

サーバの選択も PCIe-SSD のパフォーマンスに重要な役割を果たします。次の図は、いずれも PCIe-SSD 1.2 TB を搭載した PRIMERGY RX300 S7(Intel Xeon E5-2600/4600 プロセッサファミリーをベース)と PRIMERGY RX900 S2(Intel Xeon E7-4800/8800 プロセッサファミリーをベース)を比較していま す。この図では、リード比率が 100 %、67 %、 0 %を占めるランダム負荷プロファイルの最大値 の例を比較しています。シーケンシャル負荷プロ ファイルの場合も、結果はほぼ同一です。選択し たブロックサイズ(64 KB)により、プロセッサ 周波数の違いが考慮されないようにします。これ はブロックサイズが小さい場合にのみ行われます。 E5-2600/4600 プロセッサファミリーをベースと するサーバは、そのアーキテクチャーのため、特 にライト率が非常に高い負荷プロファイルにおい て明らかな利点があります。一方、E7-4800/8800 プロセッサファミリーをベースとするサーバは、 最大 4 つの PCIe-SSD まで対応するため、サーバ ごとのパフォーマンスがより大きくなります。こ のように、例えば、PRIMERGY RX900 S2 では、 「データベース」負荷プロファイルでは最大 155000 IO/s、「ストリーミング」負荷プロファイルでは最大 3170 MB/s が可能です。一方、PRIMERGY RX300 S7 では、それぞれの対応する最大値は 68000 IO/s と 0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 4 kB 8 kB 64 kB 256 kB 4 kB 8 kB 64 kB 128 kB 4 kB 8 kB 64 kB 256 kB Thr o u g h p u t [M B /s ] Affinity to CPU 0 Affinity to CPU 1 67% read 0% read 100% read 0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500

100% read 67% read 0% read

Thr o u g h p u t [M B /s ] RX300 S7 RX900 S2 RX300 S7 および RX900 S2 における PCIe-SSD(1.2 TB)の最大スループット 64 KB ブロックサイズ、ランダムアクセス 2 つの CPU 割り当ての PCIe-SSD(1.2 TB)の最大スループット さまざまなライト共有とブロックサイズ、ランダムアクセス

(19)

他のストレージ媒体との比較

ここでは、ioDrive®

2 PCIe-SSD をその先行世代、および従来のドライブベイで現在使用できる他のストレ ージメディア、標準 SAS-2.0 ハードディスク(SAS-2.0-HDD)と SAS-2.0-SSD と比較します。

以下の表は、これまで使用してきた 5 つの標準負荷プロファイルに基づいて、4 つのストレージ媒体のパフ ォーマンス値を比較したものです。 処理待ち IO = 1~512 における最大パフォーマンス 負荷 プロファイル SAS-2.0-HDD 146 GB、 15 krpm、 2.5ディスク キャッシュ 有効 SAS-2.0-SSD MLC 200 GB 2.5ディスク キャッシュ 有効 PCIe-SSD ioDrive® 640 GB フォーマット 「標準容量」 PCIe-SSD ioDrive®2 1.2 TB フォーマット 「出荷時容 量」 比率 PCIe-SSD ioDrive®2 SAS-2.0- HDD 比率 PCIe-SSD ioDrive®2 SAS-2.0- SSD 比率 PCIe-SSD ioDrive®2 PCIe-SSD ioDrive®

データベース 706 IO/s 14184 IO/s 28653 IO/s 49919 IO/s 70.71 3.52 1.74 ファイルサーバ 591 IO/s 3006 IO/s 8003 IO/s 19005 IO/s 32.16 6.32 2.37 ファイルコピー 571 IO/s 2985 IO/s 7693 IO/s 18018 IO/s 31.55 6.04 2.34 ストリーミング 192 MB/s 377 MB/s 617 MB/s 1390 MB/s 7.24 3.69 2.25 リストア 191 MB/s 196 MB/s 541 MB/s 1037 MB/s 5.43 5.29 1.92

表に示すように、ioDrive®

2 PCIe-SSD が達成できるパフォーマンス値は、負荷プロファイルに応じて、 ioDrive® の先行世代と比較して最大 2.3 倍以上、SAS-2.0-SSD の約 3.5 倍、SAS-2.0-HDD の 70 倍以上で あることがわかります。 次の表は、小さいブロックの読み取りおよび書き込み時の最小レイテンシ時間を比較しています。 負荷 プロファイル SAS-2.0-HDD 146 GB、 15 krpm、 2.5ディスク キャッシュ 有効 SAS-2.0-SSD MLC 200 GB 2.5ディスク キャッシュ 有効 PCIe-SSD ioDrive® 640 GB フォーマット 「標準容量」 PCIe-SSD ioDrive®2 1.2 TB フォーマット 「出荷時容 量」 読み取りレイテンシ (1 KB シーケンシャル) 0.089 ms 0.090 ms 0.029 ms 0.066 ms 書き込みレイテンシ (1 KB シーケンシャル) 0.098 ms 0.128 ms 0.033 ms 0.018 ms 全体として、最小書き込みレイテンシ(0.018 ms)は、ioDrive® 2 PCIe-SSD が、比較したその他のストレ ージメディアよりも明らかに低い値を示しています。

(20)

結論

ioDrive®2 PCIe-SSD は高度な非揮発性ストレージメディアで、小さいスペースにおいて、特にトランザク ション数の多い I/O アクセスで非常に優れたパフォーマンスを実現できます。先行世代のパフォーマンスと 比較して、最大トランザクションレートおよび最大データスループットどちらにおいても約 2 倍向上してい ます。ioDrive® 2 PCIe-SSD は 、例えば、通常のデータベースのアクセスにおけるトランザクションレート は最大約 50000 IO/s、ビデオストリーミングなどのシーケンシャルリードアクセスにおけるデータスループ ットは最大 1390 MB/s を実現します。 オペレーティングシステムにおける RAID アレイの構成、またはこれらのストレージメディアの独立した稼 働 に よ り 、 サ ー バ ご と の デ ィ ス ク I/O パ フ ォ ー マ ン ス は さ ら に 向 上 す る こ と が 可 能 で す 。 複 数 の PRIMERGY サーバで、最大 4 つの PCIe-SSD を稼働できます。 ブロックサイズの小さい負荷プロファイルで、特にアクセスがリード率またはライト率でほぼ占有されてい る場合、このストレージメディアのディスク I/O パフォーマンスを最適化するには、プロセッサ周波数の調 整が効果的です。 特定の条件下では、ディスク I/O を作成するアプリケーションのプロセッサ割り当ての調整も、ライト率の 高いアクセスでは効果的です。後者の調整は、特にブロックの小さいアクセスプロファイルで、アプリケー ションを常時、確実に最適なプロセッサ上で稼働させるために必要な場合があります。 また、システムの選択時にプロセッサのアーキテクチャーを考慮することも重要です。

(21)

関連資料

PRIMERGY システム http://primergy.com/ PRIMERGY のパフォーマンス http://www.fujitsu.com/fts/products/computing/servers/primergy/benchmarks/ ディスク I/O パフォーマンスの基本 http://docs.ts.fujitsu.com/dl.aspx?id=35801735-a223-491a-a879-43f506444366 Fusion-io® ioDrive®2 ソリッドステートストレージデバイス データシート(英語) http://docs.ts.fujitsu.com/dl.aspx?id=cb40337c-4292-44fe-ac8f-50a96bc653e1 Fusion-io® ioDrive® ソリッドステートストレージデバイス(先行世代) データシート(英語) http://docs.ts.fujitsu.com/dl.aspx?id=fbbf6a0c-1210-4c23-8df7-081401e9444d パフォーマンスレポート PCIe-SSD http://docs.ts.fujitsu.com/dl.aspx?id=35a81c62-eafb-414d-aab3-416aecf39d3c Iometer についての情報 http://www.iometer.org/ PC サーバ PRIMERGY(プライマジー) http://jp.fujitsu.com/platform/server/primergy/

お問い合わせ先

富士通 Web サイト:http://jp.fujitsu.com/ PRIMERGY のパフォーマンスとベンチマーク mailto:primergy.benchmark@ts.fujitsu.com

参照

関連したドキュメント

それゆえ、この条件下では光学的性質はもっぱら媒質の誘電率で決まる。ここではこのよ

弊社または関係会社は本製品および関連情報につき、明示または黙示を問わず、いかなる権利を許諾するものでもなく、またそれらの市場適応性

・本計画は都市計画に関する基本的な方 針を定めるもので、各事業の具体的な

※お寄せいた だいた個人情 報は、企 画の 参考およびプ レゼントの 発 送に利用し、そ れ以外では利

Oracle の Sun Storage 16 Gb Fibre Channel PCIe Universal Host Bus Adapter (HBA) (パーツ番号 7101674) は、QLogic テクノロジを使用したスタンドアロンの PCIe ロー

しかしながら、世の中には相当情報がはんらんしておりまして、中には怪しいような情 報もあります。先ほど芳住先生からお話があったのは

(a) ケースは、特定の物品を収納するために特に製作しも

日本でコルク製品というとコースター、コルクマット及びコルクボードなど平面的な製品が思い付く ことと考えますが、1960