要約
このドキュメントでは、PRIMERGY RX300 S5 で実行したベンチマークの概要について説明します。 PRIMERGY RX300 S5 のパフォーマンスデータを、他の PRIMERGY モデルと比較して説明しています。 ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています。 目次 ドキュメントの履歴 ... 2 製品データ ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 15 StorageBench ... 20 SPECsfs2008 ... 31 OLTP-2 ... 35 TPC-E ... 41 SAP SD ... 44 ターミナルサーバ ... 50 vServCon ... 56 VMmark... 62 関連資料... 65 お問い合わせ先 ... 66 ページ数 66パフォーマンスレポート
PRIMERGY RX300 S5
ドキュメントの履歴
バージョン 2.0 ベンチマークの章を含むレポートの初版 SPECcpu2006 Xeon E5502、E5504、L5506、E5506、L5520、E5520、L5530、E5530、E5540、X5550、X5560、 X5570、および W5590 で測定 SPECjbb2005 Xeon E5506、E5520、X5570、および W5590 で測定 StorageBench「LSI MegaRAID 8 ポートベースの RAID 0/1 SAS」コントローラーで測定 「LSI MegaRAID ベースの RAID 5/6 SAS」コントローラーで測定
SPECsfs2008
Xeon X5570、96 GB RAM および 2×5 データディスク(146 GB、10000 rpm)RAID 5 で測定 OLTP-2 Xeon E5502、E5504、E5506、E5520、L5530、E5530、E5540、X5550、X5570、および W5590 で 測定 TPC-E Xeon X5570 で測定 SAP SD
Xeon X5570 および SAP ECC リリース 6.0 で測定
Xeon X5570 および SAP Business Suite ソフトウェア、SAP ERP 6.0(Unicode)用 SAP 拡張パッ ケージ 4 で測定 ターミナルサーバ Xeon E5504、X5570 で測定 vServCon Xeon L5520、E5520、E5540、X5550、および X5570 で測定 バージョン 2.1a 新規ベンチマークの章: VMmark Xeon W5590 で測定 ベンチマークの章を更新: SPECcpu2006 o Xeon E5502、E5504、E5506、E5530、X5560、W5590 で追加測定 StorageBench 「RAID Ctrl SAS 5/6 512MB(D2616)」コントローラーで追加測定 SAP SD
o Xeon X5570、VMware ESX Server 4.0 上の SUSE Linux Enterprise Server 10 で、SAP Business Suite ソフトウェア SAP Enhancement Package 4 for SAP ERP 6.0(Unicode)および MaxDB 7.8 で測定
ターミナルサーバ (関連資料) vServCon(訂正)
© Fujitsu Technology Solutions 2009-2010 3/66 ページ
製品データ
PRIMERGY RX300 S5 は、高さ僅か 2U の省スペース 2 ソケットラックサーバで、PRIMERGY RX300 S4 の 後継製品です。インテル 5520 チップセット、2 つのインテルデュアルコアまたはクアッドコア Xeon プロセッ サ、最大 144 GB PC3-10600 または PC3-8500 Registered ECC DDR3-SDRAM、800、1067、または 1333 MHz タイミングのバス(使用するプロセッサによって異なる)、最大 8 台の内蔵 SATA または SAS ハードディス クに対応する RAID 0 / RAID 1 の SAS コントローラー、または最大 12 台の内蔵 SATA または SAS ハードディ スクに対応する RAID 5 / RAID 6 の SAS コントローラー、オンボード 2 ポート 1-GBit イーサネットコントロー ラー、および 7 PCI スロット(2 PCI Express 2.0 (x8 レーン) [8 ソケット]および 5 PCI Express 2.0 (x4 レーン) [8 ソケット])を装備しています。
SPECcpu2006
ベンチマークの説明
SPECcpu2006 は、整数演算および浮動小数点演算のシステム性能を測定するベンチマークです。これは、 12 本のアプリケーションから成る整数演算テストセット、および 17 本 のアプリケーションから成る浮動小 数点演算テストセットで構成されています。これらのアプリケーションは大量の演算を実行する CPU / メモ リ集中型です。ディスク I/O やネットワークなど、他のコンポーネントについては、このベンチマークでは 測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード として利用可能で、実際のベンチマークの前にコンパイルされます。したがって、使用するコンパイラーの バージョンやその最適化設定が測定結果に影響を与えます。 SPECcpu2006 には、次の 2 つのパフォーマンス測定方法が含まれています。最初の方法(SPECint2006 お よび SPECfp2006)は、1 つのタスクの完了に必要な時間を判定します。次の方法(SPECint_rate2006 およ び SPECfp_rate2006)は、スループット(並列処理できるタスク数)を判定します。いずれの方法も、さら に 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これは、コンパイラー最適化を使用するか どうかという点で異なります。「ベース」値は常に公開されていますが、「ピーク」値はオプションです。 ベンチマーク 演算 タイプ コンパイラー 最適化 測定結果 アプリケーション SPECint2006 整数 ピーク アグレッシブ 速度 単体実行 SPECint_base2006 整数 ベース 標準 SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行 SPECint_rate_base2006 整数 ベース 標準 SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行 SPECfp_base2006 浮動小数点 ベース 標準 SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行 SPECfp_rate_base2006 浮動小数点 ベース 標準 結果は、個々のベンチマークで得られた正規化比の幾何平均を使用しています。算術平均と比較して、幾何 平均のほうが、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムが基 準システムと比較してどの程度高速に実行されるのかを測定することです。基準システムの SPECint_base2006、 SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結果が、値「1」と判定さ れたとします。このとき、たとえば SPECint_base2006 の値 2 は、測定システムがこのベンチマークを基準 システムよりも約 2 倍の性能で実行したことを意味します。SPECfp_rate_base2006 の値 4 は、測定対象シ ステムが基準システムよりも、約 4/[ベースコピー数] 倍の性能でこのベンチマークを実行したことを意味し ます。ここで、「ベースコピー数」はベンチマークで実行された並行インスタンスの数です。 弊社は、SPEC の公開用に、 SPECcpu2006 を測定したデータのすべてを提出しているわけではありません。 このため、すべての結果が SPEC の Web サイトに表示されるわけではありません。弊社は、すべての測定 値のログデータをアーカイブしているので、測定値が出せたことをいつでも証明できます。 SPEC®、SPECint®、SPECfp®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC) の登録商標です。
© Fujitsu Technology Solutions 2009-2010 5/66 ページ
ベンチマーク結果
PRIMERGY TX300 S5(PRIMERGY RX300 S5 と同仕様)は、Xeon E5502、E5504、L5506、E5506、L5520、 E5520、L5530、E5530、E5540、X5550、X5560、X5570、および W5590 の各プロセッサを使用して測定 しました。ベンチマークプログラムは、インテル C++/Fortran コンパイラー 11.0 でコンパイルし、SUSE Linux Enterprise Server 10 SP2(64 ビット)で実行しました。次の表の太字の値は、http://www.spec.org で公開 されています。「予測」という印付きの値は、予測値です。 プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 18.0 19.9 Xeon E5504 4 2 4 MB 800 MHz 80 W 19.2 21.3 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 20.2(予測) 22.5(予測) Xeon E5506 4 2.13 4 MB 800 MHz 80 W 20.2 22.5 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 24.5(予測) 27.3(予測) Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 24.5 27.3 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 25.6(予測) 28.5(予測) Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 25.6 28.5 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 26.7 29.7 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 29.5 32.9 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 30.6 34.0 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 32.1 36.1 Xeon W5590 4 3.33 8 MB 1333 MHz 130 W 33.9 37.7
プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 33.4 65.3 35.9 70.4 Xeon E5504 4 2 4 MB 800 MHz 80 W 64.6 126 69.2 135 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 67.5(予測) 132 72.2(予測) 142 Xeon E5506 4 2.13 4 MB 800 MHz 80 W 67.5 131 72.2 141 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 95.7(予測) 186 102(予測) 200 Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 95.7 185 102 200 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 99.1(予測) 192 106(予測) 207 Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 99.1 192 106 207 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 102 198 110 214 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 115 226 124 243 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 119 230 127 247 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 122 240 130 257 Xeon W5590 4 3.33 8 MB 1333 MHz 130 W 130 255 140 274
© Fujitsu Technology Solutions 2009-2010 7/66 ページ プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 21.9 23.2 Xeon E5504 4 2 4 MB 800 MHz 80 W 23.5 25.1 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 24.7(予測) 26.3(予測) Xeon E5506 4 2.13 4 MB 800 MHz 80 W 24.7 26.3 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 29.6(予測) 31.5(予測) Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 29.6 31.5 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 31.0(予測) 32.9(予測) Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 31.0 32.9 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 31.8 33.9 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 35.8 38.0 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 36.8 39.1 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 38.1 40.7 Xeon W5590 4 3.33 8 MB 1333 MHz 130 W 40.1 42.8
プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 34.8 66.5 36.1 69.4 Xeon E5504 4 2 4 MB 800 MHz 80 W 57.5 111 59.6 115 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 59.4(予測) 115 61.6(予測) 119 Xeon E5506 4 2.13 4 MB 800 MHz 80 W 59.4 114 61.6 119 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 79.1(予測) 153 81.8(予測) 158 Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 79.1 154 81.8 159 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 81.5(予測) 158 84.2(予測) 164 Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 81.5 158 84.2 164 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 83.5 162 86.4 168 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 95.9 184 99.1 191 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 97.6 189 101 195 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 99.0 193 103 200 Xeon W5590 4 3.33 8 MB 1333 MHz 130 W 105 204 108 211
© Fujitsu Technology Solutions 2009-2010 9/66 ページ 2009 年 3 月 31 日、PRIMERGY RX300 S5 は SPECint_rate_base2006、SPECint_rate2006、 SPECfp_rate_base2006、および SPECfp_rate2006 ベンチマークの 2 ソケットサーバにおいて第 1 位を達成 しました。1 2 1 上記の競争力のあるベンチマーク結果は 2009 年 3 月 31 日時点で公開された結果を反映しています。上記の比較は、 Dell および富士通が現在出荷している中でベストパフォーマンスの 2 ソケットサーバで比較しています。 SPECint_rate_base2006 および SPECint_rate2006 によるベンチマーク結果については、 http://www.spec.org/cpu2006/results を参照してください。 2 上記の競争力のあるベンチマーク結果は 2009 年 3 月 31 日時点で公開された結果を反映しています。上記の比較は、 Supermicro および富士通が現在出荷している中でベストパフォーマンスの 2 ソケットサーバで比較しています。 SPECfp_rate_base2006 および SPECfp_rate2006 によるベンチマーク結果については、 http://www.spec.org/cpu2006/results を参照してください。
2009 年 8 月 18 日、PRIMERGY RX300 S5 は SPECint_rate_base2006、SPECint_rate2006、 SPECfp_rate_base2006、および SPECfp_rate2006 ベンチマークの 2 ソケットサーバにおいて第 1 位を達成 しました。1 2 1 上記の競争力のあるベンチマーク結果は 2009 年 8 月 18 日時点で公開された結果を反映しています。上記の比較は、 ASUSTek および富士通が現在出荷している中でベストパフォーマンスの 2 ソケットサーバで比較しています。 SPECint_rate_base2006 および SPECint_rate2006 によるベンチマーク結果については、 http://www.spec.org/cpu2006/results を参照してください。 2 上記の競争力のあるベンチマーク結果は 2009 年 8 月 18 日時点で公開された結果を反映しています。上記の比較は、 ASUSTek および富士通が現在出荷している中でベストパフォーマンスの 2 ソケットサーバで比較しています。 SPECfp_rate_base2006 および SPECfp_rate2006 によるベンチマーク結果については、 http://www.spec.org/cpu2006/results を参照してください。
© Fujitsu Technology Solutions 2009-2010 11/66 ページ 整数演算テストセットおよび浮動小数点演算テストセットの両方で、2 プロセッサのスループットは 1 プロ セッサの約 2 倍です。
下の図は、PRIMERGY RX300 S5 のパフォーマンスを先行モデルの PRIMERGY RX300 S4 と比較していま す。両方とも最高パフォーマンス構成での比較です。
ベンチマーク環境
SPECcpu2006 での測定は、すべて次のハードウェアおよびソフトウェア構成の PRIMERGY TX300 S5 で実 行されました。
ハードウェア
モデル PRIMERGY TX300 S5
CPU Xeon E5502、E5504、L5506、E5506、L5520、E5520、L5530、E5530、E5540、 X5550、X5560、X5570、および W5590 CPU 数 1 チップ: Xeon E5502: 2 コア、2 コア/チップ その他: 4 コア、4 コア/チップ 2 チップ: Xeon E5502: 4 コア、2 コア/チップ その他: 8 コア、4 コア/チップ プライマリ キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ、コアごと セカンダリ キャッシュ 256 KB オンチップ、コアごと その他の キャッシュ
Xeon E5502、E5504、L5506、および E5506:
4 MB(I+D)オンチップ、チップごと
その他: 8 MB(I+D)オンチップ、チップごと
メモリ DDR3-SDRAM
ソフトウェア オペレーティング
システム SUSE Linux Enterprise Server 10 SP2(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 11.0
PRIMERGY TX300 S5 と PRIMERGY RX300 S5 は、仕様上は同じです。
© Fujitsu Technology Solutions 2009-2010 15/66 ページ
SPECjbb2005
ベンチマークの説明
SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークで す。これは、本質的に SPECjbb2000 を更新したバージョンで、主な違いは次のとおりです。 トランザクションは、多様な機能範囲を対象とするため、より複雑になっています。 ベンチマークのワーキングセットが、全体的にシステムの負荷の増大に対応して拡大されました。 SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実際との高い近似性を 得ることができます。 ソフトウェア側では、SPECjbb2005 は JVM、JIT(ジャストインタイム)コンパイラー、ガベージコレクション、 スレッドなどのオペレーティングシステムの機能を評価します。ハードウェアに関する限り、SPECjbb2005 は CPU およびキャッシュの効率、メモリサブシステム、共有メモリシステム(SMP)のスケーラビリティを 測定します。ディスクおよびネットワーク I/O は無関係です。 SPECjbb2005 は、中間層システムを強調する最近の代表的なビジネスプロセスアプリケーションをエミュレー トする 3 階層のクライアント/サーバシステムです。 クライアントは、TPC-C ベンチマークのドライバスレッドであり、データベースへのアクセスは思 考時間をゼロにして負荷を生成します。 中間層システムは、ビジネスプロセスおよびデータベースの更新を実装します。 データベースは、データ管理を担当し、メモリ内の Java オブジェクトによりエミュレートされます。 トランザクションのログ記録は XML ベースで実装されます。 このベンチマークの主な利点は、シングルホスト上で実行される 3 つの層すべてを含んでいることです。中 間層のパフォーマンスが測定されるため、大規模なハードウェアの設置は不要となり、SPECjbb2005 の異な るシステム間の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記述さ れています。
SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能を備えた Java 仮想マシンのみが必要です。 このウェアハウスのスケーリングは、約 25 MB の Java オブジェクトです。ウェアハウスあたり 1 つの Java スレッドがこれらのオブジェクトのオペレーションを実行します。これらのビジネスオペレーションは TPC-C で次の項目を前提としています。 新規オーダーエントリー 支払 オーダーステータスの照会 納入 在庫レベル監視 顧客レポート ただし、これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません。2 つのベンチマーク結 果は比較できません。 SPECjbb2005 には、次の 2 つの性能指標があります。 bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーションの 性能です。 bops/JVM は、最初の性能指標とアクティブな JVM インスタンス数の比率です。
SPEC®、SPECjbb®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC)の登録商標 です。
SPECjbb2005 のさまざまな結果の比較では、両方の性能指標を掲載する必要があります。 ベンチマーク測定が準拠すべき以下のルールは、この性能指標の土台となるものです。 ベンチマーク測定は、ウェアハウス数(つまりスレッド数)が増加する一連の測定ポイントで構成され、各 ケースでウェアハウスが 1 だけ増加します。測定は、1 ウェアハウスで開始され、2*MaxWh まで(尐なくと も 8 ウェアハウス)行います。MaxWh は、ベンチマークで予想される、秒あたりの最高オペレーションレー トでのウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数 と同等として、ベンチマークで扱われます。
性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定済みオペレーション 速度の算術平均です。
ベンチマーク結果
2009 年 3 月、PRIMERGY RX300 S5 と仕様が同等の PRIMERGY TX300 S5 を、2 つの Xeon X5570 プロセッ サと 1 つの 24 GB PC3-10600R DDR3-SDRAM メモリを使用して測定しました。測定には、Windows Server 2008 Enterprise x64 Edition を使用しました。Oracle から提供されている JRockit(R) 6 R28.0.0(ビルド P28.0.0-14-111048-1.6.0_05-20090303-1104-windows-x86_64)の 2 つのインスタンスを測定用 JVM として 使用しました。ベンチマーク結果には、8~16 個までのウェアハウスの全測定値が含まれています。 2009 年 5 月、2 つのプロセッサ、Xeon E5506 および E5520 を使用して PRIMERGY TX300 S5 を測定しま した。2009 年 3 月の測定値と比較するために、Windows Server 2008 Enterprise x64 Edition SP2 および新 しい JVM バージョンを使用しました。Xeon E5506 では、Oracle から提供されている JRockit(R) 6 P28.0.0 (ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64)の 2 つのインスタンスを使用し、 Xeon E5520 では、4 つのインスタンスを使用しました。4~8 個までのウェアハウスの全測定値がベンチマー ク結果に含まれています。
2009 年 8 月に、2 つの Xeon W5590 プロセッサと 48 GB PC3-10600R DDR3-SDRAM のメモリ構成を使用 して、PRIMERGY TX300 S5 を測定しました。それ以外の構成は、Xeon E5520 で 2009 年 5 月の測定に対 応しています。ここでは、PRIMERGY TX300 S5 と PRIMERGY RX300 S5 はすべての 2 ソケットサーバで 最高の結果を達成しました。 上記の競争力のあるベンチマーク結果は 2009 年 8 月 26 日時点で公開された結果を反映しています。上記の比較は、 IBM および富士通が現在出荷している 2 プロセッサの中でベストパフォーマンスサーバに基づいています。最新の PECjbb2005 ベンチマーク結果については、http://www.spec.org/jbb2005/results を参照してください。
© Fujitsu Technology Solutions 2009-2010 17/66 ページ PRIMERGY RX300 S5 をその先行モデルの PRIMERGY RX300 S4 と比較すると、スループットは各トップ パフォーマンス構成で +65 %向上しています。
ベンチマーク環境
SPECjbb2005 でのすべての測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY TX300 S5 で 実行されました。 2009 年 3 月の測定: ハードウェア モデル PRIMERGY TX300 S5 CPU Xeon X5570 チップ数 2 チップ、8 コア、4 コア、チップごと プライマリキャッシュ 32 KB(命令) + 32 KB(データ)オンチップ、コアごと セカンダリキャッシュ 256 KB(I+D)オンチップ、コアごと その他のキャッシュ 8 MB(I+D)オンチップ、チップごと メモリ 6×4 GB PC3-10600R DDR3-SDRAM ソフトウェア オペレーティングシステム Windows Server 2008 Enterprise x64 Edition
JVM バージョン (ビルド P28.0.0-14-111048-1.6.0_05-20090303-1104-windows-x86_64) Oracle JRockit(R) 6 P28.0.0
2009 年 5 月の測定: ハードウェア
モデル PRIMERGY TX300 S5 CPU Xeon E5506、E5520
チップ数 2 チップ、8 コア、4 コア、チップごと
プライマリキャッシュ 32 KB(命令) + 32 KB(データ)オンチップ、コアごと セカンダリキャッシュ 256 KB(I+D)オンチップ、コアごと
その他のキャッシュ Xeon E5506: 4 MB(I+D)オンチップ、チップごと Xeon E5520: 8 MB(I+D)オンチップ、チップごと メモリ 6×4 GB PC3-10600R DDR3-SDRAM
ソフトウェア オペレーティング
システム Windows Server 2008 Enterprise x64 Edition SP2
JVM バージョン (ビルド P28.0.0-14-111048-1.6.0_05-20090303-1104-windows-x86_64) Oracle JRockit(R) 6 P28.0.0
© Fujitsu Technology Solutions 2009-2010 19/66 ページ 2009 年 8 月の測定: ハードウェア モデル PRIMERGY TX300 S5 CPU Xeon W5590 チップ数 2 チップ、8 コア、4 コア、チップごと プライマリキャッシュ 32 KB(命令) + 32 KB(データ)オンチップ、コアごと セカンダリキャッシュ 256 KB(I+D)オンチップ、コアごと その他のキャッシュ 8 MB(I+D)オンチップ、チップごと メモリ 12×4 GB PC3-10600R DDR3-SDRAM ソフトウェア オペレーティング
システム Windows Server 2008 Enterprise x64 Edition SP2
JVM バージョン (ビルド P28.0.0-14-111048-1.6.0_05-20090303-1104-windows-x86_64) Oracle JRockit(R) 6 P28.0.0
StorageBench
ベンチマークの説明
ディスクサブシステムの能力を評価するために、富士通テクノロジー・ソリューションズ はシステムに接続 されている異なるストレージシステムの比較用に StorageBench というベンチマークを開発しました。この ために、StorageBench はインテルで開発された Iometer という測定ツールと、実際の顧客アプリケーション で発生するであろう負荷プロファイルを組み合わせ、測定シナリオを定義しました。 測定ツール 2001 年末以降、Iometer は http://SourceForge.net のプロジェクトとなり、さまざまなプラットフォームに移 植され、国際的な開発者グループによって強化されています。Iometer は、Windows システムのユーザーイン ターフェースとさまざまなプラットフォームで利用できる、いわゆる「dynamo」で構成されています。この 数年で、これら 2 つのコンポーネントは、 http://www.iometer.org/ または、http://sourceforge.net/projects/iometer から「インテルオープンソースライセンス」でダウンロードできるようになりました。 Iometer は、IO サブシステムへのアクセスについて実際のアプリケーションの動作を再現できます。このた め、特に、使用するブロックサイズ、シーケンシャルリードまたはライト、ランダムリードまたはライト、 およびこれらの組み合わせなど、アクセスの種類を構成できます。また、同時アクセス数(「未処理の IO」) も構成できます。その結果、Iometer は 1 秒あたりのスループット、1 秒あたりのトランザクション数、各ア クセスパターンの平均応答時間などの基本的なパラメーターを含むカンマで区切られた.csv ファイルを生成 します。この方法により、特定のアクセスパターンを使ってさまざまなサブシステムの性能を比較できます。 Iometer は、ファイルシステムを使用して、サブシステムにアクセスできるばかりでなく、いわゆる RAW デ バイスにもアクセスできます。 Iometer では、さまざまなアプリケーションのアクセスパターンをシミュレーションおよび測定できますが、 オペレーティングシステムのファイルキャッシュは考慮されません。また、オペレーションは 1 つのテスト ファイル上のブロック単位です。 負荷プロファイル アプリケーションがマスストレージシステムにアクセスする方法は、ストレージシステムのパフォーマンス に多大な影響を及ぼします。各種アプリケーションのさまざまなアクセスパターンの例: アプリケーション アクセスパターン データベース(データ転送) ランダム、67 %リード、33 %ライト、8 KB(SQL Server) データベース(ログファイル) シーケンシャル、100 %ライト、64 KB ブロック バックアップ シーケンシャル、100 %リード、64 KB ブロック リストア シーケンシャル、100 %ライト、64 KB ブロック ビデオストリーミング シーケンシャル、100 %リード、ブロック ≥ 64 KB ファイルサーバ ランダム、67 %リード、33 %ライト、64 KB ブロック Web サーバ ランダム、100 %リード、64 KB ブロック オペレーティングシステム ランダム、40 %リード、60 %ライト、ブロック ≥ 4 KB ファイルコピー ランダム、50 %リード、50 %ライト、64 KB ブロック これから次の 4 つの独特なプロファイルが派生しました。 負荷プロファイル アクセス アクセスパターン ブロック サイズ 未処理 IO 負荷 ツール リード ライト ストリーミング シーケンシャル 100 % 64 KB 3 Iometer リストア シーケンシャル 100 % 64 KB 3 Iometer データベース ランダム 67 % 33 % 8 KB 3 Iometer ファイルサーバ ランダム 67 % 33 % 64 KB 3 Iometer 4 つのプロファイルはすべて Iometer で生成されました。© Fujitsu Technology Solutions 2009-2010 21/66 ページ 測定シナリオ 比較できる測定結果を得るためには、同一で再現性がある環境ですべての測定を実行することが重要です。 StorageBench が上記の負荷プロファイルに加えて次の規則に基づいているのはこの点にあります。 実際の顧客構成で RAW デバイスを使用するのは例外的な状況のみであるため、内蔵ディスクのパフォー マンス測定はファイルシステムを含むディスク上で常に実行されます。高いパフォーマンスが他のファ
イルシステムや RAW デバイスで実現できる場合でも、Windows では NTFS が使用され、Linux では ext3 が使用されます。
ハードディスクは、コンピュータシステムで最もエラーが発生しやすいコンポーネントです。ハード
ディスクの故障によるデータの損失をなくすためにサーバシステムで RAID コントローラーが使用さ れる理由はここにあります。ここでは、複数のハードディスクを組み合わせて「Redundant Array of Independent Disks」(RAID)を形成し、1 つのハードディスクが故障した場合でもすべてのデータが 維持されるように(RAID 0 を除く)すべてのデータを複数のハードディスクに分散させます。ハード ディスクをアレイで編成する最も一般的な方法は、RAID レベル、RAID 0、RAID 1、RAID 5、RAID 6、 RAID 10、RAID 50、RAID 60 です。各種 RAID アレイの基本については、資料 パフォーマンスレポー
ト - PRIMERGY 用モジュラー RAID を参照してください。
ディスクの数および装着されているコントローラーに応じて、 RAID 構成を変えながら PRIMERGY サー バの StorageBench を測定しました。2 台のハードディスクを装着できるシステムでは RAID 1 およ び RAID 0 を使用し、3 台以上では RAID 1E および RAID 5 を使用します。適用可能な場合はサポー トされていることを条件にさらに上位の RAID レベルを使用します。 ハードディスクのサイズに関係なく、サイズが 8 GB の測定ファイルを常に測定に使用しています。 I/O サブシステムの効率の評価では、プロセッサパフォーマンスおよびメモリ構成は、今日のシステ ムでは大きな要因ではありません。通常、考えられるボトルネックは CPU やメモリではなく、ハー ドディスクや RAID コントローラーに影響を及ぼします。したがって、CPU やメモリの構成を数々 変えながら StorageBench で解析する必要はありません。 測定結果 負荷プロファイルごとに、StorageBench は次のようにさまざまな主要指標を提供します。1 秒あたりのメガ バイト数(MB/s)の「データスループット」、1 秒あたりの I/O オペレーション数(IO/s)の「トランザクション レート」、およびミリ秒(ms)単位の「待機時間」(「平均アクセス時間」)。シーケンシャルな負荷プロファ イルでは、データスループットが通常の指標であり、小規模なブロックサイズを使用するランダムな負荷プ ロファイルでは、通常、トランザクションレートが使用されます。スループットおよびトランザクションレー トは互いに直接比例し、次の式に従って計算できます。 データスループット [MB/s] = トランザクションレート [ディスク-I/O /s] × ブロックサイズ [MB] トランザクションレート [ディスク-I/O /s] = データスループット [MB/s] / ブロック サイズ [MB]
ベンチマーク結果
PRIMERGY RX300 S5 には、Modular RAID ファミリーのコントローラーが搭載されています。各種の RAID ソリューションにより、ユーザーはアプリケーションシナリオに合わせて適切なコントローラーを選択でき ます。
PRIMERGY RX300 S5 には、次の機能を提供する RAID ソリューションがあります。
1. 「LSI MegaRAID 8 ポートベースの RAID 0/1 SAS」コントローラー(LSI MegaRAID SAS 1068) このコントローラーは、PCI Express カードとして供給されています。このコントローラーに接続で きる SATA および SAS ハードディスクの最大数は 8 台です。RAID レベル 0、1、1E に対応してい ます。このコントローラーにはキャッシュがありません。
2. 「LSI MegaRAID ベースの RAID 5/6 SAS」コントローラー(LSI MegaRAID SAS 1078)
このコントローラーは PCI Express カードとして供給され、RAID ソリューション一式を提供します。 SATA と SAS の両方のハードディスクを接続できます。RAID レベル 0、1、5、6、10、50、60 に対 応しています。このコントローラーには、256 MB または 512 MB のキャッシュを備えた 2 つのタイ プがあります。コントローラーのキャッシュは、電源障害に対してオプションのバッテリーバックアッ プユニット(BBU)により保護できます。コントローラーは 240 台までのハードディスクをサポート します。
3. 「RAID Ctrl SAS 5/6 512MB(D2616)」コントローラー(LSI MegaRAID SAS 2108)
このコントローラーは、SAS-2.0 ハードディスクと接続するための 6 Gbps SAS-2.0 インターフェー スをサポートしています。このコントローラーは PCI Express カードとして供給され、RAID ソリュー ション一式を提供します。RAID レベル 0、1、5、6、10、50、60 に対応しています。このコントロー ラーは、512 MB のコントローラーキャッシュが搭載されています。コントローラーのキャッシュは、 電源障害に対してオプションのバッテリーバックアップユニット(BBU)により保護できます。コン トローラーは 240 台までのハードディスクをサポートします。 これらのコントローラーには、さまざまな SATA、SAS、および SAS-2.0 ハードディスクを接続できます。 必要なパフォーマンスに応じて、適切なディスクサブシステムを選択できます。モデルバージョンによりま すが PRIMERGY RX300 S5 では 、3.5 インチハードディスク用の 6 個のホットプラグベイまたは 2.5 インチ ハードディスク用の 8 個もしくは 12 個のホットプラグベイを利用できます。 PRIMERGY RX300 S5 では、次のハードディスクを選択できます。 2.5 インチ SAS ハードディスク、容量 73 GB、146 GB(10 krpm) 2.5 インチ SAS ハードディスク、容量 36 GB、73 GB(15 krpm) 2.5 インチ SAS-2.0 ハードディスク、容量 146 GB、300 GB(10 krpm) 2.5 インチ SAS-2.0 ハードディスク、容量 73 GB、146 GB(15 krpm) 3.5 インチ SAS ハードディスク、容量 73 GB、146 GB、300 GB、450 GB(15 krpm) 3.5 インチ SATA ハードディスク、容量 250 GB、500 GB、750 GB、1 TB(7.2 krpm)
LSI MegaRAID SAS 1068
以下では、LSI MegaRAID SAS 1068 コントローラーで利用可能なハードディスクタイプのパフォーマンスを 比較しています。 このコントローラーには、コントローラーキャッシュがありません。測定を実行するにあたり、ディスクキャッ シュパラメーターの影響のみを測定し、ハードディスク比較の測定は、ディスクキャッシュありなしで実施 した理由はこの点にあります。 ハードディスクキャッシュは ディスク I/O パフォーマンスに影響を及ぼします。多くの場合、これは電源障 害時の安全上の問題として取り上げられ、この理由により無効化されます。ですが、ハードディスクの製造 元は、書き込みパフォーマンスの向上のために組み込んでいます。比較すると SAS ハードディスクの回転数 が遅いため、パフォーマンス上の理由により、特に SATA ハードディスクでディスクキャッシュを有効にし てください。I/O アクセス用のキャッシュが圧倒的に大きく、電源障害時の潜在的な安全上のリスク(データ
© Fujitsu Technology Solutions 2009-2010 23/66 ページ の損失)がメインメモリに存在します。これは、オペレーティングシステムによって管理されます。データ の損失を防止するには、システムに無停電電源装置(UPS)を装備することをお勧めします。 テストでは、2 台のハードディスクをコントローラーに接続し、RAID 1 として構成しました。測定では、 PRIMERGY RX300 S5 で現在利用可能なすべてのハードディスクタイプを解析しました。RAID 1 での各ハー ドディスクタイプのスループットを種々のアクセスパターンを使用して比較します。
この図は、回転数の増加に伴って、64 KB ブロックサイズを使用した LSI MegaRAID SAS 1068 のシーケン シャルリードおよびライトのスループットが増加することを示しています。 シーケンシャルリードの場合、回転数 10 krpm のハードディスクの代わりに 15 krpm のものを使用した場合、 2.5 インチハードディスクでの結果はスループットが約 19 %増加します。回転数が 15 krpm の 2.5 インチハー ドディスクと 3.5 インチ ハードディスクのスループットを比較した場合、3.5 インチハードディスクのスルー プットは 2.5 インチハードディスクよりも約 63 %大きいことがわかります。 3.5 インチ SAS ハードディスクと 3.5 インチ SATA ハードディスクを比較すると、シーケンシャルリードで、 回転数 15 krpm の SAS ハードディスクのスループットは回転数 7.2 krpm の SATA ハードディスクよりも約 58 %向上しています。 ディスクキャッシュを有効にしたシーケンシャルライトの場合、回転数 10 krpm のハードディスクの代わり に回転数 15 krpm のものを使用し、2.5 インチハードディスクの結果では約 21 %スループットが向上しまし た。回転数が 15 krpm の 2.5 インチおよび 3.5 インチハードディスクのスループットを比較した場合、3.5 イン チハードディスクのスループットは 2.5 インチハードディスクよりも約 48 %大きいことがわかります。 3.5 インチ SAS ハードディスクと 3.5 インチ SATA ハードディスクを比較すると、シーケンシャルリードお よびディスクキャッシュが有効な場合、回転数 15 krpm の SAS ハードディスクのスループットは回転数 7.2 krpm の SATA ハードディスクよりも約 46 %向上しています。 ディスクキャッシを有効にした SATA ハードディスクでは、特にシーケンシャルリードで最大 14 倍まで向上 できます。ディスクキャッシュを有効にして SAS ハードディスク で得られるスループットの向上は SATA ハー ドディスクのように大きく取り上げられていませんが、それでもかなり向上しています。10 krpm の 2.5 イン チハードディスクではスループットが 84 %、15 krpm の 2.5 インチハードディスクでは約 46 %向上します。 15 krpm の 3.5 インチハードディスクでは、スループットが 2.2 倍向上します。
次の図は、67 %リードのランダムアクセスで、ディスクキャッシュがスループットの向上にも大きく寄与し ていることを示しています。 ディスクキャッシュを有効にすることで、RAID 1(2 台の 3.5 インチ 7.2 krpm SATA ハードディスク または 3.5 インチ 15 krpm SAS ハードディスク)の 8 KB ブロックを使用するランダムアクセスで約 29 %スループッ トが向上しています。 2.5 インチ と 3.5 インチ の 15 krpm SAS ハードディスクのスループットを比較すると、8 KB のブロックを 使用し、ディスクキャッシュを有効にした場合のランダムアクセスに関して、3.5 インチのハードディスクの スループットは、2.5 インチ のハードディスクよりも約 23 %高いことが明らかです。 3.5 インチ の SAS ハードディスクのスループットを 3.5 インチ の SATA ハードディスクと比較すると、15 krpm の SAS ハードディスクのスループットは、8 KB のブロックを使用し、ディスクキャッシュを有効にした場 合のランダムアクセスに関して、7.2 krpm の SATA ハードディスクよりも約 2.5 倍高いことがわかります。 ディスクキャッシュを有効にすることにより、64 KB のブロックを使用する SATA ハードディスクで、スルー プットが 24 %増加しました。SAS ハードディスクでは、64 KB のブロックの場合のスループットの向上は、 若干尐なく、20 %強です。 2.5 インチ と 3.5 インチ の 15 krpm SAS ハードディスクのスループットを比較すると、64 KB のブロックを 使用し、ディスクキャッシュを有効にした場合のランダムアクセスに関して、3.5 インチ のハードディスク のスループットは、2.5 インチ のハードディスクよりも約 19 %高いことが明らかです。 3.5 インチ の SAS ハードディスクのスループットを 3.5 インチ の SATA ハードディスクと比較すると、64 KB のブロックを使用し、ディスクキャッシュを有効にした場合のランダムアクセスに関して、15 krpm の SAS ハー ドディスクのスループットは、7.2 krpm の SATA ハードディスクよりも約 2.4 倍高いことがわかります。
LSI MegaRAID SAS 1078
RAID アレイでは、可用性に関するデータを取り扱う方法が定義されています。各 RAID アレイ内でデータが 転送される速さは、ハードディスクのデータスループットによって大きく異なります。RAID アレイで測定用 に構成されるハードディスクの数は、RAID レベルに応じて定義されています。2 台または 3 台のハードディ スクが使用されました。さまざまなキャッシュ設定でのコントローラーの効率を測定するときに、ハードディ スクがボトルネックにならないように、回転速度が 15 krpm のハードディスクで測定が実行されました。 キャッシュ設定によって、スループットが大幅に増加する場合があります。ただし、このようなスループッ トの増加は、データの構造とアクセスのパターンによって異なります。測定のために、コントローラーキャッ シュのオプション「Read モード」は、常に「No Read-ahead」に設定され、「I/O cache」のオプションは常 に「I/O direct」に設定されます。「Write モード」と「Disk cache」のオプションはさまざまな設定が行われ ました。
© Fujitsu Technology Solutions 2009-2010 25/66 ページ LSI MegaRAID SAS 1078(512 MB のキャッシュを搭載)
LSI MegaRAID SAS 1078(512 MB のキャッシュを搭載) 次の図では、2 台の 3.5 インチ SAS ハードディスクを使用した RAID 1 と、3 台の 3.5 インチ SAS ハードディ スクを使用した RAID 5 のそれぞれで、64 KB ブロックを使用し、キャッシュ設定を変えて測定した、シー ケンシャルリード/ライトのスループットを示しています。 シーケンシャルリードのスループットでは、非常 に良い値が得られ、キャッシュ設定によって変化 していません。 対照的に、書き込みのスループットは、キャッシュ 設定によって異なります。RAID 1 で最善のパフォー マンスを実現するために、最適なキャッシュ設定 として「Disk cache enabled」のオプションを使 用する必要があります。弊社での測定では、シー ケンシャルライトの場合のスループットが 2.3 倍 向上しました。 優れたパフォーマンスのために最適なキャッシュ 設定を行うことの重要性は、特に RAID 5 で明ら かです。図では、コントローラーキャッシュを 「Write-back」のオプションで有効にし、ディスク キャッシュを「enabled」のオプションで有効にし た結果、シーケンシャルライトのスループットが、 大幅に(30 倍に)向上したことを示しています。 RAID 1 でのランダムアクセスで最善のスループッ トを実現するためには、コントローラーキャッシュ の書き込みモードのオプションを「Write-through」 に設定し、ハードディスクのディスクキャッシュを 有効にすることが重要です。このように最適のキャッ シュ設定にした結果、ランダムアクセスに 8 KB の ブロックが使用されると 34 %、64 KB のブロック が使用されると 29 %のスループットの向上が実現 しました。 RAID 5 でのランダムアクセスで最善のスループッ トを実現するためには、コントローラーキャッシュ の書き込みモードのオプションを「Write-back」に 設定し、ハードディスクのディスクキャッシュを有 効にすることが重要です。このような最適のキャッ シュ設定により、ブロックサイズに応じて、63 %お よび 9 %のスループットの向上を実現しました。 このトピックについての詳細は、次の文書で入手で きます:『パフォーマンスレポート - PRIMERGY 用 モジュラー RAID』
LSI MegaRAID SAS 2108(512 MB のキャッシュを搭載) LSI MegaRAID SAS 2108(512 MB のキャッシュを搭載)
LSI MegaRAID SAS 2108
次の図では、2 台の 2.5 インチ SAS-2.0 ハードディスクを使用した RAID 1 と、3 台の 2.5 インチ SAS-2.0 ハー ドディスクを使用した RAID 5 のそれぞれで、64 KB ブロックを使用し、キャッシュ設定を変えて測定した、 シーケンシャルリード/ライトのスループットを示しています。 シーケンシャルリードの場合に得られたスルー プットは、非常に良い値で、キャッシュ設定によっ て変化していません。 対照的に、書き込みのスループットは、キャッシュ 設定によって異なります。RAID 1 で最善のパ フォーマンスを実現するために、最適なキャッシュ 設定として「Disk cache enabled」のオプションを 使用する必要があります。弊社での測定では、シー ケンシャルライトの場合のスループットが 2 倍に 向上しました。 優れたパフォーマンスのために最適なキャッシュ 設定を行うことの重要性は、特に RAID 5 で明ら かです。図では、コントローラーキャッシュを 「Write-back」のオプションで有効にし、ディスク キャッシュを「enabled」のオプションで有効に した結果、シーケンシャルライトのスループット が、大幅に(22 倍に)向上したことを示してい ます。 RAID 1 でのランダムアクセスで最善のスループットを実現するためには、コントローラーキャッシュの書き 込みモードのオプションを「Write-through」に設定し、ハードディスクのディスクキャッシュを有効にする ことが重要です。このように最適のキャッシュ設定にした結果、ランダムアクセスに 8 KB のブロックが使 用されると 26 %、64 KB のブロックが使用されると 22 %のスループットの向上が実現しました。 RAID 5 でのランダムアクセスで最善のスループッ トを実現するためには、コントローラーキャッシュ の書き込みモードのオプションを「Write-back」に 設定し、ハードディスクのディスクキャッシュを有 効にすることが重要です。このような最適のキャッ シュ設定により、ブロックサイズに応じて、62 % および 46 %のスループットの向上を実現しました。
© Fujitsu Technology Solutions 2009-2010 27/66 ページ コントローラーの比較:SAS
次の図は、LSI MegaRAID SAS 1068 コントローラーと 1078 コントローラーのスループットを示しています。 同じ RAID 1 アレイで同じ種類のハードディスクで測定されました。図では、キャッシュを無効にした場合 (Off)と、最適なキャッシュ設定を行った場合(Optimal)に得られるスループットを示しています。 純粋な順次アクセスで最適なキャッシュ設定の場合、使用したコントローラーのパフォーマンスの違いはわ ずかです。シーケンシャルリードでは、すべてのコントローラーで、キャッシュ設定に関係なく最大のスルー プットの値を実現しました。シーケンシャルライトの場合でも、すべてのコントローラーのパフォーマンス の変動は同じ範囲内で、データスループットは最適なキャッシュ設定によって 65 %向上させることができま す。 RAID 1 での読み取りアクセスでは、この負荷プロファイルの場合、エントリーレベルのコントローラー LSI MegaRAID SAS 1068 は、LSI MegaRAID SAS 1078 コントローラー(最適な設定として上位の RAID レベル 用のコントローラーキャッシュと拡張機能が搭載され、RAID 1 でも優れたパフォーマンスを発揮するコント ローラー)よりも、若干高いデータスループットを示しました。
SATA ハードディスクが使用される場合、LSI MegaRAID SAS 1078 コントローラーは、Native Command Queuing(NCQ)をサポートしているので、LSI MegaRAID SAS 1068 コントローラーよりも有利です。NCQ
によって、付随する I/O 要求が収集され、処理する順序が最適化されます。これによって、ハードディスク のヘッドの不要な動きがなくなり、待機時間が短くなってスループットの値が増加します。この方法は、SATA ハードディスクでのみ使用できます。図からわかるように、NCQ によって、特に、ディスクキャッシュを使 用しない場合のランダムアクセスでのシーケンシャルライトで、パフォーマンスが大幅に向上します。 そのため、NCQ を有効(現在のデフォルト設定)にした LSI MegaRAID SAS 1078 コントローラーは、ディ スクキャッシュを有効にしない場合のシーケンシャルライトの約 5 倍のスループットを示します。ランダム アクセスに関しては、ディスクキャッシュに関係なく、NCQ によって約 22 % 高いスループットが可能にな ります。
SATA ハードディスクが動作しているときは、コントローラーの性能も発揮できるように、LSI MegaRAID SAS 1078 コントローラーで NCQ を常に有効にしておくことをお勧めします。
RAID 1 における SAS と SAS-2.0 - スループットの比較
SAS と SAS-2.0 コンポーネントのパフォーマンスを比較するため、2 台の RAID 1 システムを構成しました。 RAID 1(SAS1)は、2 台の 2.5 インチ 15 krpm、73 GB SAS ハードディスクから構成され、LSI MegaRAID
SAS 1078 コントローラーに接続されています。 もう一方の RAID 1(SAS2)システムは、SAS-2.0 コンポーネントのみから構成され(2 台の 2.5 イン チ 15 krpm、73 GB SAS-2.0 ハードディスク)、 LSI MegaRAID SAS 2108 コントローラーに接続 されています。コントローラーキャッシュは、ど ちらのコントローラーでも無効になっています。 左の図は、異なるディスクキャッシュ設定で 64 KB ブロックを使用したシーケンシャルリード/ライ トを実行したときのスループットを示しています。 SAS2 構成の読み取りスループットは、SAS1 構 成のスループットより約 34 %高い結果になりま した。 SAS2 構成の書き込みスループットは、ディスクキャッシュを有効にした場合と無効にした場合でそれぞれ SAS1 構成より約 37%および 13%高い結果になりました。 右の図は、異なるディスクキャッシュ設定で 8 KB および 64 KB ブロックを使用してランダムアクセ スを実行したときのスループットを示しています。 スループットはディスクキャッシュ設定によって 変化しました。SAS2 構成でディスクキャッシュを 有効にした場合のスループットは、8 KB と 64 KB ブロックを使用した場合でそれぞれ、SAS1 構成 より約 41 %および 45 %高い結果になりました。
© Fujitsu Technology Solutions 2009-2010 29/66 ページ 結論
PRIMERGY RX300 S5 により、「モジュラー RAID」の考え方に基づいて、さまざまなアプリケーションのシ ナリオの多様な要件を満たす多くの機会が得られます。
LSI MegaRAID SAS 1068 コントローラーに代表されるエントリーレベルのコントローラーでは、基本的な RAID ソリューション RAID 0、RAID 1 および RAID 1E が実現され、3 つの RAID レベルが非常に優れたパフォー マンスでサポートしています。 ハイエンドコントローラーでは、現在のすべての RAID ソリューションを使用できます。内蔵ハードディス クを最大 12 台まで拡張可能な PRIMERGY RX300 S5 の場合、RAID レベル 0、1、5、6、10、50 および 60 がサポートされています。このコントローラーには、256 MB または 512 MB のコントローラーキャッシュ が搭載され、オプションとして、BBU を使用したセキュリティの保護が可能です。キャッシュの使用に関す るさまざまな設定オプションで、使用する RAID レベルに合わせてコントローラーのパフォーマンスを柔軟 に適応させることができます。
LSI MegaRAID SAS 1078 コントローラーには 256 MB または 512 MB のコントローラーキャッシュが搭載 されており、SAS 環境で高い性能を発揮します(SAS、3 Gbps)。LSI MegaRAID SAS 2108 コントローラー は、最大 6 Gbps で SAS-2.0 を動作させるために必要です。
RAID 5 または RAID 6 を使用することにより、既存のハードディスクの容量を経済的に活用して、優れたパ フォーマンスを実現できます。ただし、最善のパフォーマンスとセキュリティのためには、RAID 10 をお勧 めします。
PRIMERGY RX300 S5 では、SATA、SAS、および SAS-2.0 のハードディスクから選択できます。SAS ハー ドディスクの場合は、2.5 インチと 3.5 インチハードディスクから選択できます。2.5 インチハードディスク の回転速度は 10 krpm または 15 krpm、3.5 インチハードディスクの回転速度は 15 krpm です。2.5 インチ SAS-2.0 ハードディスクの場合も、回転速度 10 krpm または 15 krpm の製品を使用できます。 使用するハードディスクの種類は、必要なパフォーマンスに応じて、回転速度も含めて決定する必要があり ます。回転速度 15 krpm の 2.5 インチハードディスクは、一般に回転速度の遅い製品より高いスループットを 発揮します。しかし、スループットはアクセスパターンに大きく依存します。弊社の分析では、特にランダ ムアクセスの場合に顕著で、スループットに最大 53 %の差異が出ています。 2.5 インチのハードディスクを 使用することで、RAID レベルに応じて、RAID アレイで使用するハードディスクを増やし、より高いレベル での並列処理を実現できます。 最高のパフォーマンスのために、特に SATA ハードディスクを使用する場合やコントローラーキャッシュを 持たないコントローラーを使用する場合は、ハードディスクのキャッシュを有効にすることをお勧めします。 使用するディスクの種類に応じて、パフォーマンスの増加は 14 倍です。ハードディスクのキャッシュを有効 にする場合は、UPS の使用をお勧めします。
ベンチマーク環境
ここで説明したすべての測定は、下記の一覧で示したハードウェアとソフトウェアのコンポーネントを使用 して実行されました。
コンポーネント 詳細
サーバ PRIMERGY RX300 S5
オペレーティングシステム Windows Server 2008、Enterprise Edition Version: 6.0.6001 Service Pack 1 Build 6001
ファイルシステム NTFS
測定ツール Iometer 27.07.2006
測定データ 8 GB の測定ファイル
コントローラー
「LSI MegaRAID 8 ポートベースの RAID 0/1 SAS」 (LSI MegaRAID SAS 1068)
製品: LSI RAID 0/1 SAS 1068
ドライバ名: lsi_sas.sys、ドライバのバージョン: 1.29.03.00 ファームウェアのバージョン: 01.29.03.00
BIOS のバージョン: 06.26.00.00
コントローラー
「LSI MegaRAID ベースの RAID 5/6 SAS」 (LSI MegaRAID SAS 1078)
製品: FTS RAID 5/6 SAS ドライバ名: megasys.sys、ドライバのバージョン: 3.9.0.64 ファームウェアのパッケージ: 11.0.1-0008 ファームウェアのバージョン: 1.40.32-0580 BIOS のバージョン: 2.06.00 コントローラーキャッシュ: 256 MB または 512 MB コントローラー 「RAID コントローラー SAS 5/6 512MB(D2616)」 (LSI MegaRAID SAS 2108)
製品: FTS RAID 6G 5/6 SAS ドライバ名: megasys2.sys, ドライバのバージョン: 4.12.0.64 ファームウェアのパッケージ: 12.0.1-0057 ファームウェアのバージョン: 2.0.03-0673 BIOS のバージョン:3.07.00 コントローラーキャッシュ: 512 MB ハードディスク SATA、3.5 インチ、7.2 krpm Seagate ST3500320NS、500 GB ハードディスク SAS、2.5 インチ、10 krpm Seagate ST973402SS、73 GB ハードディスク SAS、2.5 インチ、15 krpm Seagate ST973451SS、73 GB ハードディスク SAS-2.0、2.5 インチ、15 krpm Fujitsu MBE2073RC, 73 GB ハードディスク SAS、3.5 インチ、15 krpm Seagate ST3146356SS、146 GB
© Fujitsu Technology Solutions 2009-2010 31/66 ページ
SPECsfs2008
ベンチマークの説明
SPECsfs2008 は、Standard Performance Evaluation Corporation(SPEC)で開発されたベンチマークスイー トで、ファイルサーバのスループットと応答時間を測定します。異なるベンダーのプラットフォーム間での、 パフォーマンスを比較する標準的な方法が用意されています。 SPECsfs2008 の結果では、次の項目に関して、サーバの性能が要約されています。 1 秒あたりの、処理が可能なオペレーション数 (ops/sec) 応答時間(個々のオペレーションの完了に必要な時間) SPECsfs2008 の新しいコードにより、以前のバージョンとはパフォーマンスが異なります。したがって、 SPECsfs2008 の結果は、以前のバージョンの SPECsfs ベンチマーク結果とは比較できません。 SPECsfs2008 ベンチマーク は、NFS または CIFS のファイルサーバのパフォーマンスの測定に使用されま す。このベンチマークでは、標準的なサーバ環境をシミュレートするワークロードの組み合わせが作成され ます。NFS プロトコル バージョン 3 に準拠した NFS ワークロード、および CIFS ワークロードは、SFS 委 員会のメンバーによって、顧客のサイトで実際に稼働している何千もの NFS および CIFS のサーバから集め られたデータを基にしています。 類似点はありますが、特に、各ワークロードが動作するファイルセットに関しては、NFS と CIFS のワーク ロードは比較できません。例えば、SUT(テスト対象システム)の CIFS の結果が同じ SUT の NFS の結果 よりも 20 %高い場合でも、その SUT では NFS での動作よりも CIFS での動作の方が良いという推定はでき ません。ワークロードは大きく異なり、NFS と CIFS のワークロードを標準化するための試みは行われません でした。NFS でも CIFS でも、同じ SPECsfs2008 ワークロードで測定された、異なる SUT の公開結果の比 較だけは可能です。
測定には、1 ops/sec の負荷あたり 120 MB のファイルセットを作る必要があります。測定中に、ファイルセッ ト内の 30 %のファイルにアクセスがあります。ファイルの最大サイズは 32 MB です。NFS ワークロード内 の READ コマンドと WRITE コマンドの比率は 9:5 です。CIFS ワークロード内の READ_ANDX コマンドと WRITE_ANDX コマンドの比率は、およそ 7:3 です。
このベンチマークでは、サーバ上での負荷の生成に使用できるクライアントシステムを、ユーザーが 1 つ以 上持っていることが必要です。これらのクライアントの 1 つが「プライム」クライアントとして参照され、 負荷を生成するすべてのクライアントの統合に使用されます。サポート対象のクライアントのオペレーティン グシステムは、AIX、FreeBSD、Linux、Mac OS X、Solaris 10 および Windows です。
標準的な SPECsfs2008 のテスト構成では、負荷を生成する一連のクライアントは、SUT からの共有または エクスポートが行われたファイルシステムで、ネットワーク経由で管理されます。クライアントはマネージャー プログラムによって管理され、増加していく等間隔の「ロードポイント」で、10 以上の一連のテストを実行 します。ロードポイントは、クライアントがサーバへ送るワークロードのスループットレベル(オペレーション 数)を表します。 各ロードポイントの開始と同時に、各クライアントは、指定された数の負荷生成プロセスを開始します。各 プロセスでは、エクスポートまたは共有が行われたファイルシステムがマウントされ、ディレクトリ構造が 作成されて、そこにさまざまな大きさのファイルが書き込まれます。負荷を生成するプロセスで作成される ファイル数は、ロードポイントに対して指定された 1 秒あたりのオペレーション数によって決まり、その数 に比例して増加します。 負荷を生成しているすべてのプロセスによってファイルセットの初期化(ベンチマークの「INIT」フェーズ と呼ばれる)が完了されると、そのプロセスによって、ベンチマークで規定されているワークロードのパラ メーターを基にした NFS または CIFS の一連のオペレーションのサーバからの要求が開始されます。負荷ジェ ネレーターは 300 秒間 WARMUP モードを実行します。この間は正式な測定値は記録されません。WARMUP フェーズが完了すると、ベンチマークによって、300 秒間の測定フェーズが開始され、その間、ロードポイン トのスループットと応答時間の実際の測定値が収集されます。
300 秒の測定時間が正常に完了すると、テストの総合結果のレポートと記録を担当するマネージャープログ ラムにより、すべてのクライアント上のすべての負荷ジェネレーターからの統計値が収集されます。ベンチ マークのルールに違反せずにテストが完了した場合は、マネージャーによって作成された概要レポートを使 用して、審査と公表のために SPEC へ送信可能な SFS サブミッションを作成できます。そのため、ベンチ マークのレポート作成ツールが使用されてピークに達したスループットが示され、「全体応答時間」の性能指 標が算出されます。これは、一連のロードポイントの平均応答時間の測定結果を検討するためのものです。 SPECsfs2008 Run and Reporting Rules は、このスイートを使用して生成された結果が、有意義で、生成さ れた他の結果と比較でき、再現が可能なことを保証するために、SPEC によって制定されています。SPEC の ライセンス契約により、公開するすべての結果は、この Run and Reporting Rules に準拠している必要があ ります。さらに、このベンチマーク結果を公開して使用する場合、SPEC では SPEC OSG Fair Use Policy に 従うように求めています。このガイドラインに準拠していないと思われる場合、SPEC は調査を行い、公表 資料の訂正を要請する場合があります。
ベンチマーク結果
2009 年 2 月に、SPECsfs2008 ベンチマークの CIFS ワークロードを使用して、PRIMERGY RX300 S5 が測 定されました。サーバには、2 基の Xeon X5570 プロセッサ、12 枚の 8 GB PC3-8500R DDR3-SDRAM、512 MB のキャッシュ と BBU が搭載された 8 ポートの SAS RAID コントローラー、および 12 台の SAS ハード ディスクが装備されていました。オペレーティングシステムは、RAID 1 を構成する 2 台のハードディスク(36 GB、15000 rpm)上にありました。ファイルサーバのデータ領域は、2 組の RAID 5 を構成する 10 台のハー ドディスク(146 GB、10000 rpm)上にありました。PRIMERGY RX300 S5 は、2 ポートで 1 ギガビットの 内蔵イーサネットコントローラーを通じて負荷ジェネレーターに接続されていました。測定には、Windows Server 2003 R2 Enterprise x64 Edition SP2 を使用しました。
最初の測定区間では、480 ops/sec の負荷となるように測定を行いました。この結果、約 56 GB の大きさの データ領域がベンチマークにより生成されました。目標値は、後続の測定区間ごとに 480 ops/sec ずつ増加 するため、データ領域の大きさも、約 56 GB ずつ増加しました。SPECsfs2008 _cifs の結果 = 4857 ops/sec (全体応答時間 = 4.63 ミリ秒)が得られました。 下記の表は、10 回の測定間隔で得られたスループット(ops/sec)と平均応答時間(ミリ秒)を示していま す。グラフでもこのことを示しています。グラフ内には、全体応答時間も点線で表されています。これは、 すべての測定間隔から算出された平均応答時間です。また、Y 軸の上端は、ルールに沿ったベンチマークの 実行で許容される平均応答時間の最大値(20 ミリ秒)です。最後の測定間隔でも、目標値の 4800 ops/sec を 実現しています。赤い折れ線グラフは、x = 4857 で終わっています。この時点で、サーバの容量がいっぱい になっています。
© Fujitsu Technology Solutions 2009-2010 33/66 ページ 測定結果は、http://www.spec.org で公開されています。 測定値は、内蔵ハードディスクの容量を合わせた RAID 5 の構成で PRIMERGY RX300 S5 がどのようなスルー プットのパフォーマンスを実現するかを示しています。測定中に、プロセッサの能力の限界に達することは ありませんでした。特に、ハードディスクの数によって、スループットが制限されました。
ベンチマーク環境
テスト対象システム(System Under Test:SUT) ハードウェア サーバ PRIMERGY RX300 S5 プロセッサ Xeon X5570(2 基) メモリ 8 GB PC3-8500R DDR3-SDRAM(12 枚) ネットワークインター フェース 2 ポート 1 ギガビット 内蔵イーサネットコントローラー(1 セット) ディスクサブシステム
8 ポート SAS RAID コントローラー(512 MB キャッシュおよび BBU 搭載)(1 台)
SAS ディスク、36 GB、15000 rpm、RAID 1、OS 用(2 台)
SAS ディスク、146 GB、10000 rpm、RAID 5(2 組)、データ用(10 台) ソフトウェア
オペレーティング
システム Windows Server 2003 R2 Enterprise x64 Edition SP2
負荷ジェネレーター ハードウェア モデル PRIMERGY RX100 S3(8 台) プロセッサ Pentium D 950(2 基) メモリ 1 GB DDR2 SDRAM PC2-4200(2 枚) ネットワークインター フェース 1 ギガビット 内蔵イーサネット Broadcom BCM5721(2 セット:1 セットを使用) ソフトウェア オペレーティング システム Windows Server 2003