ホワイトペーパー
FUJITSU PRIMERGY サーバ
パフォーマンスレポート
PRIMERGY BX922 S2
本書では、PRIMERGY BX922 S2 で実行したベンチマークの概要について説明します。
PRIMERGY BX922 S2 のパフォーマンスデータを、他の PRIMERGY モデルと比較して
説明しています。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク
環境の説明も掲載しています。
バージョン 2.0a 2011-12-21 目次 ドキュメントの履歴 ... 2 製品データ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 13 StorageBench ... 16 OLTP-2 ... 20 SAP SD ... 27 vServCon ... 30 VMmark V1 ... 38 STREAM ... 41 関連資料 ... 43 お問い合わせ先 ... 44ドキュメントの履歴
バージョン 1.0a 以下のベンチマークを含むレポートの初版 SPECcpu2006 Xeon E5507、X5570、L5630、E5620、E5630、E5640、L5640、X5650、X5660、X5670、X5680 で測定 SPECjbb2005 Xeon X5570、X5680 で測定 StorageBench オンボード SATA コントローラーで測定 SAP SD 認証番号 2010008 バージョン 1.3 以下のベンチマークを追加 OLTP-2 Xeon E5503、E5506、E5507、E5620、E5630、E5640、L5609、L5630、L5640、X5650、X5660、 X5667、X5670、X5677、X5680 で測定 vServCon Xeon E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677、L5640、X5650、X5660、 X5670、X5680 で測定 VMmark V1 Xeon X5677、X5680 で測定 以下のベンチマークを更新 SPECcpu2006 Xeon E5503、E5506、E5507、L5609、E5620、E5630、X5667、X5677、L5640、X5650、X5660、 X5670 で測定 バージョン 2.0 以下のベンチマークを追加 STREAM Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5675、X5687、X5690 で測定 以下のベンチマークを更新 SPECcpu2006 Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5675、X5687、X5690 で測定 (インテル C++/Fortran コンパイラー 12.0) SPECjbb2005 Xeon X5690 で測定 OLTP-2 Xeon 55xx および 56xx プロセッサシリーズで測定 vServCon Xeon 55xx および 56xx プロセッサシリーズで測定 バージョン 2.0a 軽微な訂正製品データ
2 ソケットサーバブレード PRIMERGY BX922 S2 には、Intel 5520 チップセット、Intel Xeon プロセッサ 5500 シリーズまたは 5600 シリーズ(2 コア、4 コア、6 コア)2 基、最大 192 GB の DDR3-SDRAM が搭 載可能な DIMM スロット 12 本、2 ポート 1 Gbit LAN コントローラー 2 基、2.5 インチ SATA HDD 1 台ま たは SSD 最大 2 台に対応するオンボードコントローラー 1 基が搭載されています。
詳細な製品データについては、次のデータシートを参照してください。
PRIMERGY BX400 S1 データシート
PRIMERGY BX900 S1 データシート
SPECcpu2006
ベンチマークの説明
SPECcpu2006 は、整数演算および浮動小数点演算でシステム性能を測定するベンチマークです。このベン チマークは、12 本のアプリケーションから成る整数演算テストセット(SPECint2006)、および 17 本のア プリケーションから成る浮動小数点演算テストセット(SPECfp2006)で構成されています。これらのアプ リケーションは大量の演算を実行し、CPU およびメモリを集中的に使用します。他のコンポーネント(デ ィスク I/O、ネットワークなど)は、このベンチマークでは測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード として利用可能で、実際に測定する前にコンパイルする必要があります。したがって、使用するコンパイラ ーのバージョンやその最適化設定が、測定結果に影響を与えます。 SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。1 つ目の方法(SPECint2006 およ び SPECfp2006)では、1 つのタスクの処理に必要な時間を測定します。2 つ目の方法(SPECint_rate2006 および SPECfp_rate2006)では、スループット(並列処理できるタスク数)を測定します。いずれの方法 も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これらは、コンパイラー最適化 を使用するかどうかという点で異なります。「ベース」値は常に公開されていますが、「ピーク」値はオプ ションです。 ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション SPECint2006 整数 ピーク アグレッシブ 速度 単体実行 SPECint_base2006 整数 ベース 標準 SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行 SPECint_rate_base2006 整数 ベース 標準 SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行 SPECfp_base2006 浮動小数点 ベース 標準 SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行 SPECfp_rate_base2006 浮動小数点 ベース 標準 測定結果は、個々のベンチマークで得られた正規化比の幾何平均です。算術平均と比較して、幾何平均の方 が、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムがリファレン スシステムと比較してどの程度高速であるかを測定することです。例えば、リファレンスシステムの SPECint_base2006、SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結 果が、値「1」と判定されたとします。このとき、SPECint_base2006 の値が「2」の場合は、測定システム が こ の ベ ン チ マ ー ク を リ フ ァ レ ン ス シ ス テ ム の 2 倍 の 速 さ で 実 行 し た こ と を 意 味 し ま す 。 SPECfp_rate_base2006 の値が「4」の場合は、測定対象システムがリファレンスシステムの約 4/[ベー スコピー数]倍の速さでこのベンチマークを実行したことを意味します。「ベースコピー数」とは、実行さ れたベンチマークの並行インスタンスの数です。 弊社では、SPEC の公開用に、SPECcpu2006 のすべての測定値を提出しているわけではありません。その ため、SPEC の Web サイトに公開されていない結果が一部あります。弊社では、すべての測定のログファ イルをアーカイブしているので、測定の内容に関していつでも証明できます。ベンチマーク結果
測定 1Xeon シリーズ 5500 のプロセッサと、Xeon シリーズ 5600 のプロセッサを使用して PRIMERGY BX922 S2 を測定しました。「予測」という印付きの値は、予測値です。Xeon 5570 の測定結果と予測値は、インテル C++/Fortran コンパイラー 11.0 でコンパイルし、SUSE Linux Enterprise Server 10 SP2(64 ビット)で実 行したベンチマークプログラムに基づいています。他のすべての測定結果は、インテル C++/Fortran コンパ イラー 11.1 でコンパイルし、SUSE Linux Enterprise Server 11 (64 ビット)で実行したベンチマークプロ グラムに基づいています。次の表の太字の値は、http://www.spec.org で公開されています。
プロセッサ コア GHz L3 キャッ シュ QPI スピード TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5502 2 1.87 4 MB 4.80 GT/s 80 W 17.9(予測) 19.9(予測) Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 20.8 22.4 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 22.0 23.9 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 23.1 25.1 Xeon L5520 4 2.27 8 MB 5.86 GT/s 60 W 24.2(予測) 26.9(予測) Xeon E5520 4 2.27 8 MB 5.86 GT/s 80 W 24.2(予測) 26.9(予測) Xeon E5540 4 2.53 8 MB 5.86 GT/s 80 W 26.5(予測) 29.6(予測) Xeon X5550 4 2.67 8 MB 6.40 GT/s 95 W 29.2(予測) 32.6(予測) Xeon X5570 4 2.93 8 MB 6.40 GT/s 95 W 31.3(予測) 35.0(予測) Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 21.3 22.7 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 26.0 28.0 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 29.5 31.8 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 30.7 33.1 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 32.0 34.6 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 37.8 40.8 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 40.1 43.4 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 30.4 33.0 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 34.3 36.9 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 35.5 38.3 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 36.5 39.4 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 39.0 42.3 プロセッサ コア GHz L3 キャッ シュ QPI スピード TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5502 2 1.87 4 MB 4.80 GT/s 80 W 33.4(予測) 66.0(予測) 36.0(予測) 71.0(予測) Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.1 72.7 40.2 79.0 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 71.1 139 76.1 148 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 74.2 144 79.2 154 Xeon L5520 4 2.27 8 MB 5.86 GT/s 60 W 96.0(予測) 185(予測) 103(予測) 200(予測) Xeon E5520 4 2.27 8 MB 5.86 GT/s 80 W 96.0(予測) 187(予測) 103(予測) 201(予測) Xeon E5540 4 2.53 8 MB 5.86 GT/s 80 W 103(予測) 200(予測) 111(予測) 216(予測) Xeon X5550 4 2.67 8 MB 6.40 GT/s 95 W 113(予測) 224(予測) 122(予測) 241(予測) Xeon X5570 4 2.93 8 MB 6.40 GT/s 95 W 121(予測) 238 130(予測) 257 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 69.9 135 75.7 146 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 93.6 177 99.0 186 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 107 210 114 224 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 112 217 118 231 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 116 226 122 238 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 137 268 145 284 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 145 283 153 301 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 144 275 154 295 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 165 322 175 344 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 170 330 180 353 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 174 337 185 362 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 181 354 192 381
プロセッサ コア GHz L3 キャッ シュ QPI スピード TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5502 2 1.87 4 MB 4.80 GT/s 80 W 21.9(予測) 23.2(予測) Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 24.2 26.0 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 26.1 28.1 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 27.3 29.2 Xeon L5520 4 2.27 8 MB 5.86 GT/s 60 W 29.8(予測) 31.6(予測) Xeon E5520 4 2.27 8 MB 5.86 GT/s 80 W 29.8(予測) 31.6(予測) Xeon E5540 4 2.53 8 MB 5.86 GT/s 80 W 32.3(予測) 34.3(予測) Xeon X5550 4 2.67 8 MB 6.40 GT/s 95 W 35.3(予測) 37.7(予測) Xeon X5570 4 2.93 8 MB 6.40 GT/s 95 W 37.1(予測) 39.7(予測) Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 25.7 27.6 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 30.4 32.8 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 34.6 37.2 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 35.4 38.1 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 36.6 39.3 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 43.2 46.5 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 45.3 48.8 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 36.1 39.1 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 40.3 43.2 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 41.3 44.3 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 42.1 45.3 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 44.3 47.9 プロセッサ コア GHz L3 キャッ シュ QPI スピード TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5502 2 1.87 4 MB 4.80 GT/s 80 W 35.0(予測) 67.8(予測) 36.3(予測) 70.7(予測) Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.5 72.4 38.8 75.1 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 60.6 117 62.3 120 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 62.3 120 64.2 123 Xeon L5520 4 2.27 8 MB 5.86 GT/s 60 W 80.2(予測) 152(予測) 82.9(予測) 158(予測) Xeon E5520 4 2.27 8 MB 5.86 GT/s 80 W 80.2(予測) 154(予測) 82.9(予測) 160(予測) Xeon E5540 4 2.53 8 MB 5.86 GT/s 80 W 84.4(予測) 162(予測) 87.3(予測) 168(予測) Xeon X5550 4 2.67 8 MB 6.40 GT/s 95 W 93.7(予測) 183(予測) 97.3(予測) 190(予測) Xeon X5570 4 2.93 8 MB 6.40 GT/s 95 W 97.8(予測) 191 102(予測) 199 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 63.2 116 65.4 120 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 73.4 133 75.8 137 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 84.6 164 87.8 170 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 86.9 166 90.2 173 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 88.9 171 91.9 176 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 106 203 110 211 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 110 214 114 222 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 107 198 110 205 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 119 233 124 240 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 121 237 125 244 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 123 241 128 249 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 127 248 131 256
測定 2
2010 年 12 月から 2011 年 3 月にかけて、Xeon 5600 シリーズのプロセッサを使用して、PRIMERGY BX922 S2 を測定しました。結果は次の 4 つの表に示すとおりです。ベンチマークプログラムは、インテル C++/Fortran コンパイラー 12.0 でコンパイルし、SUSE Linux Enterprise Server 11 SP1(64 ビット)で実 行しました。次の表の太字の値は、http://www.spec.org で公開されています。「予測」という印付きの値は、 予測値です。 プロセッサ コア GHz L3 キャッシュ QPI スピード TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 22.7(予測) 23.7(予測) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 19.1 20.0 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 24.0(予測) 25.3(予測) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 25.2(予測) 26.6(予測) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 25.6 26.7 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 26.9 28.0 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 23.2(予測) 24.(予測) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 28.4(予測) 30(予測) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 32.3(予測) 34.1(予測) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 33.6(予測) 35.5(予測) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 35.0(予測) 37.1(予測) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 37.4 39.7 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 41.7(予測) 43.8(予測) Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 44.3(予測) 46.6(予測) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 45.0 47.7 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 33.5(予測) 35.6(予測) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 33.2 35.1 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 34.3 36.3 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 37.9(予測) 39.6(予測) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 39.2(予測) 41.1(予測) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 40.3(予測) 42.3(予測) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 41.0 43.2 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 43.1(予測) 45.4(予測) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 43.5 45.8
プロセッサ コア GHz キャッシュ L3 スピード QPI TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 39.1(予測) 76.4(予測) 41.9(予測) 82.7(予測) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 60.9 118 65.0 125 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 75.0(予測) 146(予測) 79.3(予測) 155(予測) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 78.3(予測) 151(予測) 82.5(予測) 161(予測) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 79.7 154 84.7 163 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 83.7 161 88.9 170 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 73.5(予測) 143(予測) 79.4(予測) 154(予測) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 98.4(予測) 187(予測) 104(予測) 196(予測) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 113(予測) 222(予測) 120(予測) 236(予測) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 118(予測) 230(予測) 124(予測) 243(予測) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 122(予測) 239(予測) 128(予測) 251(予測) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 130 252 137 267 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 144(予測) 283(予測) 152(予測) 300(予測) Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 153(予測) 299(予測) 161(予測) 317(予測) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 157 306 165 323 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 151(予測) 291(予測) 162(予測) 311(予測) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 153 293 163 313 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 158 302 168 324 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 177(予測) 347(予測) 187(予測) 368(予測) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 183(予測) 356(予測) 193(予測) 377(予測) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 187(予測) 363(予測) 198(予測) 387(予測) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 191 370 204 396 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 195(予測) 381(予測) 206(予測) 407(予測) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 200 388 213 415
プロセッサ コア GHz L3 キャッシュ QPI スピード TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 33.0(予測) 34.2(予測) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 29.5 31.3 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 35.6(予測) 37.0(予測) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 37.2(予測) 38.4(予測) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 36.7 39.0 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 38.2 40.4 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 35.1(予測) 36.3(予測) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 40.6(予測) 43.2(予測) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 46.2(予測) 49(予測) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 47.3(予測) 50.2(予測) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 48.2(予測) 51.5(予測) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 51.5 54.8 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 58.2(予測) 62.2(予測) Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 61.0(予測) 65.3(予測) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 61.7 65.5 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 48.3(予測) 51.5(予測) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 47.4 50.8 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 49.0 52.3 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 54.3(予測) 57.8(予測) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 55.6(予測) 59.3(予測) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 56.7(予測) 60.6(予測) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 57.6 60.9 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 59.7(予測) 64.1(予測) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 60.7 64.0
プロセッサ コア GHz キャッシュ L3 スピード QPI TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 40.1(予測) 75.5(予測) 41.5(予測) 80.1(予測) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 58.8 107 60.9 113 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 64.8(予測) 122(予測) 66.6(予測) 128(予測) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 66.6(予測) 125(予測) 68.7(予測) 131(予測) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 70.8 127 73.5 134 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 73.1 131 75.8 138 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 67.7(予測) 124(予測) 69.5(予測) 128(予測) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 78.7(予測) 142(予測) 80.5(予測) 146(予測) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 90.7(予測) 176(予測) 93.2(予測) 182(予測) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 93.2(予測) 178(予測) 95.8(予測) 185(予測) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 95.3(予測) 183(予測) 97.6(予測) 188(予測) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 99.0 190 102 196 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 114(予測) 213(予測) 116(予測) 220(予測) Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 117(予測) 225(予測) 120(予測) 232(予測) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 119 231 122 238 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 113(予測) 205(予測) 116(予測) 214(予測) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 114 211 117 217 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 116 215 119 221 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 127(予測) 245(予測) 131(予測) 251(予測) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 129(予測) 249(予測) 132(予測) 255(予測) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 131(予測) 253(予測) 135(予測) 260(予測) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 133 259 137 267 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 135(予測) 260(予測) 138(予測) 267(予測) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 137 267 141 274
整数演算テストセットおよび浮動小数点演算テストセットの両方で、2 プロセッサのスループットは 1 プロ セッサの約 2 倍です。 SPECfp_rate_base2006 SPECfp_rate2006 0 50 100 150 200 250 300 1 x Xeon X5690 2 x Xeon X5690 137 267 141 274 SPECint_rate_base2006 SPECint_rate2006 0 50 100 150 200 250 300 350 400 450 1 x Xeon X5690 2 x Xeon X5690 200 388 213 415 SPECcpu2006:整数演算性能 PRIMERGY BX922 S2(2 ソケットと 1 ソケットの比較) SPECcpu2006:浮動小数点演算性能 PRIMERGY BX922 S2(2 ソケットと 1 ソケットの比較)
ベンチマーク環境
測定 1 SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX922 S2 で行いまし た。 ハードウェア モデル PRIMERGY BX922 S2CPU Xeon E5503、E5506、E5507、X5570、L5609、L5630、E5620、E5630、E5640、X5667、X5677、 L5640、X5650、X5660、X5670、X5680 CPU 数 1 チップ: Xeon E5503: 2 コア Xeon E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677: 4 コア その他すべて: 6 コア 2 チップ: Xeon E5503: 4 コア Xeon E5506、E5507、X5570、L5609、L5630、E5620、E5630、E5640、X5667、X5677: 8 コア その他すべて: 12 コア 1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) 2 次キャッシュ 256 KB オンチップ(コアあたり) その他のキャッシュ Xeon E5503、E5506、E5507: 4 MB(命令 + データ)オンチップ(チップあたり) Xeon X5570: 8 MB(命令 + データ)オンチップ(チップあたり) その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり) ソフトウェア
オペレーティングシステム Xeon X5570: SUSE Linux Enterprise Server 10 SP2(64 ビット) その他すべて: SUSE Linux Enterprise Server 11(64 ビット) コンパイラー Xeon X5570: インテル C++/Fortran コンパイラー 11.0 その他すべて: インテル C++/Fortran コンパイラー 11.1 測定 2 SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX922 S2 で行いまし た。 ハードウェア モデル PRIMERGY BX922 S2
CPU Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5675、X5687、X5690
CPU 数 1 チップ: Xeon E5603、E5606、E5607、X5647、X5687: 4 コア その他すべて: 6 コア 2 チップ: Xeon E5603、E5606、E5607、X5647、X5687: 8 コア その他すべて: 12 コア 1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) 2 次キャッシュ 256 KB オンチップ(コアあたり) その他のキャッシュ Xeon E5603、E5606、E5607: 8 MB(命令 + データ)オンチップ(チップあたり) その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり) ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11 SP1(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 12.0
SPECjbb2005
ベンチマークの説明
SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマーク です。これは、本質的には SPECjbb2000 をアップデートしたものです。主な違いは次のとおりです。 トランザクションは、多様な機能範囲に対応するために、より複雑になっています。 ベンチマークのワーキングセットは、システムの負荷の増大に対応するために、拡大されています。 SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実環境との高い近似性 を得ることができます。 SPECjbb2005 は、ソフトウェアについては主にジャストインタイムコンパイラーで使用される JVM と、ス レッドおよびガーベージコレクションの実装のパフォーマンスを測定します。使用されるオペレーティング システムの機能も評価します。ハードウェアについては、CPU およびキャッシュの効率、メモリサブシス テム、共有メモリシステム(SMP)のスケーラビリティを評価します。ディスクおよびネットワーク I/O は 無関係です。 SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント/サーバ システムをエミュレートしたもので、中間層システムに重点を置いています。 クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベ ースへの OLTP アクセスを思考時間ゼロで行います。 中間層システムは、ビジネスプロセスおよびデータベースの更新を実装します。 データベースはデータ管理を行い、メモリ内の Java オブジェクトによりエミュレートされます。 トランザクションのログ記録は XML ベースで実装されます。 このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフ ォーマンスが測定されます。このため、大規模なハードウェアの設置は不要となり、異なるシステムの SPECjbb2005 の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記 述されています。
SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で す。 スケーリングの単位は、約 25 MB の Java オブジェクトから成るウェアハウスです。1 つのウェアハウスに つき、1 つの Java スレッドがオペレーションを実行します。これらのビジネスオペレーションは TPC-C で 次の項目を前提としています。 新規オーダーエントリー 支払 オーダーステータスの照会 納入 在庫レベル監視 顧客レポート ただし、これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません。2 つのベンチマーク の結果は比較できません。 SPECjbb2005 には、次の 2 つの性能指標があります。 bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーション の処理レートです。 bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。 SPECjbb2005 のさまざまな結果の比較では、両方の性能指標を考慮する必要があります。 これらの性能指標の測定は、次のようなベンチマークのルールに準拠しています。 ベンチマーク測定は、ウェアハウス数(スレッド数)が増加する一連の測定ポイントで構成され、それぞれ においてウェアハウス数は 1 つずつ増加します。測定は 1 ウェアハウスで開始され、2*MaxWh(尐なくと も 8 ウェアハウス)まで実行されます。MaxWh は、ベンチマークで予想される秒あたりの処理レートが最
高になるウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます。
性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペレ ーション速度の算術平均です。
ベンチマーク結果
測定 1
2010 年 2 月、2 基の Xeon X5570 プロセッサおよび 24 GB の PC3-10600R DDR3-SDRAM メモリの構成で PRIMERGY BX922 S2 を測定しました。測定には、Windows Server 2008 R2 Enterprise を使用しました。 IBM から提供されている J9 VM の 4 つのインスタンスを JVM として使用しました。 測定結果は次のとおりです。 SPECjbb2005 bops = 632425 SPECjbb2005 bops/JVM = 158106 PRIMERGY BX922 S2 は、インテルベースのすべての 2 ソケットサーバで最高の結果を得ました。1 測定 2 2010 年 3 月、2 基 の Xeon X5680 プロセッサおよび 48 GB の PC3-10600R DDR3-SDRAM メモリの構成 で PRIMERGY BX922 S2 を測定しました。Xeon X5570 の測定と同じオペレーティングシステムおよび同 じ JVM を使用しました。ただし、JVM インスタンスは 4 つではなく 6 つ使用しました。 測定結果は次のとおりです。 SPECjbb2005 bops = 927872 SPECjbb2005 bops/JVM = 154645 測定 3 2010 年 12 月、2 基の Xeon X5690 プロセッサ構成で、PRIMERGY BX922 S2 を測定しました。測定には、 Windows Server 2008 Enterprise x64 Edition SP2 を使用しました。その他の構成は、2010 年 3 月の測定と 同じです。 測定結果は次のとおりです。 SPECjbb2005 bops = 943801 SPECjbb2005 bops/JVM = 157300 1 上記の競合他社製品との比較は、2010 年 2 月 25 日現在のものです。また、この比較は、インテルベースの 2 プロセ ッ ササ ーバ におけ る SPECjbb2005 の結果に基づいています。 SPECjbb2005 ベンチマークの最新の結果は、 http://www.spec.org/jbb2005/results を参照してください。
ベンチマーク環境
SPECjbb2005 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX922 S2 で行いまし た。 ハードウェア モデル PRIMERGY BX922 S2 CPU Xeon X5570、X5680、X5690 CPU 数 Xeon X5570: 2 チップ、8 コア(チップあたり 4 コア) Xeon X5680、X5690: 2 チップ、12 コア(チップあたり 6 コア) 1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) 2 次キャッシュ 256 KB(命令 + データ)オンチップ(コアあたり) その他のキャッシュ Xeon X5570: 8 MB(命令 + データ)オンチップ(チップあたり) Xeon X5680、X5690: 12 MB(命令 + データ)オンチップ(チップあたり) メモリ Xeon X5570: 4 GB PC3-10600R DDR3-SDRAM × 6 枚 Xeon X5680、X5690: 4 GB PC3-10600R DDR3-SDRAM × 12 枚 ソフトウェアオペレーティングシステム Xeon X5570、X5680: Windows Server 2008 R2 Enterprise
Xeon X5690: Windows Server 2008 Enterprise x64 Edition SP2 JVM バージョン IBM J9 VM (build 2.4, JRE 1.6.0 IBM J9 2.4 Windows Server 2008
amd64-64 jvmwaamd64-6460sr6-20090923_42924 (JIT enabled, AOT enabled) 国または販売地域によっては、一部のコンポーネントが利用できない場合があります。 0 200000 400000 600000 800000 1000000 1 2 3 4 5 6 7 8 warehouses 2 x Xeon X5690 2 x Xeon X5680 2 x Xeon X5570 632425 927872 943801 0 200000 400000 600000 800000 1000000
2 x Xeon X5570 2 x Xeon X5680 2 x Xeon X5690 SPECjbb2005 bops: PRIMERGY BX922 S2 SPECjbb2005 bops: PRIMERGY BX922 S2
StorageBench
ベンチマークの説明
ディスクサブシステムの性能を評価するために、富士通テクノロジー・ソリューションズは StorageBench というベンチマークを開発しました。StorageBench は、システムに接続されている異なるストレージシス テムを比較することができます。このベンチマークでは、インテルで開発された Iometer という測定ツール と、実際の顧客アプリケーションで発生する負荷プロファイルを組み合わせ、測定シナリオを定義しました。 測定ツール 2001 年末以降、Iometer は http://SourceForge.net のプロジェクトとなり、さまざまなプラットフォームに 移植され、国際的な開発者グループによって強化されています。Iometer は、Windows のユーザーインター フェースと、さまざまなプラットフォームで利用できる、いわゆる「dynamo」で構成されています。この 数年でこれら 2 つのコンポーネントは http://www.iometer.org/ または http://sourceforge.net/projects/iometer から「インテルオープンソースライセンス」でダウンロードできるようになりました。 Iometer は、I/O サブシステムへのアクセスについて、実際のアプリケーションの動作を再現することがで きます。このために、使用するブロックサイズ、シーケンシャルリード/ライト、ランダムリード/ライト、 およびこれらの組み合わせなど、アクセスの種類の設定が可能です。また、同時アクセス数(「未処理 I/O」)も設定できます。テスト結果として、Iometer は 1 秒あたりのスループット、1 秒あたりのトランザ クション数、各アクセスパターンの平均応答時間などの基本的なパラメーターを含むカンマで区切られたテ キストファイル(.csv)を生成します。この方法により、特定のアクセスパターンを使ってさまざまなサブ システムの性能を比較できます。Iometer は、ファイルシステムを使用して、サブシステムにアクセスでき るばかりでなく、いわゆる RAW デバイスにもアクセスできます。 Iometer では、さまざまなアプリケーションのアクセスパターンをシミュレーションおよび測定できますが、 オペレーティングシステムのファイルキャッシュは考慮されません。また、オペレーションは単一のテスト ファイル上のブロックで行われます。 負荷プロファイル アプリケーションがマスストレージシステムにアクセスする方法は、ストレージシステムのパフォーマンス に多大な影響を及ぼします。各種アプリケーションのさまざまなアクセスパターンの例を次に示します。 アプリケーション アクセスパターン データベース(データ転送) ランダム、67 %リード、33 %ライト、8 KB(SQL Server) データベース(ログファイル) シーケンシャル、100 %ライト、64 KB ブロック バックアップ シーケンシャル、100 %リード、64 KB ブロック リストア シーケンシャル、100 %ライト、64 KB ブロック ビデオストリーミング シーケンシャル、100 %リード、ブロック ≥ 64 KB ファイルサーバ ランダム、67 %リード、33 %ライト、64 KB ブロック Web サーバ ランダム、100 %リード、64 KB ブロック オペレーティングシステム ランダム、40 %リード、60 %ライト、ブロック ≥ 4 KB ファイルコピー ランダム、50 %リード、50 %ライト、64 KB ブロックここから、次の 4 つの特徴的な負荷プロファイルが導き出されました。 負荷プロファイル アクセス アクセスパターン ブロック サイズ 未処理 I/O 負荷 ツール リード ライト ストリーミング シーケンシャル 100 % 64 KB 3 Iometer リストア シーケンシャル 100 % 64 KB 3 Iometer データベース ランダム 67 % 33 % 8 KB 3 Iometer ファイルサーバ ランダム 67 % 33 % 64 KB 3 Iometer 上記 4 つの負荷プロファイルは、すべて Iometer で生成されました。 測定シナリオ 比較できる測定結果を得るためには、再現可能な同一の環境ですべての測定を行うことが重要です。そのた め StorageBench は上記の負荷プロファイルに加えて次の規則に基づいています。 実際の顧客構成で RAW デバイスを使用するのは例外的な状況のみであるため、内蔵ディスクのパ フォーマンス測定は、常にファイルシステムを使用したディスク上で行います。高いパフォーマン スが他のファイルシステムや RAW デバイスで実現できる場合でも、Windows では NTFS、Linux では ext3 を使用します。 ハードディスクは、コンピュータシステムで最もエラーが発生しやすいコンポーネントです。その ため、サーバシステムでは RAID コントローラーを使用して、ハードディスクの故障によるデータ 損失を防止します。ここでは、複数のハードディスクを組み合わせて「RAID(Redundant Array of Independent Disks)」を形成し、1 つのハードディスクが故障した場合でもすべてのデータが維持 されるように(RAID 0 を除く)、すべてのデータを複数のハードディスクに分散させます。ハード ディスクをアレイで編成する場合の一般的な RAID レベルは、RAID 0、RAID 1、RAID 5、RAID 6、 RAID 10、RAID 50、RAID 60 です。各種 RAID アレイの基本情報については、資料『パフォーマン スレポート PRIMERGY 用モジュラーRAID』を参照してください。
ディスクの数および装着されているコントローラーに応じて RAID 構成を変えて PRIMERGY サー バの StorageBench を測定しました。2 台のハードディスクを搭載できるシステムでは RAID 1 およ び RAID 0 を使用し、3 台以上では RAID 1E および RAID 5 も使用します。コントローラーでサポ ートされている場合は、さらに上位の RAID レベルを使用します。
測定には、ハードディスクの容量に関係なく、32 GB の測定ファイルを常に使用しています。
I/O サブシステムの効率の評価では、プロセッサパフォーマンスおよびメモリ構成は、今日のシステ
ムでは大きな要因ではありません。ボトルネックは通常は CPU やメモリではなく、ハードディスク や RAID コントローラーにあります。したがって、CPU やメモリの構成を変更して StorageBench で解析する必要はありません。 測定結果 負荷プロファイルごとに、StorageBench はさまざまな主要指標を提供します。例えば、1 秒あたりのデー タ転送量をメガバイトで表した「データスループット」(MB/s)、1 秒あたりの I/O オペレーション数であ る「トランザクションレート」(IO/s)、およびミリ秒(ms)単位の「待機時間(平均アクセス時間)」な どです。通常、シーケンシャルな負荷プロファイルでは「データスループット」が使用され、小規模なブロ ックサイズを使用するランダムな負荷プロファイルでは「トランザクションレート」が使用されます。スル ープットおよびトランザクションレートは互いに直接比例し、次の式で計算できます。 データスループット [MB/s] = トランザクションレート [ディスクIO / s] × ブロックサイズ [MB] トランザクションレート [ディスクIO / s] = データスループット [MB/s] / ブロックサイズ [MB]
ベンチマーク結果
PRIMERGY BX922 S2 サーバブレードには、SATA RAID オンボードコントローラーが搭載されています。 このコントローラーは、サーバのメインボード(Intel ICH10R チップセット)に搭載されており、RAID ス タックはサーバの CPU によって認識されます。この RAID ソリューションは、SATA ハードディスクを接 続したときのみ使用できます。PRIMERGY BX922 S2 サーバブレードは、2.5 インチ HD(Hard Disk:ハー ドディスク)1 台または 2.5 インチ SSD(Solid State Drive:半導体ドライブ) 2 台のいずれかに対して内 蔵ドライブサポートを提供します。コントローラー自体は、RAID レベル 0、1、および 10 をサポートしま す。本サーバでは最大 2 台の内蔵ハードディスクを搭載できるので、構成できる RAID レベルは、0 と 1 の みになります。このコントローラーにはキャッシュがありません。このコントローラーには、さまざまな SATA ハードディスクを接続できます。必要なパフォーマンスによって、適切なディスクサブシステムを選 択できます。 PRIMERGY BX922 S2 サーバブレードでは、次の SATA ハードディスクを選択できます。 2.5 インチ SATA HD、容量 160 GB、320 GB(5.4 krpm) 2.5 インチ SATA SSD、容量 32 GB、64 GB SATA RAID オンボードコントローラー 次のグラフは、それぞれ異なるテクノロジーをベースにした 2 つの 2.5 インチ SATA ハードディスクのパ フォーマンスの違いを示しています。5.4 krpm HD を SSD と比較します。どちらも単一ディスクとして構 成し、SATA オンボードコントローラーに 接続して測定しました。このグラフは、異 なるディスクキャッシュ設定で 64 KB ブ ロックを使用してシーケンシャルリードお よびライトを実行したときのスループット を示しています。 SSD の読み取りスループットは HD の 2.9 倍で、キャッシュ設定に依存しません。 SSD の書き込みスループットは、ディス クキャッシュを有効にした場合と無効にし た場合とで、それぞれ HD の 2.4 倍および 14.6 倍になりました。 優れたパフォーマンスを得るためにキャッシュ設定がいかに重要であるかは、特に HD で明らかです。上の グラフでは、ディスクキャッシュを有効にした結果として、シーケンシャルライトのスループットが 11.6 倍に増加したことが示されています。SSD のスループットは 1.9 倍に増加しています。 2 つのハードディスクのパフォーマンスの相違点は、ランダムアクセスで確認できます。次のグラフは、異 なるディスクキャッシュ設定で、8 KB および 64 KB ブロックを使用してランダムアクセスを実行したとき のスループットを示しています。スループ ットはディスクキャッシュ設定によって変 化しました。SSD でディスクキャッシュ を有効にした場合のスループットは、 8 KB ブロックで HD の 40 倍、64 KB ブロ ックで 20 倍になりました。 SSD に対して 8 KB ブロックと 64 KB ブ ロックのランダムアクセスを実行した場合 に、ディスクキャッシュを有効にすること で、それぞれ約 53 %および 41 %スルー プットが向上しました。 HD に対して 8 KB ブロックと 64 KB ブロ ックのランダムアクセスで、ディスクキャッシュを有効にした場合、それぞれ約 32 %および 23 %スルー プットが向上しました。
結論
PRIMERGY BX922 S2 サーバブレードでオンボード SATA RAID コントローラーを使用した場合、ユーザ ー要件を満たす優れた低コストソリューションをユーザーに提供できます。
PRIMERGY BX922 S2 サーバブレードでは、2.5 インチ SATA SSD 2 台または 2.5 インチ 5.4 krpm SATA HD 1 台を選択できます。SSD は、HD よりも大幅に高いスループット、待機時間の短縮、1 秒あたりの I/O 数の増加を提供します。一方、HD は大容量のストレージを提供し、1 GB あたりの価格が大幅に安価です。 使用するハードディスクは、必要なパフォーマンスおよび目的に応じて、選択する必要があります。 最大のパフォーマンスを得るには、ディスクキャッシュを有効にすることをお勧めします。その際、UPS も使用してください。使用するディスクの種類とアクセスパターンに応じて、パフォーマンスは最大 11.6 倍に向上します。
ベンチマーク環境
ここで説明したすべての測定は、次に示すコンポーネントを使用して行いました。 コンポーネント 詳細 サーバ PRIMERGY BX922 S2オペレーティングシステム Windows Server 2008、Enterprise Edition
バージョン:6.0.6001 Service Pack 1 ビルド 6001 ファイルシステム NTFS 測定ツール Iometer 27.07.2006 測定データ 32 GB の測定ファイル オンボード SATA コントローラー Intel ICH10R BIOS:6.00.1.05 SATA RAID モード
ハードディスク SATA、2.5 インチ、5.4 krpm Hitachi HTE543232L9A300、320 GB 半導体ドライブ SATA、2.5 インチ Intel SSDSA2SH064G1GC、64 GB 国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
OLTP-2
ベンチマークの説明
OLTP とは、Online Transaction Processing(オンライントランザクション処理)の略です。OLTP-2 ベン チマークは、データベースソリューションの標準的なアプリケーションシナリオを基にしています。OLTP-2 では、データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps) が測定されます。 独立した機関によって標準化され、その規則を順守して測定しているかを監視される SPECint や TPC-E の ようなベンチマークとは異なり、OLTP-2 は、富士通が開発した固有のベンチマークです。OLTP-2 は、デ ータベースのベンチマークとしてよく知られている TPC-E を基に開発されました。そして、CPU やメモリ の構成に応じてシステムがスケーラブルな性能を示すことを実証するために、さまざまな構成で測定できる ように設計されています。 OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシ ナリオをシミュレートしても、この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートする ため、結果を比較したり同等のものとして扱うことはできません。通常、OLTP-2 の値は、TPC-E に近い値 となります。しかし、価格性能比が算出されないため、直接比較できないだけでなく、OLTP-2 の結果を TPC-E として利用することも許可されません。 詳細情報は、『ベンチマークの概要 OLTP-2』を参照してください。
ベンチマーク結果
PRIMERGY RX300 S6 の OLTP-2 の値は、Xeon 55xx および 56xx プロセッサシリーズを使用して、48 GB、 72 GB、96 GB、144 GB、および 192 GB のメモリ構成で測定しました。 次の表は、測定対象のプロセッサの仕様を示しています。 プロセッサ コア数/ チップ L3 キャッシュ プロセッサ 周波数 QPI スピード HT TM TDP 5500 E5503 2 4 MB 2.00 GHz 4.8 GT/s - - 80 W E5506 4 4 MB 2.13 GHz 4.8 GT/s - - 80 W E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W 5600 シリ ーズ 4 コア E5603 4 4 MB 1.60 GHz 4.8 GT/s - - 80 W E5606 4 8 MB 2.13 GHz 4.8 GT/s - - 80 W E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W 4 コア 、 HT 、 T M L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W 6 コア 、 HT 、 T M L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W QPI=Quick Path インターコネクト、GT=ギガトランスファー、HT=ハイパースレッディング、TM=ターボモード、TDP=熱設計電力
データベースのパフォーマンスは、CPU やメモリの構成と、データベースで使用するディスクサブシステ ムの接続性によって、大きく異なります。Xeon 55xx および 56xx プロセッサシリーズは、次のようなさま ざまなシステム構成に対応しています。 プロセッサ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 5500 E5503 E5506 E5507 5600 シリ ーズ 4 コア E5603 E5606 E5607 L5609 4 コア 、 HT 、 T M L5630 E5620 E5630 E5640 X5647 X5667 X5672 X5677 X5687 6 コア 、 HT 、 T M L5640 E5645 E5649 X5650 X5660 X5670 X5675 X5680 X5690 最大 メモリ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 CPU × 1 48 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB 144 GB *) CPU × 2 96 GB 192 GB 192 GB 192 GB 192 GB 144 GB 192 GB 192 GB 288 GB *) *) 16 GB デュアルランクメモリモジュールの特別リリース
次に示す CPU およびメモリの性能評価では、ディスクサブシステムは適切であり、ボトルネックにならな いものとします。
PRIMERGY RX300 S6 の OLTP-2 の値は、オペレーティングシステム Microsoft Windows Server 2008 R2 Enterprise とデータベース SQL Server 2008 R2 Enterprise x64 Edition で測定したものです。システム構成
の詳細については、「ベンチマーク環境」を参照してください。 データベース環境でメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモ リ容量が十分にあることが重要です。そのため、16 GB モジュールの最大構成、8 GB モジュールの最大構 成、および 8 GB モジュールの別構成で測定しました。周波数は、プロセッサと、メモリモジュールの種類 および数によって変わります。メモリパフォーマンスの詳細については、ホワイトペーパー『Xeon 5600 (Westmere-EP)搭載システムのメモリパフォーマンス』を参照してください。 次のグラフは、Intel Xeon 5600 および 5500 シリーズのプロセッサ(1 基または 2 基)と、さまざまなメモ リ構成で測定した OLTP-2 トランザクションレートを示しています。 多種類のプロセッサにより、広範にわたるレベルのパフォーマンスが実現されていることがわかります。同 じ最大メモリ構成で比較すると、パフォーマンスが最も低いプロセッサ(Xeon E5503)を使用した場合に 比べ、パフォーマンスが最も高いプロセッサ(Xeon X5690)を使用した場合は、OLTP-2 値は 5.4 倍にな っています。 測定結果が示す性能に基づき、プロセッサをいくつかのグループに分類できます。 最もパフォーマンスが低いのは、わずか 2 コアのプロセッサである Xeon E5503 です。 その次のグループのプロセッサは、OLTP-2 でほぼ 2 倍のパフォーマンスを達成しています。ハイパースレ ッディングをサポートしていない 4 コアプロセッサ(Xeon E5506、Xeon E5507、Xeon E5603、Xeon E5606、Xeon E5607 および Xeon L5609)が、このグループです。OLTP-2 の測定では、コア数を 2 倍に すると、パフォーマンスもほぼ 2 倍になります。
ハイパースレッディングとターボモードの両方をサポートする 4 コアプロセッサでは、さらに高いパフォー マンスが得られます。Xeon L5630、Xeon E5620、Xeon E5630、Xeon E5640 および Xeon X5647 がこの グループです。このグループでは、ハイパースレッディングによって論理的なプロセッサコア数が 2 倍にな るため、OLTP-2 の測定では特に優れた結果が得られます。Xeon X5667、Xeon X5672、Xeon X5677、 Xeon X5687 は、同じくハイパースレッディングとターボモードをサポートする 4 コアプロセッサですが、 高レベルのターボモードを利用可能で、QPI スピードも 5.86 GT/s よりさらに高速の 6.4 GT/s です。これ により、このグループの 4 コアプロセッサは、下位の 6 コアプロセッサであるクロック周波数、ターボモ ードレベル、QPI スピードが低いモデル(Xeon E5645、および Xeon E5649)に近いスループットを達成 できます。
最高のパフォーマンスを発揮するのは、QPI スピード 6.4 GT/s を実現する 6 コアプロセッサ Xeon X5650、 Xeon X5660、Xeon X5670、Xeon X5675、Xeon X5680 および Xeon X5690 のグループです。このグルー プでは、2 基の CPU を使用した OLTP-2 の測定のほとんどで、96 GB(8 GB DIMM × 12)で周波数 1333 MHz のメモリ構成の方が、144 GB(8 GB DIMM × 18)で周波数 800 MHz のメモリ構成より優れた 結果が得られました。
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 E5503-2Core E5506-4Core E5507-4Core E5603-4Core E5606-4Core E5607-4Core L5609-4Core L5630-4Core E5620-4Core E5630-4Core E5640-4Core X5647-4Core X5667-4Core X5672-4Core X5677-4Core X5687-4Core L5640-6Core E5645-6Core E5649-6Core X5650-6Core X5660-6Core X5670-6Core X5675-6Core X5680-6Core X5690-6Core
OLTP-2 tps
2CPUs-192GB 2CPUs-144GB 2CPUs-96GB 1CPU-96GB 1CPU-72GB 1CPU-48GB
PRIMERGY 現行モデルでの OLTP-2 の最高値は、旧モデルの最高値と比較して約 50 %向上しています。 0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 + ~ 50% tps 現行モデル TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 旧モデル TX200 S5 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - - 2 × X5570 96 GB RAM 2 × W5590 96 GB RAM 2 × X5670 96 GB RAM 2 × X5690 96 GB RAM 現行モデル 旧モデル OLTP-2 tps の最高値 システム世代間の比較
ベンチマーク環境
一般的な測定環境を以下に示します。
Intel Xeon 55xx および 56xx プロセッサシリーズの OLTP-2 のすべての値は、PRIMERGY RX300 S6 を使 用して測定しました。 データベースサーバ(B 層) ハードウェア システム PRIMERGY RX300 S6 プロセッサ Xeon E5503(2 コア、2.00 GHz)× 2 基 Xeon E5506(4 コア、2.13 GHz)× 2 基 Xeon E5507(4 コア、2.27 GHz)× 2 基 Xeon E5603(4 コア、1.60 GHz)× 2 基 Xeon E5606(4 コア、2.13 GHz)× 2 基 Xeon E5607(4 コア、2.27 GHz)× 2 基 Xeon L5609(4 コア、1.87 GHz)× 2 基 Xeon L5630(4 コア、2.13 GHz)× 2 基 Xeon E5620(4 コア、2.40 GHz)× 2 基 Xeon E5630(4 コア、2.53 GHz)× 2 基 Xeon E5640(4 コア、2.67 GHz)× 2 基 Xeon X5647(4 コア、2.93 GHz)× 2 基 Xeon X5667(4 コア、3.07 GHz)× 2 基 Xeon X5672(4 コア、3.20 GHz)× 2 基 Xeon X5677(4 コア、3.46 GHz)× 2 基 Xeon X5687(4 コア、3.60 GHz)× 2 基 Xeon L5640(6 コア、2.27 GHz)× 2 基 Xeon E5645(6 コア、2.40 GHz)× 2 基 Xeon E5649(6 コア、2.53 GHz)× 2 基 Xeon X5650(6 コア、2.67 GHz)× 2 基 Xeon X5660(6 コア、2.80 GHz)× 2 基 Xeon X5670(6 コア、2.93 GHz)× 2 基 Xeon X5675(6 コア、3.06 GHz)× 2 基 Xeon X5680(6 コア、3.33 GHz)× 2 基 Xeon X5690(6 コア、3.46 GHz)× 2 基
メモリ 48 GB~192 GB、 1333 MHz Registered ECC DDR3(8 GB DIMM)、または
1066 MHz Registered ECC DDR3(16 GB DIMM)
設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効 ネットワーク インターフェース オンボード LAN 1 Gbps × 2 基 ディスクサブシステム RX300 S6: オンボード RAID コントローラー SAS 6G 5/6 512 MB 73 GB 15k rpm SAS ドライブ × 2 台、RAID1(OS)、 147 GB 15k rpm SAS ドライ ブ × 6 台、RAID10(ログ) LSI MegaRAID SAS 9280-8e × 5 基
JX40 × 5 台:各 64 GB SSD ドライブ × 24 台、RAID5(データ) ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise
データベース SQL Server 2008 R2 Enterprise x64
アプリケーション
サーバ
A 層
B 層
ネットワーク ネットワーク クライアントデータベースサーバ
ストレージサブシステムSUT(System Under Test:テスト対象システム)
アプリケーションサーバ(A 層) ハードウェア システム PRIMERGY RX200 S6 プロセッサ Xeon E5640 (6 コア、2.66 GHz)× 1 基 メモリ 12 GB、1333 MHz Registered ECC DDR3 ネットワーク インターフェース オンボード LAN 1 Gbps × 2 基、デュアルポート LAN 1 Gbps × 2 基 ディスクサブシステム 73 GB 15k rpm SAS ドライブ × 1 台 ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard クライアント ハードウェア システム PRIMERGY RX200 S5 プロセッサ Xeon X5570(4 コア、2.93 GHz)× 2 基 メモリ 24 GB、1333 MHz Registered ECC DDR3 ネットワーク インターフェース オンボード LAN 1 Gbps × 2 基 ディスクサブシステム 73 GB 15k rpm SAS ドライブ × 1 台 ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard
OLTP-2 ソフトウェア EGen バージョン 1.12.0
SAP SD
ベンチマークの説明
SAP アプリケーションソフトウェアは、標準的な業務プロセスを管理するためのモジュールで構成されて います。モジュールには、受注組立(ATO)、財務会計(FI)、人事管理(HR)、在庫購買管理(MM)、 生産計画(PP)、販売管理(SD)などの ERP(企業資源計画)用のものや、SCM(サプライチェーンマ ネジメント)、小売、銀行業務、公益事業、BI(ビジネスインテリジェンス)、CRM(顧客関係管理)、 PLM(製品ライフサイクル管理)用のものがあります。 SAP アプリケーションソフトウェアは必ずデータベースと関連しています。したがって、SAP の構成には、 ハードウェアに加え、ソフトウェアコンポーネントであるオペレーティングシステムとデータベース、およ び SAP ソフトウェア自体も含まれます。 SAP アプリケーションシステムのパフォーマンス、安定性およびスケーラビリティを評価するために、 SAP AG は SAP 標準アプリケーションベンチマークを開発しました。中でも、最も広く使用されており最 も重要なのは、SD ベンチマークです。これらのベンチマークでは、システム全体のパフォーマンスが分析 されるため、コンポーネントの統合品質を測定できます。 ベンチマークは、2 層の構成と 3 層の構成で異なります。2 層の構成では、SAP アプリケーションとデータ ベースを 1 台のサーバにインストールします。3 層の構成では、SAP アプリケーションの各コンポーネン トを数台のサーバに分散でき、別のサーバでデータベースを処理します。 SAP AG(ドイツ、Walldorf)によって開発されたベンチマークの詳細な仕様は、 http://www.sap.com/benchmark を参照してください。ベンチマーク結果
2010 年 3 月 19 日に Xeon X5680 プロセッサ 2 基を搭載した PRIMERGY BX922 S2(Windows Server 2008 R2 Enterprise で SAP Enhancement Package 4 for SAP ERP 6.0 と SQL Server 2008 を使用)で次の 結果を得たことが認証されました(認証番号 2010008)。
認証番号 2010008
Number of SAP SD benchmark users 4910
Average dialog response time 0.99 seconds Throughput
Fully processed order line items/hour Dialog steps/hour
SAPS
536,000 1,608,000 26,800
Average database request time (dialog/update) 0.024 sec / 0.045 sec CPU utilization of central server 99%
Operating system, central server Windows Server 2008 R2 Enterprise
RDBMS SQL Server 2008
SAP Business Suite software SAP enhancement package 4 for SAP ERP 6.0 Configuration
Central Server
PRIMERGY BX922 S2
2 processors / 12 cores / 24 threads Xeon X5680
PRIMERGY BX922 S2 は、SAP ERP 6.0 用 SAP 拡張パッケージ 4 における SAP SD Standard Application Benchmark(2 プロセッサ、2 層)で、最高の結果を得ました(2010 年 4 月 8 日現在)。2 2 上記のベンチマーク結果は、2010 年 4 月 8 日現在の値を使用しています。また、上記の比較は、HP、Sun および富 士通が現在出荷しているベストパフォーマンスの 2 ソケットサーバに基づいています。SAP SD(2 層)ベンチマー クの最新の結果は、http://www.sap.com/solutions/benchmark/sd2tier.epx を参照してください。 3800 4705 4860 4910 0 1000 2000 3000 4000 5000 Number of Benchmark Users
Fujitsu PRIMERGY BX922 S2 2 x Xeon X5680
2 processors/12 cores/24 threads 72 GB RAM
Windows Server 2008 R2 Enterprise SQL Server 2008
SAP enhancement package 4 for SAP ERP 6.0 Certification number: 2010008
Fujitsu PRIMERGY TX300 S6 / RX300 S6 2 x Xeon X5680
2 processors/12 cores/24 threads 88 GB RAM
Windows Server 2008 R2 Enterprise SQL Server 2008
SAP enhancement package 4 for SAP ERP 6.0 Certification number: 2010007
HP ProLiant BL460c G6 2 x Xeon X5670
2 processors/12 cores/24 threads 96 GB RAM
Windows Server 2008 Enterprise Edition SQL Server 2008
SAP enhancement package 4 for SAP ERP 6.0 Certification number: 2010009
Sun Fire X4270 2 x Xeon X5570
2 processors/8 cores/16 threads 48 GB RAM
Solaris 10 Oracle 10g
SAP enhancement package 4 for SAP ERP 6.0 (Unicode) Certification number: 2009033
SAP ERP 6.0 用 SAP 拡張パッケージ 4 における SAP SD(2 プロセッササーバ、2 層)の結果: PRIMERGY BX922 S2 vs. その他の 2 ソケットサーバ
ベンチマーク環境
SUT(System Under Test:テスト対象システム)
ハードウェア サーバ PRIMERGY BX922 S2 プロセッサ Xeon X5680 × 2 基 メモリ 8 GB PC3-10600R DDR3-SDRAM × 9 枚 ディスクサブシステム PRIMERGY BX922 S2:
LSI MegaRAID SAS 1064E controller × 1 基 2.5" SAS disks, 73 GB, 15 krpm × 2 台 FC Mezzanine Card 8 Gbit/s 2-port × 1 枚 PRIMERGY SX940 S1 × 1 台:
RAID 5/6 SAS based on LSI MegaRAID 512MB × 1 基 RAID Contr BBU Upgrade for RAID 5/6 V16 × 1 基 SSD SATA 3G 64GB SLC HOT PLUG 2.5" EP × 2 基
Fibre Channel Mezzanine Card 2 x 8 Gb Emulex (MC-FC82E), PCIe x4 × 1 枚
FibreCAT CX3-40F × 1 台 ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise データベース SQL Server 2008 Enterprise x64 Edition
SAP Business Suite ソフトウェア SAP Enhancement Package 4 for SAP ERP 6.0(Unicode) 負荷ジェネレーター ハードウェア モデル PRIMERGY RX600 S2 プロセッサ Xeon 7040(3 GHz、4 MB L2 キャッシュ)× 4 基 メモリ 8 GB PC2-3200 DDR2-SDRAM ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。 2 層環境
テスト対象システム 負荷ジェネレーター