ホワイトペーパー
FUJITSU PRIMERGY サーバ
パフォーマンスレポート
PRIMERGY BX924 S2
本書では、PRIMERGY BX924 S2 で実行したベンチマークの概要について説明します。
PRIMERGY BX924 S2 のパフォーマンスデータを、他の PRIMERGY モデルと比較して
説明しています。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク
環境の説明も掲載しています。
バージョン 2.0a 2011-12-21 目次 ドキュメントの履歴 ... 2 製品データ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 13 OLTP-2 ... 16 vServCon ... 23 VMmark V1 ... 31 STREAM ... 35 関連資料 ... 37 お問い合わせ先 ... 38ドキュメントの履歴
バージョン 1.2 以下のベンチマークを含むレポートの初版 SPECcpu2006 Xeon E5503、E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677、L5640、 X5650、X5660、X5670、X5680 で測定 SPECjbb2005 Xeon X5680 で測定 OLTP-2 Xeon E5503、E5506、E5507、E5620、E5630、E5640、L5609、L5630、L5640、X5650、X5660、 X5667、X5670、X5677、X5680 で測定 vServCon Xeon E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677、L5640、X5650、X5660、 X5670、X5680 で測定 VMmark V1 Xeon X5677、X5680 で測定 バージョン 2.0 以下のベンチマークを追加 STREAM Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5672、X5675、X5687、X5690 で測定 以下のベンチマークを更新 SPECcpu2006 Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5672、X5675、X5687、X5690 で測定 (インテル C++/Fortran コンパイラー 12.0) SPECjbb2005 Xeon X5690 で測定 OLTP-2 Xeon 55xx および 56xx プロセッサシリーズで測定 vServCon Xeon 55xx および 56xx プロセッサシリーズで測定 バージョン 2.0a 軽微な訂正製品データ
2 ソケットサーバブレード PRIMERGY BX924 S2 には、Intel 5500 チップセット、Intel Xeon プロセッサ 5500 シリーズまたは 5600 シリーズ(2 コア、4 コア、6 コア)2 基、最大 288 GB の DDR3-SDRAM が搭 載可能な DIMM スロット 18 本、2 ポート 10 Gbit LAN コントローラー 1 基、SSD 最大 2 台に対応するオ ンボードコントローラー 1 基が搭載されています。
詳細な製品データについては、次のデータシートを参照してください。 PRIMERGY BX400 S1 データシート
PRIMERGY BX900 S1 データシート PRIMERGY BX924 S2 データシート
SPECcpu2006
ベンチマークの説明
SPECcpu2006 は、整数演算および浮動小数点演算でシステム性能を測定するベンチマークです。このベン チマークは、12 本のアプリケーションから成る整数演算テストセット(SPECint2006)、および 17 本のア プリケーションから成る浮動小数点演算テストセット(SPECfp2006)で構成されています。これらのアプ リケーションは大量の演算を実行し、CPU およびメモリを集中的に使用します。他のコンポーネント (ディスク I/O、ネットワークなど)は、このベンチマークでは測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード として利用可能で、実際に測定する前にコンパイルする必要があります。したがって、使用するコンパイ ラーのバージョンやその最適化設定が、測定結果に影響を与えます。 SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。1 つ目の方法(SPECint2006 およ び SPECfp2006)では、1 つのタスクの処理に必要な時間を測定します。2 つ目の方法(SPECint_rate2006 および SPECfp_rate2006)では、スループット(並列処理できるタスク数)を測定します。いずれの方法 も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これらは、コンパイラー最適化 を使用するかどうかという点で異なります。「ベース」値は常に公開されていますが、「ピーク」値はオプ ションです。 ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション SPECint2006 整数 ピーク アグレッシブ 速度 単体実行 SPECint_base2006 整数 ベース 標準 SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行 SPECint_rate_base2006 整数 ベース 標準 SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行 SPECfp_base2006 浮動小数点 ベース 標準 SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行 SPECfp_rate_base2006 浮動小数点 ベース 標準 測定結果は、個々のベンチマークで得られた正規化比の幾何平均です。算術平均と比較して、幾何平均の方 が、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムがリファレン スシステムと比較してどの程度高速であるかを測定することです。例えば、リファレンスシステムの SPECint_base2006、SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結 果が、値「1」と判定されたとします。このとき、SPECint_base2006 の値が「2」の場合は、測定システム が こ の ベ ン チ マ ー ク を リ フ ァ レ ン ス シ ス テ ム の 2 倍 の 速 さ で 実 行 し た こ と を 意 味 し ま す 。 SPECfp_rate_base2006 の値が「4」の場合は、測定対象システムがリファレンスシステムの約 4/[ベー スコピー数]倍の速さでこのベンチマークを実行したことを意味します。「ベースコピー数」とは、実行さ れたベンチマークの並行インスタンスの数です。 弊社では、SPEC の公開用に、SPECcpu2006 のすべての測定値を提出しているわけではありません。その ため、SPEC の Web サイトに公開されていない結果が一部あります。弊社では、すべての測定のログファ イルをアーカイブしているので、測定の内容に関していつでも証明できます。ベンチマーク結果
測定 1 Xeon 5500 および 5600 シリーズのプロセッサを使用して、PRIMERGY BX924 S2 を測定しました。ベン チマークプログラムは、インテル C++/Fortran コンパイラー 11.1 でコンパイルし、SUSE Linux Enterprise Server 11(64 ビット)で実行しました。すべての結果は、http://www.spec.org で公開されています。プロセッサ コア GHz L3 キャッ シュ QPI スピード TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 20.6 22.3 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 21.9 23.8 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 22.9 25.1 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 21.3 22.6 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 26.1 28.1 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 29.5 31.9 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 30.8 33.2 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 31.9 34.5 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 37.8 40.8 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 40.1 43.3 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 30.6 33.3 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 34.3 36.9 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 35.4 38.2 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 36.7 39.6 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 39.0 42.1 プロセッサ コア GHz L3 キャッ シュ QPI スピード TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.0 72.9 40.2 79.0 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 71.1 139 76.1 148 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 74.1 144 79.1 154 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 69.9 136 75.6 146 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 94.7 181 101 193 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 107 210 114 224 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 111 218 118 231 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 116 226 122 239 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 137 269 146 286 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 145 283 153 300 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 144 276 154 295 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 165 322 176 344 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 170 330 181 353 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 174 338 185 362 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 182 354 194 378
プロセッサ コア GHz L3 キャッ シュ QPI スピード TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 23.7 25.7 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 25.9 27.9 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 27.2 29.2 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 25.8 27.5 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 30.6 32.9 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 34.3 36.9 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 35.3 38.1 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 36.8 39.6 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 43.5 46.7 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 45.5 48.9 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 36.1 39.0 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 40.1 43.2 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 41.3 44.3 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 42.4 45.4 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 44.6 48.1 プロセッサ コア GHz L3 キャッ シュ QPI スピード TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.4 72.5 38.6 75.0 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 60.5 117 62.3 120 Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 62.2 120 64.1 123 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 63.1 116 65.3 120 Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 74.6 136 77.6 141 Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 84.6 164 87.7 170 Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 86.9 167 90.1 174 Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 89.0 172 92.3 178 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 106 206 110 213 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 110 213 114 221 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 107 198 110 205 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 119 232 123 241 Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 121 236 125 244 Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 124 241 128 249 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 127 247 132 256
測定 2
2010 年 12 月から 2011 年 3 月にかけて、Xeon 5600 シリーズのプロセッサを使用して、PRIMERGY BX924 S2 を測定しました。 結果は次の 4 つの表に示すとおりです。ベンチマークプログラムは、インテル C++/Fortran コンパイラー 12.0 でコンパイルし、SUSE Linux Enterprise Server 11 SP1(64 ビット)で実
行しました。次の表の太字の値は、http://www.spec.org で公開されています。「予測」という印付きの値は、 予測値です。 プロセッサ コア GHz L3 キャッシュ QPI スピード TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 22.6(予測) 23.7(予測) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 19.1 20.0 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 24.0(予測) 25.3(予測) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 25.1(予測) 26.7(予測) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 25.6 26.7 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 26.8 28.0 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 24.8(予測) 24.1.(予測) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 28.8(予測) 30.1(予測) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 32.4(予測) 34.2(予測) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 33.8(予測) 35.6(予測) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 35.0(予測) 37.0(予測) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 37.5 39.6 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 41.5(予測) 43.8(予測) Xeon X5672 4 3.20 12 MB 6.40 GT/s 95 W 42.5 45.0 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 44.0(予測) 46.5(予測) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 44.9 47.5 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 33.6(予測) 35.7(予測) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 33.2 35.1 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 34.4 36.4 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 37.7(予測) 39.6(予測) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 38.9(予測) 41.0(予測) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 40.3(予測) 42.5(予測) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 40.9 43.0 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 42.8(予測) 45.2(予測) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 43.2 45.6
プロセッサ コア GHz キャッシュ L3 スピード QPI TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 39.0(予測) 76.6(予測) 41.9(予測) 82.7(予測) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 60.8 118 63.3 125 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 75.0(予測) 146(予測) 79.3(予測) 155(予測) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 78.2(予測) 151(予測) 82.4(予測) 161(予測) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 79.6 154 84.4 163 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 83.3 161 88.2 170 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 73.5(予測) 144(予測) 79.3(予測) 153(予測) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 99.6(予測) 191(予測) 106(予測) 203(予測) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 113(予測) 222(予測) 120(予測) 235(予測) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 117(予測) 231(予測) 124(予測) 243(予測) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 122(予測) 239(予測) 128(予測) 251(予測) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 130 253 137 267 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 144(予測) 285(予測) 153(予測) 300(予測) Xeon X5672 4 3.20 12 MB 6.40 GT/s 95 W 148 290 156 306 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 153(予測) 299(予測) 161(予測) 315(予測) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 156 306 168 323 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 151(予測) 292(予測) 162(予測) 310(予測) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 153 293 163 314 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 158 303 168 324 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 177(予測) 346(予測) 188(予測) 368(予測) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 183(予測) 354(予測) 194(予測) 377(予測) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 187(予測) 363(予測) 198(予測) 387(予測) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 190 371 202 396 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 196(予測) 380(予測) 208(予測) 404(予測) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 199 388 212 414
プロセッサ コア GHz L3 キャッシュ QPI スピード TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 32.4(予測) 33.9(予測) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 29.2 31.2 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 35.4(予測) 36.8(予測) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 37.2(予測) 38.5(予測) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 36.7 38.7 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 38.0 40.5 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 35.3(予測) 36.3(予測) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 40.6(予測) 43.1(予測) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 45.5(予測) 48.4(予測) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 46.8(予測) 49.9(予測) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 48.8(予測) 51.9(予測) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 51.3 54.4 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 58.4(予測) 62.3(予測) Xeon X5672 4 3.20 12 MB 6.40 GT/s 95 W 58.8 62.7 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 61.1(予測) 65.3(予測) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 61.8 65.5 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 47.9(予測) 51.1(予測) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 47.5 50.7 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 48.4 52.2 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 53.8(予測) 57.7(予測) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 55.4(予測) 59.1(予測) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 56.9(予測) 60.6(予測) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 57.6 61.1 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 59.9(予測) 64.2(予測) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 60.2 63.8
プロセッサ コア GHz キャッシュ L3 スピード QPI TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 40.1(予測) 75.6(予測) 41.3(予測) 80.0(予測) Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 58.7 107 59.5 113 Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 64.8(予測) 122(予測) 66.6(予測) 128(予測) Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 66.6(予測) 125(予測) 68.5(予測) 131(予測) Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 70.5 127 73.2 133 Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 72.8 131 75.4 138 Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 67.6(予測) 123(予測) 69.3(予測) 127(予測) Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 79.9(予測) 145(予測) 82.3(予測) 150(予測) Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 90.6(予測) 174(予測) 93.0(予測) 181(予測) Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 93.1(予測) 178(予測) 95.6(予測) 185(予測) Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 95.3(予測) 183(予測) 97.9(予測) 189(予測) Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 98.9 189 102 196 Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 113(予測) 216(予測) 116(予測) 222(予測) Xeon X5672 4 3.20 12 MB 6.40 GT/s 95 W 115 222 118 229 Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 116(予測) 224(予測) 120(予測) 231(予測) Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 119 230 122 237 Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 112(予測) 208(予測) 116(予測) 214(予測) Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 113 210 117 216 Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 116 214 119 220 Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 126(予測) 244(予測) 130(予測) 252(予測) Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 128(予測) 248(予測) 132(予測) 255(予測) Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 131(予測) 253(予測) 135(予測) 260(予測) Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 133 257 137 264 Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 134(予測) 259(予測) 139(予測) 267(予測) Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 137 263 141 271
整数演算テストセットおよび浮動小数点演算テストセットの両方で、2 プロセッサのスループットは 1 プロ セッサの約 2 倍です。 SPECfp_rate_base2006 SPECfp_rate2006 0 50 100 150 200 250 300 1 x Xeon X5690 2 x Xeon X5690 137 263 141 271 SPECint_rate_base2006 SPECint_rate2006 0 50 100 150 200 250 300 350 400 450 1 x Xeon X5690 2 x Xeon X5690 199 388 212 414 SPECcpu2006:整数演算性能 PRIMERGY BX924 S2(2 ソケットと 1 ソケットの比較) SPECcpu2006:浮動小数点演算性能 PRIMERGY BX924 S2(2 ソケットと 1 ソケットの比較)
ベンチマーク環境
測定 1 SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX924 S2 で行いまし た。 ハードウェア モデル PRIMERGY BX924 S2CPU Xeon E5503、E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677、L5640、 X5650、X5660、X5670、X5680 CPU 数 1 チップ: Xeon E5503: 2 コア Xeon E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677: 4 コア その他すべて: 6 コア 2 チップ: Xeon E5503: 4 コア Xeon E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677: 8 コア その他すべて: 12 コア 1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) 2 次キャッシュ 256 KB オンチップ(コアあたり) その他のキャッシュ Xeon E5503、E5506、E5507: 4 MB(命令 + データ)オンチップ(チップあたり) その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり) ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 11.1 測定 2 SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX924 S2 で行いまし た。 ハードウェア モデル PRIMERGY BX924 S2
CPU Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5672、X5675、X5687、X5690
CPU 数 1 チップ: Xeon E5603、E5606、E5607、X5647、X5672、X5687: 4 コア その他すべて: 6 コア 2 チップ: Xeon E5603、E5606、E5607、X5647、X5672、X5687: 8 コア その他すべて: 12 コア 1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) 2 次キャッシュ 256 KB オンチップ(コアあたり) その他のキャッシュ Xeon E5603、E5606、E5607: 8 MB(命令 + データ)オンチップ(チップあたり) その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり) ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11 SP1(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 12.0
SPECjbb2005
ベンチマークの説明
SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマーク です。これは、本質的には SPECjbb2000 をアップデートしたものです。主な違いは次のとおりです。 トランザクションは、多様な機能範囲に対応するために、より複雑になっています。 ベンチマークのワーキングセットは、システムの負荷の増大に対応するために、拡大されています。 SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実環境との高い近似性 を得ることができます。 SPECjbb2005 は、ソフトウェアについては主にジャストインタイムコンパイラーで使用される JVM と、ス レッドおよびガーベージコレクションの実装のパフォーマンスを測定します。使用されるオペレーティング システムの機能も評価します。ハードウェアについては、CPU およびキャッシュの効率、メモリサブシス テム、共有メモリシステム(SMP)のスケーラビリティを評価します。ディスクおよびネットワーク I/O は 無関係です。 SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント/サーバ システムをエミュレートしたもので、中間層システムに重点を置いています。 クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データ ベースへの OLTP アクセスを思考時間ゼロで行います。 中間層システムは、ビジネスプロセスおよびデータベースの更新を実装します。 データベースはデータ管理を行い、メモリ内の Java オブジェクトによりエミュレートされます。 トランザクションのログ記録は XML ベースで実装されます。 このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパ フォーマンスが測定されます。このため、大規模なハードウェアの設置は不要となり、異なるシステムの SPECjbb2005 の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記 述されています。
SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で す。 スケーリングの単位は、約 25 MB の Java オブジェクトから成るウェアハウスです。1 つのウェアハウスに つき、1 つの Java スレッドがオペレーションを実行します。これらのビジネスオペレーションは TPC-C で 次の項目を前提としています。 新規オーダーエントリー 支払 オーダーステータスの照会 納入 在庫レベル監視 顧客レポート ただし、これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません。2 つのベンチマーク の結果は比較できません。 SPECjbb2005 には、次の 2 つの性能指標があります。 bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーション の処理レートです。 bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。 SPECjbb2005 のさまざまな結果の比較では、両方の性能指標を考慮する必要があります。 これらの性能指標の測定は、次のようなベンチマークのルールに準拠しています。 ベンチマーク測定は、ウェアハウス数(スレッド数)が増加する一連の測定ポイントで構成され、それぞれ においてウェアハウス数は 1 つずつ増加します。測定は 1 ウェアハウスで開始され、2*MaxWh(少なくと も 8 ウェアハウス)まで実行されます。MaxWh は、ベンチマークで予想される秒あたりの処理レートが最
高になるウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます。
性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペ レーション速度の算術平均です。
ベンチマーク結果
測定 1
2010 年 4 月、2 基の Xeon X5680 プロセッサおよび 48 GB の PC3-10600R DDR3-SDRAM メモリの構成で PRIMERGY BX924 S2 を測定しました。測定には、Windows Server 2008 R2 Enterprise を使用しました。 IBM から提供されている J9 VM の 6 つのインスタンスを使用しました。 測定結果は次のとおりです。 SPECjbb2005 bops = 929050 SPECjbb2005 bops/JVM = 154842 測定 2 2010 年 12 月、2 基の Xeon X5690 プロセッサ構成で、PRIMERGY BX924 S2 を測定しました。その他の 構成は、2010 年 4 月の測定と同じです。 測定結果は次のとおりです。 SPECjbb2005 bops = 945045 SPECjbb2005 bops/JVM = 157508 0 200000 400000 600000 800000 1000000 1 2 3 4 5 6 7 8 warehouses 2 x Xeon X5690 2 x Xeon X5680 929050 945045 0 200000 400000 600000 800000 1000000 2 x Xeon X5680 2 x Xeon X5690
SPECjbb2005 bops: PRIMERGY BX924 S2 SPECjbb2005 bops: PRIMERGY BX924 S2
ベンチマーク環境
SPECjbb2005 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY BX924 S2 で行いまし た。 ハードウェア モデル PRIMERGY BX924 S2 CPU Xeon X5680、X5690 CPU 数 2 チップ、12 コア(チップあたり 6 コア) 1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) 2 次キャッシュ 256 KB(命令 + データ)オンチップ(コアあたり) その他のキャッシュ 12 MB(命令 + データ)オンチップ(チップあたり) メモリ 4 GB PC3-10600R DDR3-SDRAM × 12 枚 ソフトウェアオペレーティングシステム Windows Server 2008 R2 Enterprise
JVM バージョン IBM J9 VM (build 2.4, JRE 1.6.0 IBM J9 2.4 Windows Server 2008 amd64-64 jvmwaamd64-6460sr6-20090923_42924 (JIT enabled, AOT enabled)
OLTP-2
ベンチマークの説明
OLTP とは、Online Transaction Processing(オンライントランザクション処理)の略です。OLTP-2 ベン チマークは、データベースソリューションの標準的なアプリケーションシナリオを基にしています。OLTP-2 では、データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps) が測定されます。 独立した機関によって標準化され、その規則を順守して測定しているかを監視される SPECint や TPC-E の ようなベンチマークとは異なり、OLTP-2 は、富士通が開発した固有のベンチマークです。OLTP-2 は、 データベースのベンチマークとしてよく知られている TPC-E を基に開発されました。そして、CPU やメモ リの構成に応じてシステムがスケーラブルな性能を示すことを実証するために、さまざまな構成で測定でき るように設計されています。 OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシ ナリオをシミュレートしても、この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートする ため、結果を比較したり同等のものとして扱うことはできません。通常、OLTP-2 の値は、TPC-E に近い値 となります。しかし、価格性能比が算出されないため、直接比較できないだけでなく、OLTP-2 の結果を TPC-E として利用することも許可されません。 詳細情報は、『ベンチマークの概要 OLTP-2』を参照してください。
ベンチマーク結果
PRIMERGY RX300 S6 の OLTP-2 の値は、Xeon 55xx および 56xx プロセッサシリーズを使用して、48 GB、 72 GB、96 GB、144 GB、および 192 GB のメモリ構成で測定しました。 次の表は、測定対象のプロセッサの仕様を示しています。 プロセッサ コア数/ チップ L3 キャッシュ プロセッサ 周波数 QPI スピード HT TM TDP 5500 E5503 2 4 MB 2.00 GHz 4.8 GT/s - - 80 W E5506 4 4 MB 2.13 GHz 4.8 GT/s - - 80 W E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W 5600 シリ ーズ 4 コア E5603 4 4 MB 1.60 GHz 4.8 GT/s - - 80 W E5606 4 8 MB 2.13 GHz 4.8 GT/s - - 80 W E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W 4 コア 、 HT 、 T M L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W 6 コア 、 HT 、 T M L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W
データベースのパフォーマンスは、CPU やメモリの構成と、データベースで使用するディスクサブシステ ムの接続性によって、大きく異なります。Xeon 55xx および 56xx プロセッサシリーズは、次のようなさま ざまなシステム構成に対応しています。 プロセッサ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 5500 E5503 E5506 E5507 5600 シリ ーズ 4 コア E5603 E5606 E5607 L5609 4 コア 、 HT 、 T M L5630 E5620 E5630 E5640 X5647 X5667 X5672 X5677 X5687 6 コア 、 HT 、 T M L5640 E5645 E5649 X5650 X5660 X5670 X5675 X5680 X5690 最大 メモリ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 CPU × 1 48 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB 144 GB *) CPU × 2 96 GB 192 GB 192 GB 192 GB 192 GB 144 GB 192 GB 192 GB 288 GB *) *) 16 GB デュアルランクメモリモジュールの特別リリース
次に示す CPU およびメモリの性能評価では、ディスクサブシステムは適切であり、ボトルネックにならな いものとします。
PRIMERGY RX300 S6 の OLTP-2 の値は、オペレーティングシステム Microsoft Windows Server 2008 R2 Enterprise とデータベース SQL Server 2008 R2 Enterprise x64 Edition で測定したものです。システム構成
の詳細については、「ベンチマーク環境」を参照してください。 データベース環境でメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモ リ容量が十分にあることが重要です。そのため、16 GB モジュールの最大構成、8 GB モジュールの最大構 成、および 8 GB モジュールの別構成で測定しました。周波数は、プロセッサと、メモリモジュールの種類 および数によって変わります。メモリパフォーマンスの詳細については、ホワイトペーパー『Xeon 5600 (Westmere-EP)搭載システムのメモリパフォーマンス』を参照してください。 次のグラフは、Intel Xeon 5600 および 5500 シリーズのプロセッサ(1 基または 2 基)と、さまざまなメモ リ構成で測定した OLTP-2 トランザクションレートを示しています。 多種類のプロセッサにより、広範にわたるレベルのパフォーマンスが実現されていることがわかります。同 じ最大メモリ構成で比較すると、パフォーマンスが最も低いプロセッサ(Xeon E5503)を使用した場合に 比べ、パフォーマンスが最も高いプロセッサ(Xeon X5690)を使用した場合は、OLTP-2 値は 5.4 倍に なっています。 測定結果が示す性能に基づき、プロセッサをいくつかのグループに分類できます。 最もパフォーマンスが低いのは、わずか 2 コアのプロセッサである Xeon E5503 です。 その次のグループのプロセッサは、OLTP-2 でほぼ 2 倍のパフォーマンスを達成しています。ハイパース レッディングをサポートしていない 4 コアプロセッサ(Xeon E5506、Xeon E5507、Xeon E5603、Xeon E5606、Xeon E5607 および Xeon L5609)が、このグループです。OLTP-2 の測定では、コア数を 2 倍に すると、パフォーマンスもほぼ 2 倍になります。
ハイパースレッディングとターボモードの両方をサポートする 4 コアプロセッサでは、さらに高いパフォー マンスが得られます。Xeon L5630、Xeon E5620、Xeon E5630、Xeon E5640 および Xeon X5647 がこの グループです。このグループでは、ハイパースレッディングによって論理的なプロセッサコア数が 2 倍にな るため、OLTP-2 の測定では特に優れた結果が得られます。Xeon X5667、Xeon X5672、Xeon X5677、 Xeon X5687 は、同じくハイパースレッディングとターボモードをサポートする 4 コアプロセッサですが、 高レベルのターボモードを利用可能で、QPI スピードも 5.86 GT/s よりさらに高速の 6.4 GT/s です。これ により、このグループの 4 コアプロセッサは、下位の 6 コアプロセッサであるクロック周波数、ターボ モードレベル、QPI スピードが低いモデル(Xeon E5645、および Xeon E5649)に近いスループットを達 成できます。
最高のパフォーマンスを発揮するのは、QPI スピード 6.4 GT/s を実現する 6 コアプロセッサ Xeon X5650、 Xeon X5660、Xeon X5670、Xeon X5675、Xeon X5680 および Xeon X5690 のグループです。このグルー プでは、2 基の CPU を使用した OLTP-2 の測定のほとんどで、96 GB(8 GB DIMM × 12)で周波数 1333 MHz のメモリ構成の方が、144 GB(8 GB DIMM × 18)で周波数 800 MHz のメモリ構成より優れた 結果が得られました。
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 E5503-2Core E5506-4Core E5507-4Core E5603-4Core E5606-4Core E5607-4Core L5609-4Core L5630-4Core E5620-4Core E5630-4Core E5640-4Core X5647-4Core X5667-4Core X5672-4Core X5677-4Core X5687-4Core L5640-6Core E5645-6Core E5649-6Core X5650-6Core X5660-6Core X5670-6Core X5675-6Core X5680-6Core X5690-6Core
OLTP-2 tps
2CPUs-192GB 2CPUs-144GB 2CPUs-96GB 1CPU-96GB 1CPU-72GB 1CPU-48GB
PRIMERGY 現行モデルでの OLTP-2 の最高値は、旧モデルの最高値と比較して約 50 %向上しています。 0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 + ~ 50% tps 現行モデル TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 旧モデル TX200 S5 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - - 2 × X5570 96 GB RAM 2 × W5590 96 GB RAM 2 × X5670 96 GB RAM 2 × X5690 96 GB RAM 現行モデル 旧モデル OLTP-2 tps の最高値 システム世代間の比較
ベンチマーク環境
一般的な測定環境を以下に示します。
Intel Xeon 55xx および 56xx プロセッサシリーズの OLTP-2 のすべての値は、PRIMERGY RX300 S6 を使 用して測定しました。 データベースサーバ(B 層) ハードウェア システム PRIMERGY RX300 S6 プロセッサ Xeon E5503(2 コア、2.00 GHz)× 2 基 Xeon E5506(4 コア、2.13 GHz)× 2 基 Xeon E5507(4 コア、2.27 GHz)× 2 基 Xeon E5603(4 コア、1.60 GHz)× 2 基 Xeon E5606(4 コア、2.13 GHz)× 2 基 Xeon E5607(4 コア、2.27 GHz)× 2 基 Xeon L5609(4 コア、1.87 GHz)× 2 基 Xeon L5630(4 コア、2.13 GHz)× 2 基 Xeon E5620(4 コア、2.40 GHz)× 2 基 Xeon E5630(4 コア、2.53 GHz)× 2 基 Xeon E5640(4 コア、2.67 GHz)× 2 基 Xeon X5647(4 コア、2.93 GHz)× 2 基 Xeon X5667(4 コア、3.07 GHz)× 2 基 Xeon X5672(4 コア、3.20 GHz)× 2 基 Xeon X5677(4 コア、3.46 GHz)× 2 基 Xeon X5687(4 コア、3.60 GHz)× 2 基 Xeon L5640(6 コア、2.27 GHz)× 2 基 Xeon E5645(6 コア、2.40 GHz)× 2 基 Xeon E5649(6 コア、2.53 GHz)× 2 基 Xeon X5650(6 コア、2.67 GHz)× 2 基 Xeon X5660(6 コア、2.80 GHz)× 2 基 Xeon X5670(6 コア、2.93 GHz)× 2 基 Xeon X5675(6 コア、3.06 GHz)× 2 基 Xeon X5680(6 コア、3.33 GHz)× 2 基 Xeon X5690(6 コア、3.46 GHz)× 2 基 メモリ 48 GB~192 GB、 1333 MHz Registered ECC DDR3(8 GB DIMM)、または
1066 MHz Registered ECC DDR3(16 GB DIMM)
設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効 ネットワーク インターフェース オンボード LAN 1 Gbps × 2 基 ディスクサブシステム RX300 S6: オンボード RAID コントローラー SAS 6G 5/6 512 MB 73 GB 15k rpm SAS ドライブ × 2 台、RAID1(OS)、 147 GB 15k rpm SAS ドライ ブ × 6 台、RAID10(ログ) LSI MegaRAID SAS 9280-8e × 5 基
JX40 × 5 台:各 64 GB SSD ドライブ × 24 台、RAID5(データ) ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise データベース SQL Server 2008 R2 Enterprise x64
アプリケーション
サーバ
A 層
B 層
ネットワーク ネットワーク クライアントデータベースサーバ
ストレージサブシステムSUT(System Under Test:テスト対象システム)
アプリケーションサーバ(A 層) ハードウェア システム PRIMERGY RX200 S6 プロセッサ Xeon E5640 (6 コア、2.66 GHz)× 1 基 メモリ 12 GB、1333 MHz Registered ECC DDR3 ネットワーク インターフェース オンボード LAN 1 Gbps × 2 基、デュアルポート LAN 1 Gbps × 2 基 ディスクサブシステム 73 GB 15k rpm SAS ドライブ × 1 台 ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard クライアント ハードウェア システム PRIMERGY RX200 S5 プロセッサ Xeon X5570(4 コア、2.93 GHz)× 2 基 メモリ 24 GB、1333 MHz Registered ECC DDR3 ネットワーク インターフェース オンボード LAN 1 Gbps × 2 基 ディスクサブシステム 73 GB 15k rpm SAS ドライブ × 1 台 ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard OLTP-2 ソフトウェア EGen バージョン 1.12.0
vServCon
ベンチマークの説明
vServCon は、富士通テクノロジー・ソリューションズが、ハイパーバイザーを使用するサーバ構成につい て、サーバ統合の適合性の比較に使用するベンチマークです。これにより、システム、プロセッサ、および I/O テクノロジーの比較に加え、ハイパーバイザー、仮想化形式、および仮想マシン用の追加ドライバの比 較も可能になります。 vServCon は、厳密に言えば新しいベンチマークではありません。これは、言うなればフレームワークであ り、すでに確立されたベンチマークをワークロードとして集約し、統合され仮想化されたサーバ環境の負荷 を再現します。データベース、アプリケーションサーバ、Web サーバというアプリケーションシナリオを 対象とする 3 つの実証済みのベンチマークが使用されます。 3 つのアプリケーションシナリオのそれぞれが、1 つの専用の仮想マシン(VM)に割り当てられます。これ らに加えてアイドル VM という 4 番目の仮想マシンが追加されます。これら 4 つの VM が 1 つの「タイル」 を構成します。最大の性能値を引き出すためには、測定対象となるサーバの処理能力に応じて、いくつかの タイルを並行して開始しなければならない場合もあります。 3 つの vServCon アプリケーションシナリオのそれぞれが、各 VM のアプリケーション固有のトランザク ションレートという形でベンチマーク結果を提供します。スコアを正規化するために、1 つのタイルのそれ ぞれのベンチマーク結果とリファレンスシステムの結果との比を求めます。その相対性能値に適切な重み付 けを行い、すべての VM とすべてのタイルについて加算します。最終的な計算結果が、このタイル数に対す るスコアになります。 原則として、1 つのタイルから始めて、vServCon スコアの大幅な増加が見られなくなるまで、タイル数を 増やしながらこの手順が実行されます。最終的な vServCon スコアは、すべてのタイル数から得られた vServCon スコアの最大値です。したがって、このスコアは、CPU リソースを最大限まで使用する構成で達 成される最大スループットを反映しています。このため、vServCon の測定環境は、CPU のみが制限要因と なるように設計されており、他のリソースによる制限は発生しないように設計されています。 タイル数の増加に対する vServCon スコアの伸びは、テスト対象システムのスケーリング特性を知るための 有益な情報となります。さらに、vServCon では、ホストの合計 CPU 負荷(VM および他のすべての CPU 処理)を記録し、可能な 場合は消費電力も記録します。 vServCon の詳細については、『ベンチマークの概要 vServCon』を参照してください。 アプリケーションシナリオ ベンチマーク 論理 CPU コアの数 メモリ データベース Sysbench(補正済み) 2 1.5 GB Java アプリケーションサーバ SPECjbb(補正済み、50~60 %の負荷) 2 2 GB Web サーバ WebBench 1 1.5 GB テスト対象システム … … タイル n タイル 3 タイル 2 タイル 1 データベース VM Web VM アイドル VM Java VM データベース VM Web VM アイドル VM Java VM データベース VM Web VM アイドル VM Java VM データベース VM Web VM アイドル VM Java VM
ベンチマーク結果
PRIMERGY の 2 ソケットモデル現行世代は、Intel Xeon シリーズ 5600(または 5500)プロセッサをベー スにしています。 次のようなさまざまなシステム構成に対応しています。 プロセッサ TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 5500 E5507 5600 シリ ーズ 4 コア E5607 L5609 4 コア、 HT 、 TM L5630 E5620 E5630 E5640 X5647 X5667 X5672 X5677 X5687 6 コア、 HT 、 TM L5640 E5645 E5649 X5650 X5660 X5670 X5675 X5680 X5690 HT = ハイパースレッディング、TM = ターボモード PRIMERGY の 2 ソケットモデル現行世代は、プロセッサテクノロジーの進歩により、アプリケーションの 仮想化に最適なシステムとなっています。6 コアプロセッサにも対応しているため、前世代のプロセッサを ベースとするシステムと比較して、仮想化性能が約 50 %向上しています(vServCon スコアで測定)。6 コ アプロセッサを 2 基搭載したシステムで、前述の vServCon プロファイルを基にして 27 のアプリケーショ ン VM(9 つのタイルに相当)を使用した場合、CPU リソースの最大活用をほぼ実現できます。
次のグラフは、各プロセッサで達成可能な仮想化性能値を比較したものです。発売済みの 4 コアまたは 6 コアのプロセッサを対象に幅広く測定しました。 このグラフに示されているプロセッサ間の大きな性能差は、その機能が影響していると考えられます。グラ フの左側のグループのプロセッサは、エントリーモデルです。グラフ中央のグループのプロセッサは、ハイ パースレッディングとターボモードに対応しているため、パフォーマンスが大幅に向上していることがわか ります。 グラフの中央と右側のグループのプロセッサでは、それぞれのプロセッサのメモリクロック周波数が徐々に 上がっています。このとき、パフォーマンスは、プロセッサのメモリクロック周波数とプロセッサ間のデー タ転送速度(「QPI スピード」)の組み合わせで決まります。 グラフの右側のグループは、6 コアプロセッサで構成されています。6 コアプロセッサの場合、同機能の 4 コアプロセッサと比較すると、期待どおりにパフォーマンスが約 50 %向上しています。グラフの右側のグ ループでは、E5649 から X5650 への大幅な向上が特に目立っています。X5650 以降は、最高の QPI スピー ドと強力なターボモードを備えたアドバンストプロセッサというカテゴリであるためです。 メモリパフォーマ ンスと QPI アーキテクチャーの詳細については、ホワイトペーパー『Xeon 5600 (Westmere-EP)搭載システムのメモリパフォーマンス』を参照してください。 仮想化環境のメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモリ容量 が十分にあることが重要です。 各プロセッサの製品データについて再度簡潔にまとめ、次の表に示します。 E 5 5 0 7 L5609 E5 6 0 7 L5630 E5 6 2 0 E 5 6 3 0 E 5 6 4 0 X 5 6 4 7 X 5 6 6 7 X 5 6 7 2 X 5 6 7 7 X 5 6 8 7 L5640 E5 6 4 5 E 5 6 4 9 X 5 6 5 0 X 5 6 6 0 X 5 6 7 0 X 5 6 7 5 X 5 6 8 0 X 5 6 9 0 4 4 4 6 6 6 6 6 7 7 7 7 9 9 9 9 9 9 9 9 9 0 1 2 3 4 5 6 7 8 9 10 F in a l v S e rv C o n S c o re #Tiles
プロセッサ コア数/ チップ L3 キャッ シュ プロセッサ 周波数 QPI スピード HT TM TDP タイル数 スコア 5500 E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W 4 3.02 5600 シリ ーズ 4 コア E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W 4 3.39 L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W 4 3.06 4 コア、 HT 、 TM L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W 6 4.61 E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W 6 5.40 E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W 6 5.56 E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W 6 5.79 X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W 6 6.23 X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W 7 6.93 X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W 7 7.20 X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W 7 7.24 X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W 7 7.57 6 コア、 HT 、 TM L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W 9 7.36 E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W 9 7.40 E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W 9 7.60 X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W 9 8.63 X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W 9 8.87 X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W 9 9.02 X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W 9 9.29 X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W 9 9.41 X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W 9 9.61 QPI = QuickPath インターコネクト、GT = ギガトランスファー、HT = ハイパースレッディング、 TM = ターボモード、TDP = 熱設計電力
次のグラフは、Xeon E5620(4 コア)プロセッサおよび E5649(6 コア)プロセッサを搭載した時の、VM 数の増加に対する仮想化性能を示しています。ホストのそれぞれの CPU 負荷も示されています。CPU 負荷 が 90 %のときが最適なタイル数で す。90 %を超えると過負荷となり、 仮想化のパフォーマンスは停滞また は低下します。 物理コア数の増加に加えて、ハイ パースレッディング機能によって、 多数の VM の稼動が可能になります。 ハイパースレッディング機能では、 1 つの物理プロセッサコアが結果的 に 2 つの論理コアに分割されるた め、ハイパーバイザーが利用できる コア数は 2 倍になります。そのた め、ハイパースレッディング機能は、 一般的にシステムの仮想化性能を向 上させます。 ハイパースレッディング機能を使用するシステムでは、前のグラフに示されているタイル数のスケーリング 曲線が明確に見られます。Xeon E5649 プロセッサには、12 個の物理コア、すなわち 24 個の論理コアがあ り、1 つのタイルにつき 4 個程度の論理コアが使用されます(『ベンチマークの説明』を参照)。つまり、 ほぼ 3 タイルまでは、複数の VM が同じ物理コアを並行して使用することを回避できます。そのため、この 範囲ではほぼ理想的にパフォーマンスが上昇します。その後、CPU 使用率が限界に達するまでのパフォー マンス曲線は、傾きが緩やかになっていきます。 2 .1 8 3 .8 4 4 .4 7 5 .0 1 5 .3 0 5 .4 0 2 .1 2 4 .2 3 5 .6 9 6 .3 7 7 .0 8 7 .3 4 7 .4 5 7 .5 5 7 .6 0 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% E5620 E5649 0 1 2 3 4 5 6 7 8 1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 C P U u ti li z a ti o n v S e rv C o n S c o re # Tiles vServCon Score (left axis) CPU utilization of host (right axis)
これまでは、システムの仮想化性能を全体的に分析してきました。ここからは、仮想化環境での個別アプリ ケーション VM の観点でパフォーマンスについて説明します。ここでは例として、Xeon E5649 プロセッサ のシステムを取り上げています。 システム総体としてのパフォーマンスを重視してアプリケーション VM の数を全体最適化(例として 6 タイ ル)すると、部分最適化(例として 1 タイル)して負荷が少ない状況に比べ、個別の VM のパフォーマンス はかなり低くなります。次のグラフ(VM の数が増加したときの 3 種類の各アプリケーション VM のリファ レンスシステムに対する相対的なパフォーマンス)により、この点を明らかにしています。各アプリケー ション(Java、Web、DB)のグラフの最初の列には、1 つのタイルを構成する合計 3 つの VM がアプリ ケーション別に 1 つずつ表示されています。2 番目の列には 2 つのタイルを構成する合計 6 つの VM がア プリケーション別に 2 つずつ表示され、以降も同様に、タイルを構成する VM がアプリケーション別に表示 されています。各グラフから、個々のアプリケーション VM の値、およびアプリケーション種別ごとの合計 値が読み取れます。 仮想ホスト上の VM の数に関して、全体的なパフォーマンスよりも個別のアプリケーションのパフォーマン ス要件を重視すべき場合もあります。 はじめに、完全に構成されたシステムの仮想化性能について見てきました。一方で、プロセッサを 1 基から 2 基に増やしたときに、どの程度パフォーマンスが向上するかという疑問もあります。パフォーマンスの向 上度が増せば、サーバ内のリソース共有によるオー バーヘッドは減少します。プロセッサ追加時の性能 向上度を示すスケーリング係数は、サーバの用途に よって異なります。サーバ統合用の仮想化プラット フォームとしてサーバを使用する場合、プロセッサ の追加で性能は 1.95 倍になります。つまり、Xeon E5649 のグラフに示したように、2 基のプロセッサ を使用すると、1 基のプロセッサを使用した場合に比 べて、仮想化性能が約 2 倍になります。 0 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 R e la ti ve p e rf o rm a n ce co m p a re d w it h R e fSy s
Relative performance of single VM for increasing tile count
9th VM 8th VM 7th VM 6th VM 5th VM 4th VM 3rd VM 2nd VM 1st VM Web DB Java #Tiles 0 1 2 3 4 5 6 7 8 9 1 × E5649 2 × E5649 × 1.95 v S e rv C o n S c o re
2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は、一方では個別の VM に影響し、他方 では CPU をフル活用したときの使用可能な最大 VM 数に影響しています。次のグラフでは、この 2 つの側 面における向上の度合いを比較しています。ここでは、2008 年の Xeon E5420 × 2 基のシステム、2009 年 の Xeon X5540 × 2 基のシステム、そして Xeon E5649 × 2 基の現行システムといった、ほぼ同じプロセッ サ周波数を持つ 3 つのシステムを比較しています。 2011 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2 2009 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - - 2008 TX300 S4 RX200 S4 RX300 S4 BX620 S4 - - - パフォーマンスの向上は、Xeon 5500 プロセッサ世代が登場した 2008 年から 2009 年にかけて最も顕著で す(「拡張ページテーブル」(EPT)機能の実装などによる1)。VM の数が少ないケース(1 タイル)では、 vServCon スコアが 1.30 倍に増加しています。 全体最適化した CPU フル稼動時のケースでは、vServCon スコアは、2.02 倍に増加しています。その理由 の 1 つは、個々の VM で実現できるパフォーマンスの向上です(グラフ左側の Few VMs のスコアを参照)。 もう 1 つの理由は、全体最適化された状態で実行可能な VM の数の向上です(ハイパースレッディング機能 の使用および物理コア数の増加による)。ただし、VM の数を増やすことで個々の VM のパフォーマンスは 低下しているため、全体としての性能向上は、VM の数が 3 倍になったことによってもたらされたものと言 えます。 2009 年から 2011 年にかけて、テクノロジーは、厳密にはどの点で進歩を遂げたのでしょうか。ここでは、 クロック周波数が同じで、キャッシュのサイズとメモリアクセス速度が異なるプロセッサを比較しています が、低負荷状態における個々の VM のパフォーマンスについては、プロセッサによる違いはほとんどありま せん。決定的に進歩を遂げた点は、物理コア数の増加と、それに関連した仮想化性能値の向上(グラフでは 1.47 倍)、および CPU 最大使用時における電力あたりの性能効率の向上です。ここで比較している 2009 年のプロセッサと 2011 年のプロセッサは、TDP(Thermal Design Power:熱設計電力)が 80 W で等しい ため、CPU 最大使用時の消費電力はほぼ同じです。したがって、電力あたりの性能も約 1.47 倍に向上して います。 仮想化パフォーマンスの増加は、個別の VM の性能向上によるものがすべてではありません。個別の VM の 性能向上だけでは、Xeon 5400 世代(2008 年)の同一クロックのプロセッサと比較して、30 %~50 %を 超えるスループットの増加は不可能です。2009 年以降の仮想化環境におけるパフォーマンス向上の大部分 は、利用可能な論理コアまたは物理コアが増加した結果として、実行できる VM 数が増大したことによって 達成されたものです。 1 0 1 2 3 4 5 6 7 8 9 2008 E5420 2.5 GHz 4C 2009 E5540 2.53 GHz 4C 2011 E5649 2.53 GHz 6C 2008 E5420 2.5 GHz 4C 2009 E5540 2.53 GHz 4C 2011 E5649 2.53 GHz 6C Overall Optimum Few VMs × 1.30 × 2.02 v S e rv C o n S c o re × 1.47 Year CPU Frequency #Cores
ベンチマーク環境
測定は次のような環境で行いました。
Intel Xeon 55xx と 56xx プロセッサシリーズのすべての vServCon スコアは、PRIMERGY TX300 S6 を使用 して測定しました。 SUT ハードウェア モデル PRIMERGY TX300 S6 プロセッサ 1 チップ: Xeon E5649(6 コア、2.53 GHz) 2 チップ: Xeon E5507(4 コア、2.27 GHz) Xeon L5609(4 コア、1.87 GHz) Xeon E5607(4 コア、2.27 GHz) Xeon L5630(4 コア、2.13 GHz) Xeon E5620(4 コア、2.40 GHz) Xeon E5630(4 コア、2.53 GHz) Xeon E5640(4 コア、2.67 GHz) Xeon X5647(4 コア、2.93 GHz) Xeon X5667(4 コア、3.07 GHz) Xeon X5672(4 コア、3.20 GHz) 2 チップ: Xeon X5677(4 コア、3.47 GHz) Xeon X5687(4 コア、3.60 GHz) Xeon L5640(6 コア、2.27 GHz) Xeon E5645(6 コア、2.40 GHz) Xeon E5649(6 コア、2.53 GHz) Xeon X5650(6 コア、2.67 GHz) Xeon X5660(6 コア、2.80 GHz) Xeon X5670(6 コア、2.93 GHz) Xeon X5675(6 コア、3.07 GHz) Xeon X5680(6 コア、3.33 GHz) Xeon X5690(6 コア、3.46 GHz) メモリ 96 GB(それぞれ PC3-10600R、8 GB、DIMM-1A~DIMM-1F および DIMM-2A~DIMM-2F に 搭載) ネットワーク インターフェース
1 Gbit LAN × 2 基:負荷用(2 基の LAN アダプター経由)× 1 基、制御用 × 1 基 ディスク
サブシステム
内蔵ハードディスクは使用せず、ストレージシステム FibreCAT CX500 のみを使用 VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN
各 LUN は、5 つの Seagate ST373454 ディスク(15 krpm)で構成された RAID 0 アレイ ストレージの接続 FC コントローラー Qlogic QLE 2462 を使用
SUT ソフトウェア オペレーティング システム
ハイパーバイザー VMware ESX Server
リリース バージョン 4.0 U1 ビルド 236512 BIOS バージョン 6.00 R1.08..2619.N1 隣接キャッシュラインプリフェッチ:無効、ハードウェアプリフェッチ:無効 DCU ストリーマープリフェッチ:無効、データ再利用の最適化:無効 複数の 1 Gb または 10 Gb ネットワーク 負荷ジェネレーター サーバ ストレージシステム
SUT(System Under Test:テスト対象システム) フレームワーク
SUT:仮想化に関する詳細 ESX 設定 デフォルト 一般的な詳細 『ベンチマークの概要 vServCon』を参照 負荷ジェネレーターのハードウェア モデル PRIMERGY BX920 S1 サーバブレード(PRIMERGY BX900 シャーシ)× 17 台 プロセッサ それぞれ Xeon X5570(2.93 GHz)× 2 基 メモリ 12 GB ネットワーク インターフェース それぞれ 1 Gbit LAN × 3 基 オペレーティング システム
Windows Server 2008 R2 Enterprise with Hyper-V
負荷ジェネレーター VM(タイルあたり 3 つの負荷ジェネレーターを複数のサーバブレードで動作) プロセッサ 論理 CPU × 1 基 メモリ 512 MB ネットワーク インターフェース それぞれ 1 Gbit LAN × 2 基 オペレーティング システム
Windows Server 2003 Enterprise