• 検索結果がありません。

パフォーマンスレポート PRIMERGY RX600 S5

N/A
N/A
Protected

Academic year: 2021

シェア "パフォーマンスレポート PRIMERGY RX600 S5"

Copied!
38
0
0

読み込み中.... (全文を見る)

全文

(1)

ホワイトペーパー

FUJITSU PRIMERGY サーバ

パフォーマンスレポート

PRIMERGY RX600 S5

本書では、PRIMERGY RX600 S5 で実行したベンチマークの概要について説明します。

PRIMERGY RX600 S5 のパフォーマンスデータを、他の PRIMERGY モデルと比較して

説明しています。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク

環境の説明も掲載しています。

バージョン 1.4 2011-06-30 目次 ドキュメントの履歴 ... 2 製品データ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 10 OLTP-2 ... 13 TPC-E ... 18 SAP SD ... 21 SAP BI-D ... 24 vServCon ... 26 VMmark V1 ... 32 関連資料 ... 37 お問い合わせ先 ... 38

(2)

ドキュメントの履歴

バージョン 1.3 以下のベンチマークを含むレポートの初版  SPECcpu2006 Xeon E7520、E7530、L7545、E7540、X7542、X7550、L7555、X7560 で測定  SPECjbb2005 Xeon X7560 で測定  OLTP-2 Xeon E7520、E7530、E7540、L7545、L7555、X7542、X7550、X7560 で測定  TPC-E Xeon X7560 で測定  SAP SD 認証番号 2010017  SAP BI-D 認証番号 2010011 および 2010024  vServCon Xeon E7520、E7530、L7545、E7540、X7542、L7555、X7550、X7560 で測定  VMmark Xeon E7540、X7560 で測定 バージョン 1.4 以下のベンチマークを更新  SAP SD 認証番号 2011013

(3)

製品データ

PRIMERGY RX600 S5 は、4 U の 4 ソケットラックサーバで、PRIMERGY RX600 S4 の後継製品です。 Intel 7500 チップセット、Intel Xeon シリーズ 7500 プロセッサ(4 コア、6 コア、8 コア)2 ~ 4 基を搭載 し、最大 1 TB の DDR3-SDRAM が搭載可能な最大 8 枚のメモリボード(それぞれ 8 本の DIMM スロッ ト)、4 基のオンボード 1 Gbit イーサネットコントローラー、10 本の PCI スロット(PCI-Express 2.0 x4 (3 本)、PCI-Express 2.0 x8(4 本)、PCI-Express 2.0 x16(1 本)、および PCI-Express x4(2 本)) を装備、最大 8 台の内蔵 2.5 インチドライブ(SSD、SATA、または SAS HDD)を搭載可能です。

(4)

SPECcpu2006

ベンチマークの説明

SPECcpu2006 は、整数演算および浮動小数点演算でシステム性能を測定するベンチマークです。このベン チマークは、12 本のアプリケーションから成る整数演算テストセット(SPECint2006)、および 17 本のア プリケーションから成る浮動小数点演算テストセット(SPECfp2006)で構成されています。これらのアプ リケーションは大量の演算を実行し、CPU およびメモリを集中的に使用します。他のコンポーネント(デ ィスク I/O、ネットワークなど)は、このベンチマークでは測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード として利用可能で、実際に測定する前にコンパイルする必要があります。したがって、使用するコンパイラ ーのバージョンやその最適化設定が、測定結果に影響を与えます。 SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。1 つ目の方法(SPECint2006 およ び SPECfp2006)では、1 つのタスクの処理に必要な時間を測定します。2 つ目の方法(SPECint_rate2006 および SPECfp_rate2006)では、スループット(並列処理できるタスク数)を測定します。いずれの方法 も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これらは、コンパイラー最適化 を使用するかどうかという点で異なります。「ベース」値は常に公開されていますが、「ピーク」値はオプ ションです。 ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション SPECint2006 整数 ピーク アグレッシブ 速度 単体実行 SPECint_base2006 整数 ベース 標準 SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行 SPECint_rate_base2006 整数 ベース 標準 SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行 SPECfp_base2006 浮動小数点 ベース 標準 SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行 SPECfp_rate_base2006 浮動小数点 ベース 標準 測定結果は、個々のベンチマークで得られた正規化比の幾何平均です。算術平均と比較して、幾何平均の方 が、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムがリファレン スシステムと比較してどの程度高速であるかを測定することです。例えば、リファレンスシステムの SPECint_base2006、SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結 果が、値「1」と判定されたとします。このとき、SPECint_base2006 の値が「2」の場合は、測定システム が こ の ベ ン チ マ ー ク を リ フ ァ レ ン ス シ ス テ ム の 2 倍 の 速 さ で 実 行 し た こ と を 意 味 し ま す 。 SPECfp_rate_base2006 の値が「4」の場合は、測定対象システムがリファレンスシステムの約 4/[ベー スコピー数]倍の速さでこのベンチマークを実行したことを意味します。「ベースコピー数」とは、実行さ れたベンチマークの並行インスタンスの数です。 弊社では、SPEC の公開用に、SPECcpu2006 のすべての測定値を提出しているわけではありません。その ため、SPEC の Web サイトに公開されていない結果が一部あります。弊社では、すべての測定のログファ イルをアーカイブしているので、測定の内容に関していつでも証明できます。

ベンチマーク結果

PRIMERGY RX600 S5 で、Xeon 7500 シリーズのプロセッサを測定しました。ベンチマークプログラムは、 インテル C++/Fortran コンパイラー 11.1 でコンパイルし、SUSE Linux Enterprise Server 11(64 ビット) で実行しました。次の表の太字の値は、http://www.spec.org で公開されています。

(5)

プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_base2006 4 チップ SPECint2006 4 チップ Xeon E7520 4 1.87 18 MB 800 MHz 95 W 20.6 22.6 Xeon E7530 6 1.87 12 MB 1067 MHz 105 W 22.2 24.2 Xeon L7545 6 1.87 18 MB 1067 MHz 95 W 24.4 28.4 Xeon E7540 6 2 18 MB 1333 MHz 105 W 24.5 27.0 Xeon X7542 6 2.67 18 MB 1067 MHz 130 W 28.9 31.9 Xeon X7550 8 2 18 MB 1333 MHz 130 W 25.6 28.6 Xeon L7555 8 1.87 24 MB 1067 MHz 95 W 26.5 30.4 Xeon X7560 8 2.27 24 MB 1333 MHz 130 W 28.8 32.3 プロセッサ コア GHz L3 キャッ シュ バス TDP SPECint_rate_base2006 SPECint_rate2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7520 4 1.87 18 MB 800 MHz 95 W 156 312 165 336 Xeon E7530 6 1.87 12 MB 1067 MHz 105 W 230 458 246 490 Xeon L7545 6 1.87 18 MB 1067 MHz 95 W 238 474 256 510 Xeon E7540 6 2 18 MB 1333 MHz 105 W 255 508 276 548 Xeon X7542 6 2.67 18 MB 1067 MHz 130 W 250 497 267 530 Xeon X7550 8 2 18 MB 1333 MHz 130 W 320 640 344 685 Xeon L7555 8 1.87 24 MB 1067 MHz 95 W 308 617 333 663 Xeon X7560 8 2.27 24 MB 1333 MHz 130 W 358 714 383 766 プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_base2006 4 チップ SPECfp2006 4 チップ Xeon E7520 4 1.87 18 MB 800 MHz 95 W 26.7 28.7 Xeon E7530 6 1.87 12 MB 1067 MHz 105 W 29.1 31.5 Xeon L7545 6 1.87 18 MB 1067 MHz 95 W 31.7 35.2 Xeon E7540 6 2 18 MB 1333 MHz 105 W 32.1 34.7 Xeon X7542 6 2.67 18 MB 1067 MHz 130 W 36.0 38.7 Xeon X7550 8 2 18 MB 1333 MHz 130 W 33.0 35.7 Xeon L7555 8 1.87 24 MB 1067 MHz 95 W 32.7 36.4 Xeon X7560 8 2.27 24 MB 1333 MHz 130 W 35.8 39.2 プロセッサ コア GHz L3 キャッ シュ バス TDP SPECfp_rate_base2006 SPECfp_rate2006 2 チップ 4 チップ 2 チップ 4 チップ Xeon E7520 4 1.87 18 MB 800 MHz 95 W 135 269 142 281 Xeon E7530 6 1.87 12 MB 1067 MHz 105 W 186 373 192 385 Xeon L7545 6 1.87 18 MB 1067 MHz 95 W 196 390 204 404 Xeon E7540 6 2 18 MB 1333 MHz 105 W 212 418 220 433 Xeon X7542 6 2.67 18 MB 1067 MHz 130 W 211 419 218 433 Xeon X7550 8 2 18 MB 1333 MHz 130 W 250 496 258 512 Xeon L7555 8 1.87 24 MB 1067 MHz 95 W 238 474 247 491 Xeon X7560 8 2.27 24 MB 1333 MHz 130 W 271 538 281 559

(6)

整数演算テストセットおよび浮動小数点演算テストセットの両方で、4 プロセッサのスループットは 2 プロ セッサの約 2 倍です。 SPECfp_rate_base2006 SPECfp_rate2006 0 100 200 300 400 500 600 2 x Xeon X7560 4 x Xeon X7560 271 538 281 559 SPECint_rate_base2006 SPECint_rate2006 0 100 200 300 400 500 600 700 800 2 x Xeon X7560 4 x Xeon X7560 358 714 383 766 SPECcpu2006:整数演算性能 PRIMERGY RX600 S5(4 ソケットと 2 ソケットの比較) SPECcpu2006:浮動小数点演算性能 PRIMERGY RX600 S5(4 ソケットと 2 ソケットの比較)

(7)

SPECint_base2006 SPECint2006 0 5 10 15 20 25 30 35 PRIMERGY RX600 S4 4 x Xeon X7460 PRIMERGY RX600 S5 4 x Xeon X7542 PRIMERGY RX600 S5 4 x Xeon X7560 21.9 28.9 28.8 25.2 31.9 32.3 次の 4 つの図は、PRIMERGY RX600 S5 とその旧モデルである PRIMERGY RX600 S4 のスループットを 比較したものです。それぞれ最大パフォーマンス構成になっています。 SPECint_rate_base2006 SPECint_rate2006 0 100 200 300 400 500 600 700 800 PRIMERGY RX600 S4 4 x Xeon X7460 PRIMERGY RX600 S5 4 x Xeon X7560 269 714 291 766 SPECcpu2006:整数演算性能 PRIMERGY RX600 S5 と 旧モデルとの比較 SPECcpu2006:整数演算性能 PRIMERGY RX600 S5 と 旧モデルとの比較

(8)

SPECfp_rate_base2006 SPECfp_rate2006 0 100 200 300 400 500 600 PRIMERGY RX600 S4 4 x Xeon X7460 PRIMERGY RX600 S5 4 x Xeon X7560 142 538 156 559 SPECfp_base2006 SPECfp2006 0 5 10 15 20 25 30 35 40 PRIMERGY RX600 S4 4 x Xeon X7460 PRIMERGY RX600 S5 4 x Xeon X7542 PRIMERGY RX600 S5 4 x Xeon X7560 22.4 36.0 35.8 23.8 38.7 39.2 SPECcpu2006:浮動小数点演算性能 PRIMERGY RX600 S5 と 旧モデルとの比較 SPECcpu2006:浮動小数点演算性能 PRIMERGY RX600 S5 と 旧モデルとの比較

(9)

ベンチマーク環境

SPECcpu2006 の測定は、すべて次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S5 で実 行されました。

ハードウェア

モデル PRIMERGY RX600 S5

CPU Xeon E7520、E7530、L7545、E7540、X7542、X7550、L7555、X7560

CPU 数 2 チップ Xeon E7520: 8 コア、4 コア/チップ Xeon E7530、L7545、E7540、X7542: 12 コア、6 コア/チップ その他すべて: 16 コア、8 コア/チップ 4 チップ Xeon E7520: 16 コア、4 コア/チップ Xeon E7530、L7545、E7540、X7542: 24 コア、6 コア/チップ その他すべて: 32 コア、8 コア/チップ プライマリー キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) セカンダリー キャッシュ 256 KB オンチップ(コアあたり) その他のキャッシュ

Xeon E7530: 12 MB(I+D)オンチップ(チップあたり)

Xeon E7520、L7545、E7540、X7542、X7550: 18 MB(I+D)オンチップ(チップあたり)

その他すべて: 24 MB(I+D)オンチップ(チップあたり)

ソフトウェア オペレーティング

システム SUSE Linux Enterprise Server 11(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 11.1

(10)

SPECjbb2005

ベンチマークの説明

SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマーク です。これは、本質的には SPECjbb2000 をアップデートしたものです。主な違いは次のとおりです。  トランザクションは、多様な機能範囲に対応するために、より複雑になっています。  ベンチマークのワーキングセットは、システムの負荷の増大に対応するために、拡大されています。  SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実環境との高い近似性 を得ることができます。 SPECjbb2005 は、ソフトウェアについては主にジャストインタイムコンパイラーで使用される JVM と、ス レッドおよびガーベージコレクションの実装のパフォーマンスを測定します。使用されるオペレーティング システムの機能も評価します。ハードウェアについては、CPU およびキャッシュの効率、メモリサブシス テム、共有メモリシステム(SMP)のスケーラビリティを評価します。ディスクおよびネットワーク I/O は 無関係です。 SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント/サーバ システムをエミュレートしたもので、中間層システムに重点を置いています。  クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベ ースへの OLTP アクセスを思考時間ゼロで行います。  中間層システムは、ビジネスプロセスおよびデータベースの更新を実装します。  データベースはデータ管理を行い、メモリ内の Java オブジェクトによりエミュレートされます。 トランザクションのログ記録は XML ベースで実装されます。 このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフ ォーマンスが測定されます。このため、大規模なハードウェアの設置は不要となり、異なるシステムの SPECjbb2005 の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記 述されています。

SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で す。 スケーリングの単位は、 約 25 MB の Java オブジェクトから成るウェアハウスです。1 つのウェアハウス につき、1 つの Java スレッドがオペレーションを実行します。これらのビジネスオペレーションは TPC-C で次の項目を前提としています。  新規オーダーエントリー  支払  オーダーステータスの照会  納入  在庫レベル監視  顧客レポート ただし、これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません。2 つのベンチマーク の結果は比較できません。 SPECjbb2005 には、次の 2 つの性能指標があります。  bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーション の処理レートです。  bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。 SPECjbb2005 のさまざまな結果の比較では、両方の性能指標を考慮する必要があります。 これらの性能指標の測定は、次のようなベンチマークのルールに準拠しています。 ベンチマーク測定は、ウェアハウス数(スレッド数)が増加する一連の測定ポイントで構成され、それぞれ においてウェアハウス数は 1 つずつ増加します。測定は 1 ウェアハウスで開始され、2*MaxWh(少なくと も 8 ウェアハウス)まで実行されます。MaxWh は、ベンチマークで予想される秒あたりの処理レートが最

(11)

高になるウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます。

性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペレ ーション速度の算術平均です。

ベンチマーク結果

2010 年 5 月に、PRIMERGY RX600 S5 を、Xeon X7560 プロセッサ 4 基と 256 GB PC3-10600R DDR3-SDRAM のメモリを使用して測定しました。測定には、Windows Server 2008 R2 Enterprise を使用しまし た。IBM から提供されている J9 VM の 16 つのインスタンスを使用しました。 結果は以下のとおりです。 SPECjbb2005 bops = 1992688 SPECjbb2005 bops/JVM = 124543 次の図は、PRIMERGY RX600 S5 と旧モデルの PRIMERGY RX600 S4 のスループットを比較したものです。 それぞれ最大パフォーマンス構成になっています。 0 500000 1000000 1500000 2000000 1 2 3 4 5 6 7 8 9 10 11 12 warehouses PRIMERGY RX600 S5 4 x Xeon X7560 256 GB memory IBM J9 VM PRIMERGY RX600 S4 4 x Xeon X7460 64 GB memory Oracle JRockit(R) 6 P28.0.0 SPECjbb2005 bops: PRIMERGY RX600 S5 と 旧モデルとの比較

(12)

ベンチマーク環境

SPECjbb2005 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX600 S5 で実行され ました。 ハードウェア モデル PRIMERGY RX600 S5 CPU Xeon X7560 チップ数 4 チップ、32 コア(チップあたり 8 コア) プライマリーキャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) セカンダリーキャッシュ 256 KB(I+D)オンチップ(コアあたり) その他のキャッシュ 24 MB(命令 + データ)オンチップ(チップあたり) メモリ 64 x 4 GB PC3-10600R DDR3-SDRAM ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Enterprise

JVM バージョン IBM J9 VM(ビルド 2.4、JRE 1.6.0 IBM J9 2.4 Windows Server 2008 amd64-64 jvmwa6460sr6-20090923_42924(JIT 有効、AOT 有効) 国または販売地域によっては、一部のコンポーネントが利用できない場合があります。 633897 1992688 0 500000 1000000 1500000 2000000 PRIMERGY RX600 S4 4 x Xeon X7460 64 GB memory Oracle JRockit(R) 6 P28.0.0 PRIMERGY RX600 S5 4 x Xeon X7560 256 GB memory IBM J9 VM SPECjbb2005 bops: PRIMERGY RX600 S5 と 旧モデルとの比較

(13)

OLTP-2

ベンチマークの説明

OLTP とは、Online Transaction Processing(オンライントランザクション処理)の略です。OLTP-2 ベン チマークは、データベースソリューションの標準的なアプリケーションシナリオを基にしています。OLTP-2 では、データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps) が測定されます。 独立した機関によって標準化され、その規則を順守して測定しているかを監視される SPECint や TPC-E の ようなベンチマークとは異なり、OLTP-2 は、富士通が開発した固有のベンチマークです。OLTP-2 は、デ ータベースのベンチマークとしてよく知られている TPC-E を基に開発されました。そして、CPU やメモリ の構成に応じてシステムがスケーラブルな性能を示すことを実証するために、さまざまな構成で測定できる ように設計されています。 OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシ ナリオをシミュレートしても、この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートする ため、結果を比較したり同等のものとして扱うことはできません。通常、OLTP-2 の値は、TPC-E に近い値 となります。しかし、価格性能比が算出されないため、直接比較できないだけでなく、OLTP-2 の結果を TPC-E として利用することも許可されません。 詳細情報は、『ベンチマークの概要 OLTP-2』のドキュメントで参照できます。

ベンチマーク結果

PRIMERGY RX600 S5 の OLTP-2 の値は、Intel Xeon 75xx プロセッサシリーズを使用して、64 GB、 128 GB、256 GB、および 512 GB のメモリ構成で測定されました。これらの結果は、オペレーティングシ ステム Microsoft Windows Server 2008 R2 Enterprise x64 Edition とデータベース SQL Server 2008 R2 Enterprise x64 Edition で測定されたものです。データベースのパフォーマンスは、ハードディスクとコント ローラーを含むシステムの構成オプションによって、大幅に異なります。ここに記載されている次元のスル ープットは、通常の外部ディスクサブシステムがボトルネックでない場合に実現されます。システム構成の 詳細については、「ベンチマークの環境」を参照してください。 次の表は、PRIMERGY RX600 S5 に搭載可能な各プロセッサの仕様を示しています。 HT = ハイパースレッディング、TM = ターボモード、QPI = QuickPath インターコネクト、 GT = ギガトランスファー、TDP = 熱設計電力 メモリに関しては、8 GB モジュールの最大構成、および 8 GB モジュールの 2 つの別構成で測定しました。 ここでは、周波数はプロセッサタイプによってのみ変わり、使用したメモリモジュールのタイプおよび数に は影響されません。メモリパフォーマンスの詳細については、ホワイトペーパー『Xeon 7500(Nehalem-EX)搭載システムのメモリパフォーマンス』に記載しています。 データベース環境でメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも十分な メモリ容量の方が重要であると言えます。 プロセッサ コア数/ チップ HT TM プロセッサ周波数 L3 キャ ッシュ QPI スピード メモリ周波数 TDP E7520 4  1.86 GHz 18 MB 4.8 GT/s 800 MHz 95 W E7530 6   1.86 GHz 12 MB 5.86 GT/s 978 MHz 105 W E7540 6   2.0 GHz 18 MB 6.4 GT/s 1066 MHz 105 W L7545 6   1.86 GHz 18 MB 5.86 GT/s 978 MHz 95 W L7555 8   1.86 GHz 24 MB 5.86 GT/s 978 MHz 95 W X7542 6  2.66 GHz 18 MB 5.86 GT/s 978 MHz 130 W X7550 8   2.0 GHz 18 MB 6.4 GT/s 1066 MHz 130 W X7560 8   2.26 GHz 24 MB 6.4 GT/s 1066 MHz 130 W

(14)

次のグラフは、2 基または 4 基の Intel Xeon シリーズプロセッサとさまざまなメモリ構成で得られる PRIMERGY RX600 S5 の OLTP-2 パフォーマンスデータを示しています。 搭載可能なプロセッサの種類が多いため、PRIMERGY RX600 S5 は広範囲のパフォーマンスを示します。 同じ最大メモリ構成で比較すると、最低値のプロセッサ(E7520)を使用した場合(956 tps)と、最高値の プロセッサ(X7560)を使用した場合(2042 tps)では、パフォーマンス値は 2.1 倍になっています。 得られた結果に基づいて、これらのプロセッサを複数の異なるグループに分けることができます。 最下位にランクされるのは 4 コアのみのプロセッサである E7520 で、これはターボモードをサポートして いません。 ハイパースレッディングとターボモードの両方をサポートする 6 コアのプロセッサ(E7530、E7540、 L7545)では、パフォーマンスが向上しています。 CPU あたり 8 コアのプロセッサである L7555、X7550、および X7560 は、パフォーマンスの最上位にラン クされます。 6 コアでクロック周波数は高いが、ハイパースレッディング機能がない X7542 プロセッサは例外です。デ ータベースアプリケーションをシミュレートした OLTP-2 の負荷の下では特に、論理的なプロセッサコア数 を 2 倍にするハイパースレッディングのメリットを受けます。 メインメモリを増設すると、すべてのプロセッサタイプでデータベースのスループットを向上させることが できました。 ただし、4 ソケットサーバでは、プロセッサを 2 基から 4 基にすることでパフォーマンスのスケーリングが どの程度向上するかという疑問が生じます。スケーリングが向上すれば、サーバ内のリソース共有によって 通常生じるオーバーヘッドは減少します。スケーリングの係数はアプリケーションによっても変わります。 サーバをデータベースサーバとして使用する場合は、CPU 数を 2 プロセッサから 4 プロセッサに倍増する ことで、パフォーマンスを 82 %~ 92 % 程度向上させることができます。 2CPUs-64GB 2CPUs-128GB 2CPUs-256GB 4CPUs-128GB 4CPUs-256GB 4CPUs-512GB 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 E7520 4Core E7530 6Core E7540 6Core L7545 6Core L7555 8Core X7542 6Core X7550 8Core X7560 8Core 467 670 734 691 879 646 912 998 510 732 802 755 959 705 997 1090 527 756 829 780 991 729 1037 1127 895 1286 1409 1326 1686 1239 1742 1889 941 1351 1481 1393 1771 1302 1831 2013 956 1373 1504 1416 1799 1322 1860 2042 [tps] PRIMERGY RX600 S5 : OLTP-2 太字、斜体の数字:実測値 その他:計算値

(15)

PRIMERGY RX600 S5 をその旧モデルである PRIMERGY RX600 S3 および PRIMERGY RX600 S4 と最大 構成で比較すると、スループットはそれぞれ 511 %(RX600 S3)と 177 %(RX600 S4)向上しています。 333.7 736.94 2041.56 0 250 500 750 1000 1250 1500 1750 2000 2250 PRIMERGY RX600 S3 4 × Xeon 7140M 64 GB RAM PRIMERGY RX600 S4 4 × Xeon 7460 256 GB RAM PRIMERGY RX600 S5 4 × Xeon X5680 512 GB RAM OLTP-2: PRIMERGY RX600 S3 vs. RX600 S4 vs. RX600 S5 +177% +511%

(16)

ベンチマーク環境

一般的な測定環境を以下に示します。 データベースサーバ(B 層) ハードウェア システム PRIMERGY RX600 S5 プロセッサ Xeon E7520 (4 コア、1.86 GHz) × 4 基 Xeon E7530 (6 コア、1.86 GHz) × 4 基 Xeon L7545 (6 コア、1.86 GHz) × 4 基 Xeon E7540 (6 コア、2.0 GHz) × 4 基 Xeon X7542 (6 コア、2.66 GHz) × 4 基 Xeon L7555 (8 コア、1.86 GHz) × 4 基 Xeon X7550 (8 コア、2.0 GHz) × 4 基 Xeon X7560 (8 コア、2.26 GHz) × 4 基 メモリ 64 GB~512 GB、1333 MHz Registered ECC DDR3(8 GB DIMM)

設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効 ネットワーク インターフェース オンボード LAN 1 Gbps × 4 基 ディスクサブシステム RX600 S5: オンボード RAID コントローラー SAS 6G 5/6 512 MB 73 GB 15K rpm SAS ドライブ× 2 台、RAID1(OS)、 300 GB 10K rpm SAS ドライ ブ× 6 台、RAID10(ログ) LSI MegaRAID SAS 9280-8e × 8 基

JX40 × 8 台:各 64 GB SSD ドライブ× 24 台、RAID5(データ) ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Enterprise x64 データベース SQL Server 2008 R2 Enterprise x64

アプリケーション

サーバ

A 層

B 層

ネットワーク ネットワーク クライアント

データベースサーバ

ストレージサブシステム

SUT(System Under Test:テスト対象システム)

ドライバ

(17)

アプリケーションサーバ(A 層) ハードウェア システム PRIMERGY RX200 S6 プロセッサ Xeon E5620 (4 コア、2.40 GHz)× 2 基 メモリ 12 GB、1333 MHz Registered ECC DDR3 ネットワーク インターフェース オンボード LAN 1 Gbps × 2 基、デュアルポート LAN 1Gbps × 2 基 ディスクサブシステム 73 GB 15K rpm SAS ドライブ× 1 台 ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Standard x64 クライアント ハードウェア システム PRIMERGY RX200 S5 プロセッサ Xeon X5570(4 コア、2.93 GHz)× 2 基 メモリ 24 GB、1333 MHz Registered ECC DDR3 ネットワーク インターフェース オンボード LAN 1 Gbps × 2 基 ディスクサブシステム 73 GB 15K rpm SAS ドライブ× 1 台 ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Standard x64 OLTP-2 ソフトウェア EGen バージョン 1.10.0

(18)

TPC-E

ベンチマークの説明

TPC-E ベンチマークでは、オンライントランザクション処理(OLTP)システムのパフォーマンスを測定し ます。このベンチマークは、複雑なデータベースと、そのデータベース上で実行されるさまざまな種類のト ランザクションを基にしています。TPC-E は、ハードウェアに依存しないだけでなく、ソフトウェアにも 依存しないベンチマークなので、すべてのテスト用プラットフォームで(メーカー独自のものでもオープン なものでも)実行できます。測定結果に加えて、測定されたシステムと測定方法の詳細もすべて、完全公開 レポート(Full Disclosure Report: FDR)で説明が義務付けられています。これにより、測定がベンチマー クの要件をすべて満たしたもので、再現可能であることが保証されます。TPC-E は、個別のサーバーを測 定するだけでなく、大規模なシステム構成も測定します。この場合のパフォーマンスの鍵となるのは、デー タベースサーバー、ディスク I/O およびネットワーク通信です。

パフォーマンスの性能指標は tpsE で、ここでの tps は、transactions per second(1 秒あたりのトランザク ション数)を意味します。tpsE は、1 秒間に実行された Trade-Result-Transactions(取引結果のトランザ クション)の平均数です。TPC-E の基準では、結果は、tpsE 値、パフォーマンス値あたりのコスト(例:

$/tpsE)、および測定された構成機器の入手可能日と定義されています。詳細情報は、『ベンチマークの概

要 TPC-E』のドキュメントで参照できます。

ベンチマーク結果

富士通は、2010 年 6 月に 8 コアプロセッサ Intel Xeon X7560 と 512 GB メモリを搭載した PRIMERGY

PRIMERGY RX600 S5 TPC-E 1.10.0 TPC Pricing 1.5.0 Report Date June 18, 2010 TPC-E Throughput 2046.96 tpsE Price/Performance $ 193.68 USD per tpsE

Availability Date September 1, 2010

Total System Cost $ 396,435 Database Server Configuration

Operating System Microsoft Windows Server

2008 R2 Enterprise x64 Edition Database Manager Microsoft SQL Server 2008 R2 Enterprise x64 Edition Processors/Cores/Threads 4/32/64 Memory 512 GB

Initial Database Size 8,512 GB

Redundancy Level 1 RAID-5 data and RAID-10 log

Storage 192 × 64 GB SSD 4 × 750 GB 7.2K HDD

6 × 300GB 10K HDD

(19)

RX600 S5 の TPC-E ベンチマークの結果を提出しました。PRIMERGY RX600 S4 と比較して大幅なパフォ ーマンスの向上とコストの削減が実現されていることが、これによって証明されました。

詳細情報および競合他社との比較は、TPC の Web サイト(http://www.tpc.org/tpce)で参照できます。 PRIMERGY TX300 S4、PRIMERGY RX600 S4、および PRIMERGY RX300 S5 の測定結果の提出以降、 2010 年 6 月に TPC-E の結果のリストに入っている富士通の製品は 5 種類あります。

システムとプロセッサ スループット 価格性能比 入手可能日

TX300 S4(Xeon X5460 を 2 基搭載) 317.45 tpsE $523.49/tpsE 2008 年 8 月 30 日 RX600 S4(Xeon X7350 を 4 基搭載) 492.34 tpsE $559.88/tpsE 2009 年 1 月 1 日 RX600 S4(Xeon X7460 を 4 基搭載) 721.40 tpsE $459.71/tpsE 2009 年 1 月 1 日 RX300 S5(Xeon X5570 を 2 基搭載) 800.00 tpsE $343.91/tpsE 2009 年 4 月 1 日 RX600 S5(Xeon X7560 を 4 基搭載) 2046.96 tpsE $193.68/tpsE 2010 年 9 月 1 日

測定結果を他機種と比較した次の図から、PRIMERGY RX600 S5 の非常に優れたパフォーマンスが分かり ます。PRIMERGY TX300 S4 と比較するとパフォーマンスの増加は +545 %、PRIMERGY RX300 S5 と比 較すると +156 %です。Intel Xeon X7460 プロセッサを 4 基搭載した PRIMERGY RX600 S4 と比較すると、 増加は +184 %です。

$193.68/tpsE と い う 価 格 性 能 比 は 、 提 出 さ れ て い る す べ て の TPC-E の 結 果 の 中 で 最 高 の 値 で す 。 PRIMERGY TX300 S4 と比較するとコストは 37 %、PRIMERGY RX300 S5 と比較すると 56 %、6 コアの プロセッサ Intel Xeon X7460 を搭載した PRIMERGY RX600 S4 と比較すると 42 %に削減されています。

317.45 492.34 721.40 800.00 2,046.96 523.49 559.88 459.71 343.91 193.68 0 100 200 300 400 500 600 0 500 1000 1500 2000 2500 3000 PRIMERGY TX300 S4 2 × Xeon X5460 64 GB RAM PRIMERGY RX600 S4 4 × Xeon X7350 128 GB RAM PRIMERGY RX600 S4 4 × Xeon X7460 128 GB RAM PRIMERGY RX300 S5 2 × Xeon X5570 96 GB RAM PRIMERGY RX600 S5 4 × Xeon X7560 512 GB RAM $/tpsE tpsE tpsE $/tpsE +184%

(20)

次の図は、4 基のプロセッサを使用した構成の場合の、最高の TPC-E の結果(2010 年 6 月 1 日現在)と、 対応する価格性能比の値を示しています。PRIMERGY RX600 S5 は、最高のパフォーマンス値を持つ、ク ラスで最高の製品です。現時点でのすべての TPC-E の登録の中で、PRIMERGY RX600 S5 は、パフォーマ ンスの順位で 2 位、価格性能比では 1 位を獲得しています。

1) Fujitsu PRIMERGY RX600 S5 2046.86 tpsE、$193.68/tpsE、入手可能日 2010 年 9 月 1 日 2) IBM システム x3850 X5 2022.64 tpsE、$355.02/tpsE、入手可能日 2010 年 7 月 30 日

3) HP ProLiant DL580 G7 2001.12 tpsE、$347.00/tpsE、5.84 W/TpsE、入手可能日 2010 年 6 月 21 日 4) Dell PowerEdge R910 1933.96 tpsE、$328.58/tpsE、入手可能日 2010 年 5 月 6 日

5) HP ProLiant BL685c G7 ブレードサーバ 1464.12 tpsE、$302.49/tpsE、入手可能日 2010 年 6 月 21 日 6) HP ProLiant DL 585 G7 1400.14 tpsE、$330.00/tpsE、6.72 W/TpsE、入手可能日 2010 年 6 月 21 日

2046.86 2022.64 2001.12 1933.96 1464.12 1400.14 193.68 355.02 347.00 328.58 302.49 330.00 0 100 200 300 400 500 600 700 800 0 500 1000 1500 2000 2500 Fujitsu 1) PRIMERGY RX600 S5 IBM 2) System x3850 HP 3) ProLiant DL580 G7 Dell 4) PowerEdge R910 HP 5) ProLiant BL685c G7 HP 6) ProLiant DL 585 G7 $/tpsE tpsE tpsE $/tpsE

(21)

SAP SD

ベンチマークの説明

SAP アプリケーションソフトウェアは、標準的な業務プロセスを管理するためのモジュールで構成されて います。モジュールには、受注組立(ATO)、財務会計(FI)、人事管理(HR)、在庫購買管理(MM)、 生産計画(PP)、販売管理(SD)などの ERP(企業資源計画)用のものや、SCM(サプライチェーンマ ネジメント)、小売、銀行業務、公益事業、BI(ビジネスインテリジェンス)、CRM(顧客関係管理)、 PLM(製品ライフサイクル管理)用のものがあります。 SAP アプリケーションソフトウェアは必ずデータベースと関連しています。したがって、SAP の構成には、 ハードウェアに加え、ソフトウェアコンポーネントであるオペレーティングシステムとデータベース、およ び SAP ソフトウェア自体も含まれます。 SAP アプリケーションシステムのパフォーマンス、安定性およびスケーラビリティを評価するために、 SAP AG は SAP 標準アプリケーションベンチマークを開発しました。これらのベンチマーク(その中でも SD ベンチマークが最も重要で最も広く使用されています)では、システム全体のパフォーマンスが分析さ れるため、各コンポーネントの統合品質を測定する方法が提供されます。 ベンチマークは、2 層の構成と 3 層の構成で違いがあります。2 層の構成では、SAP アプリケーションとデ ータベースが、1 台のサーバにインストールされます。3 層の構成では、SAP アプリケーションの各コンポ ーネントを数台のサーバに分散でき、別のサーバでデータベースを処理します。 SAP AG(ドイツ、Walldorf)によって開発されたベンチマークの詳細な仕様は、 http://www.sap.com/benchmark で参照できます。

(22)

ベンチマーク結果

2011 年 3 月 1 日に Xeon X7560 プロセッサ 4 基を搭載した PRIMERGY RX600 S5(Windows Server 2008 R2 Datacenter で SAP Enhancement Package 4 for SAP ERP 6.0 と SQL Server 2008 を使用)で次の結果 を得たことが認証されました(認証番号 2011013)。

認証番号 2011013

Number of SAP SD benchmark users 10,055 Average dialog response time 0.99 seconds Throughput

Fully processed order line items/hour dialog steps/hour

SAPS

1,098,330 3,295,000 54,920

Average database request time (dialog/update) 0.023 sec / 0.021 sec CPU utilization of central server 97%

Operating system, central server Windows Server 2008 R2 Datacenter

RDBMS SQL Server 2008

SAP Business Suite software SAP enhancement package 4 for SAP ERP 6.0 Configuration

Central server

PRIMERGY RX600 S5

4 processors / 32 cores / 64 threads Xeon X7560 512 GB main memory 次の図は、PRIMERGY RX600 S5 と高性能な PRIMERGY 2 ソケットサーバ のスループットを比較したも のです。それぞれ、最大パフォーマンス構成になっています。 日付:2011 年 3 月 22 日 4910 10055 0 2000 4000 6000 8000 10000 Number of Benchmark Users

Fujitsu PRIMERGY RX600 S5 4 x Xeon X7560

512 GB RAM

Windows Server 2008 R2 Datacenter SQL Server 2008 Enterprise Edition Fujitsu PRIMERGY BX922 S2 4 x Xeon X5680

72 GB RAM

Windows Server 2008 R2 Enterprise SQL Server 2008 Enterprise Edition

(23)

ベンチマーク環境

SUT(System Under Test:テスト対象システム)

ハードウェア サーバ PRIMERGY RX600 S5 プロセッサ Xeon X7560 x 4 基 メモリ 8 GB PC3-10600R DDR3-SDRAM x 64 枚 ディスクサブシステム PRIMERGY RX600 S5 x 1 台: RAID コントローラー SAS 6G 8 ポート 512 MB コントローラーキャッシ ュ(× 2 基)

RAID 5/6 V70 用 RAID コントローラー BBU アップグレード(× 2 基) HD SAS 6G 73 GB 15K ホットプラグ 2.5 インチ EP(× 8 台)

FC コントローラー 8 Gb/s 1 チャネル LPe1250 MMF LC(× 4 基) FibreCAT CX4-480 × 1 台

ソフトウェア

オペレーティングシステム Windows Server 2008 R2 Datacenter データベース SQL Server 2008 Enterprise Edition

SAP Business Suite ソフトウェア SAP Enhancement Package 4 for SAP ERP 6.0 負荷ジェネレーター ハードウェア モデル PRIMERGY RX300 S4 プロセッサ Xeon X5460(3.17 GHz、12 MB L2 キャッシュ)x 2 基 メモリ 12 GB PC2-5300F DDR2-SDRAM ソフトウェア オペレーティングシステム Linux 2.6.32 国または販売地域によっては、一部のコンポーネントが利用できない場合があります。 テスト対象システム 2 層環境 負荷ジェネレーター

(24)

SAP BI-D

ベンチマークの説明

SAP アプリケーションシステムのパフォーマンス、安定性およびスケーラビリティを評価するために、 SAP およびそのハードウェアパートナーとテクノロジーパートナーは、SAP 標準アプリケーションベンチ マークを開発しました。SAP 標準アプリケーションベンチマークは、SAP ユーザーの最も典型的なトラン ザクションとワークフローをシミュレートするスクリプトファイルで構成されています。また、事前に定義 された SAP クライアントデータベースには、ベンチマークの実行対象のサンプル企業データが含まれてい ます。SAP 標準アプリケーションベンチマークを他の標準ベンチマークと比較した場合の主な違いは、総 合的なベンチマークコードではなく商用アプリケーションコードを実行することです。

SAP BI-D(Business Intelligence-Data Mart:ビジネスインテリジェンスデータマート)の標準アプリケー ションベンチマークは、BW(Business Warehouse:ビジネスウェアハウス)環境でのシステムパフォーマ ンスを効率的に分析し最適化するために、企業で広く使用されています。このベンチマークでは、ビジネス ウェアハウスシステムのデータベースに対して大量のクエリを実行し、これを処理する際のシステムパフォ ーマンスを測定します。そのため、企業のデータベースパフォーマンスの実際の値に近い指標を示します。 データマートのシナリオは、SAP NetWeaver テクノロジープラットフォームのビジネスインテリジェンス 機能の利用方法の 1 つです。データマートには、運用データの静的スナップショットが大量に含まれていま す。このデータは、25 億件のレコードを含む 10 の InfoCube 内にあり、複数のユーザーがクエリを実行し ます。マスタデータは、クエリと同様にランダムに作成されます。ベンチマーク結果で重要な数値は、1 時 間あたりのクエリナビゲーションステップ数です。 ベンチマークは、2 層の構成と 3 層の構成で違いがあります。2 層の構成では、SAP アプリケーションとデ ータベースを、1 台のサーバにインストールします。3 層の構成では、SAP アプリケーションの各コンポー ネントを数台のサーバに分散できます。 SAP AG ( ド イ ツ 、 Walldorf ) に よ っ て 開 発 さ れ た ベ ン チ マ ー ク の 詳 細 な 仕 様 は 、 http://www.sap.com/benchmark で参照できます。

ベンチマーク結果

2010 年 3 月 7 日、シングルノードの PRIMERGY RX600 S5 は、1 時間あたり 854,649 クエリナビゲーシ ョンステップという、2 層の SAP BI-D の世界記録となる結果を達成しました(認証番号 2010011)。2010 年 5 月 6 日、2 ノードの PRIMERGY RX600 S5 は、1 時間あたり 1,624,629 クエリナビゲーションステッ プという、3 層の世界記録となる結果を達成しました(Oracle Real Application Clusters)(認証番号 2010024)。

2 層の SAP BI-D、認証日 2010 年 3 月 30 日、認証番号 2010011

Throughput/hour (query navigation steps) 854,649

CPU utilization central server 96% (1 node active: 96%) Operating system, central server SuSE Linux Enterprise Server 10

RDBMS Oracle 11g Real Application Clusters (RAC)

Technology platform release SAP NetWeaver 7.0 (non-Unicode) Configuration

1 server (1 active node):

PRIMERGY RX600 S5

4 processors / 32 cores / 64 threads Xeon X7560

(25)

3 層の SAP BI-D、認証日 2010 年 5 月 31 日、認証番号 2010024

Throughput/hour (query navigation steps) 1,624,629

CPU utilization central server 94% (node 1 active: 93%) (node 2 active: 94%)

Operating system, central server SuSE Linux Enterprise Server 10

RDBMS Oracle 11g Real Application Clusters (RAC)

Technology platform release SAP NetWeaver 7.0 (non-Unicode) Configuration

1 server (1 active node):

1 server (1 active node):

PRIMERGY RX600 S5

4 processors / 32 cores / 64 threads Xeon X7560, 128 GB main memory PRIMERGY RX600 S5

4 processors / 32 cores / 64 threads Xeon X7560, 256 GB main memory

次のグラフから分かるように、PRIMERGY RX600 S5 は優れたパフォーマンスとスケーラビリティを示し、 PRIMERGY RX300 S5 の SAP BI-D ベ ンチマーク結果を補完するものです。 Oracle Real Application Clusters によるアプリケーションの高可用性に加えて、小規模システムから開始して需要に応じて段階的に 処理能力を拡張できることも、システム環境を検討する際の決め手になります。 SAP BI-D の結果上位 Source: www.sap.com/benchmark as of 01 December 2010 Vendor Config System CPU Type Techn.Platform OS DB Certification Procs/cores/ threads 4/32/64 4/8/16 Fujitsu 3-tier 2 x RX600S5 Xeon X7560 NW 7.0 SLES10 Ora11g RAC #2010024 2/8/16 2/8/16 4/32/64 2/8/16 2/8/16 Fujitsu 3-tier 4 x RX300S5 Xeon X5570 NW 7.0 SLES10 Ora11g RAC #2009045 Fujitsu 3-tier 3 x RX300S5 Xeon X5570 NW 7.0 SLES10 Ora11g RAC #2009044 Fujitsu 2-tier 1 x RX600S5 Xeon X7560 NW 7.0 SLES10 Ora11g RAC #2010011 Fujitsu 3-tier 2 x RX300S5 Xeon X5570 NW 7.0 SLES10 Ora11g RAC #2009037 Fujitsu 2-tier 1 x RX300S5 Xeon X5570 NW 7.0 SLES10 Ora11g RAC #2009036 IBM 2-tier 1 x p570 Power6 5GHz NW 7.0 i6.1 DB2 #2008063 RX600 S5 Source: www.sap.com/benchmark as of 01 December 2010 Vendor Config System CPU Type Techn.Platform OS DB Certification Procs/cores/ threads 4/32/64 4/8/16 Fujitsu 3-tier 2 x RX600S5 Xeon X7560 NW 7.0 SLES10 Ora11g RAC #2010024 2/8/16 2/8/16 4/32/64 2/8/16 2/8/16 Fujitsu 3-tier 4 x RX300S5 Xeon X5570 NW 7.0 SLES10 Ora11g RAC #2009045 Fujitsu 3-tier 3 x RX300S5 Xeon X5570 NW 7.0 SLES10 Ora11g RAC #2009044 Fujitsu 2-tier 1 x RX600S5 Xeon X7560 NW 7.0 SLES10 Ora11g RAC #2010011 Fujitsu 3-tier 2 x RX300S5 Xeon X5570 NW 7.0 SLES10 Ora11g RAC #2009037 Fujitsu 2-tier 1 x RX300S5 Xeon X5570 NW 7.0 SLES10 Ora11g RAC #2009036 IBM 2-tier 1 x p570 Power6 5GHz NW 7.0 i6.1 DB2 #2008063 RX600 S5

(26)

vServCon

ベンチマークの説明

vServCon は、富士通テクノロジー・ソリューションズが、ハイパーバイザーを使用するサーバ構成につい て、サーバ統合の適合性の比較に使用するベンチマークです。これにより、システム、プロセッサ、および I/O テクノロジーの比較に加え、ハイパーバイザー、仮想化形式、および仮想マシン用の追加ドライバの比 較も可能になります。 vServCon は、実際には新しいベンチマークではありません。これは、言うなればフレームワークであり、 すでに確立されたベンチマークをワークロードとして集約し、統合され仮想化されたサーバ環境の負荷を再 現します。データベース、アプリケーションサーバ、Web サーバというアプリケーションシナリオを対象 とする 3 つの実証済みのベンチマークが使用されます。 3 つのアプリケーションシナリオのそれぞれが、1 つの専用の仮想マシン(VM)に割り当てられます。これ らに加えてアイドル VM という 4 番目の仮想マシンが追加されます。これら 4 つの VM が 1 つの「タイル」 を構成します。最大の性能値を引き出すためには、測定対象となるサーバの処理能力に応じて、いくつかの タイルを並行して開始しなければならない場合もあります。 3 つの vServCon アプリケーションシナリオのそれぞれが、各 VM のアプリケーション固有のトランザクシ ョンレートという形でベンチマーク結果を提供します。スコアを正規化するために、1 つのタイルのそれぞ れのベンチマーク結果とリファレンスシステムの結果との比を求めます。その相対性能値に適切な重み付け を行い、すべての VM とすべてのタイルについて加算します。最終的な計算結果が、このタイル数に対する スコアになります。 原則として、1 つのタイルから始めて、vServCon スコアの大幅な増加が見られなくなるまで、タイル数を 増やしながらこの手順が実行されます。最終的な vServCon スコアは、すべてのタイル数から得られた vServCon スコアの最大値です。したがって、このスコアは、CPU リソースを最大限まで使用する構成で達 成される最大スループットを反映しています。このため、vServCon の測定環境は、CPU のみが制限要因と なるように設計されており、他のリソースによる制限は発生しないように設計されています。 タイル数の増加に対する vServCon スコアの伸びは、テスト対象システムのスケーリング特性についての有 益な情報となります。

さらに、vServCon では、ホストの合計 CPU 負荷(VM および他のすべての CPU 処理)を記録し、可能な 場合は電力消費量も記録します。 vServCon の詳細については、『ベンチマークの概要 vServCon』を参照してください。 アプリケーションシナリオ ベンチマーク 論理 CPU コアの数 メモリ データベース Sysbench(補正済み) 2 1.5 GB Java アプリケーションサーバ SPECjbb(補正済み、50~60 %の負荷) 2 2 GB Web サーバ WebBench 1 1.5 GB テスト対象システム タイル n タイル 3 タイル 2 タイル 1 データベース VM Web VM アイドル VM Java VM データベース VM Web VM アイドル VM Java VM データベース VM Web VM アイドル VM Java VM データベース VM Web VM アイドル VM Java VM

(27)

ベンチマーク結果

PRIMERGY RX600 S5 は、最大 32 個のプロセッサコア、1024 GB のメインメモリ、10 本の I/O スロット、 さらに進歩したプロセッサテクノロジーなど、多様な拡張性を備え、多数のアプリケーション VM の実行に 適しています。前世代のプロセッサをベースとするシステムと比較して、仮想化のパフォーマンスが最高約 170 %向上しています(vServCon スコアで測定)。 プロセッサを 4 基搭載したシステムで、前述の vServCon プロファイルを基にして 54 のアプリケーション VM(18 のタイルに相当)を使用した場合、 CPU リソースの最適な活用をほぼ実現することができます。 上記のグラフは、各プロセッサで達成可能な仮想化性能値を比較したものです。このシステム用にリリース されたプロセッサには、4 コア、6 コア、8 コアがあり、技術的な仕様が異なります。次の表は、各プロセ ッサの主な違いとベンチマーク結果を示しています。(略号: QPI = QuickPath インターコネクト、GT =ギガ トランスファー、TDP =熱設計電力) プロセッサ コア数 L3 キャ ッシュ プロセッサ 周波数 QPI スピード ハイパー スレッディング ターボ モード TDP タイル数 スコア E7520 4 18 MB 1.86 GHz 4.8 GT/s   95 W 9 7.55 E7530 6 12 MB 1.86 GHz 5.86 GT/s   105 W 14 10.64 E7540 6 18 MB 2.0 GHz 6.4 GT/s   105 W 14 12.41 X7542 6 18 MB 2.66 GHz 5.86 GT/s   130 W 7 10.66 X7550 8 18 MB 2.0 GHz 6.4 GT/s   130 W 18 15.61 X7560 8 24 MB 2.26 GHz 6.4 GT/s   130 W 18 17.82   L7545 6 18 MB 1.86 GHz 5.86 GT/s   95 W 14 11.27 L7555 8 24 MB 1.86 GHz 5.86 GT/s   95 W 18 15.40 メモリ構成のパフォーマンスに対する影響は、比較的複雑です。詳細は、ホワイトペーパー『Xeon 7500 (Nehalem-EX)搭載システムのメモリパフォーマンス』を参照してください。このホワイトペーパーでは、 上の表で使用されている用語(QPI および GT)についても詳細を掲載しています。仮想化環境のメインメ モリを選択するときのガイドラインとして、メモリアクセス速度よりも十分な容量の方が重要であると言え ます。 E 7 5 2 0 E 7 5 3 0 X 7 5 4 2 L7545 E7 5 4 0 L7555 X7 5 5 0 X 7 5 6 0 9 14 7 14 14 18 18 18 0 2 4 6 8 10 12 14 16 18 20 F in a l v S e rv C o n S c o re #Tiles

(28)

次のグラフは、PRIMERGY RX600 S5 に Xeon E7540(6 コア)プロセッサおよび L7555(8 コア)プロセ ッサを搭載したときの、VM 数の増加に対する仮想化のパフォーマンスを示しています。ホストのそれぞれ の CPU 負荷も示されています。CPU 負荷が 90 %のときが最適なタイル数です。90 %を超えると過負荷と なり、仮想化のパフォーマンスは向上しなくなり、低下します。 物理コア数の増加に加え、7500 シリーズのほとんどすべての Xeon プロセッサでサポートされているハイ パースレッディング機能によって、多数の VM の稼動が可能になります。ハイパースレッディング機能では、 1 つの物理プロセッサコアが結果的に 2 つの論理コアに分割されるため、ハイパーバイザーが利用できるコ ア数は 2 倍になります。そのため、この標準機能は、システムの仮想化性能を向上させます。 ハイパースレッディング機能を使用するシステムでは、前のグラフに示されているタイル数のスケーリング 曲線が明確に見られます。Xeon E7540 プロセッサには、24 個の物理コア、すなわち 48 個の論理コアがあ り、1 つのタイルにつき 4 個程度の論理コアが使用されます(『ベンチマークの説明』を参照)。つまり、 ほぼ 6 タイルまでは、複数の VM が同じ物理コアを並行して使用することを回避できます。そのため、この 範囲では理想的なパフォーマンス曲線を描きます。その後、CPU 使用率が限界に達するまでのパフォーマ ンス曲線は、傾きが緩やかになっていきます。 前のグラフでは、ホストの全アプリケーション VM の総合的なパフォーマンスを測定しました。しかし、 個々のアプリケーション VM のパフォーマンスも興味深いものです。この情報は、前のグラフから読み取れ ます。例えば、上記の Xeon E7540 環境で、42 のアプリケーション VM(14 タイル)を使用した場合に、 全体最適化された状態になります。3 つのアプリケーション VM(1 タイル)を使用した場合が、低負荷の ケースです。1 タイルあたりの vServCon スコアは、vServCon の 3 つのアプリケーションシナリオを通じ た平均値です。1 タイル当りの平均パフォーマンスは、vServCon スコアが低負荷のケース(1.75)から全 体最適化された状態(0.89=12.41/14)へ変化すると、51%へと大幅に低下します。個々のアプリケーショ ン VM の反応は、高負荷の状況では全く違ったものになります。ある特定の状況下では、仮想ホストの VM 数に関して、全体的なパフォーマンス要件と、個々のアプリケーションのパフォーマンス要件のバランスを とる必要があります。 1 .7 5 3 .5 3 5 .1 7 6 .6 6 8 .2 3 9 .3 1 9 .8 9 1 0 .3 3 1 0 .7 0 1 1 .1 9 1 1 .7 0 1 2 .0 2 1 2 .3 2 1 2 .4 1 1.66 3 .3 3 4 .9 9 6 .6 1 8 .0 0 9 .6 7 1 0 .9 2 1 1 .9 1 1 2 .4 8 1 2 .8 1 1 2 .8 8 1 3 .6 9 1 4 .0 8 1 4 .7 3 1 4 .9 9 1 5 .1 7 1 5 .2 7 1 5 .4 0 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 4 x E7540 4 x L7555 0 2 4 6 8 10 12 14 16 18 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 C P U u til iz a tio n v S e rv C o n s c o re # Tiles vServCon score (left axis) CPU utilization of host (right axis)

(29)

2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は、一方では個別の VM に影響し、他方 では CPU をフル活用したときの使用可能な最大 VM 数に影響しています。次のグラフでは、この 2 つの側 面における向上の割合を示します。プロセッサ周波数が異なる 3 つの構成を選択し、比較しています。 Xeon X7460 を 4 基搭載した 2008 年の 4 ソケットシステムと、Xeon E7540 を 4 基、および Xeon L7555 を 4 基搭載した PRIMERGY RX600 S5 です。

2008 年のシステムと Xeon E7540 プロセッサを搭載した現在のシステムを比較すると、VM の数が少ない ケース(1 タイル)での進歩は明らかです。プロセッサ周波数が 25 % 低いにも関わらず(2.67 GHz に対 して 2.0 GHz)、現在のシステムの vServCon スコアはわずかに高くなっています。この主な理由の 1 つが、 プロセッサの新しい機能である EPT(Extended Page Tables:拡張ページテーブル)です1

。 VM でシステムを完全負荷状態にすると、Xeon E7540 6 コアプロセッサを搭載した現行システムの仮想化 のパフォーマンスは、プロセッサ周波数が 25 % 低いにも関わらず、約 2 倍になります。理由の 1 つは、 個々の VM のパフォーマンス向上です(VM の数が少ないケースのスコアを参照)。もう 1 つの理由は、全 体最適化された状態で稼動可能な VM の数が(ハイパースレッディングやメモリ帯域幅の拡大などにより) 2 倍以上に増加していることです。ただし、VM の数を増やすことで個々の VM のパフォーマンスは低下し ているため、全体としての性能向上は、VM の数が 6 タイルに対して 14 タイルになったことによってもた らされたものと言えます。 1 EPT は、ホスト OS とゲスト OS のメモリアドレスのマッピングをハードウェアでサポートすることでメモリの仮想 化を支援します。 0 2 4 6 8 10 12 14 16 18 2008 X7460 4 × 6 2.67 GHz 2010 E7540 4 × 6 2.0 GHz 2010 L7555 4 × 8 1.86 GHz 2008 X7460 4 × 6 2.67 GHz 2010 E7540 4 × 6 2.0 GHz 2010 L7555 4 × 8 1.86 GHz Overall Optimum Few VMs

Virtualization relevant improvements for 4-way servers

× 1.86 v S e rv C o n S c o re × 2.31 Year CPU #Cores Freq.

(30)

前世代のプロセッサをベースとするシステムとの比較においては、完全負荷状態での現在のシステムのスコ アの向上に加えて、消費電力の削減も考慮すべきです。TDP(Thermal Design Power:熱設計電力)が、こ の指針となります。2008 年に使用されていた Xeon X7460 プロセッサの TDP は 130 W ですが、現行の Xeon E7540 プロセッサの TDP はわずか 105 W です。 さらにコア数の多いプロセッサを使用することによって、仮想化性能をさらに向上させることができます。 (完全負荷状態で)6 コアプロセッサではなく 8 コアプロセッサの現在のシステムで同じ測定を行うと、 2008 年のシステムよりも明らかにパフォーマンスが向上していることがわかります。この例では、プロセ ッサクロック周波数が 30 %低いのにも関わらず、仮想化のパフォーマンスは 2.31 倍に向上しています。ま た、プロセッサの TDP は 95 W に低下し、エネルギー効率も高まっています。 仮想化パフォーマンスの増加は、個別の VM の性能向上によるものがすべてとは言えないということに注意 してください。それだけでは、Xeon 7400 世代(2008 年)の同一クロックのプロセッサと比較して、30 % ~ 50 %を超えるスループットの増加は不可能です。2009 年以降の仮想化環境におけるパフォーマンス向上 の大部分は、稼動できる最大 VM 数が増大したことによって達成されたものです。

(31)

ベンチマーク環境

測定は次のような環境で行われました。 SUT ハードウェア モデル PRIMERGY RX600 S5 プロセッサ Xeon E7520(4 コア、1.86 GHz)× 4 基 Xeon E7530(6 コア、1.86 GHz)× 4 基 Xeon L7545(6 コア、1.86 GHz)× 4 基 Xeon E7540(6 コア、2.0 GHz)× 4 基 Xeon X7542(6 コア、2.66 GHz)× 4 基 Xeon L7555(8 コア、1.86 GHz)× 4 基 Xeon X7550(8 コア、2.0 GHz)× 4 基 Xeon X7560(8 コア、2.26 GHz)× 4 基 メモリ 512 GB(8 GB DIMM を使用した完全構成) ネットワークインターフェース 1 Gbit LAN × 4: 負荷用 × 3、制御用 × 1 ディスクサブシステム 内蔵ハードディスクは使用せず、ストレージシステム FibreCAT CX500 のみを使用 VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN

各 LUN は、5 つの Seagate ST373454 ディスク(15 krpm)で構成された RAID 0 アレイ

ストレージの接続 FC コントローラー Emulex LPe12002 を使用

SUT ソフトウェア

オペレーティングシステム ハイパーバイザー VMware ESX Server

バージョン バージョン 4.0 U2 ビルド 261974 BIOS バージョン Aptio 3.6 R1.01C.2870、デフォルト設定 SUT:仮想化に関する詳細 ESX 設定 デフォルト 一般的な詳細 『ベンチマークの概要 vServCon』を参照 負荷ジェネレーターのハードウェア モデル PRIMERGY BX600 S3 シャーシ内にタイルあたり 2 つのサーバブレード プロセッサ それぞれ Xeon 5130 × 2 基、2000 MHz メモリ 1~2 GB ネットワークインターフェース それぞれ 1 Gbit LAN × 2 オペレーティングシステム W2K3 EE 国または販売地域によっては、一部のコンポーネントが利用できない場合があります。 1 Gb または 10 Gb の 複数のネットワーク 負荷ジェネレーター サーバ ストレージシステム

SUT(System Under Test:テスト対象システム)

フレームワーク コントローラー

(32)

VMmark V1

ベンチマークの説明

このセクションの内容は、VMmark ベンチマークバージョン 1.1.1(以降、「VMmark V1」)に基づいてい ます。VMmark V1 は、ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比 較を行うために VMware が開発したベンチマークです。 ベンチマークは、負荷生成用のソフトウェアに加えて、定義済み負荷プロファイルおよび規定されたルール で構成されます。長い間、VMmark V1 は、ベンダー間の比較が可能な唯一の確立された仮想化ベンチマー クでした。VMmark V1 のベンチマーク結果は、VMware 社のレビュー後に VMware サイトで公開されてい ました。現在では、VMmark V2 に置き換えられており、VMmark V1 は研究目的でのみ使用可能です。 VMmark V1 のようなベンチマークは、サーバ統合の観点から実際のデータセンターを模倣します。言い方 を変えると、実際にサーバ上で仮想化されているアプリケーションシナリオを考慮しなければなりません。 目標は、稼動率が低いサーバをできるだけ多く VM として集約することです。そのため、ベンチマークによ って、さまざまなアプリケーション VM の全体的なスループットと、効率よく運用できる仮想マシンの個数 を評価することが必要になります。 これらの 2 つの目的のために次のようなソリューションコンセプトが確立されています。まず、アプリケー ションシナリオの代表的なグループが選択されます。これらは、測定時に仮想ホスト上で同時に開始されま す。各 VM には、適切な負荷ツールを使用して低い負荷がかけられるようになっています。このような VM をグループ化したものを「タイル」と呼びます。 VMmark V1 のタイルは 6 つの VM で構成され、 そのうち 5 つは特定のアプリケーションシナリ オに割り当てられます。これらの VM に加え、ス タンバイサーバという 6 番目の VM が追加され ます。VMmark V1 では、論理的なプロセッサ、 メモリ、ハードディスクスペースといった特定の リソースが各 VM に強制的に割り当てられます。 右の表に、6 つの VM とそれらを測定するために 使用する負荷ツールを示します。 測定対象となるサーバの処理能力によっては、全体として最大のパフォーマンスを達成するために複数のタ イルを並列して開始する必要があります。 5 つの VMmark V1 アプリケーションシナリオのそれぞれから VM ごとのベンチマーク結果が得られます。 これらの結果から単一のスコアを取得するために、すべての結果が適切に集約されます。結果は、あるタイ ル数に対する VMmark V1 スコアで表し、「12.34@5 タイル」のように実際のスコアに加えてタイル数が示 されます。 VMmark V1 の詳細については、『ベンチマークの概要 VMmark V1』を参照してください。 アプリケーションシナリオ 負荷ツール データベースサーバ Sysbench ファイルサーバ Dbench(変更済み) Java アプリケーションサーバ SPECjbb2005(変更済み) メールサーバ Loadsim 2003 Web サーバ SPECweb2005(変更済み) スタンバイサーバ - テスト対象システム タイル n タイル 3 タイル 2 タイル 1 データ ベース VM Java VM メール VM ファイル サーバ VM Web VM スタンバイ VM データ ベース VM Java VM メール VM ファイル サーバ VM Web VM スタンバイ VM データ ベース VM Java VM メール VM ファイル サーバ VM Web VM スタンバイ VM データ ベース VM Java VM メール VM ファイル サーバ VM Web VM スタンバイ VM

参照

Outline

関連したドキュメント

A quick review of mixed Hodge modules and vanishing cycle functors is given in Section 2, which also contains the definition of spectral pairs and their basic proper- ties.. The

シートの入力方法について シート内の【入力例】に基づいて以下の項目について、入力してください。 ・住宅の名称 ・住宅の所在地

(※)Microsoft Edge については、2020 年 1 月 15 日以降に Microsoft 社が提供しているメジャーバージョンが 79 以降の Microsoft Edge を対象としています。2020 年 1

それでは資料 2 ご覧いただきまして、1 の要旨でございます。前回皆様にお集まりいただ きました、昨年 11

ハ 契約容量または契約電力を新たに設定された日以降 1

・この1年で「信仰に基づいた伝統的な祭り(A)」または「地域に根付いた行事としての祭り(B)」に行った方で

基本目標2 一 人 ひとり が いきいきと活 動するに ぎわいのあるま ち づくり1.

このアプリケーションノートは、降圧スイッチングレギュレータ IC 回路に必要なインダクタの選択と値の計算について説明し