• 検索結果がありません。

ベンチマークの説明

vServCon は、富士通テクノロジー・ソリューションズが、ハイパーバイザーを使用するサーバ構成につい

て、サーバ統合の適合性の比較に使用するベンチマークです。これにより、システム、プロセッサ、および I/O テクノロジーの比較に加え、ハイパーバイザー、仮想化形式、および仮想マシン用の追加ドライバの比 較も可能になります。

vServCon は、厳密に言えば新しいベンチマークではありません。これは、言うなればフレームワークであ

り、すでに確立されたベンチマークをワークロードとして集約し、統合され仮想化されたサーバ環境の負荷 を再現します。データベース、アプリケーションサーバ、Web サーバというアプリケーションシナリオを 対象とする 3 つの実証済みのベンチマークが使用されます。

3 つのアプリケーションシナリオのそれぞれが、1 つの専用の仮想マシン(VM)に割り当てられます。これ らに加えてアイドル VM という 4 番目の仮想マシンが追加されます。これら 4 つの VM が 1 つの「タイル」

を構成します。最大の性能値を引き出すためには、測定対象となるサーバの処理能力に応じて、いくつかの タイルを並行して開始しなければならない場合もあります。

3 つの vServCon アプリケーションシナリオのそれぞれが、各 VM のアプリケーション固有のトランザクシ ョンレートという形でベンチマーク結果を提供します。スコアを正規化するために、1 つのタイルのそれぞ れのベンチマーク結果とリファレンスシステムの結果との比を求めます。その相対性能値に適切な重み付け を行い、すべての VM とすべてのタイルについて加算します。最終的な計算結果が、このタイル数に対する スコアになります。

原則として、1 つのタイルから始めて、vServCon スコアの大幅な増加が見られなくなるまで、タイル数を 増やしながらこの手順が実行されます。最終的な vServCon スコアは、すべてのタイル数から得られた vServCon スコアの最大値です。したがって、このスコアは、CPU リソースを最大限まで使用する構成で達 成される最大スループットを反映しています。このため、vServCon の測定環境は、CPU のみが制限要因と なるように設計されており、他のリソースによる制限は発生しないように設計されています。

タイル数の増加に対する vServCon スコアの伸びは、テスト対象システムのスケーリング特性を知るための アプリケーションシナリオ ベンチマーク 論理 CPU コアの数 メモリ データベース Sysbench(補正済み) 2 1.5 GB

Java アプリケーションサーバ SPECjbb(補正済み、50~60 %の負荷) 2 2 GB

Web サーバ WebBench 1 1.5 GB

テスト対象システム

タイル n

タイル 3 タイル 2 タイル 1 データベース

VM Web

VM

アイドル Java VM

VM

データベース

VM Web

VM

アイドル Java VM

データベース VM

VM Web

VM

アイドル Java VM

データベース VM

VM Web

VM

アイドル Java VM

VM

ベンチマーク環境

一般的な測定環境を次に示します。

すべての測定は、PRIMERGY RX350 S7 を使用して行いました。

SUT(System Under Test:テスト対象システム)

ハードウェア

モデル PRIMERGY RX350 S7

プロセッサ Xeon E5-2600 プロセッサシリーズ

メモリ 1 プロセッサ: 8GB (1x8GB) 2Rx4 L DDR3-1600 R ECC × 8 2 プロセッサ: 8GB (1x8GB) 2Rx4 L DDR3-1600 R ECC × 16 ネットワーク

インターフェース

デュアルポート 1 GbE アダプター × 1 デュアルポート 10 GbE サーバアダプター × 1 ディスク

サブシステム

デュアルチャネル FC コントローラー Emulex LPe12002 × 1 ストレージシステム ETERNUS DX80:

タイルあたり:50 GB の LUN

LUN あたり:Seagate ST3300657SS ディスク(15 krpm)× 2 で構成された RAID 0 ソフトウェア

オペレーティング システム

VMware ESX 5.0.0 ビルド 469512

負荷ジェネレーター(フレームワークコントローラーを含む)

ハードウェア(共通)

シャーシ PRIMERGY BX900 ハードウェア

モデル PRIMERGY BX920 S1 サーバブレード × 18

プロセッサ Xeon X5570 × 2

メモリ 12 GB

ネットワーク インターフェース

1 Gbit LAN × 3 ソフトウェア

複数の 1 Gb または 10 Gb

ネットワーク

負荷ジェネレーター

サーバ ディスクサブシステム

SUT(System Under Test:テスト対象システム)

フレームワーク コントローラー

負荷ジェネレーター VM(タイルあたり 3 つの負荷ジェネレーターを複数のサーバブレードで動作)

ハードウェア

プロセッサ 論理 CPU × 1

メモリ 512 MB

ネットワーク インターフェース

1 Gbit LAN × 2 ソフトウェア

オペレーティング システム

Microsoft Windows Server 2003 R2 Enterprise Edition

国または販売地域によっては、一部のコンポーネントが利用できない場合があります。

ベンチマーク結果

ここで扱う PRIMERGY の 2 ソケットモデルは、Intel Xeon シリーズ E5-2600 プロセッサをベースにしてい ます。プロセッサの機能については、「製品データ」を参照してください。

これらのシステムに搭載可能なプロセッサとその測定結果を、次の表に示します。

プロセッサ

RX200 S7 RX300 S7 RX350 S7 TX300 S7 BX924 S3 CX250 S1 CX270 S1

タイル数 スコア

Xeon E5-2600シリーズ

2 コア、HT、TM E5-2637        4 3.58

4 コア E5-2603        4 3.18

E5-2609        4 4.09

4 コア、HT、TM E5-2643        4 7.02

6 コア、

HT、TM

E5-2620        7 7.44

E5-2630L        7 7.45

E5-2630        7 8.30

E5-2640        7 8.80

E5-2667        7 9.93

8 コア、

HT、TM

E5-2650L        8 8.77

E5-2650        8 10.4

E5-2660        8 11.4

E5-2665        8 11.7

E5-2670        8 12.5

E5-2680        8 12.8

E5-2690        8 13.5

HT = ハイパースレッディング、TM = ターボモード

これらの PRIMERGY 2 ソケットモデルは、プロセッサテクノロジーの進歩により、アプリケーションの仮

想化に最適なシステムとなっています。前世代のプロセッサをベースとするシステムと比較して、仮想化性 能が約 40 %向上しています(最大構成で、vServCon スコアで測定)。

プロセッサ間の大きな性能差は、その機能が影響していると考えられます。コア数、L3 キャッシュのサイ ズ、CPU クロック周波数や、ほとんどのプロセッサタイプが対応しているハイパースレッディング機能と ターボモードによって値が変わります。また、プロセッサ間のデータ転送速度(「QPI スピード」)も仮想 化性能に影響します。基本的には、メモリアクセス速度もパフォーマンスに影響します。ただし、仮想化環 境のメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモリ容量が十分に あることが重要です。

メモリパフォーマンスと QPI アーキテクチャーの詳細については、ホワイトペーパー『Xeon E5-2600

(Sandy Bridge-EP)搭載システムのメモリパフォーマンス』を参照してください。

@4 tiles 0@8 tiles 5

10 15

× 1.94

Final vServCon Score

次のグラフは、レビュー対象のプロセッサで達成可能な仮想化性能値を比較したものです。

最もパフォーマンスが低いのは、わずか 2 コアのプロセッサである Xeon E5-2637 です。Xeon E5-2603 お よび E5-2609 プロセッサでは、ハイパースレッディング(HT)とターボモード(TM)をサポートしていな いため、同様の低いパフォーマンスが見られます。基本的に、こうした最も処理能力の低いプロセッサでは、

仮想化環境への適応は限定的です。

ハイパースレッディングとターボモードの両方をサポートする 4 コアプロセッサ(Xeon E5-2643)では、

さらに高いパフォーマンスが得られます。

8 コアプロセッサを 6 コアプロセッサと比較した場合、コア数に加えて L3 キャッシュとデータ転送速度が、

個々のパフォーマンスの向上に大きく貢献しています。

同じコア数のプロセッサグループ内では、CPU のクロック周波数によるパフォーマンスの違いが見られます。

ここまでは、完全に構成されたシステムの仮想化性能について見て きました。一方で、プロセッサを 1 基から 2 基に増やしたときに、

どの程度パフォーマンスが向上するかという疑問もあります。パフ ォーマンスの向上度が増せば、サーバ内のリソース共有によるオー バーヘッドは減少します。プロセッサ追加時の性能向上度を示すス ケーリング係数は、サーバの用途によって異なります。サーバ統合 用の仮想化プラットフォームとしてサーバを使用する場合、プロセ ッサの追加で性能は 1.94 倍になります。つまり、Xeon E5-2690 のグラフに示したように、2 基のプロセッサを使用すると、1 基の プロセッサを使用した場合に比べて、仮想化性能が約 2 倍になりま

E5-2637 E5-2603 E5-2609 E5-2643 E5-2620 E5-2630L E5-2630 E5-2640 E5-2667 E5-2650L E5-2650 E5-2660 E5-2665 E5-2670 E5-2680 E5-2690

4 4 4 4 7 7 7 7 7 8 8 8 8 8 8 8

0 2 4 6 8 10 12 14

Final vServCon Score

Xeon E5-2600 Processor Series

タイル数

8 コア 6 コア

4 コア 2 コア

E5-2637 E5-2603 E5-2609 E5-2643 E5-2620 E5-2630L E5-2630 E5-2640 E5-2667 E5-2650L E5-2650 E5-2660 E5-2665 E5-2670 E5-2680 E5-2690

4 4 4 4 7 7 7 7 7 8 8 8 8 8 8 8

0 2 4 6 8 10 12 14

Final vServCon Score

Xeon E5-2600 プロセッサシリーズ

タイル数

8 コア 6 コア

4 コア 2 コア

次のグラフは、Xeon E5-2620(6 コア)プロセッサおよび E5-2650(8 コア)プロセッサを搭載した時の、

VM 数の増加に対する仮想化性能を示しています。ホストのそれぞれの CPU 負荷も示されています。CPU 負荷が 90 %のときが最適なタイル数です。90 %を超えると過負荷となり、仮想化のパフォーマンスは停滞 または低下します。

物 理 コ ア 数 の 増 加 に 加 え て 、Xeon

E5-2600 シリーズのほとんどでサポ

ートされているハイパースレッディ ング機能によって、多数の VM の稼 動が可能になります。ハイパースレ ッディング機能では、1 つの物理プ ロセッサコアが結果的に 2 つの論理 コアに分割されるため、ハイパーバ イザーが利用できるコア数は 2 倍に なります。そのため、ハイパースレ ッディング機能は、一般的にシステ ムの仮想化性能を向上させます。

ハイパースレッディング機能を使用するシステムでは、前のグラフに示されているタイル数のスケーリング 曲線が明確に見られます。Xeon E5-2650 プロセッサには、16 個の物理コア、すなわち 32 個の論理コアが あり、1 つのタイルにつき 4 個程度の論理コアが使用されます(『ベンチマークの説明』を参照)。つまり、

ほぼ 4 タイルまでは、複数の VM が同じ物理コアを並行して使用することを回避できます。そのため、この 範囲ではほぼ理想的にパフォーマンスが上昇します。その後、CPU 使用率が限界に達するまでのパフォー マンス曲線は、傾きが緩やかになっていきます。

前のグラフでは、ホストの全アプリケーション VM の総合的なパフォーマンスを測定しました。しかし、

個々のアプリケーション VM のパフォーマンスも興味深いものです。この情報は、前のグラフから読み取れ ます。例えば、高負荷で全体最適化された状態と、低負荷の状態での、個々のアプリケーション VM の仮想 化性能を考えます。上記の Xeon E5-2650 環境では、24 のアプリケーション VM(8 タイル、アイドル状態 の VM を除く)を使用した場合が全体最適化された状態で、3 つのアプリケーション VM(1 タイル、アイ ドル状態の VM を除く)を使用した場合が低負荷の状態です。1 タイルあたりの vServCon スコアは、

vServCon の 3 つのアプリケーションシナリオを通じた平均値です。1 タイルあたりの平均パフォーマンス

は、vServCon スコアが低負荷のケース(2.02)から全体最適化された状態(1.3=10.4/8)へ変化すると、

64 %へと大幅に低下します。個々のアプリケーション VM の反応は、高負荷の状況では全く違ったものに なります。ある特定の状況下では、仮想ホストの VM 数に関して、全体的なパフォーマンス要件と、個々の アプリケーションのパフォーマンス要件のバランスをとる必要があります。

1.97 3.83 5.35 6.39 7.20 7.38 7.44 2.02 4.22 5.96 7.46 8.64 9.59 10.1 10.4

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

E5-2620 E5-2650

0 2 4 6 8 10 12

1 2 3 4 5 6 7 1 2 3 4 5 6 7 8

vServCon score

----

CPU 負荷 %

タイル数

ドキュメント内 パフォーマンスレポート PRIMERGY RX300 S7 (ページ 44-51)

関連したドキュメント