• 検索結果がありません。

パフォーマンスレポート PRIMERGY RX200 S5

N/A
N/A
Protected

Academic year: 2021

シェア "パフォーマンスレポート PRIMERGY RX200 S5"

Copied!
43
0
0

読み込み中.... (全文を見る)

全文

(1)

要約

このドキュメントでは、PRIMERGY RX200 S5 で実行したベンチマークの概要について説明します。 PRIMERGY RX200 S5 のパフォーマンスデータを、他の PRIMERGY モデルと比較して説明しています。 ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています。 目次 ドキュメントの履歴 ... 2 製品データ ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 12 StorageBench ... 16 OLTP-2 ... 22 ターミナルサーバ ... 27 VMmark... 33 vServCon ... 36 関連資料... 42 お問い合わせ先 ... 43 ページ数 43

パフォーマンスレポート

PRIMERGY RX200 S5

(2)

ドキュメントの履歴

バージョン 2.0a ベンチマークの章を含むレポートの初版  SPECcpu2006 Xeon E5502、E5504、E5506、E5520、L5530、E5530、E5540、X5550、X5560、および X5570 で 測定  SPECjbb2005 Xeon X5570 で測定  StorageBench

「LSI MegaRAID 8 ポートベースの RAID 0/1 SAS」コントローラーで測定 「LSI MegaRAID ベースの RAID 5/6 SAS」コントローラーで測定

 OLTP-2 Xeon E5502、E5504、E5506、E5520、E5540、X5550、および X5570 で測定 Xeon L5530、E5530、および X5560 の値  ターミナルサーバ Xeon E5504、X5570 で測定  VMmark Xeon X5570 で測定  vServCon Xeon L5520、E5520、E5540、X5550、および X5570 で測定

(3)

製品データ

PRIMERGY RX200 S5 は、わずか 1 U の省スペース 2 ソケットラックサーバで、PRIMERGY RX200 S4 の 後継製品です。Intel 5500 チップセット、2 基の Intel デュアルコアまたはクアッドコア Xeon プロセッサ、 最大 96 GB の PC3-10600 または PC3-8500 registered ECC DDR3-SDRAM あるいは 最大 24 GB PC3-8500 unbuffered ECC DDR3-SDRAM、使用プロセッサに応じて 800、1067、または 1333 MHz で動作するバス、 オンボード 2 ポート SATA コントローラー(RAID 0 および RAID 1E 対応)、RAID 0 および RAID 1 対応の SAS コントローラーまたは RAID 5 および RAID 6 対応で最大 8 台の内蔵 SATA/SAS ハードディスクを接続可 能な SAS コントローラー、オンボード 2 ポート 1 GBit イーサネットコントローラー、および 3 本の PCI ス ロット(PCIe-2 x8 2 本と PCIe-2 x4 1 本)が搭載されています。

(4)

SPECcpu2006

ベンチマークの説明

SPECcpu2006 は、整数演算および浮動小数点演算のシステム性能を測定するベンチマークです。これは、 12 本のアプリケーションからなる整数演算テストセット、および 17 本 のアプリケーションからなる浮動小 数点演算テストセットで構成されています。これらのアプリケーションは大量の演算を実行し、 CPU / メモ リを集中的に使用します。ディスク I/O やネットワークなど、他のコンポーネントについては、このベンチ マークでは測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード として利用可能で、実際のベンチマークの前にコンパイルする必要があります。したがって、使用するコン パイラーのバージョンやその最適化設定が測定結果に影響を与えます。 SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。最初の方法(SPECint2006 および SPECfp2006)は、1 つのタスクの完了に必要な時間を評価します。次の方法(SPECint_rate2006 および SPECfp_rate2006)は、スループット(並列処理できるタスク数)を評価します。いずれの方法も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これは、コンパイラー最適化を使用するかどう かという点で異なります。「ベース」値は公開時に常に用いられますが、「ピーク」値はオプションです。 ベンチマーク 演算 タイプ コンパイラー 最適化 測定結果 アプリケーション SPECint2006 整数 ピーク アグレッシブ 速度 単体実行 SPECint_base2006 整数 ベース 標準 SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行 SPECint_rate_base2006 整数 ベース 標準 SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行 SPECfp_base2006 浮動小数点 ベース 標準 SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行 SPECfp_rate_base2006 浮動小数点 ベース 標準 結果は、個々のベンチマークで得られた正規化比の幾何平均を使用しています。算術平均と比較して、幾何 平均のほうが、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムが基 準システムと比較してどの程度高速に実行されるのかを測定することです。基準システムの SPECint_base2006、 SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結果が、値「1」と判定さ れたとします。このとき、たとえば SPECint_base2006 の値 2 は、測定システムがこのベンチマークを基準 システムよりも約 2 倍の性能で実行したことを意味します。SPECfp_rate_base2006 の値 4 は、測定対象シ ステムが基準システムよりも、約 4/[ベースコピー数] 倍の性能でこのベンチマークを実行したことを意味し ます。ここで、「ベースコピー数」はベンチマークで実行された並行インスタンスの数です。 弊社は、SPEC の公開用に、 SPECcpu2006 を測定したデータのすべてを提出しているわけではありません。 このため、すべての結果が SPEC の Web サイトに表示されるわけではありません。弊社は、すべての測定 値のログデータをアーカイブしているので、測定の内容に関していつでも証明できます。

SPEC®、SPECint®、SPECfp®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC) の登録商標です。

(5)

ベンチマーク結果

PRIMERGY RX200 S5 は、Xeon E5502、E5504、L5506、E5506、L5520、E5520、L5530、E5530、E5540、 X5550、X5560、および X5570 の各プロセッサを使用して測定されました。ベンチマークプログラムは、イ ンテル C++/Fortran コンパイラー 11.0 でコンパイルし、SUSE Linux Enterprise Server 10 SP2(64 ビット) で実行しました。次の表の太字の値は、http://www.spec.org で公開されています。「予測」という印付きの値 は、予測値です。 プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 18.0 20.0 Xeon E5504 4 2 4 MB 800 MHz 80 W 19.3 21.4 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 20.4 (予測) 22.6 (予測) Xeon E5506 4 2.13 4 MB 800 MHz 80 W 20.4 22.6 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 24.3 (予測) 27.0 (予測) Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 24.3 27.0 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 25.7 (予測) 28.7 (予測) Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 25.7 28.7 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 26.9 29.8 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 29.6 33.0 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 30.5 34.2 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 31.8 35.3

(6)

プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 33.6 66.2 36.2 71.3 Xeon E5504 4 2 4 MB 800 MHz 80 W 65.1 126 69.7 136 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 68.1 (予測) 132 72.9 (予測) 141 Xeon E5506 4 2.13 4 MB 800 MHz 80 W 68.1 132 72.9 141 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 95.8 (予測) 184 103 (予測) 199 Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 95.8 186 103 201 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 99.6 (予測) 193 107 (予測) 208 Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 99.6 193 107 209 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 103 198 111 214 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 111 221 120 237 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 116 230 125 248 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 118 236 127 254

(7)

プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 21.6 23.1 Xeon E5504 4 2 4 MB 800 MHz 80 W 23.4 25.1 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 24.7 (予測) 26.2 (予測) Xeon E5506 4 2.13 4 MB 800 MHz 80 W 24.7 26.2 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 29.7 (予測) 31.4 (予測) Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 29.7 31.4 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 30.9 (予測) 32.9 (予測) Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 30.9 32.9 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 32.1 34.1 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 35.8 38.1 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 36.7 39.1 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 37.4 40.1

(8)

プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 35.1 68.2 36.4 70.9 Xeon E5504 4 2 4 MB 800 MHz 80 W 57.6 111 59.5 116 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 59.3 (予測) 115 61.5 (予測) 119 Xeon E5506 4 2.13 4 MB 800 MHz 80 W 59.3 115 61.5 119 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 79.9 (予測) 153 82.9 (予測) 159 Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 79.9 155 82.9 161 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 82.4 (予測) 158 85.1 (予測) 164 Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 82.4 159 85.1 165 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 83.2 161 86.4 167 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 93.0 181 96.3 189 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 96.1 186 99.3 194 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 96.9 189 101 197

(9)

整数演算テストスイートおよび浮動小数点演算テストスイートの両方で、2 プロセッサのスループットは 1 プ ロセッサの約 2 倍です。

(10)

下の図は、PRIMERGY RX200 S5 のパフォーマンスを先行モデルの PRIMERGY RX200 S4 と比較していま す。両方とも最高パフォーマンス構成での比較です。

(11)

ベンチマーク環境

SPECcpu2006 での測定は、すべて次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S5 で実 行されました。

ハードウェア

モデル PRIMERGY RX200 S5

CPU Xeon E5502、E5504、L5506、E5506、L5520、E5520、L5530、E5530、E5540、 X5550、X5560、および X5570 CPU 数 1 チップ: Xeon E5502: 2 コア、2 コア/チップ その他: 4 コア、4 コア/チップ 2 チップ: Xeon E5502: 4 コア、2 コア/チップ その他: 8 コア、4 コア/チップ プライマリー キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) セカンダリー キャッシュ 256 KB オンチップ(コアあたり) その他の キャッシュ

Xeon E5502、E5504、L5506、および E5506:

4 MB(I+D)オンチップ(チップあたり)

その他: 8 MB(I+D)オンチップ(チップあたり)

ソフトウェア オペレーティング

システム SUSE Linux Enterprise Server 10 SP2(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 11.0

(12)

SPECjbb2005

ベンチマークの説明

SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークで す。これは、本質的に SPECjbb2000 を更新したバージョンで、主な違いは次のとおりです。  トランザクションは、多様な機能範囲を対象とするため、より複雑になっています。  ベンチマークのワーキングセットが、システムの負荷の増大に対応して拡大されました。  SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実際との高い近似性を 得ることができます。 ソフトウェア側では、SPECjbb2005 は JVM、JIT(ジャストインタイム)コンパイラー、ガベージコレクショ ン、スレッドなどのオペレーティングシステムの機能を評価します。ハードウェアに関する限り、SPECjbb2005 は CPU およびキャッシュの効率、メモリサブシステム、共有メモリシステム(SMP)のスケーラビリティ を測定します。ディスクおよびネットワーク I/O は無関係です。 SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層のクライアント/サーバ システムをエミュレートしたもので、特に中間層が強調されています。  クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベー スへの OLTP アクセスを思考時間ゼロで行います。  中間層は、ビジネスプロセスおよびデータベースの更新を実装します。  データベースは、データ管理を担当し、メモリ内の Java オブジェクトによりエミュレートされます。 トランザクションのログ記録は XML ベースで実装されます。 このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフォー マンスが測定されるため、大規模なハードウェアの設置は不要となり、SPECjbb2005 の異なるシステム間の 結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記述されています。 SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で す。 スケーリングの単位は、約 25 MB の Java オブジェクトからなる1つのウェアハウスです。ウェアハウスあ たり 1 つの Java スレッドがこれらのオブジェクトに対しオペレーションを実行します。これらのビジネス オペレーションは 、TPC-C の次の項目を前提としています。  新規オーダーエントリー  支払  オーダーステータスの照会  納入  在庫レベル監視  顧客レポート SPECjbb2005 と TPC-C が共通して持っている機能は、これだけです。2 つのベンチマーク結果を比較する ことはできません。 SPECjbb2005 には、次の 2 つの性能指標があります。  bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーションの 性能です。  bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。

SPEC®、SPECjbb®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC)の登録商標 です。

(13)

SPECjbb2005 のさまざまな結果を比較する場合には、両方の性能指標を考慮する必要があります。 ベンチマーク測定が準拠すべき以下のルールは、この性能指標の基となるものです。 ベンチマーク測定は、ウェアハウス数(つまりスレッド数)が増加する一連の測定ポイントで構成され、各 ケースでウェアハウスが 1 だけ増加します。測定は、1 ウェアハウスで開始され、2*MaxWh まで(ただし、 尐なくとも 8 ウェアハウス)行います。MaxWh は、ベンチマークで予想される、秒あたりの最高オペレー ションレートでのウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます。

性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定済みオペレーション 速度の算術平均です。

ベンチマーク結果

2009 年 3 月、2 基の Xeon X5570 プロセッサと 24 GB の PC3-10600R DDR3-SDRAM メモリを搭載した PRIMERGY RX200 S5 を測定しました。測定には、Windows Server 2008 Enterprise x64 Edition を使用しま し た 。 Oracle か ら 提 供 さ れ て い る JRockit ( R ) 6 P28.0.0 ( ビ ル ド P28.0.0-14-111048-1.6.0_05-20090303-1104-windows-x86_64)の 2 つのインスタンスを測定用 JVM として 使用しました。ベンチマーク結果には、8~16 個までのウェアハウスの全測定値が含まれています。 2009 年 8 月、同一のハードウェア構成でソフトウェア構成だけ変更して PRIMERGY RX200 S5 を測定しま した。測定には、Windows Server 2008 Enterprise x64 Edition SP2 を使用しました。Oracle から提供されて いる JRockit(R) 6 P28.0.0(ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64)の 4 つ のインスタンスを測定用 JVM として使用しました。ベンチマーク結果には、4~8 個までのウェアハウスの 全測定値が含まれています。

(14)

PRIMERGY RX200 S5 をその先行モデルの PRIMERGY RX200 S4 と比較すると、スループットは各トップ パフォーマンス構成で +55 %向上しています。

ベンチマーク環境

 SPECjbb2005 での測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S5 で実行され ました。 2009 年 3 月の測定: ハードウェア モデル PRIMERGY RX200 S5 CPU Xeon X5570 チップ数 2 チップ、8 コア(チップあたり 4 コア) プライマリーキャッ シュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) セカンダリーキャッ シュ 256 KB(I+D)オンチップ(コアあたり) その他のキャッシュ 8 MB(I+D)オンチップ(チップあたり) メモリ 6×4 GB PC3-10600R DDR3-SDRAM ソフトウェア オペレーティング

システム Windows Server 2008 Enterprise x64 Edition

JVM バージョン (ビルド P28.0.0-14-111048-1.6.0_05-20090303-1104-windows-x86_64) Oracle JRockit(R) 6 P28.0.0

(15)

2009 年 8 月の測定:

ハードウェア 2009 年 3 月と同じ ソフトウェア オペレーティング

システム Windows Server 2008 Enterprise x64 Edition SP2

JVM バージョン Oracle JRockit(R) 6 P28.0.0

(16)

StorageBench

ベンチマークの説明

ディスクサブシステムの能力を評価するために、富士通テクノロジー・ソリューションズ は StorageBench と いうベンチマークを開発しました。StorageBench は、システムに接続されている異なるストレージシステム を比較することができます。このベンチマークでは、インテルで開発された Iometer という測定ツールと、 実際の顧客アプリケーションで発生する負荷プロファイルを組み合わせ、測定シナリオを定義しました。 測定ツール 2001 年末以降、Iometer は http://SourceForge.net のプロジェクトとなり、さまざまなプラットフォームに移 植され、国際的な開発者グループによって強化されています。Iometer は、Windows のユーザーインターフェー スとさまざまなプラットフォームで利用できる、いわゆる「dynamo」で構成されています。この数年で、こ れら 2 つのコンポーネントは、 http://www.iometer.org/ または、 http://sourceforge.net/projects/iometer から 「インテルオープンソースライセンス」でダウンロードできるようになりました。 Iometer は、IO サブシステムへのアクセスについて実際のアプリケーションの動作を再現することができま す。このため、特に、使用するブロックサイズ、シーケンシャルリード/ライト、ランダムリード/ライト、 およびこれらの組み合わせなど、アクセスの種類を設定できます。また、同時アクセス数(「未処理 IO」)も 設定できます。その結果、Iometer は 1 秒あたりのスループット、1 秒あたりのトランザクション数、各アク セスパターンの平均応答時間などの基本的なパラメーターを含むカンマで区切られた.csv ファイルを生成し ます。この方法により、特定のアクセスパターンを使ってさまざまなサブシステムの性能を比較できます。 Iometer は、ファイルシステムを使用して、サブシステムにアクセスできるばかりでなく、いわゆる RAW デ バイスにもアクセスできます。 Iometer では、さまざまなアプリケーションのアクセスパターンをシミュレーションおよび測定できますが、 オペレーティングシステムのファイルキャッシュは考慮されません。また、オペレーションは 1 つのテスト ファイル上のブロックで行われます。 負荷プロファイル アプリケーションがマスストレージシステムにアクセスする方法は、ストレージシステムのパフォーマンス に多大な影響を及ぼします。各種アプリケーションのさまざまなアクセスパターンの例: アプリケーション アクセスパターン データベース(データ転送) ランダム、67 %リード、33 %ライト、8 KB(SQL Server) データベース(ログファイル) シーケンシャル、100 %ライト、64 KB ブロック バックアップ シーケンシャル、100 %リード、64 KB ブロック リストア シーケンシャル、100 %ライト、64 KB ブロック ビデオストリーミング シーケンシャル、100 %リード、ブロック ≥ 64 KB ファイルサーバ ランダム、67 %リード、33 %ライト、64 KB ブロック Web サーバ ランダム、100 %リード、64 KB ブロック オペレーティングシステム ランダム、40 %リード、60 %ライト、ブロック ≥ 4 KB ファイルコピー ランダム、50 %リード、50 %ライト、64 KB ブロック これから次の 4 つの独特なプロファイルが導き出されました。 負荷プロファイル アクセス アクセスパターン ブロック サイズ 未処理 IO 負荷 ツール リード ライト ストリーミング シーケンシャル 100 % 64 KB 3 Iometer リストア シーケンシャル 100 % 64 KB 3 Iometer データベース ランダム 67 % 33 % 8 KB 3 Iometer ファイルサーバ ランダム 67 % 33 % 64 KB 3 Iometer 4 つのプロファイルはすべて Iometer で生成されました。

(17)

測定シナリオ

比較できる測定結果を得るためには、再現可能な同一の環境ですべての測定を実行することが重要です。そ のため StorageBench は上記の負荷プロファイルに加えて次の規則に基づいています。

 実際の顧客構成で RAW デバイスを使用するのは例外的な状況のみであるため、内蔵ディスクのパフォー

マンス測定は常にファイルシステムを使用したディスク上で実行されます。高いパフォーマンスが他 のファイルシステムや RAW デバイスで実現できる場合でも、Windows では NTFS が使用され、Linux では ext3 が使用されます。

 ハードディスクは、コンピュータシステムで最もエラーが発生しやすいコンポーネントです。ハード

ディスクの故障によるデータの損失をなくすためにサーバシステムで RAID コントローラーが使用さ れる理由はここにあります。ここでは、複数のハードディスクを組み合わせて「Redundant Array of Independent Disks」(RAID)を形成し、1 つのハードディスクが故障した場合でもすべてのデータが 維持されるように(RAID 0 を除く)すべてのデータを複数のハードディスクに分散させます。ハード ディスクをアレイで編成する最も一般的な方法は、RAID レベル、RAID 0、RAID 1、RAID 5、RAID 6、 RAID 10、RAID 50、RAID 60 です。各種 RAID アレイの基本については、資料 パフォーマンスレポー

ト - PRIMERGY 用モジュラー RAID を参照してください。

ディスクの数および装着されているコントローラーに応じて、 RAID 構成を変えながら PRIMERGY サー バの StorageBench を測定しました。2 台のハードディスクを装着できるシステムでは RAID 1 およ び RAID 0 を使用し、3 台以上では RAID 1E および RAID 5 を使用します。適用可能な場合はサポー トされていることを条件にさらに上位の RAID レベルを使用します。  ハードディスクのサイズに関係なく、サイズが 8 GB の測定ファイルを常に測定に使用しています。  I/O サブシステムの効率の評価では、プロセッサパフォーマンスおよびメモリ構成は、今日のシステ ムでは大きな要因ではありません。通常、考えられるボトルネックは CPU やメモリではなく、ハー ドディスクや RAID コントローラーに影響を及ぼします。したがって、CPU やメモリの構成を数々 変えながら StorageBench で解析する必要はありません。 測定結果 負荷プロファイルごとに、StorageBench は次のようにさまざまな主要指標を提供します。1 秒あたりのデー タ転送量をメガバイト数で表した(MB/s)「データスループット」、1 秒あたりの I/O オペレーション数(IO/s) の「トランザクションレート」、およびミリ秒(ms)単位の「待機時間」(「平均アクセス時間」)。シーケン シャルな負荷プロファイルでは、データスループットが通常の指標であり、小規模なブロックサイズを使用 するランダムな負荷プロファイルでは、通常、トランザクションレートが使用されます。スループットおよ びトランザクションレートは互いに直接比例し、次の式に従って計算できます。 データスループット [MB/s] = トランザクションレート [ディスク-I/O /s] × ブロックサイズ [MB] トランザクションレート [ディスク-I/O /s] = データスループット [MB/s] / ブロック サイズ [MB]

(18)

ベンチマークの結果

PRIMERGY RX200 S5 には、Modular RAID ファミリーのコントローラーが搭載されています。各種の RAID ソリューションにより、ユーザーはアプリケーションシナリオに合わせて適切なコントローラーを選択でき ます。

PRIMERGY RX200 S5 には、次の機能を提供する RAID ソリューションがあります。

1. 「 LSI MegaRAID 4/8 ポ ー ト ベ ー ス の RAID 0/1 SAS 」 コ ン ト ロ ー ラ ー ( LSI MegaRAID SAS 1064/1068)

このコントローラーは、PCI Express カードとして供給されています。RAID レベル 0、1、1E に対 応しています。このタイプのコントローラーには、キャッシュがありません。コントローラーに接続 できるハードディスクの最大数は 4 台ですが、LSI MegaRAID SAS 1068 コントローラーには 8 つの ポートがあるため、最大 8 台のディスクを使用できます。

2. 「LSI MegaRAID ベースの RAID 5/6 SAS」コントローラー(LSI MegaRAID SAS 1078)

このコントローラーは PCI Express カードとして供給され、RAID ソリューション一式を提供します。 RAID レベル 0、1、5、6、10、50、60 に対応しています。このコントローラーには、256 MB また は 512 MB のキャッシュを備えた 2 つのタイプがあります。コントローラーのキャッシュは、電源 障害に対してオプションのバッテリーバックアップユニット(BBU)により保護できます。コントロー ラーは 240 台までのハードディスクをサポートします。 これらのコントローラーには、さまざまなハードディスクを接続できます。必要なパフォーマンスに応じて、 適切なディスクサブシステムを選択できます。また、PRIMERGY RX200 S5 では、2.5 インチ SAS ハードディ スク用のホットプラグベイを最大 8 個使用できます。 PRIMERGY RX200 S5 には、次のハードディスクを選択できます。  2.5 インチ SAS ハードディスク、容量 73 GB、146 GB(10 krpm)  2.5 インチ SAS ハードディスク、容量 36 GB、73 GB(15 krpm)

LSI MegaRAID SAS 1064/1068

以下では、LSI MegaRAID SAS 1068 コントローラーで利用可能なハードディスクタイプのパフォーマンス を比較しています。比較の結果は、LSI MegaRAID SAS 1064 コントローラーに適用できます。

このコントローラーには、コントローラーキャッシュがありません。よって、測定を実行するにあたり、ディ スクキャッシュパラメーターの影響のみを測定し、ハードディスク比較の測定は、ディスクキャッシュあり となしで実施しました。 ハードディスクキャッシュは ディスク I/O パフォーマンスに影響を及ぼします。多くの場合、この機能は電 源障害時の安全上の問題により無効化されます。しかし、ハードディスクの製造元は、書き込みパフォーマ ンスの向上のために組み込んでいます。I/O アクセス用のキャッシュは圧倒的に大きく、電源障害時の潜在的 なリスク(データの損失)がメインメモリには存在します。これは、オペレーティングシステムによって管 理されます。データの損失を防止するには、システムに無停電電源装置(UPS)を装備することを推奨しま す。 テストでは、2 台のハードディスクをコントローラーに接続し、RAID 1 として構成しました。測定では、 PRIMERGY RX200 S5 で現在利用可能なすべてのハードディスクタイプを解析しました。RAID 1 での各ハー ドディスクタイプのスループットを種々のアクセスパターンを使用して比較します。 右図は、64 KB ブロックサイズを使用してシーケンシャ ルリード/ライトを行った場合のスループットが、回転 速度の増加に伴って向上することを示しています。 シーケンシャルリードの場合、回転数 10 krpm のハード ディスクの代わりに回転数 15 krpm のハードディスクを 使用すると、スループットは約 19 %向上しました。 ディスクキャッシュを有効にしたシーケンシャルライト の場合、回転数 10 krpm のハードディスクの代わりに回 転数 15 krpm のハードディスクを使用すると、約 21 % スループットが向上し、ディスクキャッシュが有効でな い場合には、 52% 向上しました。

(19)

前頁の図からわかるように、ディスクキャッシュを有効にすることで、シーケンシャルライトでのスループッ トの向上が可能です。10 krpm のハードディスクではスループットは約 84 %向上し、15 krpm のハードディ スクではスループットは約 46 %向上します。 次の図は、読み取りが 67 %を占めるランダムアクセスでも、ディスクキャッシュがスループットの向上に重 要な役割を果たしていることを示しています。ディスクキャッシュを有効にすることで、スループットは、 約 23% 向上します。 回転速度の速いハードディスクでは、ランダムアクセス でもパフォーマンスが向上します。回転数が 15 krpm の 場合、回転数が 10 krpm のハードディスクに対するパ フォーマンスの向上率は 22% を若干上回ります。

LSI MegaRAID SAS 1078

可用性の観点からどのようにデータが扱われるかは、RAID アレイによって決まります。各 RAID アレイ内で データが転送される速さは、ハードディスクのデータスループットによって大きく異なります。RAID アレイ で測定用に構成されるハードディスクの数は、RAID レベルに応じて決定されます。今回は 2 台または 3 台 のハードディスクが使用されました。さまざまなキャッシュ設定でのコントローラーの性能を測定するとき に、ハードディスクがボトルネックにならないように、回転数が 15 krpm のハードディスクで測定が実行さ れました。 キャッシュ設定によって、スループットが大幅に向上する場合があります。ただし、このようなスループッ トの向上は、データの構造とアクセスのパターンによって異なります。測定では、コントローラーキャッシュ のオプション「Read モード」は、常に「No Read-ahead」に設定され、「I/O cache」のオプションは常に「I/O direct」に設定されます。「Write モード」と「Disk cache」のオプションはさまざまな設定が行われました。 次の図では、2 台の 2.5 インチ ハードディスクを使用した RAID 1 と、3 台の 2.5 インチ ハードディスクを 使用した RAID 5 のそれぞれで、64 KB ブロックを使用しキャッシュ設定を変えて測定したシーケンシャル リード/ライトのスループットを示しています。 読み取りのスループットは、最大可能スループット値(RAID 1 では 100 MB/秒以上、RAID 5 では 200 MB/秒)に 匹敵します。 対照的に、書き込みのスループットは、キャッシュ設定に よって異なります。RAID 1 で最善のパフォーマンスを実 現するために、最適なキャッシュ設定として「Disk cache enabled」のオプションを使用する必要があります。弊社 での測定では、シーケンシャルライトの場合のスループッ トが 1.7 倍向上しました。 優れたパフォーマンスのために最適なキャッシュ設定を行 うことの重要性は、特に RAID 5 で明らかです。図は、コ ントローラーキャッシュを「Write-back」のオプションで 有効にし、ディスクキャッシュを「enabled」のオプショ ンで有効にした結果、シーケンシャルライトのスループッ トが、大幅に(22 倍に)向上したことを示しています。 LSI MegaRAID SAS 1068

(20)

RAID 1 でのランダムアクセスで最善のスループットを実現するためには、コントローラーキャッシュの書き 込みモードのオプションを「Write-through」に設定し、ハードディスクのディスクキャッシュを有効にする ことが重要です。このように最適のキャッシュ設定にした 結果、8 KB のブロックを使用したランダムアクセスでは 19 %、64 KB のブロックを使用したランダムアクセスで は 14 %、スループットが向上しました。 RAID 5 のランダムアクセスで最善のスループットを実現 するためには、コントローラーキャッシュの書き込みモー ドのオプションを「Write-back」に設定し、ハードディス クのディスクキャッシュを有効にすることが重要です。こ のような最適のキャッシュ設定により、ブロックサイズに 応じて、56 %および 47 %のスループットの向上を実現し ました。 このトピックについての詳細は、次の文書で入手できます: 『パフォーマンスレポート - PRIMERGY 用モジュラー RAID』 コントローラーの比較 ここでは、さまざまなコントローラーのスループットを比較します。同じ種類のハードディスクを使用して RAID 1 アレイで測定しました。図では、キャッシュを無効にした場合(Off)と、最適なキャッシュ設定を 行った場合(Optimal)に得られるスループットを示しています。 使用したコントローラーによるパフォーマンスの違いは、シーケンシャルアクセスではごく僅かです。シー ケンシャルリードでは、すべてのコントローラーで、キャッシュ設定に関係なく最大のスループットを実現 しました。シーケンシャルライトでも、すべてのコントローラーのパフォーマンスは同じ範囲内で、データ スループットは最適なキャッシュ設定によって 65 %向上させることができます。

今回の負荷プロファイルを用いた RAID 1 でのランダムアクセスでは、エントリーレベルの LSI MegaRAID SAS 1064/1068 コントローラーは、LSI MegaRAID SAS 1078 コントローラー(より上位の RAID レベル用のコン トローラーキャッシュと拡張機能が搭載され、RAID 1 でも優れたパフォーマンスを発揮する)よりも、若干 高いデータスループットを示しました。

(21)

結論

「モジュラー RAID」のコンセプトによって、PRIMERGY RX200 S5 は、さまざまなアプリケーションシナリ オの多様な要件を満たすことができます。

LSI MegaRAID SAS 1064 および 1068 コントローラーに代表されるエントリーレベルのコントローラーでは、 基本的な RAID ソリューション RAID 0、RAID 1 および RAID 1E が実現され、それぞれが非常に優れたパフォー マンスでサポートされています。

LSI MegaRAID SAS 1078 コントローラーに代表される「ハイエンド」コントローラーでは、現在のすべて の RAID ソリューションを実現します。最大 8 台の内蔵ハードディスクまで拡張可能な PRIMERGY RX200 S5 では、RAID レベル 0、1、5、6、10、50 および 60 がサポートされます。このコントローラーには、256 MB または 512 MB のコントローラーキャッシュが搭載され、オプションとして、BBU を使用したデータの保護 が可能です。キャッシュの使用に関するさまざまな設定を行うことで、使用する RAID レベルに合わせた最 適なパフォーマンスを柔軟に引き出すことができます。 RAID 5 または RAID 6 を使用すると、既存のハードディスクの容量を経済的に活用して、優れたパフォーマ ンスを実現できます。ただし、最善のパフォーマンスとセキュリティのためには、RAID 10 をお勧めします。 PRIMERGY RX200 S5 では、回転数 10 krpm または 15 krpm の 2.5 インチ SAS ハードディスクを使用でき ます。ディスクの回転速度は、必要なパフォーマンスに応じて決定する必要があります。15 krpm のハード ディスクでは、最大 52 % のパフォーマンスの向上が可能です。 最大のパフォーマンスを実現するには、特にコントローラーキャッシュを持たないコントローラーを使用す る場合は、ハードディスクのキャッシュを有効にすることをお勧めします。これによって、使用するディス クの種類とアクセスパターンによっては、パフォーマンスが最大 85 %向上します。ハードディスクのキャッ シュを有効にする場合は、UPS の使用をお勧めします。

ベンチマークの環境

 ここで説明したすべての測定は、下記の一覧で示したハードウェアとソフトウェアのコンポーネントを使用 して実行されました。 コンポーネント 詳細 サーバ PRIMERGY RX200 S5

オペレーティングシステム Windows Server 2008, Enterprise Edition Version:6.0.6001 Service Pack 1 Build 6001

ファイルシステム NTFS

測定ツール Iometer 27.07.2006

測定データ 8 GB の測定ファイル

コントローラー

「LSI MegaRAID 8 ポートベースの RAID 0/1 SAS」

(LSI MegaRAID SAS 1068)

製品: LSI RAID 0/1 SAS 1068

ドライバ名: lsi_sas.sys、ドライバのバージョン: 1.29.03.00 ファームウェアのバージョン: 01.27.00.00

BIOS のバージョン: 06.26.00.00

コントローラー

「LSI MegaRAID ベースの RAID 5/6 SAS」 (LSI MegaRAID SAS 1078)

製品: LSI RAID 5/6 SAS 1078

ドライバ名: megasys.sys、ドライバのバージョン: 3.9.0.64 ファームウェアのパッケージ: 11.0.1-0008 ファームウェアのバージョン: 1.40.32-0580 BIOS のバージョン: 2.06.00 コントローラーキャッシュ: 256 MB または 512 MB ハードディスク SAS、2.5 インチ、10 krpm Seagate ST973402SS、73 GB ハードディスク SAS、2.5 インチ、15 krpm Seagate ST973451SS、73 GB  国または販売地域によっては一部のコンポーネントが利用できない場合があります。

(22)

OLTP-2

ベンチマークの説明

OLTP とは、Online Transaction Processing (オンライントランザクション処理)の略です。OLTP-2 ベンチマー

クは、データベースソリューションの標準的なアプリケーションのシナリオを基にしています。OLTP-2 では、 データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps)によって 測定対象システムのパフォーマンスを表すと決められています。 独立した機関によって標準化され、それぞれのルールや規則を順守することが求められる SPECint や TPC-E などのベンチマークとは違って、OLTP-2 は富士通テクノロジー・ソリューションズで開発された内部ベン チマークです。標準化されたベンチマークでは大掛かりなハードウェアの導入や時間の消費が必要なことが ありますが、OLTP-2 では適度なレベルに抑えられていて、さまざまな構成を限られた時間で測定できます。 OLTP-2 と TPC-E の 2 つの ベンチマークが同じワークロードを使用して同様のアプリケーションのシナリオ をシミュレートしても、この 2 つのベンチマークは異なる方法を使用してユーザーの負荷をシミュレートす るので、結果を比較することも、同等のものとして扱うこともできません。OLTP-2 の値は、通常、TPC-E と 同じような値になります。しかし、特に価格性能比が算出されないという理由により、直接的な比較だけで なく、OLTP-2 の結果を TPC-E として参照することもできません。

ベンチマーク結果

PRIMERGY RX200 S5 は、Xeon プロセッサシリーズ 5500 を使用して、36 GB、48 GB、72 GB および 96 GB のメモリサイズで測定されました。すべての結果は、オペレーティングシステム Microsoft Windows Server 2008 Enterprise x64 Edition とデータベース SQL Server 2008 Enterprise x64 Edition で測定されたものです。OLTP-2 のベンチマーク結果は、ハードディスクとコントローラーを含むシステムの構成オプションによって、大幅 に異なります。そのため、このシステムには 2 枚のデュアルチャネルファイバーチャネルコントローラーを 搭載し、5 台の FibreCAT CX500 に搭載した合計 450 台のハードディスクに接続しました。ディスクサブシ ステムは、測定でのボトルネックにならないように配置されました。他のディスクサブシステムでも、ボト ルネックになっていなければ、比較可能な結果を得られる場合があります。システム構成の詳細については、 「ベンチマーク環境」セクションを参照してください。

プロセッサが Xeon E5520、E5530、E5540、X5550、X5560、および X5570 の場合、PRIMERGY RX200 S5 の最大のメモリ構成(1 基のプロセッサの場合は 6 枚のメモリモジュールを使用し、2 基のプロセッサの場 合は 12 枚のメモリモジュールを使用)では、メモリのアクセス速度は 1067 MHz です。Xeon E5502、E5504、 および E5506 を使用する場合は、メモリのアクセス速度は 800 MHz です。

次頁の図は、PRIMERGY RX200 S5 の OLTP-2 パフォーマンスデータが、Xeon シリーズ 5500(E5502、E5504、 E5506、E5520、E5530、E5540、X5550、X5560、および X5570)の 1 基構成と 2 基構成の 2 つのグルー プに分けて表されています。Xeon L5530 のパフォーマンス値は Xeon E5530 と同等で、Xeon L5520 の値は Xeon E5520 と、また、Xeon L5506 の値は Xeon E5506 と同等です。

すべての種類のプロセッサの中で最大の増加は、Xeon E5502 と Xeon E5504 との間で、+95 %~+98 %で す。この場合、プロセッサのコアの数は 2 から 4 へ倍増しています。また、Xeon E5506 と Xeon E5520 と の間でも、プロセッサのキャッシュが 4 MB から 8 MB に倍増することとハイパースレッディングを使用す ることによって、+56 %~+57 %の大幅な増加があります。最後に、Xeon E5520 から Xeon X5570 まで間 の増加は +22~+24 %です。36 GB と 48 GB の間のメモリの増加による違いは約 +8 %で、72 GB と 96 GB の間では約 +3 %です。これは、OLTP-2 ベンチマークのワークロードによるもので、すべてのデータベース アプリケーションでの標準値ではありません。

(23)

105.00 207.94 213.94 335.45 345.43 355.40 395.83 404.22 412.60 98.32 191.35 197.75 315.44 322.79 330.14 364.50 372.33 380.16 87.93 169.64 173.79 285.47 292.49 299.52 326.91 335.42 343.94 0 100 200 300 400 500 600 700 800 tps Xeon E5502 Xeon E5504 Xeon E5506 Xeon E5520 Xeon E5530 Xeon E5540 Xeon X5550 Xeon X5560 Xeon X5570 24 GB 36 GB 48 GB RAM

OLTP-2: PRIMERGY RX200 S5 with 1 Xeon processor 55xx

bold numbers: measured results others: calculated results

+57% +23% +98% 105.00 207.94 213.94 335.45 345.43 355.40 395.83 404.22 412.60 98.32 191.35 197.75 315.44 322.79 330.14 364.50 372.33 380.16 87.93 169.64 173.79 285.47 292.49 299.52 326.91 335.42 343.94 0 100 200 300 400 500 600 700 800 tps Xeon E5502 Xeon E5504 Xeon E5506 Xeon E5520 Xeon E5530 Xeon E5540 Xeon X5550 Xeon X5560 Xeon X5570 24 GB 36 GB 48 GB RAM OLTP-2: PRIMERGY RX200 S5 with 1 Xeon processor 55xx

bold numbers: measured results others: calculated results

+57% +23% +98% 207.43 405.04 412.02 642.70 658.63 674.56 749.74 767.39 785.03 202.10 391.19 401.78 624.07 639.84 655.61 731.78 746.09 760.40 184.86 350.21 356.55 574.65 589.05 603.45 673.21 686.29 699.37 0 100 200 300 400 500 600 700 800 tps Xeon E5502 Xeon E5504 Xeon E5506 Xeon E5520 Xeon E5530 Xeon E5540 Xeon X5550 Xeon X5560 Xeon X5570 48 GB 72 GB 96 GB RAM

OLTP-2: PRIMERGY RX200 S5 with 2 Xeon processors 55xx

+56% +22%

+95%

bold numbers: measured results others: calculated results

207.43 405.04 412.02 642.70 658.63 674.56 749.74 767.39 785.03 202.10 391.19 401.78 624.07 639.84 655.61 731.78 746.09 760.40 184.86 350.21 356.55 574.65 589.05 603.45 673.21 686.29 699.37 0 100 200 300 400 500 600 700 800 tps Xeon E5502 Xeon E5504 Xeon E5506 Xeon E5520 Xeon E5530 Xeon E5540 Xeon X5550 Xeon X5560 Xeon X5570 48 GB 72 GB 96 GB RAM OLTP-2: PRIMERGY RX200 S5 with 2 Xeon processors 55xx

+56% +22%

+95%

bold numbers: measured results others: calculated results

(24)

PRIMERGY RX200 S5 と、その旧モデルの PRIMERGY RX200 S3 および RX200 S4 をすべて最大のパフォー マンスの構成で比較した場合、スループットの増加は +179 %と +135 %であることがわかります。 OLTP-2: PRIMERGY RX200 S3 vs. RX200 S4 vs. RX200 S5 281.8 334.62 785.03 0 100 200 300 400 500 600 700 800 PRIMERGY RX200 S3 2 x Xeon X5365 32 GB RAM PRIMERGY RX200 S4 2 x Xeon X5460 64 GB RAM PRIMERGY RX200 S5 2 x Xeon X5570 96 GB RAM +179% +135% OLTP-2: PRIMERGY RX200 S3 vs. RX200 S4 vs. RX200 S5 281.8 334.62 785.03 0 100 200 300 400 500 600 700 800 PRIMERGY RX200 S3 2 x Xeon X5365 32 GB RAM PRIMERGY RX200 S4 2 x Xeon X5460 64 GB RAM PRIMERGY RX200 S5 2 x Xeon X5570 96 GB RAM +179% +135%

(25)

ベンチマーク環境

テスト対象システム(SUT) ハードウェア サーバ PRIMERGY RX200 S5 プロセッサ Xeon E5502、E5504、E5506、E5520、E5530、E5540、X5550、X5560、X5570 メモリ 8 GB DDR3 PC3-8500R(最大 12 枚) 設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効 ネットワークインター フェース 1 ギガビット LAN(オンボード)(2 セット) ディスクサブシステム PRIMERGY RX200 S5: LSI SAS(1068E 搭載)(1 基)

2.5 インチ 36GB 15000 rpm、Fujitsu MAY2073RC RAID-1、OS 用(2 台) 2.5 インチ 73GB 15000 rpm、Fujitsu MAY2073RC RAID-0、ログ用(6 台) 2 チャネル FC コントローラー QLE2462(2 台) FibreCAT CX500(5 台): Seagate 36 GB 15 krpm(315 台) Seagate 73 GB 15 krpm(135 台) RAID-0、データ用 ソフトウェア

オペレーティングシステム Windows Server 2008 Enterprise x64 Edition データベース SQL Server 2008 Enterprise x64 Edition

国または販売地域によっては一部のコンポーネントが利用できない場合があります。

LAN スイッチ

(26)

負荷ジェネレーター ハードウェア モデル PRIMERGY Econel 200(4 台) プロセッサ Xeon 3.40 GHz、2 MB L2 キャッシュ(2 基) メモリ 2 GB DDR-SDRAM PC2700 ネットワークインター フェース 1 ギガビット LAN(オンボード)(1 セット) ソフトウェア オペレーティング

システム Windows Server 2003 Standard Edition SP1(x86) OLTP-2 ソフトウェア EGen バージョン 1.6.0-1011

(27)

ターミナルサーバ

ベンチマークの説明

ターミナルサーバの測定を行うための負荷シミュレーションツールがいくつか存在しますが、標準のベンチ マークは存在せず、結果を相互に比較することもできません。例えば、Microsoft ターミナルサービスと Citrix Presentation Server を同じ条件で測定することはできず、また、他にも制限があります。そのため、富士通 テクノロジー・ソリューションズでは、T4US(Tool for User Simulation)という名前の自社開発プログラム を使用しています。これは、使用されているオペレーティングシステムやアプリケーションに関係なく、す べてのターミナルサーバベースのシナリオをシミュレートできる柔軟性の高いツールで、さまざまなシステ ムコンポーネントの応答時間と使用率を詳細に測定できます。

T4US Record ツールは、ユーザーによるキーボードと マウスの操作をリアルタイムで記録し、さらに出力を表 示して T4US Script に保存します。T4US Script は、測 定中に使用される負荷プロファイルです。 T4US 負荷シミュレーターには 3 つのコンポーネントがあります。 T4US Control は 、シミュ レーションプロセス全体を集 中制御および監視し、測定中 の測定データを評価します。 T4US Playback のいくつか のインスタンスが負荷ジェネ レーター上で稼動します。各 T4US Playback は 、 T4US Record とともに記録された T4US Script を基にして、 キーボードとマウスからの入 力をリアルタイムでターミナ ルサーバクライアントに「転 送」し、ターミナルサーバク ライアントの画面の内容を監 視します。このようにして、 ターミナルサーバの応答時間は高精度のタイマーを使用して測定されます。T4US Agent はすべての負荷ジェ ネレーター上で稼動します。T4US Agent は、コントローラーとの通信を処理し、T4US Playback のインス タンスを制御および監視して、測定された応答時間をコントローラーに転送します。 測定中は、ターミナルサーバを使用するユーザーの数が継続的に増加します。ターミナルサーバの応答時間 は、T4US コントローラーによって監視され、事前に行った数人のユーザーによる参照用の測定から決定さ れた、保存済みの参照値と比較されます。アプリケーションの応答時間が、事前に定義されたルールに適合 しない程度に低下した場合、測定が中止され、その時のユーザー数が測定結果になります。ただし、システ ムがサポートできるユーザー数は実際のユーザープロファイルによって常に左右されるので、この数を絶対 数と考えることはできません。結果は主に相対的な結果と考える必要があります。つまり、「PRIMERGY シ ステム A の効率は PRIMERGY システム B の 2 倍である」または「メインメモリを 2 倍にするとパフォーマ ンスが x %増加する」というように考えます。 T4US Play T4US Agent 負荷ジェネレーター

T4US Play T4US Play TS Client TS Client ターミナル サーバ

TS Client テスト対象システム (System Under Test:SUT)

SUT T4US Control コントローラー T4US Record T4US Script 実際に作業している ユーザー

(28)

負荷プロファイル V2

これまでターミナルサーバの測定で使用されていた負荷プロファイル V1 は使用できなくなりました。この プロファイルでは、各ユーザーがターミナルサーバに定期的にログオンし、テキストとイメージを作成して からログオフしていました。測定対象システムのパフォーマンスの向上により、ベンチマークは、システム のプロセッサのパフォーマンスではなく実行されるログオン/ログオフ処理によってユーザー数が決まるとい う状況になりました。言い換えるとオペレーティングシステムに制限が存在するということです。これは、 プロセッサの能力を使い切る前にこのベンチマークが限界に達してしまったことを意味します。したがって プロセッサのパフォーマンスの向上はこのベンチマークでは測定できません。このような理由から、ここで 実行される測定では、新しい負荷プロファイル V2 が使用されることになりました。 新しい負荷プロファイル V2 には、シミュレートされるユーザーがさまざまな Microsoft Office アプリケーショ ンを使用するという特徴があります。Microsoft Word ドキュメントの作成に加えて、PowerPoint プレゼンテー ションも作成します。新しい Excel スプレッドシートに関する計算も実行されます。ログオン/ログオフ処理 数は、古い負荷プロファイルと比較して減尐しています。平均して 6 人に 1 人 のユーザーのみが定期的にター ミナルサーバにログオンおよびログオフします。また、平均して 6 人に 1 人のユーザーが Word ドキュメン トを印刷します。メモリ内のファイルの圧縮と解凍によって、さらに CPU の負荷が発生します。シミュレー ション対象のユーザーのタイピング速度は 1 分間に 330~440 文字です。 ターミナルサーバベンチマークに必要なメモ リは、ユーザー数に比例して増加し、基にな るオペレーティングシステムによって異なり ます。特に 32 ビットと 64 ビットのオペレー ティングシステムでは大きく異なります。こ の点については、『ターミナルサーバサイジ ングガイド』に詳しい説明が記載されていま す(関連資料を参照してください)。 右側の図には、64 ビットの Windows Server 2008 システム上での負荷 プロファイル V2 を使用したベンチマークの メモリ要件を示しています。現在のユーザー はさまざまなアプリケーションを使用すると いう事実により、負荷プロファイル V2 では 元の負荷プロファイル V1 よりも多くのメモリが使用されます。 下図は、Windows Server 2008 x64 システム上で負荷プロファイル V2 を使用したときの ディスクとネット ワークの平均的な IO レート、および関連するデータスループットを示しています。

(29)

ベンチマーク結果

ターミナルサーバシステム上で実行されるすべての測定で、オペレーティングシステムとして Windows Server 2008 x64 Enterprise Edition SP1 を使用しました。32 ビットオペレーティングシステムでは、仮想ア ドレス空間およびカーネル構造の制限のためにサポートされるユーザー数が制限されるので、このオペレー ティングシステムの測定は省略しました。 サーバまたはクライアントに行ったインストールでは最適化を行っていませんが、すべての PRIMERGY に 対して同じテスト条件になるように、以下の設定のみが変更されました。  オペレーティングシステムのページファイルは 28 GB の固定サイズに設定されました。 ターミナルサーバシステムでは、以下のパフォーマンス関連の要素が重要です。  ネットワーク  ディスクサブシステム  メインメモリ  演算処理のパフォーマンス ネットワーク ターミナルサーバベースのシステムは基盤になるネットワークインフラストラクチャーによって大きな影響 を受けます。ここでは個別のターミナルサーバのパフォーマンスが論点なので、ネットワークはボトルネッ クにならないような規模で構成されています。 ディスクサブシステム ディスクサブシステムは、さらに大きくパフォーマンスに影響する構成要素です。ここで使用する測定環境 では、オペレーティングシステムは 2 つのハードディスクで構成される RAID 0 アレイの 1 つのパーティショ ンに保存され、ユーザーのデータとページファイルは、さらに別の 2 つのハードディスクで構成される RAID 0 アレイの 1 つのパーティションに保存されます。さまざまな PRIMERGY システム間で測定結果を比較でき るように、また測定中にディスクサブシステムがボトルネックにならないようにするために、このような構 成を使用しています。ただし、これが実際の顧客の構成に対応しているとは限りません。実際の構成では、 一般的にユーザーデータが適切なディスクサブシステムまたは外部ファイルサーバ上に置かれ、ターミナル サーバのローカルハードディスクには置かれないためです。最大のスループットを実現するために、ライト キャッシュを含むすべてのキャッシュが有効になっています。ハードディスクのライトキャッシュはパフォー マンスの向上に大きく貢献し、運用環境を含めてこの機能の使用が推奨されており、すべてのハードディス クで使用可能です。そのため、停電とそれに伴うデータ損失から保護するために UPS を使用することが推奨 されます。 メインメモリ メインメモリは、ターミナルサーバのパフォーマンスに最も大きく影響します。これは特に応答時間に反映 されます。必要なときには、Windows は、現在使用しないデータをメインメモリ(RAM)からハードディス ク上のスワップファイルに再配置(スワッピング)することで追加の仮想メモリを取得します。ただし、ディ スクアクセスにはメインメモリのアクセスの 1000 倍の時間がかかるので、直接的な結果としてパフォーマ ンスが大幅に低下し、応答時間が急激に増加します。 ターミナルサーバは数多くのユーザーとさまざまなアプリケーションを処理するので、十分なメモリを搭載 したシステムを用意することが特に重要です。メモリのアクセス速度は補助的な要因になります。96 GB ま での最大メモリ構成を備えた PRIMERGY RX200 S5 は、ターミナルサーバに良好なプラットフォームを提 供します。 PRIMERGY RX200 S5 のメモリアクセス速度はプロセッサだけでなくメモリ構成にも依存します。メモリ DIMM が 1 つのバンクにのみ装着され、CPU に割り当てられた複数のチャネルに分散されているときに、最高のア クセス速度が実現されます。 今回実行した測定では、ターミナルサーバに十分なメモリが搭載されています。CPU ごとに 3 つのチャネル に分散された 4 GB メモリモジュールを 6 枚搭載した PRIMERGY RX200S S5 が、シミュレーション対象の

(30)

ユーザー数に合わせて最適に構成されると同時に、メモリアクセス時間も短くなるように構成されました。 メモリを 2 倍にして 48 GB にしてもベンチマーク結果は改善しませんでした。

演算処理のパフォーマンス

要件に応じて、PRIMERGY RX200 S5 にはさまざまなプロセッサを搭載できます。これらは、クロック周波 数、キャッシュ、Quick Path Interconnect の転送速度(ギガトランスファー、GT)、コアの数などが異なり ます。

ターミナルサーバベンチマークは、最小のクアッドコアプロセッサである Xeon E5504、および現在最も強 力なクアッドコアプロセッサである Xeon X5570 の両方で測定されました。Xeon E5504 と比較すると、Xeon X5570 にはハイパースレッディングテクノロジーとターボブーストテクノロジーの両方が採用され、最大エ ネルギー消費量(熱設計電力、Thermal Design Power(TDP))未満で動作するとき、アプリケーションに応 じて自動的にプロセッサをクロックアップします。 測定したプロセッサの仕様  Xeon E5504、2.00 GHz、4.8 GT(ギガトランスファー)、最大 800 MHz DDR3 バス速度、 4 MB L3 キャッシュ、80 W  Xeon X5570、2.93 GHz、6.4 GT(ギガトランスファー)、最大 1333 MHz DDR3 バス速度、 8 MB L3 キャッシュ、95 W 新しい負荷プロファイル V2 を使用して達成されるシステムあたりの最大ユーザー数を、以前の負荷プロファ イル V1 を使用して達成されるユーザー数と比較することはできません。混乱を避けるため、ベンチマーク 結果は絶対ユーザー数では表されなくなり、事前に測定されたリファレンスシステムとの比較に限って表さ れます。ここで使用する PRIMERGY TX200 S4 には、ハイパースレッディングテクノロジーもターボブース トテクノロジーも採用されていない最大 2 基の Xeon E5430 プロセッサが搭載されています。  Xeon E5430、2.67 GHz、1333 MHz フロントサイドバス、6 MB L2 キャッシュ × 2、80 W 新しい負荷プロファイル V2 を使用したターミナルサーバベンチマークは、演算性能と高い相関を示します。 プロセッサの数を 2 倍(4 コアから 8 コア)にすると、リファレンスシステムでも Xeon E5504 を搭載した PRIMERGY RX200 S5 でもシステムパフォーマンスが 1.8 倍に増加しました。 ハイパースレッディングを有効にした場合、 Xeon X5570 には 8 基の論理的な CPU コ アがあります。つまり、2 つ目の CPU を 追加すると、論理コアの数が 8 から 16 に 増加します。これらの測定でも、ベンチマー クではシステムパフォーマンスが CPU コ アの個数に応じて効果的に向上します。 ( 1.7 倍以上) システムパフォーマンスの点では、Xeon E5504 を搭載した PRIMERGY RX200 S5 システムは、リファレンスシステムと同程 度になります。 PRIMERGY RX200 S5 システムに、より 強力な Xeon X5570 プロセッサを搭載した 場合は、 2 倍を超えるシステムパフォーマ ンスが達成されます。クロック周波数の向 上に加えて、セカンドレベルキャッシュが 大きくなり、メモリアクセスも高速になり ます。どちらの測定でも、システムに 4 GB メモリが 6 つ搭載されました。論理コアを 追加することで、ベンチマーク結果に大きな改善が見られます。また、Xeon X5570 のターボブーストテク ノロジーにより、負荷がピークになったときにパフォーマンスが向上しました。

(31)

全体的に、PRIMERGY RX200 S5 はターミナルサーバアプリケーションに適しています。ハイパースレッディ ングやターボブーストなどのテクノロジーは、プロセッサのパフォーマンスを強化し、大きなメモリ構成を 併用することで、ターミナルサーバを利用することができるユーザー数が増加します。ただし、実際のユー ザー数は常に現在の顧客の負荷プロファイルに依存します。

ベンチマーク環境

 下の図は、ターミナルサーバのパフォーマンス測定が実施される環境を示しています。負荷ジェネレーター アプリケーションはサーバ上で実行されるので、多数のユーザーのシミュレーションが可能です。ターミナ ルサーバプロトコルでは、クライアントからサーバに対してはキーボード入力とマウスクリックのみが転送 され、サーバからクライアントに対しては画面内容の変更のみが転送されます。したがって、大きなネット ワーク帯域幅は必要ありません。負荷シミュレーターとターミナルサーバ(テスト対象システム(System Under Test:SUT とも呼ばれる)の接続は、100 Mbit イーサネットネットワークによって確立され、ターミナルサー バはギガビットアップリンクを介して接続されました。ユーザープロファイルはターミナルサーバに保存さ れるようになっています。測定中に読み書きされるユーザーのファイルも、ターミナルサーバにローカルで 保存されるようになっています。SUT ネットワーク内に同様に配置されたインフラストラクチャーサーバが、 Active Directory、DNS、ターミナルサービスのライセンス管理などの基本的なサービスを提供します。シミュ レートされたユーザーのログインは、常に Active Directory によって実行されます。  国または販売地域によっては一部のコンポーネントが利用できない場合があります。 PRIMERGY C200 T4US Control テスト対象システムの ネットワーク 約 40 の PRIMERGY デュアルサーバ Windows Server 2003 TS Client

T4US Agent、T4US Playback それぞれが最大 12 人のユーザーをシ ミュレートする シミュレーションを 制御するためのネッ トワーク PRIMERGY C200 Windows Server 2003 Active Directory ターミナルサーバ ライセンス管理サービス PRIMERGY Windows Server 2008 Enterprise Edition インフラストラク チャーサーバ 100 Mbit スイッチ 負荷ジェネレーター シミュレーションの コントローラー 100 Mbit スイッチ テスト対象システム (SUT)

(32)

テスト対象システム(System Under Test:SUT) オペレーティングシステムに含まれている Microsoft ターミナルサービスをターミナルサーバとして実行 します。表に示した以外のアプリケーションは、ター ミナルサーバにインストールされていません。 ハードウェア モデル PRIMERGY RX200S5 // PRIMERGY TX200S4 プロセッサ Xeon E5504 × 1~2 // Xeon E5430 × 1~2

Xeon X5570 × 1~2 メモリ 24 GB // 12 GB ネットワークイ

ンター フェース

1 GBit LAN Intel(オンボード) ×1 // Broadcom ディスク サブシステム SAS コントローラー × 2:LSI 1078 モジュ ラー RAID SAS ディスク × 4、15 krpm、RAID 0 ソフトウェア オペレーティン グシステム

Windows Server 2008 x64 Enterprise Edition バージョン Service Pack 1 ネットワーク プロトコル TCP/IP ディスク編成 1 ボリューム:OS 1 ボリュームずつ:データとページ ファイル ターミナル サーバソフト ウェア Microsoft ターミナルサービス アプリケーショ ン

Microsoft Office 2003(32 ビット)、7-Zip 4.57

T4US 測定環境 負荷ジェネレーターがターミナルサーバを使用する さまざまなユーザーをシミュレートします。1 つの T4US コントローラーがシミュレーションプロセス全 体を集中制御および監視します。インフラストラク チャーサーバが基本的なサービスを提供します。 負荷ジェネレーターのハードウェア モデル PRIMERGY RX100 S3 // PRIMERGY BX300 負荷ジェネレー ターの数 20 // 20

プロセッサ Pentium D 940 // Pentium III 933 MHz × 2 メモリ 2 GB // 1 GB ネットワーク インター フェース 1 GBit LAN × 2 T4US コントローラーおよびインフラストラクチャーサー バハードウェア モデル PRIMERGY C200 プロセッサ Pentium III 1.40 GHz × 2 メモリ 1.5 GB ネットワークイ ンターフェース 100 MBit LAN × 2 ソフトウェア オペレーティン グシステム

Windows Server 2003 Standard Edition SP2 ネットワーク プロトコル TCP/IP RDP クライ アント 6.0.6000.16459 T4US バージョン 3.3 T4US 負荷 プロファイル T4US 負荷プロファイル V2

参照

Outline

関連したドキュメント

・M.2 Flash モジュール専用RAID設定サービス[PYBAS1SM2]とWindows Server 2022 Standard(16コア/Hyper-V)[PYBWPS5H]インストール/Windows Server 2019

* Windows 8.1 (32bit / 64bit)、Windows Server 2012、Windows 10 (32bit / 64bit) 、 Windows Server 2016、Windows Server 2019 / Windows 11.. 1.6.2

アンチウイルスソフトウェアが動作している場合、LTO や RDX、HDD 等へのバックアップ性能が大幅に低下することがあります。Windows Server 2016,

Q-Flash Plus では、システムの電源が切れているとき(S5シャットダウン状態)に BIOS を更新する ことができます。最新の BIOS を USB

自閉症の人達は、「~かもしれ ない 」という予測を立てて行動 することが難しく、これから起 こる事も予測出来ず 不安で混乱

*Windows 10 を実行しているデバイスの場合、 Windows 10 Home 、Pro 、または Enterprise をご利用ください。S

※証明書のご利用は、証明書取得時に Windows ログオンを行っていた Windows アカウントでのみ 可能となります。それ以外の

  BT 1982) 。年ず占~は、