要約
このドキュメントでは、PRIMERGY TX200 S5 で実行したベンチマークの概要について説明します。 PRIMERGY TX200 S5 のパフォーマンスデータを、他の PRIMERGY モデルと比較して説明しています。 ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています。 目次 ドキュメントの履歴 ... 2 製品データ ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 11 StorageBench ... 14 SPECsfs2008 ... 23 OLTP-2 ... 27 関連資料... 31 お問い合わせ先 ... 31 ページ数 31パフォーマンスレポート
PRIMERGY TX200 S5
ドキュメントの履歴
バージョン 2.1 ベンチマークの章を含むレポートの初版 SPECcpu2006 Xeon E5502、E5504、L5506、E5506、L5520、E5520、L5530、E5530、E5540、X5550、X5560、 および X5570 で測定 SPECjbb2005 Xeon X5570 で測定 StorageBench オンボード SATA ICH10R コントローラー LSI MegaRAID SAS 1064 コントローラー LSI MegaRAID SAS 1068 コントローラーおよび LSI MegaRAID SAS 1078 コントローラーで測定 SPECsfs2008
Xeon X5570、96 GB RAM および 2×7 データディスク(146 GB、10000 rpm)RAID 5 で測定 OLTP-2
製品データ
PRIMERGY TX200 S5 は、Intel 5500 チップセットを搭載したデュアルソケットタワーサーバです。デュア ルコアまたはクアッドコアの Intel Xeon 5500 シリーズプロセッサ 2 基を搭載し、最大 96 GB の PC3-10600 または PC3-8500 registered ECC DDR3-SDRAM、周波数が 800、1067、または 1333 MHz のバス(使用さ
れるプロセッサとメモリによって異なる)、オンボード 6 ポート SATA コントローラーまたは RAID 0 および
RAID 1 対応の SAS コントローラーまたは RAID 5 および RAID 6 対応の SAS コントローラー、1 ギガビッ トのオンボードイーサネットコントローラーおよび 6 つの PCI スロット(PCIe-2 x4 2 スロット、PCIe-2 x8 2 スロット、PCIe x4 1 スロットおよび PCI 32 ビット/33 MHz 1 スロット)を装備しています。筐体は最大 6 台の 3.5 インチハードディスク、または最大 16 台の 2.5 インチハードディスクで構成されています。先行モ デルの PRIMERGY TX200 S4 と同様、PRIMERGY TX200 S5 は、簡単にラックマウント型に変換して 19 イン チラックに搭載することができます。
SPECcpu2006
ベンチマークの説明
SPECcpu2006 は、整数演算および浮動小数点演算のシステム性能を測定するベンチマークです。これは、 12 本のアプリケーションからなる整数演算テストセット、および 17 本のアプリケーションからなる浮動小 数点演算テストセットで構成されています。これらのアプリケーションは大量の演算を実行し、 CPU / メモ リを集中的に使用します。ディスク I/O やネットワークなど、他のコンポーネントについては、このベンチ マークでは測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード として利用可能で、実際のベンチマークの前にコンパイルする必要があります。したがって、使用するコン パイラーのバージョンやその最適化設定が測定結果に影響を与えます。 SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。最初の方法(SPECint2006 および SPECfp2006)は、1 つのタスクの完了に必要な時間を評価します。次の方法(SPECint_rate2006 および SPECfp_rate2006)は、スループット(並列処理できるタスク数)を評価します。いずれの方法も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これは、コンパイラー最適化を使用するかどう かという点で異なります。「ベース」値は公開時に常に用いられますが、「ピーク」値はオプションです。 ベンチマーク 演算 タイプ コンパイラー 最適化 測定結果 アプリケーション SPECint2006 整数 ピーク アグレッシブ 速度 単体実行 SPECint_base2006 整数 ベース 標準 SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行 SPECint_rate_base2006 整数 ベース 標準 SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行 SPECfp_base2006 浮動小数点 ベース 標準 SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行 SPECfp_rate_base2006 浮動小数点 ベース 標準 結果は、個々のベンチマークで得られた正規化比の幾何平均を使用しています。算術平均と比較して、幾何 平均のほうが、1 つの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムが基準 システムと比較してどの程度高速に実行されるのかを測定することです。基準システムの SPECint_base2006、 SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結果が、値「1」と判定さ れたとします。このとき、例えば SPECint_base2006 の値 2 は、測定システムがこのベンチマークを基準シ ステムよりも約 2 倍の性能で実行したことを意味します。SPECfp_rate_base2006 の値 4 は、測定対象シス テムが基準システムよりも、約 4/[ベースコピー数] 倍の性能でこのベンチマークを実行したことを意味しま す。ここで、「ベースコピー数」はベンチマークで実行された並列インスタンスの数です。 弊社は、SPEC の公開用に、 SPECcpu2006 を測定したデータのすべてを提出しているわけではありません。 このため、すべての結果が SPEC の Web サイトに表示されるわけではありません。弊社は、すべての測定 値のログデータをアーカイブしているので、測定の内容に関していつでも証明できます。 SPEC®、SPECint®、SPECfp®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC) の登録商標です。
ベンチマーク結果
2009 年 3 月から 7 月にかけて、Xeon E5502、E5504、L5506、E5506、L5520、E5520、L5530、E5530、 E5540、X5550、X5560 および X5570 の各プロセッサを搭載した PRIMERGY TX200 S5 を使用して測定を 行いました。ベンチマークプログラムは、インテル C++/Fortran コンパイラー 11.0 でコンパイルし、SUSE Linux Enterprise Server 10 SP2(64 ビット)で実行しました。次の表の太字の値は、http://www.spec.org で公開
されています。「予測」という印付きの値は、予測値です。 プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_base2006 2 チップ SPECint2006 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 18.0 20.0 Xeon E5504 4 2 4 MB 800 MHz 80 W 19.3 21.4 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 20.3(予測) 22.5(予測) Xeon E5506 4 2.13 4 MB 800 MHz 80 W 20.3 22.5 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 24.6(予測) 27.2(予測) Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 24.6 27.2 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 25.7(予測) 28.8(予測) Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 25.7 28.8 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 26.9 30.0 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 29.5 32.9 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 30.7 34.2 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 31.8 35.4
プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_rate_base2006 SPECint_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 33.6 66.2 36.1 71.2 Xeon E5504 4 2 4 MB 800 MHz 80 W 65.0 126 69.7 136 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 68.0(予測) 132 72.8(予 測) 141 Xeon E5506 4 2.13 4 MB 800 MHz 80 W 68.0 132 72.8 142 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 95.6(予測) 185 103(予測) 200 Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 95.6 185 103 200 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 99.6(予測) 193 107(予測) 208 Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 99.6 193 107 208 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 103 199 111 215 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 114 220 122 236 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 118 230 127 247 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 122 239 131 257
プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_base2006 2 チップ SPECfp2006 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 21.6 23.1 Xeon E5504 4 2 4 MB 800 MHz 80 W 23.5 25.1 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 24.6(予測) 26.3(予測) Xeon E5506 4 2.13 4 MB 800 MHz 80 W 24.6 26.3 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 30.2(予測) 31.8(予測) Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 30.2 31.8 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 31.1(予測) 33.0(予測) Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 31.1 33.0 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 32.3 34.3 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 36.1 38.2 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 36.8 39.2 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 38.0 40.3
プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_rate_base2006 SPECfp_rate2006 1 チップ 2 チップ 1 チップ 2 チップ Xeon E5502 2 1.87 4 MB 800 MHz 80 W 35.1 68.2 36.3 71.0 Xeon E5504 4 2 4 MB 800 MHz 80 W 57.5 111 59.5 115 Xeon L5506 4 2.13 4 MB 800 MHz 60 W 59.3(予測) 115 61.4(予測) 119 Xeon E5506 4 2.13 4 MB 800 MHz 80 W 59.3 115 61.4 119 Xeon L5520 4 2.27 8 MB 1067 MHz 60 W 80.2(予測) 152 82.8(予測) 158 Xeon E5520 4 2.27 8 MB 1067 MHz 80 W 80.2 155 82.8 161 Xeon L5530 4 2.40 8 MB 1067 MHz 60 W 81.8(予測) 159 85.1(予測) 165 Xeon E5530 4 2.40 8 MB 1067 MHz 80 W 81.8 159 85.1 165 Xeon E5540 4 2.53 8 MB 1067 MHz 80 W 83.7 162 86.8 168 Xeon X5550 4 2.67 8 MB 1333 MHz 95 W 94.0 182 97.4 188 Xeon X5560 4 2.80 8 MB 1333 MHz 95 W 97.7 189 101 196 Xeon X5570 4 2.93 8 MB 1333 MHz 95 W 98.7 194 103 199
整数演算テストセットおよび浮動小数点演算テストセットの両方で、2 プロセッサのスループットは 1 プロ セッサの約 2 倍です。
ベンチマーク環境
SPECcpu2006 での測定は、すべて次のハードウェアおよびソフトウェア構成の PRIMERGY TX200 S5 で実 行されました。
ハードウェア
モデル PRIMERGY TX200 S5
CPU Xeon E5502、E5504、L5506、E5506、L5520、E5520、L5530、E5530、E5540、 X5550、X5560、および X5570 CPU 数 1 チップ: Xeon E5502: 2 コア、2 コア/チップ その他: 4 コア、4 コア/チップ 2 チップ: Xeon E5502: 4 コア、2 コア/チップ その他: 8 コア、4 コア/チップ プライマリー キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) セカンダリー キャッシュ 256 KB オンチップ(コアあたり) その他の キャッシュ
Xeon E5502、E5504、L5506、および E5506:
4 MB(I+D)オンチップ(チップあたり)
その他: 8 MB(I+D)オンチップ(チップあたり)
メモリ DDR3-SDRAM
ソフトウェア オペレーティング
システム SUSE Linux Enterprise Server 10 SP2(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 11.0
SPECjbb2005
ベンチマークの説明
SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークで す。これは、本質的に SPECjbb2000 を更新したバージョンで、主な違いは次のとおりです。 トランザクションは、多様な機能範囲を対象とするため、より複雑になっています。 ベンチマークのワーキングセットが、システムの負荷の増大に対応して拡大されました。 SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実際との高い近似性を 得ることができます。 ソフトウェア側では、SPECjbb2005 は JVM、JIT(ジャストインタイム)コンパイラー、ガベージコレクション、 スレッドなどのオペレーティングシステムの機能を評価します。ハードウェアに関する限り、SPECjbb2005 は CPU およびキャッシュの効率、メモリサブシステム、共有メモリシステム(SMP)のスケーラビリティを 測定します。ディスクおよびネットワーク I/O は無関係です。 SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層のクライアント/サーバ システムをエミュレートしたもので、特に中間層が強調されています。 クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベー スへの OLTP アクセスを思考時間ゼロで行います。 中間層は、ビジネスプロセスおよびデータベースの更新を実装します。 データベースは、データ管理を担当し、メモリ内の Java オブジェクトによりエミュレートされます。 トランザクションのログ記録は XML ベースで実装されます。 このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフォー マンスが測定されるため、大規模なハードウェアの設置は不要となり、SPECjbb2005 の異なるシステム間の 結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記述されています。 SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で す。 スケーリングの単位は、約 25 MB の Java オブジェクトからなる 1 つのウェアハウスです。ウェアハウスあ たり 1 つの Java スレッドがこれらのオブジェクトに対しオペレーションを実行します。これらのビジネス オペレーションは、TPC-C の次の項目を前提としています。 新規オーダーエントリー 支払 オーダーステータスの照会 納入 在庫レベル監視 顧客レポート SPECjbb2005 と TPC-C が共通して持っている機能は、これだけです。2 つのベンチマーク結果を比較する ことはできません。 SPECjbb2005 には、次の 2 つの性能指標があります。 bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーションの 性能です。 bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。
SPEC®、SPECjbb®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC)の登録商標 です。
SPECjbb2005 のさまざまな結果を比較する場合には、両方の性能指標を考慮する必要があります。 ベンチマーク測定が準拠すべき以下のルールは、この性能指標の基となるものです。 ベンチマーク測定は、ウェアハウス数(つまりスレッド数)が増加する一連の測定ポイントで構成され、各 ケースでウェアハウスが 1 だけ増加します。測定は、1 ウェアハウスで開始され、2*MaxWh まで(ただし、 尐なくとも 8 ウェアハウス)行います。MaxWh は、ベンチマークで予想される、秒あたりの最高オペレー ションレートでのウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます。
性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定済みオペレーション 速度の算術平均です。
ベンチマーク結果
2009 年 3 月に、2 基の Xeon X5570 プロセッサと 24 GB PC3-10600R DDR3-SDRAM のメモリ構成を使用 して、PRIMERGY TX200 S5 で測定を行いました。測定には、Windows Server 2008 Enterprise x64 Edition SP2 を 使 用 し ま し た 。 Oracle か ら 提 供 さ れ て い る JRockit(R) 6 P28.0.0 ( build P28.0.0-14-111048-1.6.0_05-20090303-1104-windows-x86_64)の 2 つのインスタンスを測定用 JVM として 使用しました。ベンチマーク結果には、8~16 個までのウェアハウスの全測定値が含まれています。 次の結果が得られました。 SPECjbb2005 bops = 554017 SPECjbb2005 bops/JVM = 277009 2009 年 8 月には、より新しいバージョンの JVM を使用して PRIMERGY TX200 S5 を測定しました。それ 以外の構成は、2009 年 3 月の測定と同じです。Oracle から提供されている JRockit(R) 6 P28.0.0(build P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64)の 4 つのインスタンスを測定用 JVM として 使用しました。ベンチマーク結果には、4~8 個までのウェアハウスの全測定値が含まれています。
次の結果が得られました。
SPECjbb2005 bops = 569614 SPECjbb2005 bops/JVM = 142404
ベンチマーク環境
SPECjbb2005 でのすべての測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY TX200 S5 で 実行されました。 ハードウェア モデル PRIMERGY TX200 S5 CPU Xeon X5570 チップ数 2 チップ、8 コア(チップあたり 4 コア) プライマリーキャッ シュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) セカンダリーキャッ シュ 256 KB(I+D)オンチップ(コアあたり) その他のキャッシュ 8 MB(I+D)オンチップ(チップあたり) メモリ 6×4 GB PC3-10600R DDR3-SDRAM ソフトウェア オペレーティングシステム Windows Server 2008 Enterprise x64 Edition
JVM バージョン 2009 年 3 月の測定: Oracle JRockit(R) 6 P28.0.0 (ビルド P28.0.0-14-111048-1.6.0_05-20090303-1104-windows-x86_64) 2009 年 8 月の測定: Oracle JRockit(R) 6 P28.0.0 (ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64) 国または販売地域によっては一部のコンポーネントが利用できない場合があります。
StorageBench
ベンチマークの説明
ディスクサブシステムの能力を評価するために、富士通テクノロジー・ソリューションズは StorageBench と いうベンチマークを開発しました。StorageBench は、システムに接続されている異なるストレージシステムを 比較することができます。このベンチマークでは、インテルで開発された Iometer という測定ツールと、実 際の顧客アプリケーションで発生する負荷プロファイルを組み合わせ、測定シナリオを定義しました。 測定ツール 2001 年末以降、Iometer は http://SourceForge.net のプロジェクトとなり、さまざまなプラットフォームに移 植され、国際的な開発者グループによって強化されています。Iometer は、Windows のユーザーインターフェー スとさまざまなプラットフォームで利用できる、いわゆる「dynamo」で構成されています。この数年で、こ れら 2 つのコンポーネントは、 http://www.iometer.org/ または、 http://sourceforge.net/projects/iometer から 「インテルオープンソースライセンス」でダウンロードできるようになりました。 Iometer は、IO サブシステムへのアクセスについて実際のアプリケーションの動作を再現することができま す。このため、特に、使用するブロックサイズ、シーケンシャルリード/ライト、ランダムリード/ライト、 およびこれらの組み合わせなど、アクセスの種類を設定できます。また、同時アクセス数(「未処理 IO」)も 設定できます。その結果、Iometer は 1 秒あたりのスループット、1 秒あたりのトランザクション数、各アク セスパターンの平均応答時間などの基本的なパラメーターを含むカンマで区切られた .csv ファイルを生成し ます。この方法により、特定のアクセスパターンを使ってさまざまなサブシステムの性能を比較できます。 Iometer は、ファイルシステムを使用して、サブシステムにアクセスできるばかりでなく、いわゆる RAW デ バイスにもアクセスできます。 Iometer では、さまざまなアプリケーションのアクセスパターンをシミュレーションおよび測定できますが、 オペレーティングシステムのファイルキャッシュは考慮されません。また、オペレーションは 1 つのテスト ファイル上のブロックで行われます。 負荷プロファイル アプリケーションがマスストレージシステムにアクセスする方法は、ストレージシステムのパフォーマンス に多大な影響を及ぼします。各種アプリケーションのさまざまなアクセスパターンの例: アプリケーション アクセスパターン データベース(データ転送) ランダム、67 %リード、33 %ライト、8 KB(SQL Server) データベース(ログファイル) シーケンシャル、100 %ライト、64 KB ブロック バックアップ シーケンシャル、100 %リード、64 KB ブロック リストア シーケンシャル、100 %ライト、64 KB ブロック ビデオストリーミング シーケンシャル、100 %リード、ブロック ≥ 64 KB ファイルサーバ ランダム、67 %リード、33 %ライト、64 KB ブロック Web サーバ ランダム、100 %リード、64 KB ブロック オペレーティングシステム ランダム、40 %リード、60 %ライト、ブロック ≥ 4 KB ファイルコピー ランダム、50 %リード、50 %ライト、64 KB ブロック これから次の 4 つの独特なプロファイルが導き出されました。 負荷プロファイル アクセス アクセスパターン ブロック サイズ 未処理 IO 負荷 ツール リード ライト ストリーミング シーケンシャル 100 % 64 KB 3 Iometer リストア シーケンシャル 100 % 64 KB 3 Iometer データベース ランダム 67 % 33 % 8 KB 3 Iometer ファイルサーバ ランダム 67 % 33 % 64 KB 3 Iometer 4 つのプロファイルはすべて Iometer で生成されました。測定シナリオ
比較できる測定結果を得るためには、再現可能な同一の環境ですべての測定を実行することが重要です。そ のため StorageBench は上記の負荷プロファイルに加えて次の規則に基づいています。
実際の顧客構成で RAW デバイスを使用するのは例外的な状況のみであるため、内蔵ディスクのパフォー
マンス測定は常にファイルシステムを使用したディスク上で実行されます。高いパフォーマンスが他 のファイルシステムや RAW デバイスで実現できる場合でも、Windows では NTFS が使用され、Linux では ext3 が使用されます。
ハードディスクは、コンピュータシステムで最もエラーが発生しやすいコンポーネントです。ハード
ディスクの故障によるデータの損失をなくすためにサーバシステムで RAID コントローラーが使用さ れる理由はここにあります。ここでは、複数のハードディスクを組み合わせて「Redundant Array of
Independent Disks」(RAID)を形成し、1 つのハードディスクが故障した場合でもすべてのデータが
維持されるように(RAID 0 を除く)すべてのデータを複数のハードディスクに分散させます。ハード ディスクをアレイで編成する最も一般的な方法は、RAID レベル、RAID 0、RAID 1、RAID 5、RAID 6、 RAID 10、RAID 50、RAID 60 です。各種 RAID アレイの基本については、資料パフォーマンスレポー ト - PRIMERGY 用モジュラー RAID を参照してください。
ディスクの数および装着されているコントローラーに応じて、 RAID 構成を変えながら PRIMERGY サー バの StorageBench を測定しました。2 台のハードディスクを装着できるシステムでは RAID 1 およ び RAID 0 を使用し、3 台以上では RAID 1E および RAID 5 を使用します。適用可能な場合はサポー トされていることを条件にさらに上位の RAID レベルを使用します。 ハードディスクのサイズに関係なく、サイズが 8 GB の測定ファイルを常に測定に使用しています。 I/O サブシステムの効率の評価では、プロセッサパフォーマンスおよびメモリ構成は、今日のシステ ムでは大きな要因ではありません。通常、考えられるボトルネックは CPU やメモリではなく、ハー ドディスクや RAID コントローラーに影響を及ぼします。したがって、CPU やメモリの構成を数々 変えながら StorageBench で解析する必要はありません。 測定結果 負荷プロファイルごとに、StorageBench は次のようにさまざまな主要指標を提供します。1 秒あたりのデー タ転送量をメガバイト数で表した(MB/s)「データスループット」、1 秒あたりの I/O オペレーション数(IO/s) の「トランザクションレート」、およびミリ秒(ms)単位の「待機時間」(「平均アクセス時間」)。シーケン シャルな負荷プロファイルでは、データスループットが通常の指標であり、小規模なブロックサイズを使用 するランダムな負荷プロファイルでは、通常、トランザクションレートが使用されます。スループットおよ びトランザクションレートは互いに直接比例し、次の式に従って計算できます。 データスループット [MB/s] = トランザクションレート [ディスク-I/O /s] × ブロックサイズ [MB] トランザクションレート [ディスク-I/O /s] = データスループット [MB/s] / ブロックサイズ [MB]
ベンチマークの結果
PRIMERGY TX200 S5 には、Modular RAID ファミリーのコントローラーが搭載されています。各種の RAID ソリューションにより、ユーザーはアプリケーションシナリオに合わせて適切なコントローラーを選択でき ます。
PRIMERGY TX200 S5 には、次の機能を提供する RAID ソリューションがあります。 1. SATA RAID オンボードコントローラー
このコントローラーは、サーバのマザーボードに直接実装される Intel ICH10R チップセットで、RAID スタックはサーバの CPU によって実現されます。この RAID ソリューションは、SATA ハードディ スクの接続でのみ使用されます。RAID レベル 0、1、10 に対応しています。このコントローラーに は、コントローラーキャッシュがありません。
2. RAID コントローラー LSI MegaRAID SAS 1068
このコントローラーは、PCI Express カードとして供給されています。このコントローラーに接続で きる SATA および SAS ハードディスクの最大数は 8 台です。RAID レベル 0、1、1E に対応してい ます。このコントローラーにはキャッシュがありません。
3. RAID コントローラー LSI MegaRAID SAS 1078
このコントローラーは PCI Express カードとして供給され、すべての RAID ソリューションを提供し ます。SATA と SAS の両方のハードディスクを接続できます。RAID レベル 0、1、5、6、10、50、 60 に対応しています。このコントローラーには、256 MB または 512 MB のキャッシュを備えた 2 つ のタイプがあります。コントローラーのキャッシュは、電源障害に対してオプションのバッテリーバッ クアップユニット(BBU)により保護できます。このコントローラーは 240 台までのハードディス クをサポートします。 これらのコントローラーには、さまざまな SATA および SAS ハードディスクを接続できます。必要なパフォー マンスに応じて適切なディスクサブシステムを選択できます。モデルバージョンに応じて、PRIMERGY TX200 S5 では 3.5 インチハードディスク用の 4 つのホットプラグベイまたは 2.5 インチハードディスク用の 8 つの ホットプラグベイを利用できます。オプションで、2.5 インチバージョンでは 8 台の 2.5 インチホットプラ グベイの拡張ボックス、3.5 インチバージョンでは 2 台の 3.5 インチホットプラグベイの拡張ボックスを使 用できます。 PRIMERGY TX200 S5 には、次のハードディスクを選択できます。 2.5 インチ SAS ハードディスク、容量 73 GB、146 GB(10 krpm) 2.5 インチ SAS ハードディスク、容量 36 GB、73 GB(15 krpm) 3.5 インチ SAS ハードディスク、容量 73 GB、146 GB、300 GB、450 GB(15 krpm) 3.5 インチ SATA ハードディスク、容量 250 GB、500 GB、750 GB、1 TB(7.2 krpm) SATA RAID オンボードコントローラー ICH10R
次の図は、スループットがキャッシュ設定によってどのように変化するかを、3.5 インチ SATA ハードディス クを使用して示しています。1 台のハードディスク(シングルディスク、SD)のスループットを RAID 1 ア レイ構成にした 2 台のハードディスクのスループットと比較しています。 64 KB ブロックのシーケンシャルリードのスループットは、キャッシュ設定によって左右されません。RAID 1 では、スループット値はシングルディスク構成の場合 とほぼ同じですが、データの冗長性という利点がありま す。 これとは対照的に、64 KB ブロックのシーケンシャルア クセスのライトスループットは、キャッシュ設定に大き く左右されます。ディスクキャッシュを有効にすると、 シングルディスク構成および RAID 1 のライトスループッ トは約 14 倍向上します。ライトスループットがこれほ ど大幅に向上するのは、ハードディスクへのライトアク セスが最適化されるため、また待機時間が短縮されるた めです。
ディスクキャッシュを有効にすると、ランダムアクセスのスループットが向上します。ただし、これはシー ケンシャルライトのスループットの向上ほど顕著ではありません。64 KB ブロックのランダムアクセスの場 合、シングルディスク構成ではスループットは約 16 % 向上し、RAID 1 では約 28 %向上します。 8 KB ブロックのランダムアクセスの場合、スループッ トの向上は 64 KB ブロックのランダムアクセスの場合 より若干高くなり、シングルディスク構成では約 18 %、 RAID 1 では約 33 %向上します。
LSI MegaRAID SAS 1068
LSI MegaRAID SAS 1068 コントローラーで利用可能なハードディスクタイプのパフォーマンスを比較しま す。 このコントローラーには、コントローラーキャッシュがありません。そのため、ここではディスクキャッシュ パラメーターの影響のみを測定し、ディスクキャッシュを使用する場合と使用しない場合とでハードディス ク測定値を比較しました。 ハードディスクキャッシュはディスク I/O パフォーマンスに影響を及ぼします。多くの場合、この機能は電 源障害時の安全上の問題により無効化されます。しかし、ハードディスクの製造元は、書き込みパフォーマン スの向上のためにこの機能を組み込んでいます。特に、SAS ハードディスクに比べて回転数が遅い SATA ハー ドディスクでは、パフォーマンス上の理由により、ディスクキャッシュを有効にすることを推奨します。I/O アクセス用のキャッシュは圧倒的に大きく、電源障害時の潜在的なリスク(データの損失)がメインメモリ には存在します。これは、オペレーティングシステムによって管理されます。データの損失を防止するには、 システムに無停電電源装置(UPS)を装備することを推奨します。 テストでは、2 台のハードディスクをコントローラーに接続し、RAID 1 として構成しました。測定では、 PRIMERGY TX200 S5 で現在利用可能なすべてのハードディスクタイプを解析しました。RAID 1 構成の各 ハードディスクタイプのスループットを種々のアクセスパターンで比較します。 次の図は、回転数の増加に伴って、64 KB ブロックサイズを使用したシーケンシャルリードとライトのスルー プットが向上することを示しています。 シーケンシャルリードの場合、回転数 10 krpm のハードディスクの代わりに 15 krpm のものを使用すると、 2.5 インチハードディスクでスループットが約 19 %向上します。回転数が 15 krpm の 2.5 インチハードディ スクと 3.5 インチハードディスクのスループットを比較すると、3.5 インチハードディスクのスループットは 2.5 インチハードディスクに比べて約 63 %高いことがわかります。
3.5 インチ SAS ハードディスクと 3.5 インチ SATA ハードディスクを比較すると、シーケンシャルリードで、 回転数 15 krpm の SAS ハードディスクのスループットは回転数 7.2 krpm の SATA ハードディスクよりも約 58 %高くなっています。 ディスクキャッシュを有効にしたシーケンシャルライトの場合、回転数 10 krpm のハードディスクの代わり に回転数 15 krpm のものを使用すると、2.5 インチハードディスクでスループットが約 21 %向上します。回 転数が 15 krpm の 2.5 インチハードディスクと 3.5 インチハードディスクのスループットを比較すると、3.5 インチハードディスクのスループットは 2.5 インチハードディスクよりも約 48 %高いことがわかります。 3.5 インチ SAS ハードディスクと 3.5 インチ SATA ハードディスクを比較すると、シーケンシャルリードで ディスクキャッシュを有効にした場合、回転数 15 krpm の SAS ハードディスクのスループットは回転数 7.2 krpm の SATA ハードディスクよりも約 46 %高くなっています。 ディスクキャッシュを有効にした SATA ハードディスクでは、特にシーケンシャルライトでスループットを 最大 14 倍まで向上できます。ディスクキャッシュを有効化にした SAS ハードディスクでのスループットの 向上は、SATA ハードディスクほど顕著ではありませんが、それでもかなり大きいものです。10 krpm の 2.5 インチ SAS ハードディスクでは 84 %、15 krpm の 2.5 インチ SAS ハードディスクでは約 46 %スループッ トが向上します。15 krpm の 3.5 インチ SAS ハードディスクでは、スループットが 2.2 倍に向上します。 次の図は、リードが 67 %を占めるランダムアクセスでも、ディスクキャッシュがスループットの向上に重要 な役割を果たしていることを示しています。 ディスクキャッシュを有効にすると、RAID 1(7.2 krpm の 3.5 インチ SATA ハードディスク 2 台または 15 krpm の 3.5 インチ SAS ハードディスク 2 台で構成)の 8 KB ブロックを使用するランダムアクセスで約 29 %ス ループットが向上しました。 2.5 インチと 3.5 インチの 15 krpm SAS ハードディスクのスループットを比較すると、ディスクキャッシュを 有効にした場合、8 KB ブロックのランダムアクセスで、3.5 インチのハードディスクのスループットは 2.5 イン チのハードディスクよりも約 23 %高いことがわかります。 3.5 インチ SAS ハードディスクと 3.5 インチ SATA ハードディスクを比較すると、ディスクキャッシュを有 効にした場合、8 KB ブロックのランダムアクセスで、15 krpm の SAS ハードディスクのスループットは 7.2 krpm の SATA ハードディスクよりも約 2.5 倍高いことがわかります。 ディスクキャッシュを有効にすることにより、64 KB ブロックを使用する SATA ハードディスクで、スルー プットが最大 24 %向上しました。SAS ハードディスクでは、64 KB ブロックの場合のスループットの向上 は、若干低い 20 %強です。 2.5 インチと 3.5 インチの 15 krpm SAS ハードディスクのスループットを比較すると、ディスクキャッシュを 有効にした場合、64 KB ブロックのランダムアクセスで、3.5 インチのハードディスクのスループットは 2.5 インチのハードディスクよりも約 19 %高いことがわかります。 3.5 インチ SAS ハードディスクと 3.5 インチ SATA ハードディスクを比較すると、ディスクキャッシュを有 効にした場合、64 KB ブロックのランダムアクセスで、15 krpm の SAS ハードディスクのスループットは 7.2 krpm の SATA ハードディスクよりも約 2.4 倍高いことがわかります。
LSI MegaRAID SAS 1078(512 MB のキャッシュを搭載)
LSI MegaRAID SAS 1078
RAID アレイでは、可用性に関するデータを取り扱う方法が定義されています。各 RAID アレイ内でデータが 転送される速さは、ハードディスクのデータスループットによって大きく異なります。RAID アレイで測定用 に構成されるハードディスクの数は、RAID レベルに応じて定義されています。2 台または 3 台のハードディ スクが使用されました。さまざまなキャッシュ設定でのコントローラーの効率を測定するときに、ハードディ スクがボトルネックにならないように、回転数が 15 krpm のハードディスクで測定を実行しました。 キャッシュ設定によって、スループットが大幅に向上する場合があります。ただし、このようなスループッ トの向上は、データの構造とアクセスのパターンによって異なります。測定のために、コントローラーキャッ シュのオプション「Read モード」は常に「No Read-ahead」に設定し、オプション「I/O cache」は常に「I/O direct」に設定します。オプション「Write モード」と「Disk cache」はさまざまな設定にしました。 次の図は、2 台の 3.5 インチハードディスクを使用した RAID 1 と、3 台の 3.5 インチハードディスクを使用 した RAID 5 それぞれで、キャッシュ設定を変えて測定した、64 KB ブロックのシーケンシャルリードとラ イトのスループットを示しています。 シーケンシャルリードのスループットでは、非常に良い値 が得られ、キャッシュ設定によって変化していません。 対照的に、ライトのスループットは、キャッシュ設定によっ て異なります。RAID 1 で最善のパフォーマンスを実現す るには、最適なキャッシュ設定として「Disk cache enabled」 オプションを使用する必要があります。今回の測定では、 シーケンシャルライトのスループットは 2.3 倍向上しまし た。 優れたパフォーマンスのために最適なキャッシュ設定を行 うことの重要性は、特に RAID 5 で明らかです。この図は、 コントローラーキャッシュを「Write-back」のオプション で有効にし、ディスクキャッシュを「enabled」のオプション で有効にした結果、シーケンシャルライトのスループット が、大幅に(30 倍に)向上したことを示しています。 RAID 1 でのランダムアクセスで最善のスループットを実現するためには、コントローラーキャッシュの Write モードのオプションを「Write-through」に設定し、ハードディスクのディスクキャッシュを有効にすること が重要です。このような最適のキャッシュ設定により、 ランダムアクセスに 8 KB ブロックを使用すると 34 %、 64 KB ブロックを使用すると 29 %のスループットの向 上が実現しました。 RAID 5 でのランダムアクセスで最善のスループットを 実現するためには、コントローラーキャッシュの Write モードのオプションを「Write-back」に設定し、ハー ドディスクのディスクキャッシュを有効にすることが 重要です。このような最適のキャッシュ設定により、 ブロックサイズに応じて、63 %および 9 %のスループッ トの向上が実現しました。 このトピックについての詳細は、次の文書で参照でき ます:『パフォーマンスレポート - PRIMERGY 用モジュ ラー RAID』 .
コントローラーの比較
ここでは、さまざまなコントローラーのスループットを比較します。同じ RAID 1 アレイで同じ種類のハー ドディスクで測定しました。この図は、キャッシュを無効にした場合(Off)と、最適なキャッシュ設定を行っ た場合(Optimal)に得られるスループットを示しています。
SAS ハードディスクに接続するには、LSI MegaRAID SAS 1068 コントローラーまたは各バージョンの LSI MegaRAID SAS 1078 コントローラーを使用できます。 純粋なシーケンシャルアクセスで最適なキャッシュ設定の場合、使用したコントローラーのパフォーマンス の違いはわずかです。シーケンシャルリードでは、すべてのコントローラーで、キャッシュ設定に関係なく 最大のスループットの値を実現しました。シーケンシャルライトの場合でも、すべてのコントローラーのパ フォーマンスの変動は同じ範囲内で、データスループットは最適なキャッシュ設定によって 65 %向上させる ことができます。 SATA ハードディスクは、提供されているすべてのコントローラーで実行できます。
オンボード SATA ICH10R コントローラーを LSI MegaRAID SAS 1068 コントローラーと比較した場合、同 じ SATA ハードディスクおよびディスクキャッシュ設定で測定すると、2 つのコントローラーのパフォーマン スはほぼ同じになります。パフォーマンスの差異は、測定精度の範囲内です。
このオンボード SATA コントローラーは、サーバのマザーボードに直接実装される Intel ICH10R チップセッ トです。RAID スタックはサーバの CPU によって処理されます。CPU への負荷の増加は、アクセスパターン およびブロックサイズによって異なります。CPU 負荷は、この例では最大で 5 %増加していますが、サイズ の小さいデータブロックが多数ある場合は、通常、これより増加率が高くなります。オンボード SATA コン
トローラーでは高いパフォーマンス値が得られますが、LSI SAS 1068 コントローラーの利点も無視できません。
SATA ハードディスクが使用される場合、LSI MegaRAID SAS 1078 コントローラーは、NCQ(Native Command Queueing:ネイティブ・コマンド・キューイング)をサポートしているので、LSI MegaRAID SAS 1068 コン トローラーよりも有利です。NCQ によって、付随する I/O 要求が収集され、処理する順序が最適化されます。 これによって、ハードディスクのヘッドの不要な動きがなくなり、待機時間が短くなってスループットの値 が増加します。この方法は、SATA ハードディスクでのみ使用できます。図からわかるように、NCQ によっ て、特に、ディスクキャッシュを使用しない場合のランダムアクセスでのシーケンシャルライトで、パフォー マンスが大幅に向上します。
そのため、NCQ を有効(現在のデフォルト設定)にした LSI MegaRAID SAS 1078 コントローラーは、ディ スクキャッシュを有効にしない場合のシーケンシャルライトの約 5 倍のスループットを示します。ランダム アクセスに関しては、ディスクキャッシュに関係なく、NCQ によって約 22 %高いスループットが可能にな ります。
SATA ハードディスクが動作しているときは、コントローラーの性能も発揮できるように、LSI MegaRAID SAS
1078 コントローラーで NCQ を常に有効にしておくことを推奨します。
結論
PRIMERGY TX200 S5 により、「モジュラー RAID」の考え方に基づいて、さまざまなアプリケーションのシ
ナリオの多様な要件を満たす多くの機会が得られます。
SATA ハードディスクの構成の場合、オンボード SATA RAID コントローラーは、ユーザーにとって価格性能 比が非常に良いソリューションオプションです。
LSI MegaRAID SAS 1068 コントローラーに代表されるエントリーレベルのコントローラーでは、基本的な RAID ソリューション RAID 0、RAID 1 および RAID 1E が実現され、この 3 つの RAID レベルが非常に優れたパフォー マンスでサポートされます。
LSI MegaRAID SAS 1078 コントローラーに代表される「ハイエンド」コントローラーでは、現在のすべて の RAID ソリューションが実現されます。最大 16 台の内蔵ハードディスクを使用して拡張可能な PRIMERGY TX200 S5 では、RAID レベル 0、1、5、6、10、50 および 60 がサポートされます。このコントローラーに は、256 MB または 512 MB のコントローラーキャッシュが搭載され、オプションとして、BBU を使用した セキュリティの保護が可能です。キャッシュの使用に関するさまざまな設定オプションで、使用する RAID レ ベルに合わせてコントローラーのパフォーマンスを柔軟に適応させることができます。 RAID 5 または RAID 6 を使用することにより、既存のハードディスクの容量を経済的に活用して、優れたパ フォーマンスを実現できます。ただし、最善のパフォーマンスとセキュリティのためには、RAID 10 を推奨 します。
PRIMERGY TX200 S5 では、SATA と SAS から選択できます。SAS ハードディスクは、2.5 インチのハード ディスクと 3.5 インチのハードディスクから選択可能で、また、10 krpm と 15 krpm の異なる回転数も選択 できます。必要なパフォーマンスに応じて、使用するハードディスクの種類を回転数も含めて決定する必要 があります。15 krpm のハードディスクでは、最大 23 %のパフォーマンスの向上が可能です。2.5 インチハー ドディスクを使用することで、RAID レベルに応じて、RAID アレイで使用するハードディスクを増やし、よ り高いレベルでの並列処理を実現できます。 最高のパフォーマンスのために、特に SATA ハードディスクを使用する場合やコントローラーキャッシュを 持たないコントローラーを使用する場合は、ハードディスクのキャッシュを有効にすることを推奨します。 使用するディスクの種類に応じて、パフォーマンスの増加は 14.5 倍です。ハードディスクのキャッシュを有 効にする場合は、UPS の使用を推奨します。
ベンチマーク環境
ここで説明したすべての測定は、下記の一覧で示したハードウェアとソフトウェアのコンポーネントを使用 して実行されました。
コンポーネント 詳細
サーバ PRIMERGY TX200 S5
オペレーティングシステム Windows Server 2008、Enterprise Edition Version: 6.0.6001 Service Pack 1 Build 6001
ファイルシステム NTFS 測定ツール Iometer 27.07.2006 測定データ 8 GB の測定ファイル オンボード SATA コントローラー Intel ICH10R BIOS:6.00.R1.04A SATA RAID モード
コントローラー LSI MegaRAID SAS 1068
製品:LSI RAID 0/1 SAS 1068
ドライバ名:lsi_sas.sys、ドライバのバージョン: 1.29.03.00
ファームウェアのバージョン:1.27.00.00 BIOS のバージョン:06.26.00.00
コントローラー LSI MegaRAID SAS 1078
製品:LSI RAID 5/6 SAS 1078
ドライバ名:megasys.sys、ドライバのバージョン: 3.9.0.64 ファームウェアのパッケージ:11.0.1-0008 ファームウェアのバージョン:1.40.32-0580 BIOS のバージョン:2.06.00 コントローラーキャッシュ:256 MB または 512 MB ハードディスク SATA、3.5 インチ、7.2 krpm Seagate ST3500320NS、500 GB ハードディスク SAS、2.5 インチ、10 krpm Seagate ST973402SS、73 GB ハードディスク SAS、2.5 インチ、15 krpm Seagate ST973451SS、73 GB ハードディスク SAS、3.5 インチ、15 krpm Seagate ST3146356SS、146 GB 国または販売地域によっては一部のコンポーネントが利用できない場合があります。
SPECsfs2008
ベンチマークの説明
SPECsfs2008 は、Standard Performance Evaluation Corporation(SPEC)で開発されたベンチマークスイー トで、ファイルサーバのスループットと応答時間を測定します。異なるベンダーのプラットフォーム間での、 パフォーマンスを比較する標準的な方法が用意されています。 SPECsfs2008 の結果では、次の項目に関して、サーバの性能が要約されています。 1 秒あたりの、処理が可能なオペレーション数(ops/sec) 応答時間(個々のオペレーションの完了に必要な時間) SPECsfs2008 の新しいコードにより、以前のバージョンとはパフォーマンスが異なります。したがって、 SPECsfs2008 の結果は、以前のバージョンの SPECsfs ベンチマーク結果とは比較できません。 SPECsfs2008 ベンチマークは、NFS または CIFS のファイルサーバのパフォーマンスの測定に使用されます。 このベンチマークでは、標準的なサーバ環境をシミュレートするワークロードの組み合わせが作成されます。 NFS プロトコルバージョン 3 に準拠した NFS ワークロード、および CIFS ワークロードは、SFS 委員会の メンバーによって、顧客のサイトで実際に稼働している何千もの NFS および CIFS のサーバから集められた データを基にしています。 類似点はありますが、特に、各ワークロードが動作するファイルセットに関しては、NFS と CIFS のワーク ロードは比較できません。例えば、SUT(テスト対象システム)の CIFS の結果が同じ SUT の NFS の結果 よりも 20 %高い場合でも、その SUT では NFS での動作よりも CIFS での動作のほうが良いという推定はで きません。ワークロードは大きく異なり、NFS と CIFS のワークロードを平準化するための試みは行われま せんでした。NFS でも CIFS でも、同じ SPECsfs2008 ワークロードで測定された、異なる SUT の公開結果 の比較だけは可能です。
測定には、1 ops/sec の負荷あたり 120 MB のファイルセットを作る必要があります。測定中に、ファイルセッ ト内の 30 %のファイルにアクセスがあります。ファイルの最大サイズは 32 MB です。NFS ワークロード内 の READ コマンドと WRITE コマンドの比率は 9:5 です。CIFS ワークロード内の READ_ANDX コマンドと WRITE_ANDX コマンドの比率は、およそ 7:3 です。
このベンチマークでは、サーバ上での負荷の生成に使用できるクライアントシステムを、ユーザーが 1 つ以 上持っていることが必要です。これらのクライアントの 1 つが「最重要」クライアントとして参照され、負 荷を生成するすべてのクライアントの統合に使用されます。サポート対象のクライアントのオペレーティン グシステムは、AIX、FreeBSD、Linux、Mac OS X、Solaris 10 および Windows です。
標準的な SPECsfs2008 のテスト構成では、負荷を生成する一連のクライアントは、SUT からの共有または エクスポートが行われたファイルシステムで、ネットワーク経由で管理されます。クライアントはマネージャー プログラムによって管理され、増加していく等間隔の「ロードポイント」で、10 以上の一連のテストを実行 します。ロードポイントは、クライアントがサーバへ送るワークロードのスループットレベル(オペレーション 数)を表します。 各ロードポイントの開始と同時に、各クライアントは、指定された数の負荷生成プロセスを開始します。各 プロセスでは、エクスポートまたは共有が行われたファイルシステムがマウントされ、ディレクトリ構造が 作成されて、そこにさまざまな大きさのファイルが書き込まれます。負荷を生成するプロセスで作成される ファイル数は、ロードポイントに対して指定された 1 秒あたりのオペレーション数によって決まり、その数 に比例して増加します。 負荷を生成しているすべてのプロセスによってファイルセットの初期化(ベンチマークの「INIT」フェーズ と呼ばれる)が完了されると、そのプロセスによって、ベンチマークで規定されているワークロードのパラ メーターを基にした NFS または CIFS の一連のオペレーションのサーバからの要求が開始されます。負荷ジェ ネレーターは 300 秒間 WARMUP モードを実行します。この間は正式な測定値は記録されません。WARMUP フェーズが完了すると、ベンチマークによって、300 秒間の測定フェーズが開始され、その間、ロードポイン トのスループットと応答時間の実際の測定値が収集されます。
300 秒の測定時間が正常に完了すると、テストの総合結果のレポートと記録を担当するマネージャープログ ラムにより、すべてのクライアント上のすべての負荷ジェネレーターからの統計値が収集されます。ベンチ マークのルールに違反せずにテストが完了した場合は、マネージャーによって作成された概要レポートを使 用して、審査と公表のために SPEC へ送信可能な SFS サブミッションを作成できます。そのため、ベンチ マークのレポート作成ツールが使用されてピークに達したスループットが示され、「全体応答時間」の性能指 標が算出されます。これは、一連のロードポイントの平均応答時間の測定結果を検討するためのものです。 SPECsfs2008 Run and Reporting Rules は、このスイートを使用して生成された結果が、有意義で、生成さ れた他の結果と比較でき、再現が可能なことを保証するために、SPEC によって制定されています。SPEC の ライセンス契約により、公開するすべての結果は、この Run and Reporting Rules に準拠している必要があ ります。さらに、このベンチマーク結果を公開して使用する場合、SPEC では SPEC OSG Fair Use Policy に 従うように求めています。このガイドラインに準拠していないと思われる場合、SPEC は調査を行い、公表 資料の訂正を要請する場合があります。
ベンチマーク結果
2009 年 11 月に、SPECsfs2008 ベンチマークの CIFS ワークロードを使用して、PRIMERGY TX200 S5 が 測定されました。サーバには、2 基の Xeon X5570 プロセッサ、12 枚の 8 GB PC3-10600R DDR3-SDRAM、 512 MB のキャッシュと BBU を搭載する 2 つの 8 ポート SAS RAID コントローラー、および 16 台の SAS ハー ドディスクが装備されていました。オペレーティングシステムは、RAID 1 を構成する 2 台のハードディスク (36 GB、15000 rpm)上にありました。ファイルサーバのデータ領域は、2 組の RAID 5 を構成する 14 台の ハードディスク(146 GB、10000 rpm)上にありました。PRIMERGY TX200 S5 は、1 ギガビットの内蔵イー サネットコントローラーを介して負荷ジェネレーターに接続されました。測定には、Windows Server 2003 R2 Enterprise x64 Edition SP2 を使用しました。 最初の測定区間では、660 ops/sec の負荷となるように測定を行いました。この結果、約 77 GB の大きさの データ領域がベンチマークにより生成されました。目標値は、後続の測定区間ごとに 660 ops/sec ずつ増加 するため、データ領域の大きさも、約 77 GB ずつ増加しました。SPECsfs2008 _cifs の結果 = 6785 ops/sec (全体応答時間 = 6.03 ミリ秒)が得られました。 下記の表は、10 回の測定間隔で得られたスループット(ops/sec)と平均応答時間(ミリ秒)を示していま す。グラフでもこのことを示しています。グラフ内には、全体応答時間も点線で表されています。これは、 すべての測定間隔から算出された平均応答時間です。また、Y 軸の上端は、ルールに沿ったベンチマークの 実行で許容される平均応答時間の最大値(20 ミリ秒)です。 測定値は、内蔵ハードディスクの容量を合わせた RAID 5 の構成で PRIMERGY TX200 S5 がどのようなスルー プットのパフォーマンスを実現するかを示しています。測定中に、プロセッサの能力の限界に達することは ありませんでした。特に、ハードディスクの数によって、スループットが制限されました。 測定結果は、http://www.spec.org で公開されています。
ベンチマーク環境
テスト対象システム(System Under Test:SUT) ハードウェア サーバ PRIMERGY TX200 S5 プロセッサ Xeon X5570(2 基) メモリ 8 GB PC3-10600R DDR3-SDRAM x 12 枚 ネットワークインター フェース 1 ギガビットオンボードイーサネットコントローラー(1 セット) ディスクサブシステム
8 ポート SAS RAID コントローラー(512 MB キャッシュおよび BBU 搭載)(2 台)
SAS ディスク、36 GB、15000 rpm、RAID 1、OS 用(2 台)
SAS ディスク、146 GB、10000 rpm、RAID 5(2 組)、データ用(14 台) ソフトウェア
オペレーティング
システム Windows Server 2003 R2 Enterprise x64 Edition SP2
負荷ジェネレーター ハードウェア モデル PRIMERGY RX100 S3(10 台) プロセッサ Pentium D 950(2 基) メモリ 1 GB DDR2 SDRAM PC2-4200 x 2 枚 ネットワークインター フェース 1 ギガビットオンボードイーサネット Broadcom BCM5721(2 セット:1 セットを 使用) ソフトウェア オペレーティング システム Windows Server 2003
OLTP-2
ベンチマークの説明
OLTP とは、Online Transaction Processing(オンライントランザクション処理)の略です。OLTP-2 ベンチ マークは、データベースソリューションの標準的なアプリケーションのシナリオを基にしています。OLTP-2 では、データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps)に よって測定対象システムのパフォーマンスを表すと決められています。 独立した機関によって標準化され、それぞれのルールや規則を順守することが求められる SPECint や TPC-E などのベンチマークとは違って、OLTP-2 は富士通テクノロジー・ソリューションズで開発された内部ベン チマークです。標準化されたベンチマークでは大掛かりなハードウェアの導入や時間の消費が必要なことが ありますが、OLTP-2 では適度なレベルに抑えられていて、さまざまな構成を限られた時間で測定できます。 OLTP-2 と TPC-E の 2 つのベンチマークが同じワークロードを使用して同様のアプリケーションのシナリオを シミュレートしても、この 2 つのベンチマークは異なる方法を使用してユーザーの負荷をシミュレートする ので、結果を比較することも、同等のものとして扱うこともできません。OLTP-2 の値は、通常、TPC-E と 同じような値になります。しかし、特に価格性能比が算出されないという理由により、直接的な比較だけで なく、OLTP-2 の結果を TPC-E として参照することもできません。
ベンチマーク結果
PRIMERGY TX200 S5 は、Xeon 55xx シリーズのプロセッサを使用して、36 GB、48 GB、72 GB、および 96 GB のメモリサイズで測定されました。すべての結果は、オペレーティングシステム Microsoft Windows Server 2008 Enterprise x64 Edition とデータベース SQL Server 2008 Enterprise x64 Edition で測定されたものです。 OLTP-2 のベンチマーク結果は、ハードディスクとコントローラーを含むシステムの構成オプションによっ て、大幅に異なります。そのため、システムには 4 台の LSI SAS MegaRAID 8880EM2 コントローラーを装 備して、24 台の PRIMERGY SX40 および合計 288 台の SAS ハードディスクに接続しました。ディスクサ ブシステムは、測定のボトルネックにならないように配置されました。他のディスクサブシステムでも、ボ トルネックになっていなければ、比較可能な結果を得られる場合があります。システム構成の詳細については、「ベンチマーク環境」セクションを参照してください。
プロセッサが Xeon E5520、E5530、E5540、X5550、X5560、および X5570 の場合、PRIMERGY TX200 S5 の最大のメモリ構成(1 基のプロセッサの場合は 6 枚のメモリモジュールを使用し、2 基のプロセッサの場 合は 12 枚のメモリモジュールを使用)では、メモリのアクセス速度は 1067 MHz です。Xeon E5502、E5504、 および E5506 を使用する場合は、メモリのアクセス速度は 800 MHz です。
次の図では、PRIMERGY TX200 S5 の OLTP-2 のパフォーマンスデータを、Xeon 55xx シリーズプロセッサ (E5502、E5504、E5506、E5520、E5530、E5540、X5550、X5560、および X5570)を 1 基使用した場合 と 2 基使用した場合の 2 つのグループに分けて示しています。Xeon L5530 のパフォーマンス値は Xeon E5530 と同等で、Xeon L5520 の値は Xeon E5520 と、また、Xeon L5506 の値は Xeon E5506 と同等です。 すべての種類のプロセッサの中で最大の増加は、Xeon E5502 と Xeon E5504 との間で、+92~+94 %です。 この場合、プロセッサのコアの数は 2 個から 4 個へと 2 倍になっています。また、Xeon E5506 と Xeon E5520 との間でも、プロセッサのキャッシュを 4 MB から 8 MB に倍増することとハイパースレッディングを使用 することによって、+55~+59 %の大幅な増加があります。最後に、Xeon E5520 と Xeon X5570 の間の増加 は +21~+22 %です。メモリを 36 GB から 48 GB に増加させたことによる違いは約 +8 %で、72 GB から 96 GB に増加させた場合は約 +3 %です。これは、OLTP-2 ベンチマークのワークロードによるもので、すべて のデータベースアプリケーションでの標準値ではありません。
103.31 221.93 214.42 332.04 340.91 350.16 394.03 403.39 412.62 96.69 189.07 196.30 312.24 319.13 326.02 364.21 373.43 382.64 87.54 190.80 176.85 282.64 288.24 293.83 332.13 337.24 342.34 0 100 200 300 400 500 600 700 800 tps Xeon E5502 Xeon E5504 Xeon E5506 Xeon E5520 Xeon E5530 Xeon E5540 Xeon X5550 Xeon X5560 Xeon X5570 24 GB 36 GB 48 GB RAM bold numbers: measured results
others: calculated results
+59%
+22%
+92%
OLTP-2: PRIMERGY TX200 S5 with 1 Xeon processor 55xx
103.31 221.93 214.42 332.04 340.91 350.16 394.03 403.39 412.62 96.69 189.07 196.30 312.24 319.13 326.02 364.21 373.43 382.64 87.54 190.80 176.85 282.64 288.24 293.83 332.13 337.24 342.34 0 100 200 300 400 500 600 700 800 tps Xeon E5502 Xeon E5504 Xeon E5506 Xeon E5520 Xeon E5530 Xeon E5540 Xeon X5550 Xeon X5560 Xeon X5570 24 GB 36 GB 48 GB RAM bold numbers: measured results
others: calculated results
+59%
+22%
+92%
OLTP-2: PRIMERGY TX200 S5 with 1 Xeon processor 55xx
207.30 399.10 410.89 639.21 655.81 667.50 749.89 765.58 775.70 201.03 390.52 402.06 622.99 640.04 657.08 724.06 738.72 753.37 183.30 343.40 353.54 576.49 590.45 604.41 676.31 686.98 697.65 0 100 200 300 400 500 600 700 800 tps Xeon E5502 Xeon E5504 Xeon E5506 Xeon E5520 Xeon E5530 Xeon E5540 Xeon X5550 Xeon X5560 Xeon X5570 48 GB 72 GB 96 GB RAM +55% +21% +94%
OLTP-2: PRIMERGY TX200 S5 with 2 Xeon processors 55xx bold numbers: measured results
others: calculated results
207.30 399.10 410.89 639.21 655.81 667.50 749.89 765.58 775.70 201.03 390.52 402.06 622.99 640.04 657.08 724.06 738.72 753.37 183.30 343.40 353.54 576.49 590.45 604.41 676.31 686.98 697.65 0 100 200 300 400 500 600 700 800 tps Xeon E5502 Xeon E5504 Xeon E5506 Xeon E5520 Xeon E5530 Xeon E5540 Xeon X5550 Xeon X5560 Xeon X5570 48 GB 72 GB 96 GB RAM +55% +21% +94%
OLTP-2: PRIMERGY TX200 S5 with 2 Xeon processors 55xx
bold numbers: measured results others: calculated results
ベンチマーク環境
テスト対象システム(System Under Test:SUT) ハードウェア サーバ PRIMERGY TX200 S5 プロセッサ Xeon E5502、E5504、E5506、E5520、E5530、E5540、X5550、X5560、 X5570 メモリ 8 GB DDR3 PC3-8500R x 最大 12 枚 設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効 ネットワークインター フェース 1 ギガビット LAN Intel(オンボード)(1 セット) ディスクサブシステム PRIMERGY TX200 S5:
LSI MegaRAID ベースの RAID 5/6 SAS(1 台)
3.5 インチ 146 GB 15K Fujitsu MAY2073RC、OS 用(1 台) 3.5 インチ 146 GB 15K Fujitsu MAY2073RC RAID-0、ログ用(3 台) LSI SAS MegaRAID 8880EM2(4 台)
FibreCAT SX40(24 台):
Seagate 73 GB 15 krpm(192 台) Seagate 146 GB 15 krpm(96 台) RAID-0、データ用
ソフトウェア
オペレーティングシステム Windows Server 2008 Enterprise x64 Edition データベース SQL Server 2008 Enterprise x64 Edition
国または販売地域によっては一部のコンポーネントが利用できない場合があります。
LAN スイッチ
負荷ジェネレーター ハードウェア モデル PRIMERGY Econel 200(4 台) プロセッサ Xeon 3.40 GHz、2 MB L2 キャッシュ(2 基) メモリ 2 GB DDR-SDRAM PC2700 ネットワークインター フェース 1 ギガビット LAN(オンボード)(1 セット) ソフトウェア オペレーティング
システム Windows Server 2003 Standard Edition SP1(x86) OLTP-2 ソフトウェア EGen バージョン 1.7.0-1013
納品までの時間は在庫状況によって異なります。技術仕様は予告なく変更さ れることがあります。誤記脱漏は随時訂正されます。 示しているすべての販売条件は(TC)ユーロでの希望価格で VAT を除く価格 です(別途記載ない限り)。ハードウェアおよびソフトウェアの名前はすべて、 発行部門: Enterprise Products PRIMERGY Server インターネット: http://ts.fujitsu.com/primergy エクストラネット: http://partners.ts.fujitsu.com/com/products/serv