パフォーマンスレポート PRIMERGY TX100 S1

(1)

要約

このドキュメントでは、PRIMERGY TX100 S1 で実行したベンチマークの概要について説明します。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています。目次ドキュメントの履歴 ... 2 製品データ ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 10 SPECpower_ssj2008 ... 13 StorageBench ... 17 関連資料... 21 お問い合わせ先 ... 21 ページ数 21

パフォーマンスレポート

PRIMERGY TX100 S1

(2)

ドキュメントの履歴

バージョン 3.0 ベンチマークの章を含むレポートの初版  SPECcpu2006 以下で測定： o Celeron 430 および 450

o Pentium Dual-Core E5200、E5400、E6300、および E6500 o Core 2 Duo E7300、E7400、および E7600

o Xeon E3110、E3120、X3220、X3330、L3360、および X3380  SPECjbb2005 Xeon X3380 で測定  SPECpower_ssj2008 Xeon L3360 および SATA 3.5 インチ 7200rpm（1 台）で測定  StorageBench オンボード SATA ICH9R コントローラーで測定

(3)

製品データ

PRIMERGY TX100 S1 は、低消費電力を実現した 1 ソケットのタワーサーバです。Intel 3200 チップセット、 Celeron、Pentium Dual-Core、Core 2 Duo、または Xeon のいずれかのプロセッサ、最大 8 GB の PC2-6400 DDR2-SDRAM、使用プロセッサに応じて周波数 667、800、1067、または 1333 MHz のバス、Intel 82566DM 1 Gbit LAN コントローラー、Intel ICH9R 6 ポート SATA コントローラー、SAS RAID コントローラー（オプション）、最大 4 台の 3.5 インチ SATA ハードディスク、および PCI スロット 4 本（PCIe x8（2 本）、PCIe x4 （1 本）、PCI 32 ビット/33 MHz（1 本））が搭載されています。

(4)

SPECcpu2006



ベンチマークの説明

SPECcpu2006 は、整数演算および浮動小数点演算のシステム性能を測定するベンチマークです。これは、 12 本のアプリケーションからなる整数演算テストセット、および 17 本のアプリケーションからなる浮動小数点演算テストセットで構成されています。これらのアプリケーションは大量の演算を実行し、 CPU / メモリを集中的に使用します。ディスク I/O やネットワークなど、他のコンポーネントについては、このベンチマークでは測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコードとして利用可能で、実際のベンチマークの前にコンパイルする必要があります。したがって、使用するコンパイラーのバージョンやその最適化設定が測定結果に影響を与えます。 SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。最初の方法（SPECint2006 および SPECfp2006）は、1 つのタスクの完了に必要な時間を評価します。次の方法（SPECint_rate2006 および SPECfp_rate2006）は、スループット（並列処理できるタスク数）を評価します。いずれの方法も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これは、コンパイラー最適化を使用するかどうかという点で異なります。「ベース」値は公開時に常に用いられますが、「ピーク」値はオプションです。 ベンチマーク 演算 タイプ コンパイラー 最適化 測定結果 アプリケーション SPECint2006 整数ピークアグレッシブ速度単体実行 SPECint_base2006 整数ベース標準 SPECint_rate2006 整数ピークアグレッシブスループット多重実行 SPECint_rate_base2006 整数ベース標準 SPECfp2006 浮動小数点ピークアグレッシブ速度単体実行 SPECfp_base2006 浮動小数点ベース標準 SPECfp_rate2006 浮動小数点ピークアグレッシブスループット多重実行 SPECfp_rate_base2006 浮動小数点ベース標準結果は、個々のベンチマークで得られた正規化比の幾何平均を使用しています。算術平均と比較して、幾何平均のほうが、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムが基準システムと比較してどの程度高速に実行されるのかを測定することです。基準システムの SPECint_base2006、 SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結果が、値「1」と判定されたとします。このとき、たとえば SPECint_base2006 の値 2 は、測定システムがこのベンチマークを基準システムよりも約 2 倍の性能で実行したことを意味します。SPECfp_rate_base2006 の値 4 は、測定対象システムが基準システムよりも、約 4/[ベースコピー数] 倍の性能でこのベンチマークを実行したことを意味します。ここで、「ベースコピー数」はベンチマークで実行された並行インスタンスの数です。弊社は、SPEC の公開用に、 SPECcpu2006 を測定したデータのすべてを提出しているわけではありません。このため、すべての結果が SPEC の Web サイトに表示されるわけではありません。弊社は、すべての測定値のログデータをアーカイブしているので、測定の内容に関していつでも証明できます。

_{SPEC®、SPECint®、SPECfp®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation（SPEC）} の登録商標です。

(5)

ベンチマーク結果

次の 7 種類のプロセッサバージョンで PRIMERGY TX100 S1 を測定しました。  Celeron 430 および 450

（Conroe、1 コア／チップ）

 Pentium Dual-Core E5200 および E5400 （Allendale、2 コア／チップ）

 Pentium Dual-Core E6300 および E6500 （Wolfdale、2 コア／チップ）

 Core 2 Duo E7300、E7400、および E7600 （Wolfdale、2 コア／チップ）

 Xeon E3110 および E3120 （Wolfdale、2 コア／チップ）  Xeon X3220 （Kentsfield、4 コア／チップ）  Xeon X3330、L3360、および X3380 （Yorkfield、4 コア／チップ）結果は次の表のとおりです。ベンチマークプログラムは、インテル C++/Fortran コンパイラー 11.0 でコンパイルし、SUSE Linux Enterprise Server 10 SP2（64 ビット）で実行しました。

プロセッサ コア GHz L2 キャッシュ FSB TDP SPECint_base2006 SPECint2006 Celeron 430 1 1.80 0.5 MB／チップ 800 MHz 35 W 11.6 12.7 Celeron 450 1 2.20 0.5 MB／チップ 800 MHz 35 W 13.3 14.6 プロセッサ コア GHz L2 キャッシュ FSB TDP SPECint_rate_base2006 SPECint_rate2006 Celeron 430 1 1.80 0.5 MB／チップ 800 MHz 35 W Celeron 450 1 2.20 0.5 MB／チップ 800 MHz 35 W Pentium Dual-Core E5200 2 2.50 2 MB／チップ 800 MHz 65 W 31.4 33.4 Pentium Dual-Core E5400 2 2.70 2 MB／チップ 800 MHz 65 W 33.0 35.0 Pentium Dual-Core E6300 2 2.80 2 MB／チップ 1067 MHz 65 W 35.1 37.4 Pentium Dual-Core E6500 2 2.93 2 MB／チップ 1067 MHz 65 W 36.3 38.5

Core 2 Duo E7300 2 2.67 3 MB／チップ 1067 MHz 65 W 36.2 38.7 Core 2 Duo E7400 2 2.80 3 MB／チップ 1067 MHz 65 W 37.2 39.9 Core 2 Duo E7600 2 3.07 3 MB／チップ 1067 MHz 65 W 39.6 42.2

Xeon E3110 2 3 6 MB／チップ 1333 MHz 65 W 43.6 46.9 Xeon E3120 2 3.17 6 MB／チップ 1333 MHz 65 W 45.3 48.7 Xeon X3220 4 2.40 8 MB／チップ 1067 MHz 105 W 61.4 65.7 Xeon X3330 4 2.67 6 MB／チップ 1333 MHz 95 W 65.6 69.7 Xeon L3360 4 2.83 12 MB／チップ 1333 MHz 65 W 75.9 81.3 Xeon X3380 4 3.17 12 MB／チップ 1333 MHz 95 W 81.7 87.3

(6)

(7)

プロセッサ コア GHz L2 キャッシュ FSB TDP SPECfp_base2006 SPECfp2006 Celeron 430 1 1.80 512 KB／チップ 800 MHz 35 W 12.3 12.7 Celeron 450 1 2.20 512 KB／チップ 800 MHz 35 W 13.8 14.2 プロセッサ コア GHz L2 キャッシュ FSB TDP SPECfp_rate_base2006 SPECfp_rate2006 Celeron 430 1 1.80 512 KB／チップ 800 MHz 35 W Celeron 450 1 2.20 512 KB／チップ 800 MHz 35 W Pentium Dual-Core E5200 2 2.50 2 MB／チップ 800 MHz 65 W 26.0 26.9 Pentium Dual-Core E5400 2 2.70 2 MB／チップ 800 MHz 65 W 26.9 27.8 Pentium Dual-Core E6300 2 2.80 2 MB／チップ 1067 MHz 65 W 29.2 30.1 Pentium Dual-Core E6500 2 2.93 2 MB／チップ 1067 MHz 65 W 29.9 30.8

Core 2 Duo E7300 2 2.67 3 MB／チップ 1067 MHz 65 W 29.2 30.1 Core 2 Duo E7400 2 2.80 3 MB／チップ 1067 MHz 65 W 29.9 30.8 Core 2 Duo E7600 2 3.07 3 MB／チップ 1067 MHz 65 W 31.2 32.2

Xeon E3110 2 3 6 MB／チップ 1333 MHz 65 W 33.4 34.6 Xeon E3120 2 3.17 6 MB／チップ 1333 MHz 65 W 34.4 35.7 Xeon X3220 4 2.40 8 MB／チップ 1067 MHz 105 W 42.1 43.4 Xeon X3330 4 2.67 6 MB／チップ 1333 MHz 95 W 45.2 46.6 Xeon L3360 4 2.83 12 MB／チップ 1333 MHz 65 W 49.4 51.2 Xeon X3380 4 3.17 12 MB／チップ 1333 MHz 95 W 51.8 53.8

(8)

(9)

ベンチマーク環境

 SPECcpu2006 での測定は、すべて次のハードウェアおよびソフトウェア構成の PRIMERGY TX100 S1 で実行されました。 ハードウェア モデル PRIMERGY TX100 S1 CPU Celeron 430、および 450

Pentium Dual-Core E5200、E5400、E6300、および E6500 Core 2 Duo E7300、E7400、および E7600

Xeon E3110、E3120、X3220、X3330、L3360、および X3380

CPU 数

Celeron 430、450： 1 チップ、1 コア、1 コア/チップ Pentium Dual-Core E5200、E5400、E6300、E6500、Core 2 Duo E7300、E7400、 E7600、Xeon E3110、E3120： 1 チップ、2 コア、2 コア/チップ Xeon X3220、X3330、L3360、X3380： 1 チップ、4 コア、4 コア/チッププライマリーキャッシュ 32 KB（命令） + 32 KB（データ）オンチップ（コアあたり）セカンダリーキャッシュ Celeron 430、450： 512KB（I+D）オンチップ（チップあたり） Pentium Dual-Core E5200、E5400、E6300、E6500：

2 MB（I+D）オンチップ（チップあたり） Core 2 Duo E7300、E7400、E7600： 3 MB（I+D）オンチップ（チップあたり） Xeon E3110、E3120、X3330： 6 MB（I+D）オンチップ（チップあたり） Xeon X3220： 8 MB（I+D）オンチップ（チップあたり） Xeon L3360、X3380： 12 MB（I+D）オンチップ（チップあたり）その他のキャッシュなしメモリ 4 x 2 GB PC2-6400 DDR2-SDRAM ソフトウェア オペレーティング

システム SUSE Linux Enterprise Server 10 SP2（64 ビット）コンパイラーインテル C++/Fortran コンパイラー 11.0

(10)

SPECjbb2005



ベンチマークの説明

SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークです。これは、本質的に SPECjbb2000 を更新したバージョンで、主な違いは次のとおりです。  トランザクションは、多様な機能範囲を対象とするため、より複雑になっています。  ベンチマークのワーキングセットが、システムの負荷の増大に対応して拡大されました。  SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実際との高い近似性を得ることができます。ソフトウェア側では、SPECjbb2005 は JVM、JIT（ジャストインタイム）コンパイラー、ガベージコレクション、スレッドなどのオペレーティングシステムの機能を評価します。ハードウェアに関する限り、SPECjbb2005 は CPU およびキャッシュの効率、メモリサブシステム、共有メモリシステム（SMP）のスケーラビリティを測定します。ディスクおよびネットワーク I/O は無関係です。 SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層のクライアント／サーバシステムをエミュレートしたもので、特に中間層が強調されています。  クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベースへの OLTP アクセスを思考時間ゼロで行います。  中間層は、ビジネスプロセスおよびデータベースの更新を実装します。  データベースは、データ管理を担当し、メモリ内の Java オブジェクトによりエミュレートされます。トランザクションのログ記録は XML ベースで実装されます。このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフォーマンスが測定されるため、大規模なハードウェアの設置は不要となり、SPECjbb2005 の異なるシステム間の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記述されています。 SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要です。スケーリングの単位は、約 25 MB の Java オブジェクトからなる１つのウェアハウスです。ウェアハウスあたり 1 つの Java スレッドがこれらのオブジェクトに対しオペレーションを実行します。これらのビジネスオペレーションは、TPC-C の次の項目を前提としています。  新規オーダーエントリー  支払  オーダーステータスの照会  納入  在庫レベル監視  顧客レポート SPECjbb2005 と TPC-C が共通して持っている機能は、これだけです。2 つのベンチマーク結果を比較することはできません。 SPECjbb2005 には、次の 2 つの性能指標があります。  bops（1 秒あたりのビジネスオペレーション）は、1 秒あたりのすべてのビジネスオペレーションの性能です。  bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。

_{SPEC®、SPECjbb®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation（SPEC）の登録商標} です。

(11)

SPECjbb2005 のさまざまな結果を比較する場合には、両方の性能指標を考慮する必要があります。ベンチマーク測定が準拠すべき以下のルールは、この性能指標の基となるものです。ベンチマーク測定は、ウェアハウス数（つまりスレッド数）が増加する一連の測定ポイントで構成され、各ケースでウェアハウスが 1 だけ増加します。測定は、1 ウェアハウスで開始され、2*MaxWh まで（ただし、尐なくとも 8 ウェアハウス）行います。MaxWh は、ベンチマークで予想される、秒あたりの最高オペレーションレートでのウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます。

性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定済みオペレーション速度の算術平均です。

ベンチマーク結果

2009 年 6 月に、1 基の Xeon X3380 プロセッサと 8 GB PC2-6400 DDR2-SDRAM のメモリ構成を使用して、 PRIMERGY TX100 S1 で測定を行いました。測定には、Windows Server 2008 Enterprise x64 Edition SP2 を使用しました。Oracle から提供されている JRockit(R) 6 R28.0.0 の 2 つのインスタンスを測定用 JVM として使用しました。 PRIMERGY TX100 S1 は、すべての 1 プロセッササーバの中で最高の成績を出し、このカテゴリのそれまでの記録を 4 ％も上回りました。どちらの測定でも、2～4 ウェアハウスで測定されたすべての値がベンチマーク結果に組み込まれています。 _{上記の競争力のあるベンチマーク結果は 2009 年 8 月 5 日時点で公開された結果を反映しています。上記のグラフは、} IBM および富士通が現在出荷している 1 プロセッササーバーのうちベストパフォーマンスのもの同士を比較したものです。最新の SPECjbb2005 ベンチマーク結果については、http://www.spec.org/jbb2005/results. を参照してください。

(12)

ソース：http://www.spec.org/jbb2005/results（2009 年 8 月 5 日現在）

ベンチマーク環境

 SPECjbb2005 でのすべての測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY TX100 S1 で実行されました。 ハードウェア モデル PRIMERGY TX100 S1 CPU Xeon X3380 チップ数 1 チップ、4 コア（チップあたり 4 コア）プライマリーキャッシュ 32 KB（命令） + 32 KB（データ）オンチップ（コアあたり）セカンダリーキャッシュ 12 MB（I+D）オンチップ（チップあたり）その他のキャッシュなしメモリ 4×2 GB PC2-6400 DDR2-SDRAM ソフトウェア オペレーティング

システム Windows Server 2008 Enterprise x64 Edition SP2

JVM バージョン _{（ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64）}Oracle JRockit(R) 6 P28.0.0

(13)

SPECpower_ssj2008

*

ベンチマークの説明

SPECpower_ssj2008 は、サーバクラスのコンピュータを対象とした、消費電力とパフォーマンスの特性を評価する業界標準の SPEC ベンチマークです。 SPEC は、パフォーマンス測定の標準を定めたのと同じ手法で、SPECpower_ssj2008 において、サーバの消費電力測定の標準を定義しました。ベンチマークのワークロードには、典型的なサーバサイド Java ビジネスアプリケーションがシミュレートされます。ワークロードはスケーラブルで、マルチスレッド化されており、様々なオペレーション環境で利用でき、低コストで実行できます。ワークロードは CPU、キャッシュ、メモリ階層および SMP（symmetric multiprocessor systems：対称型マルチプロセシングシステム）のスケーラビリティを実行／テストし、同時に JVM （Java Virtual Machine：Java 仮想マシン）、JIT （Just In Time：ジャストインタイム）コンパイラー、ガベージコレクション、スレッド、およびオペレーティングシステムのいくつかの機能を使用します。 SPECpower_ssj2008 では、100 ％からアクティブアイドルまで 10 ％区切りで、さまざまなパフォーマンスレベルにおける一定時間の消費電力をレポートします。段階的なワークロードは、サーバの処理負荷および電力消費が、日や週により大きく変化することを表しています。全てのレベルにおける電力効率指標を計算するには、各セグメントで測定したトランザクションスループットを合計し、各セグメントの平均消費電力の合計で割ります。結果は、overall ssj_ops/watt という性能指数です。この値から測定対象サーバのエネルギー効率に関する情報が得られます。測定標準が定義されていることにより、 SPECpower_ssj2008 で測定される値を他の設定やサーバと比較することができます。右の図は、 SPECpower_ssj2008 の標準的な結果のグラフです。ベンチマークは、さまざまなオペレーティングシステムおよびハードウェアアーキテクチャーで実行され、大がかりなクライアントやストレージインフラストラクチャーを展開する必要がありません。 SPEC 準拠テストの最小構成は、ネットワークで接続された 2 台のコンピュータと、電力アナライザと温度センサーが 1 台ずつです。コンピュータの 1 台は、SUT（ System Under Test：テスト対象システム）で、サポート対象の任意のオペレーティングシステムが実行され、JVM がインストールされています。 JVM は、Java で実装されている SPECpower_ssj2008 ワークロードを実行するために必要な環境を提供します。もう 1 台のコンピュータは、CCS （Collect and Control System：収集および制御システム）で、ベンチマークの動作を制御し、レポートに使用する電力、パフォーマンス、および温度のデータを取得します。左の図は、このフレームワークの各コンポーネントの概要を示

* SPEC®、SPECpower_ssj2008® および SPEC ロゴは Standard Performance Evaluation Corporation（SPEC）の登録商標です。

(14)

ベンチマーク結果

2009 年 6 月、1 基の Intel Xeon L3360 プロセッサおよび 4 GB の PC2-6400E DDR2-SDRAM メモリの構成で PRIMERGY TX100 S1 を測定しました。測定には、Windows Server 2008 Enterprise x64 Edition SP2 および Oracle JRockit(R) 6 P28.0.0 JVM を使用しました。

Intel Xeon L3360 プロセッサを搭載した PRIMERGY TX100 S1 は、1 ソケットサーバクラスで世界記録の 1,500 overall ssj_ops/watt を達成しました。これはそれまでの記録を 17.8 ％上回るものです*。同一プロセッサで測定した PRIMERGY TX150 S6 は、ssj_ops のスループットが低くなりました。これは古いバージョンの JRockit(R) JVM を使用したことが原因です。PRIMERGY TX100 S1 が SPECpower_ssj2008 で優れた結果を出したのは、すべての負荷レベルで低消費電力が実現され、かつ Oracle JRockit(R) 6 P28.0.0 JVM の ssj_ops のスループットが向上したためと考えられます。左の図は、上記の PRIMERGY TX100 S1 の測定結果のグラフを示しています。赤横棒は、グラフの y 軸で示された各負荷レベルに対する電力性能比（上の x 軸：ssj_ops/watt ）を表しています。青線は、小さなダイヤで示された各負荷レベルにおける平均消費電力（下の x 軸：W）が描く曲線を表しています。グラフでは、100 ％からアクティブアイドルまでの 10 ％刻みの各ターゲット負荷レベルで、サーバの効率が低下していく様子が示されています。縦黒線は、PRIMERGY TX100 S1 の出したベンチマーク結果、 1,500 overall ssj_ops/watt を表しています。これは、各測定におけるトランザクションスループット合計を各測定での平均消費電力合計で割ったものです。 * 上記の競争力のあるベンチマーク結果は 2009 年 6 月 17 日時点で公開された結果を反映しています。上記の比較は、最もエネルギー効率の高い１ソケットサーバの結果に基づいています。最新の SPECpower_ssj2008 によるベンチマーク結果については、http://www.spec.org/power_ssj2008/results を参照してください。

(15)

次の表は、測定結果の各負荷レベルにおける ssj_ops、平均消費電力（W 単位）、および結果のエネルギー効率の詳細情報です。 パフォーマンス 電力 エネルギー効率 目標負荷 ssj_ops 平均電力（W） ssj_ops/watt 100 ％ 212,779 94.7 2,247 90 ％ 193,029 91.2 2,117 80 ％ 169,252 85.6 1,977 70 ％ 148,628 80.3 1,850 60 ％ 128,358 75.5 1,701 50 ％ 107,052 70.7 1,514 40 ％ 86,012 66.4 1,296 30 ％ 63,953 62.0 1,032 20 ％ 42,036 57.2 735 10 ％ 21,366 52.1 410 アクティブアイドル 0 46.2 0 ∑ssj_ops / ∑power = 1,500 サーバは、電力性能比の点で性能を最大限引き出せるようにチューニングされました。 2GB（2 枚）のメモリは、利用可能な各メモリチャネルの 1 スロットずつに挿し、最小の電力消費で最高のパフォーマンスを出せるようになっています。この構成により、利用可能なメモリ帯域幅を最大限に活用し、同等のパフォーマンスを達成できる DIMM 4 枚構成より消費電力を抑えることができます。ハードウェア構成で最も重要なのは、適切なプロセッサの選択です。プロセッサは、メモリサブシステムの次に電力を消費する部品です。 PRIMERGY TX100 S1 では、TDP（Thermal Design Power：熱設計電力） 65 W のクアッドコア Intel Xeon L3360 プロセッサ搭載時に最高の効率を示すスコアが出ました。

(16)

ベンチマーク環境

 ここに示す SPECpower_ssj2008 測定結果は、次のハードウェアおよびソフトウェア構成の PRIMERGY TX100 S1 で実行され、ZES Zimmer LMG95 電力アナライザを使用して測定されました。 ハードウェア モデル PRIMERGY TX100 S1 プロセッサ（TDP） Intel Xeon L3360（65 W）チップ数 1 チップ、4 コア／チッププライマリーキャッシュ 32 KB（命令） + 32 KB（データ）オンチップ／コアセカンダリーキャッシュ 12 MB（I+D）オンチップ／チップ、6 MB 共有／2 コアその他のキャッシュなしメモリ 2 GB PC2-6400E DDR2-SDRAM x 2 枚ネットワークイン

ターフェース 1 GBit LAN Intel 82566DM-2 ギガビットネットワーク接続（オンボード）（1 基）ディスクサブシス

テム

内蔵 SATA コントローラー（1 基）

3.5 インチ SATA ディスク、250 GB、7.2 krpm、JBOD（1 台）電源ユニット 300 W Fujitsu Technology Solutions S26113-E548-V50-01（1 基） ソフトウェア

オペレーティング

システム Windows Server 2008 Enterprise x64 Edition SP2 JVM バージョン Oracle JRockit(R) 6 P28.0.0

（ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64） JVM アフィニティ start /affinity [0x3,0xC]

JVM オプション -Xms1625m -Xmx1625m -Xns1400m -XXaggressive -Xlargepages -Xgc:genpar -XXca llprofiling -XXgcthreads=2 -XXtlasize:min=4k,preferred=1024k

(17)

StorageBench

ベンチマークの説明

ディスクサブシステムの能力を評価するために、富士通テクノロジー・ソリューションズは StorageBench というベンチマークを開発しました。StorageBench は、システムに接続されている異なるストレージシステムを比較することができます。このベンチマークでは、インテルで開発された Iometer という測定ツールと、実際の顧客アプリケーションで発生する負荷プロファイルを組み合わせ、測定シナリオを定義しました。 測定ツール 2001 年末以降、Iometer は http://SourceForge.net のプロジェクトとなり、さまざまなプラットフォームに移植され、国際的な開発者グループによって強化されています。Iometer は、Windows のユーザーインターフェースとさまざまなプラットフォームで利用できる、いわゆる「dynamo」で構成されています。この数年で、これら 2 つのコンポーネントは、 http://www.iometer.org/ または、 http://sourceforge.net/projects/iometer から「インテルオープンソースライセンス」でダウンロードできるようになりました。 Iometer は、IO サブシステムへのアクセスについて実際のアプリケーションの動作を再現することができます。このため、特に、使用するブロックサイズ、シーケンシャルリード／ライト、ランダムリード／ライト、およびこれらの組み合わせなど、アクセスの種類を設定できます。また、同時アクセス数（「未処理 IO」）も設定できます。その結果、Iometer は 1 秒あたりのスループット、1 秒あたりのトランザクション数、各アクセスパターンの平均応答時間などの基本的なパラメーターを含むカンマで区切られた.csv ファイルを生成します。この方法により、特定のアクセスパターンを使ってさまざまなサブシステムの性能を比較できます。 Iometer は、ファイルシステムを使用して、サブシステムにアクセスできるばかりでなく、いわゆる RAW デバイスにもアクセスできます。 Iometer では、さまざまなアプリケーションのアクセスパターンをシミュレーションおよび測定できますが、オペレーティングシステムのファイルキャッシュは考慮されません。また、オペレーションは 1 つのテストファイル上のブロックで行われます。 負荷プロファイル アプリケーションがマスストレージシステムにアクセスする方法は、ストレージシステムのパフォーマンスに多大な影響を及ぼします。各種アプリケーションのさまざまなアクセスパターンの例： アプリケーション アクセスパターン データベース（データ転送）ランダム、67 ％リード、33 ％ライト、8 KB（SQL Server）データベース（ログファイル）シーケンシャル、100 ％ライト、64 KB ブロックバックアップシーケンシャル、100 ％リード、64 KB ブロックリストアシーケンシャル、100 ％ライト、64 KB ブロックビデオストリーミングシーケンシャル、100 ％リード、ブロック ≥ 64 KB ファイルサーバランダム、67 ％リード、33 ％ライト、64 KB ブロック Web サーバランダム、100 ％リード、64 KB ブロックオペレーティングシステムランダム、40 ％リード、60 ％ライト、ブロック ≥ 4 KB ファイルコピーランダム、50 ％リード、50 ％ライト、64 KB ブロックこれから次の 4 つの独特なプロファイルが導き出されました。 負荷プロファイル アクセス アクセスパターン ブロック サイズ 未処理 IO 負荷 ツール リードライトストリーミングシーケンシャル 100 ％ 64 KB 3 Iometer リストアシーケンシャル 100 ％ 64 KB 3 Iometer データベースランダム 67 ％ 33 ％ 8 KB 3 Iometer ファイルサーバランダム 67 ％ 33 ％ 64 KB 3 Iometer 4 つのプロファイルはすべて Iometer で生成されました。

(18)

比較できる測定結果を得るためには、再現可能な同一の環境ですべての測定を実行することが重要です。そのため StorageBench は上記の負荷プロファイルに加えて次の規則に基づいています。

 実際の顧客構成で RAW デバイスを使用するのは例外的な状況のみであるため、内蔵ディスクのパフォーマンス測定は常にファイルシステムを使用したディスク上で実行されます。高いパフォーマンスが他のファイルシステムや RAW デバイスで実現できる場合でも、Windows では NTFS が使用され、Linux では ext3 が使用されます。

 ハードディスクは、コンピュータシステムで最もエラーが発生しやすいコンポーネントです。ハードディスクの故障によるデータの損失をなくすためにサーバシステムで RAID コントローラーが使用される理由はここにあります。ここでは、複数のハードディスクを組み合わせて「Redundant Array of Independent Disks」（RAID）を形成し、1 つのハードディスクが故障した場合でもすべてのデータが維持されるように（RAID 0 を除く）すべてのデータを複数のハードディスクに分散させます。ハードディスクをアレイで編成する最も一般的な方法は、RAID レベル、RAID 0、RAID 1、RAID 5、RAID 6、 RAID 10、RAID 50、RAID 60 です。各種 RAID アレイの基本については、資料パフォーマンスレポー

ト - PRIMERGY 用モジュラー RAID を参照してください。

ディスクの数および装着されているコントローラーに応じて、 RAID 構成を変えながら PRIMERGY サーバの StorageBench を測定しました。2 台のハードディスクを装着できるシステムでは RAID 1 および RAID 0 を使用し、3 台以上では RAID 1E および RAID 5 を使用します。適用可能な場合はサポートされていることを条件にさらに上位の RAID レベルを使用します。  ハードディスクのサイズに関係なく、サイズが 8 GB の測定ファイルを常に測定に使用しています。  I/O サブシステムの効率の評価では、プロセッサパフォーマンスおよびメモリ構成は、今日のシステムでは大きな要因ではありません。通常、考えられるボトルネックは CPU やメモリではなく、ハードディスクや RAID コントローラーに影響を及ぼします。したがって、CPU やメモリの構成を数々変えながら StorageBench で解析する必要はありません。 測定結果 負荷プロファイルごとに、StorageBench は次のようにさまざまな主要指標を提供します。1 秒あたりのデータ転送量をメガバイト数で表した（MB/s）「データスループット」、1 秒あたりの I/O オペレーション数（IO/s）の「トランザクションレート」、およびミリ秒（ms）単位の「待機時間」（「平均アクセス時間」）。シーケンシャルな負荷プロファイルでは、データスループットが通常の指標であり、小規模なブロックサイズを使用するランダムな負荷プロファイルでは、通常、トランザクションレートが使用されます。スループットおよびトランザクションレートは互いに直接比例し、次の式に従って計算できます。データスループット [MB/s] = トランザクションレート [ディスク-I/O /s] × ブロックサイズ [MB] トランザクションレート [ディスク-I/O /s] = データスループット [MB/s] / ブロックサイズ [MB]

(19)

ベンチマークの結果

PRIMERGY TX100 S1 サーバには、オンボード SATA ICH9R コントローラーが搭載されています。このコントローラーは、Intel ICH9R チップセットとしてサーバのマザーボードに直接実装され、RAID スタックはサーバの CPU によって認識されます。このコントローラーには、コントローラーキャッシュがありません。このサーバでは、最大 4 台の 3.5 インチローカルハードディスクをサポートしており、RAID レベル 0、1、および 10 を構成できます。このコントローラーには、さまざまな SATA ハードディスクを接続できます。必要なパフォーマンスに応じて、適切なディスクサブシステムを選択できます。このサーバでは、次のハードディスクを選択できます。  3.5 インチ SATA ハードディスク、容量 160 GB、250 GB、500 GB（7.2 krpm）可用性の観点からどのようにデータが扱われるかは、RAID アレイによって決まります。各 RAID アレイ内でデータが転送される速さは、ハードディスクのデータスループットによって大きく異なります。RAID アレイで測定用に構成されるハードディスクの数は、RAID レベルに応じて決定されます。ハードディスクキャッシュはディスク I/O パフォーマンスに影響を及ぼします。多くの場合、この機能は電源障害時の安全上の問題により無効化されます。しかし、ハードディスクの製造元は、書き込みパフォーマンスの向上のために組み込んでいます。I/O アクセス用のキャッシュは圧倒的に大きく、電源障害時の潜在的なリスク（データの損失）がメインメモリには存在します。これは、オペレーティングシステムによって管理されます。データの損失を防止するには、システムに無停電電源装置（UPS）を装備することを推奨します。テストでは、2 台の SATA ハードディスクを RAID 1 として構成するか、1 台の SATA ハードディスクをシングルディスク（SD）として構成し、コントローラーに接続しています。測定では、PRIMERGY TX100 S1 で現在利用可能なすべてのハードディスクタイプを解析しました。RAID 1 での各ハードディスクタイプのスループットを種々のアクセスパターンを使用して比較します。コントローラーキャッシュがないため、測定ではディスクキャッシュの影響のみを測定し、ハードディスク比較の測定は、ディスクキャッシュありとなしで実施しました。下図は、キャッシュ設定によってどのようにスループットが変化するのかを示しています。64 KB ブロックのシーケンシャルリードのスループットは、キャッシュ設定によって左右されません。RAID 1 は、シングルディスク構成の場合と比べてスループット値はほぼ同じですが、データの冗長性の点で利点があります。これとは対照的に、64 KB ブロックのシーケンシャルライトのスループットは、キャッシュ設定に大きく左右されます。ディスクキャッシュを有効にすると、シングルディスク構成の書き込みスループットは約 15 倍に向上し、RAID 1 構成の書き込みスループットは約 11 倍に向上します。この書き込みスループットの大幅な向上は、ハードディスクへの最適化された書き込みアクセスおよび待ち時間の短縮から説明できます。ディスクキャッシュを有効にすると、ランダムアクセスのスループットが向上します。ただし、これはシーケンシャルライトのスループットの向上ほど顕著ではありません。64 KB ブロックのランダムアクセスでは、シングルディスク構成で約 16%、RAID 1 では約 23% スループットが向上します。 8 KB ブロックのランダムアクセスの場合、スループットの向上は 64 KB ブロックの場合より若干高くなり、シングルディスク構成では約 24%、RAID 1 では約 29% 向上します。

(20)

オンボード SATA RAID コントローラーは、ユーザーにとってコストパフォーマンスに優れたソリューションオプションです。このオンボード SATA コントローラーは、Intel ICH9R チップセットとしてサーバのマザーボードに直接実装されます。最高のパフォーマンスを実現するために、特に SATA ハードディスクを使用する場合やコントローラーキャッシュを持たないコントローラーを使用する場合は、ハードディスクのキャッシュを有効にすることをお勧めします。使用するディスクの種類によっては、パフォーマンスが 15 倍向上します。ハードディスクのキャッシュを有効にする場合は、UPS の使用をお勧めします。

ベンチマーク環境

 ここで説明したすべての測定は、下記の一覧で示したハードウェアとソフトウェアのコンポーネントを使用して実行されました。 コンポーネント 詳細サーバ PRIMERGY TX100 S1

オペレーティングシステム Windows Server 2008 Enterprise Edition

バージョン： 6.0.6001 Service Pack 1 ビルド 6001 ファイルシステム NTFS 測定ツール Iometer 27.07.2006 測定データ 8 GB の測定ファイルオンボード SATA コントローラー Intel ICH9R BIOS： 6.00.R1.01 SATA RAID モード

ハードディスク SATA、3.5 インチ、7.2 krpm Western Digital WD1600AAJS-07M0A0、160 GB

(21)

納品までの時間は在庫状況によって異なります。技術仕様は予告なく変更されることがあります。誤記脱漏は随時訂正されます。示しているすべての販売条件は（TC）ユーロでの希望価格で VAT を除く価格です（別途記載ない限り）。ハードウェアおよびソフトウェアの名前はすべて、発行部門： Enterprise Products PRIMERGY Server インターネット： http://ts.fujitsu.com/primergy エクストラネット： http://partners.ts.fujitsu.com/com/products/serv

お問い合わせ先

PRIMERGY のパフォーマンスとベンチマーク mailto:primergy.benchmark@ts.fujitsu.com