• 検索結果がありません。

パフォーマンスレポート PRIMERGY TX100 S1

N/A
N/A
Protected

Academic year: 2021

シェア "パフォーマンスレポート PRIMERGY TX100 S1"

Copied!
21
0
0

読み込み中.... (全文を見る)

全文

(1)

要約

このドキュメントでは、PRIMERGY TX100 S1 で実行したベンチマークの概要について説明します。ベンチ マーク結果に加え、ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています。 目次 ドキュメントの履歴 ... 2 製品データ ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 10 SPECpower_ssj2008 ... 13 StorageBench ... 17 関連資料... 21 お問い合わせ先 ... 21 ページ数 21

パフォーマンスレポート

PRIMERGY TX100 S1

(2)

ドキュメントの履歴

バージョン 3.0 ベンチマークの章を含むレポートの初版  SPECcpu2006 以下で測定: o Celeron 430 および 450

o Pentium Dual-Core E5200、E5400、E6300、および E6500 o Core 2 Duo E7300、E7400、および E7600

o Xeon E3110、E3120、X3220、X3330、L3360、および X3380  SPECjbb2005 Xeon X3380 で測定  SPECpower_ssj2008 Xeon L3360 および SATA 3.5 インチ 7200rpm(1 台)で測定  StorageBench オンボード SATA ICH9R コントローラーで測定

(3)

製品データ

PRIMERGY TX100 S1 は、低消費電力を実現した 1 ソケットのタワーサーバです。Intel 3200 チップセット、 Celeron、Pentium Dual-Core、Core 2 Duo、または Xeon のいずれかのプロセッサ、最大 8 GB の PC2-6400 DDR2-SDRAM、使用プロセッサに応じて周波数 667、800、1067、または 1333 MHz のバス、Intel 82566DM 1 Gbit LAN コントローラー、Intel ICH9R 6 ポート SATA コントローラー、SAS RAID コントローラー(オプ ション)、最大 4 台の 3.5 インチ SATA ハードディスク、および PCI スロット 4 本(PCIe x8(2 本)、PCIe x4 (1 本)、PCI 32 ビット/33 MHz(1 本))が搭載されています。

(4)

SPECcpu2006

ベンチマークの説明

SPECcpu2006 は、整数演算および浮動小数点演算のシステム性能を測定するベンチマークです。これは、 12 本のアプリケーションからなる整数演算テストセット、および 17 本 のアプリケーションからなる浮動小 数点演算テストセットで構成されています。これらのアプリケーションは大量の演算を実行し、 CPU / メモ リを集中的に使用します。ディスク I/O やネットワークなど、他のコンポーネントについては、このベンチ マークでは測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード として利用可能で、実際のベンチマークの前にコンパイルする必要があります。したがって、使用するコン パイラーのバージョンやその最適化設定が測定結果に影響を与えます。 SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。最初の方法(SPECint2006 および SPECfp2006)は、1 つのタスクの完了に必要な時間を評価します。次の方法(SPECint_rate2006 および SPECfp_rate2006)は、スループット(並列処理できるタスク数)を評価します。いずれの方法も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これは、コンパイラー最適化を使用するかどう かという点で異なります。「ベース」値は公開時に常に用いられますが、「ピーク」値はオプションです。 ベンチマーク 演算 タイプ コンパイラー 最適化 測定結果 アプリケーション SPECint2006 整数 ピーク アグレッシブ 速度 単体実行 SPECint_base2006 整数 ベース 標準 SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行 SPECint_rate_base2006 整数 ベース 標準 SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行 SPECfp_base2006 浮動小数点 ベース 標準 SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行 SPECfp_rate_base2006 浮動小数点 ベース 標準 結果は、個々のベンチマークで得られた正規化比の幾何平均を使用しています。算術平均と比較して、幾何 平均のほうが、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムが基 準システムと比較してどの程度高速に実行されるのかを測定することです。基準システムの SPECint_base2006、 SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結果が、値「1」と判定さ れたとします。このとき、たとえば SPECint_base2006 の値 2 は、測定システムがこのベンチマークを基準 システムよりも約 2 倍の性能で実行したことを意味します。SPECfp_rate_base2006 の値 4 は、測定対象シ ステムが基準システムよりも、約 4/[ベースコピー数] 倍の性能でこのベンチマークを実行したことを意味し ます。ここで、「ベースコピー数」はベンチマークで実行された並行インスタンスの数です。 弊社は、SPEC の公開用に、 SPECcpu2006 を測定したデータのすべてを提出しているわけではありません。 このため、すべての結果が SPEC の Web サイトに表示されるわけではありません。弊社は、すべての測定 値のログデータをアーカイブしているので、測定の内容に関していつでも証明できます。

SPEC®、SPECint®、SPECfp®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC) の登録商標です。

(5)

ベンチマーク結果

次の 7 種類のプロセッサバージョンで PRIMERGY TX100 S1 を測定しました。  Celeron 430 および 450

(Conroe、1 コア/チップ)

 Pentium Dual-Core E5200 および E5400 (Allendale、2 コア/チップ)

 Pentium Dual-Core E6300 および E6500 (Wolfdale、2 コア/チップ)

 Core 2 Duo E7300、E7400、および E7600 (Wolfdale、2 コア/チップ)

 Xeon E3110 および E3120 (Wolfdale、2 コア/チップ)  Xeon X3220 (Kentsfield、4 コア/チップ)  Xeon X3330、L3360、および X3380 (Yorkfield、4 コア/チップ) 結果は次の表のとおりです。ベンチマークプログラムは、インテル C++/Fortran コンパイラー 11.0 でコンパ イルし、SUSE Linux Enterprise Server 10 SP2(64 ビット)で実行しました。

プロセッサ コア GHz L2 キャッシュ FSB TDP SPECint_base2006 SPECint2006 Celeron 430 1 1.80 0.5 MB/チップ 800 MHz 35 W 11.6 12.7 Celeron 450 1 2.20 0.5 MB/チップ 800 MHz 35 W 13.3 14.6 プロセッサ コア GHz L2 キャッシュ FSB TDP SPECint_rate_base2006 SPECint_rate2006 Celeron 430 1 1.80 0.5 MB/チップ 800 MHz 35 W Celeron 450 1 2.20 0.5 MB/チップ 800 MHz 35 W Pentium Dual-Core E5200 2 2.50 2 MB/チップ 800 MHz 65 W 31.4 33.4 Pentium Dual-Core E5400 2 2.70 2 MB/チップ 800 MHz 65 W 33.0 35.0 Pentium Dual-Core E6300 2 2.80 2 MB/チップ 1067 MHz 65 W 35.1 37.4 Pentium Dual-Core E6500 2 2.93 2 MB/チップ 1067 MHz 65 W 36.3 38.5

Core 2 Duo E7300 2 2.67 3 MB/チップ 1067 MHz 65 W 36.2 38.7 Core 2 Duo E7400 2 2.80 3 MB/チップ 1067 MHz 65 W 37.2 39.9 Core 2 Duo E7600 2 3.07 3 MB/チップ 1067 MHz 65 W 39.6 42.2

Xeon E3110 2 3 6 MB/チップ 1333 MHz 65 W 43.6 46.9 Xeon E3120 2 3.17 6 MB/チップ 1333 MHz 65 W 45.3 48.7 Xeon X3220 4 2.40 8 MB/チップ 1067 MHz 105 W 61.4 65.7 Xeon X3330 4 2.67 6 MB/チップ 1333 MHz 95 W 65.6 69.7 Xeon L3360 4 2.83 12 MB/チップ 1333 MHz 65 W 75.9 81.3 Xeon X3380 4 3.17 12 MB/チップ 1333 MHz 95 W 81.7 87.3

(6)
(7)

プロセッサ コア GHz L2 キャッシュ FSB TDP SPECfp_base2006 SPECfp2006 Celeron 430 1 1.80 512 KB/チップ 800 MHz 35 W 12.3 12.7 Celeron 450 1 2.20 512 KB/チップ 800 MHz 35 W 13.8 14.2 プロセッサ コア GHz L2 キャッシュ FSB TDP SPECfp_rate_base2006 SPECfp_rate2006 Celeron 430 1 1.80 512 KB/チップ 800 MHz 35 W Celeron 450 1 2.20 512 KB/チップ 800 MHz 35 W Pentium Dual-Core E5200 2 2.50 2 MB/チップ 800 MHz 65 W 26.0 26.9 Pentium Dual-Core E5400 2 2.70 2 MB/チップ 800 MHz 65 W 26.9 27.8 Pentium Dual-Core E6300 2 2.80 2 MB/チップ 1067 MHz 65 W 29.2 30.1 Pentium Dual-Core E6500 2 2.93 2 MB/チップ 1067 MHz 65 W 29.9 30.8

Core 2 Duo E7300 2 2.67 3 MB/チップ 1067 MHz 65 W 29.2 30.1 Core 2 Duo E7400 2 2.80 3 MB/チップ 1067 MHz 65 W 29.9 30.8 Core 2 Duo E7600 2 3.07 3 MB/チップ 1067 MHz 65 W 31.2 32.2

Xeon E3110 2 3 6 MB/チップ 1333 MHz 65 W 33.4 34.6 Xeon E3120 2 3.17 6 MB/チップ 1333 MHz 65 W 34.4 35.7 Xeon X3220 4 2.40 8 MB/チップ 1067 MHz 105 W 42.1 43.4 Xeon X3330 4 2.67 6 MB/チップ 1333 MHz 95 W 45.2 46.6 Xeon L3360 4 2.83 12 MB/チップ 1333 MHz 65 W 49.4 51.2 Xeon X3380 4 3.17 12 MB/チップ 1333 MHz 95 W 51.8 53.8

(8)
(9)

ベンチマーク環境

 SPECcpu2006 での測定は、すべて次のハードウェアおよびソフトウェア構成の PRIMERGY TX100 S1 で実 行されました。 ハードウェア モデル PRIMERGY TX100 S1 CPU Celeron 430、および 450

Pentium Dual-Core E5200、E5400、E6300、および E6500 Core 2 Duo E7300、E7400、および E7600

Xeon E3110、E3120、X3220、X3330、L3360、および X3380

CPU 数

Celeron 430、450: 1 チップ、1 コア、1 コア/チップ Pentium Dual-Core E5200、E5400、E6300、E6500、Core 2 Duo E7300、E7400、 E7600、Xeon E3110、E3120: 1 チップ、2 コア、2 コア/チップ Xeon X3220、X3330、L3360、X3380: 1 チップ、4 コア、4 コア/チップ プライマリー キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ (コアあたり) セカンダリー キャッシュ Celeron 430、450: 512KB(I+D)オンチップ(チップあたり) Pentium Dual-Core E5200、E5400、E6300、E6500:

2 MB(I+D)オンチップ(チップあたり) Core 2 Duo E7300、E7400、E7600: 3 MB(I+D)オンチップ(チップあたり) Xeon E3110、E3120、X3330: 6 MB(I+D)オンチップ(チップあたり) Xeon X3220: 8 MB(I+D)オンチップ(チップあたり) Xeon L3360、X3380: 12 MB(I+D)オンチップ(チップあたり) その他の キャッシュ なし メモリ 4 x 2 GB PC2-6400 DDR2-SDRAM ソフトウェア オペレーティング

システム SUSE Linux Enterprise Server 10 SP2(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 11.0

(10)

SPECjbb2005

ベンチマークの説明

SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークで す。これは、本質的に SPECjbb2000 を更新したバージョンで、主な違いは次のとおりです。  トランザクションは、多様な機能範囲を対象とするため、より複雑になっています。  ベンチマークのワーキングセットが、システムの負荷の増大に対応して拡大されました。  SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実際との高い近似性を 得ることができます。 ソフトウェア側では、SPECjbb2005 は JVM、JIT(ジャストインタイム)コンパイラー、ガベージコレクション、 スレッドなどのオペレーティングシステムの機能を評価します。ハードウェアに関する限り、SPECjbb2005 は CPU およびキャッシュの効率、メモリサブシステム、共有メモリシステム(SMP)のスケーラビリティを 測定します。ディスクおよびネットワーク I/O は無関係です。 SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層のクライアント/サーバ システムをエミュレートしたもので、特に中間層が強調されています。  クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベー スへの OLTP アクセスを思考時間ゼロで行います。  中間層は、ビジネスプロセスおよびデータベースの更新を実装します。  データベースは、データ管理を担当し、メモリ内の Java オブジェクトによりエミュレートされます。 トランザクションのログ記録は XML ベースで実装されます。 このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフォー マンスが測定されるため、大規模なハードウェアの設置は不要となり、SPECjbb2005 の異なるシステム間の 結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記述されています。 SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で す。 スケーリングの単位は、約 25 MB の Java オブジェクトからなる1つのウェアハウスです。ウェアハウスあ たり 1 つの Java スレッドがこれらのオブジェクトに対しオペレーションを実行します。これらのビジネス オペレーションは 、TPC-C の次の項目を前提としています。  新規オーダーエントリー  支払  オーダーステータスの照会  納入  在庫レベル監視  顧客レポート SPECjbb2005 と TPC-C が共通して持っている機能は、これだけです。2 つのベンチマーク結果を比較する ことはできません。 SPECjbb2005 には、次の 2 つの性能指標があります。  bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーションの 性能です。  bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。

SPEC®、SPECjbb®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC)の登録商標 です。

(11)

SPECjbb2005 のさまざまな結果を比較する場合には、両方の性能指標を考慮する必要があります。 ベンチマーク測定が準拠すべき以下のルールは、この性能指標の基となるものです。 ベンチマーク測定は、ウェアハウス数(つまりスレッド数)が増加する一連の測定ポイントで構成され、各 ケースでウェアハウスが 1 だけ増加します。測定は、1 ウェアハウスで開始され、2*MaxWh まで(ただし、 尐なくとも 8 ウェアハウス)行います。MaxWh は、ベンチマークで予想される、秒あたりの最高オペレー ションレートでのウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます。

性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定済みオペレーション 速度の算術平均です。

ベンチマーク結果

2009 年 6 月に、1 基の Xeon X3380 プロセッサと 8 GB PC2-6400 DDR2-SDRAM のメモリ構成を使用して、 PRIMERGY TX100 S1 で測定を行いました。測定には、Windows Server 2008 Enterprise x64 Edition SP2 を 使用しました。Oracle から提供されている JRockit(R) 6 R28.0.0 の 2 つのインスタンスを測定用 JVM とし て使用しました。 PRIMERGY TX100 S1 は、すべての 1 プロセッサ サーバの中で最高の成績を出し、このカテゴリのそれまで の記録を 4 %も上回りました。どちらの測定でも、2~4 ウェアハウスで測定されたすべての値がベンチマー ク結果に組み込まれています。  上記の競争力のあるベンチマーク結果は 2009 年 8 月 5 日時点で公開された結果を反映しています。上記のグラフは、 IBM および富士通が現在出荷している 1 プロセッサ サーバーのうちベストパフォーマンスのもの同士を比較したもの です。最新の SPECjbb2005 ベンチマーク結果については、http://www.spec.org/jbb2005/results. を参照してくださ い。

(12)

ソース:http://www.spec.org/jbb2005/results(2009 年 8 月 5 日現在)

ベンチマーク環境

 SPECjbb2005 でのすべての測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY TX100 S1 で 実行されました。 ハードウェア モデル PRIMERGY TX100 S1 CPU Xeon X3380 チップ数 1 チップ、4 コア (チップあたり 4 コア) プライマリーキャッ シュ 32 KB(命令) + 32 KB(データ)オンチップ (コアあたり) セカンダリーキャッ シュ 12 MB(I+D)オンチップ (チップあたり) その他のキャッシュ なし メモリ 4×2 GB PC2-6400 DDR2-SDRAM ソフトウェア オペレーティング

システム Windows Server 2008 Enterprise x64 Edition SP2

JVM バージョン (ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64) Oracle JRockit(R) 6 P28.0.0

(13)

SPECpower_ssj2008

*

ベンチマークの説明

SPECpower_ssj2008 は、サーバクラスのコンピュータを対象とした、消費電力とパフォーマンスの特性を 評価する業界標準の SPEC ベンチマークです。 SPEC は、パフォーマンス測定の標準を定めたのと同じ手法 で、SPECpower_ssj2008 において、サーバの消費電力測定の標準を定義しました。 ベンチマークのワークロードには、典型的なサーバサイド Java ビジネスアプリケーションがシミュレートさ れます。 ワークロードはスケーラブルで、マルチスレッド化されており、様々なオペレーション環境で利用 でき、低コストで実行できます。 ワークロードは CPU、キャッシュ、メモリ階層および SMP(symmetric multiprocessor systems:対称型マルチプロセシングシステム)のスケーラビリティを実行/テストし、同時 に JVM (Java Virtual Machine:Java 仮想マシン)、JIT (Just In Time:ジャストインタイム)コンパイラー、 ガベージコレクション、スレッド、およびオペレーティングシステムのいくつかの機能を使用します。 SPECpower_ssj2008 では、100 %からアクティブアイ ドルまで 10 %区切りで、さまざまなパフォーマンスレベ ルにおける一定時間の消費電力をレポートします。 段階 的なワークロードは、サーバの処理負荷および電力消費 が、日や週により大きく変化することを表しています。 全 てのレベルにおける電力効率指標を計算するには、各セ グメントで測定したトランザクションスループットを合 計し、各セグメントの平均消費電力の合計で割ります。 結 果は、overall ssj_ops/watt という性能指数です。この値 から測定対象サーバのエネルギー効率に関する情報が得 られます。 測定標準が定義されていることにより、 SPECpower_ssj2008 で測定される値を他の設定やサー バ と 比 較 す る こ と が で き ま す 。 右 の 図 は 、 SPECpower_ssj2008 の標準的な結果のグラフです。 ベンチマークは、さまざまなオペレーティン グシステムおよびハードウェアアーキテク チャーで実行され、大がかりなクライアント やストレージインフラストラクチャーを展開 する必要がありません。 SPEC 準拠テストの 最小構成は、ネットワークで接続された 2 台 のコンピュータと、電力アナライザと温度セン サーが 1 台ずつです。 コンピュータの 1 台 は、SUT( System Under Test:テスト対象 システム)で、サポート対象の任意のオペレー ティングシステムが実行され、JVM がインス トールされています。 JVM は、Java で実装 されている SPECpower_ssj2008 ワークロー ドを実行するために必要な環境を提供します。 もう 1 台のコンピュータは、CCS (Collect and Control System:収集および制御システム) で、ベンチマークの動作を制御し、レポート に使用する電力、パフォーマンス、および温 度のデータを取得します。 左の図は、このフ レームワークの各コンポーネントの概要を示

* SPEC®、SPECpower_ssj2008® および SPEC ロゴは Standard Performance Evaluation Corporation(SPEC)の登録 商標です。

(14)

ベンチマーク結果

2009 年 6 月、1 基の Intel Xeon L3360 プロセッサおよび 4 GB の PC2-6400E DDR2-SDRAM メモリの構成 で PRIMERGY TX100 S1 を測定しました。 測定には、Windows Server 2008 Enterprise x64 Edition SP2 お よび Oracle JRockit(R) 6 P28.0.0 JVM を使用しました。

Intel Xeon L3360 プロセッサを搭載した PRIMERGY TX100 S1 は、1 ソケットサーバクラスで世界記録の 1,500 overall ssj_ops/watt を達成しました。これはそれまでの記録を 17.8 %上回るものです*。同一プロセッサで 測定した PRIMERGY TX150 S6 は、ssj_ops のスループットが低くなりました。これは古いバージョンの JRockit(R) JVM を使用したことが原因です。PRIMERGY TX100 S1 が SPECpower_ssj2008 で優れた結果を 出したのは、すべての負荷レベルで低消費電力が実現され、かつ Oracle JRockit(R) 6 P28.0.0 JVM の ssj_ops のスループットが向上したためと考えられます。 左の図は、上記の PRIMERGY TX100 S1 の測定結果のグラフを示しています。 赤横棒は、グラフの y 軸で示された各 負荷レベルに対する電力性能比(上の x 軸:ssj_ops/watt )を表しています。青 線は、小さなダイヤで示された各負荷 レベルにおける平均消費電力(下の x 軸:W)が描く曲線を表しています。 グラフでは、100 %からアクティブア イドルまでの 10 %刻みの各ターゲット 負荷レベルで、サーバの効率が低下し ていく様子が示されています。縦黒線 は、PRIMERGY TX100 S1 の出した ベ ン チ マ ー ク 結 果 、 1,500 overall ssj_ops/watt を表しています。これは、 各測定におけるトランザクションスルー プット合計を各測定での平均消費電力 合計で割ったものです。 * 上記の競争力のあるベンチマーク結果は 2009 年 6 月 17 日時点で公開された結果を反映しています。 上記の比較は、 最もエネルギー効率の高い1ソケットサーバの結果に基づいています。 最新の SPECpower_ssj2008 によるベンチマー ク結果については、http://www.spec.org/power_ssj2008/results を参照してください。

(15)

次の表は、測定結果の各負荷レベルにおける ssj_ops、平均消費電力(W 単位)、および結果のエネルギー効 率の詳細情報です。 パフォーマンス 電力 エネルギー効率 目標負荷 ssj_ops 平均電力(W) ssj_ops/watt 100 % 212,779 94.7 2,247 90 % 193,029 91.2 2,117 80 % 169,252 85.6 1,977 70 % 148,628 80.3 1,850 60 % 128,358 75.5 1,701 50 % 107,052 70.7 1,514 40 % 86,012 66.4 1,296 30 % 63,953 62.0 1,032 20 % 42,036 57.2 735 10 % 21,366 52.1 410 アクティブア イドル 0 46.2 0 ∑ssj_ops / ∑power = 1,500 サーバは、電力性能比の点で性能を最大限引き出せるようにチューニングされました。 2GB(2 枚)のメモ リは、利用可能な各メモリチャネルの 1 スロットずつに挿し、最小の電力消費で最高のパフォーマンスを出 せるようになっています。 この構成により、利用可能なメモリ帯域幅を最大限に活用し、同等の パフォーマン スを達成できる DIMM 4 枚構成より消費電力を抑えることができます。 ハードウェア構成で最も重要なのは、 適切なプロセッサの選択です。 プロセッサは、メモリサブシステムの次に電力を消費する部品です。 PRIMERGY TX100 S1 では、TDP(Thermal Design Power:熱設計電力) 65 W のクアッドコア Intel Xeon L3360 プロ セッサ搭載時に最高の効率を示すスコアが出ました。

(16)

ベンチマーク環境

 ここに示す SPECpower_ssj2008 測定結果は、次のハードウェアおよびソフトウェア構成 の PRIMERGY TX100 S1 で実行され、ZES Zimmer LMG95 電力アナライザを使用して測定されました。 ハードウェア モデル PRIMERGY TX100 S1 プロセッサ(TDP) Intel Xeon L3360(65 W) チップ数 1 チップ、4 コア/チップ プライマリー キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ/コア セカンダリー キャッシュ 12 MB(I+D)オンチップ/チップ、6 MB 共有/2 コア その他の キャッシュ なし メモリ 2 GB PC2-6400E DDR2-SDRAM x 2 枚 ネットワークイン

ターフェース 1 GBit LAN Intel 82566DM-2 ギガビットネットワーク接続(オンボード)(1 基) ディスクサブシス

テム

内蔵 SATA コントローラー(1 基)

3.5 インチ SATA ディスク、250 GB、7.2 krpm、JBOD(1 台) 電源ユニット 300 W Fujitsu Technology Solutions S26113-E548-V50-01(1 基) ソフトウェア

オペレーティング

システム Windows Server 2008 Enterprise x64 Edition SP2 JVM バージョン Oracle JRockit(R) 6 P28.0.0

(ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64) JVM アフィニティ start /affinity [0x3,0xC]

JVM オプション -Xms1625m -Xmx1625m -Xns1400m -XXaggressive -Xlargepages -Xgc:genpar -XXca llprofiling -XXgcthreads=2 -XXtlasize:min=4k,preferred=1024k

(17)

StorageBench

ベンチマークの説明

ディスクサブシステムの能力を評価するために、富士通テクノロジー・ソリューションズ は StorageBench と いうベンチマークを開発しました。StorageBench は、システムに接続されている異なるストレージシステムを 比較することができます。このベンチマークでは、インテルで開発された Iometer という測定ツールと、実 際の顧客アプリケーションで発生する負荷プロファイルを組み合わせ、測定シナリオを定義しました。 測定ツール 2001 年末以降、Iometer は http://SourceForge.net のプロジェクトとなり、さまざまなプラットフォームに移 植され、国際的な開発者グループによって強化されています。Iometer は、Windows のユーザーインターフェー スとさまざまなプラットフォームで利用できる、いわゆる「dynamo」で構成されています。この数年で、こ れら 2 つのコンポーネントは、 http://www.iometer.org/ または、 http://sourceforge.net/projects/iometer から 「インテルオープンソースライセンス」でダウンロードできるようになりました。 Iometer は、IO サブシステムへのアクセスについて実際のアプリケーションの動作を再現することができま す。このため、特に、使用するブロックサイズ、シーケンシャルリード/ライト、ランダムリード/ライト、 およびこれらの組み合わせなど、アクセスの種類を設定できます。また、同時アクセス数(「未処理 IO」)も 設定できます。その結果、Iometer は 1 秒あたりのスループット、1 秒あたりのトランザクション数、各アク セスパターンの平均応答時間などの基本的なパラメーターを含むカンマで区切られた.csv ファイルを生成し ます。この方法により、特定のアクセスパターンを使ってさまざまなサブシステムの性能を比較できます。 Iometer は、ファイルシステムを使用して、サブシステムにアクセスできるばかりでなく、いわゆる RAW デ バイスにもアクセスできます。 Iometer では、さまざまなアプリケーションのアクセスパターンをシミュレーションおよび測定できますが、 オペレーティングシステムのファイルキャッシュは考慮されません。また、オペレーションは 1 つのテスト ファイル上のブロックで行われます。 負荷プロファイル アプリケーションがマスストレージシステムにアクセスする方法は、ストレージシステムのパフォーマンス に多大な影響を及ぼします。各種アプリケーションのさまざまなアクセスパターンの例: アプリケーション アクセスパターン データベース(データ転送) ランダム、67 %リード、33 %ライト、8 KB(SQL Server) データベース(ログファイル) シーケンシャル、100 %ライト、64 KB ブロック バックアップ シーケンシャル、100 %リード、64 KB ブロック リストア シーケンシャル、100 %ライト、64 KB ブロック ビデオストリーミング シーケンシャル、100 %リード、ブロック ≥ 64 KB ファイルサーバ ランダム、67 %リード、33 %ライト、64 KB ブロック Web サーバ ランダム、100 %リード、64 KB ブロック オペレーティングシステム ランダム、40 %リード、60 %ライト、ブロック ≥ 4 KB ファイルコピー ランダム、50 %リード、50 %ライト、64 KB ブロック これから次の 4 つの独特なプロファイルが導き出されました。 負荷プロファイル アクセス アクセスパターン ブロック サイズ 未処理 IO 負荷 ツール リード ライト ストリーミング シーケンシャル 100 % 64 KB 3 Iometer リストア シーケンシャル 100 % 64 KB 3 Iometer データベース ランダム 67 % 33 % 8 KB 3 Iometer ファイルサーバ ランダム 67 % 33 % 64 KB 3 Iometer 4 つのプロファイルはすべて Iometer で生成されました。

(18)

比較できる測定結果を得るためには、再現可能な同一の環境ですべての測定を実行することが重要です。そ のため StorageBench は上記の負荷プロファイルに加えて次の規則に基づいています。

 実際の顧客構成で RAW デバイスを使用するのは例外的な状況のみであるため、内蔵ディスクのパフォー マンス測定は常にファイルシステムを使用したディスク上で実行されます。高いパフォーマンスが他 のファイルシステムや RAW デバイスで実現できる場合でも、Windows では NTFS が使用され、Linux では ext3 が使用されます。

 ハードディスクは、コンピュータシステムで最もエラーが発生しやすいコンポーネントです。ハード ディスクの故障によるデータの損失をなくすためにサーバシステムで RAID コントローラーが使用さ れる理由はここにあります。ここでは、複数のハードディスクを組み合わせて「Redundant Array of Independent Disks」(RAID)を形成し、1 つのハードディスクが故障した場合でもすべてのデータが 維持されるように(RAID 0 を除く)すべてのデータを複数のハードディスクに分散させます。ハード ディスクをアレイで編成する最も一般的な方法は、RAID レベル、RAID 0、RAID 1、RAID 5、RAID 6、 RAID 10、RAID 50、RAID 60 です。各種 RAID アレイの基本については、資料 パフォーマンスレポー

ト - PRIMERGY 用モジュラー RAID を参照してください。

ディスクの数および装着されているコントローラーに応じて、 RAID 構成を変えながら PRIMERGY サー バの StorageBench を測定しました。2 台のハードディスクを装着できるシステムでは RAID 1 およ び RAID 0 を使用し、3 台以上では RAID 1E および RAID 5 を使用します。適用可能な場合はサポー トされていることを条件にさらに上位の RAID レベルを使用します。  ハードディスクのサイズに関係なく、サイズが 8 GB の測定ファイルを常に測定に使用しています。  I/O サブシステムの効率の評価では、プロセッサパフォーマンスおよびメモリ構成は、今日のシステ ムでは大きな要因ではありません。通常、考えられるボトルネックは CPU やメモリではなく、ハー ドディスクや RAID コントローラーに影響を及ぼします。したがって、CPU やメモリの構成を数々 変えながら StorageBench で解析する必要はありません。 測定結果 負荷プロファイルごとに、StorageBench は次のようにさまざまな主要指標を提供します。1 秒あたりのデー タ転送量をメガバイト数で表した(MB/s)「データスループット」、1 秒あたりの I/O オペレーション数(IO/s) の「トランザクションレート」、およびミリ秒(ms)単位の「待機時間」(「平均アクセス時間」)。シーケン シャルな負荷プロファイルでは、データスループットが通常の指標であり、小規模なブロックサイズを使用 するランダムな負荷プロファイルでは、通常、トランザクションレートが使用されます。スループットおよ びトランザクションレートは互いに直接比例し、次の式に従って計算できます。 データスループット [MB/s] = トランザクションレート [ディスク-I/O /s] × ブロックサイズ [MB] トランザクションレート [ディスク-I/O /s] = データスループット [MB/s] / ブロック サイズ [MB]

(19)

ベンチマークの結果

PRIMERGY TX100 S1 サーバには、オンボード SATA ICH9R コントローラーが搭載されています。このコン トローラーは、Intel ICH9R チップセットとしてサーバのマザーボードに直接実装され、RAID スタックはサー バの CPU によって認識されます。このコントローラーには、コントローラーキャッシュがありません。この サーバでは、最大 4 台の 3.5 インチローカルハードディスクをサポートしており、RAID レベル 0、1、およ び 10 を構成できます。このコントローラーには、さまざまな SATA ハードディスクを接続できます。必要な パフォーマンスに応じて、適切なディスクサブシステムを選択できます。 このサーバでは、次のハードディスクを選択できます。  3.5 インチ SATA ハードディスク、容量 160 GB、250 GB、500 GB(7.2 krpm) 可用性の観点からどのようにデータが扱われるかは、RAID アレイによって決まります。各 RAID アレイ内で データが転送される速さは、ハードディスクのデータスループットによって大きく異なります。RAID アレイ で測定用に構成されるハードディスクの数は、RAID レベルに応じて決定されます。 ハードディスクキャッシュは ディスク I/O パフォーマンスに影響を及ぼします。多くの場合、この機能は電 源障害時の安全上の問題により無効化されます。しかし、ハードディスクの製造元は、書き込みパフォーマン スの向上のために組み込んでいます。I/O アクセス用のキャッシュは圧倒的に大きく、電源障害時の潜在的な リスク(データの損失)がメインメモリには存在します。これは、オペレーティングシステムによって管理 されます。データの損失を防止するには、システムに無停電電源装置(UPS)を装備することを推奨します。 テストでは、2 台の SATA ハードディスク を RAID 1 として構成するか、1 台の SATA ハードディスクをシン グルディスク(SD)として構成し、コントローラーに接続しています。測定では、PRIMERGY TX100 S1 で 現在利用可能なすべてのハードディスクタイプを解析しました。RAID 1 での各ハードディスクタイプのスルー プットを種々のアクセスパターンを使用して比較します。コントローラーキャッシュがないため、測定では ディスクキャッシュの影響のみを測定し、ハードディスク比較の測定は、ディスクキャッシュありとなしで 実施しました。 下図は、キャッシュ設定によってどのようにスループットが変化するのかを示しています。64 KB ブロック のシーケンシャルリードのスループットは、キャッシュ 設定によって左右されません。RAID 1 は、シングルディ スク構成の場合と比べてスループット値はほぼ同じです が、データの冗長性の点で利点があります。 これとは対照的に、64 KB ブロックのシーケンシャルラ イトのスループットは、キャッシュ設定に大きく左右さ れます。ディスクキャッシュを有効にすると、シングル ディスク構成の書き込みスループットは約 15 倍に向上 し、RAID 1 構成の書き込みスループットは約 11 倍に向 上します。この書き込みスループットの大幅な向上は、 ハードディスクへの最適化された書き込みアクセスおよ び待ち時間の短縮から説明できます。 ディスクキャッシュを有効にすると、ランダムアクセ スのスループットが向上します。ただし、これはシー ケンシャルライトのスループットの向上ほど顕著では ありません。64 KB ブロックのランダムアクセスでは、 シングルディスク構成で 約 16%、RAID 1 では約 23% スループットが向上します。 8 KB ブロックのランダムアクセスの場合、スループッ トの向上は 64 KB ブロックの場合より若干高くなり、 シングルディスク構成では約 24%、RAID 1 では約 29% 向上します。

(20)

オンボード SATA RAID コントローラーは、ユーザーにとってコストパフォーマンスに優れたソリューション オプションです。このオンボード SATA コントローラーは、Intel ICH9R チップセットとしてサーバのマザー ボードに直接実装されます。 最高のパフォーマンスを実現するために、特に SATA ハードディスクを使用する場合やコントローラーキャッ シュを持たないコントローラーを使用する場合は、ハードディスクのキャッシュを有効にすることをお勧め します。使用するディスクの種類によっては、パフォーマンスが 15 倍 向上します。ハードディスクのキャッ シュを有効にする場合は、UPS の使用をお勧めします。

ベンチマーク環境

 ここで説明したすべての測定は、下記の一覧で示したハードウェアとソフトウェアのコンポーネントを使用 して実行されました。 コンポーネント 詳細 サーバ PRIMERGY TX100 S1

オペレーティングシステム Windows Server 2008 Enterprise Edition

バージョン: 6.0.6001 Service Pack 1 ビルド 6001 ファイルシステム NTFS 測定ツール Iometer 27.07.2006 測定データ 8 GB の測定ファイル オンボード SATA コントローラー Intel ICH9R BIOS: 6.00.R1.01 SATA RAID モード

ハードディスク SATA、3.5 インチ、7.2 krpm Western Digital WD1600AAJS-07M0A0、160 GB

(21)

納品までの時間は在庫状況によって異なります。技術仕様は予告なく変更さ れることがあります。誤記脱漏は随時訂正されます。 示しているすべての販売条件は(TC)ユーロでの希望価格で VAT を除く価格 です(別途記載ない限り)。ハードウェアおよびソフトウェアの名前はすべて、 発行部門: Enterprise Products PRIMERGY Server インターネット: http://ts.fujitsu.com/primergy エクストラネット: http://partners.ts.fujitsu.com/com/products/serv

関連資料

PRIMERGY Systems http://ts.fujitsu.com/primergy PRIMERGY TX100 S1 データシート http://docs.ts.fujitsu.com/dl.aspx?id=1ad5ecab-8b9e-4ef4-acda-233326f6f822 PRIMERGY Performance http://ts.fujitsu.com/products/standard_servers/primergy_bov.html SPECcpu2006 http://www.spec.org/osg/cpu2006 ベンチマークの概要 SPECcpu2006 http://docs.ts.fujitsu.com/dl.aspx?id=00b0bf10-8f75-435f-bb9b-3eceb5ce0157 SPECjbb2005 http://www.spec.org/jbb2005 ベンチマークの概要 SPECjbb2005 http://docs.ts.fujitsu.com/dl.aspx?id=18c15041-a25f-4d23-b0a5-5742dd5715ba SPECpower_ssj2008 http://www.spec.org/power_ssj2008 ベンチマークの概要 SPECpower_ssj2008 http://docs.ts.fujitsu.com/dl.aspx?id=a133cf86-63be-4b5a-8b0f-a27621c8d3c5 StorageBench パフォーマンスレポート - PRIMERGY 用モジュラー RAID http://docs.ts.fujitsu.com/dl.aspx?id=6baa9baf-39b7-4558-b1c2-f8846b22fbd4 Iometer http://www.iometer.org PC サーバ PRIMERGY(プライマジー) http://primeserver.fujitsu.com/primergy/

お問い合わせ先

PRIMERGY のパフォーマンスとベンチマーク mailto:primergy.benchmark@ts.fujitsu.com

参照

関連したドキュメント

従って、こ こでは「嬉 しい」と「 楽しい」の 間にも差が あると考え られる。こ のような差 は語を区別 するために 決しておざ

した標準値を表示しておりますが、食材・調理状況より誤差が生じる場合が

このように、このWの姿を捉えることを通して、「子どもが生き、自ら願いを形成し実現しよう

話者の発表態度 がプレゼンテー ションの内容を 説得的にしてお り、聴衆の反応 を見ながら自信 をもって伝えて

プロジェクト初年度となる平成 17 年には、排気量 7.7L の新短期規制対応のベースエンジ ンにおいて、後処理装置を装着しない場合に、 JIS 2 号軽油及び

「1 つでも、2 つでも、世界を変えるような 事柄について考えましょう。素晴らしいアイデ

運航当時、 GPSはなく、 青函連絡船には、 レーダーを利用した独自開発の位置測定装置 が装備されていた。 しかし、

ご使用になるアプリケーションに応じて、お客様の専門技術者において十分検証されるようお願い致します。ON