要約
このドキュメントでは、PRIMERGY TX150 S7 で実行したベンチマークの概要について説明します。 PRIMERGY TX150 S7 のパフォーマンスデータを、他の PRIMERGY モデルと比較して説明しています。 ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク環境の説明も掲載しています。 目次 ドキュメントの履歴 ... 2 製品データ ... 3 SPECcpu2006 ... 4 SPECjbb2005 ... 12 SPECpower_ssj2008 ... 15 StorageBench ... 19 OLTP-2 ... 28 関連資料... 32 お問い合わせ先 ... 32 ページ数 32パフォーマンスレポート
PRIMERGY TX150 S7
ドキュメントの履歴
バージョン 1.0 ベンチマークの章を含むレポートの初版 SPECcpu2006 測定構成 o Celeron G1101 o Pentium G6950o Core i3-530 および i3-540
o Xeon L3426、X3430、X3440、X3450、X3460、および X3470 SPECjbb2005 Xeon X3470 で測定 SPECpower_ssj2008 Xeon X3470 および SATA 2.5 インチ 5400rpm(1 台)で測定 StorageBench 測定対象 オンボード SATA コントローラー
「LSI MegaRAID 8 ポートベースの RAID 0/1 SAS」コントローラー 「RAID コントローラー SAS 5/6 512 MB(D2616)」コントローラー OLTP-2
測定構成
o Celeron G1101 o Pentium G6950
o Core i3-530 および i3-540
o Xeon L3426、X3430、X3440、X3450、X3460、および X3470 バージョン 2.0
ベンチマークの章を更新: SPECcpu2006
製品データ
PRIMERGY TX150 S7 は 1 ソケットサーバです。 Intel 3420 チップセット、Celeron、Pentium、Core i3、 または Xeon プロセッサ 1 基、最大 32 GB のメモリ、使用プロセッサに応じて 1067 MHz または 1333 MHz バス、Broadcom BCM5755 1 GBit LAN コントローラー、および PCI スロット 6 本(PCI-Express Gen2 x4 (3 本)、PCI-Express Gen2 x8(2 本)、PCI 32-bit/33 MHz(1 本))が搭載されています。
PRIMERGY TX150 S7 は、標準またはホットプラグの電源ユニット構成、および最大 4 台の内蔵 3.5 インチ ハードディスクまたは最大 8 台の 2.5 インチハードディスク構成の 4 種類のタワー型モデルが提供されてい ます。さらに、ホットプラグの電源ユニット構成で、最大 4 台の内蔵 3.5 インチハードディスクまたは最大 8 台の 2.5 インチハードディスク構成の 2 種類のラック型モデルが提供されています。 SATA ハードディスクを 使用する場合は、RAID 0、1、10 対応の 6 ポート SATA コントローラーを使用できます。 SAS ハードディ スクの場合は、RAID 0、1、および RAID 1E 対応の 8 ポート SAS コントローラー、または RAID 0、1、10、 5、50、6、および RAID 60 対応の 8 ポート SAS コントローラーを使用できます。
先行モデルと同様、タワー型の PRIMERGY TX150 S7 は、簡単に 5 U のラックシステムに改装して 19 イン チラックに搭載することができます。
SPECcpu2006
ベンチマークの説明
SPECcpu2006 は、整数演算および浮動小数点演算のシステム性能を測定するベンチマークです。これは、 12 本のアプリケーションからなる整数演算テストセット、および 17 本 のアプリケーションからなる浮動小 数点演算テストセットで構成されています。これらのアプリケーションは大量の演算を実行し、 CPU / メモ リを集中的に使用します。ディスク I/O やネットワークなど、他のコンポーネントについては、このベンチ マークでは測定しません。 SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード として利用可能で、実際のベンチマークの前にコンパイルする必要があります。したがって、使用するコン パイラーのバージョンやその最適化設定が測定結果に影響を与えます。 SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。最初の方法(SPECint2006 および SPECfp2006)は、1 つのタスクの完了に必要な時間を評価します。次の方法(SPECint_rate2006 および SPECfp_rate2006)は、スループット(並列処理できるタスク数)を評価します。いずれの方法も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これは、コンパイラー最適化を使用するかどう かという点で異なります。「ベース」値は公開時に常に用いられますが、「ピーク」値はオプションです。 ベンチマーク 演算 タイプ コンパイラー 最適化 測定結果 アプリケーション SPECint2006 整数 ピーク アグレッシブ 速度 単体実行 SPECint_base2006 整数 ベース 標準 SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行 SPECint_rate_base2006 整数 ベース 標準 SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行 SPECfp_base2006 浮動小数点 ベース 標準 SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行 SPECfp_rate_base2006 浮動小数点 ベース 標準 結果は、個々のベンチマークで得られた正規化比の幾何平均を使用しています。算術平均と比較して、幾何 平均のほうが、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムが基 準システムと比較してどの程度高速に実行されるのかを測定することです。基準システムの SPECint_base2006、 SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結果が、値「1」と判定さ れたとします。このとき、たとえば SPECint_base2006 の値 2 は、測定システムがこのベンチマークを基準 システムよりも約 2 倍の性能で実行したことを意味します。SPECfp_rate_base2006 の値 4 は、測定対象シ ステムが基準システムよりも、約 4/[ベースコピー数] 倍の性能でこのベンチマークを実行したことを意味し ます。ここで、「ベースコピー数」はベンチマークで実行された並行インスタンスの数です。 弊社は、SPEC の公開用に、 SPECcpu2006 を測定したデータのすべてを提出しているわけではありません。 このため、すべての結果が SPEC の Web サイトに表示されるわけではありません。弊社は、すべての測定 値のログデータをアーカイブしているので、測定の内容に関していつでも証明できます。 SPEC®、SPECint®、SPECfp®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC) の登録商標です。
ベンチマーク結果
次の 4 種類のプロセッサバージョンで PRIMERGY TX150 S7 を測定しました。 Celeron G1101
Pentium G6950
Core i3-530 および i3-540
Xeon L3406、L3426、X3430、X3440、X3450、X3460、 および X3470
2010 年 1 月 5 日、PRIMERGY TX150 S7 は、SPECfp_rate_base2006 ベンチマークの 1 ソケットサーバカ テゴリで第 1 位の成績を達成しました。1
2010 年 1 月 6 日、PRIMERGY TX150 S7 は、SPECint_rate_base2006 および SPECint_rate2006 ベンチマー クの 1 ソケットサーバカテゴリで第 1 位の成績を達成しました。2
結果は次の表のとおりです。ベンチマークプログラムは、インテル C++/Fortran コンパイラー 11.1 でコンパ イルし、SUSE Linux Enterprise Server 11(64 ビット)で実行しました。太字の値は、http://www.spec.org で 公開されています。 1 上記の競争力のあるベンチマーク結果は 2010 年 1 月 5 日時点で公開された結果を反映しています。上記の比較は、ベ ストパフォーマンスの 1 ソケットサーバに基づいています。 SPECfp_rate_base2006 によるベンチマーク結果につい ては、http://www.spec.org/cpu2006/results を参照してください。 2 上記の競争力のあるベンチマーク結果は 2010 年 1 月 6 日時点で公開された結果を反映しています。上記の比較は、ベ ストパフォーマンスの 1 ソケットサーバに基づいています。 SPECint_rate_base2006 および SPECint_rate2006 によ るベンチマーク結果については、http://www.spec.org/cpu2006/results を参照してください。
プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_base2006 SPECint2006 Celeron G1101 2 2.27 2 MB 1067 MHz 73 W 18.5 20.1 Pentium G6950 2 2.80 3 MB 1067 MHz 73 W 22.2 24.2 Core i3-530 2 2.93 4 MB 1333 MHz 73 W 25.4 27.7 Core i3-540 2 3.07 4 MB 1333 MHz 73 W 26.2 28.6 Xeon L3406 2 2.27 4 MB 1333 MHz 30 W 21.7 23.9 Xeon L3426 4 1.87 8 MB 1333 MHz 45 W 28.2 32.7 Xeon X3430 4 2.40 8 MB 1333 MHz 95 W 27.4 29.9 Xeon X3440 4 2.53 8 MB 1333 MHz 95 W 28.5 31.2 Xeon X3450 4 2.67 8 MB 1333 MHz 95 W 30.2 33.4 Xeon X3460 4 2.80 8 MB 1333 MHz 95 W 32.0 35.3 Xeon X3470 4 2.93 8 MB 1333 MHz 95 W 33.2 36.4 SPECint_base2006 SPECint_base2006 0 5 10 15 20 25 30 Celeron G1101 Pentium G6950 Core i3-530 Core i3-540 18.5 22.2 25.4 26.2 20.1 24.2 27.7 28.6
SPECcpu2006: integer performance PRIMERGY TX150 S7 with
Celeron, Pentium and Core i3 processors
SPECint_base2006 SPECint2006 0 5 10 15 20 25 30 35 40 Xeon L3406 Xeon L3426 Xeon X3430 Xeon X3440 Xeon X3450 Xeon X3460 Xeon X3470 21.7 28.2 27.4 28.5 30.2 32.0 33.2 23.9 32.7 29.9 31.2 33.4 35.3 36.4
SPECcpu2006: integer performance PRIMERGY TX150 S7 with Xeon processors
プロセッサ コア GHz L3 キャッシュ バス TDP SPECint_rate_base2006 SPECint_rate2006 Celeron G1101 2 2.27 2 MB 1067 MHz 73 W 32.2 35.0 Pentium G6950 2 2.80 3 MB 1067 MHz 73 W 39.3 42.5 Core i3-530 2 2.93 4 MB 1333 MHz 73 W 56.5 60.0 Core i3-540 2 3.07 4 MB 1333 MHz 73 W 58.2 61.8 Xeon L3406 2 2.27 4 MB 1333 MHz 30 W 45.7 48.7 Xeon L3426 4 1.87 8 MB 1333 MHz 45 W 84.5 90.5 Xeon X3430 4 2.40 8 MB 1333 MHz 95 W 85.8 92.3 Xeon X3440 4 2.53 8 MB 1333 MHz 95 W 105 112 Xeon X3450 4 2.67 8 MB 1333 MHz 95 W 109 115 Xeon X3460 4 2.80 8 MB 1333 MHz 95 W 114 121 Xeon X3470 4 2.93 8 MB 1333 MHz 95 W 120 127 SPECint_rate_base2006 SPECint_rate2006 0 10 20 30 40 50 60 70 Celeron G1101 Pentium G6950 Core i3-530 Core i3-540 32.2 39.3 56.5 58.2 35.0 42.5 60.0 61.8
SPECcpu2006: integer performance PRIMERGY TX150 S7 with
Celeron, Pentium and Core i3 processors
SPECint_rate_base2006 SPECint_rate2006 0 20 40 60 80 100 120 140 Xeon L3406 Xeon L3426 Xeon X3430 Xeon X3440 Xeon X3450 Xeon X3460 Xeon X3470 45.7 84.5 85.8 105 109 114 120 48.7 90.5 92.3 112 115 121 127
SPECcpu2006: integer performance PRIMERGY TX150 S7 with Xeon processors
プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_base2006 SPECfp2006 Celeron G1101 2 2.27 2 MB 1067 MHz 73 W 21.8 22.7 Pentium G6950 2 2.80 3 MB 1067 MHz 73 W 25.3 26.5 Core i3-530 2 2.93 4 MB 1333 MHz 73 W 28.4 29.9 Core i3-540 2 3.07 4 MB 1333 MHz 73 W 29.3 30.7 Xeon L3406 2 2.27 4 MB 1333 MHz 30 W 24.1 25.6 Xeon L3426 4 1.87 8 MB 1333 MHz 45 W 32.2 35.5 Xeon X3430 4 2.40 8 MB 1333 MHz 95 W 31.7 33.8 Xeon X3440 4 2.53 8 MB 1333 MHz 95 W 32.9 34.9 Xeon X3450 4 2.67 8 MB 1333 MHz 95 W 34.6 37.0 Xeon X3460 4 2.80 8 MB 1333 MHz 95 W 36.3 38.8 Xeon X3470 4 2.93 8 MB 1333 MHz 95 W 37.8 40.0 SPECfp_base2006 SPECfp2006 0 5 10 15 20 25 30 35 Celeron G1101 Pentium G6950 Core i3-530 Core i3-540 21.8 25.3 28.4 29.3 22.7 26.5 29.9 30.7
SPECcpu2006: floating-point performance PRIMERGY TX150 S7 with
Celeron, Pentium and Core i3 processors
SPECfp_base2006 SPECfp2006 0 5 10 15 20 25 30 35 40 Xeon L3406 Xeon L3426 Xeon X3430 Xeon X3440 Xeon X3450 Xeon X3460 Xeon X3470 24.1 32.2 31.7 32.9 34.6 36.3 37.8 25.6 35.5 33.8 34.9 37.0 38.8 40.0
SPECcpu2006: floating-point performance PRIMERGY TX150 S7 with Xeon processors
プロセッサ コア GHz L3 キャッシュ バス TDP SPECfp_rate_base2006 SPECfp_rate2006 Celeron G1101 2 2.27 2 MB 1067 MHz 73 W 34.0 35.4 Pentium G6950 2 2.80 3 MB 1067 MHz 73 W 39.1 40.7 Core i3-530 2 2.93 4 MB 1333 MHz 73 W 48.5 50.6 Core i3-540 2 3.07 4 MB 1333 MHz 73 W 49.7 51.8 Xeon L3406 2 2.27 4 MB 1333 MHz 30 W 39.8 41.2 Xeon L3426 4 1.87 8 MB 1333 MHz 45 W 68.8 71.3 Xeon X3430 4 2.40 8 MB 1333 MHz 95 W 73.2 75.8 Xeon X3440 4 2.53 8 MB 1333 MHz 95 W 80.5 83.3 Xeon X3450 4 2.67 8 MB 1333 MHz 95 W 82.4 85.3 Xeon X3460 4 2.80 8 MB 1333 MHz 95 W 84.9 87.7 Xeon X3470 4 2.93 8 MB 1333 MHz 95 W 87.9 90.9 SPECfp_rate_base2006 SPECfp_rate2006 0 10 20 30 40 50 60 Celeron G1101 Pentium G6950 Core i3-530 Core i3-540 34.0 39.1 48.5 49.7 35.4 40.7 50.6 51.8
SPECcpu2006: floating-point performance PRIMERGY TX150 S7 with
Celeron, Pentium and Core i3 processors
SPECfp_rate_base2006 SPECfp_rate2006 0 10 20 30 40 50 60 70 80 90 100 Xeon L3406 Xeon L3426 Xeon X3430 Xeon X3440 Xeon X3450 Xeon X3460 Xeon X3470 39.8 68.8 73.2 80.5 82.4 84.9 87.9 41.2 71.3 75.8 83.3 85.3 87.7 90.9
SPECcpu2006: floating-point performance PRIMERGY TX150 S7 with Xeon processors
下の図は、PRIMERGY TX150 S7 のパフォーマンスを先行モデルの PRIMERGY TX150 S6 と比較していま す。両方とも最高パフォーマンス構成での比較です。
ベンチマーク環境
SPECcpu2006 での測定は、すべて次のハードウェアおよびソフトウェア構成の PRIMERGY TX150 S7 で実 行されました。 ハードウェア モデル PRIMERGY TX150 S7 CPU Celeron G1101 Pentium G6950Core i3-530、および i3-540
Xeon L3406、L3426、X3430、X3440、X3450、X3460、および X3470
CPU 数
Celeron G1101, Pentium G6950, Core i3-530、および i3-540, Xeon L3406: 1 チップ、2 コア、2 コア/チップ Xeon L3426, X3430, X3440, X3450, X3460、および X3470: 1 チップ、4 コア、4 コア/チップ プライマリ キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ、コアごと セカンダリ キャッシュ 256 KB オンチップ、コアごと その他の キャッシュ Celeron G1101: 2 MB(I+D)オンチップ、チップごと Pentium G6950: 3 MB(I+D)オンチップ、チップごと Core i3-530、および i3-540, Xeon L3406: 4 MB(I+D)オンチップ、チップごと Xeon L3426, X3430, X3440, X3450, X3460、および X3470: 8 MB(I+D)オンチップ、チップごと メモリ デュアルコアプロセッサ: 4GB x 2 枚 クアッドコアプロセッサ: 4GB x 4 枚 ソフトウェア オペレーティング
システム SUSE Linux Enterprise Server 11(64 ビット) コンパイラー インテル C++/Fortran コンパイラー 11.1
SPECjbb2005
ベンチマークの説明
SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマークで す。これは、本質的に SPECjbb2000 を更新したバージョンで、主な違いは次のとおりです。 トランザクションは、多様な機能範囲を対象とするため、より複雑になっています。 ベンチマークのワーキングセットが、システムの負荷の増大に対応して拡大されました。 SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されましたが、 SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実際との高い近似性を 得ることができます。 ソフトウェア側では、SPECjbb2005 は JVM、JIT(ジャストインタイム)コンパイラー、ガベージコレクション、 スレッドなどのオペレーティングシステムの機能を評価します。ハードウェアに関する限り、SPECjbb2005 は CPU およびキャッシュの効率、メモリサブシステム、共有メモリシステム(SMP)のスケーラビリティを 測定します。ディスクおよびネットワーク I/O は無関係です。 SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層のクライアント/サーバ システムをエミュレートしたもので、特に中間層が強調されています。 クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データベー スへの OLTP アクセスを思考時間ゼロで行います。 中間層は、ビジネスプロセスおよびデータベースの更新を実装します。 データベースは、データ管理を担当し、メモリ内の Java オブジェクトによりエミュレートされます。 トランザクションのログ記録は XML ベースで実装されます。 このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパフォー マンスが測定されるため、大規模なハードウェアの設置は不要となり、SPECjbb2005 の異なるシステム間の 結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記述されています。 SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で す。 スケーリングの単位は、約 25 MB の Java オブジェクトからなる1つのウェアハウスです。ウェアハウスあ たり 1 つの Java スレッドがこれらのオブジェクトに対しオペレーションを実行します。これらのビジネス オペレーションは 、TPC-C の次の項目を前提としています。 新規オーダーエントリー 支払 オーダーステータスの照会 納入 在庫レベル監視 顧客レポート SPECjbb2005 と TPC-C が共通して持っている機能は、これだけです。2 つのベンチマーク結果を比較する ことはできません。 SPECjbb2005 には、次の 2 つの性能指標があります。 bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーションの 性能です。 bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。 SPECjbb2005 のさまざまな結果を比較する場合には、両方の性能指標を考慮する必要があります。 ベンチマーク測定が準拠すべき以下のルールは、この性能指標の基となるものです。
SPEC®、SPECjbb®、および SPEC の各ロゴは、Standard Performance Evaluation Corporation(SPEC)の登録商標 です。
ベンチマーク測定は、ウェアハウス数(つまりスレッド数)が増加する一連の測定ポイントで構成され、各 ケースでウェアハウスが 1 だけ増加します。測定は、1 ウェアハウスで開始され、2*MaxWh まで(ただし、 尐なくとも 8 ウェアハウス)行います。MaxWh は、ベンチマークで予想される、秒あたりの最高オペレー ションレートでのウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU の数と同じ値が設定されます。
性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定済みオペレーション 速度の算術平均です。
ベンチマーク結果
2009 年 10 月に、1 基の Xeon X3470 プロセッサと 8 GB PC3-10600 DDR3-SDRAM のメモリ構成を使用し て、PRIMERGY TX150 S7 を測定しました。測定には、Windows Server 2008 Enterprise x64 Edition SP2 を 使用しました。Oracle から提供されている JRockit(R) 6 P28.0.0 の 2 つのインスタンスを測定用 JVM と して使用しました。ベンチマーク結果には、4~8 個までのウェアハウスの全測定値が含まれています。 PRIMERGY TX150 S7 をその先行モデルの PRIMERGY TX150 S6 と比較すると、スループットは各トップ パフォーマンス構成で +32 %向上しています。
ベンチマーク環境
SPECjbb2005 でのすべての測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY TX150 S7 で 実行されました。 ハードウェア モデル PRIMERGY TX150 S7 CPU Xeon X3470 チップ数 1 チップ、4 コア、4 コア、チップごと プライマリキャッシュ 32 kB(命令) + 32 kB(データ)オンチップ、コアごと セカンダリキャッシュ 256 kB(I+D)オンチップ、コアごと その他のキャッシュ 8 MB オンチップ、チップごと メモリ 4×2 GB PC3-10600R DDR3-SDRAM ソフトウェア オペレーティングシステム Windows Server 2008 Enterprise x64 Edition SP2 JVM バージョン Oracle JRockit(R) 6 P28.0.0
(ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64)
SPECpower_ssj2008
*ベンチマークの説明
SPECpower_ssj2008 は、サーバクラスのコンピュータを対象とした、消費電力とパフォーマンスの特性を 評価する業界標準の SPEC ベンチマークです。 SPEC は、パフォーマンス測定の標準を定めたのと同じ手法 で、SPECpower_ssj2008 において、サーバの消費電力測定の標準を定義しました。 ベンチマークのワークロードには、典型的なサーバサイド Java ビジネスアプリケーションがシミュレートさ れます。ワークロードはスケーラブルで、マルチスレッド化されており、様々なオペレーション環境で利用 でき、低コストで実行できます。ワークロードは CPU、キャッシュ、メモリ階層および SMP( symmetric multiprocessor systems:対称型マルチプロセシングシステム)のスケーラビリティをを実行/テストし、同 時に JVM( Java Virtual Machine :Java 仮想マシン)、JIT( Just In Time:ジャストインタイム)コンパイ ラー、ガベージコレクション、スレッド、およびオペレーティングシステムのいくつかの機能を使用します。 SPECpower_ssj2008 では、100 %からアクティブアイ ドルまで 10 %区切りで、さまざまなパフォーマンスレ ベルにおける一定時間の消費電力をレポートします。段 階的なワークロードは、サーバの処理負荷および電力消 費が、日や週により大きく変化することを表しています。 全てのレベルにおける電力効率指標を計算するには、各 セグメントで測定したトランザクションスループットを 合計し、各セグメントの平均消費電力の合計で割ります。 結果は、overall ssj_ops/watt という性能指数です。この 値から測定対象サーバのエネルギー効率に関する情報が 得られます。測定標準が定義されていることにより、 SPECpower_ssj2008 で測定される値を他の設定やサー バ と 比 較 す る こ と が で き ま す 。 右 の 図 は 、 SPECpower_ssj2008 の標準的な結果のグラフです。 ベンチマークは、さまざまなオペレーティン グシステムおよびハードウェアアーキテク チャーで実行され、大がかりなクライアント やストレージインフラストラクチャーを展開 する必要がありません。 SPEC 準拠テスト の最小構成は、ネットワークで接続された 2 台のコンピュータと、電力アナライザと温度 センサーが 1 台ずつです。コンピュータの 1 台は、SUT( System Under Test:テスト対 象システム)で、サポート対象の任意のオペ レーティングシステムが実行され、JVM が インストールされています。 JVM は、Java で 実装されている SPECpower_ssj2008 ワーク ロードを実行するために必要な環境を提供し ます。もう 1 台のコンピュータは、CCS ( Collect and Control System:収集および制 御システム、)で、ベンチマークの動作を制 御し、レポートに使用する電力、パフォーマン ス、および温度のデータを取得します。左の 図は、このフレームワークの各コンポーネン* SPEC®、SPECpower_ssj2008® および SPEC ロゴは Standard Performance Evaluation Corporation(SPEC)の登録 商標です。
トの概要を示しています。
ベンチマーク結果
2010 年 1 月、1 基の Intel Xeon X3470 プロセッサおよび 4 GB の PC3-10600E DDR3-SDRAM メモリの構 成で PRIMERGY TX150 S7 を測定しました。測定には、Windows Server 2008 Enterprise x64 Edition SP2 お よび Oracle JRockit(R) 6 P28.0.0 JVM を使用しました。
Intel Xeon X3470 プロセッサを搭載した PRIMERGY TX150 S7 は、シングルノードクラスで世界記録の 2,187 overall ssj_ops/watt という成績を達成しました。これは、それまで最高だった IBM System x3250 M3 の記 録を 4.2 %* 上回るものです。 左の図は、上記の PRIMERGY TX150 S7 の測定結果のグラフを示しています。 赤横棒は、グラフの y 軸で示された各 負荷レベルに対する電力性能比(上の x 軸:ssj_ops/watt )を表しています。青 線は、小さなダイヤで示された各負荷 レベルにおける平均消費電力(下の x 軸:W)が描く曲線を表しています。 縦黒線は、PRIMERGY TX150 S7 の出 したベンチマーク結果、2,187 overall ssj_ops/watt を表しています。これは、 各測定におけるトランザクションスルー プット合計を各測定での平均消費電力 合計で割ったものです。 このグラフから、負荷が 70 %のときにサーバのエネルギー効率が最大になっていることがわかります。これ がすでに www.spec.org で公開されている前回の SPECpower_ssj2008 結果と異なる点です。前回は他の PRIMERGY サーバで測定し、負荷 100 %のときに最大効率に達しました。このような違いが生じた理由と しては、PRIMERGY TX150 S7 が「Fujitsu Enhanced Power Settings」という電源プランに対応したサーバ の中で最初に測定されたサーバであることが挙げられます。この電源プランは、Microsoft Windows Server 2008 SP2 オペレーティングシステム向けに開発されたもので、サポートされている PRIMERGY サーバには、Server View Installation Manager によってデフォルトでインストールされます。この電源プランは、Windows のコン トロールパネルの電源オプションでデフォルトの[バランス]プランの代わりとして選択できます。「Fujitsu Enhanced Power Settings」電源プランは、通常のサーバの使用率がほとんど常に 100 % を大きく下回ると いう事実に対処するために開発されました。「Fujitsu Enhanced Power Settings」電源プランは、電源管理を 最適化し、サーバの典型的な負荷の範囲でエネルギー効率が最大になるようにします。
* 上記の競争力のあるベンチマーク結果は 2010 年 1 月 27 日時点で公開された結果を反映しています。上記の比較は、 最もエネルギー効率の高いシングルノードの結果に基づいています。最新の SPECpower_ssj2008 によるベンチマーク 結果については、http://www.spec.org/power_ssj2008/results を参照してください。
次の表は、測定結果の各負荷レベルにおける ssj_ops、平均消費電力(W 単位)、および結果のエネルギー効 率の詳細情報です。
パフォーマンス 電力 エネルギー効率
Target Load ssj_ops Average Power (W) ssj_ops/watt
100% 276,514 112 2,461 90% 249,279 97.6 2,555 80% 221,473 84.6 2,618 70% 193,621 73.6 2,631 60% 167,143 65.5 2,552 50% 139,181 58.7 2,369 40% 111,429 53.2 2,095 30% 84,147 48.2 1,745 20% 55,068 42.8 1,286 10% 27,788 36.5 760 アクティブア イドル 0 24.3 0 ∑ssj_ops / ∑power = 2,187 サーバは、電力性能比の点で性能を最大限引き出せるようにチューニングされました。 2GB x 2 枚のメモリ は、利用可能な各メモリチャネルの 1 スロットずつに挿し、最小の電力消費で最高のパフォーマンスを出せ るようになっています。この構成により、利用可能なメモリ帯域幅を最大限に活用し、同等のパフォーマン スを達成できる DIMM 4 枚構成より消費電力を抑えることができます。ハードウェア構成で最も重要なのは、 適切なプロセッサの選択です。プロセッサは、メモリサブシステムの次に電力を消費する部品です。 PRIMERGY TX150 S7 では、TDP(Thermal Design Power:熱設計電力) 95 W のクアッドコア Intel Xeon X3470 プロ セッサ搭載時に最高の効率を示すスコアが出ました。
下図は、前回と今回の測定結果を比較したものです。先行モデルの PRIMERGY TX150 S6 に Intel Xeon L3360 プロセッサを搭載して測定したときと比べて、エネルギー効率が 71.8 %向上しています。 PRIMERGY TX150 S7 の SPECpower_ssj2008 の消費電力の低下と ssj_ops のスループットの向上は、新しい Intel Nehalem マ イクロアーキテクチャーによるものです。
ベンチマーク環境
ここに示す SPECpower_ssj2008 測定結果は、次のハードウェアおよびソフトウェア構成 の PRIMERGY TX150 S7 で実行され、Yokogawa WT210 電力アナライザを使用して測定されました。 ハードウェア モデル PRIMERGY TX150 S7 プロセッサ(TDP) Intel Xeon X3470(95 W) チップ数 1 チップ(チップあたり 4 コア) 1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり) 2 次キャッシュ 256 KB(命令 + データ)オンチップ(コアあたり) 3 次キャッシュ 8 MB(命令 + データ)オンチップ(チップあたり) メモリ 2 GB PC3-10600E DDR3-SDRAM(2 枚) ネットワークインターフェース 1 GBit LAN Intel 82574L ギガビットネットワーク(オンボード)(1 基) ディスクサブシス
テム
内蔵 SATA コントローラー(1 基)
2.5 インチ SATA HDD(1 台)、160 GB、JBOD
電源ユニット 350 W Fujitsu Technology Solutions S26113-E549-V50-01(1 基) ソフトウェア
オペレーティング
システム Windows Server 2008 Enterprise x64 Edition SP2
JVM バージョン (ビルド P28.0.0-29-114096-1.6.0_11-20090427-1759-windows-x86_64) Oracle JRockit(R) 6 P28.0.0 JVM アフィニ
ティー start /affinity [0x0F,0xF0]
JVM オプション -Xms1625m -Xmx1625m -Xns1500m -XXaggressive -Xlargepages -Xgc:genpar -XXca llprofiling -XXgcthreads=4 -XXtlasize:min=4k,preferred=1024k
StorageBench
ベンチマークの説明
ディスクサブシステムの能力を評価するために、富士通テクノロジー・ソリューションズ は StorageBench と いうベンチマークを開発しました。StorageBench は、システムに接続されている異なるストレージシステムを 比較することができます。このベンチマークでは、インテルで開発された Iometer という測定ツールと、実 際の顧客アプリケーションで発生する負荷プロファイルを組み合わせ、測定シナリオを定義しました。 測定ツール 2001 年末以降、Iometer は http://SourceForge.net のプロジェクトとなり、さまざまなプラットフォームに移 植され、国際的な開発者グループによって強化されています。Iometer は、Windows のユーザーインターフェー スとさまざまなプラットフォームで利用できる、いわゆる「dynamo」で構成されています。この数年で、こ れら 2 つのコンポーネントは、 http://www.iometer.org/ または、 http://sourceforge.net/projects/iometer から 「インテルオープンソースライセンス」でダウンロードできるようになりました。 Iometer は、IO サブシステムへのアクセスについて実際のアプリケーションの動作を再現することができま す。このため、特に、使用するブロックサイズ、シーケンシャルリード/ライト、ランダムリード/ライト、 およびこれらの組み合わせなど、アクセスの種類を設定できます。また、同時アクセス数(「未処理 IO」) も設定できます。その結果、Iometer は 1 秒あたりのスループット、1 秒あたりのトランザクション数、各ア クセスパターンの平均応答時間などの基本的なパラメーターを含むカンマで区切られた.csv ファイルを生成 します。この方法により、特定のアクセスパターンを使ってさまざまなサブシステムの性能を比較できます。 Iometer は、ファイルシステムを使用して、サブシステムにアクセスできるばかりでなく、いわゆる RAW デ バイスにもアクセスできます。 Iometer では、さまざまなアプリケーションのアクセスパターンをシミュレーションおよび測定できますが、 オペレーティングシステムのファイルキャッシュは考慮されません。また、オペレーションは 1 つのテスト ファイル上のブロックで行われます。 負荷プロファイル アプリケーションがマスストレージシステムにアクセスする方法は、ストレージシステムのパフォーマンス に多大な影響を及ぼします。各種アプリケーションのさまざまなアクセスパターンの例: アプリケーション アクセスパターン データベース(データ転送) ランダム、67 %リード、33 %ライト、8 KB(SQL Server) データベース(ログファイル) シーケンシャル、100 %ライト、64 KB ブロック バックアップ シーケンシャル、100 %リード、64 KB ブロック リストア シーケンシャル、100 %ライト、64 KB ブロック ビデオストリーミング シーケンシャル、100 %リード、ブロック ≥ 64 KB ファイルサーバ ランダム、67 %リード、33 %ライト、64 KB ブロック Web サーバ ランダム、100 %リード、64 KB ブロック オペレーティングシステム ランダム、40 %リード、60 %ライト、ブロック ≥ 4 KB ファイルコピー ランダム、50 %リード、50 %ライト、64 KB ブロック これから次の 4 つの独特なプロファイルが導き出されました。 負荷プロファイル アクセス アクセスパターン ブロック サイズ 未処理 IO 負荷 ツール リード ライト ストリーミング シーケンシャル 100 % 64 KB 3 Iometer リストア シーケンシャル 100 % 64 KB 3 Iometer データベース ランダム 67 % 33 % 8 KB 3 Iometer ファイルサーバ ランダム 67 % 33 % 64 KB 3 Iometer 4 つのプロファイルはすべて Iometer で生成されました。測定シナリオ
比較できる測定結果を得るためには、再現可能な同一の環境ですべての測定を実行することが重要です。そ のため StorageBench は上記の負荷プロファイルに加えて次の規則に基づいています。
実際の顧客構成で RAW デバイスを使用するのは例外的な状況のみであるため、内蔵ディスクのパフォー マンス測定は常にファイルシステムを使用したディスク上で実行されます。高いパフォーマンスが他 のファイルシステムや RAW デバイスで実現できる場合でも、Windows では NTFS が使用され、Linux では ext3 が使用されます。 ハードディスクは、コンピュータシステムで最もエラーが発生しやすいコンポーネントです。ハード ディスクの故障によるデータの損失をなくすためにサーバシステムで RAID コントローラーが使用さ れる理由はここにあります。ここでは、複数のハードディスクを組み合わせて「Redundant Array of Independent Disks」(RAID)を形成し、1 つのハードディスクが故障した場合でもすべてのデータ が維持されるように(RAID 0 を除く)すべてのデータを複数のハードディスクに分散させます。ハー ドディスクをアレイで編成する最も一般的な方法は、RAID レベル、RAID 0、RAID 1、RAID 5、RAID 6、RAID 10、RAID 50、RAID 60 です。各種 RAID アレイの基本については、資料 パフォーマンス レポート - PRIMERGY 用モジュラー RAID を参照してください。
ディスクの数および装着されているコントローラーに応じて、 RAID 構成を変えながら PRIMERGY サー バの StorageBench を測定しました。2 台のハードディスクを装着できるシステムでは RAID 1 およ び RAID 0 を使用し、3 台以上では RAID 1E および RAID 5 を使用します。適用可能な場合はサポー トされていることを条件にさらに上位の RAID レベルを使用します。 ハードディスクのサイズに関係なく、サイズが 8 GB の測定ファイルを常に測定に使用しています。 I/O サブシステムの効率の評価では、プロセッサパフォーマンスおよびメモリ構成は、今日のシステ ムでは大きな要因ではありません。通常、考えられるボトルネックは CPU やメモリではなく、ハー ドディスクや RAID コントローラーに影響を及ぼします。したがって、CPU やメモリの構成を数々 変えながら StorageBench で解析する必要はありません。 測定結果 負荷プロファイルごとに、StorageBench は次のようにさまざまな主要指標を提供します。1 秒あたりのデー タ転送量をメガバイト数で表した(MB/s)「データスループット」、1 秒あたりの I/O オペレーション数(IO/s) の「トランザクションレート」、およびミリ秒(ms)単位の「待機時間」(「平均アクセス時間」)。シー ケンシャルな負荷プロファイルでは、データスループットが通常の指標であり、小規模なブロックサイズを 使用するランダムな負荷プロファイルでは、通常、トランザクションレートが使用されます。スループット およびトランザクションレートは互いに直接比例し、次の式に従って計算できます。 データスループット [MB/s] = トランザクションレート [ディスク-I/O /s] × ブロックサイズ [MB] トランザクションレート [ディスク-I/O /s] = データスループット [MB/s] / ブロック サイズ [MB]
オンボード SATA コントローラー
ベンチマークの結果
PRIMERGY TX150 S7 には、Modular RAID ファミリーのコントローラーが搭載されています。各種の RAID ソリューションにより、ユーザーはアプリケーションシナリオに合わせて適切なコントローラーを選択でき ます。
PRIMERGY TX150 S7 には、次の機能を提供する RAID ソリューションがあります。 1. SATA RAID オンボードコントローラー
このコントローラーは、サーバのマザーボードに直接実装され、Intel Ibex Peak チップセットに組み 込まれています。RAID スタックはサーバの CPU によって認識されます。この RAID ソリューション は、SATA ハードディスクの接続のみ使用できます。RAID レベル 0、1、10 に対応しています。こ のコントローラーには、キャッシュがありません。
2. 「LSI MegaRAID 8 ポートベースの RAID 0/1 SAS」コントローラー(LSI MegaRAID SAS 1068) このコントローラーは、PCI Express カードとして供給されています。このコントローラーに接続で きる SATA、SAS、および SAS-2.0 ハードディスクの最大数は 8 台です。RAID レベル 0、1、1E に 対応しています。このコントローラーにはキャッシュがありません。
3. 「RAID Ctrl SAS 5/6 512MB(D2616)」コントローラー(LSI MegaRAID SAS 2108)
このコントローラーは、SAS-2.0 ハードディスクと接続するための 6 Gbps SAS-2.0 インターフェー スをサポートしています。このコントローラーは PCI Express カードとして供給され、RAID ソリュー ション一式を提供します。RAID レベル 0、1、5、6、10、50、60 に対応しています。このコントロー ラーには、512 MB のコントローラーキャッシュが搭載されています。コントローラーのキャッシュ は、電源障害に対してオプションのバッテリーバックアップユニット(BBU)により保護できます。 コントローラーは 240 台までのハードディスクをサポートします。 これらのコントローラーには、さまざまな SATA、SAS、および SAS-2.0 ハードディスクを接続できます。 必要なパフォーマンスに応じて、適切なディスクサブシステムを選択できます。モデルバージョンによりま すが、PRIMERGY TX150 S7 では 3.5 インチハードディスク用の 4 つのホットプラグベイまたは 2.5 インチ ハードディスク用の 8 つのホットプラグベイを利用できます。 PRIMERGY TX150 S7 には、次のハードディスクを選択できます。 2.5 インチ SATA ハードディスク、容量 160 GB、320 GB、500 GB(5.4 krpm) 3.5 インチ SATA ハードディスク、容量 160 GB、250 GB、500 GB、750 GB、1 TB(7.2 krpm) 2.5 インチ SAS-2.0 ハードディスク、容量 146 GB、300 GB(10 krpm) 2.5 インチ SAS-2.0 ハードディスク、容量 73 GB、146 GB(15 krpm) 3.5 インチ SAS ハードディスク、容量 146 GB(15 krpm) 3.5 インチ SAS-2.0 ハードディスク、容量 300 GB、450 GB、600 GB(15 krpm) SATA RAID オンボードコントローラー 下図は、2.5 インチおよび 3.5 インチ SATA ハードディスクを使用したシーケンシャルアクセスにおいて、 キャッシュ設定によってどのようにスループットが変化するかを示したものです。SATA ハードディスク間 のパフォーマンスを比較するため、2 つの RAID 1 アレイを構成しました。1 つの RAID 1(5.4 krpm 構成) は、回転数 5.4 krpm の 2 台の 2.5 インチ 320 GB SATA ハードディスクで構成されます。 もう一方の RAID 1(7.2 krpm 構成)システム は、回転数 7.2 krpm の 2 台の 3.5 インチ 500 GB SATA ハードディスクで構成されます。 2 つの RAID 1 システムは、連続して SATA オン ボードコントローラーに接続され、測定され ます。このコントローラーにはキャッシュが ありません。左図は、ディスクキャッシュ設 定を変更して 64 KB ブロックを使用したシー ケンシャルリード/ライトを実行したときの スループットを示しています。
LSI MegaRAID SAS 1068 オンボード SATA コントローラー 3.5 インチ ハードディスクを使用した RAID 1 の読み取りスループットは、2.5 インチ ハードディスクを使 用した RAID 1 の 2 倍になり、キャッシュ設定によって左右されません。 3.5 インチ ハードディスクを使用した RAID 1 の書き込みスループットは、2.5 インチ ハードディスクを使 用した RAID 1 と比べ、ディスクキャッシュの有効・無効によりそれぞれ約 95 %または 35 %高くなります。 右図は、ディスクキャッシュ設定を変更して 8 KB および 64 KB ブロックを使用したランダムアクセスを実 行したときのスループットを示しています。スループットはディスクキャッシュ設定によって変化しました。 ディスクキャッシュを有効にした場合、3.5 イン チ ハードディスクのスループットは、2.5 インチ ハードディスクを使用した場合より、8 KB およ び 64 KB ブロックで、それぞれ約 47 %または 59%高くなります。 3.5 インチ ハードディスクはより強力ですが、 2.5 インチハードディスクの利点も忘れてはいけ ません。2.5 インチドライブは、省スペースで消 費電力と放熱量が尐なくて済み、デバイスの冷 却コストも削減できるという大きなメリットが あります。
LSI MegaRAID SAS 1068
以下では、LSI MegaRAID SAS 1068 コントロー ラーで利用可能なハードディスクタイプのパ フォーマンスを比較しています。このコントローラーには、コントローラーキャッシュがありません。よっ て、 測定を実行するにあたり、ディスクキャッシュパラメーターの影響のみを測定し、ハードディスク比較 の測定は、ディスクキャッシュありとなしで実施しました。 ハードディスクキャッシュは ディスク I/O パフォーマンスに影響を及ぼします。多くの場合、この機能は電 源障害時の安全上の問題により無効化されます。しかし、ハードディスクの製造元は、書き込みパフォーマン スの向上のために組み込んでいます。特に SAS ハードディスクに比べて回転数が遅い SATA ハードディス クを用いる場合には、パフォーマンスを向上させるため、ディスクキャッシュを有効にしてください。I/O ア クセス用のキャッシュは圧倒的に大きく、電源障害時の潜在的なリスク(データの損失)がメインメモリに は存在します。これは、オペレーティングシステムによって管理されます。データの損失を防止するには、 システムに無停電電源装置(UPS)を装備することを推奨します。 テストでは、2 台のハードディスクをコントローラーに接続し、RAID 1 として構成しました。測定では、 PRIMERGY TX150 S7 で現在利用可能なすべてのハードディスクタイプを解析しました。RAID 1 での各ハー ドディスクタイプのスループットを種々のアクセスパターンを使用して比較します。 次の図は、RAID 1 でのブロックサイズが 64 KB のシーケンシャルリード/ライトのスループットを表した ものです。
ディスクキャッシュを有効にして RAID 1 でシーケンシャルリードを行った場合のディスクごとの性能を比 較すると、回転数 15 krpm の 2.5 インチ SAS-2.0 ハードディスクのスループットは、回転数 10 krpm の 2.5 インチ SAS-2.0 ハードディスクより約 18 %高く、回転数 7.2 krpm の 3.5 インチ SATA ハードディスクのス ループットは、回転数 5.4 krpm の 2.5 インチ SATA ハードディスクより約 85 %高くなりました。また、回 転数 15 krpm の 3.5 インチ SAS ハードディスクと回転数 7.2 krpm の 3.5 インチ SATA ハードディスクを比 較した場合、SAS ハードディスクのスループットは、SATA ハードディスクのスループットより約 45 %高 いことがわかります。 回転数が共に 15 krpm の 2.5 インチおよび 3.5 インチの SAS-2.0 ハードディスクのスループットを比較した 場合、3.5 インチのハードディスクのスループットは、2.5 インチのハードディスクのスループットより約 29 % 高いことがわかります。 ディスクキャッシュを有効にして RAID 1 でシーケンシャルライトを行った場合の各ディスクごとの比較を すると、回転数 15 krpm の 2.5 インチ SAS-2.0 ハードディスクのスループットは、回転数 10 krpm の 2.5 イン チ SAS-2.0 ハードディスクより約 18 %高く、回転数 7.2 krpm の 3.5 インチ SATA ハードディスクと回転数 15 krpm の 3.5 インチ SAS ハードディスクでは、SAS ハードディスクのスループットは約 35 %高くなりま す。回転数 5.4 krpm の 2.5 インチ SATA ハードディスクの代わりに、3.5 インチ SATA ハードディスク (7.2 krpm)を使用すると、スループットは約 2 倍に向上します。 SATA ハードディスクでは、特にシーケンシャルライトでディスクキャッシを有効にすることにより、最大 4.4 倍までスループットを向上できます。SAS ハードディスク では SATA ハードディスク程ではありませんが、 それでもかなり向上しています。2.5 インチ SAS-2.0 ハードディスク(10 krpm)のスループットは 3 倍向上 し、2.5 インチ SAS-2.0 ハードディスク(15 krpm)のスループットは 2.3 倍向上します。3.5 インチ SAS ハー ドディスク(15 krpm)のスループットは 2.3 倍向上し、3.5 インチ SAS-2.0 ハードディスク(15 krpm)の スループットは 2.9 倍向上します。 次の図は、67 %リードのランダムアクセスで、ディスクキャッシュがスループットの向上にも大きく寄与し ていることを示しています。 10 krpm または 15 krpm の 2 台の 2.5 インチ SAS-2.0 ハードディスクを用いた RAID 1 構成で 8 KB ブロッ クのランダムアクセスを行った場合、ディスクキャッシュを有効にすることにより、約 22 %スループットが 向上します。2.5 インチ SAS-2.0 ハードディスクの 10 krpm と 15 krpm でスループットを比較した場合、15 krpm ハードディスクのスループットは、10 krpm のハードディスクの場合より約 31 %高くなることがわかります。 3.5 インチ SAS-2.0 ハードディスク(15 krpm)と 3.5 インチ SATA ハードディスク(7.2 krpm)のスループッ トを比較した場合、SAS-2.0 ハードディスクのスループットは、SATA ハードディスクの場合より約 2 倍高 くなります。回転数が共に 15 krpm の 2.5 インチと 3.5 インチの SAS-2.0 ハードディスクのスループットを 比較すると、ほぼ同じ範囲にあることがわかります。 8 KB ブロックと 64 KB ブロックのランダムアクセスを実行した場合、ディスクキャッシュを有効にするこ とで、15 krpm の 3.5 インチ SAS-2.0 ハードディスクならばそれぞれ約 20 % および 18 %、15 krpm の 2.5 インチ SAS-2.0 ハードディスクならばそれぞれ約 22 % および 17 %スループットが向上します。7.2 krpm の
LSI MegaRAID SAS 2108(512 MB のキャッシュを搭載) 3.5 インチ SATA ハードディスクに対して 64 KB ブロックのランダムアクセスを実行した場合、ディスクキャッ シュを有効にすることで、約 30 % スループットが向上します。 回転数が共に 15 krpm の 3.5 インチおよび 2.5 インチ SAS-2.0 ハードディスクのスループットを比較すると、 ディスクキャッシュを有効にして 64 KB ブロックのランダムアクセスを実行した場合、 3.5 インチ ハードディ スクのスループットは、2.5 インチ ハードディスクより 6 %高くなり、3.5 インチ SAS ハードディスク(15 krpm) と 3.5 インチ SATA ハードディスク(7.2 krpm)を比較した場合、SAS ハードディスクのスループットは、 SATA ハードディスクより 96 %高くなります。2.5 インチ SATA ハードディスク(5.4 krpm)と 3.5 インチ SATA ハードディスク(7.2 krpm)を比較した場合、3.5 インチ ハードディスクのスループットは、2.5 イン チ ハードディスクより 66 %高くなることがわかります。
LSI MegaRAID SAS 2108
可用性の観点からどのようにデータが扱われるかは、RAID アレイによって決まります。各 RAID アレイ内で データが転送される速さは、ハードディスクのデータスループットによって大きく異なります。RAID アレイ で測定用に構成されるハードディスクの数は、RAID レベルに応じて決定され、2 台または 3 台のハードディ スクが使用されました。さまざまなキャッシュ設定でのコントローラーの性能を測定するときに、ハードディ スクがボトルネックにならないように、回転数 15 krpm の 2.5 インチ SAS-2.0 ハードディスクで測定が実行 されました。 キャッシュ設定によって、スループットが大幅に向上する場合があります。ただし、このようなスループッ トの向上は、データの構造とアクセスのパターンによって異なります。測定では、コントローラーキャッシュ のオプション「Read モード」は、常に「No Read-ahead」に設定され、「I/O cache」のオプションは常に 「I/O direct」に設定されます。「Write モード」と「Disk cache」のオプションはさまざまな設定が行われま した。
次の図では、2 台の 2.5 インチ SAS-2.0 ハードディスクを使用した RAID 1 と、3 台の 2.5 インチ SAS-2.0 ハー ドディスクを使用した RAID 5 それぞれで、64 KB ブロックを使用した、シーケンシャルリード/ライトの スループットをキャッシュ設定を変えて測定した結果を示しています。 シーケンシャルリードのスループットでは、非常に 良い値が得られ、キャッシュ設定によって結果は変 化していません。 対照的に、書き込みのスループットは、キャッシュ 設定によって異なります。RAID 1 で最善のパフォー マンスを実現するために、最適なキャッシュ設定と して「Disk cache enabled」のオプションを使用す る必要があります。弊社での測定では、シーケンシャ ルライトの場合のスループットが 2.3 倍向上しまし た。 優れたパフォーマンスのために最適なキャッシュ設 定を行うことの重要性は、特に RAID 5 で明らかで す。図は、コントローラーキャッシュを「Write-back」 のオプションで有効にし、ディスクキャッシュを 「enabled」のオプションで有効にした結果、シーケン シャルライトのスループットが、大幅に(22.7 倍に) 向上したことを示しています。
LSI MegaRAID SAS 2108(512 MB のキャッシュを搭載) RAID 1 でのランダムアクセスで最善のスループットを実現するためには、コントローラーキャッシュの Write モードのオプションを「Write-through」に設定し、ハードディスクのディスクキャッシュを有効にすること が重要です。このように最適のキャッシュ設定に した結果、ランダムアクセスに 8 KB のブロック が使用されると 28 %、64 KB のブロックが使用 されると 23 %のスループットの向上が実現しま した。 RAID 5 でのランダムアクセスで最善のスループッ トを実現するためには、コントローラーキャッシュ の Write モードのオプションを「Write-back」に設 定し、ハードディスクのディスクキャッシュを有 効にすることが重要です。このような最適のキャッ シュ設定により、ブロックサイズに応じて、61 % および 42 %のスループットの向上を実現しまし た。 このトピックについての詳細は、次の文書で入手 できます:『パフォーマンスレポート - PRIMERGY 用モジュラー RAID』 コントローラーの比較 ここでは、2 つのコントローラーのスループットを比較します。同じ RAID 1 アレイで同じ種類のハードディ スクで測定されました。図では、キャッシュを無効にした場合(Off)と、最適なキャッシュ設定を行った場 合(Optimal)に得られるスループットを示しています。
SAS-2.0 ハードディスクへの接続は、LSI MegaRAID SAS 1068 または LSI MegaRAID SAS 2108 コントロー ラーを使用することで可能になります。純粋なシーケンシャルアクセスで最適なキャッシュ設定の場合、使 用したコントローラーのパフォーマンスの違いはわずかです。シーケンシャルリードでは、すべてのコント ローラーで、キャッシュ設定に関係なく最大範囲のスループットの値を実現しました。シーケンシャルライ トでも、2 つのコントローラーのパフォーマンスはほぼ同じ範囲内にあります。
負荷の高いアプリケーションプロファイルと上位の RAID レベル用に最適化されたコントローラーキャッシュ および拡張機能が搭載された LSI MegaRAID SAS 2108 コントローラーでも、この負荷プロファイルを用い た RAID 1 でのランダムアクセスで優れたパフォーマンスを発揮します。
結論
「モジュラー RAID」のコンセプトによって、PRIMERGY TX150 S7 は、さまざまなアプリケーションシナ リオの多様な要件を満たすことができます。
SATA ハードディスクの構成の場合、オンボード SATA RAID コントローラーは、ユーザーにとってコスト パフォーマンスが非常によいソリューションオプションです。
LSI MegaRAID SAS 1068 コントローラーに代表されるエントリーレベルのコントローラーでは、基本的な RAID ソリューション RAID 0、RAID 1 および RAID 1E が実現され、それぞれが非常に優れたパフォーマンスでサ ポートされています。
LSI MegaRAID SAS 2108 コントローラーに代表される「ハイエンド」コントローラーでは、現在のすべて の RAID ソリューションを実現します。最大 8 台の内蔵ハードディスクまで拡張可能な PRIMERGY TX150 S7 では、RAID レベル 0、1、5、6、10、50 および 60 がサポートされます。このコントローラーには、512 MB のコントローラーキャッシュが搭載され、オプションとして、BBU を使用したデータの保護が可能です。キャッ シュの使用に関するさまざまな設定を行うことで、使用する RAID レベルに合わせた最適なパフォーマンスを 柔軟に引き出すことができます。 RAID 5 または RAID 6 を使用すると、既存のハードディスクの容量を経済的に活用して、優れたパフォーマン スを実現できます。ただし、最善のパフォーマンスとセキュリティのためには、RAID 10 をお勧めします。 PRIMERGY TX150 S7 では、SATA、SAS、および SAS-2.0 のハードディスクから選択できます。SATA ハー ドディスクの場合は、2.5 インチと 3.5 インチハードディスクから選択できます。2.5 インチハードディスク の回転数は 5.4 krpm、3.5 インチハードディスクの回転数は 7.2 krpm です。 SAS-2.0 ハードディスクの場合は、2.5 インチと 3.5 インチハードディスクから選択できます。2.5 インチハー ドディスクの回転数は 10 krpm または 15 krpm、3.5 インチハードディスクの回転数は 15 krpm です。 SAS ハードディスクの場合は、3.5 インチハードディスクで回転数は 15 krpm です。 使用するハードディスクの種類は、必要なパフォーマンスに応じて、回転速度も含めて決定する必要があり ます。回転数 15 krpm の 2.5 インチハードディスクは、一般に回転速度の遅い製品より高いスループットを 発揮します。しかし、スループットはアクセスパターンに大きく依存します。弊社の分析では、特にランダ ムアクセスの場合に顕著で、スループットに最大 53 %の差異が出ています。2.5 インチハードディスクを使 用することで、RAID レベルに応じて、RAID アレイで使用するハードディスクを増やし、より高いレベルで の並列処理を実現できます。 最高のパフォーマンスのために、特に SATA ハードディスクを使用する場合やコントローラーキャッシュを 持たないコントローラーを使用する場合は、ハードディスクのキャッシュを有効にすることをお勧めします。 使用するディスクの種類に応じて、パフォーマンスの増加は 22.7 倍です。ハードディスクのキャッシュを有 効にする場合は、UPS の使用をお勧めします。
ベンチマーク環境
ここで説明したすべての測定は、下記の一覧で示したハードウェアとソフトウェアのコンポーネントを使用 して実行されました。
コンポーネント 詳細
サーバ PRIMERGY TX150S7
オペレーティングシステム Windows Server 2008 , Enterprise Edition Version:6.0.6001 Service Pack 1 Build 6001
ファイルシステム NTFS
測定ツール Iometer 27.07.2006
測定データ 32 GB の測定ファイル
オンボード SATA コントローラー
IntelIbexPeak BIOS: 6.00.1.05 SATA RAID モード コントローラー
「LSI MegaRAID 8 ポートベースの RAID 0/1 SAS」 (LSI MegaRAID SAS 1068)
ドライバ名: lsi_sas.sys、ドライバのバー ジョン: 1.29.03.00 ファームウェアのバージョン: 1.27.00.00 BIOS のバージョン: 06.26.00.00 コントローラー 「RAID コントローラー SAS 5/6 512MB(D2616)」 (LSI MegaRAID SAS 2108)
ドライバ名: megasys2.sys、ドライバのバー ジョン: 4.18.0.64 ファームウェアのパッケージ: 12.0.1-0057 ファームウェアのバージョン: 2.0.03-0673 BIOS のバージョン: 3.07.00 コントローラーキャッシュ: 512 MB ハードディスク SATA、2.5 インチ、5.4 krpm Hitachi HTE543232L9A300、320 GB ハードディスク SATA、3.5 インチ、7.2 krpm Western Digital WD5002ABYS、500 GB ハードディスク SAS-2.0、2.5 インチ、10 krpm Fujitsu MBD2147RC、147 GB
ハードディスク SAS-2.0、2.5 インチ、15 krpm Fujitsu MBE2147RC、147 GB ハードディスク SAS、3.5 インチ、15 krpm Seagate ST3146356SS、147 GB ハードディスク SAS-2.0、3.5 インチ、15 krpm Hitachi HUS156045VLS600、450 GB
OLTP-2
ベンチマークの説明
OLTP とは、Online Transaction Processing (オンライントランザクション処理)の略です。OLTP-2 ベンチマー クは、データベースソリューションの標準的なアプリケーションのシナリオを基にしています。OLTP-2 では、 データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps)によって 測定対象システムのパフォーマンスを表すと決められています。 独立した機関によって標準化され、それぞれのルールや規則を順守することが求められる SPECint や TPC-E などのベンチマークとは違って、OLTP-2 は富士通テクノロジー・ソリューションズで開発された内部ベン チマークです。標準化されたベンチマークでは大掛かりなハードウェアの導入や時間の消費が必要なことが ありますが、OLTP-2 では適度なレベルに抑えられていて、さまざまな構成を限られた時間で測定できます。 OLTP-2 と TPC-E の 2 つの ベンチマークが同じワークロードを使用して同様のアプリケーションのシナリオを シミュレートしても、この 2 つのベンチマークは異なる方法を使用してユーザーの負荷をシミュレートする ので、結果を比較することも、同等のものとして扱うこともできません。OLTP-2 の値は、通常、TPC-E と 同じような値になります。しかし、特に価格性能比が算出されないという理由により、直接的な比較だけで なく、OLTP-2 の結果を TPC-E として参照することもできません。
ベンチマーク結果
PRIMERGY TX150 S7 用のプロセッサはいくつかリリースされています。次の表は、OLTP-2 測定で使用し たプロセッサです。 プロセッサ コア 数/ チップ HT TM GHz L3 キャッシュ メモリ TDP tps Celeron G1101 2 2.27 2 MB/チップ 1067 MHz 73 W 91.49 Pentium G6950 2 2.80 3 MB/チップ 1067 MHz 73 W 106.64 Core i3-530 2 2.93 4 MB/チップ 1333 MHz 73 W 166.21 Core i3-540 2 3.07 4 MB/チップ 1333 MHz 73 W 170.70 Xeon L3426 4 1.87 8 MB/チップ 1333 MHz 45 W 288.50 Xeon X3430 4 2.40 8 MB/チップ 1333 MHz 95 W 271.94 Xeon X3440 4 2.53 8 MB/チップ 1333 MHz 95 W 350.06 Xeon X3450 4 2.67 8 MB/チップ 1333 MHz 95 W 357.78 Xeon X3460 4 2.80 8 MB/チップ 1333 MHz 95 W 374.08 Xeon X3470 4 2.93 8 MB/チップ 1333 MHz 95 W 385.41 HT = ハイパースレッディング、TM = ターボモード、TDP = 熱設計電力すべての結果は、オペレーティングシステム Microsoft Windows Server 2008 Enterprise x64 Edition SP1 と データベース SQL Server 2008 Enterprise x64 Edition SP1 で測定されたものです。OLTP-2 のベンチマーク 結果は、ハードディスクとコントローラーを含むシステムの構成オプションによって、大幅に異なります。 このため、システムには、2 枚の 2 ポート SAS RAID コントローラーを搭載し、12 台の PRIMERGY SX40 に 接続しました(合計 144 台の SAS ハードディスクを搭載)。ディスクサブシステムは、測定でのボトルネッ クにならないように配置されました。他のディスクサブシステムでも、ボトルネックになっていなければ、 比較可能な結果を得られる場合があります。システム構成の詳細については、「ベンチマーク環境」セクションを 参照してください。
メモリモジュール 4 枚構成の PRIMERGY TX150 S7 の最大メモリ容量は、プロセッサの種類によって異なり ます。 Celeron、Pentium、および Core i3 プロセッサでは、バス周波数 1067 MHz または 1333 MHz で、UDIMM のメモリを最大 16 GB 使用できます。 Xeon プロセッサでは、最大 32 GB の RDIMM を使用できます。 Xeon
プロセッサは 1333 MHz でメモリにアクセスできますが、合計 32 GB の場合のアクセスは 1067 MHz にしか なりません。
次の図は、PRIMERGY TX150 S7 において、メモリ 16 GB で Celeron G1101、Pentium G6950、Core i3-530、 Core i3-540 プロセッサを使用した場合と、 メモリ 32 GB で Xeon L3426、X3430、 X3440、X3450、X3460、X3470 プロセッ サを使用した場合の OLTP-2 パフォー マンスデータを示しています。 1 つ 目 の 図 の 最 大 の 性 能 向 上 率 は 、 Pentium と Core-i3 との間で、+56 %で す。このスループットの向上は、高周波 数、大容量キャッシュ、高メモリアクセ ス周波数、およびハイパースレッディン グの影響です。 すべての Xeon プロセッサタイプにおけ る最大の性能向上率は、X3430 と X3440 との間で、+29 %です。この差はハイパー スレッディングによるものです。すべて のケースで周波数が高いほどスループッ トも向上しました。 デ ュアル コア i3-540 と ク アッド コア X3430 を比較すると、コア数とメモリサ イズが倍になったことによる性能向上率 は +59 %です。 デュアルコアプロセッサと 16 GB メモリ搭載の TX150 S7 での OLTP-2 値 クアッドコアプロセッサと 32 GB メモリ搭載の TX150 S7 での OLTP-2 値
ベンチマーク環境
テスト対象システム(B 層) ハードウェア
サーバ PRIMERGY TX150 S7
プロセッサ Celeron G1101、Pentium G6950、Core i3-530、Core i3-540、 Xeon L3426、X3430、X3440、X3450、X3460、X3470 メモリ 4 GB DDR3 PC3-10600E x 4 枚または 8 GB DDR3 PC3-8500R x 4 枚 設定(デフォルト) ターボモード有効、ハイパースレッディング有効 ネットワークインター フェース 1 ギガビット LAN Intel(オンボード)(2 セット) ディスクサブシステム PRIMERGY TX150 S7: RAID コントローラー SAS 6G 5/6 512MB(1 基) HD SAS 6G 146GB 15000 3.5 インチ(1 台)、RAID-0、OS HD SAS 6G 146GB 15000 3.5 インチ(3 台)、RAID-0、ログ LSI SAS MegaRAID 9280-8e(2 基)
FibreCAT SX40(12 台):
Seagate 146 GB 15 krpm、RAID-0、データ用(144 台) ソフトウェア
オペレーティングシス
テム Windows Server 2008 Enterprise x64 Edition SP1 データベース SQL Server 2008 Enterprise x64 Edition SP1
国または販売地域によっては一部のコンポーネントが利用できない場合があります。
LAN スイッチ 負荷ジェネレーター