• 検索結果がありません。

2. ハードウェア構成 

N/A
N/A
Protected

Academic year: 2021

シェア "2. ハードウェア構成 "

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

 

並列コンピュータ TX7/i9610 のハードウェア 

渋谷  俊輝 1    木村  真行 2    近藤  秀俊 2

   

1. はじめに 

TX7/i9610は米Intel®社の最新64bitマイクロプロセッサItanium®2を64CPUまで搭載可能なスカ ラ並列型演算サーバです.TX7/i9610はメインフレームやスーパーコンピュータの技術とノウハウ を取り入れた,NEC独自開発のチップセット,ファームウェア,サービスプロセッサにより高性能,

高信頼性,高可用性を同時に実現するシステムアーキテクチャを有しています.特にccNUMA構 造のスカラコンピュータ向けにチューニングされたアプリケーションの性能を最大限に引き出すこ とが可能なプラットフォームとなっています.本稿では,TX7/i9610システムのハードウェアについ てご紹介します.     

 

2. ハードウェア構成 

2.1. 特長 

表1にTX7/i9610の諸元を示します.特長を要約すると以下のようになります.   

(1)  最大64CPUの64ビットプロセッサItanium®2を搭載可能なccNUMA(Cache Coherent  Non-Uniform Memory Access)アーキテクチャサーバです.   

(2)  メモリは最大512GB搭載可能です. 

(3)  IOスロットとして最大64スロットのPCI-Xスロットをサポートします.   

(4)  低メモリレイテンシと高いメモリ/IO転送性能により,高いシステム性能を追求しています.   

(5)  専用に開発した高速チップセットにより,高いスケーラビリティを実現しています. 

(6)  プロセッサ/メモリ/IOの構成に,柔軟に対応可能なセルアーキテクチャを採用していま す.   

(7)  セルを構成単位とするパーティショニング機能をサポートし複数OS搭載による柔軟なシス テム構成が実現可能です.   

(8)  データパス系にはECCを付与し,アドレス,制御信号系にはパリティを備えて障害検出能 力を向上させ,高信頼システムの構築に対応しています.   

(9)  サービスプロセッサを備え,障害情報の収集,障害発生箇所の指摘,障害箇所の自動切り

1  日本電気株式会社  コンピュータ事業部 

2

(2)

離し/自動再立ち上げを実現しています.   

(10)  冗長構成の電源/ファンを採用する他,各所でホットプラグをサポートしており,可用性 の向上を図っています.   

表1  TX7/i9610  (1ノード)  諸元 

項目 諸元

プロセッサ Intel® Itanium®2 最大64CPU 最大メモリ容量 512GB

標準IOスロット数 PCI-X 133MHz×64

筐体サイズ 600(W)×1072(D)×1800(H) mm

重量 570Kg

   

写真1にTX7/i9610(1ノード)の外観を示します. 

  写真1  TX7/i9610  (1ノード)  外観 

   

(3)

2.2  基本構造   

図1に本体装置のハードウェアシステム構成を示します.本体装置は,プロセッサモジュール/

メモリを持つセルカード8枚を中核に,IO機能を提供するIOモジュール,セルカード間および,セ ルカードとIOモジュール間を接続するクロスバスイッチからなります.  各セルカードは,8CPUで 構成されるプロセッサモジュール,64GBのメモリを搭載し,クロスバスイッチを介してIOモジュー ルとの接続が可能です.CPUとメモリをバランスよくセルカードに搭載したセルアーキテクチャを 採用しているため,要求される能力に応じて段階的にコストを抑えた増設が可能です.また,セ ルカードおよびIOモジュールはクロスバスイッチを介して接続されているため,様々な構成にも柔 軟に対応可能となっています.  さらに,通常のccNUMA対応のアプリケーションに対して,クロス バスイッチに充分なデータ転送帯域を保証しているため,小規模ジョブの多重実行や大規模ジョ ブの実行でも,CPUの演算能力を最大限に引き出すことが可能となっています. 

   

クロスバスイッチ

I/Oモジュール セルカード

プロセッサモジュール メモリ

I/Oモジュール チップセット

セルカード

チップセット

I/Oモジュール I/Oモジュール I/Oモジュール I/Oモジュール I/Oモジュール I/Oモジュール

セルカード セルカード セルカード セルカード セルカード セルカード

クロスバスイッチ

I/Oモジュール セルカード

プロセッサモジュール メモリ メモリ

I/Oモジュール I/Oモジュール チップセット

セルカード

チップセット

I/Oモジュール

I/Oモジュール I/OモジュールI/Oモジュール I/OモジュールI/Oモジュール I/OモジュールI/Oモジュール I/OモジュールI/Oモジュール I/OモジュールI/Oモジュール セルカード セルカード セルカード セルカード セルカード セルカード

                         

図 1  TX7/i9610 System Block Diagram(最大構成時) 

2.3. I/O 構成 

TX7/i9610のIOシステムは,システム構成に応じてPCIカードを増設するための拡張IO機能を 提供する複数のIOモジュールから構成されます.  1台のIOモジュールには64ビット,133MHzタ

(4)

また,TX7/i9610ではHPCC(High Performance Computing Clusters)やデータセンター内のクラス タシステム間の接続など,超高速での通信が求められる分野に適したInfiniBandカードを搭載す ることが可能です.InfiniBandの通信速度は1チャネルあたり2.5Gbpsで,1本のケーブルあたりの 理論転送性能は,片方向で約1GB/sとなります. 

 

3. Itanium

®

2プロセッサの特長   

TX7/i9610は,米Intel®社製のItanium®2プロセッサを最大64CPUまで搭載することが可能です.

Itanium®2プロセッサは,Intel®社が開発した64ビットアーキテクチャであるItanium®2アーキテクチ ャを採用したプロセッサです.  表2にItanium®2プロセッサの仕様を示します.   

       

表 2  Itanium®2 の仕様 

項目 仕様

汎用レジスタ数 整数128,浮動小数点128 パイプライン段数 8

実行ユニット ALU ×6 分岐ユニット ×3 浮動小数点ユニット ×2 アドレス空間 仮想メモリ空間 64bit

実メモリ空間   50bit

 

Itanium®2アーキテクチャは,「明示的に並列性を記述した命令のサポート」および「命令レベル の並列性を強化する機能のサポート」により命令の高い並列処理を実現したItanium®アーキテク チャの特長を継承し,さらに,CPUあたりの実行ユニットALUの増加(4→6),アドレス空間拡大 (44bit→50bit),キャッシュサイズ増加により処理性能の向上を図っています. 

 

4. ハードウェア性能 

4.1. 高いスケーラビリティの実現   

  TX7/i9610 は,専用に開発した高速チップセットにより,高いスケーラビリティを実現し,最大構 成時 409.6 GFLOPS の計算能力を有します. 

図 2 は,従来機種(TX7/AzusA)に対する TX7/i9610 のスケーラビリティと性能比を表しています. 

 

(5)

量 子 化 学 計 算 性 能 比  [ TX7 / A zu sA = 1 ]

0 2 0 4 0 6 0 8 0 1 0 0 1 2 0

1 CP U 8 CP U 1 6 CP U 3 2 CP U 6 4 CP U CP U 数

性能比

TX7 / A zu sA TX7 / i9 6 1 0

TX7/AzusA

TX7/i9610

 

図 2  TX7/i9610 スケーラビリティと性能比 

 

4.2. 高いスループットの実現 

  TX7/i9610 は,プロセッサバスのバンド幅増強,セル内のツインプロセッサバス構造,および最 新 LSI テクノロジによる高速データ転送により,高いスループットを実現しています.コヒーレンシ を保持するためのディレクトリをメモリ単位に設け,メモリのライン単位でキャッシング情報を全ライ ン分格納していることから,キャッシュスワップ等のプロセッサバストラフィック増大要因が軽減され,

高いメモリスループットを維持します.図 3 は,前機種(TX7/AzusA)に対する TX7/i9610 のスルー プット性能の比較を表しています. 

 

(6)

スループット性能(メモリコピー性能) [TX7/AzusA=1]

0 10 20 30 40

TX7/AzusA TX7/i9610

スループット比

30 倍アップ!

 

図 3  TX7/i9610  スループット比較 

 

5. むすび   

以上,スカラ並列型演算サーバ TX7/i9610 について述べました.今後も,科学技術用途にお ける大規模高速演算のご要求や,IT 社会基盤の構成要素としてのサーバの重要度は増す一方 です.弊社は継続して IPF サーバを開発することにより,さらに高い処理性能,拡張性,信頼性を 実現する製品を提供してまいります.   

 

参照

関連したドキュメント

カスタムメイドで RAID 構成 PCI Express x1 1 なし RAID 専用インターフェース (カスタムメイド専用) 1 SATA-RAID カードを搭載

164 日立評論 VOL.64 No.3(柑82-3) 成し,二重化構成を可能とした。 臣】 システム構成

OSのビット数 Windows 7 : 32ビット または 64ビット Windows 8.1 : 32ビット または 64ビット Windows10 : 32ビット または 64ビット Windows Server 2012 R2 :

 運用中の swap の使用状況は free コマンドで確認することができます。swap の使用率が高い場合は、

 運用中の swap の使用状況は free コマンドで確認することができます。swap の使用率が高い場合は、

HP Z600 後期型 Workstation システム構成図 2011年4月28日版 グラフィックコントローラ NVIDIA Quadro NVS 295 FY943AA PCI Express NVIDIA Quadro

http://h18006.www1.hp.com/products/storageworks/tapecompatibility.html PCI Express スロット対応ファイバチャネルホストバスアダプタ(8Gb/s