富士通 SPARC64™ VII プ ロ セ ッ サ
Fujitsu Limited
Release 1.0. 1 June 2008
Fujitsu Limited 4-1-1 Kamikodanaka Nakahara-ku, Kawasaki, 211-8588 JapanCopyright© 2008 Fujitsu Limited, 4-1-1 Kamikodanaka, Nakahara-ku, Kawasaki, 211-8588, Japan. All rights reserved.
This product and related documentation are protected by copyright and distributed under licenses restricting their use, copying, distribution, and decompilation. No part of this product or related documentation may be reproduced in any form by any means without prior written authorization of Fujitsu Limited and its licen-sors, if any.
The product(s) described in this book may be protected by one or more U.S. patents, foreign patents, or pending applications.
TRADEMARKS
SPARC® is a registered trademark of SPARC International, Inc. Products bearing SPARC trademarks are based on an architecture developed by Sun Microsystems, Inc.
SPARC64 is a registered trademark of SPARC International, Inc., licensed exclusively to Fujitsu Limited.
UNIX is a registered trademark of The Open Group in the United States and other countries.
Sun, Sun Microsystems, the Sun logo, Solaris, and all Solaris-related trademarks and logos are registered trademarks of Sun Microsystems, Inc.
Fujitsu and the Fujitsu logo are trademarks of Fujitsu Limited.
All other company, product names mentioned may be trademarks orregistered trademarks of their respective holders and are used for identification purpose only.
This publication is provided “as is” without warranty of any kind, either express or implied, includ-ing, but not limited to, the implied warranties of merchantability, fitness for a particular purpose, or noninfringement. This publication could include technical inaccuracies or typographical errors. Changes are periodically added to the information herein; these changes will be incorporated in new editions of the publication. Fujitsu Limited may make improvements and/or changes in the product(s) and/or the program(s) described in this publication at any time.
目次
1
SPARC64
シ リ ーズについて
1
2
SPARC64 VII 概要
1
3
SPARC64 VII のマ イ ク ロ アーキ テ ク チ ャ
2
3.1
マ イ ク ロ アーキ テ ク チ ャ 詳細
2
3.2
命令フ ェ ッ チ部
3
3.3
命令実行部
3
4
キ ャ ッ シ ュ シ ス テ ム
5
5
RAS
機能 (Reliability, Availability, Serviceability) 7
5.1
内蔵 RAM の RAS 7
5.2
内蔵 レ ジ ス タ と 演算機の RAS 8
5.3
同期一括更新方式 と 命令 リ ト ラ イ
8
5.4
サービ ス性の向上
9
6
むすび
10
7
参考文献
10
1
SPARC64 シ リ ーズについて
SPARC64 シ リ ーズは富士通が開発 し てい る UNIX サーバ用 SPARC プ ロ セ ッ サです。 SPARC64 V では、 メ イ ン フ レーム ク ラ ス の高信頼性技術 と GHz を超え る周波数を実現し ま し た。 こ のプ ロ セ ッ サは富士通の PRIMEPOWER サーバに使用 さ れま し た。 そ し て SPARC64 VI は、 SPARC64 V をベースに 2 コ ア× 2 ス レ ッ ド 化する こ と で高スループ ッ ト 化を実現 し ま し た。 こ のプ ロ セ ッ サは SPARC Enterprise サーバに使用さ れています。
2
SPARC64 V
II 概要
SPARC64 VII は、 富士通が開発 し た SPARC64 シ リ ーズの最新プ ロ セ ッ サです。 富士通の 65nm テ ク ノ ロ ジ を用い, 動作 周波数は 2.5GHz, チ ッ プサ イ ズは 21.3mm x 20.9mm です。 チ ッ プは 4 コ ア を内蔵し、 共有の 6MB の L2 キ ャ ッ シ ュ を持 つ構造 と な っ てい ます。 動作消費電力は最大 135W です。
SPARC64 VII の設計に当た っ ては、 現行の SPARC64 VI の高性能 ・ 高信頼性を保ちつつ、 スループ ッ ト 性能の大幅強化 を図 り ま し た。 スループ ッ ト 性能強化のために内蔵する コ ア数を 2 か ら 4 に倍増し 、 さ ら にマルチス レ ッ ド 機構を VMT か ら SMT に変更し ま し た。 L2 キ ャ ッ シ ュ は 4 コ アで共用する構成 と し ,4 つの コ アへデータ供給を行 う ためにスルー プ ッ ト を倍増 さ せま し た。 ま た特に HPC 分野に向け、 ハー ド ウ エアバ リ ア と 呼ぶコ ア間高速同期機構を実装し ま し た。 一方バス プ ロ ト コ ルを現行 SPARC64 VI と 同一にする こ と で、 SPARC64 VI か ら SPARC64 VII への CPU モジ ュール単位 でのア ッ プグ レー ド を可能 と し てい ます。
3
SPARC64 VII のマ イ ク ロ アーキ テ ク チ ャ
SPARC64 VII のマ イ ク ロ アーキ テ ク チ ャ について概要を述べます。 コ ア部のパ イ プ ラ イ ンの基本構造は SPARC64 VI と 同一ですが, SPARC64 VII では、 マルチス レ ッ ド の実装を VMT (Vertical Multi-Threading) か ら SMT (Simultaneous Mult-Threading) へ変更 し ま し た。 図 1 に示す と お り 、 4 つあ る 各コ アの上で二つの ス レ ッ ド を同時に実行する こ と が可能で す。 CORE0 thread0 thread1 CORE1 CORE2 CORE3 thread0 thread1 thread0 thread1 thread0 thread1 time 図1 SPARC64 VII のマルチ ス レ ッ ド SMT の設計にあ た っ ては、 ス レ ッ ド 間の相互干渉を で き る 限 り 除 く こ と を主眼におき ま し た。 両ス レ ッ ド が動作 し てい る時は, 原則 と し てハー ド ウ エア リ ソ ース を ス レ ッ ド 毎に分離する構成 と し ています。 逆にど ち ら かのス レ ッ ド がア イ ド ル状態の と き は, 他方のス レ ッ ド が一部の リ ソ ース を除き両ス レ ッ ド の リ ソ ース を使用可能 と する こ と で、 シ ン グル ス レ ッ ド の性能向上を狙い ま し た。 コ アのパ イ プ ラ イ ンは、 両ス レ ッ ド で共用する構成 と な っ てい ます。 但し 一方の ス レ ッ ド がパ イ プ ラ イ ン ス ト ール し た 場合 も , 他のス レ ッ ド の処理が停滞し ない よ う に制御を行っ ています。 命令フ ェ ッ チ / 命令デコー ド / コ ミ ッ ト ス テー ジにおいてはサ イ ク ルご と にど ち ら か一方の ス レ ッ ド を選択し ます。
3.1 マイ ク ロ ア ーキ テ ク チャ 詳細
以下にマ イ ク ロ アーキテ ク チ ャ の詳細について述べます。 SPARC64 VII の コ アは、 図 2 に示す よ う に、 命令フ ェ ッ チ部 と 命令実行部に分かれ、 命令フ ェ ッ チ部には命令専用の 1 次キ ャ ッ シ ュ (L1I キ ャ ッ シ ュ ) を含み、 実行部にはオペラ ン ド 専用の 1 次キ ャ ッ シ ュ (L1D キ ャ ッ シ ュ ) を含んでいま す。 2命 令 フ ェ ッ チ 部 命 令 実 行 部 IW R L1I$ IB U F 分 岐 予 測 R SA R SBR R SF R SE L1D$ FP SP AG EN FL EX 図2 SPARC64 VII コ アの機能図
3.2 命令フ ェ ッ チ部
命令フ ェ ッ チ部は、 命令実行部 と は独立し て動作し 、 分岐予測に従っ て将来実行する命令列を命令バ ッ フ ァ IBUF (Instruction BUFfer) に取 り 込みます。 IBUF の容量は 256 バ イ ト であ り 、 最大 64 命令の保持が可能です。 両ス レ ッ ド が動 作し てい る時は、 命令バ ッ フ ァ を ス レ ッ ド ご と に均等に分割し て使用し ます。 命令実行が滞っ た場合に も 、 IBUF が一杯にな る まで命令フ ェ ッ チは停止し ません。 逆に、 キ ャ ッ シ ュ ・ ミ ス等で命令 フ ェ ッ チが停止し た場合に も 、 IBUF に命令があ る限 り 、 そ こ か ら 命令を取 り 出し て実行を継続可能です。 命令フ ェ ッ チは毎サ イ ク ル起動で き、 一度に 32 バ イ ト すなわち 8 命令を取 り 出し ます。 命令実行のスループ ッ ト はサ イ ク ルあた り 最大 4 命令であ り 、 命令フ ェ ッ チは命令実行の 2 倍のスループ ッ ト を確保し ています。 IBUF は命令フ ェ ッ チ と 命令 実行を分離 ( デカ ッ プ リ ン グ ) する こ と で、 大容量の命令 1 次キ ャ ッ シ ュ のレ イ テンシ を隠蔽し ています。3.3 命令実行部
命令デコ ード およ び発行 命令デコー ド およ び発行ス テージでは、 IWR 上の 4 つの命令を同時にデコー ド し て、 実行に必要な資源 ( 各種 リ ザベー シ ョ ン ・ ス テーシ ョ ン、 フ ェ ッ チポー ト ・ ス ト アポー ト 、 レ ジ ス タ 更新バ ッ フ ァ ) を決定し ます。 そ し て、 その資源に 空き があ る かど う かをチ ェ ッ ク し て、 空き があれば、 その資源を割 り 当て る と と も に、 0 ~ 63 の範囲の命令識別子 (IID、 Instruction IDentification) を割 り 当て て命令を発行 し ます。 つま り イ ン フ ラ イ ト 命令の最大数は 64 命令です。 一方 両ス レ ッ ド 動作時は各ス レ ッ ド の最大命令数は 32 命令です。 同じ サ イ ク ルにど ち ら かのス レ ッ ド の命令デコー ド を行 い, 交互にス レ ッ ド を切 り 替え ます。命令を発行する と その IWR を開放し ます。 IWR のどのス ロ ッ ト にあ る命令であ っ て も 、 リ ザベーシ ョ ン ・ ス テーシ ョ ン等の資源の割 り 当て制限はな く 、 ま た、 命令種類の組み合わせの制限 も あ り ません。 こ のため、 資源の空き さ えあれ ば命令を発行可能です。 4 命令分の空き が無い場合に も 、 プ ロ グ ラ ム順序の命令か ら 可能な分だけを発行し ます。 こ の よ う に命令発行の停滞を極力排除し た方式に よ り 、 どの よ う なバ イ ナ リ コー ド であ っ て も 常に高い並列度を確保し てい ます。 命令実行 デコー ド さ れた命令は リ ザベーシ ョ ン ス テーシ ョ ンに登録 さ れます。 SPARC64 VII は、 整数演算用 リ ザベーシ ョ ン ・ ス テーシ ョ ン RSE(Reservation Station for Execution) と 浮動小数点演算用 リ ザベーシ ョ ン ・ ス テーシ ョ ン RSF(Reservation Station for Floating point) を装備 し てい ます。 RSE と RSF は、 演算器に対応 し て、 それぞれ 2 つのキ ュ ーに分かれてい ま す。 すなわち演算用の リ ザベーシ ョ ン ・ ス テーシ ョ ンは、 RSEA、 RSEB、 RSFA 、 RSFB の 4 種を備えています。 リ ザ ベーシ ョ ン ・ ス テーシ ョ ンに格納 さ れた各々の命令は、 ソ ース オペラ ン ド が用意で き た も のか ら 、 個々の リ ザベーシ ョ ン ・ ス テーシ ョ ン毎に順次対応する 演算器に投入し ます。 し たがっ て 4 つの演算を同時に投入可能です。 投入アルゴ リ ズ ムは、 基本的には リ ザベーシ ョ ン ・ ス テーシ ョ ンにあ る命令の う ち、 投入可能で 1 番古い (Oldest Ready) も のを選択す る方法を採用し てい ます。 し か し ロ ー ド 命令が更新する レ ジ ス タ を ソ ース オペラ ン ド と し て演算する よ う な場合には、 ロ ー ド 命令の結果が得 ら れ る以前に投機的に投入し 、 演算ス テージで投機的な実行が良かっ たか否かを判断し てい ま す。 こ れを投機的投入 (Speculative dispatch) と 呼んでいます。 投機的投入よ り 、 キ ャ ッ シ ュ ア ク セ スのパ イ プ ラ イ ンのレ イ テ ン シ を隠蔽し て演算器の使用効率を高めてい ます。
リ ザベーシ ョ ン ・ ス テーシ ョ ン と し ては上記の RSE,RSF 以外に分岐命令用の RSBR(Reservation Station for Branch) 、 及び ロ ー ド ス ト ア命令のア ド レ ス計算用の RSA(Reservation Station for Address generation) があ り ます。
命令コ ミ ッ ト ア ウ ト ・ オブ ・ オーダで実行し た結果は、 すべて ソ フ ト ウ ェ アか ら 見えない作業用レ ジ ス タ であ る GUB、 FUB に一旦 格納し ます。 プ ロ グ ラ ムの順序性を保証する ために、 GPR や FPR な どのレ ジ ス タや メ モ リ は、 コ ミ ッ ト ス テージでプ ロ グ ラ ム命令順序に従っ て ( イ ン ・ オーダで ) 更新し ます。 さ ら に、 PC をは じ め と する制御レ ジ ス タ も 、 コ ミ ッ ト ス テー ジで一括し て更新し ます。 こ れに よ り 、 正確な割 り 込みを保証し 、 いつで も 実行中の処理のキ ャ ンセルが可能 と な っ て い ます。 こ れを同期一括更新方式 と 呼び、 分岐予測 ミ ス に関わ るや り 直し を簡単にする ばか り ではな く て、 後の章で説 明する よ う に、 RAS の向上に寄与し ています。 同時に コ ミ ッ ト で き る命令数は最大 4 です。 命令コ ミ ッ ト ス テージは 2 つの ス レ ッ ド で共用 さ れてお り , サ イ ク ルご と にど ち ら か一方のス レ ッ ド を選択し コ ミ ッ ト 処理を行います。 4
4
キ ャ ッ シ ュ シ ス テ ム
SPARC64 VII のキ ャ ッ シ ュ は、 中容量の 1 次キ ャ ッ シ ュ (L1 キ ャ ッ シ ュ ) と 大容量の 2 次キ ャ ッ シ ュ (L2 キ ャ ッ シ ュ ) の二階層で構成 さ れてい ます。 L1D キャッシュ IBUF Dec Issue RSA RSE RSF RSBR FP/SP EX FL AGEN L1Iキャッシュ 分岐 予測L2キャッシュ 6MB 256B line, 12 way
16byte 32byteCORE0
CORE1 CORE2 CORE3
図3 SPARC64 VII コ ア と キ ャ ッ シ ュ
L1 キ ャ ッ シ ュ は、 命令専用のキ ャ ッ シ ュ (L1I キ ャ ッ シ ュ ) と オペ ラ ン ド 専用のキ ャ ッ シ ュ (L1D キ ャ ッ シ ュ ) で構成 さ れ、 いずれ も 容量 64K バ イ ト /2 ウ ェ イ ・ セ ッ ト ア ソ シアテ ィ ブ、 ブ ロ ッ ク サ イ ズは 64 バ イ ト です。 L1D キ ャ ッ シ ュ は、 4 バ イ ト ア ド レ ス境界で 8 つのバン ク に分割 さ れてお り 、 2 つのオペラ ン ド の同時ア ク セ ス を実現し ています。 L1 キ ャ ッ シ ュ は、 キ ャ ッ シ ュ イ ンデ ッ ク ス に仮想ア ド レ ス を、 キ ャ ッ シ ュ タ グには物理ア ド レ ス を用いてい ます (VIPT : Virtually Indexed Physically Tagged) 。 VIPT 方式では、 メ モ リ の同 じ 領域が異な る 仮想ア ド レ ス でア ク セ ス さ れ る と 、 キ ャ ッ シ ュ の別の イ ンデ ク ス に登録 さ れて、 一貫性を損な う おそれがあ り ます ( シ ノ ニム問題 )。 SPARC64 VII では L2 キ ャ ッ シ ュ と の連携に よ っ てハー ド ウ ェ アでシ ノ ニ ム問題を解決し てい ます。 L2 キ ャ ッ シ ュ は、 容量最大 6MB/12 ウ ェ イ ・ セ ッ ト ア ソ シ ア テ ィ ブ、 ブ ロ ッ ク サ イ ズは 256 バ イ ト であ り 、 4 コ アで共 有 さ れてい ます。 2 バン ク の イ ン タ リ ーブ構成 と する こ と で、 1 サ イ ク ルあた り 64 バ イ ト のデータ を読み出し可能 と し てい ます。 L2 キ ャ ッ シ ュ か ら 読み出し たデータ を L1 キ ャ ッ シ ュ に送るバスは、 2 コ ア当た り 32 バ イ ト 幅 , L1 キ ャ ッ シ ュ か ら L2 キ ャ ッ シ ュ にデータ を送るバスは 1 コ ア当た り 16 バ イ ト 幅です。 L1 キ ャ ッ シ ュ 、 L2 キ ャ ッ シ ュ と も 、 ラ イ ト バ ッ ク と 呼ばれ る ス ト ア制御方式であ り 、 書き 込みはその階層のキ ャ ッ シ ュ に対し て行い ます。 ラ イ ト バ ッ ク 方式では、 キ ャ ッ シ ュ ・ ミ ス し た場合には、 ス ト アであ っ て も メ モ リ 上の旧デー タ を一旦キ ャ ッ シ ュ に持ち込む必要があ る反面、 キ ャ ッ シ ュ ・ ヒ ッ ト し た ス ト アは、 キ ャ ッ シ ュ上だけで完了し ます。 一般的に ス ト アの頻度はかな り 高いために、 ラ イ ト バ ッ ク 方式は、 キ ャ ッ シ ュ間の ト ラ フ ィ ッ ク や メ モ リ ア ク セ ス の ト ラ フ ィ ッ ク が削減で き る点が有利です。
一方ラ イ ト バ ッ ク 方式では最新データ を キ ャ ッ シ ュ上に握っ てい る ために、 そのプ ロ セ ッ サでエ ラ ーが発生する と 、 被 害がプ ロ セ ッ サ内に止ま ら ずにシ ス テ ムに及ぶ危険性があ り ます。 SPARC64 VII は強力な RAS 機能で こ の問題に対処し てい ます。
ま た SPARC64 VII では, 新たにハー ド ウ ェ アバ リ ア機構を実装し ま し た。 ハー ド ウ ェ アバ リ ア機構は CPU チ ッ プ内で コ ア間の同期を取る ための機構であ り 、 従来の ソ フ ト ウ エアに よ る同期方式に比べて高速な同期処理が可能 と な っ てい ます。 こ の機能は、 特に HPC(High Performance Computing) 分野に有用です。
5
RAS
機能 (Reliability, Availability, Serviceability)
SPARC64 VII は、 メ イ ン フ レームに匹敵す る RAS を実現 し てい ます。 確実にエ ラ ーを検出する こ と 、 エ ラ ーの影響範囲 を限定する こ と 、 回復処理を試みる こ と 、 エ ラ ーの記録を残す こ と 、 ソ フ ト ウ ェ アに通知する こ と な ど、 RAS の基本的 な事項を徹底し てい ます。 こ れに よ り SPARC64 VII は、 ミ ッ シ ョ ン ク リ テ ィ カルな UNIX サーバのプ ロ セ ッ サ と し て、 高度な信頼性、 可用性、 サービ ス性、 データ 保全性を提供し てい ます。
5.1 内蔵 RAM の RAS
RAM はプ ロ セ ッ サ内で最 も エ ラ ーの発生頻度が高い部分です。 SPARC64 VII においては、 RAM の 1 ビ ッ ト ・ エ ラ ーは ソ フ ト ウ ェ アの介入な し に全てハー ド ウ ェ アで自動的に訂正する ため、 ソ フ ト ウ ェ アへの影響は皆無です。
種別 エ ラ ー検出方法保護方法 エ ラ ー訂正方法
L 1 命令キ ャ ッ シ ュ デー タ パ リ テ ィ 無効化及び再読み込み
タ グ パ リ テ ィ +二重化 二重化デー タ の再書 き 込み
L 1 デー タ キ ャ ッ シ ュ デー タ SECDED ECC ECC に よ る 1 ビ ッ ト エ ラ ー訂正
タ グ パ リ テ ィ +二重化 二重化デー タ の再書 き 込み
L 2 キ ャ ッ シ ュ デー タ SECDED ECC ECC に よ る 1 ビ ッ ト エ ラ ー訂正
タ グ SECDED ECC ECC に よ る 1 ビ ッ ト エ ラ ー訂正
命令 T L B パ リ テ ィ 無効化
デー タ T L B パ リ テ ィ 無効化
ブ ラ ンチ ヒ ス ト リ パ リ テ ィ 分岐予測失敗か ら の回復
SECDED : Single Error Correction Double Error Detection
L1 キ ャ ッ シ ュ、 L2 キ ャ ッ シ ュ、 TLB はウ ェ イ 単位での縮退が可能です。 エ ラ ーの発生回数を機能単位ご と にカ ウ ン ト し 、 単位時間あた り のエ ラ ー回数が上限値を越え る と 縮退し て、 それ以降はその ウ ェ イ を使用し ない よ う に し ます。 縮退はハー ド ウ ェ アで自動的に行い ますが、 こ れに際し て コ ヒ ーレ ン シ を維持する ための保証動作 も ハー ド ウ ェ アで自 動的に行い ます。 すなわち、 L1D キ ャ ッ シ ュ の縮退 さ れる ウ ェ イ のダーテ ィ ラ イ ン を全て L2 キ ャ ッ シ ュ に書き戻す動 作、 L2 キ ャ ッ シ ュ の縮退 さ れる ウ ェ イ のダーテ ィ ラ イ ン を メ モ リ に書き戻す動作はハー ド ウ エアで自動的に実行し ま す。 ウ ェ イ 縮退は、 ソ フ ト ウ ェ アにダ メ ージ を与え る こ と な く 実行 さ れ、 ソ フ ト ウ エアは処理速度の低下を除いて動作 に影響を受け ません。
5.2 内蔵レ ジ ス タ と 演算機の RAS
SPARC64 VII はレ ジ ス タ や演算器 も エ ラ ー保護する こ と で、 デー タ 保全性に万全を期 し てい ます。 種別 保護方法エ ラ ー検出方法 レ ジ ス タ 整数 レ ジ ス タ SECDED ECC 浮動小数点 レ ジ ス タ パ リ テ ィ PC, PSTATE 等 パ リ テ ィ種別 保護方法エ ラ ー検出方法
演算入出力 レ ジ ス タ パ リ テ ィ
演算器 加減算 , 除算 , シ フ トグ ラ フ ィ ッ ク ス演算 パ リ テ ィ 予測
乗算 パ リ テ ィ 予測 + 剰余チ ェ ッ ク
整数アーキテ ク チ ャ レ ジ ス タ では よ り 信頼度を高め る ため, SPARC64 VII か ら ECC を採用し ま し た。 エ ラ ー発生時には ECC 回路でエ ラ ーを訂正 し ます。 浮動小数点アーキ テ ク チ ャ レ ジ ス タ や他の レ ジ ス タ はパ リ テ ィ ビ ッ ト が付加 さ れてい ます。 ま た演算器にパ リ テ ィ ー予測回路, 剰余チ ェ ッ ク 回路な ど を設け, 出力結果へ と パ リ テ ィ を伝播 さ せます。 万一 パ リ テ ィ エ ラ ーを検出し た場合は, 次に述べる通 り ハー ド ウ ェ アが自動的に命令を再実行し 回復を試みます。 こ の機能 を命令 リ ト ラ イ と 呼んでい ます。
5.3 同期一括更新方式と 命令リ ト ラ イ
命令実行部で説明し た よ う に、 SPARC64 VII は同期一括更新方式を採用し ています。 エ ラ ーが検出さ れる と 、 その時 点で実行途中の処理を全てキ ャ ンセル し ます。 コ ミ ッ ト ま での間の途中結果は廃棄可能可能であ り 、 エ ラ ーに遭遇する こ と な く 完了し た命令が更新し た結果だけがプ ロ グ ラ マブルな資源に残 り ます。 従っ て、 エ ラ ーに よ る プ ロ グ ラ マブル な資源の破壊を防止するばか り ではな く 、 エ ラ ー検出後にハー ド ウ ェ アで命令 リ ト ラ イ を行 う こ と が可能 と な り ます。 ハン グア ッ プの場合に も 、 滞っ てい る処理をいっ たん捨てて、 は じ めか ら や り 直す こ と が出来る ので、 回復の可能性が あ り ます。 命令 リ ト ラ イ はエ ラ ーを ト リ ガー と し て、 自動的に起動し ます。 リ ト ラ イ 中は、 1 命令ずつ実行する こ と で正常実行 の可能性を上げ、 正常に実行完了する と 、 通常の実行状態に自動的に復帰し ます。 こ の間 ソ フ ト ウ ェ アに介入は不要で あ り 、 命令 リ ト ラ イ が成功すれば、 エ ラ ーの ソ フ ト ウ ェ アへの影響はあ り ません。 命令 リ ト ラ イ は閾値に達する ま で繰 り 返し 、 こ れを超えた場合には、 エ ラ ーの発生を割 り 込みに よ っ て、 ソ フ ト ウ ェ アに通知さ れます。 8命令 取り 出し 命令 実行 P C /G P R 等の 更 新 命令 取り 出し 命令 実行 P C /G P R 等の 更 新 再 実 行 命 令 リ ト ラ イ 更 新 抑 止 壊 れ ? エ ラ ー 図4 SPARC64 VII 命令 リ ト ラ イ
5.4 サービ ス 性の向上
SPARC64 VII は、 あ り と あ ら ゆ る 個所にエ ラ ーのチ ェ ッ カ を装備 し てい ます。 エ ラ ーの発生時には、 専用の イ ン タ フ ェース に よ っ てシ ス テ ムに通知し ます。 こ の通知に よ り 、 SCF (System Control Facility) フ ァ ーム ウ ェ アは、 専用の イ ン タ フ ェース を使用し て、 エ ラ ーロ グ を収集し 、 その解析を行い ます。 こ れ ら の動作は、 ソ フ ト ウ ェ アに影響を与えずに バ ッ ク グ ラ ウ ン ド で行われます。こ れ ら の機構に よ っ て、 SPARC64 VII を搭載する シ ス テムは、 運用を継続し なが ら 故障個所 と 故障種別を迅速かつ正 確に特定し 、 予防保守に有用な情報を得て、 サービ ス性の向上を図る こ と がで き ます。
6
むすび
SPARC64 VII は、 現行の SPARC64 VI の高性能 ・ 高信頼性を保ちつつ、 ク ア ッ ド コ アおよ び SMT の採用に よ り 、 スルー プ ッ ト 性能の大幅強化を実現し ま し た。 ま た 4 コ アで L2 キ ャ ッ シ ュ を共用する構成 と し , ハー ド ウ エアに よ る コ ア間 高速同期機構を実装し ま し た。
SPARC64 VII はシ ン グルス レ ッ ド 性能 と スループ ッ ト 性能を両立 さ せてお り 、 ビ ジネ ス ・ 科学技術計算いづれの分野に おいて も その性能を フルに発揮する こ と が可能です。
7
参考文献
富士通株式会社 : UNIX サーバ用プ ロ セ ッ サ 「SPARC64 V 」 , Aug 2004