Japan Advanced Institute of Science and Technology
JAIST Repository
https://dspace.jaist.ac.jp/
Title
スーパーコンピュータの並列化動向
Author(s)
井口, 寧
Citation
Research report (School of Information Science,
Japan Advanced Institute of Science and
Technology), IS-RR-98-0001A: 1-12
Issue Date
1998-01-16
Type
Technical Report
Text version
publisher
URL
http://hdl.handle.net/10119/8378
Rights
Description
リサーチレポート(北陸先端科学技術大学院大学情報
ス ー パ ー コ ン ピ ュ ー タの 並 列 化 動 向
井 口 寧 1998,1/16 1S-RR-98-0001ACenterforInformationScience
JapanAdvancedInstituteofScienceandTechnology
Asahidai1-1,Tatsunokuchi
Nimo,Ishikawa,923-1211,JAPAN
[email protected]
(C)YasushiInoguchi,1998 ISSNO918-7553 41.は じ め に ス ー パ ー コ ン ピ ュ ー タ は 従 来 大 規 模 科 学 技 術 計 算 の 担 い 手 と し て 大 き な 成 功 を 収 め て き た が 、 近 年 で は 、 使 用 し て い る バ イ ポ ー ラ 型 論 理 素 子 の 高 速 化 が 限 界 に 近 づ い て き た た め 、1CPUあ た り の 性 能 の 更 な る 向 上 は 見 込 め な く な っ て き て い る 。 こ の 限 界 を 打 開 す る た め 、 ベ ク トルCPUを 並 列 化 し た シ ス テ ム や 、 マ イ ク ロ プ ロ セ ッ サ を 多 数 用 い て 高 い 並 列 化 に よ り性 能 向 上 を 目 指 す シ ス テ ム な ど が 提 案 さ れ て い る 。 本 報 告 で は 、 今 後 の 新 し い シ ス テ ム の 展 望 に つ い て 議 論 す る た め に 、 従 来 の ハ イ パ フ ォ ー マ ン ス シ ス テ ム の 発 展 性 、 拡 張 性 、 性 能 向 上 の 工 夫 を 、 プ ロ セ ッサ の 構 成 方 式 の 違 い ご と に ま と め 、 検 討 す る 。 2.シ ス テ ム レ ベ ル で の 並 列 化 の 動 向 超 高 速 科 学 技 術 計 算 を 目 的 とす る コ ン ピ ュ ー タ は 、 お お ま か に(a)科 学 技 術 計 算 向 き 大 型 汎 用 機 、(b)ベ ク トル 型 ス ー パ ー コ ン ピ ュ ー タ 、(c)超 並 列 シ ス テ ム 、 の3種 類 に 分 類 で き る 。 こ の 中 で(b)の ベ ク トル 型 ス ー パ ー コ ン ピ ュ ー タ は、 従 来 か らの 共 有 メ モ リ に よ る マ ル チ プ ロ セ ッ サ の も の と 、 近 年 見 ら れ る ク ラ ス タ シ ス テ ム の2つ に 分 け る こ とが で き る 。 こ れ らの タ イ プ 別 の シ ス テ ム 性 能 の グ ラ フ を 図1に 、 諸 元 を 表1か ら表3 に 示 す 。 最 初 に ベ ク トル 型 シ ス テ ム を 世 代 に 分 け 、 構 成 や 性 能 向 上 に つ い て 考 察 す る 。 ス ー パ ー コ ン ピ ュ ー タ の 世 代 分 類 つ い て は 、 さ ま ざ ま な 分 け 方 が あ る が 、 こ こ で はCray社 の 分 類 に 基 づ い た 分 類 を 用 い る 。 第0世 代 に はIBM360/195な ど が 含 ま れ 、 高 速 ス カ ラ ー 処 理 が 特 徴 で あ る 。 第1世 代 の 代 表 的 な シ ス テ ム と し て は 、 ILLIACIV,STAR-100な どが 上 げ ら れ 、 こ の 世 代 で は ベ ク トル 処 理 が 導 入 さ れ た 。 ベ ク トル レ ジ ス タ を 有 し た 、 い わ ゆ る ス ー パ ー コ ン ピ ュ ー タ は 第 世 代 に 分 類 さ れ 、CRAY-1が こ れ に あ た る 。 第2世 代 の 特 徴 は 、 FORTRANの 自動 ベ ク トル 化 、 シ ョー トベ ク トル の ベ ク トル 化 、 高 速 ス カ ラ ー 処 理 な ど が あ げ ら れ る 。1980 年 代 前 半 の 第3世 代 か ら は 国 産 メ ー カ も参 入 し、Cray-X-MP,S-810,VP200,SX-2な ど が 出 揃 う 。 こ れ ら の シ ス テ ム の 特 徴 は 、 並 列CPU,並 列 パ イ プ ラ イ ン を有 し演 算 性 能 の 向 上 を 図 っ て い る 点 と 、 複 雑 な 演 算 を含 む ベ ク トル も 処 理 可 能 と な っ た こ とで あ る 。 並 列 パ イ プ ラ イ ン は 、 パ イ プ ラ イ ン レベ ル の 並 列 化 で あ り、CPU 内 に複 数 の パ イ プ を 並 列 に 実 装 し、lCPU当 り の 性 能 を 高 め て い る 。 並 列 化 コ ン パ イ ラ な ど の 新 し い 技 術 を 用 い る こ と な く容 易 に 従 来 の ソ フ トウ ェ ア を 高 速 化 す る こ と が で き る と い う利 点 が あ る が 、 パ イ プ ラ イ ン の 並 列 化 が 進 む と 半 性 能 長 が 大 き く な り、 実 効 性 能 が 低 下 す る 傾 向 が 出 て く る 。1980年 代 後 半 の 第4世 代 で は 、 ク ロ ッ ク 周 期 も短 縮 さ れ 、 並 列CPU構 成 の ス ー パ ー コ ン ピ ュ ー タ が 主 流 と な る 。 ま た 、1CPU内 の パ イ プ ラ イ ン も 、 前 世 代 の シ ス テ ム が 同 一 の 演 算 を複 数 の パ イ プ ラ イ ン で 行 っ て い た の に 対 し 、 こ れ ら の シ ス テ ム で は パ イ プ ラ イ ン を 独 立 に 動 作 さ せ 異 な る 演 算 を並 列 に行 う こ と に よ っ て 、 半 性 能 長 の 低 下 を 軽 減 して い る 。 並 列 化 に対 して は 、 適 用 さ れ る 問 題 の 多 くは2次 元 以 上 の デ ー タ構 造 を 有 し て い る こ と を利 用 し 、 最 外 周DOル ー プ を 分 割 し各 プ ロ セ ッサ に 割 り 当 て る こ と に よ り、 比 較 的 効 率 良 く並 列 化 して い る 。 こ の 世 代 の シ ス テ ム と して は 、Y-MP,S-820,SX-3な ど が 含 ま れ る 。 現 在 の ベ ク トル 型 シ ス テ ム で は 、 処 理 性 能 向 上 の 方 法 が 分 化 し て お り 、 様 々 な 方 法 が 実 現 さ れ て い る 。 一 つ の グ ル ー プ は 従 来 の 方 法 を 踏 襲 し、 ク ロ ッ ク 周 期 の 更 な る 短 縮 に よ りCPU当 りの 性 能 を 確 保 し、 共 有 メ モ リ に よ る密 結 合 シ ス テ ム と して 、 シ ス テ ム 全 体 の 性 能 を確 保 し て い る 。 こ れ ら の グ ル ー プ と し て は 、S.3800 やT90な ど が 含 ま れ る 。 別 の ア プ ロ ー チ と して 、 回 路 素 子 を こ れ ま で の バ イ ポ ー ラ 素 子 か らCMOS素 子 に 転 換 し、1CPU当 り の 性 能 は 低 下 す る がCPUの 台 数 を増 加 させ る こ と に よ り シ ス テ ム 全 体 の 性 能 向 上 を 図 る 方 法 を と っ て い る 、VPP700やSX-4な ど の グ ル ー プ もあ る 。 デ バ イ ス 技 術 の 変 更 の 原 因 と し て は 、 バ イ ポ ー ラ 素 子 の 消 費 電 力 がCMosに 比 べ 格 段 に 多 い た め 集 積 度 を 上 げ る こ と が 難 し い こ と 、CMosの 比 例 縮 小 の 法 則 か ら微 細 加 工 が 十 分 発 達 す る と 高 速 で 高 い 集 積 度 を持 つ デ バ イ ス がCMOSで 実 現 可 能 で あ る こ と 、 な どの 原 因 が 考 え ら れ る 。 次 に シ ス テ ム の タ イ プ 別 の シ ス テ ム 性 能 に つ い て 検 討 す る 。 第2か ら第4世 代 で は 、 ベ ク トル 型 シ ス テ ム や 大 型 汎 用 機 が 主 流 で あ り、 マ イ ク ロ プ ロ セ ッ サ は 集 積 度 が 低 く数 値 演 算 の 担 い 手 に は な り え な い と い う 背 景 が あ っ た 。 こ れ ら の シ ス テ ム で は 、 従 来 の 大 型 汎 用 機 とベ ク トル 型 計 算 機 で は 、 約 二 桁 の 性 能 差 が あ る 。 ま た 第3世 代 に 当 た る 頃 に は 、 一 方 、 大 型 汎 用 機 も ベ ク トル 演 算 機 能 な ど の 付 加 機 能 に よ り 、 大 幅 に 演 算 性 能 を 向 上 し た シ ス テ ム が 実 現 さ れ る よ う に な る 。 第4世 代 か ら 、 こ れ ら の 大 型 シ ス テ ム が デ バ イ ス 技 術 を バ イ ポ ー ラ か らCMOSに 変 更 した た め 、CPU当 り の 性 能 は 伸 び 悩 む よ う に な る の に 対 し、 多 数 の マ イ ク ロ プ ロ セ ッサ(MPU)を 並 列 に動 作 さ せ る 超 並 列 シ ス テ ム も 、CM.5な ど に よ り商 業 的 に 実 現 さ れ て き て い る 。 こ れ ら の 最 大 の 構i成 で はTFLOPSま で 実 現 で き 、 共 有 メ モ リ に よ る ベ ク トル 型 シ ス テ ム に 比 べ 、 一 桁 以 上 の 高 い 性 能 を 有 し て い る 。 現 在 で は 、 超 並 列 シ ス テ ム も、MPUの 性 能 向 上 に 従 い1ノ ー ドの 性 能 が 飛 躍 的 に 向 上 し、 プ ロ セ ッサ 数 の 増 加 に よ る よ り も ノ ー ド性 能 の 向 上 に よ っ て シ ス テ ム 全 体 の 性 能 を 確 保 す る 傾 向 に な っ て き て い る 。
3.プ ロ セ ッ サ の 性 能 向 上 次 に プ ロ セ ッサ 単 体 の 性 能 に つ い て 、 近 年 急 速 に 発 展 し て い る マ イ ク ロ プ ロ セ ッサ(MPU)と 比 較 しな が ら 検 討 す る 。 図2に 、 大 型 汎 用 機 、 ベ ク トル 機 、 ベ ク トル パ ラ レ ル 機 、 超 並 列 機 、MPUの そ れ ぞ れ の 単 体 の 性 能 を 示 す 。 図 よ り、 そ れ ぞ れ の 性 能 向 上 率 は ほ ぼ 同 じで あ る こ と が 分 か る 。 従 来 よ り大 型 汎 用 機 や ベ ク トル 機 に 比 べ 、MPUの 性 能 向 上 が 非 常 に 著 しい こ と が 指 摘 さ れ て き た が 、 実 際 に は 初 期 に は 確 か に 急 激 な 性 能 向 上 が な さ れ て い る が 、 近 年 で は そ れ ほ ど性 能 向 上 が 著 しい わ け で は な い こ と が わ か る 。 こ れ は 初 期 に は 集 積 技 術 が 十 分 で な く 、 演 算 に 必 要 な ハ ー ドウ ェ ア 量 を1チ ッ プ に 載 せ る こ と が で き な い た め 、 浮 動 小 数 点 演 算 は 殆 ど ソ フ トウ ェ ア で エ ミ ュ レ ー シ ョ ン し て お り、 演 算 性 能 は 極 め て 低 か っ た の に 対 し、MPUの 集 積 度 が 上 が る に つ れ 浮 動 小 数 点 機 能 を ハ ー ドウ ェ ア で 実 現 で き る よ う に な っ た た め と 考 え ら れ る 。 浮 動 小 数 点 機 能 が ハ ー ドウ ェ ア で 実 現 さ れ れ ば 、 後 の 性 能 向 上 はMPUそ の も の の 性 能 向 上 に比 例 す る と 考 え ら れ る 。 近 年 の 傾 向 と し て 、 大 型 汎 用 機 はCMOS素 子 で 構 成 さ れ て い る た め 、 素 子 技 術 と し て のMPUに 対 す る ア ドバ ン テ ー ジ は 無 く、 性 能 もMPUと 同 じ レベ ル に な っ て い る 。 ベ ク トル 型 シ ス テ ム も 、1990年 代 初 頭 の 5GFLOPSを 越 え る シ ス テ ム の 後 に は 、 商 用 シ ス テ ム と し て は1CPU当 りの 性 能 向 上 は 留 ま っ て い る 。 4.ベ ク ト ル 型 シ ス テ ム の 成 功 の 要 因 こ こ で 従 来 の ベ ク トル 型 シ ス テ ム の 成 功 の 要 因 に つ い て 考 え 、 現 在 置 か れ て い る 状 況 と比 較 検 討 す る 。 ベ ク トル 型 シ ス テ ム の 要 因 に は さ ま ざ ま な も の が 考 え ら れ る が 、 代 表 的 な 要 因 と し て は 次 の よ う な も の で あ ろ う。 i)素 子 技 術 の 優 位 性 ベ ク トル 型 シ ス テ ム は 、 バ イ ポ ー ラ メ モ リ な ど従 来 の シ ス テ ム に 比 べ 極 め て 高 速 ・高 価 な 素 子 を用 い て い る 。 ii)演 算 パ イ プ ラ イ ン 従 来 の 汎 用 機 が 浮 動 小 数 点 演 算 に 数 ク ロ ッ ク を要 し て い た の に 対 し、 ベ ク トル 型 シ ス テ ム で は 浮 動 小 数 点 演 算 パ イ プ ラ イ ン に よ りパ イ プ ラ イ ン 当 り1演 算/1ク ロ ッ ク を 実 現 して い る 。 iii)ベ ク トル レ ジ ス タ 大 量 の ベ ク トル デ ー タ を 容 易 に扱 う こ と の で き る ベ ク トル レ ジ ス タ の 実 装 。 iv)並 列 パ イ プ ラ イ ン プ ロ セ ッ サ 当 りの 性 能 を 高 め る た め 、 パ イ プ ラ イ ン を並 列 実 装 し て い る 。 v)高 い メ モ リバ ン ド幅 高 速 で 低 い 集 積 度 の メ モ リ 素 子 を 大 量 に並 列 に 用 い 、 メ モ リ イ ン タ ー リ ー プ ア ク セ ス に よ り高 い メ モ リ バ ン ド幅 を得 て い る 。 こ れ に対 し 、 現 在 の 主 流 のMPUを 採 用 し た ワ ー ク ス テ ー シ ョ ン や サ ー バ と 比 較 す る と 、 i)既 に バ イ ポ ー ラ 素 子 よ り もCMOSプ ロ セ ッ サ の 方 が 高 速 な 動 作 が 可 能 と な っ て お り 、 こ の 優 位 性 は 失 わ れ て き て い る 。 ii)RISC化 に よ り最 近 のMPUは 殆 ど演 算 パ イ プ ラ イ ン を 持 ち 、 パ イ プ ラ イ ン 当 り1演 算/1ク ロ ッ ク を実 現 して い る 。 iii)ベ ク トル レ ジ ス タ はMPUに は 実 装 さ れ て い な い が 、 こ れ に 代 る も の と し て 大 容 量 の キ ャ ッ シ ュ が 実 装 さ れ て い る iv)演 算 パ イ プ ラ イ ン を並 列 に 実 装 した シ ス テ ム(Power2,R8000な ど)も あ る が 、 ク ロ ッ ク 周 期 の 短 縮 が 難 し い 。 こ の 点 で は ベ ク トル 型 シ ス テ ム に 利 点 が あ る が 、 ベ ク トル 型 シ ス テ ム で も並 列 度 は4程 度 で あ り、 そ れ ほ ど 差 が あ る わ け で は な い 。 v)ベ ク トル 型 シ ス テ ム の メ モ リバ ン ク 数 が 数 百 に 達 す る の に 対 し 、MPUを 用 い た シ ス テ ム の メ モ リバ ン ク 数 は た か だ か 数 バ ン ク で あ り 、 メ モ リ と の 入 出 力 性 能 は ベ ク トル 型 シ ス テ ム に 比 べ 非 常 に 低 い 。 ま たLSI を 使 用 し た 場 合 の ピ ン数 の 制 約 か ら 、MPUへ の 入 出 力 バ ン ド幅 は か な り制 限 さ れ る 。 こ の よ う に 、 現 在 で は メ モ リバ ン ド幅 の 利 点 を 除 い て 、 従 来 の ベ ク トル 型 シ ス テ ム の 優 位 性 の 多 くがMPU ベ ー ス の シ ス テ ム で 実 現 さ れ て い る 。 5.結 論 世 界 の 超 高 速 計 算 機 に 関 す るTOP500と い う資 料 が あ る 。 従 来 は ベ ク トル 型 シ ス テ ム が 上 位 を独 占 して い た が 、 現 在 は 上 位 は す べ て 並 列 シ ス テ ム と な っ て き て い る 。 しか し な が ら、 並 列 シ ス テ ム は 理 論 性 能 は 非 常 に 高 い が 実 効 性 能 を 引 き 出 す の が 非 常 に 難 し い と い う 問 題 点 が あ る 。 こ れ に 対 し従 来 の ベ ク トル シ ス テ ム は 非 常 に 発 展 し 、 単 純 な行 列 演 算 で は 理 論 性 能 の90%近 く を容 易 に 引 き 出 す こ と が で き る 。 こ れ は4節 で 述 べ た よ う に 、 高 い メ モ リ バ ン ド幅 に よ る 寄 与 が 大 き い も の と考 え ら れ る 。MPUを ベ ー ス と した シ ス テ ム で は 、 チ ッ プ の ピ ン 数 の 制 限 か ら 、CPUの メ モ リバ ン ド幅 を 向 上 す る こ と が 難 しい 。 しか し 、CPU当 りの メ モ
リバ ン ド幅 は 小 さ く と も 、 多 数 の ノ ー ドの 合 計 と して の シ ス テ ム 全 体 メ モ リバ ン ド幅 は 決 して 小 さ くな い の で 、 ノ ー ド単 位 の メ モ リ バ ン ド幅 を い か す ア ル ゴ リ ズ ム の 採 用 な ど に よ り、 理 論 性 能 の1/3程 の 性 能 は 確 保 で き る と考 え ら れ る 。 参 考 文 献 [1]"ス ー パ ー コ ン ピ ュ ー タ",日 本 物 理 学 会 編,培 風 館,1985 [2]名 取 亮,野 寺 隆,"ス ー パ ー コ ン ピ ュ ー タ と 大 型 数 値 計 算",共 立 出 版,1987 [3]シ ド ニ ー フ ァ ー ン バ ッ ク,"ス ー パ ー コ ン ピ ュ ー タ:超 高 速 計 算 の た め の ハ ー ド ウ ェ ア と ソ フ ト ウ ェ ア の す べ て",パ ー ソ ナ ル メ デ ィ ア,1988 [4]島 崎 眞 昭,"ス ー パ ー コ ン ピ ュ ー タ と プ ロ グ ラ ミ ン グ",共 立 出 版,1989 [5rス ー パ ー コ ン ピ ュ ー タ:製 品 ・技 術 ・応 用",日 経 デ ー タ プ ロ 編 集,日 経BP社,1989. 【6]長 島 重 夫,田 中 義 一,"ス ー パ ー コ ン ピ ュ ー タ",オ ー ム 社,1992
Qう 氏 ○ ﹄ ﹂ O 10000 1000 100 10 1 0.1 o.o! o.001 ●maitlframe vector vectorprallel massivelyparallel ■ 19GO 19G5 1970 1975 ・:1 Year 1985 1990 1995 2000 図1計 算 機 の シ ステ ム性 能 、.簡岬ず一 ■■■■■■■■■■■■■■■■
の ﹂ ○ ﹄ ﹄ ≧ 10000 1000 100 10 1 o.1 ●mainframe ●vector vectorprallel
Qmassivelyparallel
MicroPorcessor ' × ・ 火,)
V
X
メ萎
b 除 , 1 ★ 1960 19G5 1970 1975 ':1 1985 1990 1995 2000 Year 図21プ ロ セ ッサ 当 りの 性 能 一・.酬幽劇劇闘■■圏圏■■■■■■■■陰ProcessorCray-1 typevector shipping ク ロ ッ ク 周 期T(nx) ク ロ ッ ク 周 波 数clock(MHz) 理 論 性 能Rmax-MFLOPS MFLOPS/CPU パ イ プ ラ イ ン の 種 類 パ イ プ ラ イ ン の セ ッ ト数 MFLOPS/CPU NumberofCPU VectorRegisterLength NumberofVctRgstr/CPU VectorRegistercap(KB) Load/Storepipe(LS十L十S) MemorySize(MB) MemoryBanks MemoryBandWidth(GB/s) NumberofChannels I/OBandWidth(MB/s) Cray-1/SCyber205Cray-1/M vectorvector 19761979 12.5012.50 :111:111 160160 :11:11 22 11 160.0160.0 11 6464 88 44 11 832 1616 24 480 vector 19811982 20.0012.50 50.0080.00 400160 50.080.0 22 41 400.0160.0 11 64 8 4 1 32 12816 16 ×11 6 4 2 2 Cray-X-MP/2 vector 1983 9.50 105.26 420 105.0 2 1 210.0 2 64 8 4 3 32 16 8 424 Processor type shipping T(nx) clock(MHz) Rmax-MF MF/pipe #ofpipekind #ofpipeset(set MF/CPU #ofCPU VRlength #ofVR/CPU VRcap(KB) Load/Storepipe MEMSize(MB) MEMBanks MEMBW(GB/s) #ofChannels I/OBW(MB/s) S-810/20 vector 1983 14.00 71.43 857 71.4 6 2 857.1 1 256 32 64 3428 256 256 n∠ ρ0 3 Q り VP-200 vectorvector 1983 7.50 133.33 570 133.3 2 2 533.3 1 64 1140 256 256 9 臼 Q u 3 4 Cray-2/4-256Cray-X-MP/4SX-2 1985 4.10 243.90 1,952 243.9 2 1 487.8 4 64 8 4 1 2,048 128 8 8 2,048 vector 1985 9.50 105.26 840 105.0 2 1 210.0 4 64 8 4 3 64 32 vector 1985 ・11 166.67 1,333 166.7 2 4 1,333.3 1 256 40 80 12 256 512 11 32 50 VP-400 vector 1985 7.00 142.86 1,143 142.9 2 4 1,142.9 1 64 128 4 256 表1ベ ク トル プ ロ セ ッ サ の 性 能
Processor Cray-X-MP/4 VP-400E typevector vector shipping 1986 1987 T(nx)8.50 7.00 clock(MHz)117.65 142.86 Rmax-MF9401,714 MF/pipe117.6 142.9
#of pipe kind2 ,3
#of pipe set (set14
MF/CPU235.3' 1,714.3 #ofCPU4. 1 VR length64 64-1024 # of VR/CPU8 256-8 VR cap (KB)4 128 Load/Store pipe3. 4 MEM Size (MB)128 , 256 MEM Banks64256 , MEM BW (GB/s)4.56 , # of Channels32 I/O BW (MB/s)96 Cray-Y-MP/8, S-820/80 vector vector 19881988 6.004.00 166.67 250.00 2,6673,000 166.7250.0. 23 14• 333.3 3,000.0 81 64512 832 , 4128 38 256512 256 42.7 64 5,848288 SX-2A vector 1988 6.00 166.67 1,333 166.7 2 4 1,333.3 1 80 4, 1,024 512 , 11 64 192 Cray-Y-MP8/ vector 1989 6.00 166.67 2,667 166.7 2 1 333.3 8 64 8 4 3 1,024 256 42.7 5,848 ProcessorSX-3/44 typevector shipping1990 T(nx)2.90 clock(MHz)344.83 Rmax-MF22,000 MF/pipe344.8
#of pipe kind2 #of pipe set (set4 MF/CPU2,758.6 #ofCPU4 VR length # of VR/CPU VR cap (KB)144 Load/Store pipe (LS+L+S) MEM Size (MB)2,048 MEM Banks1,024 MEM BW (GB/s) # of Channels256 I/O BW (MB/s)1,024 VP-2600/10 vector 1990 3.20 312.50 5,000 312.5 4 4 5,000.0 1 VP-2600/20 ,vector 1990 4.00 250.00 4,000 250.0 4 4 4,000.0 1 128 8 2,048 512 125 1,024 Cray-C90 vector 1991 4.20 238.10 15,238 238.1 2 2 952.4 16 S-3800/480 'vector 1991 2.00 500.00 32,000 500.0 2 8 8,000.0 4 SX-3/44R vector 1992 2.50 400.00 25,600 400.0 2 8 6,400.0 4
Ai
tl }' )L `7 II . ,y `9- 4D'ri
Processor Cray-3-128 typevector shipping1994 T(nx)2.11 clock(MHz)473.93 Rmax-MF15,168 MF/pipe473.9 #of pipe kind2
#of pipe set (set 1 MF/CPU947.9
#ofCPU16 VR length
# of VR/CPU VR cap (KB)
Load/Store pipe (IS+L+S) MEM Size (MB) MEM Banks MEM BW (GB/s) # of Channels I/O BW (MB/s) Cray-4 vector 1995 1.00 1000.00 262,144 1000.0 8,192.0 32 3090-600E/VI VPP-500/222 vector 17.2 58.14 698 256 VP 1993 9.50 105.26 355,200 100.0 2 8 1,600.0 222 SX-4/512 VP 1994 8.00 125.00 1,024,000 125.0 2 8 2,000.0 512 256 72 144 2048000 524, 288 32,768 16,384 768 78,643.2 VPP-700/256 VP 1996 7.00 142.86 563,200 142.9 2 8 2,285.7 256 )1/112 sy
Processor type shipping ~ ^ y 7J T(nx) tJ ^ y jJ NM& clock(MHz) JI•Rmax-MFLOPS MFLOPS/CPU Number of CPU Interconnection Network Speed (MB/s) Micro Processor Memory Size (MB) CM5 parallel 1991 31.25 32.00 2,097,152 128.0 16,384 FAT Tree SPARC Paragon parallel 1991 31.25 50.00 307,200 75.0 4,096 2D-mesh 200 i860XP 131,072 Cray-T3D parallel 1992 6.67 150.00 307,200 150.0 2,048 3D-torus 300 Alpha 131,072 Cenju-3 parallel 1993 13.33 75.00 12,800 50.0 256 MultiStage 40 VR4400SC 16,384 AP1000 parallel 1993 20.00 50.00 51,200 50.0 1,024 2D-torus 25 SuperSPARC 16,384 Processor type shipping T(nx) clock(MHz) Rmax-MF MFLOPS/CPU #ofCPU Interconnection Network Speed uProcessor MEM Size (MB) Examplar parallel 1994 10.10 99.00 25,344 198.0 128 Xbar+ring 250/600 PA-RISC7100 32,768 IBM-SP parallel 1994 16.00 62.50 8,000 125.0 64 MultiStage 40 Power 16,384 nCUBE3 parallel 1994 20.00 50.00 6,553,600 100.0 65,536 HyperCube 24 original 67,108,864 CM5E parallel 1994 31.25 40.00 2,621,440 160.0 16,384 FAT Tree 40 SuperSPARC 2,097,152 Cray-T3E parallel 1995 3.33 300.00 1,228,800 600.0 2,048 3D-torus 480 Alpha21164 4,194,304 SR2201/1024 parallel 1995 6.67 150.00 307,200 300.0 1,024 Processor type shipping T(nx) clock(MHz) Rmax-MF MFLOPS/CPU #ofCPU Interconnection Network Speed uProcessor MEM Size (MB) Cray-T3E-900R5/6000-SP parallel parallel 19961996 2.226.25 450.00 160.00 1,843,200 276,480 900.0640.0 2,048512 3D-torus MultiStage 480150 Alpha21164a Power2 4,194,304 524,288 Cray-T3E-1200 parallel 1997 1.67 600.00 1,843,200 1200.0 2,048 3D-torus 480 Alpha21164a 4,194, 304
Processor type shipping ク ロ ッ ク 周 期T(nx) ク ロ ッ ク 周 波 数clock(MHz) 理 論 性 能Rmax-MFLOPS SPECint95 SPECfp95 SPECint92 SPECfp92 レ ベ ル1キ ャ ッ シ ュ(KB) レ ベ ル2キ ャ ッ シ ュ(KB) レ ベ ル3キ ャ ッ シ ュ(KB) MFLOPS/pipe パ イ プ ラ イ ン の 種 類 パ イ プ ラ イ ン の セ ッ ト数 .. .1.・ uP 1978 125.00 1! .1.・ uP ・;. .1.・ uP ・ ・. 83.33 12.00 m68020i80386DX uPuP 19851986 40.0062.50 25.0016 0.25 Processor type shipping T(nx) clock(MHz) Rmax-MF SPECint95 SPECfp95 SPECint92 SPECfp92 LU1$(1+D)(KB LU2$(KB) LV3$(KB) MF/pipe #ofpipekind #ofpipeset(se ...・ ... uP 1988 40.00 25.00 0.41 0.25 0.41 1.00 1 m68030 uP ・.. 20.00 50.00 0.5 R3000 uP ... 25.00 40.00 16 27.9 35.8 16.0 1.00 1 i80486DXm68040PA-RISC7000 uPuP 1989 30.30 33.00 22.4 uP 19891989 40.0020.00 25.0050.00 -← ﹁O Q U 9 臼 -ρ 0 ∩ V -⊥ 9 臼 Processor type shipping T(nx) clock(MHz) Rmax-MF SPECint95 SPECfp95 SPECint92 SPECfp92 Sparc uP LU1$(1+D)(KB) LV2$(KB) LU3$(KB) MF/pipe #ofpipekind #ofpipeset(set*unit) Alpha21064i80486DX2 uPuPuP 199019921992 25.005.0015.15 40.00200.0066.00 200 21.8 22.8 138 200 16 200.0 1 1 39.6 .. 8 PA-RISC7100R4000 1992 10.00 100.00 200 3.2 4.0 124 159 100.0 2 1 uP 1992 10.00 100.00 100 Q ソ ー ρ0 [ 0 ρ U 可 ⊥ R4400 uP 1992 6.67 150.00 0 109 97 32 表3マ イ ク ロ プ ロ セ ッサ の 性 能
Processor type shipping T(nx) clock(MHz) Rmax-MF SPECint95 SPECfp95 SPECint92 SPECfp92 SuperSparc uP 1992 16.67 60.00 LV1 $ (I+D) (KB) LV2 $ (KB) LV3 $ (KB) MF/pipe #of pipe kind
#of pipe set (set * unit)
1.5 1.7 89.0 103.0 36 HyperSparc uP 1993 13.89 72.00 80.0 105.0 8 m68060 uP 1993 20.00 50.00 60 45 16 P5 uP 1993 15.15 66.00 66 78.0 63.6 16 66.0 1 1 PPC601 uP 1993 20.00 50.00 50 40 60 32 50.0 1 1 Alpha21164 uP 1994 3.33 300.00 600 8.5 12.7 341 513 16 300.0 2 1 Processor type shipping T(nx) clock(MHz) Rmax-MF SPECint95 SPECfp95 SPECint92 SPECfp92 i80486DX4 uP 1994 10.00 100.00 LV1 $ (I+D) (KB) LV2 $ (KB) LV3 $ (KB) MF/pipe #of pipe kind
#of pipe set (set * unit)
55.0 27.0 16 PA-RISC7150 uP 1994 8.00 125.00 250 5.2 4.6 149 201 125.0 2 1 PA-RISC7200 uP 1994 8.00 125.00 250 6.4 9.1 150 250 2 125.0 2 1 PPC603 uP 1994 12.50 80.00 75 85 16 PPC604 uP 1994 10.00 100.00 3.6 3.2 128 120 32 R8000 uP 1994 13.33 75.00 300 112 311 32 75.0 2 2 Processor type shipping T(nx) clock(MHz) Rmax-MF SPECint95 SPECfp95 SPECint92 SPECfp92 LV1 $ (I+D) (KB) LV2 $ (KB) LV3 $ (KB) MF/pipe #of pipe kind #of pipe set (set
A1pha21164 uP 1995 3.00 333.33 666.67 9.8 13.4 400 570 16 333.3 2 1 P6 uP PPC603e uP 19951995 5.0010.00 200.00 100.00 200 8.2 6.8 320.0120 283.0105 1632 256 200.0 1 1 PPC620 uP 1995 7.52 133.00 6.0 6.0 225 300 64 SuperSparcll uP 1995 11.11 90.00 3.5 3.5 135.0 147.0 36 UltraSparcl uP 1995 6.00 166.67 333.33 6.6 9.4 269.0 386.0 32 166.7 2 1
Processor type shipping T(nx) clock(MHz) Rmax-MF SPECint95 SPECfp95 SPECint92 SPECfp92 LV1$(1+D)(KB) LU2$(KB) LU3$(KB) MF/pipe #ofpipekind #ofpipeset(set Alpha21164a uP 1996 2.00 500.00 1,000 15.0 20.0 16 500.0 2 1 PA-RISC8000PPC604ePPC620 uPuP 1996 120.00 :111 720 11.8 20.2 ×11 ・11 :11 2 2 uP 19961996 6.025.00 166.00200.00 7 ` n δ ρ 0 ρ 0 64 ∩ V O Q り Q σ 128 R10000 uP 1996 5.00 200.00 400 10.7 19.0 300 ・11 64 200.0 2 1 TurboSparc uP 1996 .. 170.00 3.5 3.0 143 119 32 Processor type shipping T(nx) clock(MHz) Rmax-MF SPECint95 SPECfp95 SPECint92 SPECfp92 LU1$(1+D)(KB3 LU2$(KB) LV3$(KB) MF/pipe #ofpipekind #ofpipeset(set UltraSparclI uP 1996 11 250.00 500 10.4 15.0 350.0 550.0 32 250.0 2 1 Alpha21164aKlamathPA-RISC8200Power2SC uPuPuPuP 1997199719971997 1.673.33120.007.41 600.00300.00220.00135.00 1,200300880540 18.011.915.56.2 27.09.625.017.6 ρ 0 ρ 0 1 ⊥ Q ) ∩ V 2 1 0 0 6 32 512 0 1 1 0 0 3 0 2 n ∠ 0 2 2 160 ∩ V 2 2 5 3 1 PPC750 uP 1997 3.76 266.00 12.4 8.4 64 Processor type shipping T(nx) clock(MHz) Rmax-MF SPECint95 SPECfp95 SPECint92 SPECfp92 LU1$(1+D)(KB) LU2$(KB) LV3$(KB) MF/pipe #ofpipekind #ofpipeset(set R10000 uP 1997 3.64 275.00 550 12.0 24.0 64 275.0 2 1 UltraSparcllI uP 1998 1.67 ・1111 35.0 ・11 表3マ イ ク ロ プ ロ セ ッサ の 性 能