• 検索結果がありません。

九州大学学術情報リポジトリ Kyushu University Institutional Repository 将来 (2010 年前後を想定 ) のペタフロップス超級スパコンセンターとの連携について 村上, 和彰九州大学大学院システム情報科学研究院 九州大学情報基盤センター

N/A
N/A
Protected

Academic year: 2021

シェア "九州大学学術情報リポジトリ Kyushu University Institutional Repository 将来 (2010 年前後を想定 ) のペタフロップス超級スパコンセンターとの連携について 村上, 和彰九州大学大学院システム情報科学研究院 九州大学情報基盤センター"

Copied!
23
0
0

読み込み中.... (全文を見る)

全文

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

将来(2010年前後を想定)のペタフロップス超級ス

パコンセンターとの連携について

村上, 和彰 九州大学大学院システム情報科学研究院 | 九州大学情報基盤センター http://hdl.handle.net/2324/9112 出版情報:SLRC プレゼンテーション, 2005-03-08 バージョン: 権利関係:

(2)

将来(2010年前後を想定)の

ペタフロップス超級スパコンセンター

との連携について

平成17年3月8日

九州大学 情報基盤センター

センター長 村上和彰

(3)

HPCに対する私的ビジョン

~2010年時点~

ユーザ数

要求性能

PFLOPS TFLOPS 100GFLOPS

Capability

Computing

Capacity

Computing

(4)

スパコンセンターに関する私的ビジョン

~2010年時点~

ユーザ数

要求性能

PFLOPS TFLOPS 100GFLOPS

Capability

Computing

Capacity

Computing

全国共同利用情報基盤センター

(@2010年)

ペタフロップス超級スパコンセンター

(@2010年)

(5)

九州大学情報基盤センターの

現状

と将来

2005

→2010年~

ユーザ数

要求性能

PFLOPS TFLOPS 100GFLOPS

Capability

Computing

Capacity

Computing

九州大学情報基盤センター

(@2005年)

富士通VPP5000/64 (614GFLOPS,2002~2006年度) IBM eServer p5モデル595×7システム (3.25TFLOPS,2005~2008年度)

ペタフロップス超級スパコンセンター

(@2010年)

(6)

九州大学情報基盤センターの

現状

と将来

2005

→2010年~

累積

ユーザ数

要求性能

PFLOPS TFLOPS 100GFLOPS

Capability

Computing

Capacity

Computing

九州大学情報基盤センター

(@2005年)

ペタフロップス超級スパコンセンター

(@2010年)

富士通VPP5000/64 (614GFLOPS,2002~2006年度) IBM eServer p5モデル595×7システム (3.25TFLOPS,2005~2008年度)

(7)

九州大学情報基盤センターの

現行コンピュータシステム

スーパーコンピュータ

(2002年度~2006年度)

富士通VPP5000/64

– ベクトル並列型スーパーコンピュータ – 1PE当りのピーク演算性能9.6GFLOPS×64PE =合計614.4GFLOPS

ハードウェア

– メモリ:1PE当り8GB/16GB(合計704GB) – インターコネクト:クロスバーネットワーク

ソフトウェア

– OS:UXP/V Ver.20 – 言語処理系および並列プログラミング環境: Fortran, HPF(High-Performance Fortran), C/C++, DPCE(データ並列版C),

MPI(Message Passing Interface), PVM (Parallel Virtual Machine)

– 数値計算ライブラリおよびアプリケーション: SSL II, NUMPACK, BLAS, LAPACK,

ScaLAPACK, IMSL Cライブラリ, MSC.Nastran, Gaussian, MOPAC, LS-DYNA, 他

高性能演算サーバ

(旧称:汎用コンピュータ,2005年度~2008年度)

IBM eServer p5モデル595

– 共有メモリ型スカラー並列コンピュータ – POWER5プロセッサ1.9GHzを搭載した最新機 種(第1号機) – 理論演算性能の総和:3.25TFLOPS

ハードウェア

– 64CPU・512GBメモリ×1システム – 64CPU・256GBメモリ×5システム – 32CPU・128GBメモリ×1システム

ソフトウェア

– OS:AIX 5L – 言語処理系および並列プログラミング環境: Fortran, C/C++, MPI, OpenMP

– 数値計算ライブラリおよびアプリケーション: IBM ESSL, IMSL C/Fortranライブラリ, Gaussian, 他

(8)

九州大学情報基盤センターの現状と

将来

~2005年→

2010

ユーザ数

要求性能

PFLOPS TFLOPS 100GFLOPS

Capability

Computing

Capacity

Computing

九州大学情報基盤センター

(@2010年)

富士通VPP5000/64 (614GFLOPS,2002~2006年度) IBM eServer p5モデル595×7システム (3.25TFLOPS,2005~2008年度) Capacity Computing指向マシン (1号機:2007~2010年度) Capability Computing指向マシン (1号機:2009~2012年度)

ペタフロップス超級スパコンセンター

(@2010年)

(9)

九州大学情報基盤センター

今後のコンピュータ調達スケジュール

2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 富士通GP7000 (2000年1月~) IBM eServer p5モデル595×7 Capability Computing指向 マシン1号機 Capability Computing指向 マシン2号機 2年間レンタル マシン Capacity Computing指向 マシン1号機 Capacity Computing指向 マシン2号機 富士通VPP5000/64 (2001年1月~)

レンタル費振り替え

レンタル費

(10)

九州大学情報基盤センターの

今後のコンピュータシステム

Capacity Computing指向マシン

(1号機:2007年度~2010年度)

大半のユーザの計算要求に応えることを目的

とした,スループット指向のスパコン

基本的に従来のスパコン調達方法を踏襲

Capability Computing指向マシン

(1号機:2009年度~2012年度)

ピーキーな計算要求を有するユーザの需要に

応えることを目的とした、レスポンスタイム(レ

イテンシ)指向のスパコン

調達の前に「共同研究フェーズ」を設定して,

ベンダーと共同して「capability」開拓のための

方策を共同開発

ペタフロップス超級スパコンのサブシステム,

あるいは,次世代ペタフロップス超スパコンの

プロトタイプ機としての位置付け

両マシンを連結して,マルチフィジックス対応の連成計算を可能に!

レンタル費は両マシンにほぼ均等配分!

(11)

共同研究フェーズ

今後のコンピュータ調達タイムテーブル

(4年レンタルを仮定した場合)

Capacity Computing指向マシン(従来型スパコン)導入手続き

1年目 2年目 3年目 4年目 ▲次世 代 機運用開始 ▲開札 ▲導入説 明会 ▲現行機運用開始 ▲入札説 ▲入札 明会 ▲仕様書案説明会 仕様策定委員会 技術審査委員会

Capability Computing指向マシン導入手続き

1年目 2年目 3年目 4年目

ユーザ会(潜在的ユーザも含む)

▲次世 代 機運用開始 ▲開札 ▲導入説 明会 ▲仕様書案説明会 ▲現行機運用開始 ▲入札説 ▲入札 明会 仕様策定委員会 技術審査委員会 ▲入札説 明会 ▲入札 ▲開札

(12)

ペタフロップス超級スパコンセンターとの連携

ユーザ数

要求性能

PFLOPS TFLOPS 100GFLOPS

Capability

Computing

Capacity

Computing

九州大学情報基盤センター

(@2010年)

• 九州大学情報基盤センターの「Capability Computing指向マシン」を

フロ

ントエンドに、「ペタフロップス超スパコン」をバックエンドに!

– フロントエンドでプログラム開発やデバック

– バックエンドで本番の計算

• 全国共同利用情報基盤センターの各マシンを

Grid化

– Gridで「疎結合」連成計算

– ペタフロップス超スパコンで「密結合」連成計算

ペタフロップス超級スパコンセンター

(@2010年)

(13)

ペタフロップス超級スパコンの

実現に向けて

(14)

事務計算コンピュータとのせめぎ合い

~HPC業界におけるMakimoto’s Wave~

1946 1961 1976 1991 2006

科学技術計算指向

事務計算指向

ENIAC (1946) UNIVAC I (1951) IBM701 (1953) IBM Stretch (1959) IBM S/360 (1964) ILLIAC IV (1966) Intel 4004 (1971) Cray I (1976) IBM PC (1981) Cray XMP (1982) Intel 386 (1985) Intel Pentium (1993)

汎用計算機

PC&LAN 携帯電話/情報端末

?

CDC6600 (1964)

黎明期(

BC: Before Cray-I

スパコン元年

スパコンの時代

PC

クラスタ

の時代

NEC SX (1985) FACOM 230-60 (1968) IBM S/370 (1970) FACOM M190 (1975) FACOM VP (1982) Beowulf (1994)

テクノロジ・

ドライバ

FACOM 230-75APU (1976) ES (2002) CM-2 (1987) NWT (1992)

(15)

PC&LAN

HPCマシン

スパコン時代(1980~1990中)

– 集積回路技術

– 実装技術

– コンパイラ技術

PCクラスタ時代(1990中~現

在)

– 高性能汎用マイクロプロセッサ

– 高集積メモリ

– 高速インターコネクト

2010年のHPCマシン

– 高性能&低消費電力組込みプ

ロセッサ+動的再構成可能デー

タパス

– 高速&知的インターコネクト

汎用大型計算機

技術移転

CE

情報家電/携帯情報端末

技術フィードバック

テクノロジ・ドライバ

ビジネス的にどう成り立たせるか?

製品移転

(16)

512KB 512KB L2 L2キャッシュキャッシュ 512KB 512KB L2 L2キャッシュキャッシュ 浮動小数点演算器 整数演算器 整数演算器 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS PPE PPE 512KB 512KB L2 L2キャッシュキャッシュ 倍精度浮動小数点演算器 単精度浮動小数点演算器

Cell (221mm

2

@90nm)

Pentium4 (112mm

2

@90nm)

整数演算器

テクノロジードライバは

PCからCEへ

(17)

CellとPentium4の比較

CELL Pentium4 (Prescott)

製造技術 90nm SOI 90nm トランジスタ数 2億3400万 1億2500万 面積 221mm2 112mm2 動作周波数 4.0GHz(最大4.6GHz) 3.8GHz ピーク性能 256GFlop/s(SPE×8個) 15.2GFlop/s 消費電力 48W(6W×8SPE)+α 103W 外付けDRAMインタフェース XIO:25.6Gバイト/秒(32ビット×3.2GHz×2 チャネル) FSB:6.4Gバイト/秒(64ビット ×800MHz) プロセッサコア 9個 1個 メインプロセッサ PPE(Powerベース+VMX)×1個 IA32(x86)ベース(+SSE3) 演算プロセッサ メインプロセッサ • L1命令キャッシュ:32KB • L1データキャッシュ:32KB • L2キャッシュ:512KB • L1命令キャッシュ:12Kマイクロ命令 • L1データキャッシュ:16KB • L2キャッシュ:1MB 演算プロセッサ • 各SPEのLS:256KB - チップ内インターコネクト (オンチップバス) EIB:192Gバイト/秒((128ビット+64ビット) ×2GHz×4リング) - 入出力インタフェース FlexIO:76.8Gバイト/秒(6.4Gビット/秒×8ビッ ト×12トランシーバ/レシーバ) SPE(SIMDプロセッサ)×8個 - 内部メモリ

(18)

1976 1982 1988 1994 2008

安定性/連続性指向

?

新規性/独創性と安定性/連続性

との間のせめぎ合い

新規性/独創性指向

自動ベクトル化 コンパイラ (F/N/H, 1982~) MPP (nCUBE, 1985) (CM-2, 1987) MPI (1995) OpenMP (1997) ベクトル・ アーキテクチャ (Cray, 1976~)

ベクトル・マシンの時代

PCクラスタ (Beowulf, 1994~)

マルチ・スカラ・マシンの時代

PC

クラスタの時代

2000

• ベクトル・アーキテクチャ:自動ベクトル化コンパイラの成功でコモディティに!

• MPP:非標準通信ライブラリを用いたインターコネクト・ネットワーク・トポロジーに依

存したプログラミング→普及できずに消滅!

PVM (1990)

(19)

?

プロ

サ性

プロセッサとメモリとの間の

性能トレードオフ

1975 1990 2005 RISC-I (1MHz, 1982) CISC オンチップ キャッシュ (Intel 486, 1989) Cray I (83MHz, 166MFlop/s, 640MB/s,1976) ES AP (1GHz, 8GFlop/s, 32GB/s, 2002) Intel P-III (1GHz, 2000) Intel Pentium (100MHz, 1994)

CISC

の時代

RISC

の時代

μアーキの時代

Intel P4 (3.6GHz, 8.6GB/s, 2004) • メモリ(DRAM)性能:RISCおよびオンチップキャッシュが登場した1980年代のピークを境に,プロセッ サ性能からの乖離が深刻化 – そもそもRISCは「プロセッサ性能=メモリ性能」を前提としたアーキテクチャ • 今や命令セットアーキテクチャ(CISC vs. RISC)の時代ではなく,マイクロアーキテクチャ(OOOスー パースカラ,ディープパイプライン,SMT,等)の時代 – 唯一の例外は,SIMD演算命令の成功 Rambus DRAM (1GB/s, 1995)

Memory Wall Problem (M. Wilkes, 1995)

MIPS R2000 (12MHz, 1986)

(20)

1980

1990

2000

2005

1

10

1

10

2

10

3

10

4

10

5

マイクロプロセッサ

55%/年

主記憶(DRAM)

7%/年

マイクロプロセッサ

vs. DRAM

性能向上率の差

48%/

「Memory Wall」問題

性能向上率

(21)

ベクトル・プロセッサ vs.

スカラ・プロセッサ

• ベクトル・プロセッサ

: : : : : : : : : : : ... : VLSU ORN :

IMBM: Interleaved Multi-Bank Memory ORN: Operand Routing Network

:

• スカラ・プロセッサ

: VR VFU IMBM LSU

VLSU: Vector Load/Store Unit VR: Vector Register

FPU

FR

LM

DC

CR: Cache Refill Controller DC: Data Cache

FR: Floating-point Register

FPU: Floating-point Processing Unit LM: Linear Memory

LSU: Load/Store Unit

(22)

スカラ・プロセッサ vs.

動的再構成可能データパス

• スカラ・プロセッサ

:

• 動的再構成可能データパス

LM : : : ... : SMAC SB : : : LSU FPU FR LM DC

CRC: Cache Refill Controller DC: Data Cache

FR: Floating-point Register

FPU: Floating-point Processing Unit IFU: Integer Functional Unit

LM: Linear Memory LSU: Load/Store Unit

ORN: Operand Routing Network SB: Steaming Buffer CRC ORN ... ORN ... : : : : ORN ... ORN IFU

(23)

512KB 512KB L2 L2キャッシュキャッシュ 512KB 512KB L2 L2キャッシュキャッシュ 浮動小数点演算器 整数演算器 整数演算器 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS 256KB LS PPE PPE 512KB 512KB L2 L2キャッシュキャッシュ 倍精度浮動小数点演算器 単精度浮動小数点演算器

Cell (221mm

2

@90nm)

Pentium4 (112mm

2

@90nm)

整数演算器

ペタフロップス超級スパコンの実現に向けて

~トランジスタを何に投資するか~

写真:SONY提供 写真:Intel提供

参照

関連したドキュメント

専攻の枠を越えて自由な教育と研究を行える よう,教官は自然科学研究科棟に居住して学

全国の 研究者情報 各大学の.

金沢大学学際科学実験センター アイソトープ総合研究施設 千葉大学大学院医学研究院

東京大学 大学院情報理工学系研究科 数理情報学専攻. hirai@mist.i.u-tokyo.ac.jp

情報理工学研究科 情報・通信工学専攻. 2012/7/12

東北大学大学院医学系研究科の運動学分野門間陽樹講師、早稲田大学の川上

1991 年 10 月  桃山学院大学経営学部専任講師 1997 年  4 月  桃山学院大学経営学部助教授 2003 年  4 月  桃山学院大学経営学部教授(〜現在) 2008 年  4

2020年 2月 3日 国立大学法人長岡技術科学大学と、 防災・減災に関する共同研究プロジェクトの 設立に向けた包括連携協定を締結. 2020年