• 検索結果がありません。

Microsoft PowerPoint - ICD-ARCパネル

N/A
N/A
Protected

Academic year: 2021

シェア "Microsoft PowerPoint - ICD-ARCパネル"

Copied!
14
0
0

読み込み中.... (全文を見る)

全文

(1)

(

)

東芝 セミコンダクター社

2008

5

13

斎藤 光男

ICD-ARC

共催研究会パネル討論

(2)

プロセッサ周波数の年代別の伸び

10

100

1000

10000

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

Year (Chip or System Shipment)

Cl

o

c

k

Ra

te

(

M

H

z)

Hiend Processor

x86 Processor

GAME console

1999 SIA local clk(Hi-Perf.)

1999 SIA chip-across clk(Hi-Perf.)

1 0 0 M H z R 4 0 0 0 1 8 7 M H z 2 1 0 6 4 2 0 0 M H z 2 1 0 6 4 2 7 5 M H z 2 1 0 6 4 3 0 0 M H z 2 1 1 6 4 5 0 0 M H z 2 1 1 6 4 6 0 0 M H z 2 1 1 6 4 8 0 0 M H z P e n t i u m I I I 4 5 0 M H z P e n t i u m I I 3 0 0 M H z P e n t i u m I I 2 0 0 M H z P e n t i u m P r o 1 5 0 M H z P e n t i u m P r o 1 0 0 M H z P e n t i u m 6 6 M H z P e n t i u m 6 6 M H z 4 8 6 D X 2 3 3 M H zP l a y St a t i o n 1 9 9 4 / 1 2 / 3 1 0 0 M H z N i n t e n do 6 4 1 9 9 6 / 6 / 1 8 2 0 0 M H z D r e a m e c a s t 1 9 9 8 / 1 1 / 2 4 3 0 0 M H z P l a y S t a t i o n 2 2 0 0 0 / 3 / 4

2G Hz

3G Hz

7 0 0 M H z 2 1 2 6 4 6 0 0 M H z P e n t i u m I I I 7 3 3 M H z XB o x 2 0 0 1 / 1 1 / 1 5 1 G H z A t h l o n / P I I I 1 . 4 G H z P e n t i u m 4

4G Hz

5G Hz

6G Hz

2 . 0 G H z P e n t i u m 4 4 8 5 M H z G a m e C u be 2 0 0 1 / 9 / 1 4 3 . 0 G H z P 4 3 . 2 G H z P 4 3 . 4 G H z P 43 . 6 G H z P 4 3 . 8 G H z P 4 3 . 2 G H z XB o x 3 6 0 2 0 0 5 / 1 2 / 1 0 3 . 2 G H z P L A Y S T A T I O N 3 2 0 0 6 / 1 1 / 1 1 2 . 9 3 G H z C o r e 2 E x t

RISCプロセッサ優位

構造が単純と言う利点

CISCプロセッサの時代

アウトオブオーダーの導入

マルチコアの時代

周波数≠性能

(3)

マルチコア化が進むマイクロプロセッサ

(4)

マルチコアプロセッサ構成の分類

説 明

マルチスレッド

性能

Homogeneous Multi-core

Homogeneous Multi-core (small core)

Heterogeneous Multi-core (simple)

汎用

CPU

汎用

CPU

汎用

CPU

汎用

CPU

シンプル

CPU

シンプル

CPU

シンプル

CPU

シンプル

CPU

シンプル

CPU

シンプル

CPU

シンプル

CPU

シンプル

CPU

シンプル

データ用

CPU

シンプル

制御用

CPU

シンプル

データ用

CPU

シンプル

データ用

CPU

シンプル

データ用

CPU

シンプル

データ用

CPU

シンプル

データ用

CPU

従来型の汎用CPUコア

を2個以上搭載する

シンプル化したCPU

コアを多数搭載する

比較的シンプルな制御

用CPUコアとシンプル

なデータ用CPUコアを

組み合わせる

シングルスレッド

性能

性能/

消費電力

ソフトウエア

移植性

そこそこ

高い

非常に

高い

非常に

高い

非常に

高い

低い

×

高い

悪い

×

良い

非常に

良い

抜本的

変更

×

シンプル

データ用

CPU

シンプル

データ用

CPU

種 類

(5)

Media性能

6

4

ビッ

M

M

12

8

M

M

Multimedia命令追

加による軌道修正

Integer性

能余り

Media性

能不足

/CP

Iに

した

PC用

プロセッサ

Processor

Processor

としての

としての

Cell

Cell

は?

は?

Media

Media処理

処理

Cell

Cell

PCの周波数

が上がっても

体感速度は変

わらないなー

映像の再生

が出来るよ

うになったが、

画質・サイズ

に不満

Integer

性能

(6)

Synergistic Processor Element (SPE)の特長

データ演算処理向けの新しいアーキテクチャ

データ演算処理向けの新しいアーキテクチャ

¾

メディア演算・浮動小数点演算

RISC

RISC 命令セット体系のプロセッサ

命令セット体系のプロセッサ

¾

高級言語指向

SIMD

SIMD 演算命令

演算命令

¾

128 ビットデータに対して並列

演算を実行 (eg. 4x32ビット)

128

128 本の

本の

128 ビット幅

128

ビット幅

レジスタファイル

レジスタファイル

256KB

256KB の

ローカルストア

ローカルストア

様々なパフォーマンス測定機能

様々なパフォーマンス測定機能

PPE:Power Processor Element

SPE: Synergistic Processor Element

LS : Local Storage

Cell/GPU

XDR

DRAM

I/O

Super

Companion

Chip

Element Interconnect Bus (EIB)

PPE

PPU

xio

F

lexIO

SPE

SPU

MFC

SPE

SPU

MFC

LS

SPE

SPU

MFC

LS

SPE

SPU

MFC

LS

SPE

SPU

MFC

LS

SPE

SPU

MFC

LS

SPE

SPU

MFC

LS

SPE

SPU

MFC

LS

L2

Cache

25.6GB/s

76.8GB/s

注) 注) 注)

LS

(7)

CellはRISC以来の新しい方向かもしれない

RISC

RISCが提案したもの

が提案したもの

¾

プログラムをアセンブラで書く

のをあきらめる

• コンパイラが扱いやすい単純な

命令のみに限定

• 効率的なプログラムをコンパイ

ラにゆだねる

¾

その結果、計算機のHWの中

身をユーザは直接は知らなく

ても良い

• 高級言語によってプログラムが

容易に

• リアルタイム性は追求しない

¾

圧倒的なコストパフォーマンス

を実現

• 簡単なハードウエアで高性能

• 3倍程度の性能が得られた

Cell

Cellが提案したもの

が提案したもの

¾

ハードウエアをありのままにユー

ザに見せる

• HWの構成、メモリサイズなどを意

識してプログラム

• プログラムを効率的にするには工

夫が必要

¾

その代わり、計算機の中で何が起

きているのかをユーザに出来るだ

け知らせる

• 性能のチューニングが容易に

• リアルタイム性が容易に確保できる

¾

圧倒的なコストパフォーマンスを実

• はるかに小さいSPU1個がPC用プ

ロセッサ2個以上に相当する例も

(8)

アカデミック・研究機関への期待

並列性の特徴

並列性の特徴

¾

マルチレベル・粒度の並列処理(スレッド、データ、命令)

¾

Determisticな可制御性の高い計算機モデル

新しい研究テーマ例

新しい研究テーマ例

¾

自動並列化コンパイラ

• SIMD化やマルチコアに対応する細粒度から粗粒度の多様な自動並

列化

• 多階層のストレージモデルに適したコード・データの自動分割

¾

並列プログラミングモデル

• OpenMP等の多様な生産性の高いプログラミング言語やスキーム

¾

新しいアプリケーション

• 生物学、航空宇宙学等の産業分野向けスーパーコンピュータ

• 映像認識性能を活かす家庭向けエンターテイメント

(9)

FAIS:Cell/B.E.の新研究拠点が九州に誕生

北九州産業学術推進機構

北九州産業学術推進機構

(

(

FAIS)に、ソ

FAIS)

に、ソ

ニー・東芝・IBMが支援する、米国ジョージ

ニー・東芝・IBMが支援する、米国ジョージ

ア工科大学に続く、第2の研究拠点

ア工科大学に続く、第2の研究拠点

画像処理技術や脳情報学等の様々な研究

画像処理技術や脳情報学等の様々な研究

者が連携する応用研究を推進

者が連携する応用研究を推進

日本経済新聞

(2007/10/30)

FAIS Cell/B.E.研究拠点

Software

Document

Cell/B.E.オンライン環境

画像処理

Forum

脳情報学

(10)

STI Center of Competence (CoC) at Georgia Tech

米国ジョージア工科大学に、ソニー・東芝・IBMが支援し

米国ジョージア工科大学に、ソニー・東芝・IBMが支援し

て、

て、

STI Center of Competence (

STI Center of Competence (

CoC

CoC

)

)

研究拠点を開設

研究拠点を開設

情報共有コミュニティサイト

情報共有コミュニティサイト

CellBuzz

CellBuzz

wiki

wiki

¾

http://wiki.cc.gatech.edu/cellbuzz

ワークショップ

ワークショップ

¾

プログラミングワークショップを2007年2・6月開催

引用元:

(11)

QVGA

D1(SD)

1080i

720p

2006 2007

2008 2009 2010

2011 2012

2013 2014 2015

Node

65nm

45nm

32nm

22nm

Year

SW

SW

solution

solution

HW

HW

solution

solution

(H.265)

Trend of HW Solution to SW Solution

MPEG-2, MPEG-4,

H.264,

DivX, VC-1,

On2 True Motion VP6,

RealVideo, Indeo,

MJPEG,

(12)

SpursEngineとCell/B.E.の比較

SPE SPE

SPE

SPE SPE SPE SPE

PPE

XIO

XDR

Cell/B.E.

映像認識

Encode

Decode

SPE

映像処理

SPE SPE SPE SPE

映像認識

映像処理

Cell/B.E.のDNA

⇒柔軟性と高性能

MPEG2

ENC

H.264

ENC

MPEG2

DEC

H.264

DEC

定型処理ハード化

⇒低消費電力

FlexIO

IO

Bridge

Linux

XIO

XDR

PCI Express

Host

Linux

Windows

コプロセッサ化

⇒ホスト汎用化

Cell/B.E.

Cell/B.E.

と共通のプロセッサコア

と共通のプロセッサコア

SPE

SPE

を4基内蔵するコプロセッサ。

を4基内蔵するコプロセッサ。

Cell/B.E

(13)

SoC Platform based on

SoC Platform based on

Venezia

Venezia

Sub

Sub

-

-

system

system

MeP

MeP

Base

Base

Current

Current

Venezia

Venezia

Base

Base

MeP

MeP

Module 0

Module 0

MeP

MeP

SoC

SoC

Global Bus

Global Bus

HW Module

HW Module

MeP

MeP

Module 1

Module 1

MeP

MeP

Module 2

Module 2

JTAG Debug

JTAG Debug

I/F Module

I/F Module

Memory Controller,

Memory Controller,

Host I/F, etc

Host I/F, etc

Bus Bridge

Bus Bridge

(Memory Controller)

(Memory Controller)

Host CPU

Host CPU

(ARM, MIPS,

(ARM, MIPS,

Etc.)

Etc.)

DMAC

DMAC

Bus Bridge

Bus Bridge

Peripheral

Peripheral

I/O

I/O

Video

Video

CODEC

CODEC

MeP

MeP

Module

Module

MeP

MeP

SoC

SoC

Global Bus

Global Bus

HW Module

HW Module

Filter

Filter

MeP

MeP

Module

Module

Audio

Audio

MeP

MeP

Module 2

Module 2

JTAG Debug

JTAG Debug

I/F Module

I/F Module

MeP

MeP

SoC

SoC

Global Bus

Global Bus

JTAG Debug

JTAG Debug

I/F Module

I/F Module

Memory Controller,

Memory Controller,

Host I/F, etc

Host I/F, etc

Bus Bridge

Bus Bridge

(Memory Controller)

(Memory Controller)

Host CPU

Host CPU

(ARM, MIPS,

(ARM, MIPS,

Etc.)

Etc.)

DMAC

DMAC

Bus Bridge

Bus Bridge

Peripheral

Peripheral

I/O

I/O

MeP

MeP

SoC

SoC

Global Bus

Global Bus

JTAG Debug

JTAG Debug

I/F Module

I/F Module

Venezia

Venezia

Sub

Sub

-

-

system

system

IVC2

IVC2

IVC2

IVC2

...

...

Video task

FIlter task

Audio task

Video task

Filter task

Audio task

Video thread

Video thread

Video thread

Video thread

Filter thread

Filter thread

Filter thread

Filter thread

Filter thread

Video thread

Video thread

Filter thread

Audio thread

Audio thread

(14)

今後の展開

プログラムモデルを変えないマルチコア,メニーコアは今後も続く

プログラムモデルを変えないマルチコア,メニーコアは今後も続く

¾

シングルコアに戻る事は無い

¾

サーバ, PCなどはこの方向

新しいプログラムモデルにより,性能重視のヘテロコアが増える

新しいプログラムモデルにより,性能重視のヘテロコアが増える

¾

新しいプログラムモデルを使いこなせれば, 性能は飛躍的に上がる

¾

アカデミアへの期待の大きいところ

一方で

一方で

HWとの融合を目指す

HW

との融合を目指す

SpursEngine,

SpursEngine

Veneziaのような試

Venezia

のような試

みが増える

みが増える

¾

効率の良いハードウエアの置き換えを目指し,

¾

ソフトウエアの最適化と, 専用ハードウエア,リコンフィギャラブルアーキテク

チャの組み合わせで,消費電力, コストの最適化を図る

やわらかいハードウエアを目指して

やわらかいハードウエアを目指して

¾

新しいプログラミングモデルと,消費電力などの効率化で

¾

SOCの時代を生き抜き

¾

ソフトウエアの時代への供えを作る事が重要

参照

関連したドキュメント

The IC consists of the following blocks: Precision Flexible DAC, Differential Remote Voltage Sense Amplifier, High Performance Voltage Error Amplifier, Differential Current

18 VDRP Voltage output signal proportional to current used for current limit and output voltage droop 19 VDFB Droop Amplifier Voltage Feedback.. 20 CSSUM Inverted Sum of

輸出入貨物の容器輸出申告 関基 67-2-12⑴、⑵ 輸出入貨物の容器輸入(納税)申告 関基 67-2-12⑴、⑵ 当事者分析成績採用申請(新規・更新・変更)

西側ヨーロッパの影響が大きいためか、シンプルな和音や規則的な拍子で構成さ

Should Buyer purchase or use onsemi products for any such unintended or unauthorized application, Buyer shall indemnify and hold onsemi and its officers, employees,

18 VDRP Voltage output signal proportional to current used for current limit and output voltage droop 19 VDFB Droop Amplifier Voltage Feedback.. 20 CSSUM Inverted Sum of

18 VDRP Voltage output signal proportional to current used for current limit and output voltage droop 19 VDFB Droop Amplifier Voltage Feedback.. 20 CSSUM Inverted Sum of

18 VDRP Voltage output signal proportional to current used for current limit and output voltage droop 19 VDFB Droop Amplifier Voltage Feedback.. 20 CSSUM Inverted Sum of