• 検索結果がありません。

Tesla P100

ドキュメント内 FPGA(6/1用授業資料) (ページ 37-44)

Virtex-6 の CLB

Stratix 10 Tesla P100

最大 TFLOPS 9.2 ? 9.3

最大電力( W ) 33- 45 250 価格 177万(開発キッ

ト)

81 万( Amazon )

• まだ Stratix 10 と GPU との比較は国際会議などでは出てきていな

• Arria10い の場合は、アプリケーションとチューニングのテクニック

によるが GPU には絶対性能では勝てない場合が多い。しかし電力 性能では勝つ

• コストは現時点では不明(出だしなので高価すぎる)だが、 Stratix V を考える(シリーズによるが 1 チップ当たり 130 万円くらいす る)と、 GPUに比べて倍以上するのでは?

アクセラレータとしての FPGA は成功する か?

• OpenCL の導入によりソフトウェア開発者、ス

パコン屋が利用可能になった

– しかし FPGA の良い所が半減したかもしれない

• 科学技術計算では、 GPU に性能面では勝てそ うもない

– Stratix 10 ならば良い勝負ができるかもしれない – しかし値段が相当違う、、、

– そのうちスパコン屋に飽きられるのでは?

• AI 分野は?

– OpenCL を使っていると GPU に比べてメリットが 少ない

• Intel には勝算があるのだろうか???

OpemCL の無料化 intel HLS の登場

ソリューションの提供

• Stratix10 クラスの性能を持ち、ターゲッ トアプリケーションが決まっている(例 えば CNN の学習)場合

– HDL を使って専門家が根性でチューニングす る

– 性能、電力で GPU に勝てる可能性がある

• カスタマがはっきりしていれば勝機があ る

→Maxeler のビジネスモデル

• Cloud で提供すれば機会が広がる

FPGA in Cloud

• Catapult project   by Microsoft [ISCA14 他 ]

– FPGA を用いた検索エンジンの導入

• FPGA Supervessel Cloud by IBM

– FPGA によるサービスの提供 [ICFPT2016]

– Xilinx SDACcel によるアプリケーション開発

• OpenCL に似た開発環境

• Amazon EC2 F1 インスタンス

– Cloud 上での FPGA アプリケーション開発環 境

– Xilinx Ultrascale+ を利用

– さほど利用は広がっていない

Microsoft’s Catapult

CPU FPGA

CPU FPGA

CPU FPGA

CPU FPGA

CPU FPGA

CPU FPGA

CPU FPGA

CPU FPGA

FE FFE0 FFE1 Compress MLS0 MLS1 MLS2

Rank computation for Web search on Bing.

Task Level Macro-Pipelining (MISD) FE: Feature Extraction

FFE: Free Form Expression: Synthesis of feature values MLS: Machine Learning Scoring

2-Dimensional Mesh is formed (8x6) for 1 cluster.

FPGA: Altera’s Stratix V

FiC(Flow in Cloud)

Xilinx 社 Kintex Ultrascale の ボード 24 枚を密結合した FPGA クラスタ

今日のポイント

• FPGA はディジタル回路を簡単に実現するためには理想的

なデバイス

• LUT を用い、 SRAM に構成情報を入れておくタイプが急

激に発達 • 通常の CMOS のプロセスだけで実現できたのが原因

• ASIC に比べて、性能、大量生産時のコスト、電力すべて

劣るが、 NRC(Non-Recurrent Cost) が節約できる

• HDL 設計が主流だが C 言語設計も広がる

• Intel が Altera を買収し、 FPGA は演算加速(アクセラレ ータ)としても展開。

• FPGA in Cloud など新しい動きが一杯

ドキュメント内 FPGA(6/1用授業資料) (ページ 37-44)

関連したドキュメント