Stratix 10
の高度な情報の要約
2015.06.08AIB-01025 更新情報 フィードバック
アルテラが提供する 14 nm Stratix® 10 FPGA & SoC は、前世代の高性能 FPGA に比べ 2 倍のコア
性能向上と最大 70%の消費電力削減を実現します。
全く新しい HyperFlex™コア・アーキテクチャを含む数々の革新的なブレイクスルーにより、
Stratix 10 ファミリは消費電力に対応につつ、最先端デバイスにおいて増大を続ける帯域幅や処 理能力などの要件を満たすことが可能です。
クアッドコア 64 ビット ARM® Cortex®-A53 をベースにしたハード・プロセッサ・システム
(HPS)を搭載した Stratix 10 SoC デバイスは、消費電力の効率化、アプリケーション・クラスの 処理を実現するだけでなく、設計者による FPGA ファブリックへのハードウェア仮想化の拡大が 可能です。Stratix 10 SoC デバイスを使用すれば、アルテラの高性能 SoC に対するコミットメン ト、そして ARM ベースのプロセッサ・システムを使用したプログラマブル・デバイスにおける アルテラの先進性をご理解いただけることでしょう。
Stratix 10 FPGA & SoC には以下のブレークスルーが含まれています
• 前世代の高性能 FPGA に比べ 2 倍のコア性能を実現する全く新しい HyperFlex コア・アーキテ クチャ • 業界最先端のインテル 14 nm トライゲート(FinFET)テクノロジ • ヘテロジニアス 3D Sip(System-in-Package)テクノロジ • 最大 5.5 M ロジック・エレメント(LE)のモノリシック・コア・ファブリック • ヘテロジニアス 3D Sip トランシーバ・タイル上の最大 144 個の全二重トランシーバ・チャネ ル • チップ間、チップ―モジュール間における最大 30 Gbps のトランシーバ・データ・レートと バックプレーン性能
• フラクショナル合成および超低ジッタ LC タンク・ベースの送信 PLL(Phase Locked Loops) • ハード PCI Express Gen3 x 16 個の IP(Intellectual Property)ブロック
• 各トランシーバ・チャネル内の Hard 10GBASE-KR/40GBASE-KR4 順方向誤り訂正(FEC) • 各ピンごとの最大 2666 MBps の DDR4 レートをサポートするハード・メモリ・コントローラ
および PHY
• 80 GFLOPS/W の電力効率を持つ、最大 10 TFLOPS のスループットのハード固定および IEEE 754 準拠のハード浮動小数点デジタル信号処理(DSP)ブロック
• SoC ファミリ・バリアントには最大 1.5 GHz のクアッドコア 64 ビット ARM Cortex-A53 プロ セッサを搭載
• 柔軟かつ低消費電力な低スキュー・クロック・ツリーが生成可能なプログラマブル・クロッ ク・ツリー・シンセシス
© 2015 Altera Corporation. All rights reserved. ALTERA, ARRIA, CYCLONE, ENPIRION, MAX, MEGACORE, NIOS, QUARTUS and STRATIX words and logos are trademarks of Altera Corporation and registered in the U.S. Patent and Trademark Office and in other countries. All other words and logos identified as trademarks or service marks are the property of their respective holders as described at www.altera.com/common/legal.html. Altera warrants performance of its semiconductor products to current specifications in accordance with Altera's standard warranty, but reserves the right to make changes to any products and services at any time without notice. Altera assumes no responsibility or liability arising out of the application or use of any information,
ISO 9001:2008
• 専用のセキュア・デバイス・マネージャ(SDM)は以下を提供します • 強化されたデバイス・コンフィギュレーションとセキュリティ • セクターベースの認証と暗号化
• AES-256、SHA-256/384、および ECDSA-256/384 暗号化/複合化アクセラレータと認証 • 多要素認証
• PUF(Physically Unclonable Function)サービスおよびプログラマブル・デバイス・コンフ ィギュレーション機能
• 前世代の高性能 FPGA に比べ最大 70%の消費電力削減を達成する包括的で高度な省電力機能 • 互換性のあるフットプリントを持つ一部のデバイスでは、Arria® 10 FPGA と Stratix 10 FPGA
間のマイグレーションでパッケージが利用可能
• ASIC やプロトタイピングをはじめとするアプリケーションをサポートする非破壊レジスタ・ ステート・リードバックとライトバック
これらの機能が搭載された Stratix 10 FPGA & SoC は、以下のような多様な市場のなかでも最も要 求の厳しいアプリケーションへの使用に適しています。 • コンピュータ&ストレージ—カスタム・サーバー、クラウド・コンピューティング、および データ・センタ・アクセラレーション • ネットワーキング—テラビット、400G およびマルチ 100G ブリッジング、アグリゲーション、 パケット処理、およびトラフィック • オプティカル・トランスポート・ネットワーク—OTU4、2xOTU4、4xOTU4 • ブロードキャスト—ハイエンド・スタジオ・ディストリビューション、ヘッドエンド・エン コーディング/ディコーディング、エッジ QAM • ミリタリー—レーダー、電子戦、セキュアな通信 • 医療機器—診断スキャナー、診断イメージング • テスト&計測機器—プロトコルおよびアプリケーション・テスタ • ワイヤレス—次世代 5G ネットワーク
• ASIC プロトタイピング—最大 I/O 数を持つ最高集積度のモノリシック FPGA ファブリック を要求するデザイン
Stratix10
デバイス・ファミリのバリアント
Stratix 10 デバイスでは、FPGA (GX と GT)と SoC(SX)のバリアントが利用可能です。 • Stratix 10 GX デバイスは、最大 1 GHz コア・ファブリック・パフォーマンスを実現し、モノ リシック・ファブリックに最大 5.5M LE を搭載しています。さらに、各トランシーバ・タイ ルは最大 144 個の汎用トランシーバ、そして 2666 Mbps DDR4 外部メモリ・インタフェース性 能を備えています。搭載されたトランシーバは、最大 30 Gbps のショート・リーチおよびバ ックプレーン機能をサポートします。業界最先端のインテル 14 nm トライゲート・プロセ ス・テクノロジで製造される Stratix 10 GX デバイスは、非常に高いトランシーバ帯域幅およ びコア・ファブリック・パフォーマンスを必要とする FPGA アプリケーション向けに最適化 されています。 • Stratix 10 SX デバイスは、Stratix 10 GX デバイスの全機能に加え、64 ビット・クアッドコア ARM Cortex-A53 プロセッサをハード・プロセッサ・システムに搭載しています。 • Stratix 10 GT デバイスは、次世代規格の帯域幅とパフォーマンスを必要とする最も要求の厳 しいアプリケーション向けに、最大 56 Gbps のデータ・レートをサポートするトランシーバ を内蔵しています。 2 Stratix10デバイス・ファミリのバリアント 2015.06.08AIB-01025
すべての Stratix 10 ファミリ・バリアントに共通する点は、 インタコネクト配線の全体およびす べての機能ブロックの出力に満遍なく Hyper-Register と呼ばれる追加のレジスタが配置された 革新的な HyperFlex コア・アーキテクチャを搭載した高性能ファブリックであるという点です。 また、コア・ファブリックにはアルテラの ALM(adaptive logic module)を活用するエンハンス ト・ロジック・アレイおよび以下に述べる豊富な高性能ビルディング・ブロックが含まれていま す。 • 20Kbit(M20K)内部メモリ・ブロック • IEEE 754 に準拠したハード浮動小数点の可変精度 DSP ブロック • フラクショナル合成 PLL とインテジャー PLL • 外部メモリ・インタフェース向け PHY とハード・メモリ・コントローラ • 汎用 IO セル このようなビルディング・ブロックのクロッキングには、Stratix 10 デバイスはプログラマブル・ クロック・ツリー・シンセシスを使用しますが、これにはアプリケーションに必要なクロック・ ツリーのブランチのみを合成する専用クロック・ツリー配線が使用されます。すべての Stratix 10 デバイスはロジック・アレイのインシステム、きめ細かいパーシャル・リコンフィギュレー ションをサポートしているので、動作中にシステムにロジックを追加したり、あるいはシステム からロジックを削除することが可能です。 すべてのデバイス・ファミリ・バリアントには高速シリアル・トランシーバが搭載されており、 フィジカル・メディア・アタッチメント(PMA)とフィジカル・コーディング・サブレイヤ (PCS)の両方が含まれています。これらは様々な業界標準規格や独自のプロトコルの実装に使 用することができます。Stratix 10 デバイスにはハード PCS 以外にも x1/x2/x4/x8/x16 レーン・コ ンフィギュレーションで Gen1/Gen2/Gen3 レートをサポートする PCI Express ハード IP のインス タンスを複数有しており、この他にも各トランシーバにハード 10GBASE-KR/40GBASE-KR4 FEC を備えています。ハード PCS、FEC、および PCI Express IP を使用することで貴重なコア・ロジ ック・リソースが確保され、消費電力も削減できるため生産性が向上します。
Stratix 10 FPGA & SoC
のイノベーション
Stratix 10 FPGA & SoC は前世代の高性能 Stratix V FPGA と比べ大きく改善された点が多くありま す。
表 1: Stratix V デバイスとの比較で見る Stratix 10 デバイスの主要な機能
機能 Stratix V FPGA Stratix 10 FPGA & SoC
プロセス・テクノロジ 28-nm TSMC(プレー ナ型トランジスタ) 14 nm Intel トライゲート(FinFET) ハード・プロセッサ・コア 無 クアッドコア 64 ビット ARM Cortex-A53 コア・アーキテクチャ 従来型のインタコネク トを持つコア・アーキ テクチャ Hyper-Register をインタコネクトに持 つ HyperFlex コア・アーキテクチャ コア性能 500 MHz 1 GHz 消費電力 1x 最低 0.3x ロジック集積度 952 KLE(モノリシッ ク) 5,500 KLE(モノリシック) AIB-01025
機能 Stratix V FPGA Stratix 10 FPGA & SoC エンベデッド・メモリ(M20K) 52 M ビット 229 M ビット 18x19 マルチプライヤ 3,926 注: Stratix V デバイス におけるマルチプ ライヤは 18x18 で す。 11,520 浮動小数点 DSP 機能 最大 1 TFLOP。ソフト 浮動小数点加算器と乗 算器を必要とします。 最大 10 TFLOPS。ハード IEEE 754 準 拠の単精度浮動小数点加算器と乗算器 を必要とします。 最大トランシーバ数 66 144 最大トランシーバ・データ・レ ート(チップ間) 28.05 Gbps 30 Gbps 最大トランシーバ・データ・レ ート(バックプレーン) 12.5 Gbps 30 Gbps ハード・メモリ・コントローラ なし DDR4 @ 1333 MHz/2666 Mbps DDR3 @ 1067 MHz/2133 Mbps ハード・プロトコル IP PCIe Gen3 x8(最大 4 イ ンスタンス) PCIe Gen3 x16(最大 6 インスタンス) 10GBASE-KR/40GBASE-KR4 FEC コア・クロッキングおよび PLL フラクショナル・シン セシス fPLL によって サポートされるグロー バル・クロック、クワ ドラント・クロック、 およびリージョナル・ クロック フラクショナル・シンセシス fPLL およ びインテジャー IO PLL によってサポ ートされるプログラマブル・クロッ ク・ツリー・シンセシス レジスタ・ステート・リードバ ックおよびライトバック 無 ASIC やプロトタイピングをはじめとするアプリケーションをサポートする 非破壊レジスタ・ステート・リードバ ックとライトバック ファミリをまたぐピン・マイグ
レーション 無 Arria 10 FPGA と Stratix 10 FPGA において互換性のあるフットプリントを持 つ一部のデバイスでは、パッケージが 利用可能
上記のイノベーションは以下の点を改善します
• コア・ロジック・パフォーマンスの向上:インテルの 14 nm トライゲート・テクノロジによ る HyperFlex コア・アーキテクチャを実装することで、Stratix 10 デバイスは前世代のデバイ スと比較し 2 倍のコア性能を達成します。 • 消費電力の低減:インテルの 14 nm トライゲート・テクノロジを利用した HyperFlex コア・ アーキテクチャとオプションの省電力機能がアーキテクチャに組み込まれており、Stratix 10 デバイスは前世代のデバイスと比較して消費電力を最大 70%削減します。 • 高集積度:Stratix 10 デバイスはモノリシック・ファブリックに最大 5,500 K のロジック・エレ メント(LE)、229 M ビット以上のエンベデッド・メモリ・ブロック(M20K)、11,520 個の 18x19 乗算器を搭載しており、5 倍以上の高集積度を提供します。 • エンベデッド・プロセッシング:Stratix 10 SoC には電力効率に最適化されたクアッド・コア 64 ビット ARM Cortex-A53 プロセッサと前世代のアルテラ SoC に準拠したソフトウェアを搭 載しています。 • トランシーバ・パフォーマンスの向上:ヘテロジニアス 3D SiP トランシーバ・タイルには最 大 144 個のトランシーバ・チャネルが実装されており、Stratix 10 デバイスはチップ間で最大 30 Gbps のデータ・レートをサポートし、30 dB を超えるシステム・ロスのイコライゼーショ ンが可能な信号調整回路を持つバックプレーン間で 30 Gbps のデータ・レートをサポートし ます。 • DSP 性能の向上:Stratix 10 デバイスの可変精度 DSP ブロックはハード化されており、最大で 10 TFLOPS IEEE 754 単精度浮動小数点の性能を達成します。 • より多くのハード IP が利用可能:Stratix 10 デバイスには、48 個の汎用 IO を持つ各バンクに 含まれるハード・メモリ・コントローラ、各トランシーバ・タイル内のハード PCIe Gen3 x16 フル・プロトコル・スタック、各トランシーバ・チャネル内のハード 10GBASE-KR/40GBASE-KR4 FEC など、前世代のデバイスに比べさらに多くのハード IP ブロックが含まれています。 • 強化されたコア・クロッキング:Stratix 10 はプログラマブル・クロック・ツリー・シンセシ スを装備しています。このクロック・ツリーは必要な場合にのみ合成可能なため、柔軟性が 向上し、クロック・ソリューションにおける消費電力を削減することができます。 • コア PLL の追加:Stratix 10 デバイスのコア・ファブリックは、インテジャー IO PLL とフラク ショナル・シンセシス fPLL の両方でサポートされているため、前世代のデバイスよりもさら に多くの PLL が利用可能です。
FPGA
& SoC 機能の概要
表 2: Stratix 10 FPGA & SoC に共通するデバイス機能
機能 説明 テクノロジ • 14 nm インテル・トライゲート(FinFET)プロセス・テクノロジ • SmartVoltage ID 制御のスタンダード VCCオプション • 0.8 V と 0.85 V のオプション VCCコア電圧 AIB-01025 2015.06.08 FPGA & SoC 機能の概要 5
機能 説明 低消費電力シリア ル・トランシーバ •• Stratix 10 GX/SX デバイスでの連続動作範囲は 611 Mbps~30 Gbps合計で 144 個のトランシーバが使用可能 • Stratix 10 GX/SX デバイスでのバックプレーン・サポートは最大 30 Gbps • オーバーサンプリングを用いて最小レンジを 125 Mbps まで拡張可能 • ユーザーによるコンフィギュレーション可能なフラクショナル合成機 能を備えた ATX 送信 PLL • XFP、SFP+、QSFP/QSFP28、CFP/CFP2/CFP4 の光モジュール・サポー ト • アダプティブ・リニアとデジション・フィードバック・イコライゼー ション • 送信プリエンファシスとディエンファシス • 個々のトランシーバ・チャネルのダイナミック・パーシャル・リコン フィギュレーション • オン・チップ計測(EyeQ 非侵入型データ・アイ・モニタリング) 汎用 I/O • 合計 1640 個の GPIO が使用可能 • 1.6 Gbps LVDS—すべてのペアを入力もしくは出力としてコンフィギュ レーション可能 • 1333 MHz/2666 MBps DDR4 外部メモリ・インタフェース • 1067 MHz/2133 MBps DDR3 外部メモリ・インタフェース • 1.2 V~3.0 V のシングル・エンド LVCMOS/LVTTL インタフェース • オンチップ終端(OCT) エンベッデッドハー ド IP • PCIe Gen1/Gen2/Gen3 コンプリート・プロトコル・スタック、x1/x2/x4/x8/x16 エンド・ポイントおよびルート・ポート • DDR4/DDR3/LPDDR3 ハード・メモリ・コントローラ(ソフト・メモ
リ・コントローラを使用する RLDRAM3/QDR II+/QDR IV) • 各デバイス内には複数のハード IP インスタンスが利用可能 トランシーバ・ハード
IP • 10GBASE-KR と 40GBASE-KR4 の順方向誤り訂正(FEC)• 10G イーサネット PCS • PCI Express(PIPE)インタフェース
• Interlaken PCS
• ギガビット・イーサネット PCS
• CPRI(Common Public Radio Interface)PCS 用の確定的レイテンシ・サ ポート • GPON(ギガビット受動光ネットワーク)PCS 用の高速ロック・タイ ム・サポート • 8B/10B、64B/66B、64B/67B のエンコーダとデコーダ • 独自規格のプロトコル用のカスタム・モード・サポート 消費電力マネジメン ト • SmartVoltage ID 制御のスタンダード V• 低スタティック消費電力デバイス・オプションCCオプション • Quartus® II に統合された PowerPlay power analysis
機能 説明 高性能モノリシッ ク・コア・ファブリッ ク • インタコネクト配線の全体およびすべての機能ブロックの出力に満遍 なく Hyper-Register が配置された HyperFlex コア・アーキテクチャを搭 載 • モノリシック・ファブリックにより、コンパイル時間を短縮し、ロジ ック使用率を向上 • 強化されたアダプティブ・ロジック・モジュール(ALM) • マルチトラック配線アーキテクチャの改善により、配線の輻輳を低減 し、コンパイル時間を短縮 • プログラマブル・クロック・ツリー・シンセシスを持つ階層コア・ク ロッキング・アーキテクチャ • きめ細かなパーシャル・リコンフィギュレーション 内部メモリ・ブロック • M20K—20-Kbit のハード ECC サポート • MLAB—640-bit の分散 LUTRAM 可変精度 DSP ブロッ ク • IEEE 754 準拠ハード単精度浮動小数点機能• 18x19 から 54x54 の範囲の精度を持つ信号処理をサポート • ネイティブの 27x27 および 18x19 乗算モード • シストリック FIR 用の 64 ビット・アキュムレータおよびカスケード接 続 • 内部係数メモリ・バンク • プリ加算器/減算器により効率を向上 • パイプライン・レジスタの増設により性能を向上し、消費電力を低減 PLL(Phase-Locked Loop) • フラクショナルとインテジャーの両方のモードをサポートするフラクショナル・シンセシス PLL(fPLL) • third-order delta-sigma 変調を持つフラクショナル・モード • 精度周波数合成 • 汎用 I/O に隣接するインテジャー PLL、サポート外部メモリ、LVDS イ ンタフェース、クロック遅延補償、ゼロ遅延バッファ コア・クロック・ネッ トワーク • 1 GHz ファブリック・クロッキング• 667 MHz 外部メモリ・インタフェース・クロッキング。2666 Mbps DDR4 インタフェースをサポート。 • 800 MHz LCDS インタフェース・クロッキング。1600 Mbps LVDS イン タフェースをサポート。 • プログラマブル・クロック・ツリー・シンセシス。グローバル、リー ジョナル、およびペリフェラル・クロック・ネットワークとの後方互 換性あり。 • 必要な場合においてのみクロッキングを実行。ダイナミック電力を最 小化。 AIB-01025 2015.06.08 FPGA & SoC 機能の概要 7
機能 説明
コンフィギュレーシ
ョン •• 専用のセキュア・デバイス・マネージャソフトウェア・プログラマブル・デバイス・コンフィギュレーション • シリルおよびパラレル・フラッシュ・インタフェース
• PCI Express Gen1/Gen2/Gen3 を使用する CvP(Configuration via Protocol) • コア・ファブリックのきめ細かなパーシャル・リコンフィギュレーシ ョン • トランシーバと PLL のダイナミック・リコンフィギュレーション • AES-256、SHA-256/384、および ECDSA-256/384 アクセラレータと多要 素認証を含む包括的なセキュリティ機能 • セクターベースの認証と暗号化
• PUF(Physically Unclonable Function)サービス
パッケージング • インテルエンベデッド・マルチダイ・インタコネクト・ブリッジ (EMIB)パッケージング・テクノロジ • 同一のパッケージ・フットプリントを持つ複数のデバイスでは、集積 度の異なるデバイス間でのシームレスなマイグレーションが可能 • Arria 10 FPGA に準拠するフットプリントのパッケージが利用可能 • ボール間隔 1.0 mm の FBGA パッケージ • リード有とリード無のパッケージが選択可能 ソフトウェアとツー
ル • 全く新しい Spectra-Q および Hyper-Aware デザイン・フローを備えたQuartus II デザイン・スイート • HyperFlex アーキテクチャの性能を限界まで引き出す Fast Forwad コン
パイラ • トランシーバ・ツールキット • Qsys システム統合ツール • DSP Builder アドバンスト・ブロックセット • OpenCL™サポート • SoC エンベデッド・デザイン・スイート(EDS)
表 3: Stratix 10 SoC 限定のデバイス機能 SoC Subsystem 機能 説明 ハー ド・プ ロセッ サ・シ ステム 中央処理装置(CPU)コ
ア • ARM CoreSight デバッグおよびトレース・テクノロジを備えたクアッドコア ARM Cortex-A53 MPCore プロセッサ
コプロセッサ • ベクタ浮動小数点ユニット(VFPU)単精度および倍精度 • 各プロセッサに ARM NEON メディア・プロセッシング・ エンジンを装備 • システム・メモリ・マネージメント・ユニット(SMMU) • キャッシュ・コヒーレンシ・ユニット(CCU) レイヤ 1 キャッシュ • 32 KB L1 命令キャッシュ • 32 KB L1 ECC 付きデータ・キャッシュ レイヤ 2 キャッシュ • 1 MB の共有 L2 キャッシュ オンチップ・メモリ • 256KB オンチップ RAM、64KB オンチップ ROM ダイレクト・メモリ・ア クセス(DMA)コントロ ーラ • 8 チャネル DMA イーサネット・メディ ア・アクセス・コントロ ーラ(EMAC) • 統合された DMA を備えた 3 つの 10/100/1000 EMAC USB On-The-Go(OTG)
コントローラ • 統合された DMA を備えた 2 つの USB OTG UART コントローラ • 2 つの 16550 互換 UART コントローラ SPI(Serial Peripheral Interface)コントローラ • 4 つの SPI 2C コントローラが 1 個 • 5 つの I2C コントローラ QSPI フラッシュ・コント ローラ • フラッシュ・サポートのある SIO、DIO、QIO SPI が 1 個 SD/SDIO/MMC コントロ ーラ • DMA と CE-ATA サポートのある MMC 4.5 が 1 個 NAND フラッシュ・コン トローラ • 8 ビットと 16 ビット・サポートのある ONFI 1.0 以降が 1 個 汎用 I/O (GPIO) • 最大 62 個のソフトウェア・プログラマブル GPIO
タイマ • 7 つの汎用タイマ
• 4 つのウォッチドッグ・タイマ
セキュリティ • セキュア・ブート
• Advanced Encryption Standard(AES)と認証(SHA/ECDSA) AIB-01025
SoC Subsystem 機能 説明 外部メ モリ・ インタ フェー ス 外部メモリ・インタフェ ース • DDR4 と DDR3 を備えたハード・メモリ・コントローラ
Stratix 10
のブロック図
図 1: Stratix 10 FPGA & SoC アーキテクチャのブロック図
Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Variable -P recision, Har d F loating-P oin t DSP B locks M20K E mbedded Memor y B locks Har d Memor y C on trollers , I/O PLLs G ener al-P urpose I/O C ells , L VDS HyperF lex C or e L ogic F abric HPS Variable -P recision, Har d F loating-P oin t DSP B locks M20K E mbedded Memor y B locks HyperF lex C or e L ogic F abric SDM Hard Memor y C on trollers , I/O PLLs G ener al-P urpose I/O C ells , L VDS Variable -P recision, Har d F loating-P oin t DSP B locks M20K E mbedded Memor y B locks Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Package Substrate
HPS: Quad ARM Cortex-A53 Hard Processor System SDM: Secure Device Manager
EMIB: Embedded Multi-Die Interconnect Bridge
Stratix 10 FPGA & SoC
のファミリ・プラン
(1) 27x27 乗算器の個数は 18x19 乗算器の半分です。
表 4: Stratix 10 GX/SX SFPGA & SoC のファミリ・プラン FPGAコア インタコネクト PLL ハード IP Stratix 10 GX/SXデバ イス名 ロジッ ク・エ レメン ト (KLE) M20K ブロッ ク M20K Mビッ ト MLAB カウン ト MLAB Mビッ ト 18x19 乗算 器 最大
GPIO XCVR最大 fPLL PLLI/O PCIe HIP
GX 500/ SX 500 484 2,196 43 4,104 3 2,304 488 24 8 10 1 GX 650/ SX 650 646 2,583 50 5,652 3 2,880 488 24 8 10 1 GX 850/ SX 850 841 3,477 68 7,124 4 4,032 736 48 16 15 2 GX 1100/ SX 1100 1092 4,401 86 9,540 6 5,040 736 48 16 15 2 GX 1650/ SX 1650 1624 5,851 114 13,764 8 6,290 704 96 32 14 4 GX 2100/ SX 2100 2005 6,501 127 17,316 11 7,488 704 96 32 14 4 GX 2500/ SX 2500 2422 9,963 195 20,529 13 10,022 1,160 144 48 24 6 GX 2800/ SX 2800 2753 11,721 229 23,796 15 11,520 1,160 144 48 24 6 GX 4500/ SX 4500 4463 7,033 137 37,821 23 3,960 1,640 72 24 34 3 GX 5500/ SX 5500 5510 7,033 137 47,700 29 3,960 1,640 72 24 34 3 (2) すべてのパッケージは 1.0 mm ピッチのボール・グリッド・アレイです。 (3) 高電圧 I/O ピンは 3V と 2.5 V のインタフェースに使用されます。 (4) それぞれの LVDS ペアは差動入力か差動出力のどちらかにコンフィギュレーション可能です。 AIB-01025
表 5: Stratix 10 GX/SX SFPGA & SoC のファミリ・プラン、パート 1 セルの説明:汎用 I/O、高電圧 I/O、LVDS ペア、トランシーバ Stratix 10 GX/ SXデバイス 名 F1152 HF35 (35x35 mm2) F1760 HF43/NF43 (42.5x42.5 mm2) F2112 NF48 (47.5x47.5 mm2) F2112 SF48 (47.5x47.5 mm2) F2112 UF48 (47.5x47.5 mm2) GX 500/ SX 500 344、8、172、24 488、8、240、24 GX 650/ SX 650 344、8、172、24 488、8、240、24 GX 850/ SX 850 688、16、336、48 736、16、360、48 GX 1100/ SX 1100 688、16、336、48 736、16、360、48 GX 1650/ SX 1650 688、16、336、48 648、24、312、72 464、32、216、96 GX 2100/ SX 2100 688、16、336、48 648、24、312、72 464、32、216、96 GX 2500/ SX 2500 688、16、336、48 648、24、312、72 GX 2800/ SX 2800 688、16、336、48 648、24、312、72 GX 4500/ SX 4500 GX 5500/ SX 5500 (5) 高電圧 I/O ピンと LVDS ペアは汎用 I/O カウント数に含まれます。トランシーバはこれとは別に カウントされます。 (6) 各パッケージのカラムは、カラム内のすべてのデバイスに向けてピン・マイグレーション(一般的 な回路のボード・フットプリント)を提供しています。 (7) Stratix 10 GX デバイスは、同じパッケージ内で Stratix 10 SX デバイスとのピン・マイグレーション が可能です。
表 6: Stratix 10 GX/SX SFPGA & SoC のファミリ・プラン、パート 2 セルの説明:汎用 I/O、高電圧 I/O、LVDS ペア、トランシーバ Stratix 10 GX/ SXデバイス 名 F2112 SF48 (47.5x47.5 mm2) F2397 FF50 (50x50 mm2) F2397 UF50 (50x50 mm2) F2597 YF53 (52.5x52.5 mm2) F2912 FF55 (55x55 mm2) GX 500/ SX 500 GX 650/ SX 650 GX 850/ SX 850 GX 1100/ SX 1100 GX 1650/ SX 1650 704、32、336、96 GX 2100/ SX 2100 704、32、336、96 GX 2500/ SX 2500 1160、8、576、16 704、32、336、96 432、48、216、 144 GX 2800/ SX 2800 1160、8、576、16 704、32、336、96 432、48、216、 144 GX 4500/ SX 4500 648、24、312、72 1256、8、624、16 1640、8、816、16 GX 5500/ SX 5500 648、24、312、72 1256、8、624、16 1640、8、816、16
Arria 10
および Stratix 10 デバイス間の移行
現段階では Arria 10 デバイスで開発を開始し、将来 Stratix 10 デバイスに容易に移行することが 可能です。これは、いくつかの Arria 10 と Stratix 10 パッケージでフットプリントに互換性があ るためです。2 つのデバイス・ファミリ間で移行が可能であるかどうかの詳細については、アル テラまでお問い合わせください。 AIB-01025 2015.06.08 Arria 10および Stratix 10 デバイス間の移行 13HyperFlex
のコア・アーキテクチャ
Stratix 10 FPGA の SoC は、新しい HyperFlex コア・アーキテクチャを備えたモノリシック・コ ア・ファブリックを搭載しています。HyperFlex コア・アーキテクチャは、前世代の高性能 FPGA に比べて 2 倍のコア性能の向上と最大 70%の消費電力削減を実現します。このパフォーマンス のブレイクスルーに加え、HyperFlex コア・アーキテクチャは多くのアドバンテージをもたらし ます。 • スループットの向上—2 倍のコア性能を活用することでスループットのブレイクスルーをも たらします。 • 電力効率の改善—HyperFlex によって小型化された IP サイズを使用することで、以前であれ ば複数のデバイスにまたがっていたデザインを 1 つのデバイスに統合し、前世代のデバイス に比べ最大 70%電力を削減します。 • デザイン機能強化—高速化されたクロック周波数により、バス幅と IP サイズを縮小し、FPGA リソースをさらに解放し、より優れた機能が追加可能です。 • 設計者の生産性向上—Hyper-Aware デザイン・ツールを使用して、配線密集とデザインのイタ レーションを減少し、タイミング・クロージャをより迅速にするタイミング・マージンを拡 大します。 アダプティブ・ロジック・モジュール(ALM)に見られる従来型のユーザー・ロジックに加え、 HyperFlex コア・アーキテクチャは FPGA ファブリック全域にわたってバイパス可能なレジスタ が埋め込まれています。Hyper-Register と呼ばれるこの追加レジスタは、すべてのインタコネク ト配線セグメントと、すべてのファンクション・ブロックの入力で使用できます。 図 2: バイパス可能な Hyper-Register
clk
CRAM
Config
CRAM
Config
CRAM
Config
Interconnect
Interconnect
Stratix 10 HyperFlex
Routing Multiplexer
(with Hyper-Register)
Conventional
Routing Multiplexer
Hyper-Register は 2 倍のコア性能を達成するために以下の主要なデザイン・テクニックをイネー ブルします。 • クリティカル・パスを解消するきめ細かい Hyper-Retiming • 配線遅延を解消するゼロ・レイテンシの Hyper-Pipelining • クラス最高の性能を実現する柔軟な Hyper-Optimization これらの手法をデザインで使用すると、Hyper-Aware デザイン・ツールは Hyper-Register を自動 的に使用して、最大のコア・クロック周波数を実現します。 14 HyperFlexのコア・アーキテクチャ 2015.06.08AIB-01025図 3: HyperFlex のコア・アーキテクチャ
ALM ALM ALM
ALM ALM ALM
ALM ALM ALM
New Hyper-Registers throughout the core fabric
ヘテロジニアス 3D SiP トランシーバ・タイル
Stratix 10 FPGA & SoC は、高電力効率で高帯域幅かつ低レイテンシのトランシーバを備えていま す。これらトランシーバはヘテロジニアス 3D System-in-Package(SiP)に実装されており、それ ぞれ 24 全二重トランシーバ・チャネルを含んでいます。今日の接続ニーズを満たすために高性 能なトランシーバ・ソリューションを提供するだけでなく、データ・レート、変調方式、プロト コル IP の進化に対応するような次世代規格への柔軟性および拡張性を備えています。 AIB-01025 2015.06.08 ヘテロジニアス 3D SiP トランシーバ・タイル 15
図 4: モノリシック・コア・ファブリックおよびヘテロジニアス 3D SiP トランシーバ・タイル Transceiver Tile (24 Channels) Transceiver Tile (24 Channels) Transceiver Tile (24 Channels) Transceiver Tile (24 Channels) Transceiver Tile (24 Channels) Transceiver Tile (24 Channels) Package Substrate EMIB EMIB EMIB EMIB EMIB EMIB Core Fabric 各トランシーバ・タイルには以下が含まれます • 24 個の全二重トランシーバ・チャネル(PMA および PCS) • リファレンス・クロック分配ネットワーク • 送信用 PLL • 高速クロッキングおよびボンディング・ネットワーク • 1 つの PCI Express ハード IP のインスタンス 図 5: ヘテロジニアス 3D SiP トランシーバ・タイル・アーキテクチャ Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Transc eiv er T ile (24 C hannels) PCI e G en3 Har d IP EMIB Transc eiv er Bank (6 C hannels) Transc eiv er PLLs , R X, and T X CL ocks Transc eiv er Bank (6 C hannels) Transc eiv er Bank (6 C hannels) Transc eiv er Bank (6 C hannels) PCI e G en3 x16 Har d IP Transc eiv er B onding Transc eiv er Ref er enc e C locks 16 ヘテロジニアス 3D SiP トランシーバ・タイル 2015.06.08AIB-01025
Stratix 10
トランシーバ
Stratix 10 デバイスは、最大 144 個の全二重トランシーバ・チャネルを搭載しています。このよう なチャネルはチップ間、チップ‐モジュール間、およびバックプレーン・アプリケーションに対 し 125 MBps から 30 Gbps の連続データ・レートを提供します。各デバイスでは、100G インタフ ェースおよび C フォーム・ファクタ・プラガブル CFP2/CFP4 光モジュールをドライブするため に、2/3 のトランシーバを最大 30 Gbps データ・レートまでコンフィギュレーションすることが 可能です。 長距離バックプレーン・ドライビング・アプリケーションの場合、30 dB を超えるシ ステム・ロスのイコライゼーションにはアドバンスト・アダプティブ・イコライゼーションが使 用されます。これにより、バックプレーン間での 30 Gbps を超えるデータ・レートが可能となり ます。 すべてのトランシーバ・チャネルは、専用のフィジカル・メディア・アタッチメント(PMA) とハード化されたフィジカル・コーディング・サブレイヤ(PCS)を備えています。 • PMA は物理チャネルとの最初のインタフェース機能を提供します。 • PCS は通常、データを FPGA コア・ファブリックに転送する以前の段階で、エンコード/デコ ードやワード・アライメントをはじめとする前処理機能を処理します。 各トランシーバ・タイル内において、トランシーバは 6 つの PMA-PCS にグループ化された 4 つ のバンクに配置されています。高度にコンフィギュレーションが可能なクロック分配ネットワ ークを使用することで、各バンクおよび各タイル内で多くの種類の結合および非結合データ・レ ート・コンフィギュレーションが選択可能です。PMA
の機能
PMA チャネルはトランスミッタ(TX)、レシーバ(RX)および高速クロッキング・リソースで 構成されています。 Stratix 10 TX に含まれる機能は、最大 30 Gbps のデータ・レートでの非常に高度なシグナル・イ ンテグリティを提供します。クロッキング・オプションには、オプショナル・フラクショナル・ シンセシス機能を持つ超低ジッタ LC タンク・ベースの(ATX) PLL、クロック・マルチプライ ヤ・ユニット(CMUs)として機能するチャネル PLL、フラクショナル・シンセシス PLL(fPLL) が含まれます。 • ATX PLL—インテジャー・モード、あるいはオプションで新しく追加されたフラクショナル・ シンセシス・モードでコンフィギュレーションが可能です。各 ATX PLL はサポートしている データ・レート範囲の最大周波数範囲にまで及ぶため、低ジッタの安定した柔軟性のあるク ロック・ソースを提供します。 • CMU PLL—トランシーバとして使用していない場合は、トランシーバ・バンク内で追加のマ スタ・クロック・ソースを提供する CMU として動作するチャネル PLL として PMA チャネル をコンフィギュレーションすることが可能です。 • fPLL—更に、精度周波数合成機能を持つ専用 fPLL も利用可能です。fPLL は、1 つのリファレ ンス・クロック・ソースから複数のクロック周波数を同期させ、複数のプロトコルおよび複 数のレートを持つアプリケーションに対し複数のリファレンス・オシレータを置き換えるた めに使用することが可能です。 レシーバ側では、各 PMA にクロック・データ・リカバリのアナログ・トラッキングを可能にす る独立したチャネル PLL が含まれます。また、各 PMA は広範囲の周波数スペクトルにおいてト ランスミッション・ロスを補償するアドバンスト・イコライゼーション回路も備えています。 AIB-01025 2015.06.08 Stratix 10トランシーバ 17• 可変ゲイン・アンプ(VGA)—レシーバのダイナミック・レンジを最適化します。 • 連続時間リニア・イコライザ(CTLE)—最も低い消費電力でチャネル・ロスを補償します。 • デシジョン・フィードバック・イコライザ(DFE)—クロストークや反射がある状態でもバ ックプレーン上に追加のイコライゼーション機能を提供します。 • オン・ダイ・インスツルメンテーション (ODI)—オンチップ・アイ・モニタ機能(EyeQ) を提供します。この機能は、ボード立ち上げ中のリンク・イコライゼーション・パラメータ の最適化に役立ち、インシステム・リンク診断およびイコライゼーション・マージン・テス トをサポートします。 図 6: Stratix 10 レシーバ・ブロックの機能
∑
VGA
CDR
DFE
EyeQ
CTLE
Adaptive Parametric Tuning Engine
Deserializer
すべてのリンク・イコライゼーション・パラメータは、新しいアルテラ・デジタル・アダプティ ブ・パラメトリック・チューニング(ADAPT)回路を使用する自動調整機能を備えています。 この回路は、動的な DFE タップ・ウエイトの設定、CTLE パラメータの調整、VGA ゲインとス レッショルド電圧の最適化に使用します。この度新しくハード化された高精度シグナル・インテ グリティ・キャリブレーション・エンジン(PreSICE)を使用して、パワーアップ時にすべての トランシーバ回路ブロックを自動的にキャリブレーションすることで最適でかつ一定したシグ ナル・インテグリティが確実なものとなります。これにより、ほとんどのリンク・マージンにお いて強固で安定したエラーのない動作が保証されます。 表 7: Stratix 10 トランシーバ PMA の機能 機能 性能 チップ間のデータ・レ ート 125 Mbps~30 Gbps(Stratix 10 GX/SX デバイス) バックプレーン・サポ ート 10GBASE-KR 準拠を含め、最大 30 Gbps のデータ・レートでバックプレーンを駆動 光モジュール・サポー ト SFP+/SFP、XFP、CXP、QSFP/QSFP28、CFP/CFP2/CFP4 ケーブル駆動サポー
ト SFP+ Direct Attach、PCI Express over cable、eSATA
機能 性能 送信プリエンファシ ス システム・チャネルの損失を補償する 5 タップ送信プリエンファシスおよびディエンファシス 連続時間リニア・イコ ライザ(CTLE) デュアル・モード、高いゲインと高いデータ・レート、システム・チャネルの損失を補償するリニア受信イコライゼーション デジション・フィード バック・イコライザ (DFE) クロストークが存在し、ノイズの多い環境下でのバックプレーン・チャ ネルの損失をイコライズする 15 個の固定タップ DFE アルテラ・デジタル・ アダプティブ・パラメ トリック・チューニン グ(ADAPT) ユーザー・ロジックから介入することなく最適なリンク・マージンを提 供する、CTLE、DFE、VGA ブロックを含む全てのリンク・イコライゼー ション・パラメータを自動的に調整するフル・デジタル・アダプティブ・ エンジン 高精度シグナル・イン テグリティ・キャリブ レーション・エンジン (PreSICE) 電源投入時にすべてのトランシーバのキャリブレーション・パラメータ を迅速に補正し最適なシグナル・インテグリティとジッタ・パフォーマ ンスを提供する、ハード化されたキャリブレーション・コントローラ ATX 送信 PLL 標準プロトコルや独自開発プロトコルといったを広範囲をカバーする連 続したチューニング範囲を備えた低ジッタ ATX(インダクタ‐コンデン サ)PLL フラクショナル PLL オンボード水晶発振器を代替し、システム・コストを削減するオンチッ プ・フラクショナル周波数シンセサイザ デジタル・アシスト・ アナログ CDR 優れたジッタ耐性と高速ロック時間 オン・ダイ計測用 EyeQ およびジッタ・ マージン・ツール 非侵入型高解像度アイ・モニタリング(EyeQ)を用いた、ボード立ち上 げ、デバッグと診断の簡素化。また、トランスミッタからジッタを注入 し、システムのリンク・マージンのテストを実行。 ダイナミック・パーシ ャル・リコンフィギュ レーション(DPRIO) トランシーバの柔軟性を高めるために、各トランシーバ・チャネルの Avalon メモリ・マップド・インタフェースを個別にコントロールするこ とが可能 PMA と PCS-PLD の多様なインタ フェース幅 デシリアライゼーション幅、エンコーディング、およびレイテンシ削減 を柔軟にする、8 ビット、10 ビット、16 ビット、20 ビット、32 ビット、 40 ビット、または 64 ビットのインタフェース幅
PCS
の機能
Stratix 10 の PMA チャネルは、コンフィギュレーションとバイバスが可能な PCS インタフェー ス・レイヤを介し、コア・ロジックとインタフェースします。 AIB-01025 2015.06.08 PCSの機能 19PCS には PMA と PCS インタフェース幅をデカップルするギアボックスが複数実装されており、 各トランシーバとコア・ロジック間で 8、10、16、20、32、40、および 64 ビット幅を持つ様々な アプリケーションが実装できる柔軟性をもたらします。 PCS にはまた、広範囲のデータ・レートおよびエンコーディング方式を持つ様々な標準プロトコ ルや独自開発プロトコルをサポートするハード IP を備えています。Standard PCS モードは、最 大 12.5 Gpbs までの 8B/10B でエンコードされたアプリケーションをサポートします。Enhanced PCS モードは、最大 17.4 Gbps までの 64B/66B および 64B/67B でエンコードされたアプリケーシ ョンをサポートします。Enhanced PCS モードには統合された 10GBASE-KR/40GBASE-KR4 順方 向誤り訂正 (FEC)回路が 1 つ内蔵されています。高度にカスタマイズされた実装であれば、 PCS Direct モードを使用することで、最大 30 Gbps までのデータ・レートをサポートし、カスタ ム・エンコーディングを可能にする最大 64 ビット幅のインタフェースを提供することが可能で す。 表 8: Stratix 10 トランシーバ PCS の機能 PCSプロトコル・ サポート データ・レート(Gbps) トランスミッタ・データ・パス レシーバ・データ・パス Standard PCS 0.125~12.5 位相補償 FIFO、バイト・シリア ライザ、8B/10B エンコーダ、ビ ット・スリッパ、チャネル・ボン ディング レート・マッチ FIFO、ワー ド・アライナ、8B/10B デコー ダ、バイト・デシリアライザ、 バイト・オーダリング PCI Express Gen1/Gen2 x1、x2、x4、 x8、x16 2.5、5.0 PIPE 2.0 インタフェースからコ
アを持つ Standard PCS と同じ PIPE 2.0 インタフェースからコアを持つ Standard PCS と同 じ PCI Express Gen3 x1、x2、 x4、x8 8.0 位相補償 FIFO、バイト・シリア ライザ、エンコーダ、スクランブ ラ、ビット・スリッパ、ギア・ボ ックス、チャネル・ボンディン グ、PIPE 3.0 インタフェースから コア、 自動速度ネゴシエーショ ン レート・マッチ FIFO (0~600 ppm モード)、ワード・アライ ナ、デコーダ、、デスクランブ ラ、位相補償 FIFO、ブロック 同期、バイト・デシリアライ ザ、バイト・オーダリング、 PIPE 3.0 インタフェースから コア、 自動速度ネゴシエーシ ョン CPRI 0.6144~9.8 確定的レイテンシ・シリアライゼ ーションのある Standard PCS と 同じ 確定的レイテンシ・デシリア ライゼーションのある Standard PCS と同じ Enhanced PCS 2.5~17.4 FIFO、チャネル・ボンディング、ビット・スリッパ、ギア・ボック ス FIFO、ブロック同期、ビット・ スリッパ、ギア・ボックス 10GBASE-R 10.3125 FIFO、64B/66B エンコーダ、スク ランブラ、FEC、ギア・ボックス FIFO、64B/66B デコーダ、デスクランブラ、ブロック同期、 FEC、ギア・ボックス 20 PCSの機能 2015.06.08AIB-01025
PCSプロトコル・ サポート データ・レート(Gbps) トランスミッタ・データ・パス レシーバ・データ・パス Interlaken 4.9~17.4 FIFO、チャネル・ボンディング、 フレーム・ジェネレータ、CRC-32 ジェネレータ、スクランブラ、 ディスパリティ・ジェネレータ、 ビット・スリッパ、ギア・ボック ス FIFO、CRC-32 チェッカ、フレ ーム同期、デスクランブラ、 ディスパリティ・チェッカ、 ブロック同期、ギア・ボック ス SFI-S または SFI-5.2 11.3 FIFO、チャネル・ボンディング、ビット・スリッパ、ギア・ボック ス FIFO、ビット・スリッパ、ギ ア・ボックス IEEE 1588 1.25~10.3125 FIFO (固定レイテンシ)、64B/66B エンコーダ、スクランブラ、ギ ア・ボックス FIFO (固定レイテンシ)、64B/ 66B デコーダ、デスクランブ ラ、ブロック同期、ギア・ボ ックス
SDI 最大 11.9 FIFO、ギア・ボックス FIFO、ビット・スリッパ、ギ
ア・ボックス
GigE 1.25 GigE ステート・マシンのある
Standard PCS と同じ GigE ステート・マシンのあるStandard PCS と同じ
PCS Direct 最大 30 Custom Custom
PCI Express Gen1/Gen2/Gen3
ハード IP
Stratix 10 デバイスには、パフォーマンス、 使いやすさ、より充実した機能性、設計者の生産性 の向上を目的として PCI Express ハード IP が内蔵されています。
PCI Express ハード IP は、PHY、Data Link、そしてトランザクション・レイヤで構成されていま す。さらに、x1/x2/x4/x8/x16 レーン・コンフィギュレーションでは、PCI Express Gen1/Gen2/Gen3 エンド・ポイントとルート・ポートをサポートします。PCI Express ハード IP は、コア・ロジッ クから独立して動作することができます(Autonomous モード)。この機能を使用すれば、他の デバイスがコンフィギュレーションされている段階でも、PCI Express リンクの起動およびリン ク・トレーニングを 100 ms 以内で完了させることが可能です。これら以外にもハード IP には、 シングル・ルート I/O 仮想化(SR-IOV)やオプションのプロトコル拡張といった新しい機能を 容易にサポートできる機能が追加されています。
PCI Express ハード IP は、エラーの検査と訂正(ECC)を使用することで、エンド・ツー・エン ドのデータ・パス保護を改善しています。さらに、ハード IP は Gen1/Gen2/Gen3 レートでの PCI Express バス間におけるプロトコルを介したデバイスのコンフィギュレーション(CvP)をもサポ ートしています。
AIB-01025
Interlaken PCS
ハード IP
Stratix 10 には、レーンあたり最大 17.4 Gbps のレートをサポートできる Interlaken PCS ハード IP が統合されています。 Interlaken PCS ハード IP は、アルテラの前世代 FPGA 向けに開発された、実績のある PCS の機能 性に基づいているため、Interlaken ASSP ベンダとサードパーティ IP サプライヤとの相互運用性 については既に実証されています。Interlaken PCS ハード IP は Stratix 10 デバイスのすべてのト ランシーバ・チャネルに含まれています。10G Ethernet
ハード IP
Stratix 10 デバイスには、IEEE 802.3 10-Gbps Ethernet(10GbE)準拠の 10GBASE-R PCS および PMA ハード IP が含まれています。この拡張性を持つ 10GbE ハード IP は、すべての 10GBASE-R PCS インスタンス化に対して 1 つの PLL を使用する一方で、複数の独立した 10GbE ポートをサポー トします。これは、1 つのコア・ロジックとクロック・ネットワークを節約することを意味しま す。
統合されたシリアル・トランシーバは、外部 XAUI-to-10G PHY を必要とする XAUI インタフェ ースに比べてマルチポート 10GbE を簡略化します。統合されたトランシーバはさらに、信号調 整回路を取り込むため、標準 10G XFP および SFP+プラガブル光モジュールに直接接続すること が可能です。この他にもトランシーバはバックプレーン Ethernet アプリケーションをサポート し、10G と 40G の両方のアプリケーションに使用できるハード 10GBASE-KR/40GBASE-KR4 順方 向誤り訂正(FEC)回路を備えています。統合された 10G Ethernet ハード IP および 10G トラン シーバにより、外部 PHY コスト、ボード・スペース、およびシステム消費電力を節約すること ができます。10G Ethernet PCS ハード IP と 10GBASE-KR FEC は各トランシーバ・チャネルに含 まれています。
外部メモリおよび汎用 I/O
Stratix 10 デバイスは、最大 2666 Mbps で動作する 72 ビット幅の DDR4 メモリ・インタフェース を最大 10 個装備できる十分な外部メモリ帯域幅を有しています。 このバンド帯域幅は、設計の容易さ、低消費電力、ハード化された高性能メモリ・コントローラ と併せて提供されています。外部メモリ・インタエースは、ハードあるいはソフト・メモリ・コ ントローラ使用時であれば、最大幅 144 ビットでコンフィギュレーションが可能です。 22 Interlaken PCSハード IP 2015.06.08AIB-01025図 7: ハード・メモリ・コントローラ AXI/Avalon IF Memory Controller PHY Interface Hard PHY Hard Nios II (Callibration/Control) I/O Interface ECC DQS CMD/ADDR User Design Core Fabric Stratix 10 FPGA 各 I/O バンクには、48 個の汎用 I/O、そしてそれぞれに異なる性能を持つ多くのメモリ・タイプ をサポートできる高効率のメモリ・コントローラが含まれています。このハード・メモリ・コン トローラもユーザー・ロジック内で実装するソフト・コントローラによってバイパスや置換が可 能です。各 I/O には、以下のような重要なメモリ・インタフェース機能が実行可能なハード化さ れたダブル・データ・レート(DDR)リード/ライト・パス(PHY)が含まれます。 • リード/ライト・レベリング • レイテンシを低減し、マージンを改善する FIFO バッファリング • タイミング・キャリブレーション • On-Chip 終端 タイミング・キャリブレーションは、アルテラの Nios® II テクノロジに基づくハード・マイクロ コントローラにより補助されており、特に複数のメモリ・インタフェースのキャリブレーション 制御に適しています。このキャリブレーションを実行することで、Stratix 10 デバイスがデバイ ス内、もしくは外部メモリ・デバイス内の、プロセス、電圧、または温度のあらゆる変化を補償 することが可能となります。アドバンスト・キャリブレーション・アルゴリズムは、すべての動 作条件にわたって最大の帯域幅と堅牢なタイミング・マージンを確実にします。 表 9: Stratix 10 外部メモリ・インタフェース性能 このリストのスピードは 1-rank ケース用です。 インタフェース コントローラの種類 性能 DDR4 ハード 2666 Mbps DDR3 ハード 2133 Mbps AIB-01025 2015.06.08 外部メモリおよび汎用 I/O 23
インタフェース コントローラの種類 性能
QDR II+ / II+ Xtreme ソフト 550 MTps
RLDRAM III ソフト 2400 Mbps RLDRAM II ソフト 533 Mbps パラレル・メモリ・インタフェースに加えて、Stratix 10 デバイスは、ハイブリッド・メモリ・ キューブ(HMC)のようなシリアル・メモリ・テクノロジもサポートしています。HMC は Stratix 10 の高速シリアル・トランシーバでサポートされいます。このトランシーバは最大 4 つの HMC リンクと接続し、各リンクは 15 Gbps のデータ・レート(HMC 短距離仕様)、あるいは 30 Gbps (HMC 超短距離仕様)で動作します。
Stratix 10 は、幅広いシングル・エンドおよび差動 I/O インタフェースがサポート可能な汎用 I/O を備えています。LVDS レートは、最大 1.6 Gbps までサポートされており、それぞれのピンのペ アには差動ドライバと差動入力バッファの両方を備えています。このため、各 LVDS ペアに対し て方向をコンフィギュレーションすることが可能です。
ALM
(Adaptive Logic Module)
Stratix 10 デバイスは、前世代の Arria 10 FPGA と Stratix V FPGA で使用されていた ALM に類似し た ALM を使用しているため、効率的にロジック機能を実装することやデバイス間での IP 変換を 容易に実行することが可能です。
次の図の ALM ブロック図は 1 つのフラクチャブル・ルック・アップ・テーブル(LUT)、2 つの 専用エンベデッド加算器、4 つの専用レジスタで構成されています。
図 8: Stratix 10 FPGA & SoC ALM のブロック図 Reg Reg 1 2 3 4 5 6 7 8 Reg Reg
4 Registers for ALM Full Adder Full Adder Adaptive LUT Stratix 10 ALM の主要な機能 • 新しく搭載された HyperFlex アーキテクチャと共に動作する、8 入力フラクチャブル LUT を 持つレジスタを多数搭載しているため、Stratix 10 デバイスは非常に高いコア・ロジック使用 率でコア性能を最大化します • 選択の 7 個の入力ロジック・ファンクション、全 6 個の入力ロジック・ファンクション、コ ア・ロジック使用率を最適化するよう(2 つの独立 4 入力 LUT のような)小さな LUT サイズ で構成される 2 つの独立ファンクションを実装します。
Quartus II ソフトウェアは Stratix 10 ALM ロジック・ストラクチャを活用することで、最高の性 能、最適なロジック使用率、最短のコンパイル時間を実現します。Quartus II ソフトウェアは、 Stratix 10 ALM アーキテクチャへレガシー・デザインを自動的にマッピングするため、デザイン の再利用が簡略化されます。
レシーバ・コア・クロッキング
Stratix 10 デバイスのコア・クロッキングは、プログラマブル・クロック・ツリー・シンセシス を利用します。 この方法では、専用クロック・ツリー配線とスイッチング回路が使用され、Quartus II ソフトウ ェアがデザインで必要とされる正確なクロック・ツリーの作成します。クロック・ツリー・シン セシスは挿入遅延を最小化し、クロック・ツリーのダイナミック消費電力を減少させ、レガシ ー・グローバルおよびリージョナル・クロッキング方式に準拠したバックワードを維持したま ま、コア内により柔軟なクロッキングを可能とします。 AIB-01025 2015.06.08 レシーバ・コア・クロッキング 25Stratix 10 デバイスのコア・クロック・ネットワークは、最大 1 GHz のクロック・レートで新し い HyperFlex コア・アーキテクチャをサポートします。また、コアへクオーター・レート転送で 最大 2666 Mbps のハード・メモリ・コントローラもサポートします。コア・クロック・ネットワ ークは、専用クロック入力ピン、フラクショナル・クロック合成 PLL、インテジャー I/O PLL に よってサポートされています。
フラクショナル合成 PLL と I/O PLL
Stratix 10 デバイスには、トランシーバやコア・ファブリックで利用可能なフラクショナル合成 PLL(fPLL)が最大で 48 個含まれています。 fPLL は 3D SiP トランシーバ・タイルに位置しており、タイルあたりに 8 個含まれ、トランシー バ・チャネルに隣接しています。fPLL は、1 つのリファレンス・クロック・ソースから複数のク ロック周波数を合成することで、ボード上で必要なオシレータとクロック・ピン両方の数を減少 させるために使用されます。トランシーバ送信 PLL へのリファレンス・クロック周波数を合成 する以外にも、fPLL は送信クロッキングに直接使用することができます。従来のインテジャー・ モード、あるいは 3 次デルタ・シグマ変調を持つエンハンスト・フラクショナル・シンセシス・ モードに対しては、各 fPLL を個別にコンフィギュレーションすることが可能です。Stratix 10 デバイスには fPLL に加えて、インテジャー I/O PLL(IOPLL)が最大 34 個含まれてい ます。 I/OPLL は、コア・ファブリック内での一般的な使用や外部メモリ・インタフェースおよ び高速 LVDS インタフェース設計の簡略化のために使用されます。IOPLL は 48 個の汎用 I/O が 存在する各バンクに位置しており、バンクあたり 1 個含まれ、ハード・メモリ・コントローラと 各 I/O バンクの LVDS SerDes に隣接しています。この配置により、IOPLL が使用する I/O と密接 にカップリングされているため、タイミングを収束することが容易になります。IOPLL はクロッ ク・ネットワーク遅延補償やゼロ遅延クロック・バッファリングのようなコア内の汎用アプリケ ーションに対して使用可能です。
内部エンベデッド・メモリ
Stratix 10 デバイスには、M20K(20K ビット)と MLAB (640 ビット)の 2 種類のエンベデッド・ メモリ・ブロックが含まれます。 MLAB ブロックは広く浅いメモリに対しての使用が理想的です。M20K ブロックはより大きな メモリ・コンフィギュレーション向けであり、ハード ECC を内蔵しています。両方のエンベデ ッド・メモリ・ブロックはシングル・ポートあるいはデュアル・ポートの RAM、FIFO、ROM、 あるいはシフト・レジスタとしてコンフィギュレーション可能です。これらのメモリ・ブロック は高い柔軟性を持ち、以下の表に示す多くのメモリ・コンフィギュレーションをサポートしま す。 表 10: Stratix 10 内部エンベデッド・メモリ・ブロックのコンフィギュレーション MLAB (640 ビット) M20K (20K ビット) 64 x 10 (エミュレーション経由でサポート) 32 × 20 2K x 10 (あるいは x8) 1K x 20 (あるいは x16) 512 x 40(あるいは x32) 26 フラクショナル合成 PLL と I/O PLL 2015.06.08AIB-01025可変精度 DSP ブロック
Stratix 10 DSP ブロックは、アルテラの前世代のデバイスで使用されていた可変精度 DSP アーキ テクチャに基づいており、ハード固定小数点および IEEE-754 準拠の浮動小数点機能を備えてい ます。 DSP ブロックは、18x19 から最大 54x54 の精度を持つ信号処理をサポートするためにコンフィギ ュレーションすることが可能です。DSP ブロックの最大動作周波数を増加させ、消費電力を減少 させる目的でパイプライン・レジスタが追加されています。 図 9: DSP ブロック:標準精度の固定小数点モード Multiplier 18 x 19 44 18 Input Regist ers +/– +/– Coefficient Registers Coefficient Registers Pipeline Register Pipeline Register Pipeline Register Pipeline Register Multiplier 18 x 19 + – SystolicRegister RegisterSystolic
Multiple xer and P ipeline Regist er Feedback Register Output Register 44 64 74 18 108 AIB-01025 2015.06.08 可変精度 DSP ブロック 27
図 10: DSP ブロック:高精度の固定小数点モード 64 Input Regist ers +/– Coefficient Registers Pipeline Register Pipeline Register Multiplier 27 x 27 Pipeline Regist er Feedback Register Output Register 64 64 74 108 Pre-Adder 図 11: DSP ブロック:単精度の浮動小数点モード 32 Input Regist ers Pipeline Register Pipeline Register IEEE-754 Single-Precision Floating-Point Multiplier Output Register 32 32 96 PipelineRegister Pipeline Register Pipeline Register Pipeline Register IEEE-754 Single-Precision Floating-Point Adder 各 DSP ブロックはコンパイル時にデュアル 18x19 あるいはシングル 27x27 乗算累積として個別 にコンフィギュレーションすることができます。専用の 64 ビット・カスケード・バスにより、 精度のより高い DSP 機能を効率的に実装する場合、複数の可変精度 DSP ブロックをカスケード 接続することが可能です。 浮動小数点モードでは、各 DSP ブロックは 1 つの単精度浮動小数点乗算器と加算器が利用可能 です。浮動小数点の加算、乗算、mult-adds および mult-accumulates がサポートされています。 28 可変精度 DSP ブロック 2015.06.08AIB-01025
以下の表は DSP ブロック内で、あるいは複数のブロックを使用することで対応できる様々な精 度を示しています。 表 11: 可変精度 DSP ブロックのコンフィギュレーション 乗算器のサイズ DSPブロック・リソース 使用目的 18x19 ビット 1/2 の可変精度 DSP ブロック 中精度の固定小数点 27x27 ビット 1 つの可変精度 DSP ブロック 高精度の固定小数点 19x36 ビット 外部乗算器を備えた 1 つの可変精度 DSP ブロック 固定小数点の FFT 36x36 ビット 外部乗算器を備えた 2 つの可変精度 DSP ブロック 非常に高精度の固定小数点 54x54 ビット 外部乗算器を備えた 4 つの可変精度 DSP ブロック 倍精度の浮動小数点 単精度の浮動小 数点 1 つの単精度の浮動小数点加算器、1 つの単精度浮動小数点乗算器 浮動小数点 DSP アルゴリズムでは複素数乗算は非常に一般的です。その中でも、複素数乗算に最も使用され ることが多いアプリケーションが FFT アルゴリズムです。このアルゴリズムは乗算器の片側で のみ精度の要件が増加するという特徴を持ち、可変精度 DSP ブロックは精度の増加にともない DSP リソース内で比例的に増大する FFT アルゴリズムをサポートします。 表 12: 可変精度 DSP ブロックを使用した複素数乗算 複素数乗算器のサイ ズ DSPブロック・リソース 使用される FFT 18x19 ビット 2 つの可変精度 DSP ブロック リソースが最適化された FFT 27x27 ビット 4 つの可変精度 DSP ブロック 最高精度の FFT 広いダイナミック・レンジが要求される FFT アプリケーションに対しては、Altera FFT IP コア は、高精度固定小数点の実装に類似したリソース使用率と性能を持つ単精度浮動小数点の実装を オプションとして提供しています。 DSP ブロックには、上記の他にも以下の機能が含まれます • 18 ビットと 25 ビットのハード・プリアダー • ハード浮動小数点乗算器と加算器 • 64 ビットのデュアル・アキュムレータ(個別の I、Q プロダクト累積用) • 18 ビットと 27 ビット FIR フィルタ用のカスケード化された出力加算器チェイン • 18 ビットおよび 27 ビット係数用のエンベデッド係数レジスタ • 完全に独立した乗算器の出力 • ほとんどのモードに対し Quartus II ソフトウェアが供給する HDL テンプレートを使用した推 論可能性 AIB-01025 2015.06.08 可変精度 DSP ブロック 29
高性能 DSP アプリケーションにおけるより高度なビット精度を求める傾向をサポートするに は、可変精度 DSP ブロックが最適です。それに加えて、可変精度 DSP ブロックは高解析度の画 像処理やリモード無線ヘッドなどの多くの既存の 18 ビット DSP アプリケーションも効率的に サポートすることができます。高性能 DSP ブロック・アーキテクチャおよびハード浮動小数点 乗算器と加算器を装備しているため、Stratix 10 デバイスは浮動小数点実装を含む多くの精度レ ベルを効率的にサポートすることが可能です。この柔軟性により、システム・パフォーマンスの 向上、消費電力の低減、システム・アルゴリズム・デザイナへに課されるアーキテクチャ制約の 減少といった利点がもたらされます。
ハード・プロセッサ・システム(HPS)
ハード・プロセッサ・システム(HPS)は、アルテラが提供する業界最先端の第 3 世代 HPS で す。インテルの 14 nm トライゲート・テクノロジを活用することで、前世代の SoC と比較し、 クアッド・コア 64 ビット ARM Cortex-A53 が統合された Stratix 10 SoC は 2 倍以上の性能を備え ています。Stratix 10 の HPS は、システム・メモリ・マネージメント・ユニットを搭載すること でシステム・ワイドなハードウェア仮想化が可能です。アーキテクチャが改善されたことで、ワ イヤレス通信、ワイヤーライン通信、データ・センタ・アクセラレーション、および多くの軍事 用アプリケーションを含む今日および今後のエンベデッド・マーケットの要求に Stratix 10 SoC は確実に対応することができます。 30 ハード・プロセッサ・システム(HPS) 2015.06.08AIB-01025図 12: HPS のブロック図
Quad ARM Cortex-A53-Based Hard Processor System
1 MB L2 Cache
JTAG Debug
or Trace 256 KBRAM Timers(x11)
LW HPS to
CORE HPS to COREBRIDGE CORE to HPSBRIDGE
AXI 32 AXI 32/64/128 AXI/ACE 32/64/128 QSPI FLASH SD/SDIO/ MMC1 USB OTG (x2)1 DMA (8 Channel) UART (x2) HPS IO I2C (x5) NAND Flash1, 2 EMAC with DMA(x3)1 SPI (x5) MPFE3 Configuration Notes:
1. Integrated direct memory access (DMA) 2. Integrated error correction code (ECC)
3. Multiport front-end interface to hard memory controller
System MMU Cache Coherency Unit
ARM Cortex -A53
NEON FPU
32 KB I-Cache
with Parity 32 KB D-Cachewith ECC
ARM Cortex -A53
NEON FPU
32 KB I-Cache
with Parity 32 KB D -Cachewith ECC ARM Cortex -A53
NEON FPU
32 KB I-Cache
with Parity 32 KB D-Cachewith ECC
ARM Cortex -A53
NEON FPU
32 KB I-Cache
with Parity 32 KB D-Cachewith ECC
AIB-01025