• 検索結果がありません。

Phi コプロセッサーの高並列アーキテクチャ

ホワイトペーパー インテル Xeon Phi コプロセッサー開発者向けクイック スタート ガイド バージョン 1.7

ホワイトペーパー インテル Xeon Phi コプロセッサー開発者向けクイック スタート ガイド バージョン 1.7

... Phi™ コプロセッサーにオフロードするアプリケーションをビルドする場合、ホストコード とオフロードコードで異なるコンパイラー・オプションを指定できます。各コンパイラー・オプション指定方法は、コンパ イラー・ドキュメント「コンパイラー・リファレンス」 > 「コンパイラー・オプション」 > 「コンパイラー・オプションカテゴ ...

30

インテル® Xeon Phi™ コプロセッサー・システムにおけるインテル® MPI ライブラリーの使用

インテル® Xeon Phi™ コプロセッサー・システムにおけるインテル® MPI ライブラリーの使用

... コプロセッサー用アプリケーション montecarlo.mic をビルドします。 # mpiicc –mmic montecarlo.c -o montecarlo.mic ホストで実行するアプリケーションをビルドするには、インテル ® 64 対応インテル ® MPI ライブ ラリー環境を設定する必要があります。実際にインストールされているバージョンに合わせて、 ...

13

アーキテクチャ

アーキテクチャ

... – (概念的には)P2Pを構成するプロセスは同一 – プロセス間相互作用は対称的,クライアントでもありサーバ でもある(サーバント, servent) – オーバレイネットワーク(overlay network) ...

21

ADO.NETのアーキテクチャ

ADO.NETのアーキテクチャ

... ADO.NET コンポーネント ADO.NET には、データへアクセスとデータ操作に使用出来るコンポーネントが 2 つ有る。 ...は、データソースから 高いパフォーマンスデータストリームを提供する。最後に、DataAdapter は DataSet オブジェ クトとデータソース間ブリッジを提供する。DataAdapter は Command ...

10

IA-32 インテル(R) アーキテクチャ・ソフトウェア・ デベロッパーズ・マニュアル、上巻:基本アーキテクチャ

IA-32 インテル(R) アーキテクチャ・ソフトウェア・ デベロッパーズ・マニュアル、上巻:基本アーキテクチャ

... IA-32 アーキテクチャに導入される新しい SIMD 命令には、浮動小数点 SIMD 命令、整数 SIMD 命令、 SIMD 浮動小数点データと SIMD 整数データ間変換命令、および XMM レジスタと MMX テクノロ ジ・レジスタ間パックド・データ変換命令がある。新しい浮動小数点 SIMD 命令により、パックド 倍精度浮動小数点値 (XMM レジスタ 1 つ当たり 2 ...

418

SCIMA アーキテクチャと性能評価 - SCIMA アーキテクチャの概要 - 中村宏東京大学先端科学技術研究センター

SCIMA アーキテクチャと性能評価 - SCIMA アーキテクチャの概要 - 中村宏東京大学先端科学技術研究センター

... キャッシュ問題点 • データではデータアロケーション/リプレースメントは ハードウェア制御 – 殆どデータアクセスは規則的なのに、 ラインコンフリクトによるキャッシュミス発生 ...

19

MIPSのマルチサイクル マイクロアーキテクチャ

MIPSのマルチサイクル マイクロアーキテクチャ

... System(OS)が走って実行中にもジョブが切り替わりますが、こ 影響が入ると困るので、CPUが単一ジョブをOS介入なしに実行した場 合実行時間(CPU実行時間:CPUTime)を測ります。今まで紹介してきた ように、CPUは単一システムクロックに同期して動くと考えて良いので、 CPU ...

55

並列処理の背景

並列処理の背景

... SMX プロセッシング・コアアーキテクチャ GK110 では、1 スレッドからアクセスできるレジスタ数が最大で 255 レジスタと 4 倍に増強されました。1 スレッドあたりで利用できるレジスタ数が増えた結果、 Fermi では多くレジスタを使用したり、使用可能レジスタ数を超えてしまったコー ドは Kepler ではこの機能によって大きくスピードアップする可能性があります。 ...

40

AWS によるマイクロソフトアーキテクチャの最適化

AWS によるマイクロソフトアーキテクチャの最適化

... まとめ • AWS は、マイクロソフトアーキテクチャに最適化された幅広いス ケーラブルなサービスを提供 • AWS クイックスタートリファレンスでは、セキュリティと可用性 に関するベストプラクティスにしたがってActive Directoryや SQL Serverなどワークロードをデプロイ可能 ...

56

EXTRAVIEW のアーキテクチャ

EXTRAVIEW のアーキテクチャ

... パフォーマンスに大きく影響します。issue 挿入や更新など ExtraView トランザクションに必要な処理パワーは比較的小さく、これらトランザ クションが連続して処理される場合、ユーザ側からはパフォーマンスにあ まり大きな影響は感じられません。しかし、1 人ユーザが実行に数秒かか る複雑なクエリを実行する場合 ...

111

オラクルコンサルが語る! 超高速!Oracle Coherence の高可用性を支える多様な障害検知アーキテクチャ 日本オラクルテクノロジーソリューションコンサルティング統括本部矢形拓也

オラクルコンサルが語る! 超高速!Oracle Coherence の高可用性を支える多様な障害検知アーキテクチャ 日本オラクルテクノロジーソリューションコンサルティング統括本部矢形拓也

... 以下事項は、弊社一般的な製品方向性に関する概要を説明するものです。 また、情報提供を唯一目的とするものであり、いかなる契約にも組み込むことは できません。以下事項は、マテリアルやコード、機能を提供することをコミットメン ト(確約)するものではないため、購買決定を行う際判断材料になさらないで下さ ...

38

プロセッサ・アーキテクチャ

プロセッサ・アーキテクチャ

... データが返される前に連続リード要求を発行することができます。 Nios II プロセッサは、シーケンシャル命令をプリフェッチして分岐予測 を実行し、命令パイプラインを可能な限りアクティブに保持します。 命令マスタ・ポートは、常に 32 ビットデータを取得します。 命令マス タ・ポートは、システム・インタコネクト・ファブリックに含まれるダ イナミック・バス・サイジング・ロジックに依存します。 ダイナミック・ ...

24

目次 はじめに アーキテクチャの比較

目次 はじめに アーキテクチャの比較

... つは、パフォーマンスがそ 時点でユーザーアクティビティに大きく依存しているため、予測できないという点です。その結 果、一定レベルパフォーマンスが得られるようにピア ツー ピア ネットワークを管理するが非 常に難しくなります。たとえば、ファイル/リソース共有をユーザーがめったに必要としない場合、ピア ツー ピア ...

12

最新の並列計算事情とCAE

最新の並列計算事情とCAE

... スライド一枚でわかる (かもしれない) スパコントレンド  10年(15年?)前  専用設計ベクトル計算機、強力なベクトルプロセッサを 速バスで接続、非常に「密」なシステム ...

23

Oracle Identity Managementの概要およびアーキテクチャ

Oracle Identity Managementの概要およびアーキテクチャ

... • Oracle Identity Management インフラストラクチャは、ID 管理ため企業 全体に対する基盤として機能し、顧客環境に配置された他 Oracle 製品、 およびサード・パーティ・ベンダー製品をサポートします。 Oracle Identity Management は、あらゆる Oracle 製品とサード・パーティ製品ユー ...

13

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

... コンピュータ記憶システムに必要なことは容量とアクセス高速性です。簡 単に言えば、膨大な記憶容量を持っていて、瞬時に読み書きできるメモリが 理想メモリです。しかし、残念なことに容量大きい、すなわちビット単価 安いメモリは遅く、高速なメモリほど容量が小さいです。ではお金が無限にあ ...

38

目次 1. はじめに 1 2. マルチALUプロセッサ MAP MAP の構成 MAP 命令セットアーキテクチャ 並列 連鎖判定のアルゴリズムについて 5 3. Booth 乗算のアルゴリズム 次 Booth アルゴリズム 次 Bo

目次 1. はじめに 1 2. マルチALUプロセッサ MAP MAP の構成 MAP 命令セットアーキテクチャ 並列 連鎖判定のアルゴリズムについて 5 3. Booth 乗算のアルゴリズム 次 Booth アルゴリズム 次 Bo

... Booth アルゴリズムを2ALU 連鎖ありで動的に実行すると、並列・連鎖演算で 60%近く割合を 占めており、単一は少ない結果となったが、2ALU 連鎖なしで動的に実行すると単一演算が 84%と ほとんど命令を単一で実行することになった。これより連鎖演算を有効にすることで 1 次 Booth 乗 算アルゴリズムは並列性が増加したと言える。2次 Booth ...

31

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

... 理想キャッシュを使った場合CPI(Clock cycles Per Instruction)は、キャッ シュミスが起きると延びてしまいます。キャッシュ性能は、キャッシュオー バーヘッドを含むCPI値で示すことができます。命令を一つ読み出す度に 命令キャッシュがアクセスされます。このため、命令キャッシュミス率×ミス ...

34

高性能,高生産性を実現する 大規模メモリ・並列処理システムソフトウエアの研究

高性能,高生産性を実現する 大規模メモリ・並列処理システムソフトウエアの研究

... る実行時間比較 MpC:Cに最低限拡張 (shared 分散マップ配列)+ OpenMP SMSを利用したクラスタ向け7点ステンシル計算プログラム 大域データshared宣言により,通常Cプログラムと同等な記述で. マルチコア並列(OpenMP)とマルチノード並列(mSMS)を実現 Tsubame3.0 (東工大) ...

10

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

システムLSIとアーキテクチャ技術  (part II:オンチップ並列            アーキテクチャ)

... ストールする – 書き込み直後に読み出しをするとキャッシュが対応できないでペナル ティが増えることもある →ノンブロッキングキャッシュ – 実際は階層化されているのでそれぞれ階層を考えないといけない – プロセッサがOut-of-order実行可能ならば読み出し時にストールしな ...

34

Show all 10000 documents...

関連した話題