• 検索結果がありません。

OpenMP指示行による並列化

インテル® コンパイラーを使用した OpenMP* による並列プログラミング

インテル® コンパイラーを使用した OpenMP* による並列プログラミング

... OpenMP* のスレッド機能を使用してプログラマーがマルチスレッドの動作をプログラミン グしたように、OpenMP* 4.0 からは omp simd を使用してプログラマーが明示的にベクトル もできるようになりました。OpenMP* simd に関連する機能を 4.0 から 5.0 までの進化を 追って紹介します ...

43

1E2-4 BDD簡約化アルゴリズムの並列化

1E2-4 BDD簡約化アルゴリズムの並列化

... 4. 並列準簡約と追駆簡約による並列 本稿では,並列に準簡約を行いつつ追駆して従来の簡約 を行う新しい並列の手法を提案する.準簡約は必ずしも完 全ではない簡約だが,個々の処理を独立に行うことが容易な ...

4

情報処理学会研究報告 IPSJ SIG Technical Report 並列 FMO プログラム OpenFMO の性能最適化 稲富雄一, 眞木淳, 高見利也, 本田宏明, 小林泰三, 南里豪志, 青柳睦, 南一生 数万 ~ 数 10 万並列での効率的な実行を目指して, 並列フラグメント分子軌道プ

情報処理学会研究報告 IPSJ SIG Technical Report 並列 FMO プログラム OpenFMO の性能最適化 稲富雄一, 眞木淳, 高見利也, 本田宏明, 小林泰三, 南里豪志, 青柳睦, 南一生 数万 ~ 数 10 万並列での効率的な実行を目指して, 並列フラグメント分子軌道プ

... これとは別に,片側通信を用いないで,かつ,worker group のジョブ実行を阻害しな い方法として,データ保存のための専用プロセスを用いること(以降,方法2)も検 討した.この方法では,モノマー密度行列データを保持してワーカプロセスからのア クセス要求に応答することを専門とするストレージプロセス(storage group に属す る)と,計算を専門に行うワーカプロセス(いずれかの worker group に属する)とを ...

8

SGI AltixUV1000 並列化プログラミング講習会

SGI AltixUV1000 並列化プログラミング講習会

... – 同時にひとつのスレッドのみで実行される領域を定義します。共有されている領 域への書き込みや、 I/O を行う際の排他制御などに用います。  atomic 指示文 – critical 指示文と同様に排他制御を行いますが、ハードウェアによる最適 うことができる特定の演算 (インクリメント等) のみに限定したものです。 ...

121

モデルベース並列化ツールeMBPの紹介

モデルベース並列化ツールeMBPの紹介

... eSOL MBPによってコアを有効利用できるタスクの割り当てを行う事で、トータルの計算 時間(周期)の短縮が期待できる。 性能向上率は、1コア割り当てした場合(並列無し)の計算時間との比較によって得る。 補)コア割り当てによる処理性能向上 ...

37

連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 問題の定義 αβ 法 16 2 αβ 法の並列化 概要 Young Brothers Wa

連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 問題の定義 αβ 法 16 2 αβ 法の並列化 概要 Young Brothers Wa

... することができる. タスクを生成する構文—Cilk の spawn に相当する—は, #pragma omp task shared(...) if(...) 文 である. 文には任意の C の文を指定でき, これで「文」を実行するタスクが生成される. Cilk のよう に, 関数呼び出ししかタスクとして実行できないというような構文的な制限はない. shared 節を使っ て, 親タスクと子タスク間で共有する局所変数を指定する. ...

24

Microsoft PowerPoint - 講義1:離散化と並列化.pptx

Microsoft PowerPoint - 講義1:離散化と並列化.pptx

... 弱スケーリング 1プロセス 2プロセス 8プロセス 並列実行単位(スレッド,またはプロセス)あたりの問題サイズを一定に保っ たまま,並列実行数(スレッド数,プロセス数)を増加させた時に,実行時間 がどのように変化するかをみる性能評価指標 ...

36

並列処理の背景

並列処理の背景

... Kepler GK110 では、カーネルから別カーネルを起動することがで、必要なストリー ムやイベントを生成したり、追加ワークの処理に必要な依存関係を管理することがホ スト CPUの関与なしに実行できます。 GPU 上で再帰的な実行パターンやデータ依存の実行パターンを生成・最適するこ とが可能になり、(中略)システムの CPU のワークロードを別のタスクに振り分け たり、よりパフォーマンスの低い CPU ...

40

1E2-2 トランスポジションテーブルを利用したIDA*探索の閾値による並列化

1E2-2 トランスポジションテーブルを利用したIDA*探索の閾値による並列化

... ドメイン非依存プランナの Fast Downward [Helmert 06] において提案手法を適用して, 並列プランナを実装した. 並列にはMPIを用いた. プランニングの分野で標準 ベンチマークとして使用されている IPC (international planning competition) 問題集より 107 問を選び, 性能 評価を行った. 一問あたり実験時間は 30 分, ...

2

H26 年度 スーパーコンピュータの高速化技法入門 並列化による高速化技法 2015 年 1 月 21 日 大阪大学サイバーメディアセンター日本電気株式会社

H26 年度 スーパーコンピュータの高速化技法入門 並列化による高速化技法 2015 年 1 月 21 日 大阪大学サイバーメディアセンター日本電気株式会社

... ▐ 初期値を与えたローカル変数、save文の指定されたローカル変数  data文などによって初期値を与えたローカル変数やsave文を指定した ローカル変数は、並列処理時には、スタックではなく、静的領域に割り 当てられるため、各タスクで同一の領域を参照するようになる ...

68

高速度ビデオでの運動解析プログラムの開発 - OpenMP 等を用いた相関計算並列化によるトレース高速化 - 横山直樹 ( 東海大学総合科学技術研究所 ) Development of versatile motion analysis program based on normalized cor

高速度ビデオでの運動解析プログラムの開発 - OpenMP 等を用いた相関計算並列化によるトレース高速化 - 横山直樹 ( 東海大学総合科学技術研究所 ) Development of versatile motion analysis program based on normalized cor

... 理想的な傾向をしている。その理由は負荷(ROI 256 個)が十分大きいためであると考えられる。 5. 結論 テンプレートのエッジ情報に着目し、エッジ成分が高い画素のみを相関計算に使用すること で、計算の高速だけでなくより良い追跡が可能であることがわかった。また OpenMP を用い ることにより、複数の相関計算を並行して走らせることができ、それによってコア数程度の高 ...

10

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

... 個別に Wait() 状態を使用する並列タスクの出力 メモ: メ゗ン スレッドは、作成した Task オブジェクトの完了を待機してから、処理 を続行します。これは、ThreadPool.QueueUserWorkItem を使用するよりもはるか に簡単かつ明確な方法です。QueueUserWorkItem メソッドを使用すると、リセット ゗ベントを主導で作成および管理する必要が生じ、Interlocked ...

47

1E2-3 Structured Zobrist Hashによる効率的な並列最良優先探索

1E2-3 Structured Zobrist Hashによる効率的な並列最良優先探索

... Abstraction による HDA* よりも高速であることを示した。 Structured Zobrist Hash は 通信オーバーヘッドを緩和する手法であるので、より通信コ ストの大きい分散メモリ環境ではより有効であると考えられ る。分散メモリ環境での実験は今後の研究課題である。また、 Structured Zobrist Hash は HDA* だけでなく、他の並列探索 ...

3

並列・高速化を実現するための 高速化サービスの概要と事例紹介

並列・高速化を実現するための 高速化サービスの概要と事例紹介

... ⇒ 高速の方針を決定 【作業】 ・実装および最適 ・ベンチマークによる性能評価 ⇒ 繰返しながら高速を目指す 1. お問い合わせ 2. NDA の締結 3. ソースのご提供 4. 初期解析 5. 作業方針検討 ...

27

MBP(モデルベース並列化)を用いたクロスレイヤ設計

MBP(モデルベース並列化)を用いたクロスレイヤ設計

... 真のデータ依存は、あるデータ値への書き込みが終 わるまでは読み込みができないような操作間の順序を 示す。これはアルゴリズム内の基本的な依存であるが、 このデータ依存性の影響を最小するようアルゴリズ ムを改良することもできる場合もある。 ...

68

MPI または CUDA を用いた将棋評価関数学習プログラムの並列化 2009/06/30

MPI または CUDA を用いた将棋評価関数学習プログラムの並列化 2009/06/30

... 本プログラムは並列度が高いので、容易に並列することができる。 ○CUDA NVIDIA製のビデオカードを持つPCで、多数のコアによる並列計算を行うものである。 C言語に少しの拡張を加えたCUDAと、通常のC/C++の混合により開発する。 ...

24

STAR-CCM+ の大規模並列化仕様とクラウドライセンス (PoD) ソリューション 株式会社 CD-adapco 吉田稔彦

STAR-CCM+ の大規模並列化仕様とクラウドライセンス (PoD) ソリューション 株式会社 CD-adapco 吉田稔彦

... – 5 つの Power Sessions ジョブを 128 コアで 100 時間ずつ使用可能 – 500 の Power Sessions ジョブを 64 コアで 1 時間ずつ使用可能 – お持ちのPoDクレジットをどのように分割し、使用するかはユーザー次第です – 複数のジョブをPoDライセンスを用いて並列で実行する場合、ジョブ実行の際の ...

30

2E1-2 状態遷移の並列比較によるNFA照合高速化

2E1-2 状態遷移の並列比較によるNFA照合高速化

... 機能を利用して比較を行ったが、提案手法はそのような機材の 制限を受けるものではないので、よりビット並列度の高い装置 での応用や、 FPGA での実装での応用が今後考えられる。遷 移におけるシンボルのサイズも本稿では 16bit に広げたのみで あるが、 2 文字の遷移を 1 つにまとめるなどしてシンボルのサ イズをより大きくすることも可能である。今後の課題としてシ ンボルのサイズをより大きくした時の照合速度の変化について ...

4

Microsoft Word - openmp-txt.doc

Microsoft Word - openmp-txt.doc

... parallel 指示文で生成されたスレッドは、for 指示文により for ループの各部分を分担して実 します。for 指示文は、並列リージョンを実行する複数のスレッドで for 指示文の後にある ループを並列に実行します。例えば、4 スレッドで並列実行している場合には、上の例では i が 0 から 249 まではスレッド ...

7

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

... もう一つ、プロセス並列処理に特有の話: どのようにデータを各プロセスに配置するか?  ここまでの並列例では、基本的に全てのプロセスが全ての配列を重複して所有  利点: データのサイズや構造を変えずに並列できる。  並列が容易 ...

68

Show all 10000 documents...

関連した話題