• 検索結果がありません。

並列化できるアルゴリズ

CCS HPCサマーセミナー 並列数値計算アルゴリズム

CCS HPCサマーセミナー 並列数値計算アルゴリズム

... • ノード内の演算性能だけではなく,全対全通信の最適 においても自動チューニングが必要になる. • 今後,並列スーパーコンピュータの規模が大きくなるに 従って、FFTの効率を向上させることは簡単ではない. ...

51

2E1-2 状態遷移の並列比較によるNFA照合高速化

2E1-2 状態遷移の並列比較によるNFA照合高速化

... Glushkov NFA の利用に着目している。 Glushkov NFA の状態遷移には、遷移元の状態、遷移する 入力シンボル、そして遷移先が格納された状態遷移テーブルを 参照する必要がある。この 3 要素すべてに対して O(1) でアク セスできる配列を作ると巨大なメモリ空間が必要になるので、 配列で保持する要素と、探索の必要となるリストで保持する要 素を組み合わせて状態遷移テーブルの参照は行われる。なかで ...

4

1E2-2 トランスポジションテーブルを利用したIDA*探索の閾値による並列化

1E2-2 トランスポジションテーブルを利用したIDA*探索の閾値による並列化

... ∗ 東京大学大学院総合文化研究科広域科学専攻広域システム科学系 〒 153-8902 東京都目黒区駒場 3-8-1 15 号館 504B E-mail: [email protected] IDA*探索では閾値を増加させながら再探索を繰り返 す. 純粋な IDA*探索では, 再探索の際にそれ以前の探 索の結果を利用しないため, ある閾値ごと行われる探索 は独立した挙動をする. そのため,Powley らは異なる閾 ...

2

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

... もう一つ、プロセス並列処理に特有の話: どのようにデータを各プロセスに配置するか?  ここまでの並列例では、基本的に全てのプロセスが全ての配列を重複して所有  利点: データのサイズや構造を変えずに並列できる。  並列が容易 ...

68

Microsoft PowerPoint 並列アルゴリズム04.ppt

Microsoft PowerPoint 並列アルゴリズム04.ppt

... 並列プログラムの実行時間 プログラムの評価に用いる時間は二通り • CPU使用時間: CPUが働いた時間. • 経過時間: 計算機の動作にかかわらず,消費した時間. 計算が主体のプログラムでは, ...

25

内容 イントロダクション スカラチューニング OpenMPによる並列化 最近のHPC分野の動向 まとめ

内容 イントロダクション スカラチューニング OpenMPによる並列化 最近のHPC分野の動向 まとめ

... ● OpenMP によるスレッド並列 – 指示行を最外ループの手前にいれるだけ(簡単!) – スレッド並列によりプロセス数を減らし、通信のオー バーヘッドを軽減:ハイブリッド並列 ...

61

講師取締役千田範夫シニアコンサルタント竹内宗孝 の事業内容 Winmostar の開発 販売 科学技術計算コードの並列化 高速化 およびカスタム開発 計算化学コンサル etc 2

講師取締役千田範夫シニアコンサルタント竹内宗孝 の事業内容 Winmostar の開発 販売 科学技術計算コードの並列化 高速化 およびカスタム開発 計算化学コンサル etc 2

... I. PDBからタンパクの分子構造をダウンロードする II. Winmostarを使って、計算可能な構造へ修正する ~結晶水(酸素原子)を取り除く~ III. Gromacsを起動し、エネルギー極小を実行する IV. 得られた構造を用いて二段階の熱平衡計算(温度一定、温度・圧力一定)を実行する V. 本計算(1 ナノ秒)を実行する。 ...

46

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎

... 阪大のスーパーコンピュータ (SX-ACE) はベクトル型計算機を束ねたものな ので,1 ノード (1 cpu, 4 core) でおさまる計算ならばテクニック的には難し いことはない.ベクトル率を高める為の工夫はまた別に必要だが. 実は普通の PC でも 4 コア持っていたりするので,4 倍ぐらいまでの並列 は容易にできたりする. ...

59

CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン

CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン

... 2DでのBLOCK・THREADの割り当て  GlobalID は、(x, y , z )方向に計算できる — GlobalID(x) = blockDim.x * blockIdx.x + threadIdx.x — GlobalID(y) = blockDim.y * blockIdx.y + threadIdx.y — GlobalID(z) = blockDim.z * blockIdx.z + ...

23

H26 年度 スーパーコンピュータの高速化技法入門 並列化による高速化技法 2015 年 1 月 21 日 大阪大学サイバーメディアセンター日本電気株式会社

H26 年度 スーパーコンピュータの高速化技法入門 並列化による高速化技法 2015 年 1 月 21 日 大阪大学サイバーメディアセンター日本電気株式会社

... 並列における注意事項(4) ▐ 巨大な配列をローカルデータとして宣言すべきではない  ローカル配列は、タスク固有データであり、各タスク毎に別々に確保されるた め、ローカル配列のサイズをタスク数倍した大きさのメモリが必要となる ...

68

並列処理の背景

並列処理の背景

... Kepler GK110 では、カーネルから別カーネルを起動することがで、必要なストリー ムやイベントを生成したり、追加ワークの処理に必要な依存関係を管理することがホ スト CPUの関与なしに実行できます。 GPU 上で再帰的な実行パターンやデータ依存の実行パターンを生成・最適するこ とが可能になり、(中略)システムの CPU のワークロードを別のタスクに振り分け たり、よりパフォーマンスの低い CPU ...

40

インテル Parallel Studio XE 2020 の最新情報 エンタープライズ クラウド HPC AI アプリケーションの並列コードを高速化 久保寺 陽子

インテル Parallel Studio XE 2020 の最新情報 エンタープライズ クラウド HPC AI アプリケーションの並列コードを高速化 久保寺 陽子

... ▪ ケーススタディー (英語) サイト インテル® テクノロジーの機能と利点はシステム構成によって異なり、対応するハードウェアやソフトウェア、またはサービスの有効が必要となる場合があります。詳細については、http://www.intel.co.jp/ を参照するか、OEM または販売店にお問い合わせください。性能の測定結果は ~2015-2017 ...

52

STAR-CCM+ の大規模並列化仕様とクラウドライセンス (PoD) ソリューション 株式会社 CD-adapco 吉田稔彦

STAR-CCM+ の大規模並列化仕様とクラウドライセンス (PoD) ソリューション 株式会社 CD-adapco 吉田稔彦

... – 5 つの Power Sessions ジョブを 128 コアで 100 時間ずつ使用可能 – 500 の Power Sessions ジョブを 64 コアで 1 時間ずつ使用可能 – お持ちのPoDクレジットをどのように分割し、使用するかはユーザー次第です – 複数のジョブをPoDライセンスを用いて並列で実行する場合、ジョブ実行の際の ...

30

情報処理学会研究報告 IPSJ SIG Technical Report 並列 FMO プログラム OpenFMO の性能最適化 稲富雄一, 眞木淳, 高見利也, 本田宏明, 小林泰三, 南里豪志, 青柳睦, 南一生 数万 ~ 数 10 万並列での効率的な実行を目指して, 並列フラグメント分子軌道プ

情報処理学会研究報告 IPSJ SIG Technical Report 並列 FMO プログラム OpenFMO の性能最適化 稲富雄一, 眞木淳, 高見利也, 本田宏明, 小林泰三, 南里豪志, 青柳睦, 南一生 数万 ~ 数 10 万並列での効率的な実行を目指して, 並列フラグメント分子軌道プ

... 3. 超並列に向けた OpenFMO の最適 3.1 MPI/OpenMP[9]ハイブリッド並列 中規模,大規模の計算機として最近主に用いられているクラスタ型並列計算機は,複 数のプロセッサ(コア)を搭載した小型計算機(計算ノード)を Gigabit Ether や Infiniband ...

8

Mode Modylas NAREGI において並列化チューニングを開始 次世代ナノ統合シミュレーションソフトウェアの研究開発 において京コンピュータに最適化した並列化チューニングを実施 MODYLAS CMSI MateriApps に登録 論文公刊 Y.Andoh et al., J. Chem

Mode Modylas NAREGI において並列化チューニングを開始 次世代ナノ統合シミュレーションソフトウェアの研究開発 において京コンピュータに最適化した並列化チューニングを実施 MODYLAS CMSI MateriApps に登録 論文公刊 Y.Andoh et al., J. Chem

... 動作確認済みコンパイラー frtpx (富士通), ifort (インテル), pgf90 (PGI) 並列方式 MPI/OpenMP/SIMD の3層ハイブリッド並列 通信方式 「京」の 3Dトーラスネットワーク Tofu に最適 インストール済スパコン 京コンピューター /opt/spire/MODYLAS/ *実行バイナリのみ ...

23

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

... WaitAll() を使用する並列タスクの出力 タスク 3 – IsCompleted プロパティを使用する 他の処理を実行する前に Task オブジェクトの進行状況をチェックする場合 (たとえば、最初 のタスクが完了していなければ実行できない別のタスクがある場合)、Wait() メソッドを使 用すると、Task オブジェクトを起動したスレッド上での他のタスクの実行をブロックして しまうため、Wait() ...

47

CCS HPCサマーセミナー 並列数値計算アルゴリズム

CCS HPCサマーセミナー 並列数値計算アルゴリズム

... 考察(1/2) • FFTE 4.1に自動チューニングを適用することにより性 能が向上していることが分かる. • これは,FFTE 4.1において固定されていた全対全通 信方式およびブロックサイズが,自動チューニングによ り最適されたことが理由と考えられる. ...

51

1E2-4 BDD簡約化アルゴリズムの並列化

1E2-4 BDD簡約化アルゴリズムの並列化

... ついて削除と共有ルールの適用を行う. 1 段階目では,各節点 に対して,削除ルールが適用できる節点は削除し,そうでない 節点については共有される節点候補のリストを作成する.同 じ子節点を持つものは同じ節点へと簡約されるため,片方 の子節点をハッシュ値として利用することで,節点候補リスト が作成される.効率良くメモリを使用するため,上記の操作中 に子節点への枝を同じ子節点を持つ節点へのリンクとして使 ...

4

モデルベース並列化ツールeMBPの紹介

モデルベース並列化ツールeMBPの紹介

... 元のソース 並列情報 並列コード ブロック/サブシステム間の依存関係とコア割り当ての情報を元に並列コードを生成する。 その際、スレッドに関するコード、スレッド間通信に関するコードが加えられる。 send ...

37

SGI AltixUV1000 並列化プログラミング講習会

SGI AltixUV1000 並列化プログラミング講習会

... – 同時にひとつのスレッドのみで実行される領域を定義します。共有されている領 域への書き込みや、 I/O を行う際の排他制御などに用います。  atomic 指示文 – critical 指示文と同様に排他制御を行いますが、ハードウェアによる最適を行 うことができる特定の演算 (インクリメント等) のみに限定したものです。 ...

121

Show all 10000 documents...

関連した話題