• 検索結果がありません。

計算の高速化と並列処理

高速度ビデオでの運動解析プログラムの開発 - OpenMP 等を用いた相関計算並列化によるトレース高速化 - 横山直樹 ( 東海大学総合科学技術研究所 ) Development of versatile motion analysis program based on normalized cor

高速度ビデオでの運動解析プログラムの開発 - OpenMP 等を用いた相関計算並列化によるトレース高速化 - 横山直樹 ( 東海大学総合科学技術研究所 ) Development of versatile motion analysis program based on normalized cor

... 理想的な傾向をしている。その理由は負荷(ROI 256 個)が十分大きいためである考えられる。 5. 結論 テンプレートエッジ情報に着目し、エッジ成分が高い画素のみを相関計算に使用すること で、計算高速だけでなくより良い追跡が可能であることがわかった。また OpenMP を用い ...

10

pthreadによる行列計算の高速化の試み

pthreadによる行列計算の高速化の試み

... pthread による行列計算の高速化の試み 231 自己列の先頭アドレスを a とすると EA= α+i ホ n+j でなされる。コンパイラがコードから得られる情報を用い て最適化しない場合には、配列の要素 1個毎にこの計算が なされる。もし、配列のアドレス計算の高速化が計られれ ば、全体の処理時聞は短縮される。 C 言語では、ポインタ型の変数が利用できるので、イン[r] ...

3

FIT2018( 第 17 回情報科学技術フォーラム ) CB-005 並列処理を用いた対話的多倍長演算環境 MuPAT の高速化 Acceleration of interactive multi-precision arithmetic toolbox MuPAT using parallel

FIT2018( 第 17 回情報科学技術フォーラム ) CB-005 並列処理を用いた対話的多倍長演算環境 MuPAT の高速化 Acceleration of interactive multi-precision arithmetic toolbox MuPAT using parallel

... 回で 計算できる. DD 精度内積,行列ベクトル積,行列積に必要な倍精 度演算回数は表 1 より,DD 加算で加算が 11 回,DD 乗 算で加算が 15 回,乗算が 9 回で合計 35 回倍精度演算で ある.このうち FMA で実行可能な積和演算は図 1 より split 関数で 1 箇所,twoProd 関数で 4 箇所ため,dd_mul_dd 関 数で ...

6

講師取締役千田範夫シニアコンサルタント竹内宗孝 の事業内容 Winmostar の開発 販売 科学技術計算コードの並列化 高速化 およびカスタム開発 計算化学コンサル etc 2

講師取締役千田範夫シニアコンサルタント竹内宗孝 の事業内容 Winmostar の開発 販売 科学技術計算コードの並列化 高速化 およびカスタム開発 計算化学コンサル etc 2

... 本チュートリアル実施あたっては、PCLinux環境(cygwin)に予めermodをビルドしておく 必要があります。 ermodWiki: http://sourceforge.net/projects/ermod/ 第一部 ER法による溶媒和自由エネルギー計算について I. ER法概要 ...

46

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

...  実はMPIは特定ソフトウェア名前ではなく、各ルーチンを定義した規格名。  ほとんど並列計算機で MPIライブラリを利用可能  MPIライブラリ = MPI規格に準拠して作成されたMPIルーチン群  MPIライブラリ = MPI規格に準拠して作成されたMPIルーチン群 ...

68

発枝醸定法 マルチプロセッサ スケジューリング問題 に対する分枝限定法の適用 笠原博徳 まえがきマルチプロセッサ方式の並列処理システムは科学技術計算用超大型計算機 ( スーパーコンピュータ ), 等の論理型言語を処理する高速推論マシン, あるいは低価格高性能のロボットコントローラの開発等を始め, 幅

発枝醸定法 マルチプロセッサ スケジューリング問題 に対する分枝限定法の適用 笠原博徳 まえがきマルチプロセッサ方式の並列処理システムは科学技術計算用超大型計算機 ( スーパーコンピュータ ), 等の論理型言語を処理する高速推論マシン, あるいは低価格高性能のロボットコントローラの開発等を始め, 幅

... むすび 本解説では,実行時間最小マルチプロセッサ・スケジ ューリング問題に対する, DF/IHS 法と呼ぶ一種の分 校限定法の適用について述べた.分校限定法は,対象問 題の特徴を適切に押さえたヒューリスティックをうまく 取り入れ,計算時間および記憶領域を低く押さえるよう なインプリメントを行なえば, NP 困難な最適化問題に 対しても実用的な意味で最適解を求めることがで[r] ...

5

H26 年度 スーパーコンピュータの高速化技法入門 並列化による高速化技法 2015 年 1 月 21 日 大阪大学サイバーメディアセンター日本電気株式会社

H26 年度 スーパーコンピュータの高速化技法入門 並列化による高速化技法 2015 年 1 月 21 日 大阪大学サイバーメディアセンター日本電気株式会社

... ▐ 初期値を与えたローカル変数、save文指定されたローカル変数  data文などによって初期値を与えたローカル変数やsave文を指定した ローカル変数は、並列処理時には、スタックではなく、静的領域に割り 当てられるため、各タスクで同一領域を参照するようになる ...

68

並列計算プログラミング超入門

並列計算プログラミング超入門

... MPI_Wait 間に、プロセス間境界メッシュ以外でメッシュで処理がおかれている ことが分かります。つまり MPI_Irecv で指定されたデータ通信、その通信にかかわるデ ータを参照しない計算を「同時に」行なうことで MPI_Recv を使用した場合に比べて計算 ...

19

メモリ階層構造を考慮した大規模グラフ処理の高速化

メモリ階層構造を考慮した大規模グラフ処理の高速化

... 道路ネットワーク USA-road-d.LKS.gr (n = 2.76M, m = 6.89M) : 20.6 日間 特許引用ネットワーク cit-Patents (n = 3.77M, m = 16.52M) : 23.6 時間 性能を引き出すためには 特殊な計算機環境 (CRAY XMT) が必要 ボトルネック なる 最短路計算 に対する汎用的な実装は存在しない ⇒ ...

23

並列処理の背景

並列処理の背景

... り高い性能は期待できない。画像処理専用IC流用では、科学技術 計算でも倍精度以上浮動小数点演算を必要したり、演算局所 性が低いものではそれほど高い性能は得られない。画像処理専用で はなく、GPUから派生して新たに開発されたGPGPU用ICでは、 倍精度浮動小数点演算やより広いメモリ空間に対応したものがあり ...

40

並列・高速化を実現するための 高速化サービスの概要と事例紹介

並列・高速化を実現するための 高速化サービスの概要と事例紹介

... ▌ 主な業務内容  科学技術計算(流体、構造解析。各種解析コードを用いた解析・開発 等)  エンジニアリング系ソフトウェア開発(CAD、PDM 等)  AI、IoT等 先端技術活用支援、開発  業務系システム基盤構築 ...

27

2E1-2 状態遷移の並列比較によるNFA照合高速化

2E1-2 状態遷移の並列比較によるNFA照合高速化

... 1 1 行目配列を並列比較では、 表 1 3 行目ようなビット列 t に格納する。このビット列 は利用する CPU レジスタサイズに収まるようにする。もと ビット列 ( 表 1, 2 行目 ) 先頭に 1 ビット追加しそのビット に 1 をセットしている。そして探索したい数値先頭に 1 ビッ ...

4

CCS HPCサマーセミナー 並列数値計算アルゴリズム

CCS HPCサマーセミナー 並列数値計算アルゴリズム

... まとめ(1/2) • 物質科学実アプリケーションにおいて使われることが 多い,高速フーリエ変換(FFT)について紹介した. • これまで並列FFTで行われてきた自動チューニングで は,基数選択や組み合わせ,そしてメモリアクセス 最適など,主にノード内演算性能だけが考慮され てきた. ...

51

000/6/3 目次 地球シミュレータの紹介 大気大循環モデル 基礎方程式 スペクトル法 コアとなる計算部分 並列化手法 実行性能 問題点と今後の予定 ワークショップ 計算科学におけるアルゴリズム

000/6/3 目次 地球シミュレータの紹介 大気大循環モデル 基礎方程式 スペクトル法 コアとなる計算部分 並列化手法 実行性能 問題点と今後の予定 ワークショップ 計算科学におけるアルゴリズム

... 「地球シミュレータ」計画目標 ■ 気象,気候変動現象解明 ★ エルニーニョ現象,地球温暖現象等グローバル現象理解 • 現状全球モデルで水平方向約60Km,鉛直方向20層 • 計算格子数増加による詳細なシミュレーション ...

32

冗長系逆運動学マップ計算の並列分散アーキテクチャ

冗長系逆運動学マップ計算の並列分散アーキテクチャ

... 拡散にかかる時間も格子数に比例して増大するため,計 算に膨大な時聞がかかる, 本研究では 3 冗長性を有するロボットに実用できる高 密度な非線形マップを並列分散方式で構成するための計 算アーキテクチャについて考察する ここでは,格子の疎分割と区域分割をおこない,実現 可能な台数のフ。ロセッサによる並列分散処理についての 設計と製作を行った結果を報告する 2. 2) 手[r] ...

6

インテル Parallel Studio XE 2020 の最新情報 エンタープライズ クラウド HPC AI アプリケーションの並列コードを高速化 久保寺 陽子

インテル Parallel Studio XE 2020 の最新情報 エンタープライズ クラウド HPC AI アプリケーションの並列コードを高速化 久保寺 陽子

... さらに詳しい情報をお知りになりたい場合は、 http://www.intel.com/benchmarks/ (英語) を参照してください。 性能測定結果はシステム構成日付時点テストに基づいています。また、現在公開中すべてセキュリティー・アップデートが適用されているは限りません。詳細につ ...

52

CCS HPCサマーセミナー 並列数値計算アルゴリズム

CCS HPCサマーセミナー 並列数値計算アルゴリズム

... 考察(1/2) • FFTE 4.1に自動チューニングを適用することにより性 能が向上していることが分かる. • これは,FFTE 4.1において固定されていた全対全通 信方式およびブロックサイズが,自動チューニングによ り最適されたことが理由考えられる. ...

51

最新の並列計算事情とCAE

最新の並列計算事情とCAE

... スライド一枚でわかる (かもしれない) スパコントレンド  10年(15年?)前  専用設計ベクトル計算機、強力なベクトルプロセッサを高 速バスで接続、非常に「密」なシステム ...

23

大規模データの匿名加工処理を高速化する技術を開発

大規模データの匿名加工処理を高速化する技術を開発

... 1. 大規模データに対する匿名加工処理高速技術開発 東大生研日立は、大規模データ解析問合せにおいて高速性を発揮してきた非順 序型実行原理を、新たに匿名加工処理に適用しました。 これまで匿名加工処理には専用ソフトウェアを用いるが一般的であり、データベ ...

6

ハードウェア支援を用いた冗長なマーク処理の抑制によるGC高速化手法

ハードウェア支援を用いた冗長なマーク処理の抑制によるGC高速化手法

... という 処理によって移動元ページを保護する.その後,GC-protect によって保護されたペー ジ内オブジェクトがロードされた時,初めてそのオブジェクトを参照するポインタ を修正する.このように,NAP ではリードバリアによって移動元ページに対する読み 出しを検知することで,アプリケーション並行動作可能なポインタ修正を実現し ている.なお ...

63

Show all 10000 documents...

関連した話題