• 検索結果がありません。

処理の末端での並列化

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2015-HPC-151 No /10/1 OpenFOAM による流体コードの Hybrid 並列化の評価 1 内山学 ファムバンフック 1 2 千葉修一 3 井上義昭 3 浅見暁 本報告は流体コード

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2015-HPC-151 No /10/1 OpenFOAM による流体コードの Hybrid 並列化の評価 1 内山学 ファムバンフック 1 2 千葉修一 3 井上義昭 3 浅見暁 本報告は流体コード

... 4x4x4 ブロックに分割し,そのブロッ クを単位として,図 2 ように 2 色マルチカラーにオー ダリングする.各ブロック内は Cuthill-McKee オーダリン グを行う. 4x4x4 分割 2 色場合,独立に計算できる ブロックは 32 ...方式 あり, schedule を dynamic ...

6

CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン

CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン

... 2DBLOCK・THREAD割り当て  GlobalID は、(x, y , z )方向に計算できる — GlobalID(x) = blockDim.x * blockIdx.x + threadIdx.x — GlobalID(y) = blockDim.y * blockIdx.y + threadIdx.y — GlobalID(z) = blockDim.z * ...

23

高性能,高生産性を実現する 大規模メモリ・並列処理システムソフトウエアの研究

高性能,高生産性を実現する 大規模メモリ・並列処理システムソフトウエアの研究

... 音響数値解析手法一種ある音響FDTD(2,4)法は、通常 FDTD法と比較して袖領域ステンシル読み込み幅が増加する が、空間方向に高次精度計算が可能となるため、効率的な 大規模音響解析に向けたマルチノード並列が求められる. SMSを利用し,時空間ブロッキング等導入により音響ソル ...

10

1E2-4 BDD簡約化アルゴリズムの並列化

1E2-4 BDD簡約化アルゴリズムの並列化

... 4. 並列準簡約と追駆簡約による並列 本稿は,並列に準簡約を行いつつ追駆して従来簡約 を行う新しい並列手法を提案する.準簡約は必ずしも完 ...

4

モデルベース並列化ツールeMBPの紹介

モデルベース並列化ツールeMBPの紹介

... 見積もりには、Simulinkモデルから生成されたCコードに対応するアセンブラ命令毎処理量 を、SHIM情報を参照する事によって計算。 Block対応生成コード No. Block Name Block Type Performance (cycle) 0 Block1 Add xxxxxxxx ...

37

連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 問題の定義 αβ 法 16 2 αβ 法の並列化 概要 Young Brothers Wa

連載講座 : 高生産並列言語を使いこなす (4) ゲーム木探索の並列化 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 準備 問題の定義 αβ 法 16 2 αβ 法の並列化 概要 Young Brothers Wa

... • 適応的な待機: 未開始タスク枝刈りやそれらへ探索窓伝搬 • 強制終了: 開始済みタスク枝刈り があり, それらが各処理どう表現されるかを述べた. ゲーム木探索においては, タスク並列処理系 と言っても, タスク生成と終了待ちが拘束に出来れば良いというものはなく, ...

24

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

... メモ: 値を取得するには、data.Result プロパテゖを調べます。Result プロパテゖの 呼び出し時にタスクが完了していれば、値がすぐに返されます。完了していなけれ ば、タスクが完了して値を取得できるようになるまで、実行中コードがブロック されます。上記は、Result プロパテゖをすぐに呼び出していますが、これは ...

47

マルチコア商用スマートディバイスの 評価と並列化の試み

マルチコア商用スマートディバイスの 評価と並列化の試み

... Tick値影響 (ARM)  一定時間間隔タイマ割り込みを発生させる頻度  100HZから200HZ程度  割り込み処理、時間関連ソフトウェアイベントを処理  割り込み処理コストは一定 ...

48

MPI または CUDA を用いた将棋評価関数学習プログラムの並列化 2009/06/30

MPI または CUDA を用いた将棋評価関数学習プログラムの並列化 2009/06/30

... 表 1がMPI並列した反復計算部ソースコードある。 特徴ベクトルに関するループを分割して並列処理している。 表中赤い部分が並列ために書き直したところある。10数行変更並列でき る。呼び出す ...

24

コンピュータ将棋と並列化

コンピュータ将棋と並列化

... • 伊藤毅志, 小幡拓弥, 杉山卓弥, 保木邦仁. 将棋における合議アルゴリズム — 多 数決による手選択. IPSJ, Vol. 52, No. 11, pp. 3030–3037, 2011. • 田中哲朗,金子知適. コンピュータ将棋不遜な挑戦 : 4.大規模クラスタシステ ム実行 -GPS将棋試み-. 情報処理, Vol. 51, ...

37

Stage 並列プログラミングを習得するためには : 1 計算機リテラシ, プログラミング言語 2 基本的な数値解析 3 実アプリケーション ( 例えば有限要素法, 分子動力学 ) のプログラミング 4 その並列化 という 4 つの段階 (stage) が必要である 本人材育成プログラムでは1~4を

Stage 並列プログラミングを習得するためには : 1 計算機リテラシ, プログラミング言語 2 基本的な数値解析 3 実アプリケーション ( 例えば有限要素法, 分子動力学 ) のプログラミング 4 その並列化 という 4 つの段階 (stage) が必要である 本人材育成プログラムでは1~4を

... CW-01~10 まで講義は,変分法,重み付残差法から始まって,一次元・三次元コードに ついて,例題プログラムを一行一行解説した。疎行列解法,前処理手法に関する解説も実施し た。計算結果可視にあたっては MicroAVS 2 を使用した。 CW-12 以降は三次元コード並列版(MPI ...

5

高速度ビデオでの運動解析プログラムの開発 - OpenMP 等を用いた相関計算並列化によるトレース高速化 - 横山直樹 ( 東海大学総合科学技術研究所 ) Development of versatile motion analysis program based on normalized cor

高速度ビデオでの運動解析プログラムの開発 - OpenMP 等を用いた相関計算並列化によるトレース高速化 - 横山直樹 ( 東海大学総合科学技術研究所 ) Development of versatile motion analysis program based on normalized cor

... 3.7 MPI による相関計算高速 次に複数ホストが高速ネットワークつながれている環境、上述 OpenMP と同様な並列 戦略相関計算を高速することを目指した。Fig.13 は横軸にランク数(ノード数にコア数をか ...

10

SGI AltixUV1000 並列化プログラミング講習会

SGI AltixUV1000 並列化プログラミング講習会

... 浮動小数点演算多いループや大きなデータセットを処理するコード性能向上が見込めます。 -axSSE4.2および-xSSE4.2オプションと組み合わせより詳細なデータ依存性解析をします。 -fast -xHOST –O3 –ipo –no-prec-div –staticを有効にするマクロオプションです。 ...

121

情報処理学会研究報告 IPSJ SIG Technical Report 並列 FMO プログラム OpenFMO の性能最適化 稲富雄一, 眞木淳, 高見利也, 本田宏明, 小林泰三, 南里豪志, 青柳睦, 南一生 数万 ~ 数 10 万並列での効率的な実行を目指して, 並列フラグメント分子軌道プ

情報処理学会研究報告 IPSJ SIG Technical Report 並列 FMO プログラム OpenFMO の性能最適化 稲富雄一, 眞木淳, 高見利也, 本田宏明, 小林泰三, 南里豪志, 青柳睦, 南一生 数万 ~ 数 10 万並列での効率的な実行を目指して, 並列フラグメント分子軌道プ

... MPICH2 行われているためだと考 えられる.例えば,図 9 経過時間約 2.5 秒~7.5 秒あたり worker group 2(rank 7~ 12 ) プ ロ セ ス が 片 側 通 信 同 期 関 数 あ る MPI_Win _unlock 関 数 と 後 続 す る MPI_Bcast ...

8

丹治より 4 つの運動のレベルの協調 局面 状況 要求に対応した運動随意的選択 意識的制御自動化された運動汎用性運動学習によってつくられた運動歩行 咀嚼 呼吸, 発声 嚥下複合運動 生得的行動サッケード 追跡眼球運動パターン化された運動 自動化されてない運動 反射運動 階層処理並列的処理重層的処理

丹治より 4 つの運動のレベルの協調 局面 状況 要求に対応した運動随意的選択 意識的制御自動化された運動汎用性運動学習によってつくられた運動歩行 咀嚼 呼吸, 発声 嚥下複合運動 生得的行動サッケード 追跡眼球運動パターン化された運動 自動化されてない運動 反射運動 階層処理並列的処理重層的処理

... 高草木 2008.1.6 林メールより 柳原・ G rillner・高草木 3者会 話より 認知的な計画をし、実地に行って学習できなくなる。 時間間隔を判断する時誤差を検出し、違う感覚 主急速に注意を向けることができない。 3次元空間認知的な行動をすることができなく なる。 ...

16

並列処理の背景

並列処理の背景

... 本並列スレッドをグループしたワープを単位にスレッド スケジューリングを行います。各 SMX にはワープスケジューラが 4 個と 命令ディスパッチ・ユニットが 8 個あり、4 つワープを並列に発行・実行 することができます。Kepler クワッド・ワープスケジューラは、4 つのワ ープを選択し、1 ワープにつき 1 ...

40

FIT2018( 第 17 回情報科学技術フォーラム ) CB-005 並列処理を用いた対話的多倍長演算環境 MuPAT の高速化 Acceleration of interactive multi-precision arithmetic toolbox MuPAT using parallel

FIT2018( 第 17 回情報科学技術フォーラム ) CB-005 並列処理を用いた対話的多倍長演算環境 MuPAT の高速化 Acceleration of interactive multi-precision arithmetic toolbox MuPAT using parallel

... 現在,ほとんどコンピュータが浮動小数点数規格と して,IEEE754-2008 を採用し,ハードウェア実装された 浮動小数点数演算は非常に高速ある.演算精度は,単 精度は 10 進 7 桁,倍精度は 16 桁あるが,それより高精 度に計算したほうが良い場面が色々ある. たとえば, Krylov ...

6

並列分散ワークフロー処理システムの研究開発

並列分散ワークフロー処理システムの研究開発

... • 複数拠点クラスタを用いたワークフロー実行 • 適切なタスク配置により、拠点間ファイル転送を少なくする • 「エッジカット最小」となるグラフ分割問題を解くことにより、タスク をグループ ...

21

2E1-2 状態遷移の並列比較によるNFA照合高速化

2E1-2 状態遷移の並列比較によるNFA照合高速化

... にあるように並列比較有無比較すると、 並列比較無し処理時間時間が大きく悪化し、並列比較効 果により悪化度合いが抑えられている。「英字」「カタカナ」 提案手法高速が出来なかった理由として次ような状 ...

4

Microsoft PowerPoint - 演習1:並列化と評価.pptx

Microsoft PowerPoint - 演習1:並列化と評価.pptx

... mpi_sendrecv による送受信 まず,上隣に jend 列を送り,下隣から jstart-1 列に受信 次に,下隣に jstart 列を送り,上隣から jend+1 列に受信 両端プロセスは,ダミープロセス( MPI_PROC_NULL) と送受信するよ うにする. ...

13

Show all 10000 documents...

関連した話題