• 検索結果がありません。

自動並列化コンパイラ

Mode Modylas NAREGI において並列化チューニングを開始 次世代ナノ統合シミュレーションソフトウェアの研究開発 において京コンピュータに最適化した並列化チューニングを実施 MODYLAS CMSI MateriApps に登録 論文公刊 Y.Andoh et al., J. Chem

Mode Modylas NAREGI において並列化チューニングを開始 次世代ナノ統合シミュレーションソフトウェアの研究開発 において京コンピュータに最適化した並列化チューニングを実施 MODYLAS CMSI MateriApps に登録 論文公刊 Y.Andoh et al., J. Chem

... 動作確認済みコンパイラー frtpx (富士通), ifort (インテル), pgf90 (PGI) 並列方式 MPI/OpenMP/SIMD の3層ハイブリッド並列 通信方式 「京」の 3Dトーラスネットワーク Tofu に最適 インストール済スパコン 京コンピューター /opt/spire/MODYLAS/ *実行バイナリのみ ...

23

概要 OpenACC とは OpenACC について OpenMP, CUDA との違い OpenACC の指示文 並列化領域指定指示文 (kernels/parallel) データ移動指示文 ループ指示文 OpenACC の実用例 実習 コンパイラメッセージの見方 OpenACC プログラムの実装

概要 OpenACC とは OpenACC について OpenMP, CUDA との違い OpenACC の指示文 並列化領域指定指示文 (kernels/parallel) データ移動指示文 ループ指示文 OpenACC の実用例 実習 コンパイラメッセージの見方 OpenACC プログラムの実装

... デバイス上で扱われるべきデータについて • プログラム上の parallel/kernels構文に差し掛かった時、 OpenACCコンパイラは実行に必要なデータを自動で転送する – 往々にして正しく転送されない。 自分で書くべき ...

62

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

... MPIの利点と欠点  利点1.高速に向けた細かいチューニングが可能  通信のタイミングや転送するデータの大きさ、さらに処理のプロセスへの分担のさせ方 やデータの配置方法等、性能に影響する事項をプログラムで直接指示できるので、慣 れれば高い性能を得られやすい。 ...

68

丹治より 4 つの運動のレベルの協調 局面 状況 要求に対応した運動随意的選択 意識的制御自動化された運動汎用性運動学習によってつくられた運動歩行 咀嚼 呼吸, 発声 嚥下複合運動 生得的行動サッケード 追跡眼球運動パターン化された運動 自動化されてない運動 反射運動 階層処理並列的処理重層的処理

丹治より 4 つの運動のレベルの協調 局面 状況 要求に対応した運動随意的選択 意識的制御自動化された運動汎用性運動学習によってつくられた運動歩行 咀嚼 呼吸, 発声 嚥下複合運動 生得的行動サッケード 追跡眼球運動パターン化された運動 自動化されてない運動 反射運動 階層処理並列的処理重層的処理

... 姿勢制御はすべて の運動に先行する。 適応的運動の実現には予測的姿勢制御と感覚情報 の変化に基づくリアルタイムの姿勢制御が必要 移動知研究より 高草木 2010 予測的姿勢制御:大脳皮質ー網様体脊髄路、大脳皮 質ー小脳 リアルタイムの姿勢制御:大脳ー小脳ー脊髄連関、 筋緊張制御系(大脳基底核ー脳幹投射系) 姿勢制御 大脳基底核:予測的姿勢制御・リアルタイムの姿勢制御 の[r] ...

16

FIRコンパイラ・ユーザー・ガイド

FIRコンパイラ・ユーザー・ガイド

... フィルタは、シンメトリカルな係数値を持っています。FIR コンパイラ は、係数を検査して、フィルタの対称性(偶数、奇数、なし)を自動的に判定しま す。フィルタの対称性が検出されると、必要な計算を最小限に抑えるため、ウィ ザードが最適なアルゴリズムを選択します。FIR コンパイラは、係数は四捨五入され た後に係数の対称性を決定します。対称性が存在する場合、2 つのデータ・ポイント ...

84

TMS320C28x オプティマイジング(最適化)C/C++ コンパイラ

TMS320C28x オプティマイジング(最適化)C/C++ コンパイラ

... 目次 2.5.4 前処理後のコンパイルの続行方法(-ppa オプション)......................................... 2-30 2.5.5 コメント付き前処理リスト・ファイルの生成方法(-ppc オプション)............. 2-31 2.5.6 行の制御情報付き前処理リスト・ファイルの生成(-ppl オプション).............. 2-31 2.5.7 Make ...

368

システム操作インターフェイス最適化によるテスト自動化ROI向上

システム操作インターフェイス最適化によるテスト自動化ROI向上

... 自動はテストプログラムの作成である。 そのため、設計、実装の品質により作成、メンテコストは変わる。 アプリケーションドライバを利用することにより、 テストプログラムの品質を上げ、 ...

19

Agenda 富士通 C++ コンパイラ C++ コンパイラの概要 C++ コードに対する課題 最適化の拡張 性能状況 OpenFOAM FX10 向けOpenFOAM OpenFOAM 構築 OpenFOAM 利用 OpenFOAMの性能改善 流体解析ヘルプデスク (OpenFOAM) 1

Agenda 富士通 C++ コンパイラ C++ コンパイラの概要 C++ コードに対する課題 最適化の拡張 性能状況 OpenFOAM FX10 向けOpenFOAM OpenFOAM 構築 OpenFOAM 利用 OpenFOAMの性能改善 流体解析ヘルプデスク (OpenFOAM) 1

... motorBike 風環境解析 34万格子 (逐次実行) hotRoom 定常熱流体解析 4千格子 (逐次実行) multiRegionHeaterRadiation 伝熱連成解析 3千格子 (逐次実行) propeller 回転機械解析 57万格子 (4並列実行) ...

24

MBP(モデルベース並列化)を用いたクロスレイヤ設計

MBP(モデルベース並列化)を用いたクロスレイヤ設計

... – (事前・ターゲットごと)LLVM IR各命令の性能情報を計測→SHIM XMLを作成 – 対象ソフトウェアをClang (LLVMコンパイラ)で中間言語表現にし、 SHIM XMLを用いて見積もる – ∑ 𝑖𝑖∈𝐼𝐼𝐼𝐼 𝑖𝑖の性能 × 𝑖𝑖の出現回数 により簡単に求まりそうであるが、 以下に示す理由で実際には簡単ではない ...

68

コンパイラ

コンパイラ

... 分散システム • 統合コンピュータシステム用ソフトウェアを整備して,ネット ワークによって結合された自律コンピュータの集合体 • 「分散システム -コンセプトとデザイン」第2版 George Coulouris, ...

29

CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン

CUDA を用いた画像処理 画像処理を CUDA で並列化 基本的な並列化の考え方 目標 : 妥当な Naïve コードが書ける 最適化の初歩がわかる ブロックサイズ メモリアクセスパターン

...  cudaError_t cudaMallocPitch ( void** devPtr, size_t* pitch, size_t width, size_t height ). — widthバイトのメモリを、height行分、取得する。 — 行は、pitchバイトで整列する。[r] ...

23

マルチコア商用スマートディバイスの 評価と並列化の試み

マルチコア商用スマートディバイスの 評価と並列化の試み

...  Thread生成からCPUのbindまでに 遅延 (Start-Migrated 440.6ms)  CPUの自動ON/OFF line(Auto Hotplug)が影響 サンプル 1 2 3 4 5 6 7 8 9 10 最速 平均 最遅 実行時間 (秒) 5.12 5.08 3.65 5.05 2.78 2.73 5.06 2.74 5.05 2.74 2.73 4.00 5.12 ...

48

並列・高速化を実現するための 高速化サービスの概要と事例紹介

並列・高速化を実現するための 高速化サービスの概要と事例紹介

... ▌ このようなお客様におススメ! 1. 自社解析プログラムの高速効果が知りたい 2. 自社解析プログラムの実行時間に不満がある 3. 自社解析プログラムの並列アドバイスがもらいたい 4. 自社で並列高速を実施したいが方法が分からない 5. 高速によりコストを削減したい ...

27

SGI AltixUV1000 並列化プログラミング講習会

SGI AltixUV1000 並列化プログラミング講習会

... n=0: 診断情報を出力しません。 n=1: 正常に自動並列できたループに対して”LOOP AUTO-PARALLELIZED”のメッセージを 出力します。 n=2: 正常に自動並列したループとできなかったループに対してメッセージを出力します。 n=3: ...

121

モデルベース並列化ツールeMBPの紹介

モデルベース並列化ツールeMBPの紹介

... ■Model-Based Development/Design • Modelを起点としたソフトウェア開発手法。モデルを作成し、シミュレーションなどで妥 当性を確認した上で、コードを作る(可能ならモデルからコードを自動生成)。 • 設計レベルの妥当性検証を可能にする。 ...

37

内容 イントロダクション スカラチューニング OpenMPによる並列化 最近のHPC分野の動向 まとめ

内容 イントロダクション スカラチューニング OpenMPによる並列化 最近のHPC分野の動向 まとめ

... ● プログラムに指示行を挿入(オプション無効時はコメント 行と見なされる(C言語は警告される場合も)) ● 自動並列に比べて柔軟に最適が可能 ● 標準規格なため、マシン/コンパイラに依らずポータブル ● 2013 年8月現在、OpenMP 4.0。SIMDの指示行、アクセ ...

61

Java Just-In-Timeコンパイラにおける最適化手法

Java Just-In-Timeコンパイラにおける最適化手法

... 意する手法はデバーチャル(devirtualization)と呼ばれる。これまでに多くのデバーチャル の手法[22][23][47][72][77][78][79][80][81][82][83]が提案されてきた。デバーチャルは、その 方法に基づいて、間接デバーチャル、直接デバーチャル、の2つに分けることができる。 ...

120

システム操作インターフェイス最適化によるテスト自動化ROI向上

システム操作インターフェイス最適化によるテスト自動化ROI向上

... 一般的にシステムテストの自動は、フロントエンドのアプリケーションの GUI 入力を エミュレートすることが多い。しかし、GUI は人間用に設計されており、プログラムから の操作に適していない。実際に問題になった点を挙げる。 ・不安定なテストになる。(タイミング依存で成否が変わる。) ・技術的にブラックボックス性が高く失敗理由の解析が困難。 ・プロダクト変更時のメンテコストが高い。 ...

20

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

... 断されれば、他の作業単位と並列実行するようにスケジュールが設定される、簡易作業単位 と考えることができます。 Task オブジェクトを作成したら、実行するロジックを含むデリゲートやラムダ ステートメ ントを、作成したオブジェクトに提供する必要があります。次に、Parallel Extensions ラ゗ブ ラリの中核となる TaskManager が、Task の実行スケジュールを設定します。実行スケジュ ...

47

OpenACCによる並列化

OpenACCによる並列化

... OpenACCで並列してください – コンパイラメッセージに注意! – 常に CPUでの結果と突き合わせ! • 計算順序が変わるため、必ずしも一致しない – この時点で遅くても気にしない! ...

28

Show all 10000 documents...

関連した話題