• 検索結果がありません。

分散メモリでの並列実行

SX-Aurora TSUBASA でのプログラミング(並列化編)― 共有並列化と分散並列化 ―

SX-Aurora TSUBASA でのプログラミング(並列化編)― 共有並列化と分散並列化 ―

... つ プ ロ セ ス 中 複 数 ス レ ッ ド に よ る 並 列 処 理 こ と す 。 SX-Aurora TSUBASA 各 VE カード内は、主記憶装置を共有する 8 個 CPU コア上実行されるスレッドに仕 ...

23

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2018-HPC-163 No /3/1 高柔軟性と高性能を提供するマルチノードマルチスレッドプログラム向け分散共有メモリシステム 緑川博子 1 北川健司 2 (1) 概要 : マルチノードに分散マップさ

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2018-HPC-163 No /3/1 高柔軟性と高性能を提供するマルチノードマルチスレッドプログラム向け分散共有メモリシステム 緑川博子 1 北川健司 2 (1) 概要 : マルチノードに分散マップさ

... 2.3 大域データへマルチスレッド非同期アクセス実 現 M-SMS では,多く PGAS 基盤システムように,GET や PUT といったユーザが明示的に指定した時のみにデー タを取得できる,あるいは,大域データアクセス範囲に制 限を設ける,などを行っていない.このため,ユーザプロ グラムを構成する複数スレッドから非同期にページ要求が ...

9

分散計算機環境における ジョブ実行支援システムに関する研究

分散計算機環境における ジョブ実行支援システムに関する研究

... : 分散型PSE "D-NCAS" におけるモジュール連 携支援, 第7回問題解決環境ワークショップ/第2回グリッドセミナー論文集, ...: 分散環境におけるデータ分散 処理システム構築, 第7回問題解決環境ワークショップ/第2回グリッドセミナー論文集, ...

27

研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI, MPICH, MVAPICH, MPI.NET プログラミングコストが高いため 生産性が悪い 新しい並

研究背景 大規模な演算を行うためには 分散メモリ型システムの利用が必須 Message Passing Interface MPI 並列プログラムの大半はMPIを利用 様々な実装 OpenMPI, MPICH, MVAPICH, MPI.NET プログラミングコストが高いため 生産性が悪い 新しい並

... CG考察 • 2と8プロセス場合,縦と横分割数が異なる(1,4,16は同じ) 25 • XMP版はすべて要素をリダクションにしているに対し, MPI版は計算に必要な要素のみをリダクションしているため w[] ...

47

情報処理学会研究報告 IPSJ SIG Technical Report 並列 FMO プログラム OpenFMO の性能最適化 稲富雄一, 眞木淳, 高見利也, 本田宏明, 小林泰三, 南里豪志, 青柳睦, 南一生 数万 ~ 数 10 万並列での効率的な実行を目指して, 並列フラグメント分子軌道プ

情報処理学会研究報告 IPSJ SIG Technical Report 並列 FMO プログラム OpenFMO の性能最適化 稲富雄一, 眞木淳, 高見利也, 本田宏明, 小林泰三, 南里豪志, 青柳睦, 南一生 数万 ~ 数 10 万並列での効率的な実行を目指して, 並列フラグメント分子軌道プ

... group ジョブ実行を阻害しな い方法として,データ保存ため専用プロセスを用いること(以降,方法2)も検 討した.この方法は,モノマー密度行列データを保持してワーカプロセスからア クセス要求に応答することを専門とするストレージプロセス(storage group に属す る)と,計算を専門に行うワーカプロセス(いずれか ...

8

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

... データテーブルを開いた状態、メニューより、[分析] > [二変量関係] を選択します。列選択画面が表示されま すので、[X,説明変数] に名義尺度ある列 「性別」、[Y,目的変数] に連続尺度ある列 「体重」を選択します。 (図①) JMP では、左図ようにデータテーブルを作成します。(サンプル データ:「weight.jmp」) ...

6

高性能,高生産性を実現する 大規模メモリ・並列処理システムソフトウエアの研究

高性能,高生産性を実現する 大規模メモリ・並列処理システムソフトウエアの研究

... クラスタ向けTransactional Memory API検討 担当者: 飯田凌大,二間瀬悠希,小林龍之介,川口優樹,津邑公暁(名工大) 赤黒木による評価 K-Meansによる評価 逐次プログラムから 容易な変更記述可能, ...

10

並列処理の背景

並列処理の背景

... Kepler GK110 では、カーネルから別カーネルを起動することが、必要なストリー ムやイベントを生成したり、追加ワーク処理に必要な依存関係を管理することがホ スト CPU関与なしに実行できます。 GPU 上再帰的な実行パターンやデータ依存実行パターンを生成・最適化するこ ...

40

Hadoop とは 大規模なデータを並列分散処理を行うフレームワークを提供 Google による MapReduce および Google File System(GFS) の論文をベースに開発された Apache プロジェクトの OSS MapReduce MapReduce 分散処理フレームワー

Hadoop とは 大規模なデータを並列分散処理を行うフレームワークを提供 Google による MapReduce および Google File System(GFS) の論文をベースに開発された Apache プロジェクトの OSS MapReduce MapReduce 分散処理フレームワー

... ● 同じ中間 key に関連つけられた全て中間データが集められる ● 同じ中間 key を持つデータは全て同じ Reducer に渡される ● Reducer に渡される際には、Key-Value リストはそのKey順序ソートされる ● Reducer ...

39

Oracle Database 12cでのパラレル実行の基本

Oracle Database 12cでのパラレル実行の基本

... は、ブロックベースグラニュルとパーティションベースグラニュルどちら ほうが最適に実行できるか、SQL 文と並列度に基づいて判断します。ユーザーがこの動作に影響 を与えることはできません。 車を数える例は、通り片側、または長い通り 1 ...

30

目次 はじめにアーキテクチャの定義各アーキテクチャの長所と短所監視アーキテクチャの概要ツール配備場所とツール コストに関する影響システム ベース / 分散 GigaSMART 機能監視の詳細 : 実行する機能とネットワーク上での実行場所の推奨監視の詳細 : 主な検討事項ケース スタディ / 使用事例

目次 はじめにアーキテクチャの定義各アーキテクチャの長所と短所監視アーキテクチャの概要ツール配備場所とツール コストに関する影響システム ベース / 分散 GigaSMART 機能監視の詳細 : 実行する機能とネットワーク上での実行場所の推奨監視の詳細 : 主な検討事項ケース スタディ / 使用事例

... ॶشঝ؞॥५ॺ ツールは分散化し、ローカル・ネットワーク・インフラストラクチャ、 ローカル・データ・センターまたは分散コアに接続すべきだという意 見があります。多数ローカル・バックアップが存在することから、 障害観点は、この形態に明らかな利点があります。しかし、ネッ トワーク全体同じツールを多数購入し、運用し、管理する必要があ ...

11

HP ProLiant Gen8サーバーでのDDR3メモリの構成と使用

HP ProLiant Gen8サーバーでのDDR3メモリの構成と使用

... DIMM 種類が同じ場合、ランク数が多い方が負荷レイテンシが小さくなります。ランク数が多いほど、 メモリコントローラーメモリ要求並行処理を多く実行できます。これにより要求キューが短くなるので、レイテンシが小 さくなります。  CAS レイテンシ。CAS(Column Address Strob)レイテンシは DRAM ...

21

在必要性が高い多倍長整数のビット数は高々数千ビット程度である. そこで本論文では, 筆算に基づく O(n 2 ) 時間の乗算を並列計算に適した積表と名付けたデータ構造を用いて GPU 上で高速に並列実行する手法を提案する.FFT 乗算とちがって, 提案手法では乗数と被乗数のビット数が異なる場合に長い

在必要性が高い多倍長整数のビット数は高々数千ビット程度である. そこで本論文では, 筆算に基づく O(n 2 ) 時間の乗算を並列計算に適した積表と名付けたデータ構造を用いて GPU 上で高速に並列実行する手法を提案する.FFT 乗算とちがって, 提案手法では乗数と被乗数のビット数が異なる場合に長い

... 0 ことある.次に, 繰り上がり情報が 2 ある要素について,その 1 つ右が繰り上がりを示す 1 なら 2 を 1 に変え,0 な ら 2 を 0 に変える.2 が連続している部分がある際 には,図ようにその部分右端に処理をした後に 次々と左へ処理を繰り返していく.そして, 2 つ ...

8

Oracle WebLogic Serverでの分散トランザクションに対するLogging Last Resource最適化

Oracle WebLogic Serverでの分散トランザクションに対するLogging Last Resource最適化

... 1. はじめに トランザクション ( コミット や ロールバック ・コールによって区切 られた一連処理)は、クライアント・アプリケーションと次性 質を保証するトランザクション・リソース(データベースやメッセー ジング・システムなど)間 ACID コントラクトあると一般には 言われています。1)原子性:中断されたトランザクション(コミッ ...

6

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

目次 概要.. 3 演習 1: 静的 PARALLEL ヘルパークラスを使用した既存のアルゴリズムの並列化 6 タスク 1 実行時間の長いサービスを並列化する 6 演習 2: 並列タスクの作成と実行. 23 タスク 1 並列タスクを特別な設定なしに実行する 23 タスク 2 Wait() メソッドと

... 断されれば、他作業単位と並列実行するようにスケジュールが設定される、簡易作業単位 と考えることができます。 Task オブジェクトを作成したら、実行するロジックを含むデリゲートやラムダ ステートメ ントを、作成したオブジェクトに提供する必要があります。次に、Parallel Extensions ラ゗ブ ラリ中核となる TaskManager が、Task ...

47

冗長系逆運動学マップ計算の並列分散アーキテクチャ

冗長系逆運動学マップ計算の並列分散アーキテクチャ

... 拡散にかかる時間も格子数に比例して増大するため,計 算に膨大な時聞がかかる, 本研究では 3 冗長性を有するロボットに実用できる高 密度な非線形マップを並列分散方式で構成するための計 算アーキテクチャについて考察する ここでは,格子の疎分割と区域分割をおこない,実現 可能な台数のフ。ロセッサによる並列分散処理についての 設計と製作を行った結果を報告する 2. 2) 手[r] ...

6

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

講義の流れ 並列プログラムの概要 通常のプログラムと並列プログラムの違い 並列プログラム作成手段と並列計算機の構造 OpenMP による並列プログラム作成 処理を複数コアに分割して並列実行する方法 MPI による並列プログラム作成 ( 午後 ) プロセス間通信による並列処理 処理の分割 + データの

...  現在利用されているほとんど並列計算機には、MPIライブラリが実装されている。  MPI規格に準拠していれば、基本的に互換性は確保されている。  欠点1.並列プログラム作成が複雑  プロセス毎データ配置やプロセス間通信等を全て自分記述しないといけないた ...

68

並列分散ワークフロー処理システムの研究開発

並列分散ワークフロー処理システムの研究開発

... • 複数拠点クラスタを用いたワークフロー実行 • 適切なタスク配置により、拠点間ファイル転送を少なくする • 「エッジカット最小」となるグラフ分割問題を解くことにより、タスク をグループ化 ...

21

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

MATLAB® における並列・分散コンピューティング ~ Parallel Computing Toolbox™ & MATLAB Distributed Computing Server™ ~

... 13 まとめ HPC環境へのリモートアクセス シミュレーション時間の短縮 1回のシミュレーション 時間短縮 複数回のシミュレーション 時間短縮 開発はローカル、実行はサーバ 開発と実行、両方をサーバ  サーバ環境に MATLAB/Simulink を用意  MATLABライセンスはBYOL Cloud (Amazon EC2) On-premise Remote[r] ...

16

メモリの選択、外部メモリ・インタフェース・ハンドブック、Volume 2、第1章

メモリの選択、外部メモリ・インタフェース・ハンドブック、Volume 2、第1章

... Gbps メモリ帯域 幅を必要として、最小 1 つライトおよび 1 つリード動作を維持することが できなければなりません。これにより、ヘッダが変更された場合、より多く帯域 幅が必要です。メモリ帯域幅要件は、メモリ選択重要な因子です(表 ...

15

Show all 10000 documents...

関連した話題