• 検索結果がありません。

並列クィックソートと 並列クィックソートと

N/A
N/A
Protected

Academic year: 2021

シェア "並列クィックソートと 並列クィックソートと"

Copied!
14
0
0

読み込み中.... (全文を見る)

全文

(1)

キャッシュ付PRAM上の キャッシュ付PRAM上の

並列クィックソートと 並列クィックソートと

並列マージソート 並列マージソート

情報論理工学研究室 情報論理工学研究室

01-1-26-081

01-1-26-081

 桜打 純視  桜打 純視

(2)

あらまし あらまし

背景 背景

PRAM PRAM

(Parallel Random Access (Parallel Random Access Machine)

Machine)

キャッシュ付PRAM キャッシュ付PRAM

並列クィックソートと並列マージソート 並列クィックソートと並列マージソート

結果と考察 結果と考察

まとめ  まとめ 

(3)

並列計算機 並列計算機

高速に問題を解きたい 高速に問題を解きたい

より複雑な問題を解きたい より複雑な問題を解きたい

プロセッサ価格の低下 プロセッサ価格の低下

並列計算機の誕生

複数のプロセッサを持つ計算機

(4)

並列アルゴリズム 並列アルゴリズム

並列アルゴリズムとは 並列アルゴリズムとは

並列計算機上で動作するアルゴリズム 並列計算機上で動作するアルゴリズム

並列計算モデル上で設計・解析 並列計算モデル上で設計・解析

並列計算モデルとは 並列計算モデルとは

並列計算機を抽象化 並列計算機を抽象化

PRAM, BSP, PRAM, BSP,

メッシュ メッシュ

, ,

ハイパーキュー ハイパーキュー

ブ ブ

, etc…, etc…

(5)

PRAM PRAM

(Parallel Random Access (Parallel Random Access Machine)

Machine)

P1

・・・・・・・

共有メモリ 共有メモリ

P2 P3 Pp

P : プロセッサ

(6)

キャッシュ付PRAM キャッシュ付PRAM

P1

・・・・・・・

キャッシュ キャッシュ

共有メモリ 共有メモリ

P2

キャッシュ キャッシュ

P3

キャッシュ キャッシュ

Pp

キャッシュ キャッシュ

PRAMの拡張モデル

(7)

キャッシュサイズと通信遅延 キャッシュサイズと通信遅延

キャッシュ付PRAMのパラメタ キャッシュ付PRAMのパラメタ

cc : :

キャッシュサイズ キャッシュサイズ

dd : :

キャッシュ キャッシュ

--

共有メモリ間の通信遅延 共有メモリ間の通信遅延

共有メモリ上の連続した 共有メモリ上の連続した

c c

個のデータを 個のデータを       

      

時間でキ 時間でキ ャッシュに読み込める

ャッシュに読み込める

多くの計算機はキャッシュ付き 多くの計算機はキャッシュ付き

より現実に近いモデル より現実に近いモデル

(8)

並列クィックソート

並列クィックソート

(Parallel Quick (Parallel Quick Sort)

Sort)

基準値より小 基準値より大

P1

P1 P2

P1 P3 P2 P4

n 個のデータ

P1 P P3 P6 P2 P7 P4 P8

(9)

並列マージソート

並列マージソート

(Parallel Merge (Parallel Merge Sort)

Sort)

P1 P5 P3 P6 P2 P7 P4 P8

P1

P1 P2

P1 P3 P2 P4

(10)

シミュレートプログラム シミュレートプログラム

並列クィックソート 並列クィックソート

並列マージソート 並列マージソート

 キャッシュ付PRAM上での  キャッシュ付PRAM上での

 シミュレートプログラムを作成

 シミュレートプログラムを作成

(11)

実行結果 実行結果 ( ( 並列クィックソー 並列クィックソー ト ト ) )

キャッシュサイズ c

データ数 : 1024 プロセッサ数 : 128

(12)

実行結果 実行結果 ( ( 並列マージソート 並列マージソート ) )

キャッシュサイズ c

データ数 : 1024

マージソート クィックソート

(13)

結果と考察 結果と考察

両アルゴリズムとも 両アルゴリズムとも

通信遅延時間 通信遅延時間

: :

大 ⇒ 実行時間 大 ⇒ 実行時間

: :

大 大

キャッシュサイズ キャッシュサイズ

: :

大 ⇒ 実行時間 大 ⇒ 実行時間

: :

小 小

キャッシュサイズによる実行時間への影 キャッシュサイズによる実行時間への影 響 響

マージソート マージソート

> >

クィックソート クィックソート

マージソートは連続したデータを扱うた マージソートは連続したデータを扱うた めキャッシュを有効的に利用できる

めキャッシュを有効的に利用できる

(14)

まとめ まとめ

キャッシュ付PRAM上の動作のシミュレート キャッシュ付PRAM上の動作のシミュレート

並列クィックソートと並列マージソート 並列クィックソートと並列マージソート

両アルゴリズムとも 両アルゴリズムとも

通信遅延時間 通信遅延時間

: :

大 ⇒ 実行時間 大 ⇒ 実行時間

: :

大 大

キャッシュサイズ キャッシュサイズ

: :

大 ⇒ 実行時間 大 ⇒ 実行時間

: :

小 小

キャッシュサイズによる実行時間への影響 キャッシュサイズによる実行時間への影響

マージソート マージソート

> >

クィックソート クィックソート

キャッシュサイズ、通信遅延に応じて キャッシュサイズ、通信遅延に応じて

両アルゴリズムを使い分ける

両アルゴリズムを使い分ける

参照

関連したドキュメント

今回の解析でハイブリッド並列化手法による解析の並列化効率は、MPI

並列プログラムの実現方法 • 

抵抗の直列回路 抵抗の並列回路 電流 電流の 図 電圧 電圧の 図 • 抵抗 合成抵 抗の求

並列 B-tree は,完全一致検索だけでなくレンジ 検索が容易であるという B-tree が持つ性質の他 に,並列化により

Japan Advanced Institute of Science and Technology JAIST Repository https://dspace.jaist.ac.jp/ Title 超並列シミュレーションとビジュアライゼーション

本論文では,コンパイラ協調型 OSCAR チップマルチプロセッサ OSCAR CMP 上でのマルチ

はじめに Advanced Parallelizing CompilerAPC プロ ジェクトでは、逐次 Fortran プログラムから 様々なレベルの並列性を抽出し

概要:本稿では,ポストペタスケール計算機環境のための階層型プログラミング環境およびプログラミング ツールである FP2C