• 検索結果がありません。

P  n / g  n / P ≤ B  P  n B / g  n / P  B  O ⌈ n / BP ⌉∗ g P  n / P  L  研究内容 ・ α ∗ α ・ α ∗ β ・ α ∗ γ ・ β ∗ β = n ∗ n / P = n / P ∗ nγ α = n / P ∗ n / Pβ    モデル上での行列積アルゴリズム 166 BSP*

N/A
N/A
Protected

Academic year: 2021

シェア "P  n / g  n / P ≤ B  P  n B / g  n / P  B  O ⌈ n / BP ⌉∗ g P  n / P  L  研究内容 ・ α ∗ α ・ α ∗ β ・ α ∗ γ ・ β ∗ β = n ∗ n / P = n / P ∗ nγ α = n / P ∗ n / Pβ    モデル上での行列積アルゴリズム 166 BSP*"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

166   BSP*モデル上での行列積アルゴリズム

情報論理工学研究所 山田 直人 

1. 序 論

 本研究では、BSP*(Bulk¡SynchronousP arallel)上で効 率の良い並列アルゴリズムを設計するために、各プロ セッサへの最適となるデータの割り当て方を求める。

 BSP*モデルは、代表的は非同期式計算モデルであ BSPモデルの拡張モデルであり、通信計算量にパ ケットの概念が取り入れられている。今日のTCP/IP 通信ではパケット通信が主に行われており、BSP*モ デルは現実のネットワークに近いモデルとして注目 されている。

2. 研究内容

BSPモデルは以下の要素から成る。

・局所メモリを持つ複数のプロセッサ

・プロセッサ間ネットワーク

・バリア同期機構

BSPモデルは以下のパラメタを持つ。

・プロセッサの台数:P

・同期周期:L

・通信路帯域幅:g

BSP*モデルは、上記のパラメタに加えて以下のパラメ タをもつ

・パケットサイズ:B

本研究ではn*n行列の積C=A*Bに最適なBSP*モデ ル上の並列アルゴリズムを設計する。行列積を求める 並列アルゴリズムでは、入力行列ABおよび出力行列 CP個の部分行列に分割され、各プロセッサに割り 当てられる。本研究では、分割の仕方を検証すること により、最適となる分割パターンを求める。分割パタ ーンは図1に示す3通りが考えられる。

   (α)       (β)       (γ)     図1:各プロセッサへの割り当て方

このとき各プロセッサに割り当てられる部分行列の サイズは、

α=n/2 P∗n/2 P β=n/P∗n γ=n∗n/P

の式で表される。この時、βγは向きが異なるだけで あり、行列Cにおいては通信量に影響しないため、 α β2通りについて考えればよい。A*Bについては

α∗α α∗β α∗γ β∗β

β∗α β∗γ γ∗α γ∗β γ∗γ 以上の9通りが考えられる。よって、C=A*Bについて 18通りについて考えればよい。

3. 結果

18のパターンのうち、α=α*αのデータの割り当て方が 最適であり、そのときのBSP*モデル上での行列積の計 算量は、

  O⌈n2/BP⌉∗g2 Pn3/PL

となる。最適となるプロセッサの台数は以下の条件と なる。

   Pn2B2/g2 n2/PB

  Pn2/3 g2 n2/P≤B

4. 結論

本研究では、BSP*モデル上で効率の良い行列積を求 める並列アルゴリズムを設計するためにプロセッサへ の最適なデータの割り当て方を求めた。

本研究より、各部分行列が正方行列になるように各プ ロセッサへデータの分割を行った場合に最適となるこ とが示された。

5. 参考文献

 1) L.G.Valiant, ”A Bridging Model for Parallel Computation,

”, Communications of the ACM, Vol.33, No.8, pp.103–111, 1990.

(2)

参照

関連したドキュメント

7 に包埋されたスペイン風邪の犠牲者の組織中に残っていたウィルスの遺伝情報 の解読を始めた。最初に

行列の数値的同時ブロック対角化アルゴリズム 前原 貴憲([email protected]) 国立情報学研究所 JST,

逆行列の使い方と掃き出し法による逆行列の求め方を説明しましたが、一般的には、余因

そこで,OpenATI_DSRMV

次の 2 次形式をベクトル と実対称行列 を用いて の表現に変換することができる。この とき行列

PRAM(Parallel Random Access Machine)1) と異なり並 列アルゴリズムの通信および同期にかかるコストを考慮し たモデルである。このため、

しかし、従来の PRAM のアルゴリズムは通信や同期が 考慮されていないため、これを BSP モデル上で実行させ

共有メモリ (Shared Memory) とそれに接続された複数のプロセッサから成る 並列計算機を共有メモリ型並列計算機 (Shared Memory Parallel Computer) と 呼ぶ。