マルチプロセッサでの実行見積り

DCPDCP DCP

9.2 実行オーバーヘッドの見積り

9.2.2 マルチプロセッサでの実行見積り

PSG、^BSGが複数プロセッサから構成される場合の耐故障プログラムの実行効率を見積もる．耐故障化する前のプログラムを、同じプロセッサ数からなるマルチプロセッサ上で実行した場合との処理時間の比較によって実行効率を表す．

ここで、

N : PSGを構成する要素プロセッサ数

O : 単一プロセッサで実行する際の元のプログラムの仕事量

F : 単一プロセッサで実行する際の耐故障プログラムの仕事量

PSG/BSGのコミュニケーションも含む．

とする．

アムダールの法則によれば、^Oの並列化可能部分率^pとして、^N台で並列実行する場合には最大負荷のプロセッサの仕事量が^{pO =N}^+(10p)Oになる^[20]．しかしこの値にはプロセッサ間の通信は考慮されていない．^N分割することによって他のプロセッサ上へ分散されたプロセスとプロセッサ間コミュニケーションが必要な場合、プロセッサ内の単位処理時間を^R、プロセッサ間メッセージ処理時間^M、メッセージ数^mとするとき、負荷バランスが均衡したとして並列実行による処理時間は、通信遅延を無視して^(pO=N+(10p)O)R+mM (N >1)

となる．よって並列処理をして意味がある、すなわち効果が得られるためには、

(pO =N +(10p)O)R+mM

であることが必要十分である．これから、⁰^N^mM ^<^(N ⁰^1)pOR を得る．

+10p+ mM

O R

0(10p)(10 1

N )

<p(10 1

N )

0 mM

O R

p(N01)

すなわち^Nが十分大きいとすれば、^mM=OR^<^p¹より、プロセッサあたりのメッセージ処理時間^mMは、単一プロセッサでの処理時間^OR すなわちマルチプロセッサシステム全体で処理しようとする仕事の単体での処理時間よりも小さくなければならない．

ここで改めて

R : 平均リダクション処理時間

M : 平均メッセージ処理時間

m : Oを並列化することで生じるメッセージ数とすると、

nor mal

+(10p)

OR+mM

が並列化した元のプログラムの実行時間である．

元のプログラム自身のコミュニケーション量は耐故障化しても変わらないものとし、また仕事の分散とともに、^PSG/BSGのコミュニケーションも分散されるとする．よって、耐故障プログラムの実行時間は、上と同様に

fts

+(10p)

FR+mM

となる．ここで、

: 耐故障化によって増える仕事量比率（^F ⁼²^O ）

: 潜在するコミュニケーション量の元のプログラムに対する比率（^m⁼²^O）

: メッセージ処理とリダクション処理の処理時間比（^M ⁼²^R）とすると、処理時間比は、

fts

nor mal

+(10p)

FR+mM

+(10p)

OR+mM

(p+(10p)N)+N

となる．

並列プログラムは本質的に並列性が高いものと考えて、並列化部分率を ^p ^' ¹として、

2を^x軸にとって、 ⁼ ¹⁰固定で^N ⁼¹⁰〜¹⁰⁰⁰⁰の場合をプロットしたのが図^9.3である．すなわち、耐故障化することでユーザプログラムは単体で¹⁰倍の仕事量に増えた

として、¹⁰台から¹⁰⁰⁰⁰台規模のプロセッサで耐故障実行させた場合に相当する．なお並

列プログラムが意味を持つ条件 ⁰ ^N^mM ^<^(N ⁰^{1)pO R} は、 ^N

N01

<p 1であるので、⁰ ¹の範囲だけ意味を持つ．ここで⁽⁼ ^mM

)は、並列化することで生じる

メッセージの処理時間とプログラムを単体プロセッサで逐次実行した場合の処理時間の比である．

これを見ると、システム規模が大きくなるほどは任意にとっても、性能低下しない．

システム規模が¹⁰⁰台程度であれば^0:1^< ¹でなければ²倍以上の実行時間となってしまう．従って本方式は大規模並列計算機であるほど有効であり、その性能は、メッセージ量とその処理時間、プロセッサ内の処理量と処理時間の比に依存する．

1 2 3 4 5 6 7 8 9 10

0.001 0.01 0.1 0.2 0.5 1

Performance Ratio of FTP to Original

beta * gamma

The Estimated Overhead on MPP

10 PE 100 PE 1000 PE 10000 PE

図^9.3: マルチプロセッサでの推定オーバーヘッド^(p⁼¹⁾

図^9.3のグラフは並列化部分率^p⁼¹として得たものだが、一般には^p^<¹であり、その値に応じて図のような曲線を描く．なおこのとき、でのみ、並列プログラ

ムとして意味がある．これを見ると、並列度が低い^(p^<< ¹⁾プログラムの場合、も小さくなり、急激に処理時間比が悪化することが分かる．図^9.3(p ⁼¹⁾の ⁼^0:01のように^1000PEで²倍程度であったはずの処理時間比も、^p⁼⁹になると⁹倍程度になる．^pが

1に近いところの変化を見るために、図^9.4を^0:99^p ^1;^0:01 ^0:1の範囲で、

軸を対数軸としてグラフを描き直したものが図^9.5である．これを見ても並列度がかなり高く^(p^! ¹⁾ないと、性能を向上が期待できないことが分かる．メッセージ処理効率が上昇するか、あるいはメッセージ数が減少して処理時間^mMが小さいプログラムの場合には、

が減少することから、やはりプログラムの並列性の高さがより支配的になる．これはサイトを構成するプロセッサ数が大きくなるほど顕著である．

The Ideal Overhead on MPP (alpha = 10)

10000 PE

0.1

0.5 0.9 1 0.1

0.5 1 1

5 6 7 8 9 10

p

beta * gamma 1000 PE

100 PE 10 PE

Performance Ration of FTP to Original

図 ^9.4: マルチプロセッサでの推定オーバーヘッド ^(0:1^<^p^<¹⁾

ドキュメント内 JAIST Repository (ページ 85-88)

DCPDCP DCP

9.2 実行オーバーヘッド の見積り

9.2.2 マルチプロセッサでの実行見積り

1 2 3 4 5 6 7 8 9 10

0.001 0.01 0.1 0.2 0.5 1

Performance Ratio of FTP to Original

beta * gamma

The Estimated Overhead on MPP

10 PE 100 PE 1000 PE 10000 PE

The Ideal Overhead on MPP (alpha = 10)

10000 PE

0.1

0.5

0.9 1 0.1

0.5

1 1

5 6 7 8 9 10

p

beta * gamma 1000 PE

100 PE 10 PE

Performance Ration of FTP to Original

9.2 実行オーバーヘッドの見積り