プライマリサイト内の要素プロセッサが故障した場合に、残りの無故障プロセッサを再 構成しない場合について考察する.
通常の並列計算機は、構成要素の一つが故障しても実行に失敗することから、直列系の システムである.従ってnプロセッサから成るシステムの信頼度Rsite(n)は、要素プロセッ サの信頼度ri
(i=1;...;n)に対して一般に
R
site (n)=
n
Y
i=1 r
i
となる.
プライマリサイト/バックアップサイトから成るシステムはバックアップがホットスタン バイのシステムであり、切替え確率を1とみなせば並列系のシステムと考えることができ る.よって不信頼度が各サイトの不信頼度の積となる.バックアップk個のk-Resilientシ ステムでは、各サイトの不信頼度(Fsite
i
(i =0;...;k)、site0はプライマリサイト)に対し て、次のように表される.
F
system (k)=
k
Y
i=0 F
site
i
従って信頼度は、次で計算される.
R
sy stem
(k) = 10 k
Y
i=0 (10R
sitei )
ここで要素プロセッサの故障率を一定とし、信頼度が指数分布に従うとする.すなわち
r
i
(t)=e 0
i
tとすると次を得る.
R
site
(n;t) = e 0
P
n
i=1
i t
MTTF
site
(n) = Z
1
0 R
site
(t)dt= 1
P
n
i=1
i
各プロセッサの信頼度が均質(8i; ri
(t)=e 0t
)であるとすれば、nプロセッサから成るサ イトは次のように1プロセッサの1/n のMTTFになる.
R
site
(n;t) = e 0nt
MTTF
site
(n) = 1
n
すべてのサイトが均質な信頼度(e0t)のプロセッサで、同じプロセッサ数(n)から構成 されるとき、システムの信頼度は次のようになる(付録A.1参照).
R
system
(k;t) = 10(10e 0nt
) k +1
=e 0nt
k
X
i=0 (10e
0nt
) i
MTTF
sy stem
(k) = Z
1
0 R
system
(k;t)dt= 1
n k
X
i=0 1
i+1
従ってk-ResilientシステムのMTTFは、1サイトのMTTFのPk
i=0 1
i+1
倍になる.一般 に次の関係があることから、MTTFはサイト数kに関するlogオーダーで増加することが 分かる.
k>0; log (k+2)<
k
X
i=0 1
i+1
<1+log (k+1)
またシステムの処理能力はサイトを構成するプロセッサ数nであり、サイト数k+1でコ ストは (k+1)n となるので次を得る.
MTTF
非再構成=
1
n k
X
i=0 1
i+1
システム処理能力非再構成=Un システム有効度非再構成= U
k
X
i=0 1
i+1
コスト有効度非再構成= U
n(k+1) k
X
i=0 1
i+1
サイトを構成するプロセッサ数がnでk+1サイトから成るシステムであるため、システ ム全体のプロセッサ数は(k+1)nである.よって、この同じシステムを耐故障を考慮しな い通常の並列計算機として見ると、n(k+1)台構成の並列計算機であるから次の値を得る.
MTTF
非耐故障=
1
n(k+1)
システム処理能力非耐故障=Un(k+1) システム有効度非耐故障 = U
コスト有効度非耐故障= U
n(k+1)
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
1 2 3 4 5 6 7 8 9 10
Effectivity Ratio
Resiliency log(k+2)/(k+1)
(1+log(k+1))/(k+1)
図5.1: 非再構成系の有効度増加率 対 処理能力減少率
従って耐故障ソフトウェアとすることで、システム有効度、コスト有効度ともPki=0 1
i+1
倍となる.ただし、システム処理能力は 1
k +1
倍である.処理能力減少率k+1に対する有 効度増加率Pki=0
1
i+1
は、有効度増加率がlog (k+2)<Pki=0 1
i+1
<1+log (k+1)のように
logで押えられることから、図5.1のようなグラフの間の値をとる.kに対する有効度の増 加に比較して、システム処理能力の低下は急激であるので、並列計算機の処理能力の高さ を保持したまま有効度を高くしたいと考えれば、kはあまり大きくできない.