協調バックグラウンドタスクスペースに関する検討

(1)

「マルチメディア通信と分散処理ワークショップJ平成12年12月

協調バックグラウンド

タスクスペースに関する検討

山口実靖務

相田仁川

斉藤忠夫・

本東京大学大学院工学系研究科

料東京大学大学院新領域創成科学研究科

干

1

3

・

8

6

5

6 東京都文京区本郷

7 -

3

・

1 {

s

創

l

e

，

a

i

d

a

，

s

a

i

t

o}

@

s

a

i

l

.

t

.

u

-

も

o

k

y

o

.

a

c

.

j

p

，，，，

とル用機立ムはで

C

いパ想ン研さ処ふ定の計さにの究開 r 使算をあのら

P

て一をコ本・はな安どの慮ら究研

m

o

計スで ( か祇しサ境ル喝的異りな用考れ研 -( 勾セ的札る算定の環パる

.

u

目くあ

x

人くこ本

腕川崎.引か棚引匙⋮川崎明サト射口一日立日明時、丸一切

職

ゆ

れ

も

賊

一

程

品

川

ω

払京間

m

M

A

M

山明矧品部訳ぬ搬

m

M

ぷ

悦

二

以

スが脱環

'

h

規

m u

の

J こ本れ即効一境んず J 川住 ' たタま大

- m

て台デ削は考境さ酎る慌て丞束、ンら

γ

新加つス超

N

し数モ日間司と環定

2

す悲しを飾ロ土。信参整ラ・や ' 定十び共 ' るた安の案の分テて ' まのらクるとリ想ら

P

の

5

あし不下提究一批

m M U

ヘしる杭へ E ンなこ川町もか

R

源久で定る以を研

r

i

己は理あ原ム削ヨ異い・

n

と台は資乱用安よこム

ザ間間帯均一れ硝好明づ

U

G

m

げ鰍

ω

一一山崎枇机・中山げふに既介究資ののすシ記テ吠てらィ博凶実聞でさそい川シあ章、，紹研算もる成の上スカしおテ言

N

(

C

境続びな稿たで本 i v の本計のげ構ザ・ク境定て一は ' 容の環接及い刺し性違

g

るそ上 ) 一る一環想しユでに内記た時機てョ化規の

- m

す群ち付ユあワるを定ピ究ら弘下し常算れ特新

N

E

U

はもこみ

W

ド場るれに的一後川町てを戸と機・のやンのいわ業効ワ以恥いク勧前算るとルタこて思作有は

H A

J

用ス割以計いこ一スっとのをと場川をタ附 1 用てるメの

i

かいル源業消ク源の一時ぷ人れけ子ど叫か多カ資作時ス資ドいら個さ受電な刊がも一一算の出タのンタさず続をり算パ荷間口計ル悶

G

態ウ川町・ら接スお計一日負時 j るカ対

T

状ラ l b -る限にピて表 . をいるしあ一た ι レグ城いにク一れや城高あ定にロいそドク郁て機一サさサ巾にに想態用クイ十倒れ算ワは続 y ゎ常態を制みをスアパク計トく接セ滑は状況ルすどタはの J J 続のツ多にロ

t

機荷状ド案なのとこ小接用ネのクプ同算負のイ提算ド用後 T にパ問機一ドと計パらアを割、刈岬 / ト一時算ワ一機用品れ ' 法表ウ刻

υ

不ツサ長計トワ算人 ' こに手やラ的理めかネはは用ツは計個くはず " サグ効処じ機一年い人ネ外ののなできるツア有な

t

草タ近る個に以ンらは稿出すセォ ' 的じ附ンりあの的う一れで本を用ロフりチ - E イな時ら目使ロこけ・害活プのあツーや異常れををア合わる弊にドこでパ

概要

近年，個人用計算機も含め非常に多くの計算機がネットワークに接続されるようになった.さらに，個人用計算機はユーザが使用していない時間は負荷がほとんどなく非常に多くの計算機資源がアイドル状況にあることになる. 本稿ではこれらのネットワークにつながれたアイドル状況にある計算資源を協調させてパックグラウンドタスクとしてパッチ型の処理の実行をさせ活用する手法について述べる.特に， (1)パックグラウンドで動かすタスクがローカルのタスクの作業を可能な限り妨げないう

(

2 )

協調システムの一部に障害が発生してもシステム全体がダウンしない高い耐障害性がある，の

2

目標を重要と考えこれらに特化した手法を提案する. 提案手法により，ユーザがローカルの処理のために計算機を使う要求が発生したときにパックグラウンドのタスクを他の計算機に移送しローカJレのタスクに影響を与えないことや，協調システムに参加しているユーザが突然システムから切断したりするなの陣害が発生しても正しく処理を続けることが可能なフォルトトレラントな環境が実現される. 提案システムはパックグラウンドのタスクに

Watch Dog

タイマーを設定する，多重化するなどをして疎なつながりの計算資源群の信頼性を上げT トークンパッシングを行い障害の検出をしている.また，簡単な試作システムを実装し動作させ検証したところ，その有効性が確かめられた. “

BG

タスク"と呼ぷ)を行うことを目指す.そしてこれらの計算機群で連携を行いアイドル状態の計算資源を提供しあうことにより全体でパッチ的な処理を行うことが可能となる.これはユーザにとっては自分の重要な“

FG

タスク"に弊害を出すこと無しに他人の計算機のアイドル状況の資源を用いて“

BG

タスク"を行うことが可能となることを意味している.また，今後はユーピキタスコンビューテイングが実現されていき家電等の資源を利用することも可能となり，これらを有効的に活用するのにも役に立つ思われる. 本稿では第2章において関連研究と本研究の新規性を示し，第3章において提案手法を示し，第4章において提案手法を評価しT第

5

章においてまとめと今後の課題を示す.

2 A

r

c

h

i

t

e

c

t

u

r

e

o

f

a

Condor Pool

図

1 :Condor A

r

c

h

i

t

.

e

c

t

u

r

e

(

1 )

“

BG

タスク"が“

FG

タスク"の作業を可能な限り妨げない

(

2 )

協調システムの一部に障害が発生してもシステム全体がダウンしない高い耐陣害性があるまず，

(

1 )

は“アイドル状況の資源も有効利用"することを目指し本来の作業に支障を来しては無意味と考え本稿の重要課題とする.次に

(

2 )

は協調システムの参加者は “

FG

タスク"のために“

BG

タスク"を容易に停止すること.参加計算機はサーバ専用計算機としての参加ではなくアイドル状態の資源の供給のために参加しているに過ぎないことなどから低品質の計算資源になることは避けられないと考え重要課題とした. さらに，

(

3 )

協調システムにユーザ認証機構があり認証ユーザレベルでの資源割り当てが可能である，

(

4 )

動的な環境における適切な資源割当が可能である，も実現が推奨されると考える.

甘

口

斥

B

誹忽叫...・H・

国

富

国

C

.~.e~!!!?~t... D.~!;忠!?~t...・H・...・.，.・M・-

C

コ試

図

.

2 :

提案システムの概要図

3 :

提案システムの構造から情報を集めアイドル計算機を発見し，その計算機とマッチするジョプを見つける. ジョプが投入されると以下の手順により実行される.

(

1 )

ジョプ

J

が計算機に投入される，

(2)CM

がアイドル計算機を発見し，その計算機にマッチするジョプとしてジョプ

J

を採用する，

(

3 )

その計算機でジョプ

J

が実行される，プール内の計算機はアーキテクチャ，

08

，メモリ量，

CPU

能力などの情報を持ち，投入されたジョブは実行アーキテクチャ.必要メモリなどの情報を持つ.こ

2 .

1 High Throughput Computing

れらの情報をもとに計算機とジョプのマッチが決定され

Condor W

i

s

c

o

n

s

i

n

大学のコンビュータ科学学部によっる計算機ユーザが作業を再開し

Condor

に対する計算て開発された

Condor

は不使用状態にあり有意義に使用されていない

CPU

資源を有効利用するためのシステム資源の解放を停止したときは，これらのプロセスは他のでありヲ基本的にワークステーシヨンクラスタ上で動作実行計算機に移動させられる

[

7

，

8

1

・する.

Condor

で述べる

HighThroughput C

o

m

p

l

t

i

n

g

とはF長期的期間で見た場合での高い計算能力のことで

3 提案手法

ある

[

6

1 .

コンドルシステムはコンドルプールで管理され.図提案するシステムの概要は図

2

に示される.すなわ 1の構造をしている. クラスタ上の個人用計算機の状況ちヲユーザが席を外し計算機がアイドル状態になる(図を肢視するために“

m

a

s

t

e

r

ヘ“

s

c

h

e

d

"

・“

s

t

a

r

t

.

d

"

の

3

種

2

の

A)

と，ネットワークによりそのアイドル計算機にタ類のコンドルデーモンが常止稼働している. “

m

a

s

t

e

r

"

スクが投入される(図

2

の

B

)

.

ユーザが席に戻るまでのは他のコンドルデーモンが稼働しているかを確認し陣聞は他から投入されたタスクを処理しi焼ける(図

2

の

C

)

.

害が発見されたらデーモンを再起動する. “

s

c

h

e

d

;

'

はユーザが席に戻ると(図

2

の

D)

これらのタスクはユーザ要求されたジョブを管理し.“

s

t

a

r

t

d

"

はジョプを投入可の作業の妨げとなるので他の計算機に移送する(図

2

の能なアイドル状況の計算機の発見やユーザが戻り計算機

E

)

.

がアイドル状況でなくなったことの検知を行う. 提案手法は図 3の構造をしている.すなわち，各計算システムには

Cent

，

r

a

lManage

l'(以下

C

I

V

I

)

計算機が機には“

FG

タスク"(図

3

の“

n

o

r

m

a

lp

r

o

c

e

s

っと，提案存在し全資源と全ジョプを管理している.システム内する協調システムのための“

BG

タスク"の実行環境(図の全“日孔l'

t

d

"

および全“

s

c

h

e

d

"

は

C M

上の“

C

o

l

e

c

t

.

o

r

"3

の“

ane

l

e

m

e

n

.

t

o

f

a

“

d

i

s

叫t.r廿凶;♂'，

r

尚

i

'I というデ一モンにプ一ル内の情報("“

s

討

t

.

訓

a

制

r

t

d

"

は百計十算機の夕スクスペ}ス"と呼ぷ)が存在する. 前述のように各アイドル状況，“、

s

c

h

e

吋

dd

ぽj"は投入されたジヨプの状況)を計算機の“

BG

夕スクスペ一ス"同士は協調動作しう全体伝える. そして“

N

a

g

o

ωt

.

i

也

a

t

ω

o

r

"

が定期的に“

C

o

l

e

け'，

o

r

"

として一つのプラットフオームを実現する.ローカルの

(3)

I B G

n

n'¥ I Task 11 -1 Space 11

a

>

図

8 :

“

BG

タスクスベー ① 図

4 :

最初の“

BG

タスク図

5 :

最初でない“

BG

タス"の調査図

6 :

最後でない“

BG

タスクスペース"のクローズスクスペース"のオープン ① ② 図

7 :

最後の“

BG

タスクスペース"のクローズ

08

は“

FG

タスク"と“

BG

タスクスペース"を同等に扱うため、“

BG

タスク"のために

CPU

やネットワークなとeの資源を予約することはできず，必然的に“

BG

タスクスペース"の環境は変化が多く不安定となる. 本手法の実行手順を以下の第

3 .

1

節ヲ第

3 .

2

節で述べる.

3 .

1 B G

タスクスペース

“

BG

タスクスペース"は“

BG

タスク"の実行環境である.クライアントは“

BG

タスクスペース"に対・してタスクを投入することが可能であり，必要ならば処理結果を受けとることが可能である.

"BG

タスクスペース"のオープンの手順を述べる.協調システムで最初の“

BG

タスクスペース"をオープンするときは図

4

の様に①“

BG

タスクスペース"を作成する， ②“

BG

タスクスペース"リストを作成し自分の登録する，となる.新しい“

BG

タスクスペース"をオープンし既存の協調システムに参加する場合は図

5

の様に①“

BG

タスクスペース"を作成する，@システム内のいずれかの“

BG

タスクスペース"に現在の“

BG

タスクスペース"のリストを要求する，①リストを獲得する，@新規加入を全スペースにアナウンスする，@各スペースは保持しているリストを更新する，となる. 次に、“

BG

タスクスペース"のクローズの手順を述べる.最後でない“

BG

タスクスペース"をクローズするときは図6の様に①処理中の“

BG

タスク"を他の“

BG

タスクスペース"に転送する，①スペースを閉じることを他の金スペースにアナウンスする，①各スペースは保持しているリストを更新するt①スペースを閉じる，となる.最後の“

BG

タスクスペース"をクローズするときは図

7

の様に①処理中の“

BG

タスク"を不揮発メモリにス図

1

0 :

陣害スペースの隣接スペースが検出図

1

1 :

トークンのタイムアウトによる検出トアするか破棄する，①スペースを閉じる，となる. また、“

BG

タスクスペース"に起きた障害を検出するために図8の様に常にトークンパッシング方式でトークンを交換する.ある“

BG

タスクスペース"に障害が発生したときは図

9

の様に①隣接“

BG

タスクスペース"との通信に失敗したーあるいは②トークンがタイムアウト時間までに送られてこない，ことにより検出が可能となる. 前者(隣接スペース)の場合は以下の手続きにより復旧する(図

1

0

参照).①障害を検出，@その障害を全スペースにアナウンス，@各スペースはリストを更新する， @トークンを次の次のスペースに転送する，後者(トークンのタイムアウト)の場合は以下の手続きにより復旧する(図

1

参照)・ ①タイムアウトにより障害を検出する，②全スペースと交信を試みる，③現在の障害状況が確認される，

0

最新のスペースリストを全スペースにアナウンスする，@新しい

10

のトークンを作成しそれを隣接ノードに送る，新しいトークンを作成する事によりトークンが複数存在してしまう可能性があるので最新トークン以外は破棄する必要がある.スペース問で同じトークン

10

を割り振らないためにはトークン

10

に

BG

タスクスペース

10

を含ませればよい. また，等しい新しさのトークンは

BG

タスクスペース

lD

で順序付けが可能となる. ネーミングサーバを用いて“

BG

タスクスペース"を管理しない理由はネーミングサーバは停止することが許されず常に稼働かつ接続されている計算機が必要であり，自由に参加/脱退が可能であるという利点が失われるからである.

3 .

2 “

B G

タスク"の処理

本節では“

BG

タスク"の処理について述べる. システムに対する“

BG

タスク"の要求は以下の様に

(4)

囲

圏園

図

1

2 :

“

BG

タスク"の投入

園

囲

園

固

因

図

1

3 :

“

BG

タスク"の処理行う(図

1

2

参照).①クライアントが“

BG

タスク"要求をいずれかの“

BG

タスクスペース"に送信する，①その “

BG

タスク"のための

Wa

.

t

c

hDog

タイマーを

1

つ以上起動する，①その“

BG

タスク"を

1

ヶ所以上の“

BG

タスクスペース"で開始する，

¥

V

a

.

t

c

h

Dog

タイマーはその “

BG

タスク"の処理に発生した陣害を検出するためのものであり，要求された“

BG

タスク"のコピーを保持している. “

BG

タスク"を起動するよりも先に

W

a

t

c

hDog

タイマーを起動することにより，①までの処理が成功すれば全“

BG

タスク"の処理と全

W

a

t

c

hDog

タイマーが停止しない限り処理を正常に終わらせることが可能である.“

BG

タスク"処理中は定期的に

W

a

t

c

hDog

タイマーをリセットする(図

1

3

参照). タスクの移送は以下の様に行う(図

1

4

参照).①“

BG

タスク"の移送要求が発生する=①新しい

W

a

t

c

hDog

タイマーを起動する，①古い

¥

V

a

t

.

c

hDog

タイマーを停止図

1

4 :

“

BG

タスク"の移送図

1

5 :

“

BG

タスク"の終了図

1

6 :Wa

t

.

c

h

Dog

タイマーのタイムアウトするー@別の“

BG

タスクスペース"に“

BG

タスク"を移動する。同様にして①までの処理が成功すれば金“

BG

タスク"の処理と全

Wa

t

.

c

hDog

タイマーが停止しない限り処理を正常に終わらせることが可能である. タスクの終了処理は以下の械に行う(図

1

5

参照).①“

BG

タスク"が終了する，①“

BG

タスク"の処理結果を結果格納ストレージに格納するなどのその“

BG

タスク"に定められた終了処理を行う，③

W

a

t

c

hDog

タイマーを停止する，@結果格納ストレージに納められている結果は有限時間で削除される，

W

a

t

c

h

Dog

タイマーを停止する前にストレージへの格納を試みているため， (全

W

a

t

c

h

Dog

タイマーに障害が発生しない限り)冗長に複数回実行され複数回ストレージに伝えられることがあっても，処理の格納がされないまま処理が停止してしまうことはない. 障害が発生したときは

W

a

t

c

hDog

タイマーにより障害が検出される(図

1

6

参照).①障害が発生しその“

BG

タスク"を処理している“

BG

タスクスペース"がなくなる，②

W

a

t

d

lDog

タイマーがタイムアウトし障害を検出する，

@Wat.chDog

タイマーが再実行のための

W

a

t

c

h

Dog

タイマーを起動する，@古い

W

a

t

c

hDog

タイマーを停止する，@別の“

BG

タスクスペース"に再度“

BG

タスク"を要求する，前述のように

W

a

t

c

hDog

タイマーは“

BG

タスク"の要求のコピーを保持している. 古い

W

a

t

c

h

Dog

タイマーを停止する前に新しい

W

a

t

c

hDog

タイマーを起動しているため，処理が重複実行されてしまう可能性があるが，処理が障害により停止してしまう危険性は低くなる.

W

a

t

c

h

Dog

タイマーのタイムアウト時間を異なる億にしておくことにより重複実行の可能性を軽減できる.

(5)

川るがるス要重はれスと方すタ必多でわ一くの動

G

がが法行ベ短と起官方方手くスをこに 4 のの案しク隔る先に理一提正るス問とをら処マーでえタト一氏 } さのイてま言

G

ン短マ一ターと叱宮イをイトマ

g

ょこル ι ポ隔タ之イ恥・るなるク間

5

え

V

E

る

F

れい y ト旬、言け市あ伽わて L ウ

Dt

同前で強失

1

チア市い

E

W

能剖は部¥ム-U 鳴

d

司 ? 司ベ

ρ

多いいイ

W

M

くかマス

をよタ﹁性明﹄ d l y w ‘ J I D / い ' ばて M 頼 7AY こ

v

;

U

れし匂信けがるい J v k l u け較るり忠源す

h

勺ーな比あよ凡一資くの以しとでが刈る高・仙そ引止と易法刊すを叫ぱに停こ容方クと度

W

れの刊はスはの上杭 ⋮ UMJ 肝タ

H

F

スま間州いタ引

i

M 吻判関斗料品 μ ザ -“

t

らゲ一七{に放え

ス

ユ

・

i

か解考聾いわやかやのが

舛

t

間る速源去伺明夜釘⋮古一間ヘ二、・り創る則 "川山口割と渇り

ク

ぅ

右

を

カ

"

ょ・つるスこ刊源す要クふな資自必スタべまこ ! るタ市訪山口開け関川_- _- _a 崎船灯時一腕引

3

第新氾 m w 阪一蹴

3

作句ク資川町

3 .

4 .

1 Watch Dog

タイマー

WatchDog

タイマーは正しく終了されるか分からな

ィ

J

?

T

5

3

2 ;

2

2 て

も

明

;

:

す

む

よ

J

日

2

い処理を行う前に起動するタイマーであり?タイムアウあるがこれは“BGタスク"終了時にクライアントと交信ト前に処理の終了に成功した場合はタイマーは止められできる状態にない場合は実現できない.そこでB結果のるがヲ逆にタイマーがタイムアウト時間までに止められ通知の方法としてストレージに格納しておきクライアンなかった場合は処理の終了に失敗したことが検出される_， .f.fトがのちに読み込む方法を提案した. 図6，図7の様な処理が行われずに“BGタスクスペース"治まf¥FT4の予めの多重化，前述の障害による羽Ta

.

t

c

h

終了したときはその“BGタスクスペース"上で行われて 2 、

Dog

タイマーの冗長動作によりストレージサーバは複数いた“BGタスク"が処理要求ごと失われてしまう2 個の結果を受け取るーとがあるが最初に得られた結果をれを避けるために

WatchDog

タイマーを導入した.さ採用すればよい#¥A.'0I' -らに，提案方式では

WatchDog

タイマーに“BGタスク"の処理内容のコピーが登録されている.これにより，障害の検出をすると同時に再実行が可能である. まに

4 評価

障害を検出したが再実行処理を依頼する“BGタスクスペース"がダウンしており再実行が行えないことも避け

4 .

1 分散協調のトレードオフに関する考察

ることができる. 提案方式では必ず処理を始める前に

WatchDog

タ

1

台の計算機内でワードプロセツサや

Web

プラウザイマーを起動している(第3.2節参照).この理由とそのを“FGタスク"としシミュレーションや数値計算を“BG 効果を以下に記す.

(

a

)

'

V

at

.

c

h

Dog

タイマ "BGタスタスク"とすると， "FGタスク"のワードプロセッサの作ク"の順に開始する方法において

Wa

.

t

c

hDog

タイマー業に影響を与えずにアイドル時間の資源のみを用いて“BG のみ起動し障害が発生した場合と，

(

b

)

“BGタスク

'¥Watch

タスク"のシミュレーシヨンを進めることが可能となる.

Dog

タイマーの順に開始する方法において“BGタスク"のこの

1

台の計算機内のプロセスを“FGそスク"と“BG み起動し障害が発生した場合を比較する.前者

(

a

)

は

W

a

t

c

l

タスク"にわけプロセスに優先度をつけるaことと提案す

Dog

タイマーがタイムアウトする前に

WatchDog

タイる協調システムの違いは表1のようになる. マーの“BGタスクスペース"が停止しなければよい.後 3 _ _{ントをとる処理の方が実現が困難であり，処} 者(h)は“BGタスク"が次のチェックポイント時刻まで理量が多い. 1.システム内の他のアイドル計算機に移送 2.サスペンド状態にする 3.ローカJレ

o

s

での優先度を下げる 4.破棄する方法1は“BGタスク"にとっては理想的な方法であるが移送の処理があり速やかに資源を解放することができず，厳密には“FGタスク"にとって理想的な方法ではない. 方法 2，方法 3は速やかな移行が可能であることが予想されるが，第4.1節で後述するようにデメリットも多い. また，

CPU

資源は解放してもメモリなどの資源は解放していないことになる.“FGタスク"の処理を妨げることが全く許されない場合は方法4も必要であると考える. この場合，破棄を行ってもその“BGタスク"の処理が正しく行われること，破棄の被害を最小限に抑えることが必要となる(第

3

.4節参照).

3 .

4 耐障害性

前述のように個々の“BGタスクスペース"は信頼性が低い.これらの環境で高い信頼性を実現するために以下のことが考慮されている. 2再度処理を行わなくてはならない“処理結果が失われる"と異なり， “要求が失われる"は要求が発生したこと自体が失われ再度処理することすらできない

3 .

4 .

2 “

B G

タスク"の移送ある“BGタスクスペース"でクローズ要求が発生したときに“BGタスク"を他の“BGタスクスペース"に移動することが可能であればそれまでの処理内容が失われない.

3 .

4 .

3

チェックポイント “BGタスク"の処理が進んだ場合は陣害発生時の再実行のコストを削減するためにチェックポイントをとっておくとことが有効である.提案方式では

WatchDog

タイマーの再実行“BGタスク"を更新することによりチェックポイントをとることが可能であり，この処理はプロセスの移送で行われる処理と同じである. よって，他の “BGタスクスペース"あるいは同一“BGタスクスペース"に“BGタスク"を移送することによりチェックポイントをとることが可能である.

3 .

5 結果の格納

"Faul.tTolerant 5UNIX系08でのniceコマンドなど

(6)

同百

1

非協調並列実行可能不可能 FT化可能不可能オーバーヘッド大規模可変性高低い資源利用効率高い bgタスクの有無に依存スループット安定 fgタスクに依存表 1:協調型システムと非協調型システムまず，協調システムでは並列実行可能であるタスクのターンアラウンド時間の短縮が可能である.また，単一計算機のみでの実行の場合はシステムの信頼性がその唯一の計算機に依存しFT化は不可能であるが官協調システムでは可能である.次に，タスクの移送などの処理が増えオーバーヘッドは協調システムの方が大きいと考える.また，単一計算機で行っている場合は常に“BGタスク"が存在するとは限らず，資源の有効利用は困難であるが協調システムはより高い確率で“BGタスク"が存在する.つまり事ある時刻において“BGタスク"の要望がないユーザと“BGタスク"の要望が多数あるユーザを集めることにより資源の効率的な使用が期待できる.これらを集めることによる要求数の時間的，計算機的偏りの軽減も期待できる.

4 .

2 試作

第1目標である「“BGタスク"が“FGタスク"の処

5 おわりに

本稿ではヲネットワークに接続された計算機群のアイドル状態の計算資源を利用してパッチ的な処理を行う手法として，特に

(

1 )

ノtックグラウンドのタスクがフォアグラウンドのタスクを妨げないこと，

(

2 )

高い耐障害性があること，に重点を置いた手法を提案した.提案手法はある計算機のフォアグラウンドのタスクが開始されたときにはパックグラウンドのタスクは他のアイドル計算機に移送するか破棄するなどをしてフォアグラウンドのタスクへの影響を最小限にしている.また，提案手法はWa

t

.

c

hDogタイマー，トークンパッシングを用いることにより信頼性の低い計算機群を用いても投入したタスクが正しく処理されることを実現している.そして最後に簡単な試作を行いその評価をし有効性を確認した. 今後は提案システムの実装，評価を進めて行くとともに

(

1 )

ユーザ認証およびユーザ指向資源割り当て，

(

2 )

動的な負荷分散機構，

(

3 )

Disconnected Operattion(オフライン作業および再接続時の同期)，

(

4 )

性能評価，について考察をして行く.

参考文献

[1] 1an Foster

，

Carl Kesselman

，

"The GR1D Blucprint for a N cw Computing 1nfrastructure"

，

Morgan Kallf -mann

，

1999. (2)中田秀基，佐藤三久，関口智嗣，“ネットワーク数値情報ライプラリ Ninfのための RPCシステムの概要ヘ電子技術総合研究所TecnicalReport TR・95・28.

理を妨げない

J

を目標とするシステムのJava言語によ (3) Jim Basney， Miron Livny， and Todcl Tannenbaum，る試作を行った.クライアントが“BGタスクスペース"に “High Throughpllt Computing with Condor"， HPCU

“BGタスク"を投入すると“BGタスクスペース"はその news， Volume 1(2)， June 1997. “BGタスク"にスレッドを割り当て実行を開始させる.“BG タスクスペース"の開始時は“BGタスク"を受け付けそ (4) Scott Fields“，Hunting for Wastecl Computing Power"，れを処理するが，ユーザからの“BGタスクスペース"の 1993 Research Sampler， University ofWisconsin-Madison クローズ要求があると処理中の“BGタスク"を全て他の “BGタスクスペース"に移送しクローズすることを可能とした. しかし，現試作の“BGタスク"スレッドの移送の実装はJava言語の直列化機能によりインスタンスを直列化し転送するにとどまっておりスタック上のデータやプログラムカウンタを引き継いで移送することはでき

(5) Miron Livny， Jiw Basney， Rajcsh

Ram

an， and Todd

TannenballUl，“Mechanisms for High Throughput

Com-pllting"， SPEEDUP Journal， Vol. 11， No. 1， June 1997

ない. よって?任意の時刻に“BGタスク"を別の“BG [6)“Overview of the Condor High Through}>ut

Com-タスクスペース"に移送し次の処理から再開することは pllting System"

まだ実現されておらず，移送可能状態になったときはじ

めて移送される6 [7) Jim Prllyne and Miron Livny，“Managillg Cb倒!k・

points for Parallel Programs" Workshop on Job Schcdul -ing Strategies for Pa.rallel Processing IPPS '96 現状の試作はアイドル状態にある計算資源を利用してパッチ的な処理を行う目標はある程度達成している. 第1の目標である「“BGタスゲ'が“FGタスク"の処理を妨げない

J

はユーザからの要求により“BGタスク"を (8)“Checkpointing and Migration of UNIX ProcesHcs 他の“BGタスクスペース"に移送できるため低いレベル in the Condor . Dist.ribut.cd Processing SystemヘDr

では達成されていると言え，現試作でも十分に有効性は Dobbs Jour.n叫，Feb 1995

確認された. しかし任意の時刻に移送を行うことが実

現されておらず理想的なレベルでの達成はなされておら [9]岩井俊弥， "Javaモパイル・エージェントヘソフト・リずさらなる改良が望まれる. サーチ・センタヘ 1998

6 Merc:ury[9}など同程度の移送のみ実現しているそパイルエージエント実装も多〈存花する.

協調バックグラウンドタスクスペースに関する検討