• 検索結果がありません。

コスト有効性に基づいた通信ソフトウェアシステムに対する予防保全スケジュールの決定

N/A
N/A
Protected

Academic year: 2021

シェア "コスト有効性に基づいた通信ソフトウェアシステムに対する予防保全スケジュールの決定"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

2001年度日本オペレーションズ。 リサーチ学会 春季研究発表会 1−C−1

コスト有効性に基づいた通信ソフトウェアシステムに対する予防保全スケ

ジュールの決定

土肥正†(01307065),海生直人‡(01105445),尾崎俊治†(01002265) †広島大学大学院,‡広島修道大学 本稿では,ある通信ソフトウェアシステムを対象に,コス ト有効性に基づいた最適なソフトウェア若化(softwarerか− venation)スケジュールを決定するための確率モデルについて 考察する.対象となるシステムの確率的挙動をセミマルコフ 過程に基づいて記述し,コスト有効性を最大にする最適若化 スケジュールを導出する.さらに,システムの故障データが 与えられた場合に,最適若化スケジュールをノンパラメトリッ クに推定するための統計アルゴリズムについても言及する. 2.セミマルコフモデル 1.はじめに 現在,コンピュータネットワークの爆発的な普及により,実 時間ネットワークシステムの信頼性を評価するための手法を 確立することが急務となっている.特に,ネットワークシス テムの障害は,ハードウェア障害よりもむしろソフトウェア による障害に起因することが多く,ソフトウェアシステムの 信頼性を向上させることが最重要課題となっている.ソフト ウェアの障害を大別すると, 0 ソフトウェアプログラムに含まれる固有フォールトによる 障害 0 ソフトウェアシステムの経年劣化による障害 に分類される.前者は,ソフトウェアの開発工程中に作り込 まれたフォールト(バグ)が運用期間中に表面化することを 意味し,後者は,ソフトウェアの運用期間が経過するにつれ てソフトウェアシステムの内部構造が変化することにより生 じる障害を意味する.このような現象はソフトウェアエージ ング(softwareaging)と呼ばれ【1】,オペレーティングシス テムやミッドウェア系システムだけでなく,通信ソフトウェ ア【2−4】やNetscape,Xrnといった典型的なアプリケーショ ンソフトウエアの運用時においても頻繁に観測されている. ソフトウェアエージングによる障害は一過性の障害(tran− Sientfailure)であることが多い.すなわち,障害が発生した 後,若干異なる内容(データ,環境)でシステムをリトライす ることにより,あたかも障害が発生していなかったかのよう な操作可能状況に復帰する可能性がある.反面,このような 一過性の障害は,ソフトウェアシステムのソースコード上で 障害の原因を特定することが極めて困難であることから,そ の対処法について数多くの研究がなされてきた.特に,ソフト ウェア若化(softwarerqiuvenation)と呼ばれる方策は,ソフ トウェアエージングによる一過性の障害を予防するための有 効な方法として認識されており,ソフトウェアシステムの稼 働を一時的に停止し,その内部構造を浄化した後にシステム を再稼働する一連の予防保全手続きを意味する【2叫・ここで, ソフトウェアシステムの内部構造の浄化とは,ガーベージコレ クション(garbagecouection)やオペレーティングシステム におけるカーネルテープ)t/(operatingsystemkerneltables) の洗浄(魚ushing),データ構造の初期化(reinitializing)等を 示す.アプリケーションシステムの運用上,極端であるが最 も頻繁に行われているソフトウェア若化の一例として,ハー ドウェアリブート(hardwarereboot)が挙げられる. Huange亡αJ.【21と同様に,通信アプリケーションソフト ウェアの時間的挙動は,正常稼働状態(状態0),障害が発生 可能な状態(状態1),障害の発生状態(状態2),ソフトウェ ア若化状態(状態3)の4状態をもつセミマルコフ過程に従っ て推移するものと仮定する.いま,システムが正常状態から 障害発生可能な状態に推移する時間を非負で連続な確率変数 Zによって表現し,その確率分布関数をPr(Z≦り=穐(t), 平均を仰(>0)とする.システムが障害発生可能な状態に 推移すると,ソフトウェア若化を行うか否かの決定をするも のとしよう.システムが障害発生可能な状態から具体的に故 障に至るまでの時間は,非負で連続な確率変数ズによって 記述され,その確率分布関数をPr†∬≦り=巧(り,平均を 〃J(>0)とする.一旦障害が発生すると,事後保全が直ちに 開始される.ここで事後保全とは,障害が発生した後に事後的 にシステムを若化することを意味し,本稿では修理という言 葉によって代用する.修理に要する時間yもまた非負の連続 形確率変数であり,その確率分布関数をPr(y≦り=凡(り, 平均を侮(>0)とする.修理が完了すると,システムの障 害発生率は正常稼働状態における初期状態まで復旧される. 他方,ソフトウェアの予防的な若化は,システムが障害発 生可能な状態に推移した後のr時間経過後になされるものと する.ここで,rは非負で連続な確率変数であり,その確率 分布関数を凡(り,平均を10(>0)とする.システム障害が 発生する前に時刻rが経過した場合は,直ちに予防的に若化 を開始し,そのシステムオーバーヘッドVに対する確率分布 関数をPr(y≦り=鳥(れ平均を〟。(>0)とする・修理 の場合と同様に,予防的若化が完了すると,システムの障害 発生率は正常稼働状態における初期状態まで復旧される.特 に,障害発生可能な状態から予防的に若化を実施するまでの −50 − © 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(2)

によって定義する.さらに,経験分布関数に基づいた標準総 試験時間変換の推定量■として,次にような標準総試験時間統 計量を定義する. 時間rが一定であるとすれば,確率分布関数凡(りを次の ようなユニット関数

瑚)=U(叫=

〈 。 (1) に置き換えればよい. Dohietαg・【3,4】の結果を直接用いることによって,上述 のモデルにおけるコスト有効性は (9) ¢れj=砺/ゆれ ここで,関数 J ゆj = ∑(n−た+1)(£k−£た−1) た=1 J=1,2,・‥,几;ゆ0=0 (10) は総試験時間統計量と呼ばれる.最終的に,点列(ブル,れブ) (ブ=0,1,2,…,れ)を2次元平面上にプロットし,それら を線分で繋ぐことにより,標準総試験時間プロット(scaled totaltime ontest plot)を得る.推定量(j/n,Qnj)(j= 0,1,2,・‥,れ)は(p,¢(p))(p∈【0,1】)のノンパラメトリック 推定量であるので,定理1の結果を直接適用することによ り,最適ソフトウェア若化スケジュールに関する以下の定理 を得る. 定理2:障害発生時間に対するm(>0)個の完全データの順 序統計量エ1≦∬2≦…≦エmが観測されているものとする. (i)コスト有効性を最大にする最適ソフトウェア若化スケジ ュールのノンパラメトリック推定量は,次の式を満たす ェゴ・によって与えられる・ デ=〈J・ ) (11) ここで,式(6)の〃′はサンプル平均∑:=1£た/れに よって置き換えられる. (ii)(i)で与えられた最適ソフトウェア若化スケジュールの ノンパラメトリック推定量は強一致推定量である.すな わち,〇j・は几→∞のとき(未知であるが)真の最適 解t。■に確率1で漸近収束する. 仰+ぷ0テ/(りdt β(亡0)= (2) C占仇巧(£0)+cp のように求めることが出来る.ここで,障害発生時の単位時 間当たりの修理費用をcβ(>0),予防的に若化を行う場合の 単位時間当たりの費用をcp(>0)とする. 3.ノンパラメトリック推定アルゴリズム ここでは,実際に障害発生時間データが与えられていると いう状況において,コスト有効性を最大にする最適ソフトウェ ア若化スケジュールを(理論分布を仮定することなく)ノン パラメトリックに推定するためのアルゴリズムについて考察 する.いま,障害発生時間分布巧(t)に対する標準給試験時 間変換を次のように定義する. ㈲=(1ル′)上F√1‘p’亨′(t)dt (3) ここで,巧(t)は絶対連続かつ非減少関数であるので,その 連関数 町1(p)=inf匝;巧(fo)≧れ 0≦p≦1 (4) が必ず存在する.よく知られた結果として,確率分布関数 巧(t)がIFR(DFR)であるための必要かつ十分条件は,関 数¢(p)がp∈fO,1】に関して凹(凸)関数であることである・ 定理1:コスト有効性β(to)を最大にする最適ソフトウェア 若化スケジュールを求める問題は,以下の問題の解p■(0≦ 〆≦1)を求めることと等価である. 参考文献 【1】D.L.ParnaS,“Softwareaging”,Prvc・16thInt,lCor$ on SoPwart:En9ineerin9,pp・279−287,ACM Press (1994)・ 【2]Y・Huang,C・Kint・ala,N・KolettisandN・D・Funton, “Softwarerejuvenation:analysis,mOduleandappli− cations”,Proc.25£hmEEInt,lSymp・On凡ult7bl− ermtComputin9,pP.381−390,IEEEComputerSo− CietyPr6ss(1995)・ 【3]T・Dohi,K・Go岳eva−PopstojanOVaandK・S・.nivedi, “Analysisofsoftwarecostmodelswithrqiuvenation,’’ P和C.5亡ん〃柁混血亡,J助叩p.0几戊タたA肌mmCe馳β− temsEn9ineerin9,pp.25−34,IEEEComputerSoci− etyPress(2000)・ 【4】T.Dohi,K・Go畠evarPopstojanovaandK・S・Thvedi, “Statisticalnon−parametricalgorithms to estimate theoptimalsoftwarerquvenation scheduleM,tO ap− pearinPrDC.2000Pac訴cRimInt’LSy77q,・OnDe− pendable Computin9,If;EEComputerSocietyPress (200町 ¢(p)+α (5) maX d盲i有1p+β ここで∴ α=囲ルJ β=Cp〝。(c5仇−Cp〃。) 次に,障害発生時間分布巧(t)は未知であるが,対応する障害 発生時間データの順序統計量エ0=0,エ1,エ2,・‥,ごnが観測さ れており,これらは打ち切りのない完全データであると仮定す る.障害発生時間分布巧(t)の推定量をエゴ(j=0,1,2,…,れ) に基づいた経験分布関数 J/几 払r ェj≦ェ<£汁1 (8) 凡(霊)= ror ェ,l<J

−51−

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

参照

関連したドキュメント

カーボンニュートラル中長期目標遵守 株式報酬制度の導入 国連グローバル・コンパクト署名 次世代自動車向け製品拡大

表-1 研究視点 1.景観素材・資源の管理利用 2.自然景観への影響把握 3.景観保護の意味を明示 4.歴史的景観の保存

国民の「知る自由」を保障し、

Effect of mixure of aqueous extra from Salacia reticulate and cyclodetrin on the serum grucose and glucose level change and gastro-intedtinal disorder.. by massive

学生部と保健管理センターは,1月13日に,医療技術短 期大学部 (鶴間) で本年も,エイズとその感染予防に関す

ひかりTV会員 提携 ISP が自社のインターネット接続サービス の会員に対して提供する本サービスを含めたひ

・この1年で「信仰に基づいた伝統的な祭り(A)」または「地域に根付いた行事としての祭り(B)」に行った方で

指針に基づく 防災計画表 を作成し事業 所内に掲示し ている , 12.3%.