• 検索結果がありません。

して実際の総テストケースは100であるが,すべてのフォー  

N/A
N/A
Protected

Academic year: 2021

シェア "して実際の総テストケースは100であるが,すべてのフォー  "

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

三」こ」出:・・二J。  

田本オペレーションズ。リサーチ学会  

2¢0勾年番寧研究発表会  

謬牙四』睦睦修置巷行う環境帯臆表別訝るS鼠喝地口Use信頼度⑬璃確認推定  

岡村寛之(01013754)†,古村仁志‡,土肥正(01307065)†  

†広島大学大学院工学研究科情報工学専攻  

‡広島大学工学部第二頬(電気系)  

2.Millerによる方法    1.はじめに   

Miller[2】による信頼度の推定は.ソフトウェア全体ある   いは単一モジュールに対して行われる.この方法ではソフト   ウェアの障尋発見確率(βJ=〃J/Ⅳ)がパラメータ(p,9)の   ベータ分布に従うと仮定している.テストを行った後,障専   発見確率の事後分布がづイズの定理から得られる・いま,障   害発見確率βJの事前分布に対する確率密度わは次式で与   えられる.  

ソフトウェアの品質は,バグが無いこと,つまり期待され   る動作を正確に行えることがその指標となる.作成段階で作  

り込まれた様々なバグや予期しない動作はテストを行うこと   により可能な限り取り除いて行く方法が一般的である.   

ソフトウェアの信頼性を評価する方法は一般的に動的な方   法と静的な方法に大別される.動的な方法では,ソフトウェ   アの実行過程におけるフォールト発見数の計測から信頼性評   価を行う.一方,静的な方法はソフトウェアの入出力関係か   ら,正常に稼動する確率やソフトウェア内に潜在するフォー   ルト数を予測することで,ソフトウェアに対する信頼性評価   を行う.   

文献【1】では静的信顔性評価のうち,入力空間に基づいたソ   フトウェア信頼性評価として,実行したテストケースの散れ   の中で障啓が発生したテストケースの数mJから,ソフトウェ   アの信瓶度月およぴその推定値点を次のように定義した.  

∬p ̄1(1−∬)q−1  

(3)  

わ(∬)=   

β(p,9)   

ここでβb,9)はベータ関数である.一回のテストにおいて   陣容が発見される事象を(Jα βe),また,障啓発見確率の事琴   分布わ(可Jαgβe)とする.一方,障啓が発見されなかった事   象を(紬CCe朗),障啓発見確率の事後分布わ(ヱlざuCCeββ)と   する.このとき,ベイズの定理からそれぞれの事後分布は  

ェp(1−エ)q ̄1  

(4)  

わ(∬げαJβe)=   

虎=聖二竺£=1_聖  

れ   γl   β(p+1,9)   

月=1im 月=1−1im    れ/  

∬p ̄1(1−げ  

n→00   れ−◆00 γも  

(5)  

わ(ェlβuCCeβ占)=   

β(p,q+1)  

ここで定義される信頼性尺度は,実行され得る全ての入力デー   タのうち正しい出力が得られる入力データの割合である.つ   まりソフトウェアが障蕃を発生することなく正常に終了する   確率と等価であり,Single−Use信頼度と呼ばれる.   

Miller[2】は,Single−Use信頼度に対してベイズ統計に基づ   いた推定手法を提案した.ソフトウェアに含まれる全てのテス  

トケースの数をⅣ,陣容を含むテストケースの数を〃パ<Ⅳ)  

(N,呵は未知)とすると,Miller[2]によるベイズ推定では   予め得ている事前情報からβJ=〃J/Ⅳの事前分布を決定す   る.次に,テストを行った後の事後分布をベイズの定理から   導出することで,βJに対する推定を行う.このモデルの特徴   は事前分布を用いることによってテストで障昏が発見されな   かった場合でも,信頼性を評価することが可能な点にある.し   かしながら,先に述べた定義においてSingle−Use信頼度は初   期時点におけるフォールトの割合に基づいた信頼性尺度であ   る.すなわち,ソフトウェアテストにおいては当然起こりえ   る「陣容が発見されたら修正をする」という事象を考慮して   いない.同様にMiller【2】による推定方法もフォールトの修   正を行うことは考慮されていない.つまり,爽際にはフォー   ルトの修正が行われるのにもかかわらず,修正されたフォー   ルトも含めて信頼度を計測しているため.実際の信頼度より   も過小評価されている.そこで本稿では,フォールトが修正   される状況を考慮した信頼性評価モデルの提案を行う.  

となり,パラメータb+1,q),b,q+1)のベータ分布となる.   

これより,t回のテスト終了時点において障善が発見され   た回数をJ障善が発見されなかった回数をβをすると,障辛   党見確率βJはパラメータ(p+J,9+β)のベータ分布で表   される.ここで土=J+βである.最終的にSingle−Use信頼   度の推定量は月=1−βJとなるため,推定値および推定量   の分散(推定精度)は以下のように与えられる.  

p+J  

p+q+f)  

呵月】= 呵1−βJ】=1−   (6)  

V叫月】= Vαり1−βJ】  

(p+J)(9+β)  

(7)   

(p+9+f)2(p+q+け1)■   

乱 フォールト修正を考慮した推定寧法  

ここではフォールト修正が行われる環境におけるSingle−  

Use信頻度に関する再考を行う.前節における推定手法は,ソ   フトウェアテストにおいて同じテストケースを2回以上行わ   ないという環境においては.テスト開始時点における障害発   生確率を推定していることになる.そこで本稿では,有限個   のテストケースに対してフォールトが発見された場合に修正   が行われることを考慮した推定手法の授案を行う.いま,Ⅳ   をテストケースの総数(既知の定数)として,〃Jに対する  

−272−   

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

(2)

事前分布がパラメータ(〃,p,9)のベータニ項分布に従うもの   と仮定する・このとき叫の事前分布に対する確率密度J〃′  

は次式で与えられる.  

β(p+m,q+Ⅳ−m)  

J〃′(れ)=    (8)  

β(p,9)   

一回のテストにより障害が発見された場合の〃Jに対する事   後分布は,ベイズの定理から次のようになる.  

︶  1 1  

一一  Ⅳ れ  

︵   −リー  れ  +  β  

+〃一m)  

J〃′(れげαJβe)=   (9)   1    50    99   148   107   246   2!〉S  

T8StrUnS   

図1:Single−Use信頼度の推定結果(Casel).  

従って,事後分布は/ミラメータ(Ⅳ−1,p+1,9)のベータニ項   分布となる.同様に,障害が発見されなかった時の〃Jに対   する事後分布J〃′(叫ucceβ5).はパラメータ(Ⅳ−1,p,9+1)  

のベータニ項分布となる.   

最終的に,t=J+β回のテストによりJ回障害が見つか   り,β回障善が見つからなかった時の〃Jの事後分布は,パラ   メータ(〃−t,p+J,q+β)のベータニ項分布となる.いま,  

Single−Use信頼度がR=1−Nf/Nで与えられるため,推定   値および推定量の分散(推定精度)は次のようになる.   

叩]=小一筈]  

︿U   9   8   7  1  0  ︵U  ▲U   6  5  4  3  2   0  0  0  <U O  ▲U  ▲U  

倉−五虐心∝  

(〃−t)(p+J)  

(10)  

1−    1 10 19 28 37 46 55 朗 73 82 9110D  

Toslruns   

図2:Single−Use信頼度の推定結果(CaBe2).  

Ⅳb+9+t)   

叫月]=Vαγト筈]  

(Ⅳ−t)(p+J)(9+β)b+9+〃)  

〃2(p+q+t)2(p+q+t+1)   

(11)   スト総数に関するパラメータをCa5elにおいてはⅣ=450,  

Case2においてはN=100とした.ここでは,Ca5elに関  

して実際の総テストケースは100であるが,すべてのフォー  

ルトを取り除くためのテスト回数の期待値が450であること   に着目している.また,実際のSingle−Use信頼度(SUR)は   月=1一(叫−れJ)/Ⅳによって与えている.   

これらの固から,CaBelおよびCa5e2においてMiller   による方法は実際のSingle−Use信頼度よりも低い推定値を   出しており,実際に過小評価となっていることがわかる.特   にCase2では.初期時点でのSingle−Use信頼度である0.5   を推定値として算出しており,フォールト修正される環境に   おいてはMillerによる方法を直接適用することの危険性を示  

している.  

参考文献  

【1】T・A.Th町er,M.Lipow,andE.C.Nelson,SoftwareRe−   

1iability,TRW Series ofSoftware Tbchnology,North−   

Holland,Amsterdam,1978.  

【2】K.W.Mi11er,L.J.Morell,R.E.Noonan,S.K.Park,   

D.M.Nicol,B.W.Murrill,andJ.M.Voas, Estimat−   

ingtheProbabilityofFailureWhenrrbstingRevealsNo   

Fai1ures, IEEETransactionsonSoftwareEngineering,   

VOl.18,nO.1,pp.33−43,1992.  

4.数値例   

ここでは,ソフトウェアテストをシミュレーションするこ   とで,先に示したニフの推定方法の違いを検証する.シミュ   レーション環境は,ソフトウェア全体のテストケースの個数   をⅣ=100,初期時点における障害を含むテストケースの個   数を〃J=50とした・特に以下の二つの環境を考えそれぞ   れの推定手法の違いを検討する.  

Casel(復元抽出):ソフトウェアテストにおける障幸発生   に対する標本を復元抽出により行う.つまりれ回のテス   

トでり個の障害が発生した場合,一n+1回目のテスト    において障害が発生する確率は(〃J−mJ)/〃となる.  

Case2(非復元抽出):ソフトウェアテストにおける降車発  

生に対する標本を非復元抽出により行う.つまりれ回の   テストでmJ個の障害が発生した場合.れ+1回目のテ   

ストにおいて障害が発生する確率は(〃ノーり)/(Ⅳ−乃)  

となる.  

上記はそれぞれ,テストケースをランダムに選択してテスト   をする場合と,テストケースを順番に選んでテストする場合   に対応する.これらの環境のもとでMillert2】による推定手   法(Mi11er)と本稿で提案する推定手法(Modified)による   Single−Use信頼度の推定結果を図1および図2に示す.それぞ   れの推定では事前情報を表す/くラメータをp=q=1とし,テ  

ー273−   

© 日本オペレーションズ・リサーチ学会. 無断複写・複製・転載を禁ず.

参照

関連したドキュメント

自閉症の人達は、「~かもしれ ない 」という予測を立てて行動 することが難しく、これから起 こる事も予測出来ず 不安で混乱

手動のレバーを押して津波がどのようにして起きるかを観察 することができます。シミュレーターの前には、 「地図で見る日本

エッジワースの単純化は次のよう な仮定だった。すなわち「すべて の人間は快楽機械である」という

1.実態調査を通して、市民協働課からある一定の啓発があったため、 (事業報告書を提出するこ と)

基準の電力は,原則として次のいずれかを基準として決定するも

以上の基準を仮に想定し得るが︑おそらくこの基準によっても︑小売市場事件は合憲と考えることができよう︒

哲学(philosophy の原意は「愛知」)は知が到 達するすべてに関心を持つ総合学であり、総合政

   縮尺は100分の1から3,000分の1とする。この場合において、ダム事業等であって起業地