フォールトアナリシスモデル

第 5 章実験的フォールトアナリシスプロセス 52

5.1.2 フォールトアナリシスモデル

本節では，フォールトアナリシスプロセスの検討に先立ち，フォールトアナリシスを明確にするため，フォールトアナリシスモデルを提案する．まず，故障，フォールト，故障再現およびフォールトアナリシスの概念を定義する．

2.1.1で述べたように，本論文では，故障とフォールトを対象ソフトウェアの状態で表現

する．ソフトウェアの状態とは，ソフトウェアプログラム実行中の瞬間的なスナップショッ

トとし，変数への値の割り当てによって定まるものとする．以下，簡単のため，プログラムを状態と遷移の組からなる状態遷移系として扱うことにする．

定義 5 (プログラムと状態) Sを状態の集合とし，T ⊆S×SとなるTを遷移の集合とするとき，(S, T)をプログラムとする．

例 5 (プログラムと状態) 例えば，ソフトウェアプログラムでは，プログラムカウンタとメモリに格納された値により，プログラムの状態を定義できる．プログラムカウンタの取りうる値の集合をP c，メモリの番地の集合をAdd，メモリが取りうる値の集合をV とするとき，状態集合Sはこれらの組み合わせ，すなわちS=P c×Add×V のように定義することができる．また，ソースコードとは，状態をどのように変化させるかを規定したものであり，遷移Tを定義したものであると考えることができる．例題として挙げたキュープログラムにおいては，考慮すべきメモリとして，キュー，配列，カウンタ，mutexがある．これらの値の組み合わせと，プログラムカウンタの値で状態を定義することができる．

なお，ここでプログラムカウンタと述べたのは，ソフトウェアプログラムのどこを実行しているのかを意味しており，実際にはCPU上のプログラムカウンタでなく，ソースコード上の位置や，ソースコードを解析した結果得られる抽象構文木上の位置であっても構わない．

フォールトアナリシスを行うためには，故障に至る状態の遷移を考える必要がある．ここで，プログラムp= (S, T)において，状態s₁から状態s₂への遷移可能であることを明示的に表現するため，これを状態間の到達可能性と呼び，s₁▷_ps₂と表すこととする. 定義 6 (到達可能性) p= (S, T)をプログラムとする. s1,s2 ∈Sについて，関係s1▷ps2

が成立するのは，(s1, s2)∈Tが成り立つ，もしくは，s1▷psかつs ▷ps2となるsが存在するとき，かつそのときに限る．

例 6 (到達可能性) キュープログラムにおいて，スレッドt1が関数non_det_intを呼び出して非決定的な値を取得した状態をs₁とし，スレッドt₂がキューから当該値を取り出した状態s₂とすると，キュープログラムではs₁▷ s₂であることが期待される．

テスト等で故障として観測された状態を「故障状態」と呼ぶこととする．

定義 7 (故障状態) (S, T)をプログラム，s0をs0∈Sとなる状態とする．故障が状態s0

で観測されたとき，s₀を故障状態と呼ぶ．

例 7 (故障状態) キュープログラムにおいて，キューから取り出した値と，配列から取り出した値が一致しない状態s₀とき，その状態は故障状態である．

故障の原因となったフォールトを示す状態を「フォールト状態」と呼ぶこととする．

定義 8 (フォールト状態) プログラムp = (S, T)に対して，s0 ∈ Sが故障状態であるとき，状態s1 ∈Sがs1▷ps0かつs1が故障の原因を示すならば，s1はフォールト状態である．

例 8 (フォールト状態) キュープログラムにおいて，キューから取り出した値と，配列から取り出した値が一致しない故障状態s0があるとする．s0以前の状態として，故障を発生するきっかけとなった状態，例えば取り出す配列のインデックスがキューのインデックスがずれた状態s₁がある場合，s₁◁ s₀かつs₁はs₀の原因であるので，s₁はフォールト状態である．なお，故障状態s₀に対して，その原因となる状態は唯一とは限らず，フォールト状態は複数存在する場合があることに注意が必要である．たとえば，状態s₂▷_ps₁において配列のインデックスをインクリメントしたとすると，s2を故障の原因と捉えフォールト状態と考えることができる．

5.1.1節で述べた議論より，故障再現においては，観測された故障と全く同一の故障を

再現するわけではない．換言すると，何をもって故障とみなすかという，故障を特徴づける条件を定めることが故障再現に必要である．したがって，ここでは，状態を故障とみなす条件という概念を導入し，これを「故障条件」と呼ぶこととする．

定義 9 (条件の集合) p= (S, T)をプログラム，s∈S を状態，Cを条件の集合とする. 関係式 C⊩p sは，プログラムpの状態sにおいて，Cのすべての要素cが成立することを示す．

例 9 (条件の集合) キュープログラムをp，「キューから取り出した値と，配列から取り出した値が一致しない」という条件をc，cを要素として含む集合をCとするとき，キューから取り出した値と，配列から取り出した値が一致しない状態の一つsについて，C ⊩ps と表記する．なお，この条件に合致する状態は唯一ではなく，集合S^′={s|C ⊩p s}^を考えるとき，その要素は複数存在することに注意されたい．

ついで，故障を特徴づける故障状態について定義する．

定義 10 (故障条件) 観測された故障f rについてC ⊩p f rが成立するとき，Cは故障条件である．

例 10 (故障条件) キュープログラムpにおいて，「5番目の整数値について，キューから取り出した値が10，配列に格納された値が15」という状態f rが観測されたとする．これは故障状態にある．しかし，キューと配列で値が異なることが，この故障の本質であり，何番目であるか，あるいは，値が何であるかは，この故障を特徴づけるものではない．条件 c「キューから取り出した値と，配列から取り出した値が一致しない」が故障を特徴づける条件である．このとき，cからなる集合CはC⊩p f rを満たし，故障条件である．

故障再現とは，故障条件が成立する状態を発見する行為である．発見された状態を再現故障と呼ぶ．

定義 11 (再現故障) p = (S, T) をプログラム，f r ∈ S を観測された故障状態とする．

C ⊩p f rが成立するCrについて，Cr ⊩p f r^′となる状態f r^′を見つける行為を故障再現と呼ぶ．状態f r^′を再現故障と呼ぶ．

䝣䜷䞊䝹䝖㻦㻌㼒㼠

㼒㼠䕫

㻼

㼒㼞

ᨾ㞀㻦㻌㼒㼞

᮲௳㻯㼠䝣䜷䞊䝹䝖

᮲௳㻯㼠㻯㼞

ᨾ㞀᮲௳

㻯㼞

෌⌧

䝣䜷䞊䝹䝖䠖㼒㼠䇻

㼒㼠䇻㻌䕫

㻼䇻

㼒㼞䇻

෌⌧ᨾ㞀䠖㼒㼞䇻

㻯㼞㻌㻌㻌㻌

㼜

㼒㼞㻯㼠㻌

㼜

㼒㼠

㻯㼞㻌

㼜䇻

㼒㼞䇻㻯㼠㻌

㼜䇻

㼒㼠䇻

ᅉᯝ㛵ಀ

௬ᐃ

ᨾ㞀

෌⌧

฿㐩ྍ⬟

䝣䜷䞊䝹䝖ศᯒ 䝣䜷䞊䝹䝖

≉ᐃ

☜ド

図 5.2: フォールトアナリシスモデル

例 11 (再現故障) 例10において，条件c「キューから取り出した値と，配列から取り出した値が一致しない」からなる集合Cに対して，「3番目のキューから取り出した値が2，配列から取り出した値が4」という状態f r^′を発見したとする．ここでC ⊩p f rが成り立ち，f r^′は再現故障である．

再現故障f r^′を得られた後，故障の原因となるフォールトを探す．再現故障に対するフォールトを再現フォールトと呼ぶこととする．

定義 12 (再現フォールト) p = (S, T)をプログラム，f r^′ ∈ Sを再現故障とする．f t^′ ▷_pf r^′となる状態f t^′がf r^′の原因であるとき，f t^′を再現フォールトと呼ぶ．

例 12 (再現フォールト) 例11において，「3番目のキューから取り出した値が2，配列から取り出した値が4」という状態f r^′に対して，「カウンタiが2の時にキューからの取り出しないにも関わらず，カウンタをインクリメントする」状態f t^′があったとする．f t^′ ▷_pf r^′ であり，f t^′によりf r^′が引き起こされると考えられるため，f t^′は再現フォールトである．

ここで，当初の故障が発生した際には，再現フォールト状態が発生したわけではないことに注意をする必要がある．故障と同様に，フォールトを特徴づける条件という概念を導入し，これをフォールト条件と呼ぶこととする．

定義 13 (フォールト条件) p = (S, T)をプログラム，f r^′ ∈Sを再現故障，Ctを条件の集合とする．Ct⊩p f r^′が成立するとき，Ctをフォールト条件と呼ぶ．

例 13 (フォールト条件) 上記の例で，「カウンタiが2の時にキューからの取り出しないにも関わらず，カウンタをインクリメントする」状態f t^′であるが，カウンタの値が他の値でも同様に故障を発生すると考えられ，「キューからの取り出しがないにも関わらず，カウンタをインクリメントする」という条件を含む集合Ctがフォールト条件となる．

図5.2に，故障，フォールト，再現故障，再現フォールトの関係を示す．故障発生時と，

故障再現時との間を，故障条件およびフォールト条件が橋渡ししているのが特徴である．

さらに，フォールトアナリシスのフローを矢印で表現した．これを，フォールトアナリシスモデルとして提案する．

フォールトアナリシスモデルに従って，フォールトアナリシスの手順を説明する．まず，

プログラムpにおいて，故障f rが観測される．次に，Cr⊩p f rを満たす故障条件Crを仮定する．次に，Cr⊩p^′ f r^′となる再現故障f r^′を探索する．これが故障再現である．ここで，pではなく，p^′となっている理由は，3.3節に述べた通りである．すなわち，故障再現においてはプログラムpそのものでなく，故障の再現性や解析結果の解析性を考慮し，

意図的に改変したプログラムを用いることがある．この改変の結果をp^′で示している．次に，再現故障f r^′の原因となったf t^′▷_p′f r^′を満たす再現フォールトを探す．これをフォールト解析と呼ぶ．次に，再現フォールトf t^′を特徴づけるCt⊩p^′ f t^′を満たす条件Ctを設定する．これによりフォールトが特定されたとみなすこととする．最後に，フォールト条件Ctを満たし，f t ▷_pf rとなるフォールト状態f tが，観測された故障発生時に存在していた可能性を確認する．これが確認できると，フォールト条件が確証される．ここで，

フォールト状態f tは必ずしも観測可能とは限らないため，確認できるのは状態そのものでなく，状態の存在の可能性の有無である．

ドキュメント内 JAIST Repository https://dspace.jaist.ac.jp/ (ページ 55-59)

第 5 章 実験的フォールトアナリシスプロセス 52

5.1.2 フォールトアナリシスモデル

㼒㼠 䕫

㼒㼞

㼒㼠䇻㻌䕫

㼒㼞䇻

㻯㼞㻌㻌㻌㻌

㼒㼞 㻯㼠㻌

㼒㼠

㻯㼞㻌

㼒㼞䇻 㻯㼠㻌

㼒㼠䇻

第 5 章実験的フォールトアナリシスプロセス 52

㼒㼠䕫

㼒㼞㻯㼠㻌

㼒㼞䇻㻯㼠㻌