分散プログラムの手順的デバッグ法に関する研究

(1)

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

分散プログラムの手順的デバッグ法に関する研究

太田, 剛

https://doi.org/10.11501/3130974

出版情報：Kyushu University, 1997, 博士（情報科学）, 論文博士バージョン：

権利関係：

(2)

Ro aωR no一O「noコqo一勺えnzwω

回一COOMBコQ『00コ〈o=ogzoa豆mooコS〈〈zzo

。宗弘襲.鍵MO司→玄HE邑侮

ω\Oo-O『回一mOR

-《o

aωR OBV、ωnω一。

85Fω宮司司書変革

3旨

-'"

ω

ω 4注印

。

(3)

分散プログラムの

手順的デバッグ法に関する研究

太田剛

1997年6月

(4)

2.3 GADTの手順的デバッグ法 . . • • • • • • • • . . . • • • • • " 18 2.4 下村の手順的デバッグ法. • • • . • • • • • • • • • . . • • • • • . 21 2.5 手順的デバッグ法の抽象化 ^• ^• ^. ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^. ^. ^• ^• ^• ^" ²⁴

2.6 あとがき . ^. ^• ^• ^• ^• ^• ^. ^. ^• ^• ^• ^• ^. ^. ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ²⁸

3 分散プログラムの手順的デバッグ法 ²⁹

3.1 まえがき . ^• ^. ^• ^. ^. ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^" ²⁹

3.2 準備 ^• ^• ^• ^• ^• ^• ^. ^. ^. ^• ^• ^• ^• ^. ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^" ²⁹

3.2.1 分散プログラムの定義 . ^. ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ²⁹

(5)

11 もくじ

3.2.2 仮定 31

3.3 第一段階:誤りを合む部分プログラムの特定 . ^• ^. ^• ^. ^• ^• ^• ^• ^• ^• 33 3.3.1 定義 ^• ^• ^• ^. ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• 33 3.3.2 同期誤りに関する考察 . . ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• 36 3.3.3 同期誤りを引き起こす部分プログラムの特定方法 ^• ^• ^. ^• 38 3.4 第二段階:誤りを合む文の特定 . ^• ^• ^• ^. ^. ^• ^. ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• 40 3.4.1 定義 ^• ^• ^• ^• ^• ^• ^• ^. ^. ^• ^• ^• ^• ^. ^. ^. ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^. ^• 40 3.4.2 誤りを含む文の特定方法 . . • • • • • • . • • • . • • • • 42 3.5 あとがき . ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^. ^， 46

4 誤り特定のための発見的手法 ⁴⁷

4.1 まえがき . ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^. ^• ^. ^• ^• ^• ^• ^• ^• ^• 47 4.2 第一段階における発見的手法 . ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• ^. ^• 47

4.2.1 プログラムの大域的状態異常にかかわるプロセスを特定する発見的手法 ^• ^• ^. ^• ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• 47 4.2.2 グラフをほぼ半分に分割する発見的手法 . ^• ^• ^• ^. ^• ^• ^• ^• 49 4.2.3 臥閃となる実行時点に関する発見的手法 . ^• ^• ^• ^• ^• ^• ^• ^• 49 4.2.4 表明を用いることによる自動化 . ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• . 50 4.3 第二段階における発見的手法 . . ^• ^• ^. ^• ^• ^• ^• ^• ^. ^. ^• ^• ^. ^• ^• ^• ^. 50 4.3.1 グラフをほぼ半分に分割する発見的手法 . ^• ^• ^• ^• ^• ^• ^. ^• 50 4.3.2 故初のCtをScの直前に取る発見的手法 ^• ^• ^. ^• ^• ^• ^• ^• 51 4.3.3 受信位置の誤りを基にした発見的手法 ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• 52 4.3.4 スライスの共通部分を用いる発見的手法 . ^• ^• ^• ^. ^• ^• ^. ^• 53 4.3.5 ダイスを用いる発見的手法 ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• 53 4.4 あとがき . ^• ^• ^• ^. ^• ^. ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• ^• . ^. ^• ^• ^• ^• . 54

5 例題 ⁵⁷

5.1 まえがき . ^• ^• ^• ^• ^• ^• ^• ^• ^• . • • • • • . • . • • • • • • • • • . • 57 5.2 2人の哲学者の食事問題 . ^• ^• ^• ^• ^• ^. ^. ^• ^• ^• ^• ^• ^• ^. ^• ^• ^• ^• ^• ^• ^• 57 5.2.1 第a段階:誤りを合むきIS分プログラムの特定 . ^• ^. ^• ^• ^• ^• 58 5.2.2 第一段階:誤りを含む文の特定 . ^• ^• ^• ^• ^• ^• ^• . ^• ^• ^• ^• ^• 64

もくじ III

5.3 誤りを含む移動窓プロトコル 66

5.3.1 第一段階:誤りを合む部分プログラムの特定 . • • • • " 66

5.3.2 第二段階:誤りを合む文の特定 . • • . • • . . • • • . " 71

5.4 あとがき 80

6 プログラム変更を前提としたプログラムスライス計算法 81

6.1 まえがき . • • • • • • . . • • • • • • • • • • • • • • • • . • • • • 81 6.2 対象言語と変数依存グラフ . • • • • • • . • . • • • • . • . . • • 82 6.2.1 対象言語 . • • • • • . . • • . • • • • • • • • • . • • . • • 82 6.2.2 変数聞の依存関係

6.2.3 変数依存グラフ

83 84 6.3 変数依存グラフを用いたスライス計算アルゴリズム • • • • • • • 86 6.3.1 スライス計算アルゴリズム • . • • • . . • . • • • • • " 86 6.3.2 スライス計算例 • • • • • • • • • • • • • • . • . • • • • • 88 6.3.3 時間計算量に関する議論 • • • • • • • • • • . • . • • • • 89 6.4 既存アルゴリズムとの時間計算量の比較 . ^• • • • • • • • . . • • 92 6.5 あとがき . • • • • • • • • . • • • • • . • . • . • • • • • • . . . • 93

7 結論 ₉₅

謝辞 ₉₉

参考文献 101

A既存のスライス計算アルゴリズムの時間計算 111

A.1 Weiserのアルゴリズム • • • • • • • • . • • • • • • • . ^• ^• ^• ^• ^• 111 A.2 PDGを用いるアルゴリズム . • • • • • • . • • • . • • • • • . • • 112 A.3μ関係行列を用いるアルゴリズム . • • • . . • . • • • • • • . . • 113

B 英和対照表 ₁₁₅

さくいん 116

(6)

lV もくじ

酢見

図

2.1 Shapiroの方法 • • • . . • • • • • ^{• .} . • • . • • • • ^• • • • • • ¹⁷

2.2 GADTにおけるプログラム変換例(Pasca1言語による) • • • • ¹⁹

2.3 手続きsquare_test. . . . . . 20 2.4 sqare_rootの実行経過 . . • . . • • • . . • • • • • . • • . . • • ²¹

2.5 下村の方法における実行経過の表現. • • • . • . • • • • • . • " ²³

2.6 手順的デバッグ法の抽象的概念 . • • ^.. • • . • • • • • • . • • . ²⁷

3.1 動作タイミングの吸収 . • • • • • . . • . • • • . • • • • • • • • • ³³

3.2 同期誤りの概念 • . . • • • • • • • • • • • • • • • . . • • • . • • ³⁷

3.3 2つの中断点前線の関係 . • • • • ^• • • • . . • • • • • . • • • . • ³⁹

3.4 第三段階で用いられるグラフの例 . • . • ^{• .} . • • • • • • • • • . ⁴³

4.1 メッセージを実際に受理した事象九と受理すべきだ、った事象 Tcとの関係• • • . . • . • • • • • • • . • • • • ^. • • • • • ^• • • • ⁵³

4.2 ダイスの概念. • • ^.. • • • • • • • . • . . • ^• • • . . . • . . • ^• ⁵⁴

5.1 2人の哲学者の食事問題 . . . • ^.• • • • ^• . • • • • • • • • • " ⁵⁸

5.2 2人の哲学者の食事問題のプログラム例 • • . . • . • • • • • . • ⁵⁹

5.3 2人の哲学者の食事問題の一実行例 . . • • ^• • . • • • • . • • • • ⁶⁰

5.4 第一段階のステップ5における実行場面 . • • • ^.• ^. • • • • • • ⁶¹

5.5 第一段階のステップ7における実行場面 . • • • • • • . • • • • • ⁶²

5.6 第一段階のステップ9における実行場面 . • . • • • • • • • • • . ⁶³

5.7 第一段階のステップ10における実行場面 • • . • • • . • • • • • ⁶⁴

5.8 同期誤りを示す実行場面群 • • • • • . • • • • • . . . • • • • ⁶⁵

5.9 文の記述誤りを含む移動窓プロトコル • • • • • • • • . • . • • • ⁶⁷

v

(7)

Vl 図一覧

5.10文の記述誤りを合む移動窓プロトコル(つづき) • . • • • . . • • ^{6 8}

5.11プロトコルの実行過程 .• ^{. •} . . . • ^{• •} • ^• • • ^{• .}. • • • • . • ⁶⁹

5.12プロトコルの実行過程(つづき) • . . • • • • • • • • • . • • • • • ⁷⁰

5.13デッドロックした移動窓プロトコルの空間時間図 • • . • • • • • ⁷¹

5.14実行時点133，変数busy [0]に関する潜在域フローグラフ . • • ⁷²

5.15グラフをほぼ下分に分割してデバッグ作業する際のCtの系列 • 73 5.16実行時点364，変数recved [0]に関する潜在域フローグラフ .. 76 5.17図5.14と図5.16から求まるダイス.• • • ^{• .}• • • • • • • • " ⁷⁷

5.18ダイスを用いたデバッグ作業におけるCtの系列• • • . • • • • . ⁷⁸ ³^.1 第 -段階における定義.• ^{• • •} • • ^.• • • • . • • ^{• •} • ^.. • • • ³⁶

3.2 第て段階における定義. • • • • • • . . • • • . . • • • • • . . • • ⁴²

昨日九表

6.1 対象とする入力言語の構文 • • • • • • • • . • ^{• .}• • ^• • . • • ^• ⁸³

6.2 例題プログラムとその変数依存グラフ • . . • • • . • • • . . . • ⁸⁵

6.3 VDCを用いたスライス計算アルゴリズム • . • • • . • • • • • • ⁸⁷

6.1 スライス計算アルゴリズムにおける時間計算量の比較(文の数

をS，変数の数をVとする) • . • • . • • • • . . • . • • • . • ⁹²

Vll

(8)

Vlll

表酢見

第1章序論

1.1

研究の背景と目的

近年の半導体技術の進歩は計算機ハードウェアの高速化，軽量化をもたらし，各人が1台のワークステーションを占有できる環境をもたらした. また，

通信技術の発展は，そのようなワークステーションを相互に高速に結び付け，

地理的に遠く離れた2地点間で様々な情報の交換を行うことを可能とする計算機ネットワークの出現をもたらした.

このような環境では，地理的に分散された広い範聞に機々な計算機資源‘が丹j 意されることになる. そのため，特別な支援環境なしでは，利用者が必要な計算機資源の存在位置を把握することに手間取ったり，計算機資源の利用率の不均衡が生じたりする. そこで，このような環境下で株々な計算機資源を有効利用するための支援環境として，分散システムが提案され構築されてきた.

分散システムを実現するためのプログラムは分散プログラムと呼ばれる. 分散プログラムは，地理的に隔たった複数の計算機上のプロセス群から成る. これらのプロセス群が，利用者の要求を満たすために，必要な'情報を計算機ネットワークを通じて相互に交換しつつ，同時並行的に実行される. 例えば，資源、

を有する計算機上のサーバ・プロセスと利用者が利用している計算機上のクライアント・プロセスとが同時に動作し相互に情報交換をして利用者の要求を満たすならば，これは簡単な分散プログラムである.

複数プロセスが情報を相互に交換しつつ同時並行的に動作するプログラムは，特に資源の確保と開放が必須となる場合には，デッドロックに代表される

l

(9)

2 第1章序論

fðJ期問題を起こし得る. 逐次プログラムでは，同ー人力を与えることによってプログラムの動作を完全に再現することが可能であることから，デバッグ作業は比較的容易であった. しかし7 同期問題を生じるようなプログラムは，その性質上，同期誤りに至る実行過程を正確に再現することが難しいこと，さらには，複数プロセスの状態を同時に考慮する必要があること等から，デバッグ作業は逐次プログラムのそれと比較してはるかに困難である.

このような背景のもとに，分散プログラムをデバッグするための手法を確立することが，本研究の目的である. 本論文では特に，手順的デバッグ法(al

gorithmic debugging)を分散プログラムに適用する方法についてまとめた.

伝統的なデバッグ手法ではプログラマが主導権を握り，デバッグ支援システムはプログラマからの質問に答える受動的立場にあるのに対して，手順的デノ〈ツグ法はデバッグ支援システムが主導権を握り，能動的にプログラマに質問を繰り返すことによって次第に誤り位置を絞り込んでゆく方式である.

なお，複数のプロセスが同時並行的に動作するプログラムには，大きく分類して，並列処理.計算機上で動作する帯列プログラム，単一CPU上で時分割方式によって尖行される複数プロセスから成る並行プログラム，分散システム内の復数計算機仁で実行される分散プログラムの3種類がある. これらのプログラムはよく似た特性を持ち，テストやデバッグに関する共通した困難があり，

共通した研究課題がある. そこで，本章においては，特に断らない限り，これらを総称して「並行プログラム」と呼ぶことにする.

1.2

従来の研究の概観

1.2.1 並行プログラムにおけるデバッグの困難さ

複数プロセスが[JJ時並行的に動作するプログラムのデバッグには，解決すべき次のような課題がある [⁴⁸]^.

1. 競合から生じる非決定性への対処.

2. 探針による擾乱(probe etfect)への対策.

3. 同期のとれた大域時計(global clock)の欠如.

1.2. 従来の研究の概観 3

4. 逐次型プログラムと比較して複雑さがはるかに大きいことへの対処.

競合とは，複数プロセスが並列に処理を進めるために，プロセス群の動作のタイミングによっては異なる結果を生じる場合があることを云う. 例えば， 2 つのプロセスから成るプログラムの一方のプロセスがあるメモリに啓き込みを試み，別のプロセスが同一メモリを読み出す場合，後者のプロセスのふるまいは，書き込みと読み出しの実行順序によって異なる. これにより，プログラムのふるまいに非決定性が生じることになる. したがって，このようなプログラムは，たとえ同一入力を与えて再実行したとしても同4の結果が得られるとは限らない.

透次プログラムをデバッグする古典的方法は，実行中のプログラムを中断して状態を調査し，実行を継続するか，あるいはさらに前の時点で実行を中断するために先頭から再実行することの繰り返しによっている. このようなデバッグ方式を繰り返しデバッグ法(cyclical debugging)と呼ぶ. この万式は，同一入力を与えたプログラムはそのふるまいが再現されることを前提としているが，複数プロセスが同時並行的に動作するプログラムにおいては， FHhlJtが{呆証されないために，この方式を適用することは困難である.

非決定性に対処するために，プログラムのふるまいを観察・記録して再現させようとする試みは，逆に，誤り発生状況の再現を困難にしてしまうことがある. これを「探針による援活し」と呼ぶ [²⁶]. 競合を含むプログラムにおいては，デバッグ用に追加した文の実行や表示行為が，ただでさえ厳しい競合の状況をさらに変更してしまうことになり，関心のあるふるまいの発生率を下げてしまうためである.

さらには，このようなプログラムにおける「大域的状態」の概念があやふやであったり，時に全く存在しないことさえある[⁴¹]. 大域的状態を完全に定義するためには，すべてのプロセス間で同期のとれた大域時計が必要となるが，

一般にこれは存在し得ない. したがって，各プロセスで生じた事象(event)の正確な順序を決定することが困難となり，プログラムのふるまいの再現が困難なもう1 つの理由となっている.

また，これらの事象が探針による擾乱なしに観測可能であり，それぞれが正確に順序付けできたとしても，この履歴は膨大な量となる. この大量の情報の

(10)

4 第l章序論

中からデバッグに必要な情報を効率良く取り出し，解析するためのツールが，

プログラマにとって必要となる.

これらの術究課題に対して，これまでに様々な試みが成されてきている. それらの試みの概略について，次節以降に述べる.

1.2.2 複数の逐次デバッガの統合

ここで述べる並列デバッガは並列プログラムを構成する任意のプロセスに接続することができる機能を従来の逐次デバッガに持たせて，これを複数のプロセスそれぞれに接続して利用するものである. またこのようにして接続したデバッガ群を親デバッガから制御できるようにしたものもある. これらは逐次デ、パッガの単純な拡張ではあるが，マルチウインドウ環境が普及した現在では，実用的な意味を持つ. すなわち，各ウインドウ上で各プロセス用デバッガを起動し表示させておくことにより，フログラマは望みのプロセスに望みのコマンドを与えて観測することが可能となる. しかしながら，この方式では，プロセスの数がある程度以kになるとプログラマはこれを使いこなせなくなる.

さらに，複数のプ口セスに対して同時に命令を与えることが困難であり，最初のプロセスと故後のプロセスとの命令投入時間の差が探針による擾乱を引き起こすことにもなる.

Sun Microsy stemsの dbxtool[72]， GNUの gdb[73] は，いずれもこの範障に人るデバッガである. それぞれ UNIX上の複数プロセスにそれぞれデバッガを後続してデバッグを行なうが，このとき動的プロセス生成(UNIXでは forkシステムコール)には対応できない. また，プロセス群に同時に命令を与えることができないので， 1つのプロセスを停止する命令を発行しても別のプロセスは実行を続け，その結果として探針による擾乱(例えば，実際には起こ

り作ないタイムアウトが性じる等)が発生する.

Sequent Corp. の pdbxは，マスタデバッガを置き，これが他のデバッガを制御する方式を採る[60]. ここでは「すべてのプロセスを停止せよJ Iすべてのプロセスを再開せよjという命令によって上記の探針による擾乱を抑えることができるが，もちろん，命令が各プロセスに与えられる時刻が正確に同時であるわけではないので，完全ではない. 同様の方式としてGriffinのデバツ

ガがある. そこでは，カレントプロセス集合を定義することにより，命令をテえるプロセス群をプログラマが自由に定義できる[29].

このようなデバッガにおけるブレークポイントの機能に関しても，特徴的な研究がなされている. ブレークポイントの設定方式は，ソースプログラム上の特定の文に到達した場合，ある条件が満たされた場合，特定のメモリ(変数領域)がアクセスされた場合，例外が発生した場合等，従来の逐次デバッガと同様である. しかし，停止直後の動作として，当該プロセスだけを停止すること，全プロセスを停止することのどちらも必要となる[59]. これに関連して，

メッセージ渡し(messag e pa.ssing)を通信機構として用いる並列プログラムにおいて，矛盾のない状態ですべてのプロセスを停止させるためのアルゴリズムが報告されている[49].

また，逐次プログラムのデバッガには必要のなかった，新たなハードウェアやOSへの要求が必要とされる[48]. それは，任意のプロセス開通信を捕獲する能力，任意にメッセージを修正，挿入，削除する能力，タイムアウトに使用される時計を制御する能力である.

1.2.3 ふるまいの再現

プログラム実行時の事象を記録することにより，実行終了後にこれを調査してプログラムのふるまいを調べることも，動作を再現するための補助情報として利用することも可能となる. この目的のために記録された事象群のことを事象履歴(eventhistory)と呼ぶ[48].

プログラム実行時に事象を記録することは，本来の目的を達成するために行われる動作ではないので，当然ながら傑針による擾乱を引き起こす原肉となり得る. そのため，最小限の記録によって最大の情報を取り出せることが望まれる. どのような事象を記録すべきかは記録した事象履歴をどのように利用するかに依存する.

1. 視覚化用一事象によってプログラムの状態が連続的に変化していくさまをプログラマに見せるために記録する場合は，各事象についての最小限の情報があるだけで良い. ある1つのプロセスにおける事象の生起順序を記録するだけでも，プログラムのふるまいの異常を発見することに

(11)

6 第1章序論役立つ.

2. 再現用一事象履歴を用いてプログラムの実行を再現するために記録する場合は，各フ。ロセスにおける事象の生起順序の他に，別プロセスの2 つの事象聞の順序関係をも記録する必要がある. このためには，プロセス開通信，共有変数アクセスに関する事象のすべてを記録すれば十分であることは明らかであるが， LeBlanc & Mellor-Crummey はこの情報を削減できることを示した[43]. その手法は，再実行時にプログラムがメッセージ内容を再生成できるという事実に基づいている.

3. シミュレーション用一事象履歴を用いて任意の単一プロセスの動作環境をシミュレートするために記録する場合はそのプロセスから観測できるすべてのイベントに関するあらゆる情報が必要となる. 例えば，プロセス間通信の場合ならメッセージの送受信時刻とともにその内容が必要である.

事象を記録する手段としてはソースプログラムに適切な文を挿入する方法，オペレーテイング・システムのシステムサービスに予を加えておく方法，

メモリパスを直接監視する方法がある. 最後の方法を除いて，記録すること自体がプログラムのふるまいのタイミングを変えてしまう恐れがあるため，探針による援乱に注意を払う必要がある.

事象属医を1記録する場合，これらの事象は半順序によって関係付けられる.

すなわち，事象を各プロセスごとに独立して見た場合には，そのプロセス内で令mrur.関係を構成し，これらの全順序関係にある事象同士が，プロセス開通信あるいは共有変数アクセスの事-象によってさらに関係付けられることによって，全体として判IIR序を構成する. LeBlanc & Mellor-Crummeyは，この事実を素直に適用した下法を用いて事象履歴を取っている[43]. また，程と午ぬ[12] は，半順序関係を記録する際に生じる探針による擾乱の度合を減少させるため，半順序透過性(partial order transparency)の概念を導入した.

これに対して， T ravelerではプログラム中のオブジェクトごとに活動線(life line)と呼ばれる履歴の記録を取る[46]. しかし，半順序関係を得るための一般的手法は，論理時間を示すベクトルを生起事象に対応付けることである[22，

30]. このベクトルはベクトル時計(vectorclock)とも呼ばれる[47].

このようにして記録した事象履歴を用いてある種の制御実行を行なうことにより，プログラムの再実行，すなわち，ふるまいの再現を行なうことが可能となる [^17，43]. この機能を再演(replay)と呼ぶ. P}7寅機能を有するデバッガでは，従来通りの繰り返しデバッグ法を用いたデバッグ作業が可能となる. ただし，事象履歴の記録の際に探針による擾乱が生じているかもしれないことに注意しておく必要がある.

また，事象履歴を自動検査システム，解析システム，検証システム等に投入してデバッグ作業を行なう試みもある. DISDEBはメモリパスを監視し，プログラム実行前に記述されたある種の仕様が満たされているかどうかを，実時間で検査する[42]. Ada用の同様のシステムHARDもある[19]. IDDでは仕様記述に時相論理を用いることにより， Iいつか・・・・・・が成り立つJといった検査が可能となっている[31]. T SLはAdaを対象として事象履歴の仕様に対する検証を行なう[32]. EDLはデバッガと言うよりは事象記述言語ではあるが，これらと若干異なる立場を取っている[6]. このシステムでは，他の手法とは逆に，事象履歴に記録されている低位の事象から，より高伎の十111象化された事象を定義する手法が提供され，より高位の事象によって検説得を行なうことを目的としている.

1.2.4 複雑さの増大への対処

膨大な量の事象履歴と関連して，これらをいかにプログラマにとってわかり易く提示するかという課題がある. 特に並列プログラムの場合には，複数プロセスにわたる事象群の関連をプログラマが把握することが困難であるがゆえに，その提示方法に玉夫が必要となる.

このような目的で利用される代表的な予法に，時間-プロセス空間(time process space)を用いる方法がある. これは，表示画面の2次元空間の a方を時間経過の軸に，他方を個々のプロセスに割り当てることによって，各プロセスのふるまいをプログラマが直観的に把握できるようにしたものである.

Griffinのシステムは，この空間をテキストで表示し[29]， IDDはグラフィックスを多用している[31]. 特に IDDでは，メッセージ通信が線で明確に表示されるため，情報の流れを掴み易いという特徴がある. また， IDDやPPUTT[24]

(12)

8 第1章序論

では，フィルタを用いることによって，来示すべき情報をプログラマが選択することが可能となっている.

時間一プロセス?問を用いる方法は，大域時計の存在を仮定した方式であるが，これを必要としない方式も提案されている. そのためには，メッセージ送受信事象に恭づいて，事象の発生!順序だけを考慮して並べる並行状態マップ (concurrency map)を用いる[⁶³]. 並行状態マップも時間と空間の2次元座標を持つが，時間軸は正確な時刻を表すものではないことに注意が必要である.

時間の流れを画面上の1つの軸として表現するのではなく，アニメーションの形で表現する手法も研究されている. Belvedereでは，時間の流れに沿って各プロセスの状態をアニメーション表示する³⁸[ ]. このとき，プログラマは，プロセッサの状態，通信チャネルの状態，データの状態等の視点から表示させるようにシステムに指示することができる. この視点の考えかたをさらに進めて，プロセスの存伝を表すアイコンの表示位置や，どの情報を表示させるのかを指示するフィルタ等を統合した「視界(vicw) Jをプログラマが定義し利月jできるようにするぷみがVoyeurである [⁶²]^.

時[IIJ- プロセス空間jによる表ぷ，アニメーションによる店法いずれも，プロ

グラマがプログラムのふるまいを佐観的に把握することが可能となり，プログラムの「あやしい」部分をすみやかに絞り込むことに威力を発揮する. しかしながら，異常状態に陥る過程を追求し，原因を特定するためには情報が乏しく，事象履歴をmいたプログラムの再現手法によらねばならない.

1.2.5 静的解析

探針による擾乱を避けられないのであればソースプログラムを静的に解析することによって，あらかじめ誤りの原因となりそうな部分を特定し修正しておくことは十分に価値のある作業であろう. TaylorとOsterweil は，プログラムをフローグラフによって表現し，その各頂点(これはプログラムの文に相

当する)に対して gcn (値の生成) ，kill (値の死滅)なるラベルを付加し，

与えられた頂点において与えられた変数の値が live(死滅していない )，avail (利用可能)であるかどうかを計算するアルゴリズムを与えた [⁶⁴]^{. これによ}

り，

-初期化されていない変数の参照.

-値の設定と参照が同時に行われ得る変数.

-一度も参照されない変数.

-値が不定となることがある変数.

-スケジュールされていないプロセスの完了を待つプロセス.

-完了済みプロセスの完了を待つプロセス.

-自分自身と並列実行されるようにスケジ、ュールされるプロセス.

を静的解析によって検出できる.

プログラムテキスト上の2点が並列に実行され得るかどうかを解析することも有用である. 例えば 2点が同一メモリへの書き込み操作である場合には並列アクセス誤りを検出できることになる. これに関しては，様々なす語での様々なアルゴリズムが提案されており，実際のデバッギングツールに組み込まれているものも多い4，9， 48， 65[ ]^.

1.2.6 手順的デバッグ法

繰り返しデバッグ法に代表される伝統的デバッグ手法は，プログラマがデバッグ環境に指示を与えで情報を予に入れ，次にすべき作業を決定することの繰り返しによって進められる. その意味で，プログラマ主導のデバッグ手法である. これに対して，手順的デバッグ法はデバッグ環境の側が主導権を握り，

デバッグすべきプログラムに関する質問をプログラマに対して繰り返し行なつことによって，誤りを含む範囲を半自動的に絞り込んで、ゆく手法である.

手順的デバッグ法に関する研究は，論理型プログラムを対象としたShapiro の研究に始まる [⁶¹]. Shapiroのシステムは，プログラムの実行終了後に，実行中に利用されたProlog節の正誤についてプログラマに質問を繰り返すことによって，誤りを含む節を特定する. この手法を素直に拡張して手続き型言語に適用したものがGADTである²⁵[ ]. このシステムでは，対象プログラム中

(13)

10 第1 章序論

の大域変数をすべての'f:.続きと関数の引数に埋め込み，その大域変数への参照を引数への参照へと変換してプログラム中の副作用を消去することによって，

Shapiroの手法を適用できるようにしたものである. しかしながら，この方法では，誤りを合む範聞として手続きまたは関数を特定できるだけであり，その中のどの文が誤りであるのかまでは特定できない. これを，プログラムのスライス化技法 [1 ， 68 ， 69]を応用して解決する手法も提案されている[2，40，45].

特に下村は，ある文が誤りであることを特定するだけでなく，文の記述漏れまで特定することのできる方法を提案した[82，83].

手順的デバッグ法を手続き君!!言語で書かれた並列プログラムに適用する試みは，研究が緒についたばかりであり，発表済みの成果はない. これは，次の理

由によると考えられる.

1. 実行時点の定義がはっきりしないこと.

2. プログラムの再現に困難がともなうこと.

手順的デバッグ法においては，ある実行時点におけるプログラム状態の正誤をプログラマが判断しなくてはならない. したがって「実行時点Jの定義は重要である. 逐次プログラムにおけるプログラムの「実行時点jの定義は，実行の流れがlつしか存在しないことから，明確である. しかし，並行プログラムでは実行の流れがプロセスの例数と同じだけ存在する，この場合，各プロセスの実行時点の匹積をJIjいてプログラムの実行時点を定義することは臼然ではあるが，プログラムの進行にともなってプロセスの個数は動的に変化し得ることから，その扱いは難しい. しかも，各プロセスが独立に進行することが可能なので，その数は組み令わせ論的に増大してゆく. また，プログラマが，ある実行時点におけるプログラム状態の正誤を判断するためには，その状態を再現で

きなくてはならない. 第1.2.1節で述べた通り並行プログラムには探針による援乱が発生するため，その状態再現は困難である.

1.3 研究の特徴

伝統的な繰り返しデバッグ法を用いる限り，並列プログラムのデバッグ作業は逐次プログラムのそれと比較してはるかに困難を伴う. そこで本研究では，

1.4. 論文の構成 11

デバッグ環境の側が主導権を握り，プログラマに質問を繰り返し行なうことによって誤りの存在する範囲を絞り込む手順的デバッグ法を，手続き�言1iEで告:

かれた並列プログラムに適用するノJ法について考察した. この手続き型計ü百では，メッセージ渡しによる情報交換を行ない，共有メモリはmいないものとする. また，本論文では，簡単のため動的なプロセス生成については扱っていないが，これに対応するような拡張は谷易である.

本論文で述べる手順的デバッグ法は，大きく2つの段階から成る. 第一段階では，デッドロックに代表される同期誤りを引き起こす原因となった部分プログラムを特定する. このとき，前節最後に挙げた両問題に対して， Damodaran

Kamal _&Francioniの中断点前線(suspend pointfrontier) [18]を用いることによって解決をはかった. 第二段階では，そのようにして特定した部分プログラムから，誤りや記述漏れを文のレベルで特定する. この段階では，下村の手法[82，83] を若干拡張して用いた.

手順的デバッグ法を用いれば，プログラマはデバッグ環境の誘導に従って質問に答えてゆくことで，誤り部分を半自動的に特定できる. その際，デバッグの対象となるシステムが，時間経過にともなってどのようにふるまうかに注意を向けるのではなく，ある2つの実行時点の問にどのような機能が達成されていなければならないのかに注意を向けておけば良い. すなわち，繰り返しデバッグ法において必要であった， rどのように進行しているか(過程) Jを犯握するのではなく， r何が達成されたか(機能) Jに注目することによって，

デバッグ作業を行なうことができる. これはある意味で，デバッグの作業プロセスをプログラマ側からデバッグ環境側に移すことによって，プログラマの負担を軽減したものと考えることができる.

1.4 論文の構成

本論文は，全7章から成る.

第1章は序論であり，研究の背景と目的，従来の研究の概観と本研究の特徴について述べた.

第2章では，既存の予)眼的デバッグ法に関してまとめこれを抽象化する.

Shapiroに始まる手順的デバッグ法は様々な型のプログラミング言語に対し

(14)

12 第1章序論

て提案されており，その外見は」見異なる. しかし，それらを抽象化してみれば，プログラムの実行を有向グラフとしてとらえ，実行状態の正誤を基にしてこのグラフを刈り込む作業であると45・えられる. すなわち，

1. プログラムの実行を実行時点の集合としてとらえ，

2. 実行時点を半順序によって関係付けて有向グラフに表現し，

3. プログラムの状態をグラフの切断によって表現し，

4. 2つの切断によってこのグラフを

(a)切断以前の状態はすべて正しく，誤りの存在しない部分 (b) プログラムの誤りが存在する部分

(c) 切断以降の状態はすべて誤りであり，プログラムの誤りが存在し得ない部分

の 3つのグラフに切り分け，

5. 4( a)と4(c)の間に新たな切断を設定し，その状態の正訟をプログラマに問い合わせることによって4(b)の部分を絞ってゆき，

6. 最終的にOないし 1例の実行時点を特定する.

作業であると戸-える. なぜこのことが言えるのかについて，既存の予法の概略を述べて明らかにする.

第3市は，本論文の絞となる章であり，第2章において抽象化された手順的デバ、ソグitを分散プログラムに適用するHì-去について述べる.

まず，本論文において捉-案する手法を正雄に述べるための準備として，対象とするプログラミング豆諸の定義デバッグ環境やプログラマの能力に関する似定について述べる.

次に，第一段階として，同期誤りを引き起こした部分プログラム群を特定する}j法について述べる. この段階では，半順序関係としてLamportの肉果先行(happened before)関係[41]を，切断としてDamodaran-Kamal& Fran

cioniのsuspend point frontier[ 18]を用いる. そのため，ここで用いるグラフ

1.4. 論文の構成 13

は，空間時間凶(space-time diagram)となる. この段階での主日的は，同期誤りを引き起こした部分プログラムを特定することなので，次には，このグラフにおける同期誤りとは何であるかを定義し，その特性について述べる. 最後に，部分プログラムを特定するためのアルゴリズムを提示する.

さらに第二段階として，第一段階において特定した郎分プログラムから誤りを含む文を特定する方法について述べる. 既に前段階で同期誤りが特定できているので，第二段階における作業は逐次プログラムのデバッグ作業とやiJら変わりはない. ただし，メッセージ渡しによる値の受け渡しをどのように扱うかが残された問題である. しかしながら，前段階において中断点前線を用いていることによって，メッセージの送信時点と受信時点が正確に再現できるため，これを代入文と同様に扱うことが可能となる. したがって，下村の手法をほぼそのままの形で適用できる. ここでは，半順序関係として，変数値の設定と参照に関する定義依存関係，文と文との問での制御定義依存関係，分岐方向が変化した場合に変数値が変わり得ることを示す分岐設定漏れ依存関係，配列の添字式の値によっては特定の要素の値が変わり得ることを示す配列設定漏れ依存関係の4積類を用いる. また，グラフの切断については明らかである.

第4 章では，第 3章において，誤りの存在範聞を効率良く絞り込むために利用できる発見的手法をいくつか挙げる.

第3章に提示した誤りの存在範囲を絞るためのアルゴリズムは決して効本的なものではない. 使い勝手の良い実用的なデバッグ環境を実現するにあたっては，発見的手法を用いた効率の良い方法を検討することは重要な課題である.

そのような発見的手法を，本章においていくつか.0í明する.

第5章では，前章までに述べた方式の実際の動作について，例題を用いて具体的に述べる. 用いる例題は，同期問題として良く知られているís人の村学者の食事問題J [20]を簡単化したí2人の哲学者の食事問題jと，文の記述誤りによってデッドロックが生じるような「移動窓プロトコル (sliding window

protocol)J [35]に関するものである. 前者では，デッドロックが検出されたときに，その原因となる誤りが存在する部分プログラムをどのようにして特定するのかについて述べ， 1つの解決手法について簡単に触れる. その際，この方式によって危険領域を特定できることも示す. 後者では，デッドロックの原因となる誤りを文のレベルで特定するまでの過程について述べ. 第3章に提示

分散プログラムの手順的デバッグ法に関する研究

九州大学学術情報リポジトリ

Kyushu University Institutional Repository

分散プログラムの手順的デバッグ法に関する研究

太田, 剛

https://doi.org/10.11501/3130974

Ro aωR no一O「noコqo一勺えnzwω

。宗弘襲.鍵MO司→玄HE邑侮

-《o

aωR OBV、ωnω一。

85Fω宮司司書変革

3旨

分散プログラムの

手順的デバッグ法に関する研究

太田 剛

1997年6月

もくじ

酢見

図

昨日九 表

第1章 序論

研究の背景と目的

従来の研究の概観

太田剛

昨日九表

第1章序論