大規模分散処理システムの検証の効率化に関する先行研究

２．大規模分散処理システムにおける検証

2.3 大規模分散処理システムの検証の効率化に関する先行研究

本節では大規模分散処理システムにおけるシステム検証の効率化に関する先行研究をレビューする．最初に大規模分散処理システムの検証の効率化について，次に従来の検証である従来の情報システムにおける検証の効率化の研究について紹介する．システム検証で発生する問題に関する研究は，3,4,5 章の各章で記述する．

1.1 節で記述したように，対象とする大規模分散処理システムは，近年の BigData に対応するシステムとして注目されている．しかし，以降に示すように，大規模分散処理システムに関する論文やソフトウェアの検証に関する論文はあるが，大規模分散処理システムにおけるシステム検証の効率化に関する研究は報告されていない．報告の少なさは，大規模分散処理システムが注目されて間もないため，従来の情報システムと比較すると開発例が多くないことや，企業にとって検証の効率化は費用削減のアドバンテージになることから，率先して公表をしないことが一因と考えられる．

倉持[24]は，大規模分散処理システムにおいて，処理のトレースが可能なライブラリや，サービス間の呼び出し関係と処理時間をトラッキングする API を開発して利用する報告をしている．また，

LIU ら[25]は，実際に実行されているプロセスの動作と，定義された仕様の動作とを自動的に比較するツールを開発し利用する報告している．これらの方法は，工数をかけてライブラリや API やツールを開発する必要があるが，機能が少なく開発工数が開発全体に影響しない場合，デバックの効率化に効果的である．その他には，Jerry Gao ら[26]，坂西ら[27]，Haryadi S. Gunawi ら[28]，Sergiy VILKOMIR[29]，Lian Yu ら[30]，Leah Muthoni Riungu ら[31]は，ホストマシン上の仮想的なバーチャルマシン（VM) で構成された大規模分散処理システムにおいて，従来の情報システムにおけるシステム検証と比較し，ハードウェアに依存する検証や実運用の環境でのシステム検証を不要とする報告をしている．この方法は，物理的なマシンではなく VM を利用する場合に有効である．

一方，従来の情報システムにおける検証については，Cem Kaner ら[41]，Glenford J. Myers ら [42]，IEEE の SWEBOK[14] で詳しく報告されている．これらは，検証の方法について記載されており，大規模分散処理システムの検証に全て適用が可能である．しかし，1，2 章で記述したとおり，

大規模分散処理システムに特有である大規模なデータ量で，多くのマシン台数を利用する検証作業は，従来の情報システムにおける方法では時間を要してしまう．期間が定められた商用開発においては，時間を要したことで期間を延伸して検証を完了することは許されない．従来の情報システムにおけるシステム検証で利用する技術を，1.2.2 項で示したアクティビティの分類を利用して以下の表 7 に示す．

表 7. 従来の情報システムにおいてシステム検証で利用する技術

アクティビティ利用する技術適用可否

（可：○，否：×）

計画  プロセス計画

 成果物の決定

 工程およびコスト見積もり

 資源割り付け

 リスクマネジメント

 品質マネジメント

 計画マネジメント

○

○ テストケース

生成

 論理網羅テスト（全数テスト）

 組み合わせテスト（直交表，HAYST 法，オールペア，k-way）

 同値分割，境界値分析

 原因-結果グラフ（デシジョンテーブル，CFD 法）

 機能テスト

 ユースケース

 統計的テスト

 シナリオテスト

 リスクベース

 欠陥仮設法（エラー推測，異常値，特異値分析）

 例外ユースケース（探索テスト）

 状態遷移テスト

 モデル検査（カバレッジ）

 タイミングテスト

 静的解析によるピンポイントテスト

 ランダムテスト（モンキーテスト）

○

× テスト環境の

開発

 ソフトウェアエンジニアリングツール

 テストジェネレータ

 テスト実行フレームワーク

 テスト評価ツール

 テストマネジメントツール

 性能分析ツール

 保守ツール

実行  動的検証

 ホワイトボックステスト

 パステスト（組み合わせテスト，エラー推測，欠陥仮設法）

 トランザクションフローテスト（タイミングテスト）

 データフローテスト（同値分割，境界値分析）

 状態遷移（グラフ）テスト（原因-結果グラフ）

 ブラックボックステスト

 ドメインテスト（ユースケース，統計的テスト，シナリオテスト，リスクベース，例外ユースケース）

 ランダムテスト

 静的検証

 構文テスト

 論理テスト（カバレッジ，モデル検査，静的解析）

○

△（構文テストは適用可）

テスト結果の評価

 テストされるプログラムの評価

 テスト計画およびテスト設計におけるプログラム計量

 フォールトタイプ／クラス分け／統計

 フォールト密度

 ライフテスト／信頼性評価

 信頼度成長モデル

 実施されたテストの評価

 カバレッジ／徹底度計量尺度

 フォールトの人為的種まき

 得意仕留め得点数

 種々の技法の比較および相対的有効度

○

問題報告／テストログ

 データの収集

 データの分析および情報プロダクトの開発

 結果の伝達

○

欠陥追跡欠陥／増補／論点および問題追跡ツール ○

計画アクティビティで利用する技術は，プロセス計画，成果物の決定，工数，工程，およびコスト見積もり，資源割り付け，リスクマネジメント，品質マネジメント，計画マネジメントである[14]．

 プロセス計画は，ウォータフォール，スパイラル，進化的プロトタイピングといったソフトウェアライフサイクルモデルの選定，および適切なソフトウエアライフサイクル・プロセスの適応化，および割り

付け配置の技術である．

 成果物の決定は，タスクそれぞれから成果物を仕様化し決定する技術である．その過程において，先に開発した成果物や他のプロジェクトで開発した成果物の再利用が検討される．

 工数，工程，およびコスト見積もりは，タスク，入力，出力の要素それぞれの工数として過去の開発における規模対工数データが利用および参照可能であれば，そのデータに基づいて見積もりをする技術である．利用および参照ができない場合は，エキスパートによる判定のような開発のデータを分析する方法で見積もりをする．この工数，工程，およびコスト見積もりの技術は，類似なシステム開発のデータが存在する場合に有効である．そのため，類似なシステムが少ない大規模分散処理システムでは適用ができない．

 資源割り付けは，ガントチャートなどを用いて装置，設備，および人員をタスクに割り当てる技術である．この資源割り付けの技術は，工数，工程，およびコスト見積もりの技術の結果を反映しており，結果が正しい場合は有効である．見積もりの技術が確立していない大規模分散処理システムでは適用ができない．

 リスクマネジメントは，意思決定樹やプロセスシミュレーションによるリスク査定法により，リスクの識別と分析を行いリスクの軽減，リスクの発生による処理を行う技術である．品質マネジメントは，プロダクトに対して適切に定量的，定性的に定義し，全プロセスに渡って実施されるプロダクトに対する検証と妥当性確認をする技術である．

 計画マネジメントは，プロジェクト全体をどのようにマネジメントするか，および計画そのものをどのようにマネジメントするのかをマネジメントツール[15]を活用しながら計画する技術である．

上記のとおり，プロセス計画，成果物の決定，リスクマネジメント，品質マネジメント，計画マネジメントの技術は，どのソフトウェア開発に適用可能な技術である．しかし，工数，工程，およびコスト見積もり，資源割り付けの技術は，大規模分散処理システムでは適用ができない．

テストケース生成アクティビティで利用する技術は，論理網羅テスト，組み合わせテスト，同値分割，境界値分析，原因-結果グラフ，機能テスト，ユースケース，統計的テスト，シナリオ，リスクベース，例外ユースケース，欠陥仮設法，エラー推測，状態遷移テスト，モデルチェッキング，タイミングテスト，静的解析によるピンポイントテスト，ランダムテストである[42]．

 論理網羅テスト（全数テスト）は，プログラムのソースコードを網羅的に実行する技術である．

 組み合わせテスト（直交表を用いたテスト）は，テストケース生成の技術を組み合わせて検証する技術である．任意の 2 因子についての組み合わせを決定するために，直交表を利用する．

 同値分割は，2 つ以上の同値のテストケースからいくつかのテストケースを選択する技術である．

 境界値分析は，テストケースで入力条件と出力条件から 1 つまたは複数個の要素を選ぶ技術である．

 原因-結果グラフ（デシジョンテーブル）は，原因-結果グラフのツールを使って問題の摘出効果の高いテストケースを選択する技術である．原因-結果の判定の組み合わせを決定するために，

デシジョンテーブルを利用する．

 機能テストは，システムの機能が規定された役割や処理ができているかどうかを確認する技術である．

 ユースケースは，ユーザの利用シーンを想定した検証の技術である．

 統計的テストは，統計的に利用が多い代表的なテストケースを作成し検証する技術である．

 シナリオテストは，業務を想定したシナリオを作成し検証する技術である．

 リスクベースは，バグが出た場合の影響度を品質リスクと捕らえ検証期間の早い段階で品質リスクを低減する検証の技術である．

 例外ユースケースは，ユーザの利用シーン以外やトラブル状態を想定した検証の技術である．

 欠陥仮設法は，品質特性から欠陥の兆候の仮説を立て，仮説に基づいて検証をする技術である．

 エラー推測は，経験から問題を抽出できそうなテストケースを作成し検証する技術である．

 状態遷移テストは，状態遷移図や状態遷移表に基づいて検証する技術である．

 モデル検査は，システムを有限後の状態を持つモデルで表現し，システムが満たすべき性質がモデル上で成り立つかどうかを，モデルが取りえる全ての状態およびパス上で機械的かつ網羅的に検証する技術である．

 タイミングテストは，イベントの同時発生などタイミングが関係する箇所に着目し検証する技術である．

 静的解析によるピンポイントテストは，ソースコードを解析してコーディングルールに合っているかどうかや，データフローや制御フローを解析し，エラーが発生しやすい箇所を分析し検証する技術である．

 ランダムテストは，ランダムな入力を与えて検証する技術である．

上記のとおり，ユースケース，統計テスト，シナリオテスト，リスクベース，欠陥仮説法の技術は，どのソフトウェア開発に適用可能な技術である．論理網羅テスト，組み合わせテスト，同値分割，境界値分析，原因-結果グラフ，機能テスト，例外ユースケース，状態遷移テスト，モデル検査，タイミングテスト，静的解析によるピンポイントテスト，ランダムテストは，大規模分散処理システムでは，検証項目数が多くなることから適用ができない．

テストケースが膨大な場合，品質を確保し効率的に検証をするには，利用する検証技術は，図 12 の縦軸と横軸が交差する中心近くに位置する検証技術の必要がある．これは，横軸の「ピンポイント」に位置する検証だと項目の網羅性がなく，それ以外だと大規模分散処理システムで検証項目を抽出すると項目数が多くなってしまうからである．しかしながら，どの技術を使えば品質を確保し効率的に検証ができるかは明らかになっていない．

ドキュメント内大規模分散処理システムの検証の効率化に関する研究 (ページ 50-61)

２． 大規模分散処理システムにおける検証

2.3 大規模分散処理システムの検証の効率化に関する先行研究

２．大規模分散処理システムにおける検証