• 検索結果がありません。

WS3 monden 最近の更新履歴 ソフトウェアエンジニアリングシンポジウム2012

N/A
N/A
Protected

Academic year: 2018

シェア "WS3 monden 最近の更新履歴 ソフトウェアエンジニアリングシンポジウム2012"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

多変量予測モ におけ 目的変数 選択について

門田暁人†

ソフ 開発工数 予測 開発工数 目的変数 ,ソフ 残存バ 数 予測

バ 数 目的変数 こ 自然 あ ,生産性 規模あ 工数 予測

規模 乗 工数 出 こ 可能 あ , 均要員数 予測 ,開発期間 乗 工

数 出 こ 可能 あ ,バ 密度 予測 ,規模 乗 バ 数 出 こ 可

能 あ い 方法 採用 ,一見,同 結果 得 う 思わ ,実際 異

結果 得 本論文 ,問題提起 ー 示

On Selection of Objective Variables in Multivariate Predictor

Models

Akito Monden†

To estimate the software development effort, it seems clear that the objective variable is the effort. But is it really clear? We could estimate the productivity; then, derive the effort by multiplying it by the product size. Also, we could estimate the average number of staffs; then, multiply it by the project duration to derive the effort. Do these yield a same result? The answer is no. Similarly, to predict the number of bugs in a software module, the objective variable can be either the number of bugs or the bug density. This paper presents a problem statement and a case study.

1. じめに

ソフ 開発 い ,プ ネ ン

効果的 行う ,QCD Quality, Cost, Delivery

関 値 予測 く 見積 こ 必須 あ

特 ,開発工数 残存バ 数 多く 開発現場 い

重要 見積 対象 ,数多く 予測

提案さ ,用い

予測 ,当然 こ ,予測 い値

目的変数 設定 ソフ 開発工数 予測

開発工数 目的変数 ,残存バ 数 予測

バ 数 目的変数 こ 自然 あ こ ,

現実 ,生産性 予測 規模 乗 工数

出 こ 可能 あ , 均要員数 予測 ,開

発期間 乗 工数 出 こ 可能 あ ,

バ 密度 予測 ,規模 乗 バ 数 出 こ 可能 あ

こ う ,予測 い値 間接的 出

,同 結果 得 いう ,実 う い

筆者 予備実験 , プワ 重回帰分析

用い 構築 場合, バ 数 予測 バ

密度 予測 ,異 説明変数 選択さ 場合

あ ,全く異 得 異

得 いうこ , 適合度,残差分布, バ

性 違い いうこ あ ,い

優 い 自明 いこ ,

間接的 出 悪い 一概 いえ ,実際 両方

構築 ,統計的 良い 判断 方

選択 べ あ 思わ ,従来,こ う

間接的 出 い ほ 検討さ ,

間接的 出 検討 価値 あ う 不明

以上 問題提起 ,本論文 ,予測 い値

直接 出 場合 ,間接的 出 場合 い ,

程度予測精度 異 分析 本論文

,特 ,ソフ 開発工数 予測 対象 ,

ン 手法 ,線形重回帰分析 ン フォ

用い 事例 い 述べ

2. 実験

2.1. 概要

Desharnais [1] 用い ,開発工数 説

明変数 構築 場合 ,開発工数 間接

†奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology

(2)

的 出 構築 場合 い ,

残差,選択さ 変数,各変数 重要度 比較

予測 ,線形重回帰 , び,

ン フォ 用い

2.2. 条件

Desharnais ー 含 77 プ

全 用 い 構 築 説 明 変 数 ,

AdjFPs 調整済フ ン ョン ン , Duration 開発 期間 , ExpEquip 開発 ー 経験 数 , ExpProjMan プ 管理者 経験 数 , DevEnv 開発言語

用い DevEnv 2 値変数化 DevEnv1 DevEnv2 2 変数 設け

目的変数 ,(1)開発工数,(2)開発工数 フ ン ョン ン =規模あ 工数=生産性 ,(3) フ ン ョン ン 開発工数 =生産性 逆数 3

い 構築 (2) い ,予測後

AdjFPs 開発工数 (3) 予測後 ,予測値 逆数 AdjFPs 乗 開発工数 出 ,AdjFPs,Duration,ActualEffort 3

変数 い ,あ 対数変換 行 工数

予測 精度評価 ,対数変換後 値 対 行 構築 統計 ー R 用い,線形重回帰 対 変数選択法 , AIC(Akaike’s Information Criteria) 変数増減法 用い

2.3. 結果

実験結果 表1 示 表中,MMRE,MMER, MAE ,Mean Magnitude of Relative Error 相対誤差 均 ,Mean Magnitude of Error Relative to Estimate 分母 予測値 相対誤差 均 ,Mean Absolute Error 絶対誤差 均 あ

表 1 ,重回帰 , FP 工数

残差 さく 一方, ン フォ

, 工数 FP 残差 さく

こ こ ,開発工数 直接予測 く,間

接的 出 こ ,場合 効果的 あ こ

示唆さ

選択さ 説明変数 調べ こ ,3 重回帰

同 変 数 選 択 さ AdjFPs, Duration, DevEnv1, DevEnv2 一方, ン フォ

い ,各 け 各説明変数 重要度

尺度 あ IncNodePurity 分析 表 2 表 2

,各 け 説明変数間 IncNodePurity 相対的 差 着目さ い 表 ,い

フ ン ョン ン AdjFPs 重要度 最 高く,次 い ,Duration 開発期間 重要 高 ,

3番目以降 重要度 順序 ,各 異 い

こ こ 目的変数 変え あ 意味当然

あ 異 得 こ 確認

3. おわ に

本稿 ,(1)開発工数予測 ,(2)規模あ

工数 予測 規模 乗 工数 求

,(3)工数あ 規模 予測 , 逆数

規模 乗 工数 求 , 3 構築 ,こ

予測結果 等 く いこ 示

,開発工数 直接予測 (1) ,必

最適 わ , 残差 さい

限 いこ 示

今後 , 多く ー 用い ,工数 間

接的 出 他 例えば, 均要員数 予

測 ,開発期間 乗 工数 出

い 評価 いく予定 あ ,バ 数 予測

い 実施 予定 あ

謝辞

本研究 一部 ,文部科学省科学研究費補助金 基 盤研究(C):課題番号 22500028 基 い 行わ

参考文献

[1] Desharnais, J.M., “Analyse statistique de la productivitie des projets informatique a partie de la technique des point des function”, Masters Thesis, University of Montreal, 1989.

表 1. 実験結果

表 2. ン フォ け 各変数 重要度

MMR MM R MA

工数 . . .

工数/FP . . .

FP/工数 . . .

工数 . . .

工数/FP . . .

FP/工数 . . .

重回帰モ

ランダムフォ ス

目的変数 工数 残差

工数 工数/FP FP/工数

a . . .

x . . .

x P Ma . . .

A P . . .

. . .

. . .

目的変数

参照

関連したドキュメント

Thanks to this correspondence, formula (2.4) can be read as a relation between area of bargraphs and the number of palindromic bargraphs. In fact, since the area of a bargraph..

Keywords: continuous time random walk, Brownian motion, collision time, skew Young tableaux, tandem queue.. AMS 2000 Subject Classification: Primary:

The oscillations of the diffusion coefficient along the edges of a metric graph induce internal singularities in the global system which, together with the high complexity of

By considering the p-laplacian operator, we show the existence of a solution to the exterior (resp interior) free boundary problem with non constant Bernoulli free boundary

In our previous papers, we used the theorems in finite operator calculus to count the number of ballot paths avoiding a given pattern.. From the above example, we see that we have

Section 4 will be devoted to approximation results which allow us to overcome the difficulties which arise on time derivatives while in Section 5, we look at, as an application of

Shi, “The essential norm of a composition operator on the Bloch space in polydiscs,” Chinese Journal of Contemporary Mathematics, vol. Chen, “Weighted composition operators from Fp,

This paper presents an investigation into the mechanics of this specific problem and develops an analytical approach that accounts for the effects of geometrical and material data on