多変量予測モ におけ 目的変数 選択について
門田暁人†
ソフ 開発工数 予測 開発工数 目的変数 ,ソフ 残存バ 数 予測
バ 数 目的変数 こ 自然 あ ,生産性 規模あ 工数 予測
規模 乗 工数 出 こ 可能 あ , 均要員数 予測 ,開発期間 乗 工
数 出 こ 可能 あ ,バ 密度 予測 ,規模 乗 バ 数 出 こ 可
能 あ い 方法 採用 ,一見,同 結果 得 う 思わ ,実際 異
結果 得 本論文 ,問題提起 ー 示
On Selection of Objective Variables in Multivariate Predictor
Models
Akito Monden†
To estimate the software development effort, it seems clear that the objective variable is the effort. But is it really clear? We could estimate the productivity; then, derive the effort by multiplying it by the product size. Also, we could estimate the average number of staffs; then, multiply it by the project duration to derive the effort. Do these yield a same result? The answer is no. Similarly, to predict the number of bugs in a software module, the objective variable can be either the number of bugs or the bug density. This paper presents a problem statement and a case study.
1. じめに
ソフ 開発 い ,プ ネ ン
効果的 行う ,QCD Quality, Cost, Delivery
関 値 予測 く 見積 こ 必須 あ
特 ,開発工数 残存バ 数 多く 開発現場 い
重要 見積 対象 ,数多く 予測
提案さ ,用い
予測 ,当然 こ ,予測 い値
目的変数 設定 ソフ 開発工数 予測
開発工数 目的変数 ,残存バ 数 予測
バ 数 目的変数 こ 自然 あ こ ,
現実 ,生産性 予測 規模 乗 工数
出 こ 可能 あ , 均要員数 予測 ,開
発期間 乗 工数 出 こ 可能 あ ,
バ 密度 予測 ,規模 乗 バ 数 出 こ 可能 あ
こ う ,予測 い値 間接的 出
,同 結果 得 いう ,実 う い
筆者 予備実験 , プワ 重回帰分析
用い 構築 場合, バ 数 予測 バ
密度 予測 ,異 説明変数 選択さ 場合
あ ,全く異 得 異
得 いうこ , 適合度,残差分布, バ
性 違い いうこ あ ,い
優 い 自明 いこ ,
間接的 出 悪い 一概 いえ ,実際 両方
構築 ,統計的 良い 判断 方
選択 べ あ 思わ ,従来,こ う
間接的 出 い ほ 検討さ ,
間接的 出 検討 価値 あ う 不明
あ
以上 問題提起 ,本論文 ,予測 い値
直接 出 場合 ,間接的 出 場合 い ,
程度予測精度 異 分析 本論文
,特 ,ソフ 開発工数 予測 対象 ,
ン 手法 ,線形重回帰分析 ン フォ
用い 事例 い 述べ
2. 実験
2.1. 概要
Desharnais ー [1] 用い ,開発工数 説
明変数 構築 場合 ,開発工数 間接
†奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science, Nara Institute of Science and Technology
的 出 構築 場合 い ,
残差,選択さ 変数,各変数 重要度 比較
予測 ,線形重回帰 , び,
ン フォ 用い
2.2. 条件
Desharnais ー 含 77 プ
全 用 い 構 築 説 明 変 数 ,
AdjFPs 調整済フ ン ョン ン , Duration 開発 期間 , ExpEquip 開発 ー 経験 数 , ExpProjMan プ 管理者 経験 数 , DevEnv 開発言語
用い DevEnv 2 値変数化 DevEnv1 DevEnv2 2 変数 設け
目的変数 ,(1)開発工数,(2)開発工数 フ ン ョン ン =規模あ 工数=生産性 ,(3) フ ン ョン ン 開発工数 =生産性 逆数 3
い 構築 (2) い ,予測後
AdjFPs 乗 開発工数 出 (3) い , 予測後 ,予測値 逆数 AdjFPs 乗 開発工数 出 ,AdjFPs,Duration,ActualEffort 3
変数 い ,あ 対数変換 行 工数
予測 精度評価 ,対数変換後 値 対 行 構築 統計 ー R 用い,線形重回帰 対 変数選択法 , AIC(Akaike’s Information Criteria) 変数増減法 用い
2.3. 結果
実験結果 表1 示 表中,MMRE,MMER, MAE ,Mean Magnitude of Relative Error 相対誤差 均 ,Mean Magnitude of Error Relative to Estimate 分母 予測値 相対誤差 均 ,Mean Absolute Error 絶対誤差 均 あ
表 1 ,重回帰 , FP 工数
残差 さく 一方, ン フォ
, 工数 FP 残差 さく
こ こ ,開発工数 直接予測 く,間
接的 出 こ ,場合 効果的 あ こ
示唆さ
選択さ 説明変数 調べ こ ,3 重回帰
同 変 数 選 択 さ AdjFPs, Duration, DevEnv1, DevEnv2 一方, ン フォ
い ,各 け 各説明変数 重要度
尺度 あ IncNodePurity 分析 表 2 表 2
,各 け 説明変数間 IncNodePurity 相対的 差 着目さ い 表 ,い
フ ン ョン ン AdjFPs 重要度 最 高く,次 い ,Duration 開発期間 重要 高 ,
3番目以降 重要度 順序 ,各 異 い
こ こ 目的変数 変え あ 意味当然
あ 異 得 こ 確認
3. おわ に
本稿 ,(1)開発工数予測 ,(2)規模あ
工数 予測 規模 乗 工数 求
,(3)工数あ 規模 予測 , 逆数
規模 乗 工数 求 , 3 構築 ,こ
予測結果 等 く いこ 示
,開発工数 直接予測 (1) ,必
最適 わ , 残差 さい
限 いこ 示
今後 , 多く ー 用い ,工数 間
接的 出 他 例えば, 均要員数 予
測 ,開発期間 乗 工数 出
い 評価 いく予定 あ ,バ 数 予測
い 実施 予定 あ
謝辞
本研究 一部 ,文部科学省科学研究費補助金 基 盤研究(C):課題番号 22500028 基 い 行わ
参考文献
[1] Desharnais, J.M., “Analyse statistique de la productivitie des projets informatique a partie de la technique des point des function”, Masters Thesis, University of Montreal, 1989.
表 1. 実験結果
表 2. ン フォ け 各変数 重要度
MMR MM R MA
工数 . . .
工数/FP . . .
FP/工数 . . .
工数 . . .
工数/FP . . .
FP/工数 . . .
重回帰モ
ランダムフォ ス
目的変数 工数 残差
工数 工数/FP FP/工数
a . . .
x . . .
x P Ma . . .
A P . . .
. . .
. . .
モ 目的変数