2017年 度 修 士 論 文報 告 書
ソ フ トウ ェ ア 開発 工 数 予 測 に お け る カ テ ゴ リー 変 数 の 活 用
指 導教員 山本 久志
首都 大学 東 京 大 学 院 博 士前 期 課 程
シス テ ムデ ザ イ ン研 究 科 シス テ ムデ ザ イ ン専攻 経 営 シ ステ ムデ ザイ ン学域
学修 番 号:16892504伊 藤 康 祐
次目
P.1
・..・ ・..・ ・..● ■ ■■ ■ ■ ●● ● ●● ● ● ● ●■ ■ ■■ ■■ ● ■ ●● ■ ●● ■ ● ●■ ■,騨.… ■・ …..
序論
章1第
… …‑P .1
■,●,,,,● ■,.■
●「■「,,● ■,,,,■ ●■
研究背景
1.1
・・P .2
●●■■●●●●●■■.■
●■■●●,,,,■
本論 文の構成
1.2
P.3
●■ 暫幽 ● ●● ● ● ● ■■ ●● ■ ■ ●噸 ■ ・・ 魯 ■….
ウェア 開発 工数 予 測
ト
ソ フ
章
第2
・・… 一 ・一・P
●●●●■●■■●●■ ●●●● .3
トウェア 開発 工数 予 測手 法 ソ フ
2.1
… …P 、3
●●●●幽,■ ■■■」■,■
,幽,●,,●,■ 囑●
フ ァ ン ク シ ョ ン ポ イ ン ト法 2.1.1
P6
●
●● ●●●●,,■ ■
●昏●●●●●●幽唱,● ●●,● ■
●,■ ●
COCOMOll 2.1.2
P.8
●
● ●幽,,■ ■唱■■
■●噛■咽■■●■●■,■ ●■ ,■ ■,●
線形重回帰
2.1.3
P.10
●■●●
■■,●,,,,,,■ ■■.■
●■●幽,,,●,,■,● ■ ●,●
ド回帰
ツリ
ハ イ ブ 2.1.4
・…‑P .11
●'● ●●■●●■■●■●●●,■ ●
カ テ ゴ リー 変 数 の 扱 い方 2.2
… 一 ・・ ・ ・ ・ ・ ・ ・ …P .11
●●昏●■●●■,,■,■ ●●●・,■
ダ ミー 変 数 化 2.2.1
P.13
●●■
●■昏●●噛,騒 ●,●,,,,,,● ■.■
デ ー タ の 層 別 … … … ・… … ・…
2.2.2
P.15
■● ● ■■ ■●,■ ● ●
ツ ド回帰 数 量 化 皿類 を用 い たハ イ ブ リ
章
第3
P.15
●,■ ●■
●酢●■,● ■,,,,■ ■唱■■●■■■■■
数量化 皿類の適用
3.1
P.18
●.● ●●●●●●●●●,● ●,,,■ ●凸●■■■●●■●■■・幽幽■幽
」■●
ド回帰の適用
ツリ
3.2 ハイ ブ
P.18
●●昏■■■●,
■●,● ●r■ ●噛,●,,,●,● ●■■■■■
ト選 出方法 類 似 プ ロ ジ ェ ク
3.2.1
P.20
●r幽 ●●●,■ ●■ ■■■■,■ ■1●,
●■●
回 帰 手 法 ・… … … … 3.2.2
P.21
■ ■■ ■ ■■ ● 暉 ●● ● ●● ● ■ ●● ● ●● ● ●■ ● ■ ●● ■ ■● ■ ■● ■ ■● ■ ■ ■■ ■ ■● 幽 ・● ■ ■.…..・ ・
評価
章
第4
P.21
.
実 験 条 件 … ・… … … … … ・… … ・… … … ・… ・… ・・
4.1
P.21
,● ●,●,●,● ●■,■ ■●,幽 ■.■ ■.
ト
デ ー タ セ ッ
4」.1
P.23
.実 験 手 順 … … … … 幽…'…"…'…
4.1.2
P.24
●■■■「,「 「●●■「■●層噛噛 ■●,,●,,,■ ■幽■■■■■■■■■■,● ■■■■●」■■」●,● ■■.幽 幽■..
評価指標
4.1.3
P.26
,,,■ ●●,,● ■噛
予 備 実 験 … … … ・一 4.2
カテ ゴ リー 変数 間 の相 関 関係 につ い て P.26 4.2.1
ト選 出 の有 効 性 につ い て P、31
類 似 プ ロジ ェク 4.2.2
P.33
●噛噛,「 ●■■■噛●,,● ●,,,,■ ■■■■■■」」 ■■・●」■」・●
数量化 皿類の適用結果
4.3
工数予測結果 P、38
4,4
ド回帰 との 比較 P.38
ツリ
ミー変 数 化 を用 いた ハ イ ブ
ダ
4.4.1
P.42
,「 「,「 「,「 「,,■ ■■■■■■■●,,
データの層別 を用 いた線形 回帰 との比較
4.4.2
P.44
■ ■■ ■幽 ● ●■ ● ● ■ ●● ■ ●● ● ● ●■ ● ● ■● ●● ● ■ ● ■■ ●● ● ■ ■暉 ■ ■■ ・ ●暑 噸 ・ ・幽 … 幽.
結論
章5第
P.45
● ● ■■ ● ■ ■■ ● ■■ 畢 ■● 幽 ● ● ●● ●● ● ● ■ ■● ■ ●● ● ●■ ● ● ■■ ● ■■ ■ ■● ■ ■■ ● ●■ ● ■ ■ ■… 幽 ・・ ・ …
参考文献
P.49
●幽 ● ●脚 ● ● ■■ ● ●● ■ ●● ■ ■ ■ ■■ ■ ●暉 ● ■噛 ● 幽 ● ●● 脚 ●● ● ●● ● ● ●● ●● ■ ● ■ ■■ ●■ ● ■ ■● ■ ●暉 ■ ■暉 曜 ●■ ●‑● ・ ●
謝辞
■● ● ■● ■ ●● ● ■ ■■ ■ ■■ ■ ■ ■■ ■ ■ ●● 幽 ●● ● ● ● ■■ ● ■■ ● ■■ ■ ■● ■ ■● ● ● ■■ ● ■■ ■ ■ ■■ ■ ■■ ■ ●● ●■ ・ ● 噛 … P.50
付録
1080字 〕
〔36x 30ニ
第1章 序論
1.1研 究 背 景
ソフ トウェ ア 開発 プ ロジ ェ ク トで は,プ ロジ ェ ク トの初 期 段 階 に ソフ トウェ ア の 開発 に必 要 な工 数 の予 測 を行 う.ソ フ トウェア 開 発 に お ける 工数 とは,ソ フ ト ウェ ア を 開発 す るた め に必 要 な工 程 数 を人 月 で表 した もの で あ る.正 確 に工数 を 予 測 す る こ とが で きれ ば,開 発 に必 要 な期 間や 人 員 を適切 に把 握 す る こ とが で き るた め,コ ス トの超 過や 納 期 の遅 延 が生 じる リス ク を低 減 で き る.よ っ て,工 数 を正確 に予 測す る こ とでプ ロ ジ ェ ク トを成 功 に導 く可能 性 が高 くな る.こ の よ う な理 由 か ら,予 測精 度 の高 い 工 数 予測 手 法 が 必 要 とされ て い る[35].
ソフ トウェ ア開発 工数 予 測 では,過 去 の プ ロ ジ ェ ク トデ ー タ を用 い て予 測 を行 う手 法 が数 多 く用 い られ て い る[8][10][22][37].プ ロジ ェ ク トデ ー タ にはFP(フ ァ ン クシ ョンポ イ ン ト)や 開発 言 語 な どプ ロジ ェ ク トの特 性 を表 す 変 数 が記 録 され て お り,こ れ らの変 数 を工数 予測 に用 い る こ とが有 効 で あ る.ま た,近 年 のプ ロ ジ ェ ク トデ ー タ に記 録 され て い る変 数 は,FPな どの量 的 な 変数 よ りも開発 言 語 な どの カ テ ゴ リー変 数 と呼 ば れ る質 的 な変 数 が非 常 に多 く記 録 され て い る傾 向 に あ る.例 えば,世 界32か 国か らプ ロジ ェク トデ ー タ を収 集 してい る非 営 利 団体 で あ るISBSGが 公 開 して い るデ ー タセ ッ ト(ISBSGRelease2016R1.1)[4]に は263個 の変 数 が記 録 され て い るが,内164個 の変 数 が カテ ゴ リー変 数 で あ る.こ の よ う な背 景 か ら,工 数 予 測 にお い て,カ テ ゴ リー変 数 を どの よ うに活 用 す べ きか を議 論 す る必 要 が あ る と言 え る.
カ テ ゴ リー 変 数 を工 数 予 測 に用 い るた めの一 般 的 な方 法 と して,カ テ ゴ リー 変 数 を用 い てデ ー タ の層 別 を行 う方 法[30]と,カ テ ゴ リー 変 数 を ダ ミー 変数 化 す る 方 法[5][21][291[321が 挙 げ られ る.両 者 とも,デ ー タの層 別 や ダ ミー一一一・変 数 化 を施 す こ とで 量 的 変 数 の み か らな るデ ー タセ ッ トを作 成 し,線 形 重 回帰 を用 い て 予 測 式 を構 築 す る こ とが 多 い[21][31][32].一 一般 的 に線 形 重 回 帰 に お け る偏 回 帰 係 数 を求 め るた め に は,説 明変 数 の個 数 を上 回 るサ ンプル 数 が必 要 とされ る[27].し か し, デ ー タの層 別 を用 い る とサ ンプル 数 は減 って しま い,ダ ミー 変 数化 を用 い る と説
明変 数 の個 数 が増 え て しま うた め,偏 回帰 係 数 が求 ま らず,工 数 の 予 測値 を算 出 で きない 現 象 が 生 じる場 合 が あ る.従 って,従 来 のカ テ ゴ リー 変 数 の扱 い方 で は 多 量 のカ テ ゴ リー変 数 を用 い て 工数 予 測 を行 うこ とが困難 で あ る.本 研 究 で は, デ ー タ の層 別 とダ ミー 変 数化 を適 用 す る こ とか ら生 じるデ メ リッ トに 対 処す る手 法 として,数 量化 皿類 を適用 した工数 予測 手 法 の提案 を行 う.数 量化 皿類 を用 い る こ とで,多 量 の カテ ゴ リー 変 数 を全 て予 測 に用 い る こ とが で き る上 に,説 明変 数 の個 数 が サ ンプル数 を上 回 っ て しま うこ とを防 止 で き る.
1.2本 論 文 の 構 成
本論 文 の構 成 は以 下 の通 りで あ る.ま ず,2章 で ソフ トウェア 開発 工 数 予 測 の 予 測 手 法 と先 行 研 究 で用 い られ て い るカ テ ゴ リー変 数 の扱 い方 に つ いて の紹 介 を行 う.3章 で工 数 予 測へ の数 量 化 皿 類 の適 用 を提 案 し,4章 で は提 案 手 法 と従 来 手 法 の予 測精 度 を比 較す るた め の数値 実 験 を行 う.5章 では 本論 文 の結 論 と今 後 の 課 題 に つ いて 言 及 す る.
第2章 ソ フ トウ ェ ア 開 発 工 数 予 測
本 章 で は ソ フ トウェア 開 発 工数 予 測 に 関す る先 行 研 究 を紹 介 す る.2.1節 で 工 数 予 測 手法 につ い て,基 礎 的 な 手法 か ら近年 用 い られ て い る従 来 手法 ま で紹 介 す る.2.2節 で は 本研 究 の 論 点 で あ る工数 予 測 の分 野 にお け るカテ ゴ リー 変 数 の 扱 い 方 に つ い て,先 行 研 究 で 用 い られ て い る扱 い方 を紹 介 す る.
2.1ソ フ トウ ェ ア 開 発 工 数 予 測 手 法
本 節 で は 従 来 の ソフ トウェ ア開 発 工数 予測 手 法 を紹介 す る.2.1.1項 及 び2.1.2 項 で は 工数 予 測 にお け る基 礎 的 な手 法 を紹 介 す る.2.1.3項 で は 工数 予 測 の分 野 で 広 く用 い られ てい る線 形重 回帰 を紹 介 し,2、1.4項 で は近 年 の 多様 な プ ロ ジェ ク ト デ ー タ に対 応 す る手 法 と して ハ イ ブ リッ ド回 帰 を紹 介 す る.
2.1.1フ ァ ン ク シ ョ ン ポ イ ン ト法
FP法(フ ァン ク シ ョンポ イ ン ト法)[1ユとは,1979年 に公 表 され た ソフ トウェ ア の機 能 規模 を測 定す るた め の手 法 で あ る.FP法 の計 測 手 順 を以 下 に 示 す.
(1)ア プ リ ケ ー シ ョ ン 境 界 を 設 定 す る (2)フ ァ ン ク シ ョ ン を 抽 出 す る
(3)フ ァ ン ク シ ョ ン を 識 別 す る (4)フ ァ ン ク シ ョ ン に 点 数 を 付 け る
ア プ リケ ー シ ョン境 界[36]と は ア プ リケ ー シ ョン とユ ー ザ ー との境 界 線 で あ り, 手順(1)で は アプ リケ ー シ ョン境 界 を設 定 す る こ とでFP法 の 計 測範 囲 を明確 に す
る.手 順(2)で は アプ リケ ー シ ョン境 界 内 の フ ァン クシ ョンの抽 出を行 う、FP法 に お け る フ ァ ン クシ ョンは 以 下 の5つ に分 類 され る[20].
i.内 部 論 理 フ ァ イ ル(IntemalLogicalFile;ILF)
デ ー タ フ ァ ン ク シ ョ ン[36]の1つ.計 測 対 象 の ア プ リケ ー シ ョ ン に よ っ て 維 持 ・
ii.外 部 イ ン タ ー フ ェ イ ス フ ァ イ ル(ExternalInterfaceFile;EIF)
デ ー タ フ ァ ン ク シ ョ ン の1つ.計 測 対 象 の ア プ リ ケ ー シ ョ ン が 参 照 す る が,維 持 ・管 理 は 行 わ れ な い フ ァ ン ク シ ョ ン.
iii.外 部 入 力(ExternalInput;EI)
トラ ン ザ ク シ ョ ン フ ァ ン ク シ ョ ン の1つ[36].計 測 対 象 の ア プ リケ ー シ ョ ン が 別 の ア プ リ ケ ー シ ョ ン か ら デ ー タ が 入 力 さ れ る 処 理
iv.外 部 出 力(Extema10utput;EO)
トラ ン ザ ク シ ョ ン フ ァ ン ク シ ョ ン の1つ.計 測 対 象 の ア プ リ ケ ー シ ョ ン が 別 の ア プ リケ ー シ ョ ン に 出 力 す る 処 理
v.外 部 照 会(ExtemalInquiry;EQ)
トラ ン ザ ク シ ョ ン フ ァ ン ク シ ョ ン の1つ.計 測 対 象 の ア プ リ ケ ー シ ョ ン がILF を 加 工 す る こ と な く別 の ア プ リ ケ ー シ ョ ン に デ ー タ を 出 力 す る 処 理
手順(3)で は,抽 出 した フ ァン ク シ ョン を5つ の種i類に分類 す る.最 後 に手 順(4)で 各 フ ァン ク シ ョン の複雑 さを求 め,複 雑 さを用 い て各 フ ァン ク シ ョン を重 み づ け
し,合 計す る こ とで未 調 整FPを 求 め る こ とが で き る.未 調 整FPと はユ ー ザ ー機 能 の み か ら求 めたFPで あ り,ユ ー ザ ー機 能 に加 え シス テ ム 的 な特 性 を考 慮 して 求 め るFPを 調整 済 みFPと 呼ぶ[20].フ ァ ン クシ ョンの複 雑 さは,デ ー タ の要 素 数 と レコー ドの種 類 数(デ ー タ要 素 の サ ブ グル ー プ の数)か ら決 ま り,「 単 純 」,
「普 通 」,「複 雑 」の3段 階で 表 現 され る.表2.1か ら表2.3に フ ァ ン ク シ ョンタイ プ別 の フ ァ ン ク シ ョンの複雑 さの判 定 基 準 を示 す.ま た,各 フ ァ ン ク シ ョンの重 み を表2.4に 示 す.ソ フ トウェア の規模 を表 す 他 の手 法 と して,ソ ー ス コー ド行 数 が あ るが,ソ ー ス コー ド行 数 は 開発 技術 者 の コーデ ィ ン グス キル や 開発 言 語 の 種 類 の違 い に影 響 を受 け て しま うとい うデ メ リッ トが あ る[36].FP法 は機 能 数 か ら ソフ トウェ アの 規模 を測 る手 法 で あ るた め,ソ ー ス コー ド行 数 に 比 べ ソ フ トウ ェア の規 模 を測 る上 で外 的な 影 響 を受 け に くい 手 法 で あ る と言 え る.
未 調整FPは ソフ トウェア の 規模 を表 す 値 で あ るた め,ソ フ トウェア の 開発 工 数 へ 変 換 す る こ とで 工数 を予 測 す る こ とが で き る[20].ま た,未 調 整FPは, COCOMOII[2]や 線 形 重 回 帰[24]な どの 工 数 予 測 手 法 のパ ラ メー タ ー と して用 い
表2.lILFとEIFの 複 雑 さの判 定 基 準 レ コ ー ド
種 類 数
デー タ 要 素 数
1〜19 20〜50 51〜
0.1 単純 単純 普 通
2〜5 単純 普 通 複 雑
6〜 普通 複 雑 複雑
表2.2EIの 複 雑 さの判 定 基 準 レ コ ー ド
種 類 数
デ ー タ要 素数
1〜4 5〜15 16〜
α1 単純 単純 普 通
2 単純 普通 複雑
3〜 普通 複雑 複 雑
表2.3EOとEQの 複 雑 さの 判 定 基 準 レ コ ー ド
種 類 数
デ ー タ要 棄 数
1〜5 6〜19 20〜
0.1 単純 単純 普通
2.3 単純 普通 複雑
4〜 普通 複雑 複雑
表2.4フ ァンクションタイプ別 の 重 み
フ ァ ン ク シ ョ ン タ イ プ
複 雑度
単純 普 通 複雑
ILF 7 10 15
EIF 5 7 10
EI 3 4 6
EO 4 5 7
EQ 3 4 6
2.1.2COCOMOI【
COCOMOII[2]と は,1997年 にBoehmら に よって提 案 され た工 数 予 測 手 法 で あ る.COCOMOI工 は ソフ トウ ェア の規模 な どか ら工数 を求 め る手 法 で あ り,未 調整 FPを 用 い て 工数 を求 め る こ とが で き る.ま た,COCOMOIIに は3つ の予 測 モ デ ル が あ り,予 測 に用 い るモデ ル は予測 を行 う時点 での 開発 プ ロ ジェ ク トの進 度 に よ って決 定す る.本 論 文 で は3つ の モデ ル の 中で最 も適 用 分 野 が広 い初 期 設 計 モ デ ル を紹 介す る[20].初 期 設 計 モ デル は シス テ ム構 造 が 明確 にな って い ない 毅 階 にお け る見積 も りを行 うモデ ル で あ る.初 期 設 計 モ デ ル を(2.1)式に示 す.
Eニ2.45sBc (2.1)
た だ し,
E:開 発 工 数(人 月)
S:1000ス テ ッ プ 単 位 の ソ ー ス コ ー ド行 数(KSLOC) B:ス ケ ー ル フ ァ ク タ ・一一一・
C:コ ス ト係 数
で あ る.Sは ソー ス コー一・・一・ド行 数 を用 い る こ とが で き るが,未 調 整FPを ソー ス コー ド行 数 に変 換 して用 い る こ とが で き る.未 調 整FPか ら ソー ス コー ド行 数 へ の 変 換 は,開 発 言語 に よっ て異 な る係 数 が 定 め られ て い る.Bは プ ロジ ェ ク トの生 産 性 に与 え る要 因か ら求 め られ る係数 で あ る.表25の 「B:ス ケー ル フ ァク タ ー」
の5項 目を それ ぞ れ6毅 階 で評 価 し,そ の評 価 に応 じてBの 値 が 決 定す る.Cは プ ロジ ェ ク トの コス トに 影響 を与 え る要 因 か ら求 め られ る係 数 で あ る.Cの 値 は 表2.5の 「C=コ ス ト係 数 」 の7項 目を7毅 階 で評 価 され た結 果 に基 づ い て決 ま
る.
COCOMOIIは ス ケ ー ル フ ァク ター や コス ト係 数 を計 算 に用 い る こ とで,ソ フ ト ウェ アの 規模 だ け で な く,開 発 チー ムの 能 力 な どの 定性 的 なプ ロ ジ ェ ク ト特性 を 予 測 に反 映 させ る こ とが で き る.し か し,ス ケール フ ァク ター とコス ト係 数 は 定 性 的 な プ ロ ジ ェ ク ト特 性 を人 の判 断 に よ って 定 量 的 なデ ー タ に変 換 す るた め,や
表2,Sス ケー ル ファクターとコス ト係 数 を決 定 す る要 因
Blス ケ ー ル フ ァ ク タ ー C=コ ス ト係 数
製品の先進性 製品の信頼性 と複雑性
開発 の柔軟性 プ ラ ッ ト フ ォ ー ム の 難 し さ ア ー キ テ ク チ ャ/リ ス ク の 早 期 解 決 の 必 要 性 メ ン バ ー の 能 力
チ ー ム の 凝 集 度 ス ケ ジ ュ ー ル
プ ロ セ ス の 成 熟 度 再 利 用 へ の 要 求
メ ン バ ー の 経 験
開発環境
2.1.3線 形 重 回 帰
線 形 重 回帰[24]と は,複 数 個 の 説 明変 数 と 目的変 数 の 関係 を調 べ るた めの 手 法 で あ る.線 形 重 回 帰 は 目的変 数 と説 明変 数 の 関係 を式 で 表 す こ とが で き るた め, 線 形重 回帰 に よって 求 め られ た式 は 目的変 数 の 予測 式 と して 予 測 に 用 い る こ とが で き る.工 数 予 測 に用 い る線 形 重 回帰 モ デ ル を(2.2)式で示 す.
γ=腐+Σ βノら+ε
ノ ≡1
(2.2)
た だ し,
r:開 発 工 数(人 月) β⑪:定 数 項
β、:回 帰 係 数(ノ=1,2,…,n)
Xy:プ ロ ジ ェ ク ト 特 性(ノ=1,2,…,n) ε:誤 差 項
η:プ ロ ジ ェ ク ト特 性 の 個 数
で あ る.線 形 重 回 帰 モ デ ル の 回 帰 係 数 の 一 般 的 な 推 定 方 法 と し て,最 小 二 乗 法 (OrdinaryLeastSquares;OLS)が あ る.OLSに よ っ て 推 定 さ れ る 回 帰 係 数 は 予 測 誤 差 の2乗 が 最 小 に な る 値 を と る.OLSに よ る 回 帰 係 数 の 推 定 値 を(2.3)式 で 示 す.
偏 一 鱒 一角一ジ (2.3)
た だ し,
β:回 帰 係 数 の ベ ク トル β=(fi1,J62,̲,β 。)
β。Ls:OLSに よ る 回 帰 係 数 の 推 定 値 の ベ ク トル
㍉:プ ロ ジ ェ ク ト特 性XJの 実 測 値(∫=1,2,̲,m),(ノ=1,2,̲,n)
βノ:回 帰 係 数(ノ=1,2,̲,n)
n:プ ロ ジ ェ ク ト特 性 の 個 数
初:プ ロ ジ ェ ク トの 個 数
で あ る.
ソフ トウェ ア 開発 工 数予 測 の分 野 で は,線 形重 回 帰モ デ ル が 多 くの先 行 研 究 で 用 い られ て い る[16][21].線 形 重 回帰 に よる 工数 予 測 は,一一定数 の プ ロジ ェ ク トデ ー タ さ えあれ ば予 測 式 を構 築 す る こ とが で き る .し か し,近 年 の ソフ トウェア と そ の 開発 環 境 の多 様 化 が進 ん でい るた め,線 形 重 回 帰 の よ うに1つ の予 測 式 の み で 多数 の プ ロジ ェ ク トの 工数 を予 測 す る手法 は高 い 精度 で 予測 を行 うこ とが難 し
くな っ て い る.
2.1Aハ イ ブ リ ッ ド回 帰
ソ フ ト ウ ェ ア 開 発 工 数 予 測 に お け る ハ イ ブ リ ッ ド回 帰[16]と は,線 形 重 回 帰 に よ り予 測 式 を 構 築 す る 際 に 用 い る フ ィ ッ トデ ー タ を,プ ロ ジ ェ ク トの 類 似 性 に 基 づ い て 選 出 す る 手 法 で あ る.予 測 プ ロ ジ ェ ク ト を α,過 去 プ ロ ジ ェ ク ト を pl,p2,̲,Pm.1と し た 場 合 の ハ イ ブ リ ッ ド回 帰 の 予 測 手 順 を 以 下 に 示 す.
(1)過 去 プ ロ ジ ヱ ク トPl,p2,̲,Pm.1の 中 か ら 予 測 プ ロ ジ ェ ク トaに 類 似 し て い る プ ロ ジ ェ ク トをe個 選 出 す る.
(2)選 出 さ れ たc個 の 類 似 プ ロ ジ ェ ク トを フ ィ ッ トデ ー タ と し て 線 形 重 回 帰 を 行 う.
(3)得 ら れ た 予 測 式 に 予 測 プ ロ ジ ェ ク トaの プ ロ ジ ェ ク ト特 性 を 代 入 し,予 測 工 数 を 算 出 す る.
こ こで,cは 予 測 プ ロジ ェ ク トaの 類似 プ ロ ジェ ク トの個 数 を表 して い る.
手順(1)に お い て,類 似 プ ロジ ェ ク ト選 出方 法 には様 々 な手 法 が提 案 され て い る.
非 階 層型 ク ラ ス タ リン グ手法 の一 種 で あ るk‑means法[19]は,い くつ か の先 行 研 究[10][17ユ[22]でハ イ ブ リッ ド回帰 に適 用 され てい る手 法 で あ る.Leandroら[8]は 工 数 予 測 に お け る類 似 プ ロ ジェ ク ト選 出方 法 を比 較 し,EMア ル ゴ リズ ム な どの 手 法 に比 べ,k‑means法 が最 も予 測精 度 を高 くす る こ とを示 した 、
手 順(2)に お い て,ハ イ ブ リ ッ ド回帰 は線 形 重 回帰 を用 い て予 測 を行 うが,先 行 研 究 で様 々 な回帰 手 法 が用 い られ て い る.Nagpalら[10]は,回 帰 手法 と して,OLS 重 回 帰 だ け で な く,ス プ ライ ン回 帰 な どを用 い てい る.森 松 ら[22]はLasso回 帰 を
ハ イ ブ リッ ド回帰 に適 用 す る こ とを提 案 して い る.
通 常 の線 形 重 回帰 に よる予測 で は,基 本 的 に全 て の プ ロジ ェ ク トデ ー タ を用 い て1つ の予測 式 を構 築 す る.し か し,ハ イ ブ リッ ド回 帰 は プ ロジ ェ ク トの個別 性 を考 慮 し,予 測 プ ロジ ェ ク トご とに予 測 式 を構 築 す るた め,近 年 の多 様 化 した ソ フ トウェア 開発 環 境 に対 応 す る こ とが で き る.Nagpalら[10]は ハ イ ブ リッ ド回 帰 を用 い て予 測 を行 うこ とで,通 常 の線 形 重 回 帰 で予 測 を行 う場 合 に比 べ 工数 の 予 測精 度 が高 くな る こ と を示 した.
2.2カ テ ゴ リー 変 数 の 扱 い 方
本 節 で は,カ テ ゴ リー変 数 を ソフ トウ ェア開発 工 数予 測 に用 い る場合 の扱 い 方 につ い て の紹 介 を行 う.2.2.1項 で は,多 くの先 行 研 究 で 用 い られ てい る ダ ミー 変 数 化 を紹 介 す る.2.2.2項 で は,角 田 ら[31]や戸 田 ら[30]が 用 い て い るデ ー タの層 別
につ い て紹 介 す る.
2.2.1ダ ミ ー 変 数 化
ダ ミ ー 変 数 化[18]と は,カ テ ゴ リー 変 数 を 定 量 的 な 変 数 と し て 扱 うた め に,2値 デ ー タ で 表 す 処 理 で あ る.あ る カ テ ゴ リー 変 数 が 乃個 の カ テ ゴ リ ー を 持 つ と き, そ の カ テ ゴ リー 変 数 はh‑1個 の ダ ミ ー 変tWd,,d,,̲,dh.1で 表 す こ と が で き る.ダ ミ ー 変 数4
s(s=1,2,.一 ■,h‑1)を(2.4)式 で 示 す.
4=儲 朔 嚇 募 凋 離 しなレ・ (2.4)
で あ る.こ こで,mは サ ンプ ル の個 数 で あ り,i=1,2,...,mで あ る.
表2.6は 「開発 言 語 」 とい う 「A」,「B」,「C」 とい う3つ のカ テ ゴ リー を持 つ カテ ゴ リー 変 数 を ダ ミー変 数 化 した 場合 の例 を表 して い る.表2.6の 例 にお い て, 開発 言 語 のカ テ ゴ リー数 乃はhニ3で あ る ため,2個 の ダ ミー 変 数 を作 る こ とで 開 発 言語 を表 現 す る こ とが で き る.ま た,ダ ミー 変数41とd,は それ ぞ れ 「開発 言 語
がAで あ るか ど うか 」及 び 「開発 言 語 がBで あ るか ど うか 」 を表 して い る.
この よ うに,ダ ミー 変数 化 を用 い る こ とで カテ ゴ リー 変 数 を量 的変 数 と同様 に 扱 うこ とが で き るた め,カ テ ゴ リー変 数 が 非 常 に 多 い プ ロジ ェ ク トデ ー タ の分 析 に広 く用 い られ て い る.例 え ば,角 田 ら[35]は線 形 重 回帰 モ デ ル の説 明変 数 と し て,カ テ ゴ リー 変数 で あ る 「開発 言語 」,「プ ラ ッ トフ ォー ム」,「開発 種別 」 を ダ
ミー変 数 化 して 用 い て い る.肖 ら[37]はハ イ ブ リッ ド回帰 に カテ ゴ リー 変数 で あ る 「開 発 言 語 」 を ダ ミー 変 数 化 して 用 い て い る.
しか し,カ テ ゴ リー 変 数 をダ ミー 変 数化 す る と回帰 に用 い る説 明変 数 の数 は 過 剰 に増 えて しま う.線 形 重 回 帰 に は,説 明 変数 の個 数 を上 回 るサ ンプル 数 を用 い る必 要 が あ る た め[27],全 て の カ テ ゴ リー 変 数 を ダ ミー 変 数 化 して 線 形 重 回 帰 に
用 い る こ とは 困難 な場 合 が あ る.Lokanら[8]は カ テ ゴ リー変 数 で あ る 「開発 言語 種 別 」,「開発 種 別 」,「プ ラ ッ トフォー ム」 を用 い て線 形 重 回 帰 に よる 工数 予 測 を 行 って い るが,「業 種種 別 」な どの カ テ ゴ リー数 が多 い カテ ゴ リー変 数 に 関 して は, ダ ミー 変数 の数 が多 くな りす ぎ る こ とか ら実 験 か ら除外 して い る.こ の よ うに, 先 行 研 究 で一 般 的 にカテ ゴ リー 変数 を用 い た 予 測 が提 案 され て い る もの の,用 い
るべ きカ テ ゴ リー 変数 の種 類 や 個数 に 関 して の議論 は行 われ て い な い,
表2.6ダ ミー 変数 化 の例
開発言語 4」 42
A 1 0
B 0 1
C 0 o
22.2デ ー タ の 層 別
デ ー タの 層 別[31]と は,あ る カテ ゴ リー 変 数 に基 づ い て デ ー タ の グル ー プ分 け を行 うこ とで あ る.例 え ば,「A」,「B」,「C」 の3つ の カ テ ゴ リー を持 つ 「開発 言 語 」 とい うカ テ ゴ リー変 数 に基 づ い て層 別 す る場 合,開 発 言 語 が 同 じで あ るプ ロ ジ ェ ク トデ ー タ だ けを集 め た 「デ ー タセ ッ トA」,「 デ ー タセ ッ トB」,「 デ ー タセ ッ トC」 を作 成 す る.作 成 され た3つ のデ ー タセ ッ トの サ ンプル 数 はそ れ ぞ れ, 鞠,怖 溜,と す る.従 来 の工 数 予測 で は,層 別 を行 った後 に予 測 プ ロ ジ ェ ク トαと 同 じカテ ゴ リー を持 っ プ ロ ジ ェ ク トデ ー タのみ を用 い て 線 形重 回 帰 を行 うこ とで 予 測 プ ロ ジ ェ ク トαの予 測 式 を構 築 す る こ とが 多 い.予 測 プ ロ ジ ェ ク トαの開 発 言 語 がrA」 の 場合,「 デ ー タセ ッ トA」 に記 録 され て い る予 測 プ ロジ ェ ク トa以
外 のmA‑・・1個の プ ロ ジ ェ ク トデ ー タ を フ ィ ッ トデ ー タ と して 線 形重 回帰 を行 う.
角 田 ら[31]は デ ー タ の層 別 を 用 い た線 形 重 回帰 に よる 工数 予 測 にお い て,ど の 変 数 を用 い て層 別 をす るべ き な の か を検 討 した.角 田 らは プ ロジ ェ ク ト特 性 の 中 で生 産 性 と関連 の強 い 変数 を 用 い てデ ー タ を層 別 す る こ とを提 案 した.9個 の カ テ ゴ リー変 数 と10個 の 定 量 的 な変 数 の 中か ら生産 性 に強 く影 響 を及 ぼす 変 数 と して,「 規 摸 あ た り要 員 数 」 を選 び 出 し,3つ の カ テ ゴ リー を持 つ カ テ ゴ リー 変 数 に変 換 して層 別 に用 い た.そ の結 果,変 換後 の 「規 模 あた り要 員 数 」 でデ ー タ の 層別 を 行 って か ら線 形 回帰 を行 うこ とで,層 別 を行 わ な い場 合 に比 べ 予測 精 度 が
向上 す る こ とを示 した.
戸 田 ら[30ユは複 数 のパ ター ンで層 別 を行 い,そ の後 作 成 した 予 測 式 の 中で 適 合 度 の高 い予 測 式 を用 い て 予 測 を行 う手 法 を提 案 した.例 え ば,予 測 に用 い るデ ー タに カ テ ゴ リー 変 数 と して 「開発 言 語 」 と 「業 種 」が含 まれ て い た場 合,「 開発 言 語 」の み で 層 別 を した場 合,「 業 種 」のみ で 層 別 した場 合,「 開発 言 語 」 と 「業種 」 の両 方 を用 い て 層別 を した場 合 で それ ぞ れ 予 測 式 を作成 す る.次 に,作 成 した3 つ の予 測 式 の 中で調 整 済 み決 定係 数 が高 い予 測 式 を選 び,そ の 予測 式 で予 測 を行
う.戸 田 らの提 案 手法 と層 別 を しない線 形 回帰 に よ る予 測 を 比 較 した結 果,戸 田 らの提 案 手 法 の予 測精 度 が 高 くな るこ とを示 した.
この よ うに,カ テ ゴ リー 変数 に よって デ ー タの層 別 を行 う手 法 は,予 測 に用 い るプ ロ ジ ェ ク トデ ・一タ を厳 選 す る こ とがで き るた め,層 別 を行 わ ない 手 法 に 比べ,
工 数 予測 の精 度 が 高 ま る傾 向 に あ る.し か し,ど の変 数 を どれ だ け用 い て層 別 を す れ ばい い の か を一意 に決 め る こ とは難 しい 上 に,近 年 の ソフ トウェ ア 開発 プ ロ ジ ェ ク トデ ー タは記 録 され て い るカ テ ゴ リー変 数 の種 類 も非 常 に多 く,多 量 のカ テ ゴ リー変 数 を層別 に用 い る と,予 測 に用 い るサ ンプル数 が不 足 して しま うリス クが 高 い.よ って,デ ー タの 層別 を行 う手 法 は必 ず しも扱 いや す い 手 法 で あ る と は言 えな い.
第3章 数 量 化 皿類 を用 い た ハ イ ブ リッ ド回帰
本章 では,数 量化 皿類 を適 用す るこ とで,デ ー タの層別 や ダ ミー変数 化 を用い た従来 手法 のデ メ リッ トを解 消 しつ つ,カ テ ゴ リー変数 を最大 限 に活 用 した ソフ
トウェア開発 工数予測 手法 を提 案す る.提 案 手法 の予測手 順 を以下 に示 す.
(1)数 量化 皿類 に よるカテ ゴ リー変数 の処理 (2)ハ イ ブ リッ ド回帰 を用 いた予測式 の構築 (3)予 測 工数 の算 出
具体 的 には,ま ず予 測手 順(1)にお いて カテ ゴ リー変 数 に数量化 皿類 を適 用 し, 合 成変 数 を作成 す る.次 に,予 測手 順(2)において,ハ イブ リッ ド回帰 を用 い て工 数 の予測 式 を構 築す る,最 後 に予 測手順(3)におい て予測 プ ロジ ェク トの変数 を予 測 式 に代入す るこ とで予測 工数 を算 出す る.本 章で は,3.1節 で提案手 法 に適用す る数量 化皿類 の紹 介 を行 う,3.2節 では提案 手法 のべ 一ス となる予 測 手法 で あ る ハ イ ブ リッ ド回帰 の詳細 を紹介す る.
3.1数 量 化 皿 類 の 適 用
予測 手順(1)で 数 量化 皿類 を用 いて合成 変数 を作成 し,カ テ ゴ リー変 数 を量的 なデ ー タに変換す る.数 量化 皿類[15]と は,カ テ ゴ リー とサ ンプル の類 似 の該 当 パ ター ンを集 める こ とで,カ テ ゴ リー とサ ンプル の 両方 を同時 に分類 す る成分分 析 的 なカテ ゴ リー デー タ解 析法 で ある.数 量化 皿類 をカテ ゴ リー 変数 に適 用す る
こ とで,量 的変数 に対す る主成分 分析 と同様 に,多 くの変数 で表現 され てい るデ ー タを少量 の合成 変数 で表 す ことが で きる.数 量 化 皿類 ではサ ンプル とカテ ゴ リ ー の相 関係数Rを 最 大化す るAとBの 固有ベ ク トルaとbを 求 め る.サ ンプル とカ テ ゴ リーの相 関係 数Rを(3,1)式 に示す.
'αIDゐ R=
伽 の渥('醐% (3.1)
た だ し,
D:デ ー タ 行 列
A:サ ン プ ル 反 応 数(あ る サ ン プ ル が 該 当 し た カ テ ゴ リ ー の 個 数)を 対 角 成 分 と し た 対 角 行 列
B:カ テ ゴ リ ー 反 応 数(あ る サ ン プ ル に 該 当 し た カ テ ゴ リ ー の 個 数)を 対 角 成 分 と し た 対 角 行 列
π:サ ン プ ル ス コ ア む:カ テ ゴ リ ー ス コ ア
で あ る,こ こ で,i(iニ1,2,̲m)IS目 の サ ン プ ル の カ テ ゴ リ ー・‑e(eニ1,2,..1)の 値 をd,, と し た 場 合 の デ ー タ 行 列pを(3.2)式 に 示 す.
12.・層η﹂α44
ユ内∠24142⁝4
12:︑摺444ー
ニD
た だ し,
ら一儲 朔 仁醐 認 仁 呈に護導雛 い
で あ る,ま た,AとBを そ れ ぞ れ(3.4)式 と(3.5)式 に 示 す.
昭OnU:・η4
ほ0偽⁝0
な40⁝0ー‑Σ圖
=
(3.2)
(3.3)
(3.4)
ー00⁝喝
0妬⁝0
40.:0ー用マ乙同
=B
(35)
カテ ゴ リー ス コアbか らは合成 変数 を求 め る ことが で きる.相 関係数Rは そ の合 成変数 のデ ー タの説 明力 を表 す た め,相 関係 数Rが 大 きい合成 変数 ほ ど重 要 な合 成変数 で あ る と言 える[28].
本研 究 では,数 量化皿類 を用 いて複数 の合成 変数 を作成 し,そ の 中か ら相関係 数Rが 大 きい値 を とる合 成変数 を工数 予測 に用い るこ ととす る.相 関係数Rが 大 きい値 を とる一 部 の合成 変数 のみ を用い る ことで説 明変数 の個数 を減 ら しつつ, 多量 のカ テ ゴ リー変数 が持つ 情報 を予測 に反 映 させ るこ とがで きる.そ のた め, 数 量化 皿類 を工数 予測 に適 用す る ことで,ダ ミー 変数化や デー タの層 別 を用い る 場 合 に生 じるデ メ リッ トを解 消す るこ とがで きる,工 数 予測 の精度及 び汎 用性 が 高 くな る と考 え られ る.
3.2ハ イ ブ リ ッ ド回帰 の 適 用
予測 手順(2)でハイ ブ リッ ド回帰 を用 い る こ とで,プ ロジェク トの類 似性 を考慮 した うえで線 形重 回帰 によって予測 式 を作成 す る.ハ イブ リッ ド回帰 は予測 式 を 構 築す る際 に用い るフィ ッ トデー タ を厳 選す るた め,通 常 の線形 重 回帰 に比べ少 ないサ ンプル 数 で予測式 を構 築す るこ とにな る.そ のた め,場 合 に よってはサ ン プル数 と説 明変数 の個 数 の関係 で予測 値 が算 出で きない場 合 が ある[16].こ の よ うなハイ ブ リッ ド回帰 の特性 は説 明変数 の個数 を減 らす こ とがで き る数 量化 皿類 と相性 が良い と考 え られ るた め,本 研究 ではハ イ ブ リッ ド回帰 に数 量化 皿類 を適 用す る ことを提案 手法 とす る,
3.2.1類 似 プ ロ ジ ェ ク ト選 出 方 法
本 研 究 で は ハ イ ブ リ ッ ド 回 帰 に お け る 類 似 プ ロ ジ ェ ク ト選 出 方 法 と し て, fixed‑k法[34]とk‑means法[19]を 用 い る.fixed‑k法 と は,予 測 プ ロ ジ ェ ク ト と過
去 の プ ロ ジ ェ ク トの ユ ー ク リ ッ ド距 離 を 計 算 し,最 も 距 離 の 近 い 任 意 の 個 数 の プ ロ ジ ェ ク トを 予 測 プ ロ ジ ェ ク ト とす る 手 法 で あ る.予 測 プ ロ ジ ェ ク ト・と 過 去 プ ロ ジ ェ ク トpの ユ ー ク リ ッ ド距 離ED 砂 を(3.6)式 に 示 す.
ED.=Σ: .、(xb,一一xL」)2 (3.6)
た だ し,
xa,:正 規 化 され た 予 測 プ ロ ジ ェ ク トaの プ ロ ジ ェ ク ト特 性 ノ(ノ=1,2,̲,n)の 値 惰:正 規 化 され た 過 去 プ ロ ジ ェ ク ト ρの プ ロ ジ ェ ク ト特 性 ノ(ノ司 ②̲④ の 値 η:プ ロ ジ ェ ク ト特 性 の 個 数
で あ る.ま た,複 数 の 変 数 を 用 い て ユ ー ク リ ッ ド距 離 を 計 算 す る 場 合,全 て の 変 数 の 値 域 を そ ろ え る 必 要 が あ る た め,本 研 究 で はNormalize法[33]を 用 い て 変 数 の 正 規 化 を 行 っ た.Normalize法 を(3.7)式 に 示 す,
Xu‑min¢ 、) xllニ
max㊨ 一min㊥ (3.7)
た だ し,
Xv:プ ロ ジ ェ ク トi(i=1,2,...,m)の プ ロ ジ ェ ク ト特 性 ノ(∫司,乳 …,n)の 値 鴎:正 規 化 さ れ た エ、ノ
max¢ 、):プ ロ ジ ェ ク ト特 性 ノの 最 大 値 mi雌J):プ ロ ジ ェ ク ト特 性 ノの 最 小 値 砿 プ ロ ジ ェ ク トの 個 数
η:プ ロ ジ ェ ク ト特 性 の 個 数
で あ る.No㎜alize法 を 用 い る こ と で,全 て のx,、の 値 域 を0≦xu≦1に 揃 え る こ と が で き る.k‑means法 な どの ク ラ ス タ リ ン グ 手 法 は ク ラ ス タ 数 を 指 定 す る こ と が で き る が,類 似 プ ロ ジ ェ ク トの 個 数 自 体 を 指 定 す る こ と が で き な い.そ れ に 対 し て fixed‑k法 は 類 似 プ ロ ジ ェ ク トの 個 数 を 直 接 的 に 指 定 す る こ と が で き る.
k‑means法 と は 非 階 層 型 ク ラ ス タ リ ン グ 手 法 の1つ で あ り,デ ー タ を 任 意 の ク ラ ス タ 数 に 分 割 す る こ と が で き る.本 研 究 で 用 い るk‑means法 の 手 順 を 以 下 に 示 す.
① デ ー タ の 中 か ら ラ ン ダ ム に 此個 の プ ロ ジ ェ ク トを 選 出 し,そ れ ら を ク ラ ス タ の 核 と す る.
② 全 て の デ ー タ と 全 て の 核 と の ユ ー ク リ ッ ド距 離 を 計 算 す る.
③ 全 て の デ ー タ を そ れ ぞ れ 最 も距 離 の 近 い 核 に 分 類 し,ク ラ ス タ を 形 成 す る.
④ 各 ク ラ ス タ の 重 心 を 計 算 し,そ の 重 心 を ク ラ ス タ の 新 た な 核 とす る,
⑤ ② か ら ④ ま で の 手 順 を 核 の 位 置 が 変 化 し な く な る ま で 繰 り返 す.
⑥ 予 測 プ ロ ジ ェ ク トαと 同 じ ク ラ ス タ に 含 ま れ る デ ー タ を 予 測 プ ロ ジ ェ ク ト σの 類 似 プ ロ ジ ェ ク ト とす る.
k‑means法 の 問 題 点 と し て,手 順 ① に お い て,初 期 の 核 を ラ ン ダ ム に 選 出 す る た め,ク ラ ス タ リ ン グ 結 果 が 初 期 値 に 依 存 して し ま う と い う問 題 が あ る[26].本 研 究 で は こ の 問 題 点 に 対 処 す る た め,手 順 ① か ら 手 順 ⑤ ま で を10000回 繰 り返 し,
作成 した全 ての クラス タの郡 内平方 和 を合 計 した値が最 小 とな るクラス タ リング 結果 を採用 した.全 て のク ラス タの郡 内 平方和 の合計Kを(3.8)式 に示 す.
γ弍
傷Σげ.
左Σ釧陥
(3.8)
た だ し,
xl:プ ロ ジ ェ ク トiの プ ロ ジ ェ ク ト 特 性 の ベ ク ト ルxlニ(xlpXl2,̲,xp V,:ク ラ ス タg(g=1,2,̲,k)の 核
κ:ク ラ ス タ 数
で あ る.κ が 最 小 と な る ク ラ ス タ リ ン グ 結 果 を 採 用 す る こ と で,最 適 な ク ラ ス タ リ ン グ 結 果 を 得 る こ と が で き る,
32.2回 帰 手 法
本研 究 で はハイ ブ リッ ド回帰 に用 い る回帰手 法 として ステ ップ ワイ ズ 回帰 を用 い る.ス テ ップ ワイ ズ回帰 とは,Stepwise法[25]で 変数選択 を行 った上 で回帰 を行 う手法 で ある,重 回帰分析 に用 い られ る説 明変数 同士は相 関関係 にあ るこ とが多 い.互 い に強 い相 関 を持 つ説 明変数 を用い て回帰係 数の推 定 を行 うと多 重共線性 が生 じ,推 定精度 が不 安定 にな って しま う.OLSを 用い て回帰係数 の推 定 を行 う 場 合,多 重 共線性 に対 処す る方法 として は説 明変数 の変数選 択 をす る ことが一般 的で あ る.以 上の こ とか ら,本 研 究 では回帰 手法 と して ステ ップ ワイ ズ回帰 を用 い る.
第4章 評 価
本 章 で は提 案 手 法 と従 来 手 法 の予 測 精 度 の 差 を 比較 し,提 案 手 法 を評 価 す る た め に数 値 実 験 を行 う.評 価 計 算 に は統 計 ソフ トR3.2.0を 用 い た.な お,比 較 対 象 は,ダ ミー 変 数 化 を用 い たハ イ ブ リ ッ ド回帰 及 び デ ー タ の層 別 を用 い た線 形 重 回 帰 とす る.
4.1節 で は実 験 の手 順 や用 い るデ ー タセ ッ トな どの 実 験条 件 を紹 介 し,4.2節 で は数 量化 皿類 を適 用 す る こ と及 び ハ イ ブ リッ ド回 帰 にお い て類 似 プ ロジ ェ ク トを 選 出す る こ との妥 当性 を検 証 す るた め の 予備 実 験 を行 う.4.3節 では 数 量 化 皿 類 を用 い て作 成 した合 成 変 数 を示 し,4.4節 で は提 案 手 法 と従 来 手 法 の 工 数 予 測 の 結 果 を示 す.
4.1実 験 条 件
本 節 で は4⊥1項 で 実験 に用 い るデ ー タセ ッ トの 詳 細 を紹 介 す る.4.1.2項 で は 実験 の 手順 を紹 介 し,4.1.3項 で は手 法 の 予測 精 度 を評価 す るた め の指 標 を紹介 す
る.
4.1.1デ ー タ セ ッ ト
実 験 に は プnジ ェ ク トデ ー タ の 収 集 を 行 う 非 営 利 団 体 で あ るISBSG(The InternationalSoftwareBench‑MarkmgStandardsGroup)[4]が 収 集 し て い る デs‑一一Lタセ ッ
ト を 用 い る.ISBSGの デ ー タ セ ッ トは 多 く の 先 行 研 究[81[30]で 用 い ら れ て い る.
本 実 験 で 用 い るISBSGRelease2016RL1に はISBSGが2016年 ま で に 収 集 し た 7518件 の プ ロ ジ ェ ク トデ ー タ が 記 録 さ れ て お り,32か 国 の 様 々 な 企 業 か ら 収 集
さ れ た 企 業 横 断 的 な デ ー タ セ ッ トで あ る.ま た,本 デ ー タ セ ッ トに は263個 の プ ロ ジ ェ ク ト特 性 が 記 録 さ れ て い る が,そ の 内164個 が カ テ ゴ リ ー 変 数 で あ る.
ま ず,実 験 に 用 い る プ ロ ジ ェ ク ト特 性 の 選 定 を 行 っ た.表4.1に 本 実 験 に 用 い る プ ロ ジ ェ ク ト特 性 を 示 す.工 数 以 外 の プ ロ ジ ェ ク ト特 性 は,全 て 開 発 プ ロ セ ス に お け る 外 部 設 計 終 了 時 に 決 定 し て い る 変 数 で あ る.こ れ は,本 研 究 で は 工 数 予
測 を外 部設 計 終 了 時 に行 うこ とを想 定 して い るた めで あ る.次 に,Lokanら[8]の 条 件 に従 い 実験 に用 い るサ ンプル の選 定 を行 った.条 件 は 以 下 の通 りで あ る.
(1)FP計 測 方 法 「Countapproach」 が 「IFPUG4」 で あ る こ と.
(2)工 数 算 出 方 法 「Recordingmethod」 が 「Staffhours(Recorded)」 な ど 記 録 さ れ た も の で あ る こ と.
(3)デ ー タ の 信 頼 性 「Dataqualityrating」 及 びFPの 信 頼 性 「UFPrating」 がAも し く はB(信 頼 性 が 高 い)で あ る こ と.
(4)工 数 の 計 測 対 象 「Resourcelevel」 が1(開 発 チ ー ム の 工 数 の み)で あ る こ と.
(5)プ ロ ジ ェ ク ト特 性 が 無 欠 損 で あ る こ と.
表4,1実 験 に用い るプ ロジ ェクト特 性 一 覧
プ ロ ジ ェ ク ト特 性1種 類 カ テ ゴ リー 数 備 考
未 調 整FP 量 的 変数 ・ ソ フ ト ウ ェ ア の 規 模 を 表 す.
開発 言 語種 別 カ テ ゴ リー 変 数 3 3GL,4GLな ど 開 発 に 用 い た 言 語 の 大 別.
業種 カ テ ゴ リー 変 数 8 金 融,通 信 な ど 開 発 す る ソ フ トウ ェ ア が
実 装 さ れ る 組 織 の 業 種.
開 発種 別 カ テ ゴ リ ー 変 数 2 新 規 開 発,再 開 発 な ど開 発 の 形 態.
プ ラ ッ トフ ォ ー ム カ テ ゴ リ ー 変 数 5 メ イ ン フ レ ー ム,PCな ど 開 発 に 用 い た
コ ン ピ ュ ー タ ー.
ア ー キ テ ク チ ャ カ テ ゴ リー 変 数 5 ス タ ン ドア ロ ン,ク ラ イ ア ン トサ ー バ ー
な ど ソ フ ト ウ ェ ア の 構 造.
ア プ リ ケ ー シ ョ ン グ ル ー プ カ テ ゴ リー 変 数 3 ビ ジ ネ ス 向 け な ど ソ フ ト ウ ェ ア の 用 途,
ウ ォ ー タ ー フ ォ ー ル カ テ ゴ リー 変 数 2 開 発 手ll頂が ウ ォ ー タ ー フ ォ ー ル 型 か ど う
か.
ア ジ ヤ イ ル カ テ ゴ リー 変 数 2 ア ジ ャ イ ル 開 発 で あ る か ど う か.
JAD(Jointappl酷ationd¢sig皿) カ テ ゴ リー 変 数 2 JAD開 発 で あ る か ど うか.
RAD(Rapidapphcationde鴨lopment) カ テ ゴ リー 変 数 2 RAD開 発 で あ る か ど う か.
MFT(Multi且mctbnalteam) カ テ ゴ リー 変 数 2 MFTで あ る か ど うか.