モンテカルロ法によるクラスタリング評価に関する
研究
著者
?川 智?
2018 年度 修⼠論⽂要旨 モンテカルロ法によるクラスタリング評価に関する研究 関⻄学院⼤学⼤学院理⼯学研究科 ⼈間システム⼯学専攻 岡留剛研究室 ⽯川智⼰ 本研究は,モンテカルロ法を⽤いることで外的規準により近い内的規準を探 索する⽅法を提案する.クラスタリング結果の質を評価する規準は外的規準と 内的規準に分けられ,外的規準はいわゆる正解を必要とする規準であり,内的 規準は正解が不要な規準である.後者の⽅がクラスタリングの評価規準として は適切と考えられる.そこで,モンテカルロ法により⼈⼯的なデータセットを ⽣成し,外的規準との誤差が少なくなるような回帰問題を解くことで,外的規 準との相関の⾼い内的規準を探索する.Lasso を⽤いた線形回帰と,ガウス過 程回帰を⽤いた⾮線形回帰により探索を試みる.既存の内的規準を単体で⽤い るより,複数の内的規準を組み合わせる⽅が外的規準との相関が⾼くなること が確かめられた.また,いくつかの実データに対してクラスタリングのパラメ ータを決定する実験を⾏った.その結果、Iris データセットでは既存の内的規 準,本⼿法による内的規準ともに正しいクラスタ数を復元できなかった.⼀ ⽅,⼿書き数字データセット MNIST による実験では,既存の内的規準単体に よるクラスタ数の決定より,本⼿法による内的規準を使⽤する⽅がより正しい クラスタ数を復元できることが分かった.ただし,使⽤する内的規準の数に依 存することが分かった. 本研究の特徴は,複数の内的規準を組み合わせることで新たな内的規準を構 築することである.また,先⾏研究ではガウス分布のみであった⼈⼯的なデー タセットの⽣成分布を指数型分布族に拡張した点も挙げられる. キーワード クラスタリング,モンテカルロ法,ランダムサンプリング,内的規準,外的規 準,ガウス過程回帰