• 検索結果がありません。

変数重要度の評価について

第 5 章 結論と今後の課題

5.2 今後の課題

5.2.2 変数重要度の評価について

本手法は,Gini-Importanceによって変数重要度を評価しているが,これ以外にも変数 重要度を評価する方法はある.例えば,説明変数の一つを隠すことで予測精度がどの程度 落ちるか,といった基準から変数重要度を評価することも可能である.よって,変数重要 度の評価法について,どのような評価法がどのような目的に対して有効であるのか等を検 証する必要がある.

5.2.3 多重共線性の問題について

重回帰分析において,説明変数間に強い相関がある場合,結果がロバストなものとなら ないことが指摘されており,多重共線性の問題と呼ばれている.本手法は決定木によるも のであるが,同様の問題を抱えているものと考えられる.よって,結果をより信頼度の高 いものとするためにも,決定木において多重共線性の問題をどう解決するのかを考える必 要がある.

参考文献

[1] Rich Caruana and Dayne Freitag. Greedy attribute selection. InICML, pages 28–36.

Citeseer, 1994.

[2] Tsuyoshi Id´e, Aurelie C Lozano, Naoki Abe, and Yan Liu. Proximity-based anomaly detection using sparse structure learning. In SDM, pages 97–108, 2009.

[3] Alan J Izenman.Modern multivariate statistical techniques: regression, classification, and manifold learning. Springer, 2008.

[4] Ron Kohavi et al. A study of cross-validation and bootstrap for accuracy estimation and model selection. InIJCAI, pages 1137–1145, 1995.

[5] Nicolai Meinshausen and Peter B¨uhlmann. High-dimensional graphs and variable selection with the lasso. The Annals of Statistics, 34(3):1436–1462, 2006.

[6] Robert Tibshirani. Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society. Series B (Methodological), pages 267–288, 1996.

[7] Martin J Wainwright, John D Lafferty, and Pradeep K Ravikumar. High-dimensional graphical model selection using 1-regularized logistic regression. In Advances in neural information processing systems, pages 1465–1472, 2006.

[8] 奥喜正,本村猛能,前鶴政和, and 内桶誠二. データマイニングにおける二値データ解 析: 決定木とロジスティック回帰分析. 物流問題研究, 44:1–14, 2004.

[9] 家村俊一郎 and 夏目徹. タンパク質のネットワーク解析から創薬へ. Synthesiology, 1(2):123–129, 2008.

[10] 悟, 藤重,正夫, and 伊理. グラフ・ネットワーク・組合せ論. 共立出版, 2002.

[12] 池谷智行 and 村田剛志. 複数種ノードネットワークからのコミュニティ抽出. 2008 年度人工知能学会全国大会 (22) 論文集, 3, 2008.

[13] 浩, 元田, 周作, 津本, 高平, 山口, and 情報処理学会. データマイニングの基礎. オー ム社, 2006.

[14] 金英子, 松尾豊, and 石塚満. Web 上の情報を用いた企業間関係の抽出. 人工知能学 会論文誌, 22(1):48–57, 2007.

[15] 鹿島久嗣. ネットワーク構造予測. 人工知能学会誌, 22(3):344–351, 2007.

謝辞

本研究を進めるにあたり,主指導教員である北陸先端科学技術大学院大学 知識科学研

究科 Dam Hieu Chi 准教授には大変お世話になりました.私はデータマイニングに関し

て全く無知なところから研究を始めましたが,Dam先生によるデータマイニング・統計 の勉強会,またゼミなどによる手厚い研究指導により,何とか研究活動を全うすることが できました.具体的な研究活動以外にも,研究に対する姿勢や哲学,また人としてどう生 きるべきか,といったことまで幅広くご指導頂き,人間として成長できたことを感じてお ります.本当にありがとうございました.深く感謝しております.

 日々の学生生活や,各種文書の校正などでは,北陸先端科学技術大学院大学 知識科学 研究科 杉山 歩 助教授に大変お世話になりました.研究発表における良いスライドの 作り方や,研究文書の書き方など,研究活動に必須の知識について色々と教えて頂きまし た.また,学生生活において有用な情報を多く教えて頂き,そのお陰で有意義な学生生活 を送ることができました.深く感謝しております.

 研究に詰まった時のアドバイスや,各種文書の校正などでは,北陸先端科学技術大学院 大学 マテリアルサイエンス研究科 水上 卓 助教授に大変お世話になりました.杉山 先生と同様に,水上先生からも研究活動に必要な知識,心構えなど様々なことを教えて頂 きました.深く感謝しております.

 研究活動並びに学生生活において,研究室の皆様や友人達にお世話になりました.良い 研究室メンバー,友人に恵まれたことで,非常に充実した大学院生活を送る事が出来まし た.深く感謝しております.

 最後に,あらゆる面で学生生活を支援してくれた家族に深く感謝しております.

付録

ここでは,本研究の検証実験に用いたデータの元データについて説明する.なお,ここ での説明は国立情報学研究所情報学研究データリポジトリ9のニコニコデータセットに存 在するデータ仕様書からの引用である.

動画情報 JSON

動画情報JSON は下記のキーと値を持つ.

タグ情報 JSON

タグ情報JSON は下記のキーと値を持つ.ただし、lock と category キーについては、

存在しない場合がある.

図 5.2: タグ情報JSON

関連したドキュメント