dbdc2 anai

(1)

Random Forest 用い

対破綻検知器作成

公立こ未来大学金井貴浩松原仁

(2)

開発し破綻検知器概要

• ^入力

• ^当 ^ム発 ^，直前 ^ユ ^発 ^使用し

• ^出力

• ^， ^出力し

• ^途中 ^破綻 ^判定 ^分布 ^考慮し ^い ^い

• Paragraph Vector Random Forest ^実装行

(3)

対破綻検知器

• ^入力： ^ム発 ^，直前 ^ユ ^発

• ^出力：^{1, 0(}^破綻し ^，し ^い ^い ⁾

入力

Paragraph Vector

文章分散表

現

Random Forest

木構造分類器ユ

う

ムこ

出力

(4)

Paragraph Vector

• ^今回 ^対 ^{破綻検知器} ^使用し ^分散表現

• ^実装 ^python ^イブ ^gensim¹ ^使用

• Word2vec ^文章 ^拡大

• ^単語 ^分散表現 ^連結， ^しく ^均 ^す ^こ文章表現

• ^文章 ^語順 ^保 ^こ

• BoW

[Quoc Le, 2014]

(5)

特徴量

• ^ユ ^発 ^ム発 ^ベク ^化

• ^ユ ^発 ^ベク ^ム発 ^ベク ^内積，コ ^イ

ン尺度

• ^コ ^イン尺度 ^，文章 ^類似度 ^使わ ^こ ^多い

• ^対 ^破綻 ^原因 ^ユ ^発 ^ム発 ^意味

差？

(6)

Random Forest

• ^木構造 ^利用し ^アン ^ンブ ^学習 ^一種

• ^木構造 ^{複数作成し，多数決} ^最終的 ^分類決定

• ^学習 ^速度 ^{速く，軽量}

• Python ^イブ scikit-learn² ^使用

[Breiman, Leo. 2001]

(7)

実験

• Random Forest ^学習 ^傾向 ^知 ^い

• ^いく ^コ ^パ ^セッ ^調べ

• Paragraph Vector ^学習 ^昨 ^配布さ rest1046 ^使用し

• ^学習す ^コ ^パ ^量 ²⁵^個，¹⁰⁰^個，⁹⁶³^個 ^設定し

• ^学習す ^コ ^パ rest1046, DCM, IRS ^ン ^ム使用し

(8)

結果 ₍ ベ一致尺度 ₎

学習量 Accuracy Precision(X) Recall(X) F(X) Precision(T+X) Recall(T+X) F(T+X)

963^個run1 0.335 0.187 0.683 0.294 0.385 0.633 0.479

100^個run1 0.551 0.141 0.197 0.164 0.383 0.214 0.274

25^個run1 0.611 0.216 0.053 0.086 0.472 0.053 0.095

(9)

結果 ₍ 分布距離系統 ₎

学習量 _Accuracy

Js divergence (O,T,X)

Js divergence (O,T+X)

Js divergence (O+T,X)

963^個run1 0.335 0.493 0.405 0.353

100^個run1 0.551 0.633 0.445 0.585

25^個run1 0.611 0.695 0.468 0.685

(10)

実験

• 25^個 ^学習し ^Accuracy ^高い

• X ^検出率 ^低い

• 963^個学習し ^Accuracy ^低い

• ^{分布距離系統} ^い ^， ^性能 ^いい

• ^今回 ¹⁰⁰^個学習し ^ン ^提出し

• ^中間的 ^性能

(11)

今後

• Paragraph Vector ^使わ ^単語 ^学習量 ^少い

• Twitter^コ ^パ ^使用し

Paragraph Vector ^学習量 ^増やす

• 100^個 ^コ ^パ ^学習し ⁹⁶³^個学習し

学習量差あ

• ^細 ^く学習量 ^調整し ^{いく必要性} ^あ

(12)

参考文献

[Quoc Le, 2014] Le, Q. V., & Mikolov, T. (2014, June). Distributed Representations of Sentences and

Documents. In ICML (Vol. 14, pp. 1188-1196).

[Breiman, Leo. 2001] Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.

dbdc2 anai

Random Forest 用い

対 破綻検知器 作成

開発し 破綻検知器 概要

対 破綻検知器

Paragraph Vector

特徴量

Random Forest

実験

結果 ( ベ 一致尺度 )

結果 ( 分布距離系統 )

実験

今後

参考文献

対破綻検知器作成

開発し破綻検知器概要

対破綻検知器

結果 ₍ ベ一致尺度 ₎

結果 ₍ 分布距離系統 ₎