• 検索結果がありません。

PDFファイル 3F4 「人間・行動と機械学習」

N/A
N/A
Protected

Academic year: 2018

シェア "PDFファイル 3F4 「人間・行動と機械学習」"

Copied!
2
0
0

読み込み中.... (全文を見る)

全文

(1)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 1 -

類器

知特性

付加

特徴

Addition of cognitive properties to a spam classifier

谷口

英貴

*1

甲野

*1

清水

隆宏

*1

高橋達

*2

Hidetaka Taniguchi Yuu Kouno Takayuki Shimizu Tatsuji Takahashi

*1

東京電機大学大学院

*2

東京電機大学

Graduate School Tokyo Denki University Tokyo Denki University

Previous studies have shown that some combo of human cognitive biases is effective in machine learning. The well used model of the biases is called LS (loosely symmetric) model. In this study, we test how LS works for classifying spam emails.

1.

はじめに

先 行 研 究 人 間 因 果 関 係 推 論 傾 向 有 す

Loosely Symmetric model : LS 通し ,人間 知特性

機械学習 諸 い 有効 あ 示さ い . 本 研 究 汎 用 的 機 械 学 習 あ

類 扱い,LS 通し 人間 知特性 既存 困 難 類 い 様 働く 検証し .

2.

Loosely Symmetric Model

緩 い対 称 性 (LS) ,人間 因 果 帰 納 等 存 在 す 対称性 び 相互対称性 いう 2 非 論 理 的 知 緩 や 持 確 信 度 あ

[篠原 2007].

人 ,原因 象p 結果 象q あ 時, p→

q 真 あ ば q→p 真 あ 思い込 対称性

あ . p→q あ ば p→q あ 思い込 相 互排 他性 存在 し,こ 論 理学 い 裏 表 関係 あ , 人 直感 誤 解 出す 恐 あ 言 え .

し し,LS 他 普 性 用い こ 柔 軟 変化 す こ ,人 間 因 果 機能 対し高 い相関 持

, , 機械学 習 い 高い成果 出 し い . 類 器 人 間 知 特 性 組 込 こ

柔軟化 本研究 LS 採用す 端緒 . 本研究

け a,b,c,d p,q 共起頻度,あ い

共起確率pq,p ̅, ̅q, ̅ ̅ 対応す .対応表 表1 示す.

表1 : 共起情報 2×2 割表

̅

a b

̅ c d

|

(1)

3.

教師あり学習

例 えば 等 , 機 械 未 定 義

類 さ せ 手 法 機 械 学 習 い う. 機 械 学 習 教 師 あ 学 習 教師 し学習 種類 大 さ .本研究 扱 う 教師 あ 学 習 ,既 与え ン 付随さ 教師 信 号 機 械 的 解 析 し, 結 果 教 師 信 号 対 す

自 的 生 成 し いく学 習 手 法 あ . 教師あ 学習 類さ , ッ や本文 含

,迷惑 /非迷惑 ( ) いう教 師 信 号 , う 単 語 や 構 造 含 /

類さ 学習す .

し し, 中 easy ham 呼ば 簡単

類 対し ,hard ham 呼ば

境 界 あ う 存在 し ,こ 正しく す 困難 あ .本研究 教師あ 学習( ) LS 組 込 用 い , 人 間 近 い直 感 性 付与 し, 未知 対し 柔 軟化 正 確 可能 実装 目指す.

3.1 ナイーブベイズ分類器

本 研 究 け ナ 類 器 呼 ば 使 用 す . 今 回 本 文 中 使 用 さ い 単語 扱い,各単語 内 け 使 用 頻 度 , 非 内 け 使 用 頻 度 調

[Conway 2012].こ 非 含 任

意 単語 確 率 | 学 習 し,こ

元 有害 あ 無害 あ す .式 2 用 い 類( ) あ 確 率 | 非 あ 確率 | 計算し, 大 関係 任意 ( ) 類 決定す .

| |

| ∏ |

(2)

3.2 第一種過誤と第二種過誤

既 存 い 学 習 実 験 双方 共 存 在し い 対す 処理 曖昧 あ ,こ 原因 第一 種 誤 第 種 誤 発 生す 恐 あ . 第一 種 誤 疑 陽 性 呼 ば ,偽 あ 情 報 誤 真 断 し し うこ あ . ,第 種 誤 偽陰性 呼ば ,真 あ 情報 偽 連絡先:谷口英貴e-mail : ht_msn[at]outlook.com

東京電機大学大学院理工学研究科情報学専攻

(2)

The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014

- 2 -

断 し し うこ あ . 本 研 究 人 間 知 的 性 質 揺 す LS 主観確率 し 用い , け

誤 発生率 う 変化 発生す 検証し .

4.

LSNB

分類器

5章 述 ナ う ,既 存 用 い

未 知 対 し 適 断 し難 い . こ ナ LS 組 込 ,教師情報 元 各単 語 非 け 共起情報 記録す . ,

行う 教師情報 LS 扱え 形 変換す . 本 文 存 在 す 単語 共起 頻 度 抽 出 し , 任 意 単 語

非 共起情報 表 2 う 割す . し 式 3 ,通常 ナ | 計 算 し う | | 計 算 し , 大 関係 任意 ( ) 類 決定す .

表2 : 抽出し 共起頻度表

Spam Ham

a b

¬ c d

| |

| ∏ |

(3)

5.

シミュレーション

始 教 師 情 報 し 非 英 文

与え, 数 2673個,492個 し . 学習 終え ,非 あ

容易 (以 easy ham),非 あ 困

難 (以 hard ham), (以 spam) 種類

与え,各 類機 正しく 可能 行 .

5.1 結果

LS 用い 類器 ナ シ ュ ション 結

果 表3 ,ナ 結果 表4 示す.こ 結 果 LS 用い 類器 ナ 類機 比

,spam 性 能 向 し い こ わ . ,hard

ham い 若干 向 見 ,easy ham 性

能 低 し い .

表3 : LS 類器 精度

spam Ham

easy ham 0.3657143 0.63428571

hard ham 0.2661290 0.73387097

Spam 0.9204871 0.07951289

表4 : ナ 類器 精度

spam Ham

easy ham 0.1957143 0.8042857

hard ham 0.2782258 0.7217742

spam 0.8495702 0.1504298

5.2 考察

ナ LS 組 込 こ ,spam 類 い

ham 教師情報 ,ham 類 い spam 教師情

報 参照す こ 可能 、相互排他的 類 可能 .こ 対 し, 従 来 ナ 未 知 単 語 出 現 し 際 , 単 語 あ 確 率 低 く 見 積 計 算 す

,正しい す こ 困難 あ 考え . し し,LS 用い 器 既存 類器 ham

spam し し し .こ Easy ham ,hard hamや

spam 教師情報 対し 数 多く,spam 含

無害 単 語 多 く参照 し し こ 予想さ . 以

こ ,easy ham spam 類 い , さ

傾向 高 予想さ .

6.

結論

本研究 ,ナ LS 組 込 類器 既 存 比較 行い,LS 類器 い う

働く 検証し .spam及びhard ham い LS 有

用 働 くこ 確 , 多 く 情 報 含 対 し 誤 断 す 傾 向 強 く し . 今 発 展 し , 検 出 率 高 共 , 非

向 目指す.

参考文献

[篠原 2007] 篠原修 ,田口亮,桂田浩一,新田恒雄: 因果性

基 く信念形成 N本腕 ン ッ 問題 応用, 人工知能学会論文 22巻1号G,pp.58-68,2007.

[清水 11] 清水 隆宏,横川純貴,甲野佑,高橋達 : 知

調整機構 LS Q学習 実装 機能, JSAI

2011(2011年度人工知能学会全国大会(第 25回)) ,予稿

集,2011

[清水 13] 清水隆宏,大用 庫智,高橋達 :人間 因果的直

観 用い 類器,JSAI2013(2013年度人工知能学

会全国大会(第27回)) ,予稿集,2013

[Takahashi 2010]. T. Takahashi, M. Nakano and S. Shinohara, *“Cognitive symmetry:

Illogical but rational biases,”* Symmetry: Culture and Science, Vol. 21, No. 1-3, pp. 275-294, 2010.

[Takahashi 2011]. T. Takahashi, K. Oyo and S. Shinohara, *“A Loosely Symmetric Model of Cognition,nitiakahashi, K. Oyo and S. Science, No. 5778, Springer, pp. 234-241, 2011. [Conway 2012] Drew Conway, John Myles White, Machin

参照

関連したドキュメント

Its layer-to-layer transfer matrix is a polynomial of two spectral parameters, it may be re- garded in terms of quantum groups both as a sum of sl(N) transfer matrices of a chain

In this paper, we will be concerned with a degenerate nonlinear system of diffusion-convection equations in a periodic domain modeling the flow and trans- port of

In [11] a model for diffusion of a single phase fluid through a periodic partially- fissured medium was introduced; it was studied by two-scale convergence in [9], and in [40]

To deal with the complexity of analyzing a liquid sloshing dynamic effect in partially filled tank vehicles, the paper uses equivalent mechanical model to simulate liquid sloshing...

Differential equations with delayed and advanced argument (also called mixed differential equations) occur in many problems of economy, biology and physics (see for example [8, 12,

3.1, together with the result in (Barber and Plotkin 1997) (completeness via the term model construction), is that the term model of DCLL forms a model of DILL, i.e., a

It is suggested by our method that most of the quadratic algebras for all St¨ ackel equivalence classes of 3D second order quantum superintegrable systems on conformally flat

In particular, we consider a reverse Lee decomposition for the deformation gra- dient and we choose an appropriate state space in which one of the variables, characterizing the