• 検索結果がありません。

電子情報通信学会ワードテンプレート (タイトル)

N/A
N/A
Protected

Academic year: 2021

シェア "電子情報通信学会ワードテンプレート (タイトル)"

Copied!
6
0
0

読み込み中.... (全文を見る)

全文

(1)

DEIM Forum 2011 B6-2

ターム共起に注目したグラフ構造に基づく

ドキュメントクラスタリング

Graph Based Document Clustering with Term Co-Occurrence

藤田 真可

新美 礼彦

††

小西 修

†††

†公立はこだて未来大学大学院 システム情報科学研究科 〒041-8655 北海道函館市亀田中野町 116-2

††公立はこだて未来大学 システム情報科学部 〒041-8655 北海道函館市亀田中野町 116-2

†††公立はこだて未来大学 システム情報科学部 〒041-8655 北海道函館市亀田中野町 116-2

E-mail: †[email protected] ††[email protected], †††[email protected]

あらまし ドキュメントクラスタリングは,テキストマイニングにおける最も活発な研究課題のひとつである.ド

キュメントクラスタリングは,タームの出現頻度の統計を使って類似なドキュメントに分類するものである.この

ドキュメントクラスタリングという問題では,二つの異なる分野からの新しいアプローチがある.一つは,複雑ネ

ットワークのコミュニティ抽出,もう一つは,スペクトラルクラスタリングであり,これら二つは,ドキュメント

集合を一つのグラフとして表すものである.本研究では,大規模ドキュメント集合を実時間でクラスタリングする

方法を提案する.ドキュメントの共起ターム対に注目したグラフを構築し,ハブに基づくクラスタリングを行いサ

ブグラフに分割する.さらに,このサブグラフを基にスペクトラルクラスタリングを適用し概念マップを抽出する.

この概念マップをドキュメントのインデックスとして使用した検索システムを構築することができる.これは,検

索システムの得られた大きな検索結果集合をダイナミックスクラスタリングできるアルゴリズムである.

キーワード ドキュメントクラスタリング,ハブに基づくクラスタリング,スペクトラルクラスタリング,ターム

共起

Abstract: Document clustering is one of the most active research topics in text mining. Document clustering groups similar

documents using statistical computations on term frequencies. Ideally, related documents within the document collection are

clustered. In this work two approaches issued from very different fields are explored for document clustering: community

detection in complex networks and spectral clustering. Both approaches are based on a representation of the document

collection as a graph, of which the nodes represent the documents and the edges represent the similarities between each pair of

documents, such that the two approaches have many issues in common. These graph based approaches are complementary and

are useful for finding structure in large collections of documents. We present a novel method for semantically clustering a

large collection of documents using community detection in graphs. A term network based on term co-occurrence is generated

from the documents collection, the terms in the complex network are clustered into some communities by means of hub based

clustering and spectral clustering, the semantic term clusters as conceptual maps are used to generate overlapping document

clusters. The terms resulting from clusters as queries are used to map the highest ranked documents to clusters. Our algorithm

occupies a middle ground between speed and quality. Our method provides a way to segment large document collection in fast

running times. The algorithm presented can also be incorporated into a search system that enables the dynamic clustering of

large numbers of search results.

Keywords: document clustering, graph based clustering, community detection, term co-occurrence

1. は じ め に

現 在 , テ キ ス ト デ ー タ な ど 大 規 模 な 情 報 を コ ン ピ ュ ー タ で 扱 う こ と が 多 く な っ て い る . し か し , 大 量 の デ ー タ 情 報 の 各 情 報 が ど の よ う な 関 連 性 が あ る か と い う こ と は 分 か り に く く な っ て い る . そ の 大 量 の 情 報 の 中 か ら 必 要 な 情 報 を 取 り 出 せ る こ と が 必 要 で あ る . 情 報 検 索 に お い て , キ ー ワ ー ド 検 索 は , キ ー ワ ー ド

(2)

と 関 連 し て い る ド キ ュ メ ン ト で も ユ ー ザ ー が 意 図 し な い ド キ ュ メ ン ト が 検 索 結 果 と し て 出 て く る こ と が あ る . こ れ は イ ン タ ー ネ ッ ト コ ン テ ン ツ の 発 展 や 普 及 に よ り 情 報 が 多 様 化 し て い る た め で あ る . ま た , 従 来 の 研 究 で は , 大 規 模 な ド キ ュ メ ン ト ク ラ ス タ リ ン グ に k-means 法が 使わ れてお り, ドキ ュメン ト キ ー ワ ー ド を 記 述 す る と き に は ベ ク ト ル 空 間 モ デ ル で 記 述 さ れ て い た . そ の た め , 対 応 す る デ ー タ 量 が 多 く な る と 結 果 が 煩 雑 に な っ て し ま っ て い た . こ れ を 解 決 す る た め に ド キ ュ メ ン ト を グ ラ フ 表 現 し , グ ラ フ マ イ ニ ン グ を 行 う .

2. 関 連 研 究

Barabasi ら の 研 究 で ス ケ ー ル フ リ ー ネ ッ ト ワ ー ク の 度 数 分 布 が 平 均 に 一 致 し な い こ と が 発 見 さ れ た . そ の ネ ッ ト ワ ー ク は 80 パ ーセ ント以 上の ノー ドが リンク 数 4 未満で あり ,度数 分布 の上 位個数 のノ ード (全体の 0.001 パ ー セ ン ト ほ ど の ノ ー ド )が 1000 本 以 上 の リ ン ク を 持 っ て い る べ き 乗 則 で あ る こ と が わ か っ て い る . つ ま り , ラ ン ダ ム ネ ッ ト ワ ー ク の 分 布 で は 平 均 か ら 外 れ る と ノ ー ド 数 が 少 な く な る が , べ き 乗 則 に 従 う ス ケ ー ル フ リ ー ネ ッ ト ワ ー ク で は そ の よ う な 系 に 従 う 尺 度 が 存 在 し て い な い と い う 特 徴 が あ る . 本 研 究 で は , 使 用 す る デ ー タ に よ り 構 築 し た ネ ッ ト ワ ー ク が こ の べ き 乗 則 に 従 う か を 検 証 す る [1],[2]. Rohinski ら の 研 究 で は 複 雑 な ネ ッ ト ワ ー ク に 対 し , そ の ネ ッ ト ワ ー ク を 複 数 の 階 層 ・ 種 類 を 用 い て 自 動 的 に 分 類 す る も の を 設 定 し , こ れ を 用 い て 一 定 の ノ ー ド を 持 つ 部 分 グ ラ フ を 要 約 す る こ と で 概 念 マ ッ プ の ク ラ ス タ リ ン グ を 行 っ て い る . 本 研 究 で は ス ケ ー ル フ リ ー ネ ッ ト ワ ー ク 性 を 用 い て ハ ブ 構 造 ネ ッ ト ワ ー ク 内 の ノ ー ド か ら 構 成 さ れ る 部 分 グ ラ フ を 用 い て ク ラ ス タ リ ン グ を 行 う [3],[7]. Illhoi Yoo ら の 研 究 で は そ れ ぞ れ の ド キ ュ メ ン ト ク ラ ス タ が 重 要 度 の 高 い ネ ッ ト ワ ー ク 構 造 と 定 義 す る こ と で , そ れ ぞ れ の ド キ ュ メ ン ト ク ラ ス タ に つ い て 意 味 的 関 連 性 の あ る 情 報 の 核 を 見 つ け 部 分 グ ラ フ を 分 類 す る モ デ ル を 生 成 し て い る . こ の 部 分 グ ラ フ の モ デ ル を も と に し , 各 実 験 の ド キ ュ メ ン ト デ ー タ を 関 連 付 け て ネ ッ ト ワ ー ク に す る こ と で ク ラ ス タ リ ン グ を お こ な っ て い る . 本 研 究 で 抽 出 す る ハ ブ ノ ー ド と こ の ハ ブ ノ ー ド と 接 続 す る サ ブ ノ ー ド か ら 構 成 さ れ る ネ ッ ト ワ ー ク も ツ リ ー 構 造 の ネ ッ ト ワ ー ク で あ る . 複 数 の ハ ブ 構 造 ネ ッ ト ワ ー ク も 同 様 に 用 い て い る が , 本 研 究 で は ハ ブ 構 造 ネ ッ ト ワ ー ク ク ラ ス タ リ ン グ で は な く そ の ハ ブ 構 造 ネ ッ ト ワ ー ク で 構 成 さ れ る ノ ー ド で 構 築 さ れ る ネ ッ ト ワ ー ク で ク ラ ス タ リ ン グ を 行 う [4],[5]. ド キ ュ メ ン ト 集 合 内 の タ ー ム を ノ ー ド と し た ネ ッ ト ワ ー ク を 構 築 し , 自 然 言 語 で あ る ド キ ュ メ ン ト 内 の タ ー ム そ れ ぞ れ が ス モ ー ル ワ ー ル ド ネ ッ ト ワ ー ク 構 造 を 示 す こ と か ら , ス モ ー ル ワ ー ル ド コ ミ ュ ニ テ ィ を 使 っ て 意 味 的 に ク ラ ス タ リ ン グ す る 方 法 が あ る . ド キ ュ メ ン ト を 語 彙 の ネ ッ ト ワ ー ク グ ラ フ に し , 相 互 情 報 量 に よ っ て グ ラ フ カ ッ ト し ク ラ ス タ リ ン グ す る 方 法 で あ る . [6]

3. 提 案 手 法

従 来 ま で は 専 門 的 な ド キ ュ メ ン ト の 分 類 は 専 門 家 が 手 作 業 で 分 類 し て い た . こ れ を 自 動 的 に 分 類 で き る よ う シ ス テ ム を 構 築 す る . ま た , 従 来 の ベ ク ト ル 表 現 の ド キ ュ メ ン ト ク ラ ス タ リ ン グ よ り 膨 大 な ド キ ュ メ ン ト を 直 感 的 に 理 解 で き る よ う な 表 現 と , 実 時 間 で 分 類 す る 方 法 を 提 案 す る . ド キ ュ メ ン ト 集 合 を グ ラ フ 表 現 し , こ の ネ ッ ト ワ ー ク グ ラ フ を 分 割 す る こ と で イ ン デ ッ ク ス と な る 概 念 マ ッ プ を 抽 出 し , ド キ ュ メ ン ト ク ラ ス タ リ ン グ を 行 う . 本 研 究 で は , 大 規 模 ド キ ュ メ ン ト 集 合 を 実 時 間 で 分 割 す る 方 法 を 提 案 す る . ド キ ュ メ ン ト 集 合 を グ ラ フ 表 現 し , ド キ ュ メ ン ト 集 合 か ら な る 複 雑 な ネ ッ ト ワ ー ク の 分 類 を 効 果 的 に 行 う ア プ ロ ー チ を と る . こ れ に よ っ て よ り 効 果 的 な 表 現 と な る 概 念 マ ッ プ に 基 づ く ド キ ュ メ ン ト の ク ラ ス タ リ ン グ を 行 う . ま ず , ネ ッ ト ワ ー ク か ら ハ ブ 構 造 ネ ッ ト ワ ー ク を 構 築 す る ア プ ロ ー チ を 示 す . こ の ア プ ロ ー チ で は 重 要 な ハ ブ ノ ー ド と そ れ に つ な が る ノ ー ド か ら な る ネ ッ ト ワ ー ク を 構 築 す る こ と で , そ の ド キ ュ メ ン ト 集 合 内 で の キ ー ワ ー ド か ら 多 く の キ ー ワ ー ド , も し く は 多 く の ド キ ュ メ ン ト と 関 連 し て い る キ ー ワ ー ド を 見 つ け る こ と を 目 的 と す る . 3.1 提 案 手 法 の 流 れ 図 1 ではド キュメ ント 集合 か ら作 られ たネ ットワ ー ク グ ラ フ か ら 概 念 マ ッ プ 抽 出 ま で の 流 れ を 示 し て い る . a は ド キ ュ メ ン ト 集 合 全 体 の タ ー ム と 共 起 タ ー ム か ら な る ネ ッ ト ワ ー ク グ ラ フ で あ る . b は 共起 ターム の出 現 回 数 に 閾 値 で 制 限 し た も の で あ る . c は bのグ ラフ 構 造 の ハ ブ を 取 り 出 し た サ ブ グ ラ フ ( ク ラ ス タ ) で あ る .d は Hub Based Clustering を 用いて 抽出 した クラス タ に さ ら に Spectral Clustering [9],[10]を用 いてク ラス タ を 抽 出 す る .そ し て ,cohesion を使 って その ターム の 出 現 頻 度 に 対 し て そ の タ ー ム に 接 続 す る エ ッ ジ と な る 共 起 タ ー ム の 出 現 頻 度 の 割 合 の 高 い も の を 抽 出 し て 概 念 マ ッ プ と す る . こ れ ら に よ っ て ド キ ュ メ ン ト ク ラ

(3)

ス タ リ ン グ e がで きる . ス ペ ク ト ラ ル ク ラ ス タ リ ン グ を 行 う た め に , ス ペ ク ト ラ ル ク ラ ス タ リ ン グ の 固 有 値 問 題 を 解 決 す る 必 要 が あ る . そ こ で , 大 規 模 な ネ ッ ト ワ ー ク を 意 味 の あ る 分 割 で ス ペ ク ト ラ ル ク ラ ス タ リ ン グ が 行 え る よ う な サ イ ズ に ハ ブ ク ラ ス タ リ ン グ を 使 っ て ネ ッ ト ワ ー ク を ク ラ ス タ リ ン グ す る . こ の ハ ブ ク ラ ス タ リ ン グ を 行 う こ と に よ っ て , 大 規 模 な ネ ッ ト ワ ー ク に 対 し て も ス ペ ク ト ラ ル ク ラ ス タ リ ン グ を 行 う こ と が で き る . 図 1 グ ラフ構 築か らの 概念マ ップ 抽出 までの 流れ 本 研 究 で は , ド キ ュ メ ン ト 集 合 を ひ と つ の 世 界 と し て と ら え . 各 ド キ ュ メ ン ト の キ ー ワ ー ド に 注 目 す る . こ の と き , ド キ ュ メ ン ト の キ ー ワ ー ド の 欄 よ り タ ー ム を 抽 出 し た . [Co-occurrence Term] 図 2 タ ー ム ペ ア 生 成 1. ID と タ ー ム の テ ー ブ ル か ら タ ー ム ペ ア を 作 る . 具 体 例 を 図 2 に 示 す .“data mining” と “hub” と “co-occurrence”がタ ーム とな り,グラ フの ノー ド と な る . エ ッ ジ は “data mining”と“hub”,“data mining”と“co-occurrence”,“hub”と“co-occurrence” の ノ ー ド 間 に 付 く こ と に な る . 2. タ ー ム を ノ ー ド と し , 1 で 出 来 た タ ー ム ペ ア に エ ッ ジ を 付 け る . こ れ を も と に グ ラ フ を 構 築 す る . た ま た ま で き た タ ー ム ペ ア の 使 用 を 避 け る た め に , 出 現 回 数 に 閾 値 を 指 定 し て 閾 値 を 越 え た タ ー ム ペ ア を 使 う .

(4)

[Hub Based Clustering] 3. 2 で 再 構 築 さ れ た グ ラ フ に 対 し て エ ッ ジ の 重 み を つ け る . Cohesion を使 い, 全体の 出現 頻度 に 対 す る ペ ア の 出 現 頻 度 を エ ッ ジ の 重 み と す る . 4. ハ ブ の 抽 出 を 行 う . ハ ブ に は , 各 ノ ー ド に 対 し て 接 続 し て い る エ ッ ジ の cohesion で 付 け た 重 み の 総 和 を 求 め , 値 が 大 き い も の か ら ハ ブ と し て 取 り だ す . 5. 取 り だ し た 各 ハ ブ そ れ ぞ れ に 隣 接 し て い る ノ ー ド 同 士 の グ ラ フ を 抽 出 す る . こ れ は 1 , 2 で 構 築 し た グ ラ フ の 部 分 グ ラ フ に あ た る . 図 3 ハ ブ に 基 づ く ク ラ ス タ リ ン グ [Spectral Clustering] 6. こ の 5 で 抽 出 し た 部 分 グ ラ フ を も と に ス ペ ク ト ラ ル ク ラ ス タ リ ン グ ア ル ゴ リ ズ ム を 用 い て ク ラ ス タ を 作 る . 7. 6 で 行 わ れ た グ ラ フ カ ッ ト で 出 来 た 部 分 グ ラ フ を 概 念 マ ッ プ と し , ド キ ュ メ ン ト 間 の 関 連 の 特 徴 づ け を 行 う .

4. 実 験

今 回 の 実 験 に 使 用 し た デ ー タ を 表 に 示 す . 表 1 使 用デー タ ( 論文 数) こ の 実 験 デ ー タ よ り 抽 出 し た タ ー ム の 総 数 は 6971 個 ,タ ー ム の 種 類 は 3037 個,ター ムペア の総 数は 20046 個 , タ ー ム ペ ア の 種 類 は 15283 個とな った .こ の抽出 結 果 か ら ノ ー ド は 3037 個,エッ ジは 15283 個と なるの で グ ラ フ を 構 築 し た . こ の ネ ッ ト ワ ー ク グ ラ フ は zipf’s low に従っ てお り , ス ケ ー ル フ リ ー 性 を 示 し た . 図 4 zipf’s law に基 づく 分布 ハ ブ を 取 り 出 し , 一 つ の ハ ブ か ら 概 念 マ ッ プ を い く つ か 作 る . 図 4 は “ Data mining”のハ ブ ノ ード からの 概 念 マ ッ プ で あ る . 図 4 概 念 マ ッ プ 例

0

1

2

3

4

0

0.5

1

1.5

2

lo

g(

頻度)

log(順位)

For

End

For

End

If

End

v

HNS

HNS

true

v

HNS

Linking

If

V

in

v

each

For

v

HNS

HNS

k

to

i

HNS

each

For

ree

N

of

k

Top

v

v

v

G

desend

v

ree

N

V

Sort

For

End

For

End

e

weight

v

ree

N

e

in

v

each

For

E

in

e

edge

each

For

Sets

Node

Hub

HNSs

k

clusters

k

Output

partition

graph

of

number

the

k

sets

term

occurrence

co

E

V

G

graph

a

Input

Clustering

Based

Hub

orithm

A

j i i j i j i i i i k j i j i j

}

{

)

,

(

}

{

1

,

}

deg

|

,

,

,

{

'

)

),

(

deg

,

(

)

(

)

(

deg

))

(

(

:

)

(

)

(

)

,

(

:

:

lg

2 1

(5)

各 ハ ブ 構 造 ネ ッ ト ワ ー ク 内 の 全 て の ノ ー ド に つ い て そ れ ら の ノ ー ド 間 の リ ン ク を 全 て 抽 出 し , ネ ッ ト ワ ー ク を 構 築 す る こ と で , 概 念 マ ッ プ を 抽 出 す る . そ の ネ ッ ト ワ ー ク 兄 で の 各 2 点 の ノ ー ド の 平 均 距 離 と ク ラ ス タ ー 度 を 調 べ る こ と で , ス モ ー ル ワ ー ル ド 性 を 調 べ た ( 表 2 ). 表 2 ク ラ ス タ ー 係 数 実 験 結 果 の 例 と し”Data mining”の概 念マッ プか らの 部 分 グ ラ フ と そ の 文 献 数 を 表 3 に 示 す . 表 3 ハ ブ ノ ー ド“Data mining”の結 果 共 通 す る ノ ー ド 接 続 ノ ー ド 文 献 件 数

Data maining association rule 4 clustering 4 Data mining association rule 3 mining methods 3 Data mining association rule 2 mining methods 2 Data mining closed itemset 2 minimal generator 2 Data mining clustering 2

singular value decomposition

2 Data mining clustering 2 classification 2 Data mining knowledge discover y 3 text mining 3 Data mining knowledge discover y 2 text mining 2 Data mining knowledge discover y 2 text classification 2

5. 分 析 と 考 察

ハ ブ を 抽 出 し た と き に , 抽 出 し た ハ ブ に 隣 接 し て い る ノ ー ド( サ ブ ノ ー ド )が ,ハ ブ の 場 合 が あ る( 図 5 ). こ の よ う な ノ ー ド は ネ ッ ト ワ ー ク の 中 で 特 に 強 い 概 念 を 持 つ ノ ー ド で は な い か と 考 え ら れ る . 図 5 ハ ブ ノ ー ド の 派 生 ま た ,図 6 の よ う に 2 点 の ハ ブ ノ ー ド に 隣 接 す る ノ ー ド が 複 数 あ る 場 合 , 抽 出 数 を わ ず か に 増 加 す る だ け で ハ ブ ノ ー ド に な る ノ ー ド が あ る 一 方 で , 膨 大 な 数 の 抽 出 数 で も ハ ブ ノ ー ド に 変 化 し な い ノ ー ド が 存 在 す る . こ れ は 重 み の 総 和 が 高 い だ け で な く , そ の 際 の そ れ ら の ノ ー ド が 持 つ リ ン ク の 本 数 に も 影 響 が あ る と 考 え ら れ る . 図 6 ハ ブ ノ ー ド の 派 生

6. お わ り に

本 研 究 で は , 大 規 模 な デ ー タ を 扱 う の に 適 し た グ ラ フ 表 現 を 用 い , ド キ ュ メ ン ト 集 合 か ら な る 複 雑 な ネ ッ ト ワ ー ク の 分 類 を 効 果 的 に 行 う ア プ ロ ー チ を と っ た . こ れ に よ り , 概 念 マ ッ プ に 基 づ く ド キ ュ メ ン ト ク ラ ス タ リ ン グ が で き た . 本 論 文 の 特 徴 と し て は , 共 起 タ ー ム を 利 用 し た グ ラ フ か ら の ハ ブ ク ラ ス タ リ ン グ と ス ペ ク ト ラ ル ク ラ ス タ リ ン グ を 行 い , 概 念 マ ッ プ を 抽 出 す る と こ ろ で あ る . 概 念 マ ッ プ 抽 出 に よ り そ の 概 念 マ ッ プ を イ ン デ ッ ク ス と し た 検 索 シ ス テ ム を 可 能 と す る . 共 起 タ ー ム か ら ネ ッ ト ワ ー ク グ ラ フ を 構 築 す る こ と で 言 語 世 界 の ス ケ ー ル フ リ ー 性 に 注 目 す る .そ し て , そ の ス ケ ー ル フ リ ー 性 が も つ ハ ブ と い う 概 念 を 用 い て , ハ ブ に 基 づ く グ ラ フ ク ラ ス タ リ ン グ に よ る サ ブ グ ラ フ の 作 成 す る . ハ ブ ク ラ ス タ リ ン グ す る こ と で , 大 規 模

(6)

な デ ー タ を 意 味 の あ る ク ラ ス タ に 分 割 し , ク ラ ス タ サ イ ズ を 小 さ く す る こ と で ス ペ ク ト ラ ル ク ラ ス タ リ ン グ を 適 応 で き る よ う に な る . ス ペ ク ト ラ ル ク ラ ス タ リ ン グ は 高 い 質 で ク ラ ス タ リ ン グ を 行 う こ と が で き る ク ラ ス タ リ ン グ 手 法 で あ る . 今 後 , よ り 大 規 模 な ド キ ュ メ ン ト 集 合 に 適 応 で き る 効 果 的 な 高 速 ス ペ ク ト ラ ル ク ラ ス タ リ ン グ ア ル ゴ リ ズ ム ( 乱 択 ア ル ゴ リ ズ ム を 含 む ) の 開 発 を 進 め る [8]. ま た , 実 験 デ ー タ の ド キ ュ メ ン ト か ら の キ ー ワ ー ド 抽 出 を 工 夫 す る こ と で よ り 精 度 の 高 い 結 果 が 得 ら れ る と 考 え ら れ る . そ し て , よ り 高 速 な 処 理 を 可 能 と す る た め に ス ペ ク ト ラ ル ク ラ ス タ リ ン グ の 改 良 が 必 要 と な る .

参 考 文 献

[1]

A. L.Barabasi, R Albert, H.Jeong, and G.Bianconi , “ Power-law distribution of the world wide web.Science” , 287, 2000

.

[2] A. L.Barabasi, Reka Albert ,“ Emergence of Scaling in Random network ” , SCIENCE Vol 286 p509 -512, 1999.

[3]

Rohini K. Srihari, Sudarshan Lamkhede, Anmol Bhasin, “Unapparent Information Revelation: A Concept Chain Graph Approach ” , CIKM'05, 2005. [4] Illhoi Yoo, Xiaohua Hu, Il Yeol Song “ Integrating

Biomedical Literature Clustering nd Summriztion Approches using Biomedical Ontology”, ACM, 2006. [5] Illhoi Yoo, Xiaohua Hu, Il Yeol Song,“ Clustering Ontology-enriched Graph Representation for Biomedical Documents based on Scale -Free Network Theory” , 2006 3rd International IEEE conference on volume, p851 -858, 2006.

[6] Brant Chee, Bruce Schatz, “ Document Clustering using Small world community” , JCDL’07, 53-60, 2007.

[7] L. da F. Costa, Hub -Based Community Finding, arXiv:cond-mat/0405022v1, 2004.

[8] Y.Wng, H.Song and W. Wang, “ A Microscopic View on Community Detection in Complex Networks ” , PIKM’08, 57-64, 2008.

[9] Y.Chi, X.Song, D.Zhou, “ K.Hino, and B.Tseng, Evolutionary Spectral Clustering by Incorporating Temporal Smoothness” , KDD’07.

[10] X.Wang and I. Davidson, “ Flexible Constrained Spectral Clustering” , KDD’10, 563-572, 2010.

参照

関連したドキュメント

The (GA) performed just the random search ((GA)’s initial population giving the best solution), but even in this case it generated satisfactory results (the gap between the

The objective of this study is to address the aforementioned concerns of the urban multimodal network equilibrium issue, including 1 assigning traffic based on both user

In Section 4 we present conditions upon the size of the uncertainties appearing in a flexible system of linear equations that guarantee that an admissible solution is produced

By an inverse problem we mean the problem of parameter identification, that means we try to determine some of the unknown values of the model parameters according to measurements in

Finally, in Section 7 we illustrate numerically how the results of the fractional integration significantly depends on the definition we choose, and moreover we illustrate the

The aim of this work is to prove the uniform boundedness and the existence of global solutions for Gierer-Meinhardt model of three substance described by reaction-diffusion

In particular, a 2-vector space is skeletal if the corresponding 2-term chain complex has vanishing differential, and two 2-vector spaces are equivalent if the corresponding 2-term

The linearized parabolic problem is treated using maximal regular- ity in analytic semigroup theory, higher order elliptic a priori estimates and simultaneous continuity in