DEIM Forum 2011 B6-2
ターム共起に注目したグラフ構造に基づく
ドキュメントクラスタリング
Graph Based Document Clustering with Term Co-Occurrence
藤田 真可
†新美 礼彦
††小西 修
††††公立はこだて未来大学大学院 システム情報科学研究科 〒041-8655 北海道函館市亀田中野町 116-2
††公立はこだて未来大学 システム情報科学部 〒041-8655 北海道函館市亀田中野町 116-2
†††公立はこだて未来大学 システム情報科学部 〒041-8655 北海道函館市亀田中野町 116-2
E-mail: †[email protected] ††[email protected], †††[email protected]
あらまし ドキュメントクラスタリングは,テキストマイニングにおける最も活発な研究課題のひとつである.ド
キュメントクラスタリングは,タームの出現頻度の統計を使って類似なドキュメントに分類するものである.この
ドキュメントクラスタリングという問題では,二つの異なる分野からの新しいアプローチがある.一つは,複雑ネ
ットワークのコミュニティ抽出,もう一つは,スペクトラルクラスタリングであり,これら二つは,ドキュメント
集合を一つのグラフとして表すものである.本研究では,大規模ドキュメント集合を実時間でクラスタリングする
方法を提案する.ドキュメントの共起ターム対に注目したグラフを構築し,ハブに基づくクラスタリングを行いサ
ブグラフに分割する.さらに,このサブグラフを基にスペクトラルクラスタリングを適用し概念マップを抽出する.
この概念マップをドキュメントのインデックスとして使用した検索システムを構築することができる.これは,検
索システムの得られた大きな検索結果集合をダイナミックスクラスタリングできるアルゴリズムである.
キーワード ドキュメントクラスタリング,ハブに基づくクラスタリング,スペクトラルクラスタリング,ターム
共起
Abstract: Document clustering is one of the most active research topics in text mining. Document clustering groups similar
documents using statistical computations on term frequencies. Ideally, related documents within the document collection are
clustered. In this work two approaches issued from very different fields are explored for document clustering: community
detection in complex networks and spectral clustering. Both approaches are based on a representation of the document
collection as a graph, of which the nodes represent the documents and the edges represent the similarities between each pair of
documents, such that the two approaches have many issues in common. These graph based approaches are complementary and
are useful for finding structure in large collections of documents. We present a novel method for semantically clustering a
large collection of documents using community detection in graphs. A term network based on term co-occurrence is generated
from the documents collection, the terms in the complex network are clustered into some communities by means of hub based
clustering and spectral clustering, the semantic term clusters as conceptual maps are used to generate overlapping document
clusters. The terms resulting from clusters as queries are used to map the highest ranked documents to clusters. Our algorithm
occupies a middle ground between speed and quality. Our method provides a way to segment large document collection in fast
running times. The algorithm presented can also be incorporated into a search system that enables the dynamic clustering of
large numbers of search results.
Keywords: document clustering, graph based clustering, community detection, term co-occurrence
1. は じ め に
現 在 , テ キ ス ト デ ー タ な ど 大 規 模 な 情 報 を コ ン ピ ュ ー タ で 扱 う こ と が 多 く な っ て い る . し か し , 大 量 の デ ー タ 情 報 の 各 情 報 が ど の よ う な 関 連 性 が あ る か と い う こ と は 分 か り に く く な っ て い る . そ の 大 量 の 情 報 の 中 か ら 必 要 な 情 報 を 取 り 出 せ る こ と が 必 要 で あ る . 情 報 検 索 に お い て , キ ー ワ ー ド 検 索 は , キ ー ワ ー ドと 関 連 し て い る ド キ ュ メ ン ト で も ユ ー ザ ー が 意 図 し な い ド キ ュ メ ン ト が 検 索 結 果 と し て 出 て く る こ と が あ る . こ れ は イ ン タ ー ネ ッ ト コ ン テ ン ツ の 発 展 や 普 及 に よ り 情 報 が 多 様 化 し て い る た め で あ る . ま た , 従 来 の 研 究 で は , 大 規 模 な ド キ ュ メ ン ト ク ラ ス タ リ ン グ に k-means 法が 使わ れてお り, ドキ ュメン ト キ ー ワ ー ド を 記 述 す る と き に は ベ ク ト ル 空 間 モ デ ル で 記 述 さ れ て い た . そ の た め , 対 応 す る デ ー タ 量 が 多 く な る と 結 果 が 煩 雑 に な っ て し ま っ て い た . こ れ を 解 決 す る た め に ド キ ュ メ ン ト を グ ラ フ 表 現 し , グ ラ フ マ イ ニ ン グ を 行 う .
2. 関 連 研 究
Barabasi ら の 研 究 で ス ケ ー ル フ リ ー ネ ッ ト ワ ー ク の 度 数 分 布 が 平 均 に 一 致 し な い こ と が 発 見 さ れ た . そ の ネ ッ ト ワ ー ク は 80 パ ーセ ント以 上の ノー ドが リンク 数 4 未満で あり ,度数 分布 の上 位個数 のノ ード (全体の 0.001 パ ー セ ン ト ほ ど の ノ ー ド )が 1000 本 以 上 の リ ン ク を 持 っ て い る べ き 乗 則 で あ る こ と が わ か っ て い る . つ ま り , ラ ン ダ ム ネ ッ ト ワ ー ク の 分 布 で は 平 均 か ら 外 れ る と ノ ー ド 数 が 少 な く な る が , べ き 乗 則 に 従 う ス ケ ー ル フ リ ー ネ ッ ト ワ ー ク で は そ の よ う な 系 に 従 う 尺 度 が 存 在 し て い な い と い う 特 徴 が あ る . 本 研 究 で は , 使 用 す る デ ー タ に よ り 構 築 し た ネ ッ ト ワ ー ク が こ の べ き 乗 則 に 従 う か を 検 証 す る [1],[2]. Rohinski ら の 研 究 で は 複 雑 な ネ ッ ト ワ ー ク に 対 し , そ の ネ ッ ト ワ ー ク を 複 数 の 階 層 ・ 種 類 を 用 い て 自 動 的 に 分 類 す る も の を 設 定 し , こ れ を 用 い て 一 定 の ノ ー ド を 持 つ 部 分 グ ラ フ を 要 約 す る こ と で 概 念 マ ッ プ の ク ラ ス タ リ ン グ を 行 っ て い る . 本 研 究 で は ス ケ ー ル フ リ ー ネ ッ ト ワ ー ク 性 を 用 い て ハ ブ 構 造 ネ ッ ト ワ ー ク 内 の ノ ー ド か ら 構 成 さ れ る 部 分 グ ラ フ を 用 い て ク ラ ス タ リ ン グ を 行 う [3],[7]. Illhoi Yoo ら の 研 究 で は そ れ ぞ れ の ド キ ュ メ ン ト ク ラ ス タ が 重 要 度 の 高 い ネ ッ ト ワ ー ク 構 造 と 定 義 す る こ と で , そ れ ぞ れ の ド キ ュ メ ン ト ク ラ ス タ に つ い て 意 味 的 関 連 性 の あ る 情 報 の 核 を 見 つ け 部 分 グ ラ フ を 分 類 す る モ デ ル を 生 成 し て い る . こ の 部 分 グ ラ フ の モ デ ル を も と に し , 各 実 験 の ド キ ュ メ ン ト デ ー タ を 関 連 付 け て ネ ッ ト ワ ー ク に す る こ と で ク ラ ス タ リ ン グ を お こ な っ て い る . 本 研 究 で 抽 出 す る ハ ブ ノ ー ド と こ の ハ ブ ノ ー ド と 接 続 す る サ ブ ノ ー ド か ら 構 成 さ れ る ネ ッ ト ワ ー ク も ツ リ ー 構 造 の ネ ッ ト ワ ー ク で あ る . 複 数 の ハ ブ 構 造 ネ ッ ト ワ ー ク も 同 様 に 用 い て い る が , 本 研 究 で は ハ ブ 構 造 ネ ッ ト ワ ー ク ク ラ ス タ リ ン グ で は な く そ の ハ ブ 構 造 ネ ッ ト ワ ー ク で 構 成 さ れ る ノ ー ド で 構 築 さ れ る ネ ッ ト ワ ー ク で ク ラ ス タ リ ン グ を 行 う [4],[5]. ド キ ュ メ ン ト 集 合 内 の タ ー ム を ノ ー ド と し た ネ ッ ト ワ ー ク を 構 築 し , 自 然 言 語 で あ る ド キ ュ メ ン ト 内 の タ ー ム そ れ ぞ れ が ス モ ー ル ワ ー ル ド ネ ッ ト ワ ー ク 構 造 を 示 す こ と か ら , ス モ ー ル ワ ー ル ド コ ミ ュ ニ テ ィ を 使 っ て 意 味 的 に ク ラ ス タ リ ン グ す る 方 法 が あ る . ド キ ュ メ ン ト を 語 彙 の ネ ッ ト ワ ー ク グ ラ フ に し , 相 互 情 報 量 に よ っ て グ ラ フ カ ッ ト し ク ラ ス タ リ ン グ す る 方 法 で あ る . [6]3. 提 案 手 法
従 来 ま で は 専 門 的 な ド キ ュ メ ン ト の 分 類 は 専 門 家 が 手 作 業 で 分 類 し て い た . こ れ を 自 動 的 に 分 類 で き る よ う シ ス テ ム を 構 築 す る . ま た , 従 来 の ベ ク ト ル 表 現 の ド キ ュ メ ン ト ク ラ ス タ リ ン グ よ り 膨 大 な ド キ ュ メ ン ト を 直 感 的 に 理 解 で き る よ う な 表 現 と , 実 時 間 で 分 類 す る 方 法 を 提 案 す る . ド キ ュ メ ン ト 集 合 を グ ラ フ 表 現 し , こ の ネ ッ ト ワ ー ク グ ラ フ を 分 割 す る こ と で イ ン デ ッ ク ス と な る 概 念 マ ッ プ を 抽 出 し , ド キ ュ メ ン ト ク ラ ス タ リ ン グ を 行 う . 本 研 究 で は , 大 規 模 ド キ ュ メ ン ト 集 合 を 実 時 間 で 分 割 す る 方 法 を 提 案 す る . ド キ ュ メ ン ト 集 合 を グ ラ フ 表 現 し , ド キ ュ メ ン ト 集 合 か ら な る 複 雑 な ネ ッ ト ワ ー ク の 分 類 を 効 果 的 に 行 う ア プ ロ ー チ を と る . こ れ に よ っ て よ り 効 果 的 な 表 現 と な る 概 念 マ ッ プ に 基 づ く ド キ ュ メ ン ト の ク ラ ス タ リ ン グ を 行 う . ま ず , ネ ッ ト ワ ー ク か ら ハ ブ 構 造 ネ ッ ト ワ ー ク を 構 築 す る ア プ ロ ー チ を 示 す . こ の ア プ ロ ー チ で は 重 要 な ハ ブ ノ ー ド と そ れ に つ な が る ノ ー ド か ら な る ネ ッ ト ワ ー ク を 構 築 す る こ と で , そ の ド キ ュ メ ン ト 集 合 内 で の キ ー ワ ー ド か ら 多 く の キ ー ワ ー ド , も し く は 多 く の ド キ ュ メ ン ト と 関 連 し て い る キ ー ワ ー ド を 見 つ け る こ と を 目 的 と す る . 3.1 提 案 手 法 の 流 れ 図 1 ではド キュメ ント 集合 か ら作 られ たネ ットワ ー ク グ ラ フ か ら 概 念 マ ッ プ 抽 出 ま で の 流 れ を 示 し て い る . a は ド キ ュ メ ン ト 集 合 全 体 の タ ー ム と 共 起 タ ー ム か ら な る ネ ッ ト ワ ー ク グ ラ フ で あ る . b は 共起 ターム の出 現 回 数 に 閾 値 で 制 限 し た も の で あ る . c は bのグ ラフ 構 造 の ハ ブ を 取 り 出 し た サ ブ グ ラ フ ( ク ラ ス タ ) で あ る .d は Hub Based Clustering を 用いて 抽出 した クラス タ に さ ら に Spectral Clustering [9],[10]を用 いてク ラス タ を 抽 出 す る .そ し て ,cohesion を使 って その ターム の 出 現 頻 度 に 対 し て そ の タ ー ム に 接 続 す る エ ッ ジ と な る 共 起 タ ー ム の 出 現 頻 度 の 割 合 の 高 い も の を 抽 出 し て 概 念 マ ッ プ と す る . こ れ ら に よ っ て ド キ ュ メ ン ト ク ラス タ リ ン グ e がで きる . ス ペ ク ト ラ ル ク ラ ス タ リ ン グ を 行 う た め に , ス ペ ク ト ラ ル ク ラ ス タ リ ン グ の 固 有 値 問 題 を 解 決 す る 必 要 が あ る . そ こ で , 大 規 模 な ネ ッ ト ワ ー ク を 意 味 の あ る 分 割 で ス ペ ク ト ラ ル ク ラ ス タ リ ン グ が 行 え る よ う な サ イ ズ に ハ ブ ク ラ ス タ リ ン グ を 使 っ て ネ ッ ト ワ ー ク を ク ラ ス タ リ ン グ す る . こ の ハ ブ ク ラ ス タ リ ン グ を 行 う こ と に よ っ て , 大 規 模 な ネ ッ ト ワ ー ク に 対 し て も ス ペ ク ト ラ ル ク ラ ス タ リ ン グ を 行 う こ と が で き る . 図 1 グ ラフ構 築か らの 概念マ ップ 抽出 までの 流れ 本 研 究 で は , ド キ ュ メ ン ト 集 合 を ひ と つ の 世 界 と し て と ら え . 各 ド キ ュ メ ン ト の キ ー ワ ー ド に 注 目 す る . こ の と き , ド キ ュ メ ン ト の キ ー ワ ー ド の 欄 よ り タ ー ム を 抽 出 し た . [Co-occurrence Term] 図 2 タ ー ム ペ ア 生 成 1. ID と タ ー ム の テ ー ブ ル か ら タ ー ム ペ ア を 作 る . 具 体 例 を 図 2 に 示 す .“data mining” と “hub” と “co-occurrence”がタ ーム とな り,グラ フの ノー ド と な る . エ ッ ジ は “data mining”と“hub”,“data mining”と“co-occurrence”,“hub”と“co-occurrence” の ノ ー ド 間 に 付 く こ と に な る . 2. タ ー ム を ノ ー ド と し , 1 で 出 来 た タ ー ム ペ ア に エ ッ ジ を 付 け る . こ れ を も と に グ ラ フ を 構 築 す る . た ま た ま で き た タ ー ム ペ ア の 使 用 を 避 け る た め に , 出 現 回 数 に 閾 値 を 指 定 し て 閾 値 を 越 え た タ ー ム ペ ア を 使 う .
[Hub Based Clustering] 3. 2 で 再 構 築 さ れ た グ ラ フ に 対 し て エ ッ ジ の 重 み を つ け る . Cohesion を使 い, 全体の 出現 頻度 に 対 す る ペ ア の 出 現 頻 度 を エ ッ ジ の 重 み と す る . 4. ハ ブ の 抽 出 を 行 う . ハ ブ に は , 各 ノ ー ド に 対 し て 接 続 し て い る エ ッ ジ の cohesion で 付 け た 重 み の 総 和 を 求 め , 値 が 大 き い も の か ら ハ ブ と し て 取 り だ す . 5. 取 り だ し た 各 ハ ブ そ れ ぞ れ に 隣 接 し て い る ノ ー ド 同 士 の グ ラ フ を 抽 出 す る . こ れ は 1 , 2 で 構 築 し た グ ラ フ の 部 分 グ ラ フ に あ た る . 図 3 ハ ブ に 基 づ く ク ラ ス タ リ ン グ [Spectral Clustering] 6. こ の 5 で 抽 出 し た 部 分 グ ラ フ を も と に ス ペ ク ト ラ ル ク ラ ス タ リ ン グ ア ル ゴ リ ズ ム を 用 い て ク ラ ス タ を 作 る . 7. 6 で 行 わ れ た グ ラ フ カ ッ ト で 出 来 た 部 分 グ ラ フ を 概 念 マ ッ プ と し , ド キ ュ メ ン ト 間 の 関 連 の 特 徴 づ け を 行 う .
4. 実 験
今 回 の 実 験 に 使 用 し た デ ー タ を 表 に 示 す . 表 1 使 用デー タ ( 論文 数) こ の 実 験 デ ー タ よ り 抽 出 し た タ ー ム の 総 数 は 6971 個 ,タ ー ム の 種 類 は 3037 個,ター ムペア の総 数は 20046 個 , タ ー ム ペ ア の 種 類 は 15283 個とな った .こ の抽出 結 果 か ら ノ ー ド は 3037 個,エッ ジは 15283 個と なるの で グ ラ フ を 構 築 し た . こ の ネ ッ ト ワ ー ク グ ラ フ は zipf’s low に従っ てお り , ス ケ ー ル フ リ ー 性 を 示 し た . 図 4 zipf’s law に基 づく 分布 ハ ブ を 取 り 出 し , 一 つ の ハ ブ か ら 概 念 マ ッ プ を い く つ か 作 る . 図 4 は “ Data mining”のハ ブ ノ ード からの 概 念 マ ッ プ で あ る . 図 4 概 念 マ ッ プ 例0
1
2
3
4
0
0.5
1
1.5
2
lo
g(
頻度)
log(順位)
For
End
For
End
If
End
v
HNS
HNS
true
v
HNS
Linking
If
V
in
v
each
For
v
HNS
HNS
k
to
i
HNS
each
For
ree
N
of
k
Top
v
v
v
G
desend
v
ree
N
V
Sort
For
End
For
End
e
weight
v
ree
N
e
in
v
each
For
E
in
e
edge
each
For
Sets
Node
Hub
HNSs
k
clusters
k
Output
partition
graph
of
number
the
k
sets
term
occurrence
co
E
V
G
graph
a
Input
Clustering
Based
Hub
orithm
A
j i i j i j i i i i k j i j i j}
{
)
,
(
}
{
1
,
}
deg
|
,
,
,
{
'
)
),
(
deg
,
(
)
(
)
(
deg
))
(
(
:
)
(
)
(
)
,
(
:
:
lg
2 1
各 ハ ブ 構 造 ネ ッ ト ワ ー ク 内 の 全 て の ノ ー ド に つ い て そ れ ら の ノ ー ド 間 の リ ン ク を 全 て 抽 出 し , ネ ッ ト ワ ー ク を 構 築 す る こ と で , 概 念 マ ッ プ を 抽 出 す る . そ の ネ ッ ト ワ ー ク 兄 で の 各 2 点 の ノ ー ド の 平 均 距 離 と ク ラ ス タ ー 度 を 調 べ る こ と で , ス モ ー ル ワ ー ル ド 性 を 調 べ た ( 表 2 ). 表 2 ク ラ ス タ ー 係 数 実 験 結 果 の 例 と し”Data mining”の概 念マッ プか らの 部 分 グ ラ フ と そ の 文 献 数 を 表 3 に 示 す . 表 3 ハ ブ ノ ー ド“Data mining”の結 果 共 通 す る ノ ー ド 接 続 ノ ー ド 文 献 件 数
Data maining association rule 4 clustering 4 Data mining association rule 3 mining methods 3 Data mining association rule 2 mining methods 2 Data mining closed itemset 2 minimal generator 2 Data mining clustering 2
singular value decomposition
2 Data mining clustering 2 classification 2 Data mining knowledge discover y 3 text mining 3 Data mining knowledge discover y 2 text mining 2 Data mining knowledge discover y 2 text classification 2
5. 分 析 と 考 察
ハ ブ を 抽 出 し た と き に , 抽 出 し た ハ ブ に 隣 接 し て い る ノ ー ド( サ ブ ノ ー ド )が ,ハ ブ の 場 合 が あ る( 図 5 ). こ の よ う な ノ ー ド は ネ ッ ト ワ ー ク の 中 で 特 に 強 い 概 念 を 持 つ ノ ー ド で は な い か と 考 え ら れ る . 図 5 ハ ブ ノ ー ド の 派 生 ま た ,図 6 の よ う に 2 点 の ハ ブ ノ ー ド に 隣 接 す る ノ ー ド が 複 数 あ る 場 合 , 抽 出 数 を わ ず か に 増 加 す る だ け で ハ ブ ノ ー ド に な る ノ ー ド が あ る 一 方 で , 膨 大 な 数 の 抽 出 数 で も ハ ブ ノ ー ド に 変 化 し な い ノ ー ド が 存 在 す る . こ れ は 重 み の 総 和 が 高 い だ け で な く , そ の 際 の そ れ ら の ノ ー ド が 持 つ リ ン ク の 本 数 に も 影 響 が あ る と 考 え ら れ る . 図 6 ハ ブ ノ ー ド の 派 生6. お わ り に
本 研 究 で は , 大 規 模 な デ ー タ を 扱 う の に 適 し た グ ラ フ 表 現 を 用 い , ド キ ュ メ ン ト 集 合 か ら な る 複 雑 な ネ ッ ト ワ ー ク の 分 類 を 効 果 的 に 行 う ア プ ロ ー チ を と っ た . こ れ に よ り , 概 念 マ ッ プ に 基 づ く ド キ ュ メ ン ト ク ラ ス タ リ ン グ が で き た . 本 論 文 の 特 徴 と し て は , 共 起 タ ー ム を 利 用 し た グ ラ フ か ら の ハ ブ ク ラ ス タ リ ン グ と ス ペ ク ト ラ ル ク ラ ス タ リ ン グ を 行 い , 概 念 マ ッ プ を 抽 出 す る と こ ろ で あ る . 概 念 マ ッ プ 抽 出 に よ り そ の 概 念 マ ッ プ を イ ン デ ッ ク ス と し た 検 索 シ ス テ ム を 可 能 と す る . 共 起 タ ー ム か ら ネ ッ ト ワ ー ク グ ラ フ を 構 築 す る こ と で 言 語 世 界 の ス ケ ー ル フ リ ー 性 に 注 目 す る .そ し て , そ の ス ケ ー ル フ リ ー 性 が も つ ハ ブ と い う 概 念 を 用 い て , ハ ブ に 基 づ く グ ラ フ ク ラ ス タ リ ン グ に よ る サ ブ グ ラ フ の 作 成 す る . ハ ブ ク ラ ス タ リ ン グ す る こ と で , 大 規 模な デ ー タ を 意 味 の あ る ク ラ ス タ に 分 割 し , ク ラ ス タ サ イ ズ を 小 さ く す る こ と で ス ペ ク ト ラ ル ク ラ ス タ リ ン グ を 適 応 で き る よ う に な る . ス ペ ク ト ラ ル ク ラ ス タ リ ン グ は 高 い 質 で ク ラ ス タ リ ン グ を 行 う こ と が で き る ク ラ ス タ リ ン グ 手 法 で あ る . 今 後 , よ り 大 規 模 な ド キ ュ メ ン ト 集 合 に 適 応 で き る 効 果 的 な 高 速 ス ペ ク ト ラ ル ク ラ ス タ リ ン グ ア ル ゴ リ ズ ム ( 乱 択 ア ル ゴ リ ズ ム を 含 む ) の 開 発 を 進 め る [8]. ま た , 実 験 デ ー タ の ド キ ュ メ ン ト か ら の キ ー ワ ー ド 抽 出 を 工 夫 す る こ と で よ り 精 度 の 高 い 結 果 が 得 ら れ る と 考 え ら れ る . そ し て , よ り 高 速 な 処 理 を 可 能 と す る た め に ス ペ ク ト ラ ル ク ラ ス タ リ ン グ の 改 良 が 必 要 と な る .
参 考 文 献
[1]
A. L.Barabasi, R Albert, H.Jeong, and G.Bianconi , “ Power-law distribution of the world wide web.Science” , 287, 2000.
[2] A. L.Barabasi, Reka Albert ,“ Emergence of Scaling in Random network ” , SCIENCE Vol 286 p509 -512, 1999.
[3]
Rohini K. Srihari, Sudarshan Lamkhede, Anmol Bhasin, “Unapparent Information Revelation: A Concept Chain Graph Approach ” , CIKM'05, 2005. [4] Illhoi Yoo, Xiaohua Hu, Il Yeol Song “ IntegratingBiomedical Literature Clustering nd Summriztion Approches using Biomedical Ontology”, ACM, 2006. [5] Illhoi Yoo, Xiaohua Hu, Il Yeol Song,“ Clustering Ontology-enriched Graph Representation for Biomedical Documents based on Scale -Free Network Theory” , 2006 3rd International IEEE conference on volume, p851 -858, 2006.
[6] Brant Chee, Bruce Schatz, “ Document Clustering using Small world community” , JCDL’07, 53-60, 2007.
[7] L. da F. Costa, Hub -Based Community Finding, arXiv:cond-mat/0405022v1, 2004.
[8] Y.Wng, H.Song and W. Wang, “ A Microscopic View on Community Detection in Complex Networks ” , PIKM’08, 57-64, 2008.
[9] Y.Chi, X.Song, D.Zhou, “ K.Hino, and B.Tseng, Evolutionary Spectral Clustering by Incorporating Temporal Smoothness” , KDD’07.
[10] X.Wang and I. Davidson, “ Flexible Constrained Spectral Clustering” , KDD’10, 563-572, 2010.