筑波大学大学院博士課程 システム情報工学研究科修士論文
動的ネットワークの
成長過程と差分の可視化手法
石原 正樹
(コンピュータサイエンス専攻)
指導教員 田中二郎
2007 年 3 月
概要
動的ネットワークの変化を表現するために成長過程と差分を可視化する描画手法を 開発し,その有効性の評価を行なった.これまで,ネットワークの可視化手法は,ネッ トワークが変化しないことを前提としている場合が多かった.しかし,現実のネットワ ークは時々刻々と変化しており,このような動的ネットワークを対象とした成長過程や 差分の可視化手法の開発が課題であった.従来,動的ネットワークの成長過程や差分の 表現の多くは,複数枚の静止画や動画などを用いる.しかし,これら表現手法では,ネ ットワークの変化の認識を見る者自身に委ねてしまう問題がある.
本研究では,動的ネットワークを対象として,その成長過程と差分それぞれの表現方 法に,時間一覧性と単一性の二つの性質を導入した新しい描画手法を開発した.時間一 覧性とは,表示していない情報の記憶を人間に強いないために,ある時点の表示像を切 り出してきても,必要な全期間の情報がその像に表示されていることである.また,単 一性とは,同一対象物に対する複数像間での同一性の判定を人間に強いないために,一 時には単一像だけが表示されることである.
成長過程の表現手法として,「波紋表現」を開発した.これは,時間とともにネット ワークが成長してゆく過程を,エッジの長さに時間を対応付けて描画する可視化手法で ある.また,差分の表現手法として,「差分表現」を開発した.これは,前状態と次状 態の二つのネットワーク図を重ねて提示し,ノードの位置が移動したことによる差分を 矢印アイコン(ベクトル)で表現する可視化手法である.
波紋表現と差分表現により,動的ネットワークの変化そのものを見る者に分かりやす く提示でき,今まで難しかった,1 枚のネットワーク図によるネットワーク構造の時系 列分析が可能となった.その適用例として,Weblog 記事のリンク関係の波紋表現と購 買履歴の差分表現を行なった.その結果,ネットワークに潜む「リンク構造の時間特性」
を表現できるようになった.
目次
第
1
章 序論... 1
1.1
可視化とは... 1
1.2
情報可視化とネットワーク... 1
1.2.1
情報可視化における表現手法... 1
1.2.2
ネットワークを可視化する意義... 2
1.3
動的ネットワークとは... 2
1.3.1
現実のネットワークは変化する... 3
1.3.2
なぜ変化するのか... 3
1.4
動的ネットワークの変化を可視化する有用性... 3
1.4.1
変化が意味するもの... 3
1.4.2
ネットワークの差分と成長過程の概念... 3
1.5
本研究の目的... 5
1.6
本研究の貢献... 5
第
2
章 関連研究... 7
2.1
可視化対象に関連する研究... 7
2.1.1
動的ネットワークを可視化対象とした研究... 7
2.1.2
動的ネットワークの変化を可視化対象とした研究... 7
2.2
可視化手法に関連する研究... 8
2.2.1
木構造の可視化手法... 8
2.2.2
時系列の可視化手法... 8
2.2.3 2
部グラフの可視化手法... 8
2.3 Weblog
に関連する研究... 9
第
3
章 視覚的表現... 10
3.1
視覚的表現への要求... 10
3.1.1
時間一覧性... 11
3.1.2
単一性... 11
3.2
表現すべき要素... 11
3.2.1
ネットワークの差分の可視化において表現すべき要素... 12
3.2.2
ネットワークの成長過程の可視化において表現すべき要素... 13
第
4
章 動的ネットワークの変化の提示手法... 14
4.1
成長過程の可視化手法... 14
4.1.1
波紋表現の概要... 14
4.2
差分の可視化手法... 16
4.2.1
差分表現の概要... 16
第
5
章 波紋表現... 19
5.1
描画スタイル... 19
5.1.1
描画対象... 19
5.1.2
グラフの描画規約... 19
5.1.3
グラフの描画規則... 19
5.2
自動レイアウト... 20
5.2.1
ノード位置の決め方... 20
5.2.2
波紋の決め方... 20
5.2.3
エッジの長さの決め方... 21
5.2.4
エッジの角度の決め方... 21
5.3
実装:RippleTree ... 21
5.3.1
システム構成... 22
5.3.2
機能説明... 23
第
6
章 差分表現... 26
6.1
描画スタイル... 26
6.1.1
描画対象... 26
6.1.2
グラフの描画規約... 26
6.1.3
差の表現法の定式化... 26
6.2
自動レイアウト... 27
6.2.1
マージグラフ... 27
6.2.2
物理モデル... 28
6.2.3
マージグラフの表現... 28
6.3
実装:DiffGraph... 29
6.3.1
システム構成... 30
6.3.2
機能説明... 30
第
7
章 適用例... 36
7.1
波紋表現による話題の広がりの可視化... 36
7.1.1 Weblog
記事とニュース記事のリンク関係の視覚化... 36
7.1.2 Weblog
記事のリンク関係の波紋表現... 38
7.2
差分表現による購買傾向の可視化... 42
7.2.2
購入者の商品に対する趣向変化... 42
7.2.3
商品の購買層の変化... 42
第
8
章 評価... 45
8.1
実験目的... 45
8.2
実験方法... 45
8.2.1
被験者... 45
8.2.2
課題... 46
8.2.3
採点方法... 52
8.3
実験結果... 53
8.3.1
ネットワークの差分を捉える課題における実験結果... 53
8.3.2
ネットワークの成長過程を捉える課題における実験結果... 54
8.4
考察... 55
8.4.1
差分表現の有効性... 55
8.4.2
波紋表現の有効性... 55
第
9
章 議論... 57
9.1
単一性と時間一覧性の重要性... 57
9.2
差分表現と波紋表現の連携による適用事例の将来性... 57
9.3
今後の課題... 58
9.3.1
リアルタイム対応... 58
9.3.2
適用限界の克服... 58
9.3.3
波紋表現の可読性向上... 58
第
10
章 結論... 59
謝辞
... 60
参考文献
... 61
脚注
... 65
図目次
図
1
ネットワークの差分と成長過程の概念... 4
図
2
本研究で対象としている可視化手法(斜線部)... 6
図
3
トポロジ変化とジオメトリ変化... 12
図
4
木構造の時系列階層表現と波紋表現との比較... 15
図
5
差分表現... 17
図
6
波紋表現の座標系... 20
図
7
RippleTree
の概観... 22
図
8
RippleTree
のシステム構成とデータフロー... 23
図
9
被リンク数とノード直径の関係... 24
図
10
スライダ操作によるビューの変化... 25
図
11
DiffGraph
の外観... 29
図
12
DiffGraph
のシステム構成とデータフロー... 30
図
13
Before Graph View... 31
図
14
After Graph View ... 31
図
15
アンカーノードを商品,フリーノードを購入者としたMerged Graph View ... 32
図
16
移動ベクトル(緑色の三角アイコン)... 33
図
17
エッジのハイライト表示... 33
図
18
カテゴリごとのアンカーノード配置... 34
図
19
追加されたノードの判定... 35
図
20
トラックバック記事があるニュース記事の波紋表現... 36
図
21
類似度に基づいたトラックバック記事の配置... 37
図
22
トラックバック記事の角度の割り当て... 38
図
23
Weblog
記事間のリンク関係の波紋表現(7日目)... 40
図
24
Weblog
記事間のリンク関係の波紋表現(14日目)... 40
図
25
Weblog
記事間のリンク関係の波紋表現(21日目)... 41
図
26
2006
年8
月1
日から12
月1
日までのマージグラフ (アンカーノード: 商品,フリーノード:購入者)... 43
図
27
2006
年8
月1
日から12
月1
日までのマージグラフ (アンカーノード: 購入者,フリーノード:商品)... 44
図
28
ネットワークの差分を捉える課題の例... 47
図
29
被験者グループ1に対して提示したネットワーク図の例... 47
図
30
被験者グループ3に対して提示したネットワーク図の例... 48
図
31
ネットワークの成長過程を捉える課題の例... 49
図
32
被験者グループ1に対して提示したネットワーク図の例... 49
図
33
被験者グループ3に対して提示したネットワーク図の例... 50
図
34
ネットワークの差分を捉える課題におけるジオメトリ変化の設問の平均 得点... 53
図
35
ネットワークの差分を捉える課題におけるトポロジ変化の設問の平均得 点... 54
図
36
波紋表現における被リンク数のカウントミスの例と正しいカウントの仕 方... 56
表目次
表
1
提示手法の分類... 10
表
2
被験者グループとネットワーク図の提示手法の対応... 46
表
3
課題の種類と被験者グループごとのネットワーク図の提示方法... 46
表
4
ネットワークの差分を捉える課題の条件設定... 51
表
5
ネットワークの成長過程を捉える課題の条件設定... 52
表
6
トポロジ変化に関する設問の正誤... 54
第 1 章 序論
1.1 可視化とは
普段,我々は物事を図で理解をすることが往々にしてある.これは,人間が直接「見る」
ことのできないデータを,「見る」ことができる表現に変換することで,人間の理解や記憶と いった認知能力を視覚的に支援ができるためである.このように,「見る」ことができる表現 に変換することを可視化(Visualization)と呼ぶ.
コンピュータサイエンスにおける可視化の研究には,科学技術計算の結果をコンピュータ グラフィクス(
CG
)で表現するといった科学的可視化(Scientific Visualization)
と呼ばれる 研究分野がある[1]
.一方で,コンピュータの普及と高性能化により,可視化対象とするデー タは科学技術分野だけに留まらず,Web
構造や友人関係といった抽象的なデータへ広がり,その用途はデータマイニングや情報検索,ビジュアルインタフェースなど多様化している.
これに伴い,「用途に応じて,いかに分かりやすい表現を行なうか」という課題のもと,情報 可視化(Information Visualization)と呼ばれる研究が盛んに行なわれている
[2]
.本研究では,こ の情報可視化を研究対象としている.1.2 情報可視化とネットワーク
筆者はネットワークを可視化対象にした情報可視化手法について研究を行なった.ネット ワークの例として,
WWW
のハイパーリンク構造やソーシャルネットワークなどが代表的で ある.なお,本研究で扱うネットワークとは,「オブジェクト(人や物)とオブジェクトのつ ながりによる構造体」であり,数学的にはグラフでデータ表現することができる.すなわち,オブジェクトがノード(節点・頂点)に対応し,つながりがエッジ(経路・辺・リンク)に 対応している.エッジの性質は,有向と無向に分けられる.ノードやエッジの追加的な情報
(名前,ラベル,カテゴリ,時刻など)は属性として付属している.
1.2.1
情報可視化における表現手法一般に,情報可視化で対象とするデータには,株価や温度といった数値データの他に,プ ログラムコードや文書といったテキストデータ,会社組織やファイルといった階層構造を持 ったデータ,友人関係や
WWW
のハイパーリンク構造といったネットワークなど多様にある.これらデータを可視化する表現手法は大きく分けて以下の5つに分類できる
[3]
.(1)
座標系:
折れ線グラフ,棒グラフなど(2)
行列系:
表など(3)
領域系:
ベン図など(4)
連結系:
ネットワーク図,フローチャートなど(5)
連結系と領域系の複合系:
複合グラフなどこれら表現方法の中で,座標系と行列系は比較的に表現方法が既に確立しているのに対し,
連結系や連結系およびそれらの複合系は,その描画法があまり発達していない
[4]
.さらに,連結系の表現方法で対象としているネットワークのデータは,数値やテキストデータと比較 して, つながり や 関係性 といった一般に目に見えにくい構造情報が重要な意味を持っ ている.したがって,情報可視化の分野においてネットワークを可視化対象とした研究が特 に活発に行なわれている.
1.2.2
ネットワークを可視化する意義ネットワークを可視化する主な意義は,以下の
2
点に集約できる. ネットワークの全体像を俯瞰でき,直感的に要素間のつながりを捉えることが可能と なる.
ネットワークから新たな発見や有用な情報を見つけ出せるようになる.
「百聞は一見にしかず」という諺の通り,人間は言葉による理解よりも,視覚的に理解す る場面が多い.ネットワークデータは,数値や文字データであり,コンピュータに解釈でき ても,人間には要素間のつながりを捉えることが難しい.そこで,ネットワークの要素を点 で表現し,要素間のつながりを線で表現するといった可視化を行なうことで,人間にとって 視覚的に分かりやすい表現形式に変換できる.これにより,人間はネットワークの全体像を 俯瞰でき,そして,認知能力を最大限に発揮できるようになる.
この人間の認知能力を利用してビジュアルデータマイニングや情報検索といった知的活動 が行える.例えば,友人関係のネットワークを可視化することで,ある友人間のつながりが 強いグループ(コミュニティ)やグループ間を仲介する重要な人物を素早く見つけ出せるよ うになる.
1.3 動的ネットワークとは
情報可視化研究において,近年は,「ネットワークは変化する」という前提で動的ネットワ ークの可視化手法も注目され始めている.以下に,変化するネットワークとその変化の理由 について述べる.
1.3.1
現実のネットワークは変化する従来は,可視化対象のネットワークが変化しないことを前提とした,静的ネットワークの 可視化手法について主に研究されてきた.しかし,現実のネットワークは時々刻々と成長お よび変化している.このようなネットワークを「動的ネットワーク」と呼ぶ.動的ネットワー クとは,「時間経過に伴って構造(ノードおよびエッジの増減)や属性(関係性の強さ)が変 化するネットワーク」である.
1.3.2
なぜ変化するのかなぜネットワークが変化するかということについては,ネットワーク科学の分野で研究が 進められているが,「ネットワークはそもそも成長を続ける」という前提に立脚してネットワ ークを分析することが重要とされている.
例えば,
Barabasi
らは,ネットワークに成長過程のモデルを導入したことにより,スケールフリーネットワークと呼ばれる現実の
WWW
の構造に近いネットワークを構成できること を1999
年に発見した[5, 6]
.また,
Watts
によれば,「ネットワークとは動的な対象である.ネットワークのシステムの中で物事が起こるからということだけでなく,ネットワークそのものが,それを構成する要 素の活動や決定に突き動かされて,時とともに展開,変化するからだ.」と説明されている
[7]
.1.4 動的ネットワークの変化を可視化する有用性
動的ネットワークを可視化するには,単純に従来の静的ネットワークの可視化手法を拡張 し,各時点のネットワークを可視化したネットワーク図を用意し,それを時系列に沿って並 べて提示する,もしくはアニメーションのように動画で提示することで実現できる.しかし,
動的ネットワークの可視化で最も重要なのは,「時間の前後関係で何が変化しているか」とい うことを観察者に分かりやすく提示することである.これにより「どういった傾向が読み取 れるか」という新しい知見を視覚的に抽出できるようになる.
1.4.1
変化が意味するもの具体的な動的ネットワークの例として,
Weblog
記事間のリンク関係を考える.リンク構造 の時系列的な変化に注目すると,記事の被リンク数の増加(トポロジ変化)は「注目を集め ている」という解釈ができる.また,逆に被リンク数は多くても,増加が無くなった場合に は,「話題となった記事だが,すでに注目されなくなった記事」といった解釈ができる.この ように,動的ネットワークの時系列的な変化には,その時々のトレンドに関する重要な情報 が含まれていると言われている[8]
.1.4.2
ネットワークの差分と成長過程の概念動的ネットワークの可視化では,静的ネットワークには無かった新たな可視化要素として,
「変化」が加わる.例えば,ネットワークを時間関数と見れば,その時間関数を各時刻にプ
ロットしたものが,その時点の静的ネットワーク図となる.このプロット(ネットワーク図)
をいくつか眺めることで,時間関数の性質(ネットワークの性質)が見えてくる.このよう に,ネットワークを時系列に沿って観察する際には,各時点のネットワークの静止画を時系 列に並べた提示手法と動画による提示手法が考えられる.前者は,いくつかのプロット点を 並べて観察し,後者はプロット点を連続的に繋いで観察を行なう手法に相当する(図
1
).し かし,これら提示手法ではこの時間関数を表現する際に,時間に対する変化量(ネットワーク の差分)は表現できない.さらに,ある時点のネットワーク図を取り出してきても,過去か らその時点までの変化過程(ネットワークの成長過程)は表現されていない.すなわち,ネッ トワークの差分と,その差分の履歴である成長過程を表現することが,ネットワークの変化 を捉える際に有用となる.図 1 ネットワークの差分と成長過程の概念
以上のように,時系列にネットワークを分析する際に,前後関係から観察者が見比べて変 化(差分や成長過程)を発見するという認知的負荷を与えずに,変化そのものも可視化要素 として扱うことを本研究では行なう.
t1 t2 tn
t
ND(t)
: 時刻t
のネットワーク図⊿ND
: ネットワークの差分ND(t
0)+Σ⊿ND
: ネットワークの成長過程 ND(t1)ND(t2) ND(tn)
ネットワークの動き
⊿ND
⊿t ND(t)
静止画を並べて提示する手法 t ND(t)
t
ND(t)
動画で提示する手法
1.5 本研究の目的
本研究では,より現実的な動的ネットワークを対象とし,その時間的な変化を適切な表現 で可視化する手法を開発する.すなわち,動的ネットワークを構成する要素が「いつ,何が,
どのように変化したのか」という観点から,分かりやすい可視手法を開発する.そして,変 化そのものを可視化することで,今まで見えなかった「ネットワークが持つ時間特性や傾向」
という新たな知見を明らかにする.
1.6 本研究の貢献
可視化手法を,その用途と可視化対象の性質で分類すると,図
2
となる.この図において,斜線で示した部分が,本研究が対象とした可視化手法である.これまで,動的ネットワーク を対象とした可視化手法は,情報可視化分野においてあまり研究されてこなかった.本研究 では,この動的ネットワークを可視化対象とし,その変化を捉えやすい可視化手法を開発し た.この可視化手法を用いることで,観察者はネットワークの変化を認知する負荷から解放 できる.
また,動的ネットワークの変化である差分や成長過程を可視化することで,今まで行えな かったネットワーク構造の時間特性を分析することが可能となった.例えば,
CM
や広告前 後の話題性や反響,購買傾向などの変化を,ネットワーク図により視覚的に捉えることが期 待できる.ネットワーク図は,棒グラフや円チャート,折れ線グラフといった表現手法に比 べて,今まであまり利用されてこなかったが,将来的にはマーケティングや費用対効果とい った宣伝効果の評価の際に,本研究で開発したネットワーク図が積極的に利用されるように なると考えられる.図 2 本研究で対象としている可視化手法(斜線部)
情報可視化 (Information Visualization) 科学的可視化
(Scientific Visualization)
動的
ネットワーク可視化手法 数値データ可視化手法
静的
動的ネットワーク 可視化手法
静的ネットワーク 可視化手法
可視化対象の性質
可視化手法の用途
第 2 章 関連研究
本研究が対象としている研究分野において,関連する研究や技術を以下に挙げる.
2.1
節で は,可視化の”
対象”
という観点から,2.2
節では,可視化の 手法 という観点から述べる.そして,
2.3
節は本研究で開発した可視化手法を実際に適用した時に対象としたデータやその 用途に関する研究を述べた.なお,2.1
節で挙げた関連研究は特に,本研究との比較が重要と なるため,要点を述べるに留め,詳しい比較と考察は第3
章にて述べる.2.1 可視化対象に関連する研究
2.1.1
動的ネットワークを可視化対象とした研究動的ネットワークの可視化ツールは,いくつか開発されており,その多くがアニメーショ ンによる提示やユーザの操作に対してインタラクティブに提示するものである.
鈴木らが開発した
Network Viewer [9]
では,シミュレーションによって構築された動的な ネットワークをリアルタイムに描画するための機能を実装している.グラフのレイアウトは 代表的な4
つのレイアウト手法をユーザが選択できるようになっており,アニメーションな どによって変化の過程を提示する.このツールを,ネットワーク構造が変化するモデルと,ネットワーク上で情報が伝播するモデルの可視化に適用している.
また,
Moody
らは,ソーシャルネットワークの変化を,static flip book (
静的なパラパラ漫画
)
とdynamic movie (
動的な動画)
の二つの手法を用いて可視化した.前者の手法は,ソーシャルネットワークの動的関係性を,ノード位置を固定し,エッジを積み重ねて提示する.後 者は,ノード位置を関係性の変化とともに移動させて提示する手法である
[10]
.2.1.2
動的ネットワークの変化を可視化対象とした研究動的ネットワークを対象として,その変化を可視化対象とした研究は非常に少ない.
Erten
らは,異なる一連のグラフを統一的に観察できるようにするために,Aggregate Layout,
Merged Layout, Converging Iterations Layout
の3
つのグラフレイアウトアルゴリズムを提案している.特に,
Aggregate Layout
を利用したAggregate View
では,各グラフのノー ドおよびエッジに別の色を割り当て,複数のグラフを重畳表示することで,複数グラフ間の 違いを特定できるように提示できる.さらに,2
次元平面図だけでなく,各グラフをレイヤ ー毎に描画し,それを3
次元的に自由な視点から見られるようにしている.これにより,各 グラフ間の変化を観察者が認知することを視覚的に支援している[11]
.同様に,中園らは,時系列ごとのネットワーク図をレイヤーごとに管理し,観察者がスラ イダバーを操作することで,インタラクティブに各時点のネットワーク図を差分とともに提
示できる
Nel2
を開発している.差分の提示には,ノードおよびエッジの追加と削除のそれぞ れに別々の色を割り当てることで実現している.Erten
らの提示手法と異なり,変化を観察 者に認知させるのではなく,変化そのものを色で提示するというアプローチを取っているの が特徴である[12]
.豊田らは,
Web
ページのハイパーリンクのリンク関係を対象として,そのリンク構造を時 系 列 に 沿 っ て 発 展 過 程 を 可 視 化 す る シ ス テ ムWebRelievo[13]
を 開 発 し て い る . こ のWebRelievo
により,ウェブ上でのリンク構造の解析を可能とし,注目されているトピックやトレンドを発見することに応用できると述べている.可視化技法の特徴は,差分とクラスタ の二つのビューを用意しており,各時間のグラフを時系列に並べて提示している.観察者は,
これらグラフを見比べることで,変化を捉えることができる.近年は,この手法を用いて,
Web
ページのリンク構造変化の可視化に適用し,話題となっているWeb
ページを視覚的に分 析できるようにした[8]
.2.2 可視化手法に関連する研究
2.2.1
木構造の可視化手法木構造の視覚化に関して,これまで多くのシステム開発や研究が行われてきた.代表的な 木構造表現手法に,
Hyperbolic Tree[14]
がある.これは,双曲空間上に樹形図を配置する手 法である.特徴的なのは,中央に近いノードほど大きく,中央から遠いノードほど小さく表 示される点である.これはユーザの注目している視点に配慮した表現法である.また他にも,木構造の階層に注目し,画面空間の再帰分割で表現した
Tree-Maps[15],
デー タ宝石箱[16]
や,三次元空間で入れ子構造を構築し,半透明表示をする手法,Information
Cube[17]
などがある.これは,木構造の階層かノードがカテゴリを意味しているデータに有効である.つまり,情報をカテゴライズして捉えるのに有効な表現手法である.
Ka-Ping Yee
らは,木構造の各階層を同心円に表現している.特に,ユーザの注目ノードに応じて,アニ メーションで動的にレイアウトを変化させている点が特徴的である[18]
.2.2.2
時系列の可視化手法John V. C.
らは,時間の周期に注目し,時系列をスパイラル上に情報を表現する研究を行っている
[19]
.また,野田らは,時間属性と空間属性の二つを持つ時空間を,年輪の視覚的特 性「年輪メタファ」を利用して表現する手法を開発した[20]
.半径方向に時間軸を,そして 円周方向に空間軸を割り当てることによって時空間を同時に表現できる.データの「一覧性」と「時間軸の進行方向や時間的関連性」の二つの観点を問題視し,これらを解決している.
2.2.3 2部グラフの可視化手法
2
部グラフとは,グラフG
のうち,V(G)
を二つの頂点集合に分割して各集合内の頂点同士 に枝が無いようにできるグラフのことである1.三末は,この2
部グラフの2
種類のノードの 一方に位置の制約を課した描画スタイルであるアンカーマップ(Anchored Map)
を開発した.この描画スタイルにより,アンカーノードとフリーノード間の関係性の強さが位置(アンカ ーノードとフリーノード間の距離)により提示することができる
[21]
.2.3 Weblog に関連する研究
Weblog
を対象とした時系列分析は,マーケティングリサーチ2やトレンドチェック3,
データマイニング
[22],
コミュニティ抽出[23, 24, 25]
,リンク構造解析[26]
,Weblog
とニュースの マッピング[27]
など,Weblog
が比較的浸透してきた近年は,特に注目されている.情報可視 化の分野においても同様の用途[28,29]
で数多く研究されている.特に,ネットワーク構造の時間特性に着目し,時系列に沿った
Weblog
記事のリンク構造 の 可視化 を行なう研究はまだあまりない.内田らは,ネットワークの成長(例えば,コ ミュニティの形成過程や話題の広がり等)の様子を可視化する研究を行なっている[30]
.第 3 章 視覚的表現
動的ネットワークの変化を可視化する際に,どのような視覚的表現を行えば分かりやすい か,要求される表現の性質について考察する.また,動的ネットワークの差分と成長過程の 二つの可視化手法において可視化すべき要素について述べる.
3.1 視覚的表現への要求
人間にとって動的ネットワークの変化を捉えやすい視覚的表現とは,以下の二つの性質を 満たす必要がある.
時間一覧性
単一性
これらについて以下に詳しく述べるが,端的に表現すれば,「
1
枚の図で必要な情報全てが 分かること」である.この時間一覧性と単一性の観点から,特に関連する研究の分類および 比較を行い,目指すべき提示手法について述べる.なお,表1
に提示手法を分類整理した.表 1 提示手法の分類 単一性
不満足 満足
不満足
3
次元画像 動画インタラクティブ提示手法
時間一覧性
満足
各時刻の図を並べた 複数枚の図による提示手法
時間軸を座標系に導入した
1
枚図による提示手法Aggregate View [11]
など
波紋表現,差分表現
WebRelievo [13]など
Static flip book [10]
Nel2 [12]
などNetwork Viewer [9]
dynamic movie [10]
など3.1.1
時間一覧性時間一覧性とは,表示の切り替えや,表示していない情報の記憶を人間に強いないために,
ある時点の像を切り出して来ても,必要な全期間の情報とその情報に付随するタイムスタン プがその像に表示されていることである.
3次元画像による提示手法: 不満足
3
次元の3
つの軸のうち,1
軸に時間軸を割り当てた場合,3
次元空間を透視投影図法で2
次元平面に写像して表現しているため,各時点の表示像が重なって表示されない情報がでて きてしまう.動画やインタラクティブ操作による提示手法: 不満足
自動もしくは,スライダバーなどの
GUI
操作により,時間軸に沿って各時点の表示像を切 り替えて提示することで,変化の過程を動きで知覚することができる.しかし,全期間にわ たって変化を知覚するためには,動画には時間軸が明示されていないので,変化前と変化後 の像の記憶による認知的負荷がかかるだけでなく,動画を見るための時間を要する.時間情報が反映された静止画による提示手法: 満足
時間情報が反映された静止画を提示することで,変化の過程を一覧して提示できる.時間 軸を座標系に導入した静止画と,各時刻の静止画を並べて提示する
2
種類がある.3.1.2
単一性単一性とは,同一対象物に対する複数像間での同一性の判定を人間に強いないために,一 時には単一像だけが表示されることである
[31]
.各時刻の図を並べた複数枚の静止画による提示手法: 不満足
各時刻の静止画を比較することで, 間違い探し のように変化を認知する.しかし,複数 枚の静止画が必要となり,その枚数が増えるに従って,動画と同様に,記憶による認知的負 荷が増大してしまう.
時間軸を座標系に導入した1枚図による提示手法: 満足
時間軸を座標系に導入した
1
枚図による提示手法は,1
枚の静止画で全期間の情報を提示 できるので,変化を認知する負荷から人間を解放することができる.また,動画のように,表現する時間を必要としない.
3.2 表現すべき要素
1
章で触れたように,ネットワークの変化で表現するべき要素として,ネットワークの差 分と成長過程の二つがある.これら,それぞれについて,3.1
節で述べた時間一覧性と単一性を満たした可視化手法が表現すべき要素について以下に述べる.
3.2.1
ネットワークの差分の可視化において表現すべき要素グラフの差を
1
枚の図として表現する際に,表現すべき要素はトポロジに関するものとジ オメトリに関するものに分けられる.トポロジに関する差は,ノードの増減およびエッジの増減である.トポロジの差だけに着 目すれば,要素(ノードおよびエッジ)の増減を表現するだけであるので,容易である.一 方のグラフを基準にすれば,増加した要素,減少した要素,変わらない要素の
3
種類を視覚 的に表現できる.豊田らはこのような色分けを用いてWeb
のグラフとしての変化を表現して いる[13]
.視覚的にグラフを表現した場合には,トポロジカルな観点だけでなく,ジオメトリックな 観点も重要である.ネットワークの視覚的表現には,その目的によっては,トポロジカルな 情報だけでなくジオメトリックな情報の表現をも重視するものも少なくない.つまり,重み の付与されたエッジによって表現されたノード間の関連性の強さを,視覚的に表現するもの も多い.
ジオメトリに関する差は,ノードの移動およびエッジの変形である.トポロジの変化やエ ッジに付与された重みの変化によって,ノードの位置やエッジの形状が変化する可能性があ る.このようなジオメトリックな差は色では表現できないため,トポロジの差の表現のよう に単純ではない.
図 3 トポロジ変化とジオメトリ変化 エッジ追加 ノード追加
ノード削除 エッジ削除
(a)トポロジ変化(構造変化)
(b)ジオメトリ変化(レイアウト変化)
移動
3.2.2
ネットワークの成長過程の可視化において表現すべき要素時間一覧性の「時系列の変化を一覧して表現する」ために,成長過程の可視化には差分の 表現要素であるトポロジとジオメトリ変化の他に,各時点の状態を一連に表現する必要があ る.
差分では,トポロジとジオメトリの変化の前後関係で異なることが分かればよかったので,
色や形状で表現する場合には,
2
種類用意すればよい.しかし,時系列の各状態を弁別でき るようにするには,その各状態数だけ種類が必要となり,表現すべき時系列が長くなればな るほど表現が難しくなる.そこで,連続的な変化が可能かつ,各時点の状態の違いを弁別で きるような,描画要素に時間を対応させる必要がある.第 4 章 動的ネットワークの変化の提示手法
時間一覧性と単一性を満たした動的ネットワークの変化の提示手法として,差分と成長過 程の可視化手法を提案する.なお,本章ではそれぞれの可視化手法の概要と利点などを述べ るにとどめる.詳しい説明は
5
章と6
章にて述べる.4.1 成長過程の可視化手法
ネットワークの構造と時系列の変化を同時に表現するために,グラフレイアウトに時間情 報を反映させるアプローチを取った.具体的に時間情報を反映させる描画要素として,エッ ジ長,ノードの色,ノードの大きさなどがあるが,ここでは,観察者が変化を最も認知しや すいジオメトリ要素(レイアウト要素)の,エッジ長に時間情報を対応付けた.この動的ネ ットワークの成長過程の可視化手法を「波紋表現」と名づけた.
4.1.1
波紋表現の概要新しい情報を中心に配置し,その情報がもつ時刻(履歴)が古くなるのに従って,中心か ら離れて行くという波紋の特徴を利用した表現手法「波紋表現」を提案する.対象とするデ ータ構造は,木と同様であるが,表現の方法が次の二点で違いがある.
最新の情報は,親ノードの近傍に配置される.
子ノード間の関係は,親ノードからのエッジ角度で表現される.
波紋表現のコンセプトは「新しいものは近くに,古いものは遠くに配置する」ことである.
これは,波紋が広がる特徴を利用しており,ゆえに波紋表現と呼ぶ.
系統図に代表されるように,従来の木構造の時系列階層表現は図
1(a)
のように,時系列の 階層がルートからリーフに向かって平行に表現される(ここでは,ノードC-F
間の点線は無 視をする).これに対し波紋表現では,図 4(b)
のように時系列階層が各部分木の親ノードを 中心とした同心円(波紋)で表現される.波紋表現は,対象とする木構造データを時系列の 階層で表現する場合に有効である.この時系列階層を同心円で表現する.(a)時系列階層表 (b)波紋表現 図 4 木構造の時系列階層表現と波紋表現との比較
特徴
波紋表現は,時系列階層表現と比較して階層の順番が異なっている.木構造の時系列階層 表現の場合,ルートからリーフ方向へ向かって古い時刻から新しい時刻へと順番に配列され る.一方,波紋表現では,各部分木の一番古いリーフの時刻から親ノード(中心)に向かっ て新しくなってゆくように配置される.ただし,親ノード位置のみノード生成時刻とする.
すなわち,時系列階層の並びが時系列階層表現と逆になっているのが特徴である.
自然界にも波紋や木の年輪のように,波紋表現と同様の時系列の並びを様々な場所で見る ことができる.基本的に,時間の経過とともに成長する性質を持つものが,こうした時系列 階層の形をとる.年輪の間隔は成長周期の
1
年であるし,波紋の間隔は周波数の逆数に比例 している.両者とも周期は様々であるが,間隔が一定周期でかつ同心円状に広がってゆく点 が共通となっている.波紋表現においても,各波紋の周期はすべて同じである.この表現では,波紋とノードが 同期しており,ノードの生成時刻と波紋の発生時刻が同じである場合,波及してゆくその波 紋上にそのノードが配置される.波紋の中心には,親ノードが配置され,ある一定間隔で同 心円状に波紋が発生する.すなわち,同一波紋上にあるノードは,すべて同じ時刻に発生し たノードを表している.
利点
波紋表現では,各波紋の周期が分かれば,ある時点から最も古い時間までの履歴を視覚的 に把握することが可能となる.さらに,波紋の周期を変化させることで,様々な時間周期で 情報を整理することができ,情報のもつ周期性や出現頻度といったことが分析可能となる.
木は,閉路をもたないグラフである.さらに,ルートを決めた場合,階層をもった有向木 となる.例えば,組織図の場合には,各階層は組織の単位を表し,系統図の場合には,年代 を表す.有向木を時系列階層で表現した場合,最新の情報は常に最下層に配置される.一方,
B
C
D
E
G
2003 2004
2005
2005
2004 2005
A 2003 F
A
B C
F D
G
2004
E 2005
波紋表現の場合は,最新情報は常に親ノードから見て最上層に配置される.すなわち,最新 の情報を知りたいときは波紋の発生点(親ノード)の近傍に注目するだけでよい.
波紋表現では,木の構造上,表現することができなかった,リーフ同士のリンク関係を角 度として表現できる.例えば,図 4
(a)
の点線で示したように,ノードF
とノードC
の間に意 味的な繋がりがあった場合,波紋表現では図 4(b)
に示したように,角度的に近い場所に配置 して,このリンク関係を表現することができる.実世界の情報は,複数の属性を持つことが あり,木のように明確に構造化できる場合が少ない.このように 見えないリンク関係[32]
も視覚化することが重要である.
適用限界
波紋表現は,閉路のないグラフ構造すなわち木のみ表現可能である.また,表現すべき要 素の,ジオメトリックな変化は,そもそも時間的変化をレイアウトに反映させてしまってい るため,表現ができない.したがって,波紋表現で表現できるのは,トポロジ変化(グラフ 要素の増加)とその時間的変化の表現のみである.
4.2 差分の可視化手法
ネットワークの差分を表現するために,二つのグラフを重ねて表示するマージグラフを利 用する.グラフの物理モデルに
Spring-Embedding [33]
を適用し,前後で対応するノード同 士を,仮想的に自然長0のバネで連結する.エッジに埋め込んだスプリングの強さを,関係 性の属性値(関連度など)に対応させると,変化の前後で,ノード位置が変化する.このノ ード位置の変化量を,三角アイコン等で示すことで,差分を可視化する.これを「差分表現」と名づけた.
4.2.1
差分表現の概要差分表現では,二つのグラフを重ねることで,トポロジの変化とジオメトリの変化を表現 できる.具体的に,ある時刻tのグラフ
G
1と,時刻t+1
のグラフG
2をマージすると,図5(c)
のようなマージグラフができる.この時の重ね順は,時刻が古いグラフG
1が上側になり,時 刻が新しいグラフG
2が下側になるようにする.このような重ね順にすることで,G
2とG
1と でトポロジおよびジオメトリの変化がないグラフ要素(ノードとエッジ)は,同じ位置に完 全に重なり合う.なお,このような位置が重なるようにG
2とG
1とで対応するノード同士を,仮想的に自然長
0
のバネで連結する.一方,追加によるトポロジ変化があった
G
2のグラフ要素は,重ならずにマージグラフに現 れる.ここでは,追加要素はノードc,
エッジBc,
エッジDc,
エッジBb,
エッジAb
である.この追加によるトポロジ変化と削除によるトポロジ変化(エッジ
Cb
)によって,G
2にジオ メトリ変化が現れる.この理由は,エッジにバネ埋め込みを行なっているためであり,トポ ロジ変化により,力学的なつり合いが変化するからである.すると,マージグラフでは,ト ポロジ変化の場合と同様に,G
1のグラフ要素と重ならないノードb
が現れる.このノードb
は追加要素ではないが,トポロジ変化の結果として現れるジオメトリ変化のグラフ要素であ る.このグラフ要素は,
G
1とG
2で共通するノードなので,対応関係を示すために,前状態 のG
1に帰属するノードb
から次状態のG
2に帰属するノードb
に向かって,移動を表すベク トル(三角アイコン)を描く.さらに,以上のようなルールを用いてトポロジ変化とジオメトリ変化をマージグラフにて 分かりやすく提示できるように,グラフ
G
1のグラフ要素を青色,グラフG
2のグラフ要素の 色を赤色で色分けを行なう.これにより,どちらのグラフに帰属するグラフ要素なのか色に よって判別が可能となる.図 5 差分表現 利点
エッジのトポロジの変化がそのままジオメトリ変化に反映され,その結果,ノードの移動 ということに帰着できる.また,エッジの長さも関係性の強さを対応させることで,ジオメ トリ変化に反映できる.このように,ジオメトリ変化を統一的に移動ベクトルによって表現 できる利点がある.
また,ノードの追加というトポロジ変化は,マージグラフにおいて色の特異点を見つける だけという作業で,比較的簡単に追加ノードを見つけることが出来る.このような,特徴を 備えた差分表現により,例えば可視化対象のグラフが大規模となった場合に,従来は間違い 探しといった前状態と次状態の図の比較作業では,ジオメトリ変化要素とトポロジ変化要素 の発見が困難であったが,この作業から解放できる.
適用限界
マージグラフでは,トポロジ変化のノードおよびエッジの追加のみ表現可能である.例え ば,ノードの削除は,マージグラフでは上側に重ねる前状態のノードに隠されてしまい,表
(a) 時刻tのグラフG1
マージ
(b) 時刻t+1のグラフG2 (c) グラフG1とG2のマージグラフ
A
B
C
D
E F
A B
C
D
E F
+
エッジ
A
B
C
D
E a F
b
a
c b b
c
a
b
固定ノード自由ノード
現することができない.また,エッジの削除も同様である.したがって,トポロジ変化のう ち,グラフ要素の増加だけ表現可能である.
また,ジオメトリ変化は,前状態のグラフ要素の位置から変化であり,少なくとも前状態 のグラフ要素に
1
つ以上の位置的基準点が必要となる.すなわち,ノードのうち少なくとも1
つは位置を固定し,その座標を基準とした次状態における位置の変化を求める必要がある.第 5 章 波紋表現
グラフの「成長過程」を
1
枚の静的な図として表現する表現スタイル「波紋表現」を考案 した.その具体的な描画手法について,5.2
節にて数学的な定式化を述べ,5.3
節にて実装し たシステムについて述べる.まず,定式化を行なう準備として,5.1
節にて波紋表現の描画対 象や座標系,グラフの描画ルールといった描画スタイルを定義する.5.1 描画スタイル
5.1.1
描画対象描画対象は,時間情報をもった根付き木である.この根付き木はG=(V,E)で与えられ,エ ッジの集合E⊂V×V とノードの集合Vで構成されている.また,子ノードにリーフノードし か持たないノードを根とする部分木をGsubと表記する.さらに,根付き木の各ノードv∈V は 属性として生成時刻とカテゴリの二つの属性を保持している.したがって,Vは時系列デー タとなっている.また,vの生成時刻をd(v)と表記する.
5.1.2
グラフの描画規約ノードの配置規約
Gsubの波紋表現の配置規約は,同心円配置である.従って,Gsubの入れ子構造であるGの 波紋表現の配置規約は,再帰的同心円配置となる.
エッジの配線規約
配線規約を,エッジの線種と配置規約の座標系との関係で説明する.まず,波紋表現のエ ッジの線種は,直線配線である.また,この配線は波紋表現の座標系と独立している.
5.1.3
グラフの描画規則波紋表現の描画規則について,意味的規則と構造的規則に分けて述べる.まず,ノードの 持つ属性による配置規約(意味的規則)として, 時間属性が新しいノードの集合を中央付近 に配置 が挙げられる.また,Gが持つグラフ理論的な概念や特徴に関係した配置規則(構 造的規則)に関しては,特に制約を設けていない.
5.2 自動レイアウト
5.2.1
ノード位置の決め方
図 6 波紋表現の座標系
ノードの位置は,図
6
で示したように極座標で表現する.すなわち,Gの描画の際には,エッジの長さと角度をパラメータとして各ノードの位置を決定する.例えば,vの位置p(v)は,
エッジの長さをlv(t),角度を
θ
とすると,(lv(t),θ
)と表せる.すなわちルートの位置を決め ると相対的に全てのノードの位置が定まる.5.2.2
波紋の決め方波紋の描画は,Gsubの親ノードの位置を中心として,ある一定時間ごとに波紋を生成して いる.そして,ノードと波紋の描画位置が互いに一致している.すなわち,Gsubの親ノード 以外のノードの中で最も古い時刻のノード(一番外側のノード)をvとすれば,その時刻
)
0 d(v
t = から波紋が発生する.また,子ノード位置と一致している波紋以外に,一定の時間 間隔ごとに波紋が発生している.このように波紋は,ノードの時刻と経過時間のスケールを 視覚的に理解できる役目がある.
Gsubの親ノードを中心とする波紋の集合を{c1,c2,L,cn}とする.時刻tにおける時刻t0に発 生した波紋(最も外側の波紋)c1の半径r1(t)は
(9)
式で計算される.ただし,波紋の周波数をf ,波長を
λ
とする.( ) (
0)
1 t f t t
r =
λ
⋅ × −(1)
このとき,描画される波紋の個数nは
(10)
式を満たさねばならない.
=
λ
)1(t
n r