動的ネットワークの成長過程と差分の可視化手法

(1)

筑波大学大学院博士課程システム情報工学研究科修士論文

動的ネットワークの

成長過程と差分の可視化手法

石原正樹

（コンピュータサイエンス専攻）

指導教員田中二郎

2007 年 3 月

(2)

概要

動的ネットワークの変化を表現するために成長過程と差分を可視化する描画手法を開発し，その有効性の評価を行なった．これまで，ネットワークの可視化手法は，ネットワークが変化しないことを前提としている場合が多かった．しかし，現実のネットワークは時々刻々と変化しており，このような動的ネットワークを対象とした成長過程や差分の可視化手法の開発が課題であった．従来，動的ネットワークの成長過程や差分の表現の多くは，複数枚の静止画や動画などを用いる．しかし，これら表現手法では，ネットワークの変化の認識を見る者自身に委ねてしまう問題がある．

本研究では，動的ネットワークを対象として，その成長過程と差分それぞれの表現方法に，時間一覧性と単一性の二つの性質を導入した新しい描画手法を開発した．時間一覧性とは，表示していない情報の記憶を人間に強いないために，ある時点の表示像を切り出してきても，必要な全期間の情報がその像に表示されていることである．また，単一性とは，同一対象物に対する複数像間での同一性の判定を人間に強いないために，一時には単一像だけが表示されることである．

成長過程の表現手法として，「波紋表現」を開発した．これは，時間とともにネットワークが成長してゆく過程を，エッジの長さに時間を対応付けて描画する可視化手法である．また，差分の表現手法として，「差分表現」を開発した．これは，前状態と次状態の二つのネットワーク図を重ねて提示し，ノードの位置が移動したことによる差分を矢印アイコン（ベクトル）で表現する可視化手法である．

波紋表現と差分表現により，動的ネットワークの変化そのものを見る者に分かりやすく提示でき，今まで難しかった，1 枚のネットワーク図によるネットワーク構造の時系列分析が可能となった．その適用例として，Weblog 記事のリンク関係の波紋表現と購買履歴の差分表現を行なった．その結果，ネットワークに潜む「リンク構造の時間特性」

を表現できるようになった．

(3)

1

章序論

... 1

1.1

可視化とは

... 1

1.2

情報可視化とネットワーク

... 1

1.2.1

情報可視化における表現手法

... 1

1.2.2

ネットワークを可視化する意義

... 2

1.3

動的ネットワークとは

... 2

1.3.1

現実のネットワークは変化する

... 3

1.3.2

なぜ変化するのか

... 3

1.4

動的ネットワークの変化を可視化する有用性

... 3

1.4.1

変化が意味するもの

... 3

1.4.2

ネットワークの差分と成長過程の概念

... 3

1.5

本研究の目的

... 5

1.6

本研究の貢献

... 5

第

2

章関連研究

... 7

2.1

可視化対象に関連する研究

... 7

2.1.1

動的ネットワークを可視化対象とした研究

... 7

2.1.2

動的ネットワークの変化を可視化対象とした研究

... 7

2.2

可視化手法に関連する研究

... 8

2.2.1

木構造の可視化手法

... 8

2.2.2

時系列の可視化手法

... 8

2.2.3 2

部グラフの可視化手法

... 8

2.3 Weblog

に関連する研究

... 9

第

3

章視覚的表現

... 10

3.1

視覚的表現への要求

... 10

3.1.1

時間一覧性

... 11

3.1.2

単一性

... 11

3.2

表現すべき要素

... 11

3.2.1

ネットワークの差分の可視化において表現すべき要素

... 12

3.2.2

ネットワークの成長過程の可視化において表現すべき要素

... 13

第

4

章動的ネットワークの変化の提示手法

... 14

4.1

成長過程の可視化手法

... 14

4.1.1

波紋表現の概要

... 14

(4)

4.2

差分の可視化手法

... 16

4.2.1

差分表現の概要

... 16

第

5

章波紋表現

... 19

5.1

描画スタイル

... 19

5.1.1

描画対象

... 19

5.1.2

グラフの描画規約

... 19

5.1.3

グラフの描画規則

... 19

5.2

自動レイアウト

... 20

5.2.1

ノード位置の決め方

... 20

5.2.2

波紋の決め方

... 20

5.2.3

エッジの長さの決め方

... 21

5.2.4

エッジの角度の決め方

... 21

5.3

実装：

RippleTree ... 21

5.3.1

システム構成

... 22

5.3.2

機能説明

... 23

第

6

章差分表現

... 26

6.1

描画スタイル

... 26

6.1.1

描画対象

... 26

6.1.2 ... 26

6.1.3

差の表現法の定式化

... 26

6.2

自動レイアウト

... 27

6.2.1

マージグラフ

... 27

6.2.2

物理モデル

... 28

6.2.3

マージグラフの表現

... 28

6.3

実装：

DiffGraph... 29

6.3.1

システム構成

... 30

6.3.2

機能説明

... 30

第

7

章適用例

... 36

7.1

波紋表現による話題の広がりの可視化

... 36

7.1.1 Weblog

記事とニュース記事のリンク関係の視覚化

... 36

7.1.2 Weblog

記事のリンク関係の波紋表現

... 38

7.2

差分表現による購買傾向の可視化

... 42

7.2.2

購入者の商品に対する趣向変化

... 42

7.2.3

商品の購買層の変化

... 42

第

8

章評価

... 45

8.1

実験目的

... 45

(5)

8.2

実験方法

... 45

8.2.1

被験者

... 45

8.2.2

課題

... 46

8.2.3

採点方法

... 52

8.3

実験結果

... 53

8.3.1

ネットワークの差分を捉える課題における実験結果

... 53

8.3.2

ネットワークの成長過程を捉える課題における実験結果

... 54

8.4

考察

... 55

8.4.1

差分表現の有効性

... 55

8.4.2

波紋表現の有効性

... 55

第

9

章議論

... 57

9.1

単一性と時間一覧性の重要性

... 57

9.2

差分表現と波紋表現の連携による適用事例の将来性

... 57

9.3

今後の課題

... 58

9.3.1

リアルタイム対応

... 58

9.3.2

適用限界の克服

... 58

9.3.3

波紋表現の可読性向上

... 58

第

10

章結論

... 59

謝辞

... 60

参考文献

... 61

脚注

... 65

(6)

図目次

図

1 ... 4

図

2

本研究で対象としている可視化手法（斜線部）

... 6

図

3

トポロジ変化とジオメトリ変化

... 12

図

4

木構造の時系列階層表現と波紋表現との比較

... 15

図

5

差分表現

... 17

図

6

波紋表現の座標系

... 20

図

7 RippleTree

の概観

... 22

図

8 RippleTree

のシステム構成とデータフロー

... 23

図

9

被リンク数とノード直径の関係

... 24

図

10

スライダ操作によるビューの変化

... 25

図

11 DiffGraph

の外観

... 29

図

12 DiffGraph

のシステム構成とデータフロー

... 30

図

13 Before Graph View... 31

図

14 After Graph View ... 31

図

15

アンカーノードを商品，フリーノードを購入者とした

Merged Graph View ... 32

図

16

移動ベクトル（緑色の三角アイコン）

... 33

図

17

エッジのハイライト表示

... 33

図

18

カテゴリごとのアンカーノード配置

... 34

図

19

追加されたノードの判定

... 35

図

20

トラックバック記事があるニュース記事の波紋表現

... 36

図

21

類似度に基づいたトラックバック記事の配置

... 37

図

22

トラックバック記事の角度の割り当て

... 38

図

23 Weblog

記事間のリンク関係の波紋表現（７日目）

... 40

図

24 Weblog

記事間のリンク関係の波紋表現（１４日目）

... 40

図

25 Weblog

記事間のリンク関係の波紋表現（２１日目）

... 41

図

26 2006

年

8

月

1

日から

12

月

1

日までのマージグラフ（アンカーノード：商品，フリーノード：購入者）

... 43

図

27 2006

年

8

月

1

日から

12

月

1

日までのマージグラフ（アンカーノード：購入者，フリーノード：商品）

... 44

図

28

ネットワークの差分を捉える課題の例

... 47

図

29

被験者グループ１に対して提示したネットワーク図の例

... 47

(7)

図

30

被験者グループ３に対して提示したネットワーク図の例

... 48

図

31

ネットワークの成長過程を捉える課題の例

... 49

図

32

被験者グループ１に対して提示したネットワーク図の例

... 49

図

33

被験者グループ３に対して提示したネットワーク図の例

... 50

図

34

ネットワークの差分を捉える課題におけるジオメトリ変化の設問の平均得点

... 53

図

35

ネットワークの差分を捉える課題におけるトポロジ変化の設問の平均得点

... 54

図

36

波紋表現における被リンク数のカウントミスの例と正しいカウントの仕方

... 56

(8)

表目次

表

1

提示手法の分類

... 10

表

2

被験者グループとネットワーク図の提示手法の対応

... 46

表

3

課題の種類と被験者グループごとのネットワーク図の提示方法

... 46

表

4

ネットワークの差分を捉える課題の条件設定

... 51

表

5

ネットワークの成長過程を捉える課題の条件設定

... 52

表

6

トポロジ変化に関する設問の正誤

... 54

(9)

第 1 章序論

1.1 ^{可視化とは}

普段，我々は物事を図で理解をすることが往々にしてある．これは，人間が直接「見る」

ことのできないデータを，「見る」ことができる表現に変換することで，人間の理解や記憶といった認知能力を視覚的に支援ができるためである．このように，「見る」ことができる表現に変換することを可視化(Visualization)と呼ぶ．

コンピュータサイエンスにおける可視化の研究には，科学技術計算の結果をコンピュータグラフィクス（

CG

）で表現するといった科学的可視化

(Scientific Visualization)

と呼ばれる研究分野がある

[1]

．一方で，コンピュータの普及と高性能化により，可視化対象とするデータは科学技術分野だけに留まらず，

Web

構造や友人関係といった抽象的なデータへ広がり，

その用途はデータマイニングや情報検索，ビジュアルインタフェースなど多様化している．

これに伴い，「用途に応じて，いかに分かりやすい表現を行なうか」という課題のもと，情報可視化（Information Visualization）と呼ばれる研究が盛んに行なわれている

[2]

．本研究では，この情報可視化を研究対象としている．

1.2 情報可視化とネットワーク

筆者はネットワークを可視化対象にした情報可視化手法について研究を行なった．ネットワークの例として，

WWW

のハイパーリンク構造やソーシャルネットワークなどが代表的である．なお，本研究で扱うネットワークとは，「オブジェクト（人や物）とオブジェクトのつながりによる構造体」であり，数学的にはグラフでデータ表現することができる．すなわち，

オブジェクトがノード（節点・頂点）に対応し，つながりがエッジ（経路・辺・リンク）に対応している．エッジの性質は，有向と無向に分けられる．ノードやエッジの追加的な情報

（名前，ラベル，カテゴリ，時刻など）は属性として付属している．

1.2.1

情報可視化における表現手法

一般に，情報可視化で対象とするデータには，株価や温度といった数値データの他に，プログラムコードや文書といったテキストデータ，会社組織やファイルといった階層構造を持ったデータ，友人関係や

WWW

のハイパーリンク構造といったネットワークなど多様にある．

これらデータを可視化する表現手法は大きく分けて以下の５つに分類できる

[3]

．

(10)

(1)

座標系

:

折れ線グラフ，棒グラフなど

(2)

行列系

:

表など

(3)

領域系

:

ベン図など

(4)

連結系

:

ネットワーク図，フローチャートなど

(5)

連結系と領域系の複合系

:

複合グラフなど

これら表現方法の中で，座標系と行列系は比較的に表現方法が既に確立しているのに対し，

連結系や連結系およびそれらの複合系は，その描画法があまり発達していない

[4]

．さらに，

連結系の表現方法で対象としているネットワークのデータは，数値やテキストデータと比較して，つながりや関係性といった一般に目に見えにくい構造情報が重要な意味を持っている．したがって，情報可視化の分野においてネットワークを可視化対象とした研究が特に活発に行なわれている．

1.2.2

ネットワークを可視化する意義

ネットワークを可視化する主な意義は，以下の

2

点に集約できる．

ネットワークの全体像を俯瞰でき，直感的に要素間のつながりを捉えることが可能となる．

ネットワークから新たな発見や有用な情報を見つけ出せるようになる．

「百聞は一見にしかず」という諺の通り，人間は言葉による理解よりも，視覚的に理解する場面が多い．ネットワークデータは，数値や文字データであり，コンピュータに解釈できても，人間には要素間のつながりを捉えることが難しい．そこで，ネットワークの要素を点で表現し，要素間のつながりを線で表現するといった可視化を行なうことで，人間にとって視覚的に分かりやすい表現形式に変換できる．これにより，人間はネットワークの全体像を俯瞰でき，そして，認知能力を最大限に発揮できるようになる．

この人間の認知能力を利用してビジュアルデータマイニングや情報検索といった知的活動が行える．例えば，友人関係のネットワークを可視化することで，ある友人間のつながりが強いグループ（コミュニティ）やグループ間を仲介する重要な人物を素早く見つけ出せるようになる．

1.3 ^{動的ネットワークとは}

情報可視化研究において，近年は，「ネットワークは変化する」という前提で動的ネットワークの可視化手法も注目され始めている．以下に，変化するネットワークとその変化の理由について述べる．

(11)

1.3.1

現実のネットワークは変化する

従来は，可視化対象のネットワークが変化しないことを前提とした，静的ネットワークの可視化手法について主に研究されてきた．しかし，現実のネットワークは時々刻々と成長および変化している．このようなネットワークを「動的ネットワーク」と呼ぶ．動的ネットワークとは，「時間経過に伴って構造（ノードおよびエッジの増減）や属性（関係性の強さ）が変化するネットワーク」である．

1.3.2

なぜ変化するのか

なぜネットワークが変化するかということについては，ネットワーク科学の分野で研究が進められているが，「ネットワークはそもそも成長を続ける」という前提に立脚してネットワークを分析することが重要とされている．

例えば，

Barabasi

らは，ネットワークに成長過程のモデルを導入したことにより，スケー

ルフリーネットワークと呼ばれる現実の

WWW

の構造に近いネットワークを構成できることを

1999

年に発見した

[5, 6]

．

また，

Watts

によれば，「ネットワークとは動的な対象である．ネットワークのシステムの

中で物事が起こるからということだけでなく，ネットワークそのものが，それを構成する要素の活動や決定に突き動かされて，時とともに展開，変化するからだ．」と説明されている

[7]

．

1.4 動的ネットワークの変化を可視化する有用性

動的ネットワークを可視化するには，単純に従来の静的ネットワークの可視化手法を拡張し，各時点のネットワークを可視化したネットワーク図を用意し，それを時系列に沿って並べて提示する，もしくはアニメーションのように動画で提示することで実現できる．しかし，

動的ネットワークの可視化で最も重要なのは，「時間の前後関係で何が変化しているか」ということを観察者に分かりやすく提示することである．これにより「どういった傾向が読み取れるか」という新しい知見を視覚的に抽出できるようになる．

1.4.1

変化が意味するもの

具体的な動的ネットワークの例として，

Weblog

記事間のリンク関係を考える．リンク構造の時系列的な変化に注目すると，記事の被リンク数の増加（トポロジ変化）は「注目を集めている」という解釈ができる．また，逆に被リンク数は多くても，増加が無くなった場合には，「話題となった記事だが，すでに注目されなくなった記事」といった解釈ができる．このように，動的ネットワークの時系列的な変化には，その時々のトレンドに関する重要な情報が含まれていると言われている

[8]

．

1.4.2

動的ネットワークの可視化では，静的ネットワークには無かった新たな可視化要素として，

「変化」が加わる．例えば，ネットワークを時間関数と見れば，その時間関数を各時刻にプ

(12)

ロットしたものが，その時点の静的ネットワーク図となる．このプロット（ネットワーク図）

をいくつか眺めることで，時間関数の性質（ネットワークの性質）が見えてくる．このように，ネットワークを時系列に沿って観察する際には，各時点のネットワークの静止画を時系列に並べた提示手法と動画による提示手法が考えられる．前者は，いくつかのプロット点を並べて観察し，後者はプロット点を連続的に繋いで観察を行なう手法に相当する（図

1

）．しかし，これら提示手法ではこの時間関数を表現する際に，時間に対する変化量（ネットワークの差分）は表現できない．さらに，ある時点のネットワーク図を取り出してきても，過去からその時点までの変化過程（ネットワークの成長過程）は表現されていない．すなわち，ネットワークの差分と，その差分の履歴である成長過程を表現することが，ネットワークの変化を捉える際に有用となる．

図 1 ネットワークの差分と成長過程の概念

以上のように，時系列にネットワークを分析する際に，前後関係から観察者が見比べて変化（差分や成長過程）を発見するという認知的負荷を与えずに，変化そのものも可視化要素として扱うことを本研究では行なう．

t1 t2 tn

t

ND(t)

: 時刻

t

のネットワーク図

⊿ND

: ネットワークの差分

ND(t

₀

)+Σ⊿ND

: ネットワークの成長過程 ND(t1)

ND(t2) ND(tn)

ネットワークの動き

⊿ND

⊿t ND(t)

静止画を並べて提示する手法 t ND(t)

t

ND(t)

動画で提示する手法

(13)

1.5 ^{本研究の目的}

本研究では，より現実的な動的ネットワークを対象とし，その時間的な変化を適切な表現で可視化する手法を開発する．すなわち，動的ネットワークを構成する要素が「いつ，何が，

どのように変化したのか」という観点から，分かりやすい可視手法を開発する．そして，変化そのものを可視化することで，今まで見えなかった「ネットワークが持つ時間特性や傾向」

という新たな知見を明らかにする．

1.6 ^{本研究の貢献}

可視化手法を，その用途と可視化対象の性質で分類すると，図

2

となる．この図において，

斜線で示した部分が，本研究が対象とした可視化手法である．これまで，動的ネットワークを対象とした可視化手法は，情報可視化分野においてあまり研究されてこなかった．本研究では，この動的ネットワークを可視化対象とし，その変化を捉えやすい可視化手法を開発した．この可視化手法を用いることで，観察者はネットワークの変化を認知する負荷から解放できる．

また，動的ネットワークの変化である差分や成長過程を可視化することで，今まで行えなかったネットワーク構造の時間特性を分析することが可能となった．例えば，

CM

や広告前後の話題性や反響，購買傾向などの変化を，ネットワーク図により視覚的に捉えることが期待できる．ネットワーク図は，棒グラフや円チャート，折れ線グラフといった表現手法に比べて，今まであまり利用されてこなかったが，将来的にはマーケティングや費用対効果といった宣伝効果の評価の際に，本研究で開発したネットワーク図が積極的に利用されるようになると考えられる．

(14)

図 2 本研究で対象としている可視化手法（斜線部）

情報可視化 (Information Visualization) 科学的可視化

(Scientific Visualization)

動的

ネットワーク可視化手法数値データ可視化手法

静的

動的ネットワーク可視化手法

静的ネットワーク可視化手法

可視化対象の性質

可視化手法の用途

(15)

第 2 章関連研究

本研究が対象としている研究分野において，関連する研究や技術を以下に挙げる．

2.1

節では，可視化の

”

対象

”

という観点から，

2.2

節では，可視化の手法という観点から述べる．

そして，

2.3

節は本研究で開発した可視化手法を実際に適用した時に対象としたデータやその用途に関する研究を述べた．なお，

2.1

節で挙げた関連研究は特に，本研究との比較が重要となるため，要点を述べるに留め，詳しい比較と考察は第

3

章にて述べる．

2.1 可視化対象に関連する研究

2.1.1

動的ネットワークを可視化対象とした研究

動的ネットワークの可視化ツールは，いくつか開発されており，その多くがアニメーションによる提示やユーザの操作に対してインタラクティブに提示するものである．

鈴木らが開発した

Network Viewer [9]

では，シミュレーションによって構築された動的なネットワークをリアルタイムに描画するための機能を実装している．グラフのレイアウトは代表的な

4

つのレイアウト手法をユーザが選択できるようになっており，アニメーションなどによって変化の過程を提示する．このツールを，ネットワーク構造が変化するモデルと，

ネットワーク上で情報が伝播するモデルの可視化に適用している．

また，

Moody

らは，ソーシャルネットワークの変化を，

static flip book (

静的なパラパラ漫

画

)

と

dynamic movie (

動的な動画

)

の二つの手法を用いて可視化した．前者の手法は，ソーシ

ャルネットワークの動的関係性を，ノード位置を固定し，エッジを積み重ねて提示する．後者は，ノード位置を関係性の変化とともに移動させて提示する手法である

[10]

．

2.1.2

動的ネットワークの変化を可視化対象とした研究

動的ネットワークを対象として，その変化を可視化対象とした研究は非常に少ない．

Erten

らは，異なる一連のグラフを統一的に観察できるようにするために，

Aggregate Layout,

Merged Layout, Converging Iterations Layout

の

3

つのグラフレイアウトアルゴリズムを

提案している．特に，

Aggregate Layout

を利用した

Aggregate View

では，各グラフのノードおよびエッジに別の色を割り当て，複数のグラフを重畳表示することで，複数グラフ間の違いを特定できるように提示できる．さらに，

2

次元平面図だけでなく，各グラフをレイヤー毎に描画し，それを

3

次元的に自由な視点から見られるようにしている．これにより，各グラフ間の変化を観察者が認知することを視覚的に支援している

[11]

．

同様に，中園らは，時系列ごとのネットワーク図をレイヤーごとに管理し，観察者がスライダバーを操作することで，インタラクティブに各時点のネットワーク図を差分とともに提

(16)

示できる

Nel2

を開発している．差分の提示には，ノードおよびエッジの追加と削除のそれぞれに別々の色を割り当てることで実現している．

Erten

らの提示手法と異なり，変化を観察者に認知させるのではなく，変化そのものを色で提示するというアプローチを取っているのが特徴である

[12]

．

豊田らは，

Web

ページのハイパーリンクのリンク関係を対象として，そのリンク構造を時系列に沿って発展過程を可視化するシステム

WebRelievo[13]

を開発している．この

WebRelievo

により，ウェブ上でのリンク構造の解析を可能とし，注目されているトピックや

トレンドを発見することに応用できると述べている．可視化技法の特徴は，差分とクラスタの二つのビューを用意しており，各時間のグラフを時系列に並べて提示している．観察者は，

これらグラフを見比べることで，変化を捉えることができる．近年は，この手法を用いて，

Web

ページのリンク構造変化の可視化に適用し，話題となっている

Web

ページを視覚的に分析できるようにした

[8]

．

2.2 可視化手法に関連する研究

2.2.1

木構造の可視化手法

木構造の視覚化に関して，これまで多くのシステム開発や研究が行われてきた．代表的な木構造表現手法に，

Hyperbolic Tree[14]

がある．これは，双曲空間上に樹形図を配置する手法である．特徴的なのは，中央に近いノードほど大きく，中央から遠いノードほど小さく表示される点である．これはユーザの注目している視点に配慮した表現法である．

また他にも，木構造の階層に注目し，画面空間の再帰分割で表現した

Tree-Maps[15],

データ宝石箱

[16]

や，三次元空間で入れ子構造を構築し，半透明表示をする手法，

Information

Cube[17]

などがある．これは，木構造の階層かノードがカテゴリを意味しているデータに有

効である．つまり，情報をカテゴライズして捉えるのに有効な表現手法である．

Ka-Ping Yee

らは，木構造の各階層を同心円に表現している．特に，ユーザの注目ノードに応じて，アニメーションで動的にレイアウトを変化させている点が特徴的である

[18]

．

2.2.2

時系列の可視化手法

John V. C.

らは，時間の周期に注目し，時系列をスパイラル上に情報を表現する研究を行っ

ている

[19]

．また，野田らは，時間属性と空間属性の二つを持つ時空間を，年輪の視覚的特性「年輪メタファ」を利用して表現する手法を開発した

[20]

．半径方向に時間軸を，そして円周方向に空間軸を割り当てることによって時空間を同時に表現できる．データの「一覧性」

と「時間軸の進行方向や時間的関連性」の二つの観点を問題視し，これらを解決している．

2.2.3 2部グラフの可視化手法

2

部グラフとは，グラフ

G

のうち，

V(G)

を二つの頂点集合に分割して各集合内の頂点同士に枝が無いようにできるグラフのことである¹．三末は，この

2

部グラフの

2

種類のノードの一方に位置の制約を課した描画スタイルであるアンカーマップ

(Anchored Map)

を開発した．

(17)

この描画スタイルにより，アンカーノードとフリーノード間の関係性の強さが位置（アンカーノードとフリーノード間の距離）により提示することができる

[21]

．

2.3 Weblog に関連する研究

Weblog

を対象とした時系列分析は，マーケティングリサーチ²やトレンドチェック³

,

データ

マイニング

[22],

コミュニティ抽出

[23, 24, 25]

，リンク構造解析

[26]

，

Weblog

とニュースのマッピング

[27]

など，

Weblog

が比較的浸透してきた近年は，特に注目されている．情報可視化の分野においても同様の用途

[28,29]

で数多く研究されている．

特に，ネットワーク構造の時間特性に着目し，時系列に沿った

Weblog

記事のリンク構造の可視化を行なう研究はまだあまりない．内田らは，ネットワークの成長（例えば，コミュニティの形成過程や話題の広がり等）の様子を可視化する研究を行なっている

[30]

．

(18)

第 3 章視覚的表現

動的ネットワークの変化を可視化する際に，どのような視覚的表現を行えば分かりやすいか，要求される表現の性質について考察する．また，動的ネットワークの差分と成長過程の二つの可視化手法において可視化すべき要素について述べる．

3.1 ^{視覚的表現への要求}

人間にとって動的ネットワークの変化を捉えやすい視覚的表現とは，以下の二つの性質を満たす必要がある．

時間一覧性

単一性

これらについて以下に詳しく述べるが，端的に表現すれば，「

1

枚の図で必要な情報全てが分かること」である．この時間一覧性と単一性の観点から，特に関連する研究の分類および比較を行い，目指すべき提示手法について述べる．なお，表

1

に提示手法を分類整理した．

表 1 提示手法の分類単一性

不満足満足

不満足

3

次元画像動画

インタラクティブ提示手法

時間一覧性

満足

各時刻の図を並べた複数枚の図による提示手法

時間軸を座標系に導入した

1

枚図による提示手法

Aggregate View [11]

など

波紋表現，差分表現

WebRelievo [13]など

Static flip book [10]

Nel2 [12]

など

Network Viewer [9]

dynamic movie [10]

など

(19)

3.1.1

時間一覧性

時間一覧性とは，表示の切り替えや，表示していない情報の記憶を人間に強いないために，

ある時点の像を切り出して来ても，必要な全期間の情報とその情報に付随するタイムスタンプがその像に表示されていることである．

3次元画像による提示手法：不満足

3

次元の

3

つの軸のうち，

1

軸に時間軸を割り当てた場合，

3

次元空間を透視投影図法で

2

次元平面に写像して表現しているため，各時点の表示像が重なって表示されない情報がでてきてしまう．

動画やインタラクティブ操作による提示手法：不満足

自動もしくは，スライダバーなどの

GUI

操作により，時間軸に沿って各時点の表示像を切り替えて提示することで，変化の過程を動きで知覚することができる．しかし，全期間にわたって変化を知覚するためには，動画には時間軸が明示されていないので，変化前と変化後の像の記憶による認知的負荷がかかるだけでなく，動画を見るための時間を要する．

時間情報が反映された静止画による提示手法：満足

時間情報が反映された静止画を提示することで，変化の過程を一覧して提示できる．時間軸を座標系に導入した静止画と，各時刻の静止画を並べて提示する

2

種類がある．

3.1.2

単一性

単一性とは，同一対象物に対する複数像間での同一性の判定を人間に強いないために，一時には単一像だけが表示されることである

[31]

．

各時刻の図を並べた複数枚の静止画による提示手法：不満足

各時刻の静止画を比較することで，間違い探しのように変化を認知する．しかし，複数枚の静止画が必要となり，その枚数が増えるに従って，動画と同様に，記憶による認知的負荷が増大してしまう．

時間軸を座標系に導入した１枚図による提示手法：満足

時間軸を座標系に導入した

1

枚図による提示手法は，

1

枚の静止画で全期間の情報を提示できるので，変化を認知する負荷から人間を解放することができる．また，動画のように，

表現する時間を必要としない．

3.2 ^{表現すべき要素}

1

章で触れたように，ネットワークの変化で表現するべき要素として，ネットワークの差分と成長過程の二つがある．これら，それぞれについて，

3.1

節で述べた時間一覧性と単一性

(20)

を満たした可視化手法が表現すべき要素について以下に述べる．

3.2.1

ネットワークの差分の可視化において表現すべき要素

グラフの差を

1

枚の図として表現する際に，表現すべき要素はトポロジに関するものとジオメトリに関するものに分けられる．

トポロジに関する差は，ノードの増減およびエッジの増減である．トポロジの差だけに着目すれば，要素（ノードおよびエッジ）の増減を表現するだけであるので，容易である．一方のグラフを基準にすれば，増加した要素，減少した要素，変わらない要素の

3

種類を視覚的に表現できる．豊田らはこのような色分けを用いて

Web

のグラフとしての変化を表現している

[13]

．

視覚的にグラフを表現した場合には，トポロジカルな観点だけでなく，ジオメトリックな観点も重要である．ネットワークの視覚的表現には，その目的によっては，トポロジカルな情報だけでなくジオメトリックな情報の表現をも重視するものも少なくない．つまり，重みの付与されたエッジによって表現されたノード間の関連性の強さを，視覚的に表現するものも多い．

ジオメトリに関する差は，ノードの移動およびエッジの変形である．トポロジの変化やエッジに付与された重みの変化によって，ノードの位置やエッジの形状が変化する可能性がある．このようなジオメトリックな差は色では表現できないため，トポロジの差の表現のように単純ではない．

図 3 トポロジ変化とジオメトリ変化エッジ追加ノード追加

ノード削除エッジ削除

(a)トポロジ変化（構造変化）

(b)ジオメトリ変化（レイアウト変化）

移動

(21)

3.2.2

ネットワークの成長過程の可視化において表現すべき要素

時間一覧性の「時系列の変化を一覧して表現する」ために，成長過程の可視化には差分の表現要素であるトポロジとジオメトリ変化の他に，各時点の状態を一連に表現する必要がある．

差分では，トポロジとジオメトリの変化の前後関係で異なることが分かればよかったので，

色や形状で表現する場合には，

2

種類用意すればよい．しかし，時系列の各状態を弁別できるようにするには，その各状態数だけ種類が必要となり，表現すべき時系列が長くなればなるほど表現が難しくなる．そこで，連続的な変化が可能かつ，各時点の状態の違いを弁別できるような，描画要素に時間を対応させる必要がある．

(22)

第 4 章動的ネットワークの変化の提示手法

時間一覧性と単一性を満たした動的ネットワークの変化の提示手法として，差分と成長過程の可視化手法を提案する．なお，本章ではそれぞれの可視化手法の概要と利点などを述べるにとどめる．詳しい説明は

5

章と

6

章にて述べる．

4.1 ^{成長過程の可視化手法}

ネットワークの構造と時系列の変化を同時に表現するために，グラフレイアウトに時間情報を反映させるアプローチを取った．具体的に時間情報を反映させる描画要素として，エッジ長，ノードの色，ノードの大きさなどがあるが，ここでは，観察者が変化を最も認知しやすいジオメトリ要素（レイアウト要素）の，エッジ長に時間情報を対応付けた．この動的ネットワークの成長過程の可視化手法を「波紋表現」と名づけた．

4.1.1

波紋表現の概要

新しい情報を中心に配置し，その情報がもつ時刻（履歴）が古くなるのに従って，中心から離れて行くという波紋の特徴を利用した表現手法「波紋表現」を提案する．対象とするデータ構造は，木と同様であるが，表現の方法が次の二点で違いがある．

最新の情報は，親ノードの近傍に配置される．

子ノード間の関係は，親ノードからのエッジ角度で表現される．

波紋表現のコンセプトは「新しいものは近くに，古いものは遠くに配置する」ことである．

これは，波紋が広がる特徴を利用しており，ゆえに波紋表現と呼ぶ．

系統図に代表されるように，従来の木構造の時系列階層表現は図

1(a)

のように，時系列の階層がルートからリーフに向かって平行に表現される（ここでは，ノード

C-F

間の点線は無視をする）．これに対し波紋表現では，図 4

(b)

のように時系列階層が各部分木の親ノードを中心とした同心円（波紋）で表現される．波紋表現は，対象とする木構造データを時系列の階層で表現する場合に有効である．この時系列階層を同心円で表現する．

(23)

(a)時系列階層表 (b)波紋表現図 4 木構造の時系列階層表現と波紋表現との比較

特徴

波紋表現は，時系列階層表現と比較して階層の順番が異なっている．木構造の時系列階層表現の場合，ルートからリーフ方向へ向かって古い時刻から新しい時刻へと順番に配列される．一方，波紋表現では，各部分木の一番古いリーフの時刻から親ノード（中心）に向かって新しくなってゆくように配置される．ただし，親ノード位置のみノード生成時刻とする．

すなわち，時系列階層の並びが時系列階層表現と逆になっているのが特徴である．

自然界にも波紋や木の年輪のように，波紋表現と同様の時系列の並びを様々な場所で見ることができる．基本的に，時間の経過とともに成長する性質を持つものが，こうした時系列階層の形をとる．年輪の間隔は成長周期の

1

年であるし，波紋の間隔は周波数の逆数に比例している．両者とも周期は様々であるが，間隔が一定周期でかつ同心円状に広がってゆく点が共通となっている．

波紋表現においても，各波紋の周期はすべて同じである．この表現では，波紋とノードが同期しており，ノードの生成時刻と波紋の発生時刻が同じである場合，波及してゆくその波紋上にそのノードが配置される．波紋の中心には，親ノードが配置され，ある一定間隔で同心円状に波紋が発生する．すなわち，同一波紋上にあるノードは，すべて同じ時刻に発生したノードを表している．

利点

波紋表現では，各波紋の周期が分かれば，ある時点から最も古い時間までの履歴を視覚的に把握することが可能となる．さらに，波紋の周期を変化させることで，様々な時間周期で情報を整理することができ，情報のもつ周期性や出現頻度といったことが分析可能となる．

木は，閉路をもたないグラフである．さらに，ルートを決めた場合，階層をもった有向木となる．例えば，組織図の場合には，各階層は組織の単位を表し，系統図の場合には，年代を表す．有向木を時系列階層で表現した場合，最新の情報は常に最下層に配置される．一方，

B

C

D

E

G

2003 2004

2005

2004 2005

A 2003 F

A

B C

F D

G

2004

E 2005

(24)

波紋表現の場合は，最新情報は常に親ノードから見て最上層に配置される．すなわち，最新の情報を知りたいときは波紋の発生点（親ノード）の近傍に注目するだけでよい．

波紋表現では，木の構造上，表現することができなかった，リーフ同士のリンク関係を角度として表現できる．例えば，図 4

(a)

の点線で示したように，ノード

F

とノード

C

の間に意味的な繋がりがあった場合，波紋表現では図 4

(b)

に示したように，角度的に近い場所に配置して，このリンク関係を表現することができる．実世界の情報は，複数の属性を持つことがあり，木のように明確に構造化できる場合が少ない．このように見えないリンク関係

[32]

も視覚化することが重要である．

適用限界

波紋表現は，閉路のないグラフ構造すなわち木のみ表現可能である．また，表現すべき要素の，ジオメトリックな変化は，そもそも時間的変化をレイアウトに反映させてしまっているため，表現ができない．したがって，波紋表現で表現できるのは，トポロジ変化（グラフ要素の増加）とその時間的変化の表現のみである．

4.2 ^{差分の可視化手法}

ネットワークの差分を表現するために，二つのグラフを重ねて表示するマージグラフを利用する．グラフの物理モデルに

Spring-Embedding [33]

を適用し，前後で対応するノード同士を，仮想的に自然長０のバネで連結する．エッジに埋め込んだスプリングの強さを，関係性の属性値（関連度など）に対応させると，変化の前後で，ノード位置が変化する．このノード位置の変化量を，三角アイコン等で示すことで，差分を可視化する．これを「差分表現」

と名づけた．

4.2.1

差分表現の概要

差分表現では，二つのグラフを重ねることで，トポロジの変化とジオメトリの変化を表現できる．具体的に，ある時刻tのグラフ

G

1と，時刻

t+1

のグラフ

G

2をマージすると，図

5(c)

のようなマージグラフができる．この時の重ね順は，時刻が古いグラフ

G

1が上側になり，時刻が新しいグラフ

G

2が下側になるようにする．このような重ね順にすることで，

G

2と

G

1とでトポロジおよびジオメトリの変化がないグラフ要素（ノードとエッジ）は，同じ位置に完全に重なり合う．なお，このような位置が重なるように

G

2と

G

1とで対応するノード同士を，

仮想的に自然長

0

のバネで連結する．

一方，追加によるトポロジ変化があった

G

2のグラフ要素は，重ならずにマージグラフに現れる．ここでは，追加要素はノード

c,

エッジ

Bc,

エッジ

Dc,

エッジ

Bb,

エッジ

Ab

である．

この追加によるトポロジ変化と削除によるトポロジ変化（エッジ

Cb

）によって，

G

2にジオメトリ変化が現れる．この理由は，エッジにバネ埋め込みを行なっているためであり，トポロジ変化により，力学的なつり合いが変化するからである．すると，マージグラフでは，トポロジ変化の場合と同様に，

G

1のグラフ要素と重ならないノード

b

が現れる．このノード

b

(25)

は追加要素ではないが，トポロジ変化の結果として現れるジオメトリ変化のグラフ要素である．このグラフ要素は，

G

1と

G

2で共通するノードなので，対応関係を示すために，前状態の

G

1に帰属するノード

b

から次状態の

G

2に帰属するノード

b

に向かって，移動を表すベクトル（三角アイコン）を描く．

さらに，以上のようなルールを用いてトポロジ変化とジオメトリ変化をマージグラフにて分かりやすく提示できるように，グラフ

G

1のグラフ要素を青色，グラフ

G

2のグラフ要素の色を赤色で色分けを行なう．これにより，どちらのグラフに帰属するグラフ要素なのか色によって判別が可能となる．

図 5 差分表現利点

エッジのトポロジの変化がそのままジオメトリ変化に反映され，その結果，ノードの移動ということに帰着できる．また，エッジの長さも関係性の強さを対応させることで，ジオメトリ変化に反映できる．このように，ジオメトリ変化を統一的に移動ベクトルによって表現できる利点がある．

また，ノードの追加というトポロジ変化は，マージグラフにおいて色の特異点を見つけるだけという作業で，比較的簡単に追加ノードを見つけることが出来る．このような，特徴を備えた差分表現により，例えば可視化対象のグラフが大規模となった場合に，従来は間違い探しといった前状態と次状態の図の比較作業では，ジオメトリ変化要素とトポロジ変化要素の発見が困難であったが，この作業から解放できる．

適用限界

マージグラフでは，トポロジ変化のノードおよびエッジの追加のみ表現可能である．例えば，ノードの削除は，マージグラフでは上側に重ねる前状態のノードに隠されてしまい，表

(a) 時刻tのグラフG1

マージ

(b) 時刻t+1のグラフG2 (c) グラフG1とG2のマージグラフ

A

B

C

D

E F

A B

C

D

E F

+

エッジ

A

B

C

D

E a F

b

a

c b b

c

a

b

固定ノード

自由ノード

(26)

現することができない．また，エッジの削除も同様である．したがって，トポロジ変化のうち，グラフ要素の増加だけ表現可能である．

また，ジオメトリ変化は，前状態のグラフ要素の位置から変化であり，少なくとも前状態のグラフ要素に

1

つ以上の位置的基準点が必要となる．すなわち，ノードのうち少なくとも

1

つは位置を固定し，その座標を基準とした次状態における位置の変化を求める必要がある．

(27)

第 5 章波紋表現

グラフの「成長過程」を

1

枚の静的な図として表現する表現スタイル「波紋表現」を考案した．その具体的な描画手法について，

5.2

節にて数学的な定式化を述べ，

5.3

節にて実装したシステムについて述べる．まず，定式化を行なう準備として，

5.1

節にて波紋表現の描画対象や座標系，グラフの描画ルールといった描画スタイルを定義する．

5.1 ^{描画スタイル}

5.1.1

描画対象

描画対象は，時間情報をもった根付き木である．この根付き木はG=(V,E)で与えられ，エッジの集合E⊂V×V とノードの集合Vで構成されている．また，子ノードにリーフノードしか持たないノードを根とする部分木をG_subと表記する．さらに，根付き木の各ノードv∈V は属性として生成時刻とカテゴリの二つの属性を保持している．したがって，Vは時系列データとなっている．また，vの生成時刻をd(v)と表記する．

5.1.2

ノードの配置規約

Gsubの波紋表現の配置規約は，同心円配置である．従って，G_subの入れ子構造であるGの波紋表現の配置規約は，再帰的同心円配置となる．

エッジの配線規約

配線規約を，エッジの線種と配置規約の座標系との関係で説明する．まず，波紋表現のエッジの線種は，直線配線である．また，この配線は波紋表現の座標系と独立している．

5.1.3

グラフの描画規則

波紋表現の描画規則について，意味的規則と構造的規則に分けて述べる．まず，ノードの持つ属性による配置規約（意味的規則）として，時間属性が新しいノードの集合を中央付近に配置が挙げられる．また，Gが持つグラフ理論的な概念や特徴に関係した配置規則（構造的規則）に関しては，特に制約を設けていない．

(28)

5.2 ^{自動レイアウト}

5.2.1

ノード位置の決め方

図 6 波紋表現の座標系

ノードの位置は，図

6

で示したように極座標で表現する．すなわち，Gの描画の際には，

エッジの長さと角度をパラメータとして各ノードの位置を決定する．例えば，vの位置p(v)は，

エッジの長さをl_v(t)，角度を

θ

^{とすると，}(l_v(t),

θ

)と表せる．すなわちルートの位置を決めると相対的に全てのノードの位置が定まる．

5.2.2

波紋の決め方

波紋の描画は，G_subの親ノードの位置を中心として，ある一定時間ごとに波紋を生成している．そして，ノードと波紋の描画位置が互いに一致している．すなわち，G_subの親ノード以外のノードの中で最も古い時刻のノード（一番外側のノード）をvとすれば，その時刻

)

0 d(v

t = から波紋が発生する．また，子ノード位置と一致している波紋以外に，一定の時間間隔ごとに波紋が発生している．このように波紋は，ノードの時刻と経過時間のスケールを視覚的に理解できる役目がある．

Gsubの親ノードを中心とする波紋の集合を{c₁,c₂,L,c_n}とする．時刻tにおける時刻t₀に発生した波紋（最も外側の波紋）c₁の半径r₁(t)は

(9)

式で計算される．ただし，波紋の周波数を

f ，波長を

λ

^とする．

( ) (

0

)

1 t f t t

r =

λ

⋅ × −

(1)

このとき，描画される波紋の個数nは

(10)

式を満たさねばならない．





=

λ

)

1(t

n r

(2)

l

v

(t) l

w

(t)

θ x

y p(v)= (l

v

動的ネットワークの 成長過程と差分の可視化手法

筑波大学大学院博士課程 システム情報工学研究科修士論文