• 検索結果がありません。

Microsoft Word - Ⅲ表紙社会ネット

N/A
N/A
Protected

Academic year: 2021

シェア "Microsoft Word - Ⅲ表紙社会ネット"

Copied!
34
0
0

読み込み中.... (全文を見る)

全文

(1)

目 次

1. はじめに─ネットワークとは 2. 複雑ネットワーク 3. ネットワークとグラフ 4. ネットワークの基本特徴量─Excel による計算 5. ネットワーク分析用Excel テンプレート NodeXL 6. おわりに 参考文献 練習問題 No.11-03

Excel による社会ネットワーク分析Ⅰ

─ネットワークの基本特徴量─

和歌山大学経済学部 牧野真也 2011 年 6 月 30 日 2012 年 4 月 7 日,2015 年 2 月 7 日 修正

(2)
(3)

Excel による社会ネットワーク分析Ⅰ

ネットワークの基本特徴量

2011 年 6 月 30 日 牧野真也 2012 年 4 月 7 日,2015 年 2 月 7 日 修正

1.はじめに─ネットワークとは

今日の社会科学では,社会ネットワーク分析というネットワークの概念を用 いた分析が,統計学を用いた分析と並んで一般的なものになりつつあります。 ここで,ネットワークとは,複数の(多くの)主体間の関係をモデル化(抽象 化)したものです。ここでいう主体とは社会科学の分野では,人間や組織など の社会的主体が想定されます。主体間の関係には,主体同士の相互作用,影響, つながりなどがあります。 一般にネットワークは,図1のよ うに示されます。図式的には主体を 点(丸)で,関係を線で表わします。 このように,主体と関係(点と線) のみに着目し,他のもろもろのこと を捨て去って分析を行なうところ が社会ネットワーク分析の大きな 特徴といえるでしょう。 また,社会ネットワーク分析では, ネットワークの構造にしたがってさまざまな分析がなされます。具体的には, ネットワークの構造に基づく特徴量(metric)を計算したり,ネットワークを さまざまな側面から可視化1したりして分析されます。 ここでは,Excel を用いてそれらの一部を実際に計算し,ネットワーク分析に 対する理解を深めます。さらに,NodeXL という無料で利用できるツール(Excel のテンプレート)を用いて,複雑な計算やネットワークの可視化も行ないます。 1 可視化(visualization)とは,直接見ることができなかったり,直接見てもわかりにくか ったりする現象や事象を,図などの見える形やわかりやすい形で示すことです。 図1 ネットワークの図による表現

(4)

2.複雑ネットワーク

1990 年代後半以降,ネットワークの研究は大きく進み,今日では現実の複雑 なネットワーク(複雑ネットワークと呼ばれます)がもついくつかの性質が明 らかになりつつあります。その中で,とりわけ注目されている複雑ネットワー クの特性としてスモールワールド性,クラスター性,スケールフリー性をあげ ることができます2 前稿「Excel による社会シミ ュレーションⅠ─セル・オート マトン」では,セル・オートマ トンによる社会シミュレーシ ョンについてみました。それは, あらゆる主体(セル)が一定数 (決まった数)の近傍の主体と のみ関係するモデルでした。ネ ットワークとして図示すれば, たとえば2次元セル・オートマ トン(ムーア近傍:近傍数 8) は図2のようになるでしょう。 もちろん,このモデルは,社会のある重要な側面(たとえば,近くの主体に 強い影響を受ける)を表わしていると考えられるでしょう。しかし,実際の社 会ネットワークでは,近くだけではなく遠くの主体と何らかの関係を持つこと が少なからずあり,このことが重大な影響を及ぼすこともあります。また,あ らゆる主体が一定数の主体と関係しているのではなく,実際には多くの主体と 関係している主体もあればそうでない主体もあります。セル・オートマトンで は現実のこのような特性を捨象する(捨て去る)ことによって特定のシミュレ ーションや分析を可能にしています。 一方,複雑ネットワークでは,実際のネットワークがもつこれらの特性を重 要なものと考えます。以下,複雑ネットワークがもつ3つの特性(スモールワ ールド性,クラスター性,スケールフリー性)について簡単にみてみます。 (1) スモールワールド性 スモールワールド性とは,社会ネットワークが大規模であっても,それぞれ の主体間の距離は相当に小さいという性質です。少数の主体を介するだけで他 2 これらの特性が意味する範囲は研究者によって少し違いますが,この稿ではウィキペディ ア項目「複雑ネットワーク」に準じました。 図2 セル・オートマトンのネットワーク

(5)

の多数の主体とつながります。このことは,アメリカの心理学者ミルグラム(S. Milgram)が 1967 年に行なった実験で示して以来,さまざまに採りあげられて きました。ミルグラムの実験は,米国内の遠くの見知らぬ相手へ手紙を届ける というものであり,その際,知り合いのみを次々にリレーして届けるというも のです。この実験の結果,平均して 6 人の知り合いを介すれば相手に届くこと が示されました。この 6 人という数は直感に比べて非常に小さく感じられるイ ンパクトのあるものでした。以降このことは「6 次の隔たり」と呼ばれ,世界は 思いのほか小さい(small world)のでは,と考えられるようになりました。 1990 年代後半には,ワッツ(D. J. Watts)とストロガッツ(S. H. Strogatz) による「スモールワールド実験」が行なわれました。この実験は,ミルグラム の実験と同様のもので,電子メールを用いて,ファーストネームで呼び合える 関係の人にメッセージを送ることを繰り返し,目的とする人物まで届けるとい うものです。この結果もまた 6 次の隔たりを支持するものでした。また,この 実験では,ミルグラムの実験と比べて参加者がそれなりに多かったため,実際 に到達したメールも多く,そこで得られたデータをもとにさまざまな分析がな されました。その結果,メールを中継する送り先の多くは,家族や職場の近い 人でしたが,一部はそうではない遠くの人に送られていました。そして,この 「遠い関係」がスモールワールド性に大きく関係していることが示されました。 (2) クラスター性 クラスター性とは,クラスターと呼ばれる主体間の 密な関係が社会ネットワークに多くみられるという 性質です。ここでクラスターとは,図3のような三角 形を構成する主体間の関係のことで3,たとえば,あ る人の知り合い同士もまた知り合いであるという状 況があげられます。図3は,たとえば,a さんと b さ ん・c さんが知り合いのときに b さんと c さんも知り 合いであるような状況と解釈できます。 ワッツらは,現実のネットワークにおいては,このクラスター性(が高い) という特徴があることを指摘しました。詳しくは後述しますが,主体間をラン ダムにつないだネットワークでは,クラスター性はかなり低くなります。たと えば,1 億人がそれぞれ 100 人の知り合いをもっている場合,ある1人の知り 合い同士が知り合いである数(つまりクラスターを形成する数)の期待値は約 0.01 となります。これは,100 人それぞれのネットワークについて調べて,よ うやく 1 組のクラスターが期待できるということであり,私たちの実感と比べ 3 場合によっては四角形を構成する関係を含むこともあります。 図3 クラスター

(6)

て著しく少なく感じます。現実には,自分の知り合い同士がまた知り合いであ ることは相当に多くあることであり,普通のことともいえます。 (3) ワッツ=ストロガッツモデル ここまでみてきた,スモール ワールド性やクラスター性4 示すネットワークの構造とはど のようなものでしょうか。ワッ ツとストロガッツはそのモデル を提案しました。これは,ワッ ツ=ストロガッツモデルあるい はスモールワールドモデルとよ ばれます。 それは,近隣のみと関係する ネットワーク(図2のセル・オ ートマトンのようなネットワー ク)をベースにその一部(少数) の関係をランダムにつなぎ替えたモデルです(図4)5。このつなぎ替えをリワ イヤリング(rewiring)といいます。 2次元セル・オートマトンのような構造は格子と呼ばれるもので,クラスタ ーは多いのですが,主体間の距離は小さくありません。たとえば,100×100 の 格子の場合端から端までの距離は99 となり,6 次の隔たりどころではありませ ん。しかし,そこに少量のリワイヤリングを施すと,距離は圧倒的に小さくな ることが示されました。 一方,リワイヤリングは適度に少なく行なわれる必要があります。リワイヤ リングしすぎると,ランダムネットワークになってしまい。(2)でみたようにク ラスターが少なくなってしまいます。 ワッツとストロガッツの研究に触発されて,1990 年代末あたりから複雑ネッ トワークの研究は盛んになりました。 (4) スケールフリー性 スケールフリー性とは,主体がもっている関係の数は,主体によって大きく 異なるという性質です。図5は(執筆当時)国内最大のSNS であるミクシィの 4 これら 2 つをあわせて,スモールワールド性と呼ぶこともあります。 5 ワッツらは1次元格子の円環で示しましたが,図4では2次元格子を示しています。これ らは本質的には何ら違いはありません。 図4 ワッツ=ストロガッツモデル

(7)

マイミク関係(相互に認め合った友達関係のようなもの)を,専用の可視化ソ フト MixiGraph によって示したものです。図5から明らかなように,ミクシィ のメンバーの多くは1 人や 2 人といった少ないマイミクしかもっていませんが, 一部のメンバーは何十人,あるいは場合によっては百人を超える数(1 人がもつ ことができるマイミクは運用上最大で千人)のマイミクをもっています。この ように関係の数には主体による大きな較差があります。特に多くの関係を持っ ている主体はしばしばハブと呼ばれます。 図5 MixiGraph によるマイミクのネットワーク(出典http://sg.fmp.jp/mixiGraph/) この現象は,社会ネットワークをはじめネットワーク一般に広く見らます6 各主体が関係する主体の数の分布をみると,図6のようなベキ分布になるとこ がわかっています7。このベキ分布は,都市の人口,商品の売り上げ,人々の年 収や資産など実に幅広くみられる分布でもあります。一般によく知られている 正規分布よりも多くみられるかもしれません。 では,なぜ,このような分布が形成されるのでしょうか。このことは,前に 6 インターネットや航空ネットワークなどでもよく見られます。航空路の多く集中する空港 はハブ空港と呼ばれます。 7 図6は,一般的な分布(確率分布)ではありませんが,同様にベキ分布となります。

(8)

採り上げたワッツ=ストロガッツモデルでは,説明できません。そこで,バラ バシ(A-L. Barabási)とアルバート(R. Albert)は,関係を多くもつ主体ほど より高い確率で新たな関係を構築するという優先的選択が,一部の主体に関係 を集中させ,ハブをつくり出し,スケールフリー性をもたらすということを, モデル(バラバシ=アルバートモデル)を用いて説明しました。優先的選択は, 多くもつものはより多くもつようになるということであり,格差を拡大します。 大都市への人口集中や,売れる商品がより売れるという現象(経済学でいうバ ンドワゴン効果)に対しても,優先的選択による説明が可能でしょう。 図6 ベキ分布(日本の都市の人口,データ:ウィキペディア項目「日本の市の人口順位」) 以上みてきた複雑ネットワークの特性は,今日の社会ネットワークを特徴付 ける重要な性質であることは間違いありません。しかし,これらの特性は,確 かによくみられるものですが,全ての社会ネットワークにおいて必ずみられる というものではないことに注意しましょう。

(9)

3.ネットワークとグラフ

(1) グラフ理論 すでにみたように,ネットワークは点とそれらを結ぶ線の集合として扱うこ とができます。グラフ理論という数学の分野では,このような構造をグラフ (graph)と呼んで研究を進めてきています。この稿ではネットワークとグラフ を同じ意味で用います。 グラフ理論では,一般的に点を頂点(vertex;複数形が vertices であること に注意)と呼び,線を辺(edge)と呼び8,グラフを頂点の集合と辺の集合(の 組)と考えます。グラフを G,頂点の集合を V,辺の集合を E とすると,図7 のグラフ G は,たとえば以下のように表わすことができます。つまり,左の数 式と右の図は同じグラフを表わしています。 )} , ( ), , ( ), , ( ), , ( ), , {( } , , , , { ) , ( 5 2 4 3 4 2 3 2 2 1 5 4 3 2 1 v v v v v v v v v v E v v v v v V E V G    数式中,{a, b, c,…}は集合を示し,(x, y,…)は組(tuple)を示します。組は, 集合と同様に複数の値からなりますが,集合と違って順序や重複に意味をもた せたもので,高校までの数学でいうとベクトルの成分表示や平面上や空間上の 座標がこれに該当します。そして,それぞれの辺は異なる2つの頂点の組で示 すことができます。たとえばv1とv2を結ぶ辺は,組(v1, v2)で示されます。 また,左側の式からも明らかなように,グラフでは頂点および2つの頂点間 の関係のみが意味を持っています。したがって,右図はそのグラフの可視化の 一例であり,これと同じグラフの図はいくらでも示すことができます。図8に そのいくつか示します。したがって,目的に応じて適切な図を描く(選ぶ)こ と自体が,ネットワークの理解を深めることになります。また,これらの図7・ 8で示した図形をトポロジカルに等しいということがあります。 8 高校までの幾何でも図形において頂点・辺という表現を用いているので,この稿でもこの 表現を用います。また,後に用いる(あるいは紹介する)ネットワーク分析用のツール類 の多くもグラフ理論の用語の英語表現を用いています(日本語版のツールは今のところな いと思われます)。以下,重要な用語には一般的な英語表現も示します。 図7 グラフ

(10)

図8 図7と同一のグラフの別表現 (2) さまざまなグラフ ・有向グラフ・無向グラフ グラフには,辺に方向性をもたせた図9の ような有向グラフ(directed graph)と方向 性 を も た せ な い 無 向 グ ラ フ (undirected graph)があります。この稿では無向グラフ のみを扱います。 無向グラフでは,2つの頂点の間に辺があ る場合,双方向の有向辺(向きのある辺)2 本があるものと一般的に解釈されます。たと えば友達関係はお互いに認め合って初めて友達になると考えれば(たとえばミ クシィのマイミクや Facebook の友達では明示的にそのような手続きが必要で す),a さんと b さんが友達という場合「a さん─<友達>→b さん」「b さん─< 友達>→a さん」が同時に存在すると考えられます。このような関係を対称的 (symmetric)といいます。 一方,恋愛感情などでは,「a さん─<好き>→b さん」は必ずしも「b さん─< 好き>→a さん」を意味しませんから対称的ではありません。したがって,有向 グラフの場合は,辺(v1, v2)と辺(v2, v1)は別の辺を意味します。ここでは無向グラ フのみを扱いますから,これらの区別はないと考えることにします9 ・単純グラフ この稿では,単純グラフ(simple graph) を中心に扱います。単純グラフでは,図 10 で示すような,ループと呼ばれる1つの頂点 の自分と自分の間を結ぶ辺や,多重辺と呼ば れる同一の2つの頂点間を結ぶ複数の辺は 9 要素数 2 の組を特に対(pair)と呼び,このような順序に意味がない対を非順序対と呼ん で別の記号で表わすことがありますが,この稿では無向グラフの場合,特に断わらない限 り辺の組を非順序対と考えます。 図9 有向グラフ 図10 ループと多重辺

(11)

存在できません。 なお,(1)で説明したグラフは単純グラフを前提にしているといえます。なぜ なら,辺は異なる2頂点の組の集合であり,また辺の集合が重複を許さない(集 合では重複に意味がない)ため,ループや多重辺は存在できないからです。 ・連結グラフ 任意の頂点からそれとは別の任意の頂点へ辺をたどって到達できるグラフを 連結グラフ(connected graph)といい,到達できないグラフを非連結グラフ (disconnected graph)といいます。図 11 のように,すべてつながっているグ ラフが連結グラフ,どこかで切れている(あるいは複数の連結グラフがある) グラフが非連結グラフです。なお,図12 の孤立している1つの頂点もグラフと 考えます(辺の集合Eがφ:空集合であるグラフ)。この稿では連結グラフを中 心に扱います。 図11 連結グラフ 図 12 非連結グラフ (3) 隣接行列 いまグラフの頂点が n 個あるとします。そのとき,頂点 viから頂点 vjへの辺 が存在するとき行列の (i, j) 成分を 1 とし,存在しないとき (i, j) 成分を 0 とす るような,n×n行列を用いて,グラフを表わすことができます。たとえば,図7 のグラフは次の行列Aのように書けます。                  0 1 0 0 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 1 0 0 0 1 0 A この行列Aはその(i, j)成分によってvivjが隣り合っているかどうかを示し ているとみることができるので,隣接行列(adjacency matrix)と呼ばれます。 図7(再掲)

(12)

無向グラフの場合は必ず双方向で隣り合っているので(対称的なので),Aは対 称行列(行と列を入れ替えても同じ行列)となります(もちろん,有向グラフ の場合は対称行列になるとはかぎりません)。 隣接行列 A は図7のグラフを余すところなく表わしています。さらに,集合 や組でグラフを表わす場合と違って,さまざまな操作が行列の演算により可能 となります。このことは非常に便利なので隣接行列はしばしば利用されます。

(13)

4.ネットワークの基本特徴量─Excel による計算

ここでは,ネットワークの基本的な特徴量に ついて紹介し,実際にExcel で計算してみます。 基本的かつ計算が簡単なものにとどめたいと 思います。 以下では,例として図7のネットワーク(グ ラフ)を多く用います。 (1) ネットワークのExcel での表現 まず,対象のネットワークを Excel で表わす必要があります。その方法はい くつか考えられますが,以下に説明する3つの方法が代表的でしょう。ネット ワーク分析専用のツールでもこれらの形式を扱っている場合が多いと思います。 なお前述したように,ここでは,無向グラフ,単純グラフ,連結グラフのみを 扱います。 a. 辺のリストを示す(辺リスト) 辺が存在する2頂点のリストを示します。辺の集合 E をそのまま表わすイメ ージです。頂点の情報はそのリストの中に含まれると考えます(連結グラフで あれば辺の情報は全頂点を含みます)。以下にExcel での表現を示します。この 方法では,辺の数と行数(ラベル除く)が一致します。この表現方法を「辺リ スト」と呼ぶことにしましょう。なお,頂点を示す(区別する)値は数値でも 文字列でもかまいませんが,ここでは後の処理を容易にするために,1, 2, 3,… の整数を用います。 A B C D 1 頂点(1) 頂点(2) 2 1 2 3 2 3 4 2 4 5 3 4 6 4 5 7 図7(再掲)

(14)

b. 頂点ごとに,その頂点と隣接している頂点のリストを示す(頂点リスト,ま たは隣接リスト) それぞれの頂点ごとに,その頂点から1つの辺でつながっている別の頂点の リストを示します。たとえば以下のようにします。この表現方法を「頂点リス ト」と呼ぶことにします(頂点とそれに隣接する頂点を示しているので「隣接 リスト」と呼ばれることが多いですが,本稿では「辺リスト」との対照のため 以下頂点リストと呼びます)。 A B C D E F 1 頂点 頂点(1) 頂点(2) 頂点(3) 頂点(4) 2 1 2 3 2 1 3 4 4 3 2 4 5 4 2 3 5 6 5 4 7 この表では,A 列に全頂点が並び,各行の B~E 列に A 列の頂点とつながって いる頂点が示されます。辺でつながる頂点の数は最大で「頂点数-1」なので, その分の列を(ラベルをつけて)確保しています。この方法では,頂点の数と 行数(ラベル除く)が一致します。多くの場合,頂点の数は辺の数よりも少な いので(頂点の数がn の場合,辺の数は最大 n (n-1)/2 となります),行数は辺 リストよりも短くなることが多いでしょう。 なお,この表には辺の反対側からの頂点も示しています。無向グラフの場合 は,データとして冗長ですが,これは処理を容易にするためです。反対側を省 略して処理することや自動的に追加することも可能でしょう。 c. 隣接行列を示す 隣接行列を示します。行列は Excel の表でそのまま表現できます(行,列の 概念もそのままです)。隣接行列は,無向グラフの場合,対称行列となるので, 一方のみ(たとえば右上の三角形の領域のみ)を書いて,反対側はコピーした り参照したりすることもできるでしょう。

(15)

A B C D E F G 1 頂点 1 2 3 4 5 2 1 0 1 0 0 0 3 2 1 0 1 1 0 4 3 0 1 0 1 0 5 4 0 1 1 0 1 6 5 0 0 0 1 0 7 以上の3つの表現方法を紹介しましたが,それぞれ一長一短といえるでしょ う。ここでは,b の頂点リストの方法を基本的に用いて,必要に応じて a の辺リ ストや c の隣接行列に変換することとします。なぜなら,ここで扱うネットワ ークの特徴量の多くは頂点に関わるものが多く,b の頂点リストは頂点ごとに整 理された形式なので,処理が容易なことが多いからです。 では,b の頂点リストの形式で頂点と対応する頂点のリストを入力し,そのワ ークシートの適当なところに隣接行列をつくってみましょう。セル H2 に適切な 式を入れればあとはコピーするだけで隣接行列(セル範囲 H2:L6)をつくれます。 A B C D E F G H I J K L 1 頂点 頂点1 頂点2 頂点3 頂点4 頂点 1 2 3 4 5 2 1 2 1 0 1 0 0 0 3 2 1 3 4 2 1 0 1 1 0 4 3 2 4 3 0 1 0 1 0 5 4 2 3 5 4 0 1 1 0 1 6 5 4 5 0 0 0 1 0 7 H2 に入力する式はいろいろ考えられるでしょう。ここでは,最も簡単な方法 として関数 COUNTIF(範囲,検索条件) の利用をあげておきましょう。この関数は 「範囲」から「検索条件」(検索条件に数値や文字列,セル番地を指定した場合 はその値に一致するもの)を満たすセルの個数を返します。たとえば,上のワー クシートで COUNTIF(B2:E2,1)は 0 を返し,COUNTIF(B2:E2,2)は 1 を返します。 このことは,(頂点1 が)頂点 2 への辺をもっていることを意味します。ここで, 検索条件の1 や 2 は隣接行列の 1 行目の値をそのまま利用できます。あとは各

(16)

自考えてみましょう。 (2) 次数 頂点 vi からでている辺の数を vi の次数 (degree)といいます。たとえば,図7では, 頂点v1の次数は1,頂点v2の次数は3 となり ます。 次数の計算は簡単です。隣接行列をつくっ ているのであれば,行方向(や列方向)の合 計がその頂点の次数となります。頂点リスト からも簡単につくれます。関数 COUNT(値…)は,引数にセル範囲を指定すれば, そのセル範囲中にある数値の個数が返されます。これを利用して簡単に頂点リ ストから次数を求めることができます。 すべての頂点の次数を求めたら,それを合計してみましょう。全頂点の次数 の和は,無向グラフの場合は必ず辺の数の2倍になります(このことは1つの 辺には必ず2つの頂点がつながっていることから自明でしょう)。このことを握 手の補題と呼びます。 また,この例では頂点数が少ないのであまり意味はありませんが,頂点が多 い場合は,それらの次数の分布(次数分布)をグラフ化してみましょう。分布 のつくり方はいろいろありますが,最も簡単な方法は,次数を多い順に並べ, 次数を目的変数(y),次数の順位を説明変数(x)としてグラフ化することです。 Excel の「並べ替え」や順位を求める関数 RANK(数値,範囲,[順序])を必要に応 じて利用しましょう。 スケールフリー性がある場合,その分布はベキ分布となり,y xa で近似で きます。この式の両辺の対数をとれば,logylogxlogaとなるので,その グラフは直線で近似でき,視覚的にも確認しやすくなります(図6参照)。近似 は Excel のグラフの「近似曲線の追加」などを利用しましょう。なお「近似曲 線の追加」では近似曲線だけでなく,近似式や重相関係数を追加して表示する こともできます。 (3) 頂点間距離 頂点間の最短距離を求めてみましょう。ネット ワーク(グラフ)の最短距離を求める問題は応用 範囲が広い問題です(たとえば,輸送経路の計画 やカーナビの道順の決定,日程計画などで応用さ れます)。 図7(再掲) 図7(再掲)

(17)

ここでは,すべての辺の長さを 1 として最短距離を求めてみましょう。たと えば,図7の場合,頂点v1から v5までの経路はいくつかありますが,その最短 経路はv1→v2→v4→v5であり,その距離は3 となります。他にも(後戻りしない 経路としては)v1→v2→v3→v4→v5がありますが,その距離は 4 なので最短では ありません。以降一般に距離という場合は最短距離を意味することとします。 a. 隣接行列のべき乗による距離行列の作成 このようなネットワークのすべての頂点間の最短距離を求める方法はいくつ かあります。1つの方法として,隣接行列の積を繰り 返し計算する(隣接行列のべき乗を計算する)方法が あります。簡単にみてみましょう。 まず,隣接行列A の 2 乗(AA=A2)を計算してみま しょう。行列の積XY の(i, j)成分は,定義から X の i 行 目の行ベクトルと Y の j 列目の列ベクトルの内積とな ります(蛇足ながらX の行数と Y の列数が一致する場 合のみ,その積 XY が定義されます)。たとえば, A2 の(1,3)成分は,それぞれの成分の行ベクトルと列ベクトルの内積,すなわち,A1 行目のベクトルを r1=(0, 1, 0, 0, 0) とし,3 列目のベクトルを c3=(0, 1, 0, 1, 0) とすると r1 ·c3となります。 この内積 r1 ·c3の計算結果は,0×0+1×1+0×0+0×1+0×0=1 となります。この計算 式の第2 項が 1 となり生き残るのは,v1→v2の経路が存在し(r1の第2 成分が 1 である意味),かつ,v2→v3の経路が存在する(c3の第2 成分が 1 である意味) ためであり,それはv1→v2→v3の経路が存在していることを意味します。このよ うな,どこかを経由するv1からv3への距離が2 の経路が 1 つ以上存在すればそ の成分の計算結果は1 以上になりますし,存在しなければ 0 となります。 隣接行列の2 乗の結果 0 でない値になった成分には距離 2 の経路が存在して いることになります。さらに隣接行列との積を計算する(A3, A4…を計算する) ことによって,距離3 の経路,距離 4 の経路…の存在が求められます。 したがって,隣接行列のべき乗を2 乗,3 乗,4 乗…と計算していき,(対角 成分以外の)その成分が初めて 0 でなくなるときのべき指数(何乗であるか) が,その成分に対応する頂点間の最短距離となります。この操作をすべての成 分が 0 でなくなるまで繰り返せば,すべての頂点間の距離を示す行列(これを 距離行列といいます)を得ることができます。                  0 1 0 0 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 1 0 0 0 1 0 A 図13 隣接行列

(18)

以上の操作を Excel で行なってみ ましょう。 Excel では行列の積を計算するた めの関数 MMULT(配列 1,配列 2) があ ります。「配列 1」,「配列 2」にそれ ぞれ行列をセル範囲で指定します。 一方,この関数の式は配列数式とし て入力しなければなりません。その 手順はいくつかありますが,まず基 準となるセル(行列の1 行 1 列目) に「=MMULT(セル範囲 1,セル範囲 2)」 の数式を入れ,その計算結果が表示 される範囲(例の場合は5×5)をマウスドラッグなどで選択します。その後数 式にマウスを移動し(F2 キーを押せばそうなります。数式バーをクリックして もかまいません)Ctrl+Shift+Enter を押します。 最初に,隣接行列で1 のところは最短距離 1 として,対角成分の 0 のところ は最短距離 0 として確定し,残りの場所で 0 以外が現われたところを,その積 の回数(べき指数)の距離として確定していきます。対角成分以外のすべての セルが0 でなくなったらそれが距離行列となります。IF 関数などをうまく使っ て要領よく式を入れていけば,以下のようなワークシートは比較的簡単につく れると思います。 図14 行列の積の計算

(19)

図 15 隣接行列のべき乗で距離行列を求めるワークシート b. ウォーシャル・フロイド法 隣接行列による計算は Excel で処理しづらく,また効率があまりよくないの で,これに代わる方法がいくつか提案されています。その中でウォーシャル・ フロイド法は簡単なアルゴリズムであると同時に,すべての頂点間の最短距離 を同時に求められ,また計算効率も悪くないので(全く工夫しなくても,計算 量のオーダは頂点数の3 乗10)しばしば利用されます。 ウォーシャル・フロイド法のアルゴリズムは以下のようです。 ①距離行列D を初期化します。 ・同一頂点間の距離を0 にします。 ・隣接頂点間(辺が存在する頂点間)の距離を 1 にします。 ・その他の頂点間の距離を無限大にします。 ②すべての頂点 vk について,D のすべての成分 10 たとえば,頂点数が 2 倍になれば計算量は 8 倍,3 倍になれば 27 倍という程度で増えて いきます。これを効率が悪くないとは考えることは理解しがたいかもしれませんが,ネッ トワークの問題でしばしばみられる指数や階乗オーダの計算量に比べれば,かなり少ない 増え方といえます。                            0 1 1 0 1 1 1 0 1 1 1 0 1 1 0 D 図16 距離行列初期値

(20)

dijに対して,dik+dkj<dijであればdij= dik+dkjとします。

①の結果,図16 の距離行列が最初にできます。②ではすべての頂点 vkについ

て,それを経由したvivj間の距離dik+dkjが現在の距離行列のdijで示されている

距離よりも小さければ(近ければ),D の内容(距離)をそれで置き換えます。 これは,きわめてシンプルでわかりやすいアルゴリズムといえるでしょう。

なお,このアルゴリズムは,Excel のみでは実現できないので,Excel VBA (Visual Basic for Applications)という Excel に付属する BASIC 風のプログ ラミング言語を用いる必要があります。VBA の概要については,前稿「Excel による社会シミュレーションⅠ─セル・オートマトン」をみてください。 図17・18 に,ウォーシャル・フロイド法で距離行列を作成するワークシート とVBA のプログラム例をあげます。 図17 のプログラム中,5・6 行目は,セル範囲 I3:M7 に準備されている初期値 の表(の値)を計算対象のセル B3 以下にコピーしています。その際,∞は999 などの,この問題においてはあり得ないような大きな値を用いています。なお, 前稿(前掲)で示したように,このセルのコピーは代入演算子「=」を用いて書 くこともできます。 距離行列が大規模である場合,初期のデータをあらかじめ手作業で準備する のは面倒ですから,距離行列としてまず隣接行列を用意しておいて,以下の図 18 のようなプログラムで初期化しましょう。

(21)

図17 ウォーシャル・フロイド法による距離行列の計算 図18 プログラムによる距離行列の初期化 図18 の 5 行目からの 2 重の For ループは,i が 1 から頂点数(vn)までの繰 り返される中で j が 1 から頂点数まで繰り返されています。つまり, (i,j)=(1,1),(1,2),…,(1,vn),(2,1),(2,2),…,(2,vn),…,(vn,1),(vn,2),…,(vn,vn) のように繰り返されるので,Range("B3").Cells(i, j)は,すべての距離行列の 要素をたどることになります。なお,Cells(行インデクス,列インデクス)は, Range(セル参照)のプロパティとして書くと,そのセル参照の左上を(1,1)とし た相対的なインデクスで示すことができ,その結果,制御変数の初期値などで 思い悩まなくてもよくなります。

7~9 行目の If <条件> Then <処理> End If は,<条件>を満たすとき Then 以 下の行の<処理>を行なうという制御構造で,これによって<条件>の評価(計算) の結果によって処理をさせたりさせなかったりできます。<処理>はいくつ書い ても(何行にわたって書いても)かまいません。<条件>には,比較演算子(=, <, >, <=, >=, <>11など)や論理演算子(And, Or, Not など)を組み合わせて書く

(22)

ことができます12。7 行目では,「i=j または セル番地 B3 基点で i 行 j 列目の 値=1 (のどちらでも)ない場合」を意味し,隣接行列の対角上あるいはすで に 1 が入力されている場合(距離が 0 または 1 の場合)以外は,8 行目によって 該当セルに 999(無限大を意味する)が記入されます。 図17 のプログラムに戻って,8 行目以下は,ウォーシャル・フロイド法によ るアルゴリズム通りの処理です。k が 1 から vn まで繰り返される中において, 距離行列のすべてが参照され,k を介する i,j 間の距離を変数 d に代入し(11 行目),d が距離行列の i,j 間の距離より小さければ d で距離行列を置き換える (12・13 行目)というプログラムになっています。 c. 平均頂点間距離 距離行列からネットワークの平均(頂点間)距離を計算してみましょう。こ れは,全ての2つ頂点間の距離の平均です。2つの頂点を選び出す組み合わせ は,頂点の数をn とすると, 2 ) 1 ( 2   n n C n となるので,平均距離 L は,距離行 列をダブルカウントしないように右上半分の合計を計算し,2頂点の組み合わ せで除することにより求められます。式で書くと,以下のようになります。dij は距離行列の(i, j)成分です。

     n j i ij d n n L 1 ) 1 ( 2 これを Excel で計算することは簡単でしょう。無向グラフの距離行列は対称 であり,また,同じ頂点間の距離は 0 なので,距離行列をすべて合計すると距 離の合計の2倍になります。したがって,これを2nC2すなわちn(n−1)で除して も,同じ結果となります。 また,ネットワーク全体で,最も大きい頂点間距離をそのネットワークの直 径(diameter)といいます。距離行列から直径を求めるのはきわめて簡単なの で省略します。 なお,ネットワークがスモールワールド性をもつことは,L∝log n であること で示されるといわれています。ここで,記号∝は n が十分大きければ比例する 12 演算の優先順位は,おおむね算術演算>比較演算>論理演算の順です。算術演算の優先 順位は数学とほぼ一致します(たとえば,*は+に優先)。よくわからない場合は数学と同様 に()で括りましょう。なお,代入演算子と比較演算子の=は別の演算です。

(23)

ことを意味します。たとえば,n=1,000 のとき L=3,n=100,000,000 のとき L=8 になるような状況です。スモールワールド性があればネットワークが巨大にな っても(頂点数がものすごく増えても),平均距離はほとんど大きくはなりませ ん。しかし,このような検証は,nがさまざまな場合のデータが必要になるので, 実際のネットワークで検証することは困難かもしれません13 (4) クラスター 2.でみたように,クラスター(cluster)とは, 図 19 のように3つの辺が形成する三角形のこと です14。ある人の友達同士が友達であるような状 況です。クラスターが多く集まっている部分は, たとえばコミュニティのような強固な人間関係が 築かれている部分とみなされたりします。 ここでは,ネットワーク中のクラスターを数え てみましょう。たとえば,図20 のネットワークに はv1-v2-v3,v1-v2-v4,v1-v3-v4,v2-v3-v4の4つのクラ スターがあります。 ある頂点がそれを頂点の1つとするクラスター をどの程度もっているかを表わす指標にクラスタ ー係数(cluster coefficient)があります。ある頂 点の次数をk(つまりk本の辺をもっている)とす ると,その頂点がもつことができるクラスターの 数は,それらの辺がつながっている頂点のうちの任意の2つの組み合わせです から,最大 2 ) 1 ( 2   k k C k 個のクラスターをもつことができます。そのうちいく つに実際に辺が存在しているか,つまりクラスターになっているかが,クラス ター係数の定義です。 頂点viが含まれるクラスター数をciとすると,viのクラスター係数Cliは以下 のようになります。 ) 1 , 0 ( 0 ), 2 ( ) 1 ( 2      k Cl k k k c Cl i i i 13 2.で紹介したようなモデルによるシミュレーションの場合は,n を変えて計算すればよ いので,容易に検証できます。 14 四角形を含む場合もあるようですが,ここでは三角形のみとします。 図20 クラスター数は? 図19 クラスター

(24)

k =0,1 の場合は(連結グラフの場合 0 はありませんが),最大クラスター数が 0 になるので,その場合はクラスター係数を 0 と定義します。図 20 でクラスタ ー係数を計算してみましょう。頂点 v4のクラスター係数は,v4の次数が 4 でク ラスター数が3 ですから,2×3/4×3=0.5 となります。 では,クラスター係数をExcel で計算してみましょう。以下の図 21 のような データが準備されているとすると,クラスター数は,頂点リストの 2 頂点の組 み合わせごと辺の存在を確認し数えればよいことになります。 図21 クラスター係数のワークシート 具体的には,頂点1 と辺でつながる頂点リスト 2, 3, 4 の組み合わせは,(2, 3), (2, 4), (3, 4)の 3 つです。それぞれの頂点の間に辺が存在するかどうかは,隣接 行列の該当するセルをみるのが簡単でしょう。たとえば(2, 3)の間に辺があるか どうかは,隣接行列の(2, 3)成分が 1 であることから,「ある」ことがわかります。 このような手続きを Excel のみで行なうのは困難と思われるので(不可能で はないかもしれませんが,ちょっとやる気はしないでしょう),VBA でプログラ ムを作ってみましょう。 たとえば,以下のようなVBA プログラムが考えられるでしょう。

(25)

図22 クラスター係数を計算する VBA プログラム プログラム中 8 行目以下は,次数(dn)が 1 より大きい場合(2 以上でないと クラスターはできない),2重ループによって,制御変数 i,j の組み合わせを つくり(たとえば,dn が 3 の場合,(i,j)=(1,2), (1,3), (2,3)の3つの組み合 わせができる),その i,j を使って 11~13 行目ではそれぞれの頂点の組み合わ せで隣接行列を参照しその値が 1 であれば,変数 cn を 1 増やしています(14 行 目)。最後に 19 行目で,cn の値を O(オー)列目に書き込んでいます。 なお,プログラム中,行末の「 _」(スペースとアンダースコア)は行継続文 字であり,ステートメントを行を改めて続ける場合に用います。 以上のプログラムによって,各頂点のクラスター数が求まれば,最大もちう るクラスター数を計算するなどし(これはExcel で簡単にできます),クラスタ ー係数を計算しましょう。 また,ネットワーク全体のクラスター係数(平均クラスター係数)は,すべ ての頂点のクラスター係数の平均(算術平均)とされます。図20 の場合は,0.7 となります。各頂点のクラスター係数が求まれば,この算出は簡単ですね。こ の値が十分に大きければ,ネットワークにクラスター性があることとなります。 その基準として,n 個の頂点にランダムに l 本の辺をつないだネットワーク(こ れをランダムネットワークあるいはランダムグラフといいます)のクラスター 係数を考えましょう。ランダムネットワークのクラスターは何の意図もなく(偏 りなく)形成されるものと考えられるので,これのクラスター係数と比較して

(26)

みます。 クラスター係数の期待値はその定義から,ある頂点が隣接する頂点同士の間 に辺が存在する割合(確率)となります。これは,ランダムネットワークの場 合,n や l(頂点や辺の数)が十分に大きいときは,任意の頂点間に辺が存在す る確率(これをp(n, l)とします)と一致するはずです。p(n, l)は,辺の数 l を, 辺が存在しうる頂点の組み合わせn (n−1) ∕ 2 で割れば求められるので,ランダム ネットワークのある頂点のクラスター係数の期待値Ecl (n, l) は以下ようになり ます。 ) 1 ( 2 ) , (   n n l l n Ecl 上式中の記号≅は,変数 n, l が十分に大きい場合に等しくなるという意味で用 いています。実際にコンピュータで辺をランダムに配置するシミュレーション を行なうと,n, l が十分に大きければ,クラスター係数はこの値とかなり一致し ます。なお,この式では頂点の特殊性を含んでいないので(ランダムネットワ ークでは各頂点に差はない),そのままネットワーク全体の平均クラスター係数 の期待値となります。あるネットワークの平均クラスター係数が,これと比較 して十分に大きい場合に,そのネットワークにクラスター性があると考えるこ とができるでしょう15 なお,上記の辺の存在確率p(n, l)は,辺が存在しうる頂点の組み合わせに対す る実際に辺が存在する数の比率であり,密度(density)と呼ばれているものと 同じものです。十分に大きなランダムネットワークの平均クラスター係数は密 度と一致すると考えられます。 (5) 中心性 中心性(centrality)とは,それぞれの頂点がネットワークにおいてどの程度 中心的であるか数値化したものです。中心性が高い頂点ほどネットワークにお いて重要な存在であると考えられます。 中心性は社会ネットワーク分析のための主要な特徴量で,これまで多くの中 心性の指標が提案されてきました。以下,ここでは主に計算の容易な中心性に ついてみていきます。 15 なお,ランダムネットワークのクラスター係数はかなり小さな値になることが知られて います。たとえば,n=100,000,000,l=20,000,000,000 のランダムネットワークは,1 億人が それぞれ平均200 人の知り合いをもっている場合に相当しますが,平均クラスター係数は 上式に基づけば10-6オーダになります。これは,現実の感覚と比べて著しく小さな数値と いえるでしょう。

(27)

・次数中心性 頂点viの次数中心性(degree centrality) とは,頂点viの次数のことです。次数中心性 では次数そのものを中心性の指標として用い ます。つまり,次数が大きい頂点の中心性が 高いと考えます。図7ではv2とv4の次数が3 で最も大きいので次数中心性も最も高くなり ます。 次数中心性はきわめて単純な指標であり, 隣接する頂点を同質と考えてその数をカウントしているだけですが,隣接する 頂点のもつ中心性を勘案し,それらを再帰的に反映した中心性の指標もいくつ か提案されています。このような指標に,固有ベクトル中心性(eigenvector centrality)や検索エンジン Google をはじめとする Web ページ評価の指標でも あるページランク(PageRank)などがあります。いずれも Excel では算出困難 なので分析ツールなどで必要に応じて計算してみましょう。 ・近接中心性 頂点viの近接中心性(closeness centrality)とは,viと他のすべての頂点との 距離の合計の逆数であり,他の頂点とどのくらい近いかを示しています16。距離 の合計が小さいほど他の頂点と近い(近接している)ことを意味していますか ら,その逆数である中心性としての指標は高くなります。 頂点数を n とすると,viの近接中心性 Cciは以下のようになります。式中 dij は,vi vjの距離です。

   n i j j ij i d Cc , 1 1 なお,dijの和を求める式のj≠iは,ここでは単純グラフを扱うためループを考 える必要がなく同じ頂点間の距離diiが0 となるためなくてもかまいません。 距離行列がすでに求められていれば,近接中心性の計算は Excel で簡単にで きます。各自考えてみてください。以下の図23 に,図7のネットワークの場合 の計算結果を示します。近接中心性の上位1項目(最大値)のセルの書式を「条 件付き書式」で強調しています。 16 場合によっては,距離の合計の逆数ではなく,距離の平均の逆数が採用されることもあ ります。しかし,その場合でも頂点の中心性の順位は当然ながらそのままです。 図7(再掲)

(28)

図23 近接中心性 また,ある頂点の最も離れた頂点までの距離,すなわち距離の最大値をその 頂点の離心数(eccentricity)といい,その逆数を離心中心性(eccentricity centrality) といいます。離心中心性は最も遠い頂点でもどの程度近いかを示しています。 近接中心性や離心中心性のような距離に基づく中心性はしばしば利用されます。 ・その他の中心性 以上,次数中心性をはじめとする頂点に関わる指標に基づく中心性と,近接 中心性など頂点間の距離に基づく中心性をみてきました。もちろん,これら以 外にも多くの中心性の指標が提案されています。 たとえば,媒介中心性(betweenness centrality)は,ある頂点が,それ以外 の頂点間の最短経路上にどの程度位置するかを示した指標です。媒介中心性の 高い頂点は他の頂点間の何らかのやりとり(情報かもしれないし物質かもしれ ない)を媒介する(仲介する)可能性が高いと考えられます。同様の指標に情 報中心性(information centrality)やランダムウォーク中心性(random walk betweenness centrality)などがあります。 しかし,これらの中心性の計算は多くの場合 Excel のみでは実現不可能であ りVBA などのプログラミングが必要となります。また,これらは,あまり考え ずにつくると計算量が爆発してしまう17場合もあるので,効率のよいアルゴリズ ムが必要とされることもあります。また,Excel+VBA 自体の計算効率の低さ が問題となることもあるでしょう。したがって,これらの指標は,次に紹介す るような専用の分析ツールで計算することをおすすめします。 17 「計算量が爆発する」とは,問題がある程度大きくなる(たとえば頂点や辺の数がある 程度大きくなる)と有用な時間内に計算を終えることができなくなる現象のことです。

(29)

5.ネットワーク分析用

Excel テンプレート NodeXL

社会ネットワーク分析のためのツールは,今日いろいろと提供されつつあり ます。代表的なものとして,Pajek や UCINET のようなネットワーク分析用の 専用ソフトウェアや統計ソフトR の sna パッケージなどがあります。これらの ツールは今日広く利用されるようになりつつます。これらのツール自体の日本 語化は,本稿執筆時点では,完全にはなされていませんが,日本語の解説書や 翻訳書もいくつか出版されています18 ここでは,NodeXL という Excel のテンプレートとして提供されているネッ トワーク分析ツールを利用して,ネットワークの可視化やいくつかの特徴量の 計算などを行なってみましょう。Excel テンプレートなので,Excel を使ってい る人にとっては比較的習得しやすく,また Excel で処理したデータを利用した り,結果をExcel でさらに分析したりすることも容易です。なお,NodeXL は, マイクロソフトの研究者やワシントン大学,コーネル大学,メリーランド大学 などの研究者によって開発されたオープンソースのソフトウェアです。 NodeXL はマイクロソフトのオープンソース用ウェブサイトである CodePlex にあるNodeXL のホームページ(http://nodexl.codeplex.com/)からダウンロー ドすることができます。また,そのホームページには多くのドキュメントもア ップされていて,最近では書籍も出版されています19。ここでは,その一部を簡 単に使ってみましょう。NodeXL による本格的な社会ネットワーク分析は別の 機会にゆずりたいと思います。 (1) NodeXL 超入門 ・起動 すでにNodeXL がインストールされている場合は,[スタート]→[すべての プログラム]→[Microsoft NodeXL]→[NodeXL Excel Template]で NodeXL のテンプレートを選択しましょう20。以下のような NodeXL タブがリボンに追 加され,さらに図24 のようなブック(左)とグラフ表示ウィンドウ(右)が開 きます。 18 Nooy (2005)の邦訳や鈴木(2009)など。 19 Hansen et al. (2011). 本稿執筆時点では日本語訳はなされていないようです。 20 NodeXL を個人のパソコンなどにインストールする場合は,該当する説明をよく読んで, 注意深く行なってください。またその結果については自己責任でお願いします。

(30)

図24 NodeXL

NodeXL を本格的に使いたい人は,NodeXL のホームページに NodeXL Documentation としてアップされている NodeXL チュートリアル(NodeXL Tutorial;http://casci.umd.edu/images/4/46/NodeXL_tutorial_draft.pdf;英文) を読みながら使ってみることが最も手っ取り早いと思います。以下,その中か らいくつかをごく簡単に説明します。

・データの入力:

NodeXL のデータ入力は,基本的には辺リスト(edge list)を Edges ワーク シートに入力します。辺リストは頂点のペアです。チュートリアルの1)の Data entry のように,あなたの知っている友達関係を入れてみましょう(名前は仮名 でいいです)。 データをある程度入力したら,グラフを表示してみましょう。グラフウィン ドウの左上にある[Show Graph]ボタンを押しましょう。グラフのレイアウト は自動的になされます。 ・特徴量の計算 チュートリアルの 5)にしたがって,Kite_Network.xlsx を該当のホームペー ジ(http://casci.umd.edu/NodeXL_Teaching)からダウンロードし,さまざま な特徴量を計算してみましょう。頂点に関する中心性,ネットワーク全体の指 標などさまざまな特徴量が計算されます。これまで取り上げなかった,媒介中 心性などの指標も計算されます。特徴量の計算は,NodeXL タブの[Graph Metrics]ボタンを押し,ダイアログボックスで必要な特徴量をチェックし

(31)

[Compute Metrics]ボタンを押すと,該当するワークシート(たとえば頂点に関 わる特徴量は Vertices シート)に示されます。詳しくはチュートリアルを参照 しながら試してみてください。 ・辺リストへの変換 NodeXL はさまざまなデータ形式を読み取ることができますが,辺リスト形 式が基本です。この稿で用いた頂点リストのデータと辺リストの間の変換を考 えてみましょう。以下に,頂点リストから辺リストへ変換するためのワークシ ートとVBA プログラムを示します。プログラムは,これまでみてきたステート メントの範囲で記述されています。あまり難しくないと思いますので,各自解 読してみてください。 図25 頂点リストから辺リストへの変換

(32)

4.おわりに

以上,社会ネットワーク分析の基本特徴量の計算を中心に入門的な部分をみ てきました。今日では超大規模な社会ネットワークの分析も行なわれつつあり ます。たとえば,インターネット上のSNS やブログでは最大数千万あるいは数 億の主体(頂点)を持つ社会ネットワークが形成されています。また,これら のデータ(の一部)は場合によっては比較的容易に入手することができ21,近年 では盛んに分析されつつあります。 この稿の最後で扱った NodeXL は,Excel テンプレートという実装方法から 考えて,超大規模なデータを扱うことは困難かもしれませんが(そもそも特徴 量によってはどんなツールを使っても計算量が爆発するものがあります),数千 くらいの頂点数であれば問題なく扱えるようです。 最後に,この稿をきっかけとして,みなさんに社会ネットワーク分析に興味 を持っていただければ幸いです。

参考文献

Nooy, W. de., Mrvar A. and Batagelj V. (2005), Exploratory Social Network Analysis with Pajek, Cambridge University Press. (安田雪監訳『Pajek を活用した社会ネットワーク分析』東京電機大学出版局,2009。)

Hansen, D. L., Schneiderman, B. and Smith, M. A. (2011), Analyzing Social Media Networks with NodeXL: Insights from a Connected World, Morgan Kaufmann. 今野紀雄,町田拓也(2008)『図解入門よくわかる複雑ネットワーク─シミュ レーションで見るモデルの性質─』秀和システム。 増田直紀, 今野紀雄(2006)『「複雑ネットワーク」とは何か─複雑な関係を読 み解く新しいアプローチ─』講談社。 増田直紀, 今野紀雄(2010)『複雑ネットワーク─基礎から応用まで─』近代 科学社。 鈴木努(2009)『ネットワーク分析(R で学ぶデータサイエンス,金明哲編集; 8)』共立出版。 「ウィキペディア─フリー百科事典」(http://ja.wikipedia.org/wiki/)項目:「複 雑ネットワーク」。

21 たとえば,NodeXL タグの Import ボタンの中に Twitter や Flickr Tag からデータを収

(33)

練習問題

問題1(架空のクラスのネットワーク) 以下は,架空のある学校のクラスの お互い親友と認めている関係のネットワークを示しています。 1 2 4 2 1 3 3 2 4 4 1 3 5 5 4 6 7 6 5 7 5 8 9 8 7 9 9 7 8 データの形式は,本文でいう頂点リスト(隣接リスト)形式で,各行の最初 の整数が頂点名,残りの整数がその頂点に隣接しているいくつかの頂点名です。 それぞれの頂点の整数の間は半角スペースで区切られています。 このデータを利用して以下の作業をしましょう。 (1) このネットワークを図に書いてみましょう。図形描画機能を使いましょう。 (2) clnet.txt を Excel のデータ(頂点リスト)に変換しましょう。 (3) (2)に隣接行列を付け加えましょう。 (4) 各頂点の次数,距離行列と平均距離,近接中心性を求めましょう。ネットワ ークの直径と各頂点の離心中心性も求めましょう。 (5) 各頂点のクラスター係数とネットワークの平均クラスター係数を求めまし ょう。ネットワークの密度も求めましょう。 (6) 頂点リストから辺リストをつくり,NodeXL に入力し(コピー&ペーストが 最も簡単),ネットワークを可視化しましょう。 (7) NodeXL で各種特徴量を計算しましょう。(1)~(4)の結果と一致することを 確認しましょう。NodeXL が示す中心性(媒介中心性や固有ベクトル中心性 など)も含めて,すべての特徴量をわかりやすく示しましょう。それぞれの 中心性で中心と判断される頂点も示しましょう。 (本稿は,平成21 年度和歌山大学経済学部研修専念制度に基づく成果の一部を利用しています。)

(34)

参照

関連したドキュメント

(※)Microsoft Edge については、2020 年 1 月 15 日以降に Microsoft 社が提供しているメジャーバージョンが 79 以降の Microsoft Edge を対象としています。2020 年 1

弊社専用ダイヤルもしくは、お買い上げの販 売会社にご連絡ください。( ☞裏表紙 ) 特定コンセント

関係会社の投融資の評価の際には、会社は業績が悪化

 当社の連結子会社である株式会社 GSユアサは、トルコ共和国にある持分法適用関連会社である Inci GS Yuasa Aku Sanayi ve Ticaret

ダイダン株式会社 北陸支店 野菜の必要性とおいしい食べ方 酒井工業株式会社 歯と口腔の健康について 米沢電気工事株式会社

析の視角について付言しておくことが必要であろう︒各国の状況に対する比較法的視点からの分析は︑直ちに国際法

 千葉 春希 家賃分布の要因についての分析  冨田 祥吾 家賃分布の要因についての分析  村田 瑞希 家賃相場と生活環境の関係性  安部 俊貴

田中さんは、インターンを2つされていて、1つが大阪 にある CRAZY WEDDING