Microsoft Word - Ⅲ表紙社会ネット

(1)

Excel による社会ネットワーク分析Ⅰ

─ネットワークの基本特徴量─

和歌山大学経済学部牧野真也 2011 年 6 月 30 日 2012 年 4 月 7 日，2015 年 2 月 7 日修正

(2)

(3)

Excel による社会ネットワーク分析Ⅰ

ネットワークの基本特徴量

2011 年 6 月 30 日牧野真也 2012 年 4 月 7 日，2015 年 2 月 7 日修正

１．はじめに─ネットワークとは

今日の社会科学では，社会ネットワーク分析というネットワークの概念を用いた分析が，統計学を用いた分析と並んで一般的なものになりつつあります。ここで，ネットワークとは，複数の（多くの）主体間の関係をモデル化（抽象化）したものです。ここでいう主体とは社会科学の分野では，人間や組織などの社会的主体が想定されます。主体間の関係には，主体同士の相互作用，影響，つながりなどがあります。一般にネットワークは，図１のように示されます。図式的には主体を点（丸）で，関係を線で表わします。このように，主体と関係（点と線）のみに着目し，他のもろもろのことを捨て去って分析を行なうところが社会ネットワーク分析の大きな特徴といえるでしょう。また，社会ネットワーク分析では，ネットワークの構造にしたがってさまざまな分析がなされます。具体的には，ネットワークの構造に基づく特徴量（metric）を計算したり，ネットワークをさまざまな側面から可視化1_{したりして分析されます。} ここでは，Excel を用いてそれらの一部を実際に計算し，ネットワーク分析に対する理解を深めます。さらに，NodeXL という無料で利用できるツール（Excel のテンプレート）を用いて，複雑な計算やネットワークの可視化も行ないます。 1_{可視化（visualization）とは，直接見ることができなかったり，直接見てもわかりにくか} ったりする現象や事象を，図などの見える形やわかりやすい形で示すことです。図１ネットワークの図による表現

(4)

２．複雑ネットワーク

1990 年代後半以降，ネットワークの研究は大きく進み，今日では現実の複雑なネットワーク（複雑ネットワークと呼ばれます）がもついくつかの性質が明らかになりつつあります。その中で，とりわけ注目されている複雑ネットワークの特性としてスモールワールド性，クラスター性，スケールフリー性をあげることができます2_。前稿「Excel による社会シミュレーションⅠ─セル・オートマトン」では，セル・オートマトンによる社会シミュレーションについてみました。それは，あらゆる主体（セル）が一定数（決まった数）の近傍の主体とのみ関係するモデルでした。ネットワークとして図示すれば，たとえば２次元セル・オートマトン（ムーア近傍：近傍数 8）は図２のようになるでしょう。もちろん，このモデルは，社会のある重要な側面（たとえば，近くの主体に強い影響を受ける）を表わしていると考えられるでしょう。しかし，実際の社会ネットワークでは，近くだけではなく遠くの主体と何らかの関係を持つことが少なからずあり，このことが重大な影響を及ぼすこともあります。また，あらゆる主体が一定数の主体と関係しているのではなく，実際には多くの主体と関係している主体もあればそうでない主体もあります。セル・オートマトンでは現実のこのような特性を捨象する（捨て去る）ことによって特定のシミュレーションや分析を可能にしています。一方，複雑ネットワークでは，実際のネットワークがもつこれらの特性を重要なものと考えます。以下，複雑ネットワークがもつ３つの特性（スモールワールド性，クラスター性，スケールフリー性）について簡単にみてみます。 (1) スモールワールド性スモールワールド性とは，社会ネットワークが大規模であっても，それぞれの主体間の距離は相当に小さいという性質です。少数の主体を介するだけで他 2_{これらの特性が意味する範囲は研究者によって少し違いますが，この稿ではウィキペディ} ア項目「複雑ネットワーク」に準じました。図２セル・オートマトンのネットワーク

(5)

の多数の主体とつながります。このことは，アメリカの心理学者ミルグラム（S. Milgram）が 1967 年に行なった実験で示して以来，さまざまに採りあげられてきました。ミルグラムの実験は，米国内の遠くの見知らぬ相手へ手紙を届けるというものであり，その際，知り合いのみを次々にリレーして届けるというものです。この実験の結果，平均して 6 人の知り合いを介すれば相手に届くことが示されました。この 6 人という数は直感に比べて非常に小さく感じられるインパクトのあるものでした。以降このことは「6 次の隔たり」と呼ばれ，世界は思いのほか小さい（small world）のでは，と考えられるようになりました。 1990 年代後半には，ワッツ（D. J. Watts）とストロガッツ（S. H. Strogatz）による「スモールワールド実験」が行なわれました。この実験は，ミルグラムの実験と同様のもので，電子メールを用いて，ファーストネームで呼び合える関係の人にメッセージを送ることを繰り返し，目的とする人物まで届けるというものです。この結果もまた 6 次の隔たりを支持するものでした。また，この実験では，ミルグラムの実験と比べて参加者がそれなりに多かったため，実際に到達したメールも多く，そこで得られたデータをもとにさまざまな分析がなされました。その結果，メールを中継する送り先の多くは，家族や職場の近い人でしたが，一部はそうではない遠くの人に送られていました。そして，この「遠い関係」がスモールワールド性に大きく関係していることが示されました。 (2) クラスター性クラスター性とは，クラスターと呼ばれる主体間の密な関係が社会ネットワークに多くみられるという性質です。ここでクラスターとは，図３のような三角形を構成する主体間の関係のことで3_{，たとえば，あ} る人の知り合い同士もまた知り合いであるという状況があげられます。図３は，たとえば，a さんと b さん・c さんが知り合いのときに b さんと c さんも知り合いであるような状況と解釈できます。ワッツらは，現実のネットワークにおいては，このクラスター性（が高い）という特徴があることを指摘しました。詳しくは後述しますが，主体間をランダムにつないだネットワークでは，クラスター性はかなり低くなります。たとえば，1 億人がそれぞれ 100 人の知り合いをもっている場合，ある１人の知り合い同士が知り合いである数（つまりクラスターを形成する数）の期待値は約 0.01 となります。これは，100 人それぞれのネットワークについて調べて，ようやく 1 組のクラスターが期待できるということであり，私たちの実感と比べ 3_{場合によっては四角形を構成する関係を含むこともあります。} 図３クラスター

(6)

て著しく少なく感じます。現実には，自分の知り合い同士がまた知り合いであることは相当に多くあることであり，普通のことともいえます。 (3) ワッツ＝ストロガッツモデルここまでみてきた，スモールワールド性やクラスター性4_を示すネットワークの構造とはどのようなものでしょうか。ワッツとストロガッツはそのモデルを提案しました。これは，ワッツ＝ストロガッツモデルあるいはスモールワールドモデルとよばれます。それは，近隣のみと関係するネットワーク（図２のセル・オートマトンのようなネットワーク）をベースにその一部（少数）の関係をランダムにつなぎ替えたモデルです（図４）5_{。このつなぎ替えをリワ} イヤリング（rewiring）といいます。２次元セル・オートマトンのような構造は格子と呼ばれるもので，クラスターは多いのですが，主体間の距離は小さくありません。たとえば，100×100 の格子の場合端から端までの距離は99 となり，6 次の隔たりどころではありません。しかし，そこに少量のリワイヤリングを施すと，距離は圧倒的に小さくなることが示されました。一方，リワイヤリングは適度に少なく行なわれる必要があります。リワイヤリングしすぎると，ランダムネットワークになってしまい。(2)でみたようにクラスターが少なくなってしまいます。ワッツとストロガッツの研究に触発されて，1990 年代末あたりから複雑ネットワークの研究は盛んになりました。 (4) スケールフリー性スケールフリー性とは，主体がもっている関係の数は，主体によって大きく異なるという性質です。図５は（執筆当時）国内最大のSNS であるミクシィの 4_{これら 2 つをあわせて，スモールワールド性と呼ぶこともあります。} 5_{ワッツらは１次元格子の円環で示しましたが，図４では２次元格子を示しています。これ} らは本質的には何ら違いはありません。図４ワッツ＝ストロガッツモデル

(7)

マイミク関係（相互に認め合った友達関係のようなもの）を，専用の可視化ソフト MixiGraph によって示したものです。図５から明らかなように，ミクシィ のメンバーの多くは1 人や 2 人といった少ないマイミクしかもっていませんが，一部のメンバーは何十人，あるいは場合によっては百人を超える数（1 人がもつことができるマイミクは運用上最大で千人）のマイミクをもっています。このように関係の数には主体による大きな較差があります。特に多くの関係を持っている主体はしばしばハブと呼ばれます。図５ MixiGraph によるマイミクのネットワーク（出典http://sg.fmp.jp/mixiGraph/）この現象は，社会ネットワークをはじめネットワーク一般に広く見らます6_。各主体が関係する主体の数の分布をみると，図６のようなベキ分布になるとこがわかっています7_{。このベキ分布は，都市の人口，商品の売り上げ，人々の年} 収や資産など実に幅広くみられる分布でもあります。一般によく知られている正規分布よりも多くみられるかもしれません。では，なぜ，このような分布が形成されるのでしょうか。このことは，前に 6_{インターネットや航空ネットワークなどでもよく見られます。航空路の多く集中する空港} はハブ空港と呼ばれます。 7_{図６は，一般的な分布（確率分布）ではありませんが，同様にベキ分布となります。}

(8)

採り上げたワッツ＝ストロガッツモデルでは，説明できません。そこで，バラバシ（A-L. Barabási）とアルバート（R. Albert）は，関係を多くもつ主体ほどより高い確率で新たな関係を構築するという優先的選択が，一部の主体に関係を集中させ，ハブをつくり出し，スケールフリー性をもたらすということを，モデル（バラバシ＝アルバートモデル）を用いて説明しました。優先的選択は，多くもつものはより多くもつようになるということであり，格差を拡大します。大都市への人口集中や，売れる商品がより売れるという現象（経済学でいうバンドワゴン効果）に対しても，優先的選択による説明が可能でしょう。図６ベキ分布（日本の都市の人口，データ：ウィキペディア項目「日本の市の人口順位」）以上みてきた複雑ネットワークの特性は，今日の社会ネットワークを特徴付ける重要な性質であることは間違いありません。しかし，これらの特性は，確かによくみられるものですが，全ての社会ネットワークにおいて必ずみられるというものではないことに注意しましょう。

(9)

３．ネットワークとグラフ

(1) グラフ理論すでにみたように，ネットワークは点とそれらを結ぶ線の集合として扱うことができます。グラフ理論という数学の分野では，このような構造をグラフ（graph）と呼んで研究を進めてきています。この稿ではネットワークとグラフを同じ意味で用います。グラフ理論では，一般的に点を頂点（vertex；複数形が vertices であることに注意）と呼び，線を辺（edge）と呼び8_{，グラフを頂点の集合と辺の集合（の} 組）と考えます。グラフを G，頂点の集合を V，辺の集合を E とすると，図７ のグラフ G は，たとえば以下のように表わすことができます。つまり，左の数 式と右の図は同じグラフを表わしています。 )} , ( ), , ( ), , ( ), , ( ), , {( } , , , , { ) , ( 5 2 4 3 4 2 3 2 2 1 5 4 3 2 1 v v v v v v v v v v E v v v v v V E V G    数式中，{a, b, c,…}は集合を示し，(x, y,…)は組（tuple）を示します。組は，集合と同様に複数の値からなりますが，集合と違って順序や重複に意味をもたせたもので，高校までの数学でいうとベクトルの成分表示や平面上や空間上の座標がこれに該当します。そして，それぞれの辺は異なる２つの頂点の組で示すことができます。たとえばv1とv2を結ぶ辺は，組(v1, v2)で示されます。また，左側の式からも明らかなように，グラフでは頂点および２つの頂点間の関係のみが意味を持っています。したがって，右図はそのグラフの可視化の一例であり，これと同じグラフの図はいくらでも示すことができます。図８にそのいくつか示します。したがって，目的に応じて適切な図を描く（選ぶ）こと自体が，ネットワークの理解を深めることになります。また，これらの図７・８で示した図形をトポロジカルに等しいということがあります。 8_{高校までの幾何でも図形において頂点・辺という表現を用いているので，この稿でもこの} 表現を用います。また，後に用いる（あるいは紹介する）ネットワーク分析用のツール類の多くもグラフ理論の用語の英語表現を用いています（日本語版のツールは今のところないと思われます）。以下，重要な用語には一般的な英語表現も示します。図７グラフ

(10)

図８図７と同一のグラフの別表現 (2) さまざまなグラフ・有向グラフ・無向グラフグラフには，辺に方向性をもたせた図９のような有向グラフ（directed graph）と方向性をもたせない無向グラフ（undirected graph）があります。この稿では無向グラフのみを扱います。無向グラフでは，２つの頂点の間に辺がある場合，双方向の有向辺（向きのある辺）２本があるものと一般的に解釈されます。たとえば友達関係はお互いに認め合って初めて友達になると考えれば（たとえばミクシィのマイミクや Facebook の友達では明示的にそのような手続きが必要です），a さんと b さんが友達という場合「a さん─<友達>→b さん」「b さん─< 友達>→a さん」が同時に存在すると考えられます。このような関係を対称的（symmetric）といいます。一方，恋愛感情などでは，「a さん─<好き>→b さん」は必ずしも「b さん─< 好き>→a さん」を意味しませんから対称的ではありません。したがって，有向グラフの場合は，辺(v1, v2)と辺(v2, v1)は別の辺を意味します。ここでは無向グラフのみを扱いますから，これらの区別はないと考えることにします9_。・単純グラフこの稿では，単純グラフ（simple graph）を中心に扱います。単純グラフでは，図 10 で示すような，ループと呼ばれる１つの頂点の自分と自分の間を結ぶ辺や，多重辺と呼ばれる同一の２つの頂点間を結ぶ複数の辺は 9_{要素数 2 の組を特に対（pair）と呼び，このような順序に意味がない対を非順序対と呼ん} で別の記号で表わすことがありますが，この稿では無向グラフの場合，特に断わらない限り辺の組を非順序対と考えます。図９有向グラフ図10 ループと多重辺

(11)

存在できません。なお，(1)で説明したグラフは単純グラフを前提にしているといえます。なぜなら，辺は異なる２頂点の組の集合であり，また辺の集合が重複を許さない（集合では重複に意味がない）ため，ループや多重辺は存在できないからです。・連結グラフ任意の頂点からそれとは別の任意の頂点へ辺をたどって到達できるグラフを連結グラフ（connected graph）といい，到達できないグラフを非連結グラフ（disconnected graph）といいます。図 11 のように，すべてつながっているグラフが連結グラフ，どこかで切れている（あるいは複数の連結グラフがある）グラフが非連結グラフです。なお，図12 の孤立している１つの頂点もグラフと考えます（辺の集合Eがφ：空集合であるグラフ）。この稿では連結グラフを中心に扱います。図11 連結グラフ図 12 非連結グラフ (3) 隣接行列いまグラフの頂点が n 個あるとします。そのとき，頂点 viから頂点 vjへの辺が存在するとき行列の (i, j) 成分を 1 とし，存在しないとき (i, j) 成分を 0 とするような，n×n行列を用いて，グラフを表わすことができます。たとえば，図７のグラフは次の行列Aのように書けます。                  0 1 0 0 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 1 0 0 0 1 0 A この行列Aはその(i, j)成分によってviとvjが隣り合っているかどうかを示しているとみることができるので，隣接行列（adjacency matrix）と呼ばれます。図７（再掲）

(12)

無向グラフの場合は必ず双方向で隣り合っているので（対称的なので），Aは対称行列（行と列を入れ替えても同じ行列）となります（もちろん，有向グラフの場合は対称行列になるとはかぎりません）。隣接行列 A は図７のグラフを余すところなく表わしています。さらに，集合や組でグラフを表わす場合と違って，さまざまな操作が行列の演算により可能となります。このことは非常に便利なので隣接行列はしばしば利用されます。

(13)

４．ネットワークの基本特徴量─Excel による計算

ここでは，ネットワークの基本的な特徴量について紹介し，実際にExcel で計算してみます。基本的かつ計算が簡単なものにとどめたいと思います。以下では，例として図７のネットワーク（グラフ）を多く用います。 (1) ネットワークのExcel での表現まず，対象のネットワークを Excel で表わす必要があります。その方法はいくつか考えられますが，以下に説明する３つの方法が代表的でしょう。ネットワーク分析専用のツールでもこれらの形式を扱っている場合が多いと思います。なお前述したように，ここでは，無向グラフ，単純グラフ，連結グラフのみを扱います。 a. 辺のリストを示す（辺リスト）辺が存在する２頂点のリストを示します。辺の集合 E をそのまま表わすイメージです。頂点の情報はそのリストの中に含まれると考えます（連結グラフであれば辺の情報は全頂点を含みます）。以下にExcel での表現を示します。この方法では，辺の数と行数（ラベル除く）が一致します。この表現方法を「辺リスト」と呼ぶことにしましょう。なお，頂点を示す（区別する）値は数値でも文字列でもかまいませんが，ここでは後の処理を容易にするために，1, 2, 3,… の整数を用います。 A B C D 1 頂点(1) 頂点(2) 2 1 2 3 2 3 4 2 4 5 3 4 6 4 5 7 図７（再掲）

(14)

b. 頂点ごとに，その頂点と隣接している頂点のリストを示す（頂点リスト，または隣接リスト）それぞれの頂点ごとに，その頂点から１つの辺でつながっている別の頂点のリストを示します。たとえば以下のようにします。この表現方法を「頂点リスト」と呼ぶことにします（頂点とそれに隣接する頂点を示しているので「隣接リスト」と呼ばれることが多いですが，本稿では「辺リスト」との対照のため以下頂点リストと呼びます）。 A B C D E F 1 頂点頂点(1) 頂点(2) 頂点(3) 頂点(4) 2 1 2 3 2 1 3 4 4 3 2 4 5 4 2 3 5 6 5 4 7 この表では，A 列に全頂点が並び，各行の B～E 列に A 列の頂点とつながっている頂点が示されます。辺でつながる頂点の数は最大で「頂点数－１」なので，その分の列を（ラベルをつけて）確保しています。この方法では，頂点の数と行数（ラベル除く）が一致します。多くの場合，頂点の数は辺の数よりも少ないので（頂点の数がn の場合，辺の数は最大 n (n－1)/2 となります），行数は辺 リストよりも短くなることが多いでしょう。なお，この表には辺の反対側からの頂点も示しています。無向グラフの場合は，データとして冗長ですが，これは処理を容易にするためです。反対側を省略して処理することや自動的に追加することも可能でしょう。 c. 隣接行列を示す隣接行列を示します。行列は Excel の表でそのまま表現できます（行，列の概念もそのままです）。隣接行列は，無向グラフの場合，対称行列となるので，一方のみ（たとえば右上の三角形の領域のみ）を書いて，反対側はコピーしたり参照したりすることもできるでしょう。

(15)

A B C D E F G 1 頂点 1 2 3 4 5 2 1 0 1 0 0 0 3 2 1 0 1 1 0 4 3 0 1 0 1 0 5 4 0 1 1 0 1 6 5 0 0 0 1 0 7 以上の３つの表現方法を紹介しましたが，それぞれ一長一短といえるでしょう。ここでは，b の頂点リストの方法を基本的に用いて，必要に応じて a の辺リストや c の隣接行列に変換することとします。なぜなら，ここで扱うネットワークの特徴量の多くは頂点に関わるものが多く，b の頂点リストは頂点ごとに整理された形式なので，処理が容易なことが多いからです。では，b の頂点リストの形式で頂点と対応する頂点のリストを入力し，そのワークシートの適当なところに隣接行列をつくってみましょう。セル H2 に適切な式を入れればあとはコピーするだけで隣接行列（セル範囲 H2:L6）をつくれます。 A B C D E F G H I J K L 1 頂点頂点1 頂点2 頂点3 頂点4 頂点 1 2 3 4 5 2 1 2 1 0 1 0 0 0 3 2 1 3 4 2 1 0 1 1 0 4 3 2 4 3 0 1 0 1 0 5 4 2 3 5 4 0 1 1 0 1 6 5 4 5 0 0 0 1 0 7 H2 に入力する式はいろいろ考えられるでしょう。ここでは，最も簡単な方法として関数 COUNTIF(範囲,検索条件) の利用をあげておきましょう。この関数は「範囲」から「検索条件」(検索条件に数値や文字列，セル番地を指定した場合はその値に一致するもの)を満たすセルの個数を返します。たとえば，上のワークシートで COUNTIF(B2:E2,1)は 0 を返し，COUNTIF(B2:E2,2)は 1 を返します。このことは，（頂点1 が）頂点 2 への辺をもっていることを意味します。ここで，検索条件の1 や 2 は隣接行列の 1 行目の値をそのまま利用できます。あとは各

(16)

自考えてみましょう。 (2) 次数頂点 vi からでている辺の数を vi の次数（degree）といいます。たとえば，図７では，頂点v1の次数は1，頂点v2の次数は3 となります。次数の計算は簡単です。隣接行列をつくっているのであれば，行方向（や列方向）の合計がその頂点の次数となります。頂点リストからも簡単につくれます。関数 COUNT(値…)は，引数にセル範囲を指定すれば，そのセル範囲中にある数値の個数が返されます。これを利用して簡単に頂点リストから次数を求めることができます。すべての頂点の次数を求めたら，それを合計してみましょう。全頂点の次数の和は，無向グラフの場合は必ず辺の数の２倍になります（このことは１つの辺には必ず２つの頂点がつながっていることから自明でしょう）。このことを握手の補題と呼びます。また，この例では頂点数が少ないのであまり意味はありませんが，頂点が多い場合は，それらの次数の分布（次数分布）をグラフ化してみましょう。分布のつくり方はいろいろありますが，最も簡単な方法は，次数を多い順に並べ，次数を目的変数（y），次数の順位を説明変数（x）としてグラフ化することです。 Excel の「並べ替え」や順位を求める関数 RANK(数値,範囲,[順序])を必要に応じて利用しましょう。スケールフリー性がある場合，その分布はベキ分布となり，y xa で近似できます。この式の両辺の対数をとれば，logylogxlogaとなるので，そのグラフは直線で近似でき，視覚的にも確認しやすくなります（図６参照）。近似は Excel のグラフの「近似曲線の追加」などを利用しましょう。なお「近似曲線の追加」では近似曲線だけでなく，近似式や重相関係数を追加して表示することもできます。 (3) 頂点間距離頂点間の最短距離を求めてみましょう。ネットワーク（グラフ）の最短距離を求める問題は応用範囲が広い問題です（たとえば，輸送経路の計画やカーナビの道順の決定，日程計画などで応用されます）。図７（再掲）図７（再掲）

(17)

ここでは，すべての辺の長さを 1 として最短距離を求めてみましょう。たとえば，図７の場合，頂点v1から v5までの経路はいくつかありますが，その最短経路はv1→v2→v4→v5であり，その距離は3 となります。他にも（後戻りしない経路としては）v1→v2→v3→v4→v5がありますが，その距離は 4 なので最短ではありません。以降一般に距離という場合は最短距離を意味することとします。 a. 隣接行列のべき乗による距離行列の作成このようなネットワークのすべての頂点間の最短距離を求める方法はいくつかあります。１つの方法として，隣接行列の積を繰り返し計算する（隣接行列のべき乗を計算する）方法があります。簡単にみてみましょう。まず，隣接行列A の 2 乗（AA=A2_{）を計算してみま} しょう。行列の積XY の(i, j)成分は，定義から X の i 行 目の行ベクトルと Y の j 列目の列ベクトルの内積とな ります（蛇足ながらX の行数と Y の列数が一致する場 合のみ，その積 XY が定義されます）。たとえば， A2 の(1,3)成分は，それぞれの成分の行ベクトルと列ベクトルの内積，すなわち，A の1 行目のベクトルを r1=(0, 1, 0, 0, 0) とし，3 列目のベクトルを c3=(0, 1, 0, 1, 0) とすると r1 ·c3となります。 この内積 r1 ·c3の計算結果は，0×0+1×1+0×0+0×1+0×0=1 となります。この計算式の第2 項が 1 となり生き残るのは，v1→v2の経路が存在し（r1の第2 成分が 1 である意味），かつ，v2→v3の経路が存在する（c3の第2 成分が 1 である意味）ためであり，それはv1→v2→v3の経路が存在していることを意味します。このような，どこかを経由するv1からv3への距離が2 の経路が 1 つ以上存在すればその成分の計算結果は1 以上になりますし，存在しなければ 0 となります。隣接行列の2 乗の結果 0 でない値になった成分には距離 2 の経路が存在していることになります。さらに隣接行列との積を計算する（A3_{, A}4_{…を計算する）} ことによって，距離3 の経路，距離 4 の経路…の存在が求められます。したがって，隣接行列のべき乗を2 乗，3 乗，4 乗…と計算していき，（対角成分以外の）その成分が初めて 0 でなくなるときのべき指数（何乗であるか）が，その成分に対応する頂点間の最短距離となります。この操作をすべての成分が 0 でなくなるまで繰り返せば，すべての頂点間の距離を示す行列（これを距離行列といいます）を得ることができます。                  0 1 0 0 0 1 0 1 1 0 0 1 0 1 0 0 1 1 0 1 0 0 0 1 0 A 図13 隣接行列

(18)

以上の操作を Excel で行なってみましょう。 Excel では行列の積を計算するための関数 MMULT(配列 1,配列 2) があります。「配列 1」，「配列 2」にそれぞれ行列をセル範囲で指定します。一方，この関数の式は配列数式として入力しなければなりません。その手順はいくつかありますが，まず基準となるセル（行列の1 行 1 列目）に「=MMULT(セル範囲 1，セル範囲 2)」の数式を入れ，その計算結果が表示される範囲（例の場合は5×5）をマウスドラッグなどで選択します。その後数式にマウスを移動し（F2 キーを押せばそうなります。数式バーをクリックしてもかまいません）Ctrl＋Shift＋Enter を押します。最初に，隣接行列で1 のところは最短距離 1 として，対角成分の 0 のところは最短距離 0 として確定し，残りの場所で 0 以外が現われたところを，その積の回数（べき指数）の距離として確定していきます。対角成分以外のすべてのセルが0 でなくなったらそれが距離行列となります。IF 関数などをうまく使って要領よく式を入れていけば，以下のようなワークシートは比較的簡単につくれると思います。図14 行列の積の計算

(19)

図 15 隣接行列のべき乗で距離行列を求めるワークシート b. ウォーシャル・フロイド法隣接行列による計算は Excel で処理しづらく，また効率があまりよくないので，これに代わる方法がいくつか提案されています。その中でウォーシャル・フロイド法は簡単なアルゴリズムであると同時に，すべての頂点間の最短距離を同時に求められ，また計算効率も悪くないので（全く工夫しなくても，計算量のオーダは頂点数の3 乗10_{）しばしば利用されます。} ウォーシャル・フロイド法のアルゴリズムは以下のようです。 ①距離行列D を初期化します。 ・同一頂点間の距離を0 にします。・隣接頂点間（辺が存在する頂点間）の距離を 1 にします。・その他の頂点間の距離を無限大にします。 ②すべての頂点 vk について，D のすべての成分 10_{たとえば，頂点数が 2 倍になれば計算量は 8 倍，3 倍になれば 27 倍という程度で増えて} いきます。これを効率が悪くないとは考えることは理解しがたいかもしれませんが，ネットワークの問題でしばしばみられる指数や階乗オーダの計算量に比べれば，かなり少ない増え方といえます。                            0 1 1 0 1 1 1 0 1 1 1 0 1 1 0 D 図16 距離行列初期値

(20)

dijに対して，dik+dkj<dijであればdij= dik+dkjとします。

①の結果，図16 の距離行列が最初にできます。②ではすべての頂点 vkについ

て，それを経由したvi，vj間の距離dik+dkjが現在の距離行列のdijで示されている

距離よりも小さければ（近ければ），D の内容（距離）をそれで置き換えます。 これは，きわめてシンプルでわかりやすいアルゴリズムといえるでしょう。

なお，このアルゴリズムは，Excel のみでは実現できないので，Excel VBA （Visual Basic for Applications）という Excel に付属する BASIC 風のプログラミング言語を用いる必要があります。VBA の概要については，前稿「Excel による社会シミュレーションⅠ─セル・オートマトン」をみてください。図17・18 に，ウォーシャル・フロイド法で距離行列を作成するワークシートとVBA のプログラム例をあげます。図17 のプログラム中，5・6 行目は，セル範囲 I3:M7 に準備されている初期値の表（の値）を計算対象のセル B3 以下にコピーしています。その際，∞は999 などの，この問題においてはあり得ないような大きな値を用いています。なお，前稿（前掲）で示したように，このセルのコピーは代入演算子「=」を用いて書くこともできます。距離行列が大規模である場合，初期のデータをあらかじめ手作業で準備するのは面倒ですから，距離行列としてまず隣接行列を用意しておいて，以下の図 18 のようなプログラムで初期化しましょう。

(21)

図17 ウォーシャル・フロイド法による距離行列の計算図18 プログラムによる距離行列の初期化図18 の 5 行目からの 2 重の For ループは，i が 1 から頂点数（vn）までの繰り返される中で j が 1 から頂点数まで繰り返されています。つまり， (i,j)=(1,1),(1,2),…,(1,vn),(2,1),(2,2),…,(2,vn),…,(vn,1),(vn,2),…,(vn,vn) のように繰り返されるので，Range("B3").Cells(i, j)は，すべての距離行列の要素をたどることになります。なお，Cells(行インデクス,列インデクス)は， Range(セル参照)のプロパティとして書くと，そのセル参照の左上を(1,1)とした相対的なインデクスで示すことができ，その結果，制御変数の初期値などで思い悩まなくてもよくなります。

7～9 行目の If <条件> Then <処理> End If は，<条件>を満たすとき Then 以下の行の<処理>を行なうという制御構造で，これによって<条件>の評価（計算）の結果によって処理をさせたりさせなかったりできます。<処理>はいくつ書いても（何行にわたって書いても）かまいません。<条件>には，比較演算子（=, <, >, <=, >=, <>11_{など）や論理演算子（And, Or, Not など）を組み合わせて書く}

(22)

ことができます12_{。7 行目では，}_{「i=j またはセル番地 B3 基点で i 行 j 列目の} 値＝1 （のどちらでも）ない場合」を意味し，隣接行列の対角上あるいはすでに 1 が入力されている場合（距離が 0 または 1 の場合）以外は，8 行目によって該当セルに 999（無限大を意味する）が記入されます。図17 のプログラムに戻って，8 行目以下は，ウォーシャル・フロイド法によるアルゴリズム通りの処理です。k が 1 から vn まで繰り返される中において，距離行列のすべてが参照され，k を介する i,j 間の距離を変数 d に代入し（11 行目），d が距離行列の i,j 間の距離より小さければ d で距離行列を置き換える（12・13 行目）というプログラムになっています。 c. 平均頂点間距離距離行列からネットワークの平均（頂点間）距離を計算してみましょう。これは，全ての２つ頂点間の距離の平均です。２つの頂点を選び出す組み合わせは，頂点の数をn とすると， 2 ) 1 ( 2   n n C n となるので，平均距離 L は，距離行 列をダブルカウントしないように右上半分の合計を計算し，２頂点の組み合わせで除することにより求められます。式で書くと，以下のようになります。dij は距離行列の(i, j)成分です。



     n j i ij d n n L 1 ) 1 ( 2 これを Excel で計算することは簡単でしょう。無向グラフの距離行列は対称であり，また，同じ頂点間の距離は 0 なので，距離行列をすべて合計すると距離の合計の２倍になります。したがって，これを2nC2すなわちn(n−1)で除して も，同じ結果となります。また，ネットワーク全体で，最も大きい頂点間距離をそのネットワークの直径（diameter）といいます。距離行列から直径を求めるのはきわめて簡単なので省略します。なお，ネットワークがスモールワールド性をもつことは，L∝log n であること で示されるといわれています。ここで，記号∝は n が十分大きければ比例する 12_{演算の優先順位は，おおむね算術演算＞比較演算＞論理演算の順です。算術演算の優先} 順位は数学とほぼ一致します（たとえば，*は+に優先）。よくわからない場合は数学と同様に()で括りましょう。なお，代入演算子と比較演算子の=は別の演算です。

(23)

ことを意味します。たとえば，n=1,000 のとき L=3，n=100,000,000 のとき L=8 になるような状況です。スモールワールド性があればネットワークが巨大になっても（頂点数がものすごく増えても），平均距離はほとんど大きくはなりません。しかし，このような検証は，nがさまざまな場合のデータが必要になるので，実際のネットワークで検証することは困難かもしれません13_。 (4) クラスター２．でみたように，クラスター（cluster）とは，図 19 のように３つの辺が形成する三角形のことです14_{。ある人の友達同士が友達であるような状} 況です。クラスターが多く集まっている部分は，たとえばコミュニティのような強固な人間関係が築かれている部分とみなされたりします。ここでは，ネットワーク中のクラスターを数えてみましょう。たとえば，図20 のネットワークにはv1-v2-v3，v1-v2-v4，v1-v3-v4，v2-v3-v4の４つのクラスターがあります。ある頂点がそれを頂点の１つとするクラスターをどの程度もっているかを表わす指標にクラスター係数（cluster coefficient）があります。ある頂点の次数をk（つまりk本の辺をもっている）とすると，その頂点がもつことができるクラスターの数は，それらの辺がつながっている頂点のうちの任意の２つの組み合わせですから，最大 2 ) 1 ( 2   k k C k 個のクラスターをもつことができます。そのうちいくつに実際に辺が存在しているか，つまりクラスターになっているかが，クラスター係数の定義です。頂点viが含まれるクラスター数をciとすると，viのクラスター係数Cliは以下のようになります。 ) 1 , 0 ( 0 ), 2 ( ) 1 ( 2      k Cl k k k c Cl i _i i 13_{２．で紹介したようなモデルによるシミュレーションの場合は，n を変えて計算すればよ} いので，容易に検証できます。 14_{四角形を含む場合もあるようですが，ここでは三角形のみとします。} 図20 クラスター数は？図19 クラスター

(24)

k =0,1 の場合は（連結グラフの場合 0 はありませんが），最大クラスター数が 0 になるので，その場合はクラスター係数を 0 と定義します。図 20 でクラスター係数を計算してみましょう。頂点 v4のクラスター係数は，v4の次数が 4 でクラスター数が3 ですから，2×3／4×3＝0.5 となります。では，クラスター係数をExcel で計算してみましょう。以下の図 21 のようなデータが準備されているとすると，クラスター数は，頂点リストの 2 頂点の組み合わせごと辺の存在を確認し数えればよいことになります。図21 クラスター係数のワークシート具体的には，頂点1 と辺でつながる頂点リスト 2, 3, 4 の組み合わせは，(2, 3), (2, 4), (3, 4)の 3 つです。それぞれの頂点の間に辺が存在するかどうかは，隣接行列の該当するセルをみるのが簡単でしょう。たとえば(2, 3)の間に辺があるかどうかは，隣接行列の(2, 3)成分が 1 であることから，「ある」ことがわかります。このような手続きを Excel のみで行なうのは困難と思われるので（不可能ではないかもしれませんが，ちょっとやる気はしないでしょう），VBA でプログラムを作ってみましょう。たとえば，以下のようなVBA プログラムが考えられるでしょう。

(25)

図22 クラスター係数を計算する VBA プログラムプログラム中 8 行目以下は，次数（dn）が 1 より大きい場合（2 以上でないとクラスターはできない），２重ループによって，制御変数 i，j の組み合わせをつくり（たとえば，dn が 3 の場合，(i,j)=(1,2), (1,3), (2,3)の３つの組み合わせができる），その i,j を使って 11～13 行目ではそれぞれの頂点の組み合わせで隣接行列を参照しその値が 1 であれば，変数 cn を 1 増やしています（14 行目）。最後に 19 行目で，cn の値を O（オー）列目に書き込んでいます。なお，プログラム中，行末の「 _」（スペースとアンダースコア）は行継続文字であり，ステートメントを行を改めて続ける場合に用います。以上のプログラムによって，各頂点のクラスター数が求まれば，最大もちうるクラスター数を計算するなどし（これはExcel で簡単にできます），クラスター係数を計算しましょう。また，ネットワーク全体のクラスター係数（平均クラスター係数）は，すべての頂点のクラスター係数の平均（算術平均）とされます。図20 の場合は，0.7 となります。各頂点のクラスター係数が求まれば，この算出は簡単ですね。この値が十分に大きければ，ネットワークにクラスター性があることとなります。その基準として，n 個の頂点にランダムに l 本の辺をつないだネットワーク（こ れをランダムネットワークあるいはランダムグラフといいます）のクラスター係数を考えましょう。ランダムネットワークのクラスターは何の意図もなく（偏りなく）形成されるものと考えられるので，これのクラスター係数と比較して

(26)

みます。クラスター係数の期待値はその定義から，ある頂点が隣接する頂点同士の間に辺が存在する割合（確率）となります。これは，ランダムネットワークの場合，n や l（頂点や辺の数）が十分に大きいときは，任意の頂点間に辺が存在す る確率（これをp(n, l)とします）と一致するはずです。p(n, l)は，辺の数 l を， 辺が存在しうる頂点の組み合わせn (n−1) ∕ 2 で割れば求められるので，ランダム ネットワークのある頂点のクラスター係数の期待値Ecl (n, l) は以下ようになり ます。 ) 1 ( 2 ) , (   n n l l n E_cl 上式中の記号≅は，変数 n, l が十分に大きい場合に等しくなるという意味で用 いています。実際にコンピュータで辺をランダムに配置するシミュレーションを行なうと，n, l が十分に大きければ，クラスター係数はこの値とかなり一致し ます。なお，この式では頂点の特殊性を含んでいないので（ランダムネットワークでは各頂点に差はない），そのままネットワーク全体の平均クラスター係数の期待値となります。あるネットワークの平均クラスター係数が，これと比較して十分に大きい場合に，そのネットワークにクラスター性があると考えることができるでしょう15_。なお，上記の辺の存在確率p(n, l)は，辺が存在しうる頂点の組み合わせに対す る実際に辺が存在する数の比率であり，密度（density）と呼ばれているものと同じものです。十分に大きなランダムネットワークの平均クラスター係数は密度と一致すると考えられます。 (5) 中心性中心性（centrality）とは，それぞれの頂点がネットワークにおいてどの程度中心的であるか数値化したものです。中心性が高い頂点ほどネットワークにおいて重要な存在であると考えられます。中心性は社会ネットワーク分析のための主要な特徴量で，これまで多くの中心性の指標が提案されてきました。以下，ここでは主に計算の容易な中心性についてみていきます。 15_{なお，ランダムネットワークのクラスター係数はかなり小さな値になることが知られて} います。たとえば，n=100,000,000，l=20,000,000,000 のランダムネットワークは，1 億人が それぞれ平均200 人の知り合いをもっている場合に相当しますが，平均クラスター係数は上式に基づけば10-6_{オーダになります。これは，現実の感覚と比べて著しく小さな数値と} いえるでしょう。

(27)

・次数中心性頂点viの次数中心性（degree centrality）とは，頂点viの次数のことです。次数中心性では次数そのものを中心性の指標として用います。つまり，次数が大きい頂点の中心性が高いと考えます。図７ではv2とv4の次数が3 で最も大きいので次数中心性も最も高くなります。次数中心性はきわめて単純な指標であり，隣接する頂点を同質と考えてその数をカウントしているだけですが，隣接する頂点のもつ中心性を勘案し，それらを再帰的に反映した中心性の指標もいくつか提案されています。このような指標に，固有ベクトル中心性（eigenvector centrality）や検索エンジン Google をはじめとする Web ページ評価の指標でもあるページランク（PageRank）などがあります。いずれも Excel では算出困難なので分析ツールなどで必要に応じて計算してみましょう。・近接中心性頂点viの近接中心性（closeness centrality）とは，viと他のすべての頂点との距離の合計の逆数であり，他の頂点とどのくらい近いかを示しています16_。距離の合計が小さいほど他の頂点と近い（近接している）ことを意味していますから，その逆数である中心性としての指標は高くなります。頂点数を n とすると，viの近接中心性 Cciは以下のようになります。式中 dij は，viと vjの距離です。



   _n i j j ij i d Cc , 1 1 なお，dijの和を求める式のj≠iは，ここでは単純グラフを扱うためループを考える必要がなく同じ頂点間の距離diiが0 となるためなくてもかまいません。距離行列がすでに求められていれば，近接中心性の計算は Excel で簡単にできます。各自考えてみてください。以下の図23 に，図７のネットワークの場合の計算結果を示します。近接中心性の上位１項目（最大値）のセルの書式を「条件付き書式」で強調しています。 16_{場合によっては，距離の合計の逆数ではなく，距離の平均の逆数が採用されることもあ} ります。しかし，その場合でも頂点の中心性の順位は当然ながらそのままです。図７（再掲）

(28)

図23 近接中心性また，ある頂点の最も離れた頂点までの距離，すなわち距離の最大値をその頂点の離心数（eccentricity）といい，その逆数を離心中心性（eccentricity centrality）といいます。離心中心性は最も遠い頂点でもどの程度近いかを示しています。近接中心性や離心中心性のような距離に基づく中心性はしばしば利用されます。・その他の中心性以上，次数中心性をはじめとする頂点に関わる指標に基づく中心性と，近接中心性など頂点間の距離に基づく中心性をみてきました。もちろん，これら以外にも多くの中心性の指標が提案されています。たとえば，媒介中心性（betweenness centrality）は，ある頂点が，それ以外の頂点間の最短経路上にどの程度位置するかを示した指標です。媒介中心性の高い頂点は他の頂点間の何らかのやりとり（情報かもしれないし物質かもしれない）を媒介する（仲介する）可能性が高いと考えられます。同様の指標に情報中心性（information centrality）やランダムウォーク中心性（random walk betweenness centrality）などがあります。しかし，これらの中心性の計算は多くの場合 Excel のみでは実現不可能でありVBA などのプログラミングが必要となります。また，これらは，あまり考えずにつくると計算量が爆発してしまう17_{場合もあるので，効率のよいアルゴリズ} ムが必要とされることもあります。また，Excel＋VBA 自体の計算効率の低さが問題となることもあるでしょう。したがって，これらの指標は，次に紹介するような専用の分析ツールで計算することをおすすめします。 17_{「計算量が爆発する」とは，問題がある程度大きくなる（たとえば頂点や辺の数がある} 程度大きくなる）と有用な時間内に計算を終えることができなくなる現象のことです。

(29)

５．ネットワーク分析用

Excel テンプレート NodeXL

社会ネットワーク分析のためのツールは，今日いろいろと提供されつつあります。代表的なものとして，Pajek や UCINET のようなネットワーク分析用の専用ソフトウェアや統計ソフトR の sna パッケージなどがあります。これらのツールは今日広く利用されるようになりつつます。これらのツール自体の日本語化は，本稿執筆時点では，完全にはなされていませんが，日本語の解説書や翻訳書もいくつか出版されています18_。ここでは，NodeXL という Excel のテンプレートとして提供されているネットワーク分析ツールを利用して，ネットワークの可視化やいくつかの特徴量の計算などを行なってみましょう。Excel テンプレートなので，Excel を使っている人にとっては比較的習得しやすく，また Excel で処理したデータを利用したり，結果をExcel でさらに分析したりすることも容易です。なお，NodeXL は，マイクロソフトの研究者やワシントン大学，コーネル大学，メリーランド大学などの研究者によって開発されたオープンソースのソフトウェアです。 NodeXL はマイクロソフトのオープンソース用ウェブサイトである CodePlex にあるNodeXL のホームページ（http://nodexl.codeplex.com/）からダウンロードすることができます。また，そのホームページには多くのドキュメントもアップされていて，最近では書籍も出版されています19_{。ここでは，その一部を簡} 単に使ってみましょう。NodeXL による本格的な社会ネットワーク分析は別の機会にゆずりたいと思います。 (1) NodeXL 超入門・起動すでにNodeXL がインストールされている場合は，［スタート］→［すべてのプログラム］→［Microsoft NodeXL］→［NodeXL Excel Template］で NodeXL のテンプレートを選択しましょう20_{。以下のような} _{NodeXL タブがリボンに追} 加され，さらに図24 のようなブック（左）とグラフ表示ウィンドウ（右）が開きます。 18_{Nooy (2005)の邦訳や鈴木（2009）など。} 19_{Hansen et al. (2011). 本稿執筆時点では日本語訳はなされていないようです。} 20_{NodeXL を個人のパソコンなどにインストールする場合は，該当する説明をよく読んで，} 注意深く行なってください。またその結果については自己責任でお願いします。

(30)

図24 NodeXL

NodeXL を本格的に使いたい人は，NodeXL のホームページに NodeXL Documentation としてアップされている NodeXL チュートリアル（NodeXL Tutorial；http://casci.umd.edu/images/4/46/NodeXL_tutorial_draft.pdf；英文）を読みながら使ってみることが最も手っ取り早いと思います。以下，その中からいくつかをごく簡単に説明します。

・データの入力：

NodeXL のデータ入力は，基本的には辺リスト（edge list）を Edges ワークシートに入力します。辺リストは頂点のペアです。チュートリアルの1)の Data entry のように，あなたの知っている友達関係を入れてみましょう（名前は仮名でいいです）。データをある程度入力したら，グラフを表示してみましょう。グラフウィンドウの左上にある［Show Graph］ボタンを押しましょう。グラフのレイアウトは自動的になされます。・特徴量の計算チュートリアルの 5)にしたがって，Kite_Network.xlsx を該当のホームページ（http://casci.umd.edu/NodeXL_Teaching）からダウンロードし，さまざまな特徴量を計算してみましょう。頂点に関する中心性，ネットワーク全体の指標などさまざまな特徴量が計算されます。これまで取り上げなかった，媒介中心性などの指標も計算されます。特徴量の計算は，NodeXL タブの[Graph Metrics]ボタンを押し，ダイアログボックスで必要な特徴量をチェックし

(31)

[Compute Metrics]ボタンを押すと，該当するワークシート（たとえば頂点に関わる特徴量は Vertices シート）に示されます。詳しくはチュートリアルを参照しながら試してみてください。・辺リストへの変換 NodeXL はさまざまなデータ形式を読み取ることができますが，辺リスト形式が基本です。この稿で用いた頂点リストのデータと辺リストの間の変換を考えてみましょう。以下に，頂点リストから辺リストへ変換するためのワークシートとVBA プログラムを示します。プログラムは，これまでみてきたステートメントの範囲で記述されています。あまり難しくないと思いますので，各自解読してみてください。図25 頂点リストから辺リストへの変換

(32)

４．おわりに

以上，社会ネットワーク分析の基本特徴量の計算を中心に入門的な部分をみてきました。今日では超大規模な社会ネットワークの分析も行なわれつつあります。たとえば，インターネット上のSNS やブログでは最大数千万あるいは数億の主体（頂点）を持つ社会ネットワークが形成されています。また，これらのデータ（の一部）は場合によっては比較的容易に入手することができ21_，近年では盛んに分析されつつあります。この稿の最後で扱った NodeXL は，Excel テンプレートという実装方法から考えて，超大規模なデータを扱うことは困難かもしれませんが（そもそも特徴量によってはどんなツールを使っても計算量が爆発するものがあります），数千くらいの頂点数であれば問題なく扱えるようです。最後に，この稿をきっかけとして，みなさんに社会ネットワーク分析に興味を持っていただければ幸いです。

参考文献

Nooy, W. de., Mrvar A. and Batagelj V. (2005), Exploratory Social Network Analysis with Pajek, Cambridge University Press. （安田雪監訳『Pajek を活用した社会ネットワーク分析』東京電機大学出版局，2009。）

Hansen, D. L., Schneiderman, B. and Smith, M. A. (2011), Analyzing Social Media Networks with NodeXL: Insights from a Connected World, Morgan Kaufmann. 今野紀雄，町田拓也（2008）『図解入門よくわかる複雑ネットワーク─シミュレーションで見るモデルの性質─』秀和システム。増田直紀, 今野紀雄（2006）『「複雑ネットワーク」とは何か─複雑な関係を読み解く新しいアプローチ─』講談社。増田直紀, 今野紀雄（2010）『複雑ネットワーク─基礎から応用まで─』近代科学社。鈴木努（2009）『ネットワーク分析（R で学ぶデータサイエンス，金明哲編集； 8）』共立出版。「ウィキペディア─フリー百科事典」（http://ja.wikipedia.org/wiki/）項目：「複雑ネットワーク」。

21_{たとえば，NodeXL タグの Import ボタンの中に Twitter や Flickr Tag からデータを収}

(33)

練習問題

問題１（架空のクラスのネットワーク）以下は，架空のある学校のクラスのお互い親友と認めている関係のネットワークを示しています。 1 2 4 2 1 3 3 2 4 4 1 3 5 5 4 6 7 6 5 7 5 8 9 8 7 9 9 7 8 データの形式は，本文でいう頂点リスト（隣接リスト）形式で，各行の最初の整数が頂点名，残りの整数がその頂点に隣接しているいくつかの頂点名です。それぞれの頂点の整数の間は半角スペースで区切られています。このデータを利用して以下の作業をしましょう。 (1) このネットワークを図に書いてみましょう。図形描画機能を使いましょう。 (2) clnet.txt を Excel のデータ（頂点リスト）に変換しましょう。 (3) (2)に隣接行列を付け加えましょう。 (4) 各頂点の次数，距離行列と平均距離，近接中心性を求めましょう。ネットワークの直径と各頂点の離心中心性も求めましょう。 (5) 各頂点のクラスター係数とネットワークの平均クラスター係数を求めましょう。ネットワークの密度も求めましょう。 (6) 頂点リストから辺リストをつくり，NodeXL に入力し（コピー＆ペーストが最も簡単），ネットワークを可視化しましょう。 (7) NodeXL で各種特徴量を計算しましょう。(1)～(4)の結果と一致することを確認しましょう。NodeXL が示す中心性（媒介中心性や固有ベクトル中心性など）も含めて，すべての特徴量をわかりやすく示しましょう。それぞれの中心性で中心と判断される頂点も示しましょう。（本稿は，平成21 年度和歌山大学経済学部研修専念制度に基づく成果の一部を利用しています。）

(34)

Microsoft Word - Ⅲ表紙社会ネット

目 次

Excel による社会ネットワーク分析Ⅰ

─ネットワークの基本特徴量─

ネットワークの基本特徴量

１．はじめに─ネットワークとは

２．複雑ネットワーク

３．ネットワークとグラフ

４．ネットワークの基本特徴量─Excel による計算





５．ネットワーク分析用

Excel テンプレート NodeXL

４．おわりに

参考文献

練習問題

目次