• 検索結果がありません。

特集論文 理論と方法 33 巻 1 号 2018 年数理社会学会 Sociological Theory and Methods Vol.33 No Japanese Association for Mathematical Sociology 社会ネットワーク分析における意義の検討

N/A
N/A
Protected

Academic year: 2021

シェア "特集論文 理論と方法 33 巻 1 号 2018 年数理社会学会 Sociological Theory and Methods Vol.33 No Japanese Association for Mathematical Sociology 社会ネットワーク分析における意義の検討"

Copied!
14
0
0

読み込み中.... (全文を見る)

全文

(1)

統計的ネットワーク分析の視座:

社会ネットワーク分析における意義の検討

鈴木 努(東北学院大学)

[要約]

社会ネットワーク分析において指数ランダムグラフモデル(Exponential Random Graph Models: ERGM)や経験的ネットワーク分析のためのシミュレーション手法(Simulation Investigation for Empirical Network Analysis: Siena)といった統計的ネットワーク分析の手法 の適用が広まってきている.本稿ではこれらの手法の特徴を概観し,社会ネットワーク分 析におけるその意義を検討した.統計的ネットワーク分析の手法には,ネットワークに含 まれる頂点や頂点対の諸特性が頂点間の結合に与える効果を多変量モデル化し,その統計 的有意性を検定することができるという利点がある.近年の統計パッケージの整備によっ て,その実データへの適用は容易になってきているが,その意義については社会構造の解 明という社会ネットワーク分析の目的にとっては限定的であるという疑義もある.本稿 では統計的ネットワーク分析が主にミクロなネットワーク特性に着目しており,マクロな ネットワーク特性をモデル化しにくい点,頂点結合に対する諸効果の一様性を仮定してい る点を指摘したうえで,社会ネットワークの形成,発展,衰退といったプロセスの分析に 統計的ネットワーク分析を適用することを提案した. [キーワード] 統計的ネットワーク分析,ERGM,Siena [審査記録] 受稿 2017 年 11 月 26 日/掲載決定 2018 年 2 月 6 日

1

 目的と背景

本稿の目的は近年社会ネットワーク分析において利用の広まっている指数ランダムグラ フモデル(Exponential Random Graph Models: ERGM)や経験的ネットワーク分析のための シミュレーション手法(Simulation Investigation for Empirical Network Analysis: Siena)といっ た統計的ネットワーク分析手法の特徴を概観し,社会ネットワーク分析においてこれらの 手法のもつ意義を検討することである.

従来の社会ネットワーク分析では,ネットワークの密度,推移性,中心性といった諸指 標が,分析対象となるネットワークの構造的特徴を示すものとして主に記述的に用いられ

(2)

てきた.統計的ネットワーク分析ではそれらの指標の確率分布を想定することで,測定値 に対して統計的有意性検定を行うことができる.さらに,複数のネットワーク指標を相互 に統制しながら,統計的検定を行うことができる多変量モデルが提案され,実行のための 統計パッケージが開発,公開されたことで,その適用範囲は大きく広がっている. 社会ネットワーク分析の主要な学術誌である Social Networks 誌において,統計的ネット ワーク分析の代表的モデルである ERGM と Siena が言及された頻度の年次推移を示したの が図 1 である1).2000 年代後半以降,統計的ネットワーク分析手法とりわけ ERGM に言 及する論文が増加していることが分かる.この時期には統計解析ソフト R で ERGM を実 行するための統合パッケージである statnet パッケージ(Handcock et al. 2003)および Siena を実行する RSiena パッケージ(Ripley et al. 2009)の整備が進んでおり,これらの分析法の 発展やパッケージ利用による適用の容易化が,論文数増加の背景にあると考えられる.

また,近年では統計的ネットワーク分析を扱ったネットワーク分析の解説書も複数出 版されている.社会ネットワーク分析の初期の代表的テキストである Wasserman and Faust

(1994)では ERGM の 1 つである p1モデルが扱われていた.同じシリーズの Carrington

et al. eds.(2005)では ERGM のほか,Siena を扱う章もあった(Snijders 2005).これら はやや専門的な部類の解説書であったが,より入門的なテキストである Knoke and Yang (2008)ではロジットモデルとして p* が紹介されている.同じく入門的なテキストと して知られる Scott の Social Network Analysis は第 3 版以降,ERGM と Siena に言及する ようになっている(Scott 2013, 2017).また Prell(2012),Borgatti et al.(2013),Yang et al.(2017)といったテキストではこれらの統計的ネットワーク分析に関する節や章を設け, 具体例を示しながら解説しており,統計的ネットワーク分析を扱うことは社会ネットワー ク分析の解説書では一般的になってきている.

Kolaczyk(2009)はネットワークの統計モデルを幅広く扱っているが,その姉妹編であ る Kolaczyk and Csárdi(2014)には R を使って統計的ネットワーク分析を行う方法が具体 的に示されている.R による統計的ネットワーク分析の方法は Harris(2014),Luke(2015), 鈴木(2017)に R スクリプトの例を含め詳しく解説されているので,これらを参考にす れば統計的ネットワーク分析を実際に適用することはそれほど難しくない.日本語の文献

(3)

では,金光(2003)がいちはやく p* モデルに至る統計的社会ネットワークのモデルをレ ビューしているほか,Schut and Oʼneil(2013 = 2014)に ERGM の簡単な紹介がある.

このように統計的ネットワーク分析の適用と紹介は進んでおり,日本の数理社会学にお いても今後その適用が進むことが予想される.以下では統計的ネットワーク分析の社会 ネットワーク分析における意義を確認した後,その問題点と今後の課題について考察する.

2

 統計的ネットワーク分析の意義

2.1

 統計的ネットワーク分析のモデル

社会ネットワーク分析における構造的指標に対して統計的有意性の検定を行うにはどうす ればよいか.計量社会学でよく用いられる検定法では,例えば 2 群の平均値に差はない,相 関係数や回帰係数が 0 であるなどの帰無仮説のもとで,観測値よりも極端な値が得られる確 率すなわち有意確率を求める.統計的ネットワーク分析における帰無仮説は,ある条件のも とで 2 つの頂点間に辺が存在する確率は一定であるという,辺の存在のランダム性である. 例えば,ネットワークに含まれる頂点の数と辺の数を条件とした場合,任意の 2 つの頂 点間に辺がある確率はそのネットワーク全体の密度に等しい.よって,2 つの頂点が共通 のある別の頂点との間に辺をもっている場合と,もっていない場合でこれら 2 つの頂点間 に辺のある確率は一定であり,ネットワーク全体の推移性の期待値はネットワークの密度 と等しくなる.実際のネットワークでこの期待値よりも高い推移性が観測された場合,そ れを偶然と見なすか,偶然以上の意味があると判断するか決めるためには,このランダム なネットワークにおける推移性の分布を知る必要がある.

CUG 検定(Conditional Uniform Graph test)は,与えられた条件のもとでランダムなグラフ を多数生成するシミュレーションによって,ネットワークの構造指標の分布を推定する方法 である(Anderson et al. 1999).この分布から,ネットワークのランダム性の帰無仮説のもと で観測値より極端な値が得られる確率を求め,統計的な有意性検定を行うことができる.推 移性のように密度の影響を受ける構造指標の評価において,推移性の値の大小そのものでは なく,密度を統制した場合の有意確率によって,対象のネットワークがランダムなネット ワークよりも高い推移性をもっているといえるか判断することが可能となるのである. しかし,CUG 検定では単一の指標の有意性しか検定することができないので,例えば ネットワーク内に三角形の構造が多くみられたとき,それが推移的な関係形成によるもの なのか,あるいは性別や年齢のような属性に基づく同類選好の結果として生じたものなの か判別することができない.そのためには複数の構造指標や属性を相互に統制して有意性 を評価する多変量モデルが必要となる.

2.2

 ERGM

Wasserman and Pattison(1996)が提示した p* モデルは,ネットワークの構造指標,頂 点や頂点対の属性など複数の変数を相互に統制しながら,それらの効果について検定を行 うことができるモデルである.現在では p* をはじめとする指数型分布族を用いる統計的 ネットワーク分析のモデルは ERGM と総称されている.ERGM の基本的モデルでは,ラ ンダムに生成されるネットワーク Y において,観測されたネットワーク y が得られる確率 を次のようにモデル化する.ここでzk( y)は y における構造指標や諸属性などの変数,θk はその係数である.

(4)

P(Y = y) = 1 c ⎛ ⎝ ⎜ ⎞ ⎠ ⎟exp θkzk( y) k

⎧ ⎨ ⎩ ⎫ ⎬ ⎭ ここから以下の式が導かれる.ただし,P(Y = y) = 1 c ⎛ ⎝ ⎜ ⎞ ⎠ ⎟exp θkzk( y) k

⎧ ⎨ ⎩ ⎫ ⎬ ⎭ p(Yij=1| yijC)は頂点 i と頂点 j の関係以外は y と 同じとき,i と j の間に辺のある確率,zk( yij+)は頂点 i と頂点 j の間に関係があり,それ以 外の頂点間の関係は y のままにした場合のzk( yの値,ij−) zk( yij−)は頂点 i と頂点 j の間に関係がな く,それ以外の頂点間の関係は y のままにした場合のzk( yの値である.ij−) logit P(Y ij=1| yijC)⎤⎦ = θk

{

(zk( yij+) − zk( yij−)

}

k

logit P(Y ij=1| yijC)⎤⎦ = θk

{

(zk( yij+) − zk( yij−)

}

k

これは頂点間の辺の有無を予測するロジスティック回帰モデルであり,この式における 各変数の係数の値と分布を推定することで,関係形成における各変数の効果を検定すること ができるのである.なお,ここでの分析の単位は頂点ではなく頂点対なので,分析に用いら れるケース数は,通常の社会学研究で用いられるロジスティック回帰分析のように分析対 象のサンプルサイズではなく,そこで可能な 2 者関係の数となることに留意されたい2).ま た係数の推定においては,通常のロジスティック回帰モデルのように変数間の独立性が 仮定できないため,シミュレーションに基づく方法であるマルコフ連鎖モンテカルロ法 (MCMC)が用いられる(Robins et al. 2007). このようなモデル化によって,関係の推移性や相互性といった構造的な規則の効果,あ るいは頂点の属性の効果や同類選好の効果などを相互に統制しながら検討することが可能 になり,対象のネットワークにおける関係形成の原理の究明が可能となった.このことは 社会ネットワーク分析において非常に大きな意義をもつといえる.社会ネットワーク研究 において,対象のネットワークがどのような規則に従って形成されているかを知ることは そのネットワークを理解するうえで重要であり,それによって異なる社会ネットワークを 比較しそれらの特性を知ることができる.また,ネットワーク分析によって得られる構造 的指標だけでなく,社会学研究で広く用いられるデモグラフィック変数もモデルに含める ことができることも,社会ネットワークの研究にとって大いに有用である. ERGM が社会ネットワークの形成原理の探究に有用であることは確かだが,「形成」の 含意については検討しておいた方がよいだろう.通常,社会ネットワークの形成という場 合に,何らかのプロセスによるネットワーク構造の時間的変化が想定される.例えば,相 互的な関係の形成では,贈り物に対してお返しがあるように,一方が先にある相手に対し て関係を作り,それへの反応として逆向きの関係が形成されると考えることができる.あ るいは,推移的な関係の形成では,友達の友達を新たな友達として選ぶように,先にある 2 辺にもう 1 辺が加わって三角形が形成されるというイメージがしばしば用いられる. しかし,ランダムなネットワークの形成においては必ずしもそのような時間的な構造変 化による関係形成が想定されるわけではない.双方向の関係をもつ頂点対を一挙に選んで もよいし,三角形を形成する 3 つの頂点を同時に選んでもよいのである.1 時点のネット ワークデータにおいて見いだされる相互性や推移性は,それが時間的に変化して形成され たのか,あるいは一挙的に形成されたのか区別できない.1 時点のネットワークデータを 用いた ERGM でもそれは同様であり,分析によって相互性や推移性の効果が認められた としても,それを時間的変化によるものと見るか一挙的に形成されたものと見るかは解釈

(5)

次第である.これは ERGM が本質的に時間性をもたないことの帰結である. ただし,ERGM では独立変数として頂点対の属性を含むことができることを利用して, ネットワークの時間的変化を分析することもできる.例えば,友人関係の有無が相談関係 の有無に影響を与えるというような同一時点での異なるネットワーク間の影響を分析する 場合に,友人関係の有無をダミー変数として独立変数に加えて,相談関係の有無に対する 影響を検討することができる.同じように先行する時点における関係の有無をダミー変数 として独立変数に加えれば,先の時点における関係の有無が後の時点のネットワーク構造 に与える効果を検討することができる.Harris(2014: 102-4)には,高校生の春学期の友 人ネットワークがそれに先立つ秋学期の友人ネットワークの影響をどの程度受けているか を評価するための分析例がある.この場合は独立変数と従属変数に時間差を設けることに よって,時間的変化を分析しているのである. ネットワークの時間的変化をより明示的にモデルに組み込んだ ERGM の拡張としては, Temporal Exponential Random Graph Models(TERGM) が 提 案 さ れ て い る(Hanneke et al. 2010; Krivitsky and Handcock 2014).TERGM では先行する時点のネットワーク構造が与え られたときに,後続する時点のネットワークが得られる条件付き確率をモデル化している ため,先に述べたような ERGM における相互性や推移性の解釈の多義性は解消されている.

2.3

 Siena

TERGM とは異なる方法で,ネットワークの時間的変化を想定したモデル化を行ってい る統計的ネットワーク分析の手法に Siena がある(Snijders et al. 2010).Siena では 2 時点以 上のネットワークデータと頂点であるアクターの行動(属性も含む)データから,先行時 点におけるどのような構造や行動が後の時点における頂点間の関係の変化に影響を与えて いるかを,エージェントベースト・シミュレーションを用いて推定する.そのため,この モデルは確率的アクター指向モデル(Stochastic Actor-Oriented Model: SAOM)とも呼ばれる.

Siena の特徴としては,従属変数に行動変数を加えることができる点も挙げられる.これ により,1 時点のネットワークデータでは区別できなかった,行動が似ているアクター間に 関係が形成されるのか,関係のあるアクター間で行動が似てくるのかを区別して分析する ことができる.またこれらの影響の両方の存在を想定して,関係の形成と行動の類似が相 互に影響を与えるという,関係と行動の共進化をモデル化することが可能になっている. Siena においても,アクターの次時点での関係の有無や行動の選択を決める評価関数は 先行する時点における諸独立変数の線形結合として表現される.時点 x におけるアクター i の評価関数は次式で表される.ski(x)はアクター i に関する k 番目の独立変数の値,fi(β,x) = βkski(x) k

は その係数である. fi(β,x) = βkski(x) k

ERGM と比較しての Siena の特徴としては,まず ERGM が基本的には 1 時点のネット ワークデータからネットワークの形成原理を明らかにする一方,Siena では複数時点の ネットワークデータからネットワークの変化の要因を明らかにする点が挙げられる.その ため,例えば推移性に関する効果にも様々なパターンが想定され,モデルの構築や解釈は 複雑になる(Ripley et al. 2017). 図 2 に i,j,k の 3 者による推移的関係の例を示した.ERGM ではネットワークにおい てこのような 3 者関係がどの程度できやすいか,言い換えればその総数が重要なのであっ て,3 者の位置関係は本質的には問題ではない.一方,Siena はアクターが関係を選択す

(6)

るモデルなので,i → k と k → j があるとき i → j ができる(例えば,友人3)の友人を友人 にする)という構造と i → k と i → j があるとき k → j ができる(i の友人とされたアクター 間に友人関係ができる)という構造は区別される.なぜなら,アクター i にとって前者の 3 者関係形成を選択することは可能だが,後者の k → j の関係を自らの選択として形成す ることは不可能だからである(Block et al. 2016).このように同じ「推移性」の効果を考 える場合でも ERGM と Siena でその含意が等しいわけではない. Siena の特徴の 2 点目には,先述したようにネットワークの行動の共進化のモデル化が 可能という点が挙げられる.例えば,喫煙や飲酒の程度が似ているとアクター間に関係が できやすいのか,また逆に関係のあるアクター間ではこれらの行動が似てくるのかといっ た分析が可能である.このような分析においても,2 時点以上のネットワークデータおよ び行動データを用いることで,関係形成と行動の類似性のどちらが先行するかを明らかに することができる.Mercken et al.(2010)では Siena を用いた青年の友人ネットワークと 喫煙行動の関係の分析から,友人関係を通じた喫煙行動の影響と喫煙行動に基づく友人の 選択の両方のプロセスが存在し,後者の方が優勢であることが示されている. 時間的変化を明示的に分析できる点は Siena の大きな利点ではあるが,そのためにネッ トワークデータを複数時点で継続的に取得する必要があるのは,データ収集におけるコス トを増加させるであろう.複数時点で異なるサンプルを対象に調査するのではなく,同一 のアクター集合に対するパネル調査が必要となるため,調査不能などの理由で欠損値が生 じる可能性もある4).データ収集のコストという面では Siena の方が ERGM よりも制約が あるといえる.

3

 統計的ネットワーク分析への疑義

3.1

 金光による指摘

他の計量的な社会学研究法と比べて,社会ネットワーク分析において統計的モデルの導 入が進まなかった理由として,金光(2003)は分析単位間の独立性の仮定が満たせないた めに社会ネットワーク分析は統計的モデルと親和性がないと考えられてきたことを挙げて いる.前章で紹介した統計的ネットワーク分析の手法は,分析単位すなわち頂点間の関係 対の独立性を仮定せずに可能な統計的モデルとして開発されている.それでも残る問題と して金光は次の 3 点を挙げる. 図 2 推移的 3 者関係

(7)

(1) 統計的なモデル化にはロジット回帰やログリニア分析などの専門の統計技法の知識 と手順が必須となり,社会ネットワーク分析本来のもつ自由な数学的モデル化が制 限される. (2) モデル化が煩雑な割には明らかにされるのは社会構造というよりも,むしろ結合対 のもつ属性や,その結合対属性と他の属性との統計的に有意な関係にすぎない. (3) 分析パッケージが必ずしも統一的に整備されておらず,その分析のために,SPSS や SAS,SYSTAT,BMDP などの統計パッケージを切り替えねばならず煩雑である. (金光 2003: 195) そして統計的ネットワーク分析の可能性を認めたうえで,「果たして統計的社会ネット ワーク・モデリングは社会ネットワーク分析にとって独自の進歩なのか,あるいは統計的 方法への妥協に過ぎないのか?」(金光 2003: 196)という問題提起をしている. 上記の 3 点目については現在では statnet や RSiena といった R パッケージが開発,公開 され既に解決されたといってよいので,検討すべきは残る 2 点である.1 点目にある「社 会ネットワーク分析本来のもつ自由な数学的モデル化」が具体的に何を指すのかここでは 明示されていないが,別の箇所で統計的社会ネットワークモデルを「必ずしも社会ネット ワーク分析の主流(グラフ理論)とは一貫性のない,純統計学的な知識を前提とする煩雑 なモデル化」(金光 2003: 231)と評していることから,グラフ理論および線形代数を用い たグラフ構造の分析諸手法を指していると考えられる.上の 2 点目でも指摘されているよ うに,統計的ネットワーク分析は頂点対の結合可能性に関するモデルなので,グラフの全 体構造は独立変数として含まれるにとどまる.河崎ほか(2017 : 114)が ERGM は「『ネッ トワークの変化』を検定する方法ではあるものの『構造的な変化』を検定する方法である とは言い難い」と述べているのもそのためである. ERGM も Siena も頂点間の結合の可能性を,最終的に独立変数の線形結合によって表現す るモデルである.そういった意味で,統計的ネットワーク分析は社会ネットワーク分析の 線形モデル化,あるいは回帰分析化といえる.線形回帰モデルはグラフ理論などと比べて 一般的な社会学研究でも馴染みのあるモデルである.しかし,馴染みのあるモデルだけに, その枠組にとらわれると,金光の指摘するように自由な発想が制限される可能性もある. 社会学において線形モデルの考え方が理論的思考の自由度を制限しうることを Abbott (2001)は「一般線形リアリティ」という概念を用いて指摘している.その含意は分析単 位の不変性,単調な因果,変数の効果の一義性,時系列効果の不在などである.これらの 特徴が必ずしも統計的ネットワーク分析に当てはまるわけではないし,実際 Siena は有効 なオルタナティブと考えられる.次節では Abbott に倣って,統計的ネットワーク分析の 枠組がどのような社会ネットワークの効果を見落としがちになるのかを検討する.それに よって,単に「どのような頂点どうしが結びつきやすいか」を統計的に検定するだけでは ない,統計的ネットワーク分析の適用可能性が見えてくるだろう.

3.2

 社会ネットワーク分析における一様性と多様性

線形モデルにおける独立変数の効果は基本的にはどの個体に対しても一様である.交互 作用やマルチレベルモデルなどより複雑なモデルを用いれば,層別の効果の違いをモデル 化することはできるが,同一の層内ではやはり効果の一様性が仮定される.独立変数の線 形結合によって表現される統計的ネットワーク分析のモデルにおいても,基本的には独立

(8)

変数の効果はどの頂点または頂点対に対しても一様の効果をもつことが想定される5) このように,ネットワーク形成の原理はそのネットワークに含まれるどの頂点や頂点対 に対しても一様であるという仮定は,ある種の社会ネットワーク分析の視座とは対照的で ある.例えば,頂点の中心性の分析は社会ネットワーク分析において最もよく使われるも のの 1 つであるが,その目的はネットワークにおいて中心的な頂点を識別することである. それゆえ中心性分析が意味をもつのは,ネットワークに含まれる頂点の集合がその中心性 において一様でなく,十分な分散があるとき,中心性が高い頂点もあれば低い頂点もある 多様性をもっているときである. では,そのような中心性の多様性はどのように生じるのか.中心性分析自体はそのよ うな問いに答えることはできないので,その説明は理論的な解釈や他の変数との連関を検 討することによって行われる.例えば,年齢の高い人ほど,あるいは女性は男性よりも高 い次数中心性をもつといったような場合,この次数中心性の高低を生み出す原理は統計的 ネットワーク分析を用いて説明することができる.なぜなら,次数中心性は統計的ネット ワーク分析の従属変数である頂点対の結合可能性と直接的な関係があるからである. では,次数中心性と並んで代表的な中心性指標である近接中心性や媒介中心性の場合は どうだろうか.これらの中心性指標は各頂点のもつ直接的な関係からだけでは算出できず, ネットワークの全体的な構造における頂点の位置によって決定される.具体的にはネット ワークに含まれる頂点間の距離の最大値(直径)や平均値,切断点の数などが関係してい る.しかし,ERGM や Siena ではネットワークの直径や切断点の数というマクロなネット ワーク指標を直接的にはモデルに含めることができない6).近接中心性や媒介中心性の高 い頂点と低い頂点が生じる要因については,これらの統計的ネットワーク分析の手法で扱 うのは難しいのである. 図 3 のように各頂点が近傍の頂点と三角形の関係を作りながら帯状に並んだネットワー クを考えてみよう.これは Watts and Strogatz(1998)の提案したレギュラーグラフの円環 を切断し非トーラス化したものであり,ランダムグラフに比べて高い推移性と大きい直径 をもつというレギュラーグラフの特徴を備えている.このネットワークにおける頂点の近 接中心性や媒介中心性には大小の序列があり,両端に近い頂点ほど中心性が低い.一方で 両端付近のわずかな頂点を除けば各頂点の次数は一定であり,それゆえある頂点が他の頂 点と関係をもつ確率もほぼ一定である.このような場合に ERGM の独立変数に近接中心 性や媒介中心性を加えても,それらの中心性指標によって頂点対の結合確率を予測するこ とは不可能である. ただし,ネットワークに含まれる多くの頂点がある特定の頂点とのみ関係をもつような スター構造がある場合など,次数中心性が高いほど近接中心性や媒介中心性が高くなるこ とはよくある.その場合,媒介中心性や近接中心性と頂点間の結合確率との間に有意な関 係が生じうる.しかし,1 時点でのデータからは,高い中心性が他の頂点との関係形成を 促進したのか,他の頂点との関係形成の結果として高い中心性が得られたのか判別し難い. 複数時点のデータを扱う TERGM や Siena であれば,先行時点での中心性が後の時点での 関係形成に与える影響を評価することはできるであろう.それでも,なぜ中心性の高い頂 点と低い頂点が生じるのかというマクロなネットワーク形成原理を明らかにすることはで きないのである. その他のマクロなネットワーク指標に関しては,ERGM ではネットワークに含まれる 辺の数(密度),三角形の数(推移性)や k-スター(次数 k をもつ頂点の分布)といった 変数をモデルに含むことができる.これは ERGM がこれらのマクロなネットワーク指標

(9)

が頂点間の結合確率に対して与える効果をモデル化しているからである.一方,Siena は アクター指向のモデルなので,ERGM に比べるとマクロなネットワーク特性のモデル化 には制約もある(Block et al. 2016). 統計的ネットワーク分析におけるマクロなネットワーク指標の扱いにくさは,モデルに 従って生成されるネットワークと観測されたネットワークの間で次数分布や頂点間距離な どに差が生じる可能性にも表れている.モデルで直接コントロールしていないネットワー ク指標に関して観測値との間で大きな差が生じた場合,そのモデルが実際の関係形成原理 を表現しているとはいえない.そのため ERGM や Siena ではモデルの推定後に,次数分 布や頂点間距離が観測値と乖離していないか当てはまりの診断(Goodness of Fit: GOF)が 行われる(Harris 2014; Ripley et al. 2017; 鈴木 2017).

社会ネットワーク研究においてよく知られている Granovetter(1973 = 2006)の「弱い紐 帯の強さ」や Burt(1992 = 2006)の「構造的空隙」は,社会ネットワーク上で異なる集 団をつなぐ位置を占めることが個人の利益やパフォーマンスの向上につながることを示し ている.集団内の関係を密にするか,他集団へと関係を広げるかという個人のネットワー ク形成における戦略の違いとその効果については社会関係資本論における重要なテーマで ある(金光 2003).このようなアクターのネットワーク形成における戦略の多様性とその 社会的帰結という社会ネットワーク分析の関心と,アクター間のネットワーク形成原理の 一様性を仮定する統計的ネットワーク分析の視座には,その理論的な前提に隔たりがある. この戦略の多様性とネットワーク形成原理の一様性の仮定の隔たりを埋めるためには, ネットワーク形成の場や紐帯の種類を限定して,統計的ネットワーク分析を適用する必要 があるだろう.例えば,他集団との関係形成が選好されるのは,どのような場合のどのよ うな関係においてなのかを特定し,所属集団の一致/不一致が関係形成の可能性に与える 影響を評価することで,ネットワーク形成における戦略選択の傾向を実証的に扱うことが できる.

3.3

 社会ネットワークのダイナミクスの時間的一様性

Abbott(2001)が一般線形リアリティの問題点として指摘した時系列効果の不在は,独 立変数によって規定される従属変数が次の時点では独立変数として従属変数を規定する, という因果的サイクルの連鎖が圧縮されて時間性をもたないモデルとして記述されるこ とにある.Siena モデルにおける複数時点を想定したネットワークと行動の共進化はこの ような問題に対するオルタナティブになりうる.Siena では 3 つ以上の時点を考えるとき, ネットワークや行動の変化の原理は基本的には全期間を通じて共通とされるが,時間的に 変化するモデルも可能である.つまりネットワークのダイナミクスは時間的に一様でもよ 図 3 非トーラス化された 1 次元レギュラーグラフ

(10)

いし変化してもよいとされている(Ripley et al. 2017). このことは,ある集団や組織の形成,発展から衰退に至る過程を分析する際に有効性を 発揮する.ある集団が他の集団から独立してネットワークを形成する時期と,安定的に集 団を維持する時期とでは,人間関係の形成原理が同じとは限らない.例えば,高校の新入 生のネットワークは,最初は同じ中学校の出身者どうしの結びつきが強いが,徐々に共通 の趣味や部活動による結びつきが増えていくだろう.また,集団が衰退や消滅の過程をた どるとき,人間関係の解消がその形成時と逆の原理で起こるとは限らない.ネットワーク 形成時に関係構築を促進した要因が,ネットワーク衰退時に関係解消を抑制する要因にな るとは限らないのである.機を見るに敏な行為者は,関係構築に積極的な半面で,関係の 解消もまた躊躇しないであろう. 集団や組織の形成期において,個々のアクターはそこに参加するか否かの選択を行う. 個人の参加に対して人間関係が与える効果については,Granovetter(1978)の閾値モデル が有名である.あるアクターとつながりをもつネットワーク他者における参加者の比率が アクターの参加の選択に与える効果は,Siena でモデル化可能である.必ずしもアクター 間で一様ではない参加の閾値の分布をモデルでどう表現するかという課題はあるものの, ネットワークが参加という行動に与える影響の分析に Siena は有効である. 組織のネットワークの発展過程においては,個人の参加に加えて組織間のつながりが重 要性をもつ.Osa(2003)はポーランドの民主化運動において組織間ネットワークがどの ように展開したかを年代ごとのネットワーク図によって示した.そこでは宗教団体や様々 な党派性をもつ組織がメンバーの重複によってつながることで,ネットワークが拡大し ていった様子が描かれている.この研究ではネットワークデータはネットワークの可視化 や中心性の算出など記述的に用いられるのみであるが,このようなデータに統計的ネット ワーク分析を適用すれば組織の性質や規模が組織間連携に与える影響を計量的に分析する ことが可能になるであろう.メンバーの重複は二部グラフで表現されるアフィリエーショ ン・ネットワークから導かれるが,Siena をアフィリエーション・ネットワークに適用す ることも可能である(Snijders et al. 2013). 社会ネットワークの形成,発展,衰退といった過程を分析する際,統計的ネットワーク 分析が有効性をもつのは,ネットワークの形成原理すなわち,どのような頂点や頂点対に 関係ができやすいか,だけではなく逆にどのような頂点や頂点対は関係ができにくいのか, あるいは関係が解消されやすいのかをも分析できる点にある.ERGM は関係の相互性や 同類選好といった,ネットワーク形成における結合の起こりやすさに注目することが多い が,衰退期にある社会ネットワークにおけるネットワーク結合の起こりにくさに着目する ことでその適用範囲は広がるだろう. 時系列データに基づいてネットワークと行動の共進化をモデル化できる Siena では,組 織への異議申し立てや組織からの離脱が起きるプロセス(Hirschman 1970 = 2005)のモ デル化などへの適用も考えられる.組織が危機に面したとき,メンバーは組織を離脱する か,不満を発言するかという行動を選択することができる.どのようなネットワーク上の 地位や特性が離脱や発言といった行動につながるのか,あるいはそれらの行動がネット ワークに変化をもたらすのかといった視点の研究には Siena が適している. 分析パッケージの整備によって統計的ネットワーク分析の適用そのものは容易になって きている.これらの方法が社会ネットワーク分析にさらに寄与するか否かはその適用の仕 方にかかっているといえる.互酬的な関係は築かれやすい,友人の友人は友人になりやす い,似たものどうしは結びつきやすい,といった日常的な洞察と大差のない仮説の検証に

(11)

とどまらず,社会ネットワークの変化における詳細なプロセスまで視野に入れたとき,統 計的ネットワーク分析は社会ネットワークに関する理論的発展にも寄与する手法となるで あろう.

4

 まとめ

本稿では,社会ネットワーク分析で適用の広がりつつある ERGM および Siena という 統計的ネットワーク分析の手法について,その概略と適用可能性を確認し,さらにこれら の分析手法に向けられた疑義について検討した.統計的ネットワーク分析は,従来ネッ トワークの特徴を記述するためにのみ用いられることの多かった密度や相互性,推移性と いったネットワーク指標を相互に統制しながら,それらが頂点間の結合に与える影響の有 意性検定を行うことができるという点で,社会ネットワーク分析の新たな可能性を示して いるといえる. 統計的ネットワーク分析ではグラフ理論などに基づく従来のネットワーク分析の自由な モデル化が制限され,そこで行われているのは頂点対の結合可能性というミクロな現象の 有意性検定にすぎないという指摘については,特にグラフの全体構造の解明との関連が薄 いことは確かである.だが,複雑ネットワーク研究における Watts-Strogatz モデル(Watts and Strogatz 1998)や Barabási-Albert モデル(Barabási and Albert 1999)が関係の変化や形 成に関するミクロな規則からマクロな構造特性における帰結をモデル化していることを考 えれば,社会ネットワークの構造形成におけるミクロ-マクロ連関のモデルへと発展させ ることは十分可能であろう. 複雑ネットワーク研究におけるこれらのモデルも頂点間の平均距離のようなマクロなパ ラメータをネットワーク形成規則に直接的に含めているわけではない.辺の架け替えや関 係相手の選択という極めて単純でミクロな規則の結果として,マクロな構造特性の法則性 が見出されているのである.同じように,観察されたネットワークのマクロな構造特性を 再現するために,どのようなミクロな関係形成規則があればよいのかをネットワーク形成 シミュレーションを用いて探究することが考えられる.例えば,Bearman et al.(2004)は 高校生の恋愛ネットワークに見られる木構造やサイズの大きなサイクルといったマクロな 構造を,4-サイクルを避ける(デートの相手として自分7)の以前のボーイフレンドの現在 のガールフレンドの以前のボーイフレンドを避ける)というミクロな行動規則から再現す るシミュレーションを行っている.アクター指向の Siena はこのような研究方法と親和性 が高い. 集団や組織の研究という視点からは,関係の形成や変化の説明という統計的ネットワー ク分析の利点を活かし,より長期的な集団の変化を説明するような研究への適用が期待さ れる.特にネットワークと行動の共進化をモデル化できる Siena は集団におけるある行動 の活性化と沈静化が人間関係の変化とどのように連関しているかの解明に有効だと考えら れる.独立変数の細かな有意性の有無にこだわるような適用に終始することなく,社会 ネットワークにおけるミクロ-マクロ過程と集団の中長期的変動という視点にたつことで, 統計的ネットワーク分析は社会ネットワーク研究の新たな展開に寄与すると考えられる.

(12)

[謝辞] 本稿の作成にあたり 2 名の匿名の査読者から有益な示唆を得た.記して感謝申し上げる. [注] 1) Science Direct のデータベースにより本文中に各語を含む原著論文を検索した結果. 2) 頂点数 n のネットワークにおいて,自分を除いた他の頂点との間で可能な 2 者関係の数は,関係に向 きのある場合 n(n-1),向きの無い場合 n(n-1)/2 である.頂点対(dyad)とはこれら 2 つの頂点間の 順序対(関係に向きがある場合)あるいは非順序対(関係に向きのない場合)を指し,何らか関係の 存在を表す辺(edge)とは異なる概念である.ある頂点対にはその間に辺がある場合とない場合がある. 3) ここでは向きのある関係を想定しているので,アクターが他のアクターを友人として指名する関係と 考えられたい. 4) RSiena パッケージではアクター集合へのアクターの入退出は可能であり,10% 程度までの欠損値は許 容されている(Ripley et al. 2017). 5) ただし頂点の生産性(productivity)や牽引性(attractiveness)のように各頂点に属すると想定される 効果はその限りでない.生産性と牽引性については金光(2003),Wasserman and Pattison(1996)な どを参照. 6) 直接的にはモデルに含めることができない,というのは例えばランダム性の高いグラフではネット ワークの直径が小さくなり,切断点も少ないというように結果的に頂点間の距離や切断点の数に影響 を与えることは可能だからである. 7) これは Bearman et al.(2004)が用いた,異性愛の女子を前提とした場合の例である. [文献]

Abbott, Andrew, 2001, Time Matters: On the Theory and Method, The University of Chicago Press.

Anderson, Brigham S., Carter Butts and Kathleen M. Carley, 1999, “The Interaction of Size and Density with Graph-level Indices,” Social Networks, 21(3): 239-67.

Barabási, Albert-László and Réka Albert, 1999, “Emergence of Scaling in Random Networks,” Science, 286(5439): 509-12.

Bearman, Peter S., James Moody and Katherine Stovel, 2004, “Chains of Affection: The Structure of Adolescent Romantic and Sexual Networks,” American Journal of Sociology, 110(1): 44-91.

Block, Per, Christoph Stadtfeld and Tom A. B. Snijders, 2016, “Forms of Dependence: Comparing SAOMs andERGMs from Basic Principles,” Sociological Methods & Research, (Retrieved December 25, 2017, https:// doi.org/10.1177/0049124116672680).

Borgatti, Stephen P., Martin G. Everett and Jeffrey C. Johnson, 2013, Analyzing Social Networks, Sage.

Burt, Ronald S., 1992, Structural Holes: The Social Structure of Competition, Harvard University Press.(=2006, 安田雪訳『競争の社会的構造:構造的空隙の理論』新曜社.)

Carrington, Peter J., John Scott and Stanley Wasserman eds., 2005, Models and Methods in Social Network Analysis, Cambridge University Press.

Granovetter, Mark S., 1973, “The Strength of Weak Ties,” American Journal of Sociology, 78(6): 1360-80.(=2006, 大岡栄美訳「弱い紐帯の強さ」野沢慎司編『リーディンス ネットワーク論』勁草書房,123-58.) Granovetter, Mark, 1978, “Threshold Models of Collective Behavior,” American Journal of Sociology, 83(6): 1420-43. Handcock, Mark S., David R. Hunter, Carter T. Butts, Steven M. Goodreau and Martina Morris, 2003, statnet:

Software Tools for the Statistical Modeling of Network Data.

Hanneke, Steve, Wenjie Fu and Eric P. Xing, 2010, “Discrete Temporal Models of Social Networks,” Electronic

Journal of Statistics, 4: 585-605.

Harris, Jenine K., 2014, An Introduction to Exponential Random Graph Modeling, Sage.

Hirschman, Albert O., 1970, Exit, Voice, and Loyalty: Responses to Decline in Firms, Organizations, and States, Harvard University Press.(=2005,矢野修一訳『離脱・発言・忠誠:企業・組織・国家における衰退 への反応』ミネルヴァ書房.)

金光淳,2003,『社会ネットワーク分析の基礎:社会的関係資本論にむけて』勁草書房.

河崎素乃美・谷口隆晴・増本康平・近藤徳彦・岡田修一,2017,「交流ネットワークの構造変化に対する ネットワークモデルを用いた統計的検定手法」『日本応用数理学会論文誌』27(2): 112-46.

Knoke, David and Song Yang, 2008, Social Network Analysis, 2nd ed., Sage. Kolaczyk, Eric D., 2009, Statistical Analysis of Network Data, Springer.

(13)

Krivitsky, Pavel N. and Mark S. Handcock, 2014, “A Separable Model for Dynamic Networks,” Journal of the Royal

Statistical Society: Series B (Statistical Methodology), 76(1): 29-46.

Luke, Douglas A., 2015, A User’s Guide to Network Analysis in R, Springer.

Mercken, L., T. A. B. Snijders, C. Steglich, E. Vartiainen and H. de Vries, 2010, “Dynamics of Adolescent Friendship Networks and Smoking Behavior,” Social Networks, 32(1): 72-81.

Osa, Maryjane, 2003, “Netwoks in Opposition: Linking Organizations through Activists in the Polish Peopleʼs Republic,” Mario Diani and Doug McAdam eds., Social Movements and Networks: Relational Approaches to

Collective Action, Oxford University Press, 77-104.

Prell, Christina, 2012, Social Network Analysis: History, Theory and Methodology, Sage.

Ripley, Ruth, Krists Boitmanis, and Tom A.B. Snijders, 2009, RSiena: Simulation Investigation for Empirical Network Analysis.

Ripley, Ruth M., Tom A. B. Snijders, Zsófia Boda, András Vörös and Paulina Preciado, 2017, “Manuals for RSiena,” Siena Homepage; Department of Statistics; University of Oxford, (Retrieved November 25, 2017, http://www. stats.ox.ac.uk/~snijders/siena/RSiena_Manual.pdf).

Robins, Garry, Pip Pattison, Yuval Kalish and Dean Lusher, 2007, “An Introduction to Exponential Random Graph (p*) Models for Social Networks,” Social Networks, 29(2): 173-91.

Schut, Rachel and Cathy Oʼneil, 2013, Doing Data Science: Straight Talk from the Frontline, O'Reilly Media.(= 2014,瀬戸山雅人・石井弓美子・河内崇・河内真理子・古畠敦・木下哲也・竹田正和・佐藤正士・望 月啓充訳『データサイエンス講義』オライリージャパン.)

Scott, John, 2013, Social Network Analysis, 3rd ed., Sage. Scott, John, 2017, Social Network Analysis, 4th ed., Sage.

Snijders, Tom A. B., 2005, “Models for Longitudinal Network Data,” Carrington, Peter J., John Scott and Stanley Wasserman eds. Models and Methods in Social Network Analysis, Cambridge University Press, 215-47. Snijders, Tom A. B., Alessandro Lomi and Vanina Jasmine Torló, 2013, “A Model for the Multiplex Dynamics of

Two-mode and One-mode Networks, with an Application to Employment Preference, Friendship, and Advice,”

Social Networks, 35(2): 265-76.

Snijders, Tom A. B., Gerhard G. van de Bunt and Christian E. G. Steglich, 2010, “Introduction to Stochastic Actor-based Models for Network Dynamics,” Social Networks, 32(1): 44-60.

鈴木努,2017,『Rで学ぶデータサイエンス8 ネットワーク分析 第2版』共立出版.

Wasserman, Stanley and Katherine Faust, 1994, Social Network Analysis: Methods and Applications, Cambridge University Press.

Wasserman, Stanley and Philippa Pattison, 1996, “Logit Models and Logistic Regressions for Social Networks: I. An Introduction to Markov Graphs and p*,” Psychometrika, 61(3): 401-25.

Watts, Duncan J. and Steven Strogatz, 1998, “Collective Dynamics of ʻSmall-Worldʼ Networks,” Nature, 393(6684): 440-2.

(14)

Special Issue Article

The Perspective of Statistical Network Analysis:

A Consideration of Its Usefulness in Social Network Analysis

Tsutomu Suzuki (Tohoku Gakuin University)

Abstract

The application of statistical network analysis, such as Exponential Random Graph Models (ERGM) and Simulation Investigation for Empirical Network Analysis (Siena), has been widespread in social network analysis. In this article, the characteristics of these methods were reviewed, following which their usefulness was discussed. The advantages of statistical network analysis methods are multivariate modeling of the effects of the features of nodes or node pairs in networks upon the connections of nodes and the statistical significance tests of these effects. The recent development of statistical packages for these methods made it easy to apply them to real data; however, some research suggested that the usefulness of these methods is restrictive for the purpose of social network analysis, which investigates social structures. This article demonstrated that statistical network analysis methods mainly focus on the micro features of networks, which makes it difficult to model the macro features of networks, and that these methods assume that the effects upon the node pairs are uniform. Finally, the application of these methods to the analysis of network processes such as formation, development, and declination was proposed.

Keywords

statistical network analysis, ERGM, Siena Review History

Received November 26, 2017/Accepted February 6, 2018

鈴木 努(すずき つとむ).東北学院大学教養学部 准教授.〒981-3193 仙台市泉区天神沢二丁目1-1.t-suzuki@ mail.tohoku-gakuin.ac.jp.研究関心:社会ネットワーク分析,情報行動.

参照

関連したドキュメント

オリコン年間ランキングからは『その年のヒット曲」を振り返ることができた。80年代も90年

昨年の2016年を代表する日本映画には、新海誠監督作品『君の名は。」と庵野秀明監督作品『シ

In this paper, the method is applied into quantized feedback control systems and the performance of quantizers with subtractive dither is analyzed.. One of the analyzed quantizer

[文献] Ballarino, Gabriele and Fabrizio Bernardi, 2016, “The Intergenerational Transmission of Inequality and Education in Fourteen Countries: A Comparison,” Fabrizio Bernardi

「1 建設分野の課題と BIM/CIM」では、建設分野を取り巻く課題や BIM/CIM を行う理由等 の社会的背景や社会的要求を学習する。「2

社会福祉法人 社会福祉法人 みすず福祉会 みすず福祉会.. 信号用

調査資料として映画『ハリー・ポッター」シリーズの全7作を初期、中期、後期に分け、各時

日本冷凍空調学会論文集.