• 検索結果がありません。

社会ネットワークにおける構造的特徴を測るためのエゴと周辺の異質性に基づいた属性の提案

N/A
N/A
Protected

Academic year: 2021

シェア "社会ネットワークにおける構造的特徴を測るためのエゴと周辺の異質性に基づいた属性の提案"

Copied!
7
0
0

読み込み中.... (全文を見る)

全文

(1)

社会ネットワークにおける構造的特徴を測るための

エゴと周辺の異質性に基づいた属性の提案

A Study on Attributes Based on Heterogeneity of Egos and

Surrounding Nodes for Structural Features in Social Networks

夏目 稔

1

石榑 隼人

1

 武藤 敦子

1

 森山 甲一

1

 犬塚 信博

1

Minoru Natsume

1

Hayato Ishigure

1

Atsuko Mutoh

1

Koichi Moriyama

1

Nobuhiro Inuzuka

1

1

名古屋工業大学大学院工学研究科情報工学専攻

1

Department of Computer Science, Graduate School of Engineering, Nagoya Institute of

Technology

Abstract: 社会ネットワーク分析において,多様な性質を有するグループに接続する接点は有用な 働きをする可能性がある.そこで,本研究は周囲に多様な属性を持つ接点の属性を明らかにする.そ のために社会ネットワークにおける構造的特徴を測るためのエゴと周辺の異質性に基づいた属性の ためのオペレータを定義し,構造的特徴を測るために意味を持つ属性を抽出した.また,抽出した属 性を適用した形式概念分析を用いて,具体的なエゴの振る舞いを分析した.

1

はじめに

近年,社会ネットワーク分析の研究が盛んに行われて いるが,その中でもグラフの部分構造を詳細に分析す るエゴセントリックネットワーク分析がある.エゴセン トリックネットワークは社会関係資本論において,その 行為者が持つ社会関係資本として考えられている.そ の社会関係資本の尺度の 1 つに,「関係する次元(性別, 年齢,人種,職業など)に関する周囲のバラエティー」 である 「異質性」がある [1].ここで,性別,年齢,人 種,職業などはネットワークから得られないため他で 取得する必要がある.しかし,ネットワークから得ら れるネットワークの構造に関する「異質性」を用いた 場合でも,人の社会関係資本すなわちネットワークの 構造的特徴を測れると考えられる.また,社会関係資 本論においてエゴセントリックネットワークの構造は 個人の特性と関係があると考えられている. 本研究では社会ネットワークにおける構造的特徴を 測るための,エゴと周辺の異質性に基づいた属性のた めのオペレータを提案する.提案するオペレータはネッ トワークの構造に基づいて,エゴの基本的属性の値か ら導かれるものである.つまりネットワークにおいて エゴの属性値と周囲の値との関係から値の異質性につ いて定義する.また,その属性を適用した形式概念分 析を行い,学生の友人ネットワーク及び,学生の授業 連絡先:名古屋工業大学大学院工学研究科情報工学専攻 〒 466-8555 名古屋市昭和区御器所町 E-mail: [email protected] 出席に関する行動属性と照合することでエゴの振る舞 いを分析する.

2

準備

本論文で用いるエゴセントリックネットワーク及び 形式概念分析について導入する.

2.1

エゴセントリックネットワーク

各行為者を頂点とし,行為者間の影響関係を辺で表 した無向グラフを考える.社会ネットワーク分析では, 行為者の 1 人 1 人に注目するときに,各行為者をエ ゴと呼ぶ.各エゴを中心としたローカルネットワーク, つまりエゴと直接つながる行為者(オルター)の集合 から誘導される部分グラフをエゴセントリックネット ワーク(以下エゴネット)という.図 1 上のネットワー クにおける F のエゴネットはグレーのネットワークで ある. 図 1: エゴセントリックネットワーク

(2)

ネットワークは組 N = (V, E)(E ⊆ V × V )であ る.V が人の集合のとき,つまり N として人のネット ワークを考える.このとき V のノードをエゴという. あるエゴ e∈ V に対して,3 項組 Ne= (e, Ve, Ee) を e のエゴネットという.ここで,Veは e 及び e と隣接す るノードの集合であり,Eeはこれらのノード間のエッ ジの集合である.エゴネット中の e のオルターの集合 即ち Ve−{e}を A(e) と書く.

2.2

形式概念分析

形式概念分析は,概念データを思考単位として,概 念構造の明確化や事象の分析,データの可視化及び依 存関係などを明らかにするものである. 形式概念分析では,対象の集合 G とそれが取り得る 属性の集合 M を扱う.例えとして,対象の集合として G ={ハト, ヒト, カモノハシ, ネコ}を,属性の集合と して M ={卵生, 言葉 (をはなす), 母乳 (で育つ)}を考 えると,表 1 が得られる.この表を形式文脈という.形 式文脈上の「×」は,ある対象がある属性を持つとい う意味である.対象のある集合 X ⊆ G と,属性のあ る集合 Y ⊆ M に対して,X のすべての対象が共通し てもつ属性の集合が Y であり,Y をすべて有する対象 の集合が X であるとき,組 (X, Y ) を形式概念という. 例えば,X ={ハト, カモノハシ}において,X の対象 が共通してもつ属性の集合は Y ={卵生}であり,Y を すべて有する対象の集合は,{ハト,カモノハシ}であ る.したがって,組 ({ハト, カモノハシ},{卵生}) は形 式概念である. 表 1: 形式文脈の例 名前 卵生 言葉 母乳 ハト × ヒト × × カモノハシ × × ネコ ×

3

従来研究

Kapferer ら [2] が工場作業者の人間関係についてネッ トワークの構造的分析によって説明した例は有名であ る.この研究は個人のネットワーク構造を詳しく見る ことで,その人物の影響力を分析したものである.こ のように社会ネットワーク分析において,構造からわ かる特徴の詳細な分析が盛んに行われている.市場に おける企業の競争関係,行為者の地位・役割分析,ネッ トワークの適正規模,株式仲買人や見合い紹介業者な どの仲介者の利益に関する分析などがある [3]. ネットワークの詳細を数理的に分析することで,エ ゴネットの構造的特徴を分析する研究もその後進めら れてきた.Totterdell ら [4] は,人間個人の個性と人間 関係ネットワークにおけるエゴネットが表す個人的関 係の構造的特徴がどのようにその個人の主観的幸福度 に結びつくのかを経路モデルを用いて示した.伊東ら [5] は,エゴネットの構造的特徴をトップダウンモデル によって定め,これに基づいたクラスタリング手法を 提案した.林ら [6] は,Freeman[7] が人々のグループ への帰属関係に形式概念分析を用いたのに対し,エゴ ネットの構造から形式概念分析を用いて,概念を抽出 し,アンケートデータから得た社会的属性と照合する 手法を提案した.形式概念分析では,一人一人の人間を 形式文脈における対象,その人のエゴネットに含まれ る部分ネットワークである属性グラフを属性とし,得 た形式概念をパターンとしている. 夏目ら [8] は,林らが社会的属性との照合を行ったの に対し,出席データから得た個人の行動特性を生成し, 生成した特性との照合を行った.出席データとは,学 生が各教室の IC カードリーダに授業の入退室時に学 生証(IC カード)を用いた際記録されるデータであり, 学生の授業の出欠管理を目的として取得している.夏 目ら [8] は出席データから授業への遅刻などの行動的属 性を生成し,これとネットワークの構造の関係を分析 した. 社会関係資本の尺度として異質性が挙げられている が,これらの研究では異質性に基づいてエゴネットの 構造的特徴を分析されていなかった.本研究ではエゴ と周辺の異質性に基づいてエゴネットの構造的特徴を 分析することで,これまで測られなかったエゴネット の特徴を測ることを目指す.

4

提案オペレータ及びその活用

本研究では夏目ら [8] の流れに沿って学生の友人ネッ トワークと学生の授業出席に関する行動属性の照合を 手がかりに研究を進める.より適切な構造的分析をす るため構造的特性を測るオペレータを提案する. 異質性属性はエゴネットにおける基本属性の値にオ ペレータを適用することで生成する.基本属性の値は 必ずしもスカラーではないが,その値の上で距離が定 義されている.エゴネットと基本属性からエゴの基本属 性についての異質性を算出するオペレータを提案する. ネットワーク N = (V, E) と V 上の属性(基本属性) v が与えられているとする.v は関数 v:V → X である. X はこの属性の値の集合であり,上で距離が定義され ているとする.2 つのノード e1, e2∈ V に対して,その

(3)

v における値 v(e1) と v(e2) の距離を dist(v(e1), v(e2))

と書く.

4.1

提案オペレータ

本研究では局所独自性オペレータと周辺多様性オペ レータの 2 種類のオペレータを提案する.

局所独自性オペレータ(local uniqueness operator: lu-オペレータと略す)の定義は以下の通りである.N = (V, E),e∈ V ,V 上の属性 v に対し,局所独自性オペ レータを施した結果の属性を vluと書き,以下に定義 する. vlu(e) = 1 |A(e)|e′∈A(e) dist(v(e), v(e′)) (1) すなわち,エゴと異なるオルターを持つエゴほど異 質性が高いと考え,エゴとオルターの差を算出するオ ペレータが局所独自性オペレータである. 局所独自性オペレータの適用例を以下に示す.図 2 のエゴ A に lu-オペレータを適用した場合,属性:次数 中心性に対し,エゴ A とオルターの次数中心性の値を 表 2 に示す. 図 2: 例で利用するネットワーク 表 2: エゴ A とそのオルターの次数中心性の値 次数中心性 A 2 B 3 C 3 D 1 エゴ A とオルターの差を以下に示す. dist(v(A), v(B)) = 1 (2) dist(v(A), v(C)) = 1 (3) dist(v(A), v(D)) = 1 (4) 属性:次数中心性に対し,エゴ A に局所独自性オペ レータを施した結果は次の通りである. vlu(A) = 1 (5)

周辺多様性オペレータ (around diversity operator: ad-オペレータと略す) の定義は以下の通りである.N = (V, E),e∈ V ,V 上の属性 v に対し,周辺多様性オペ レータを施した結果の属性を vadと書き,以下に定義 する. vad(e) = 1 |A(e)|(|A(e)| − 1)e′,e”∈A(e) dist(v(e′), v(e”)) (6) 周辺多様性オペレータはオルター同士の差を算出する オペレータである.オルターのバラエティーを表すた め,定義通りの異質性属性の生成を行える. 周辺多様性オペレータの適用例を以下に示す.図 2 のエゴ A に lu-オペレータを適用した場合,属性:次数 中心性に対し,エゴ A のオルター同士の次数中心性の 値の差を以下に示す. dist(v(B), v(C)) =|3 − 3| = 0 (7) dist(v(B), v(D)) =|3 − 1| = 2 (8) dist(v(C), v(D)) =|3 − 1| = 2 (9) 属性:次数中心性に対し,エゴ A に周辺多様性オペ レータを施した結果は次の通りである. vad(A) = 1.3 (10) また,オペレータを多重に適用することで,高次の 異質性属性を生成できる.したがって,異質性属性を 基本属性とした異質性に関する異質性属性を生成でき る.オペレータを 1 回適用することを一次適用,2 回 適用することを二次適用と呼ぶことにする. ここで,異質性属性を用いて形式概念分析を行うた め異質性属性を 2 値属性にする必要がある.1 つの異 質性属性に対し,その値の分布によって第 1∼第 4 四 分位のいずれに属するかによって 4 つの 2 値属性を用 いることにする.即ち,vluが第 1 四分位数未満である とき vlu 1 を 1(満たさないとき 0),第 1 四分位数以上 から第 2 四分位数未満であるとき vlu 2 を 1(満たさない とき 0),第 2 四分位数以上から第 3 四分位数未満であ るとき vlu 3 を 1(満たさないとき 0),第 3 四分位数以 上であるとき vlu 4 を 1(満たさないとき 0)とした属性 をそれぞれ生成する.同様に vadから vad 1 ∼vad4 を作る こととする.

4.2

提案オペレータの活用スキーマ

提案オペレータの活用は,属性抽出,形式概念分析, 特性照合の 3 つからなるスキーマとして与えられる. 属性抽出として,生成した異質性属性から,エゴネッ トの構造的特徴を測るために意味を持つと考えられる属 性を抽出する.異質性属性の抽出は以下の通りである.

(4)

まず,伊東らのトップダウンモデル [5] を利用し,エ ゴをクラスタリングする.異質性属性とクラスタの相 関を確認し,相関の高い異質性属性を抽出する.クラ スタリングに利用するトップダウンモデルでは,ネッ トワーク中のノードを次の 8 つのクラスタに分類する. 即ち,孤立したもの,次数が域値以下のもの(域値は 3 とした),スターグラフとなるもの,完全グラフとな るもの,そのエゴネットの島数(エゴネットからエゴ を除いたネットワークの連結成分個数)が 1 でありク ラスタ係数が低いもの(低クラスタ),そのエゴネット の島数が 1 でありクラスタ係数が高いもの(高クラス タ),そのエゴネットの島数が 2 以上でありグループ (エゴネットからエゴを取り除いたグラフの連結成分の 内,孤立ノードではないものの数)が 1 のもの(ゲート ウェイ),そのエゴネットの島数が 2 以上でありグルー プが 2 以上のもの(ハブ)の 8 つのクラスタがある.こ のクラスタリングをトップダウンクラスタという. 相関の確認では,各異質性属性について四分位で分 けることで 2 値属性とし,その属性を用いてトップダ ウンモデルでのクラスタリングと相関の高いクラスタ リングができるかを 2 項検定によって確認するものと する. 2 項検定で算出した p 値の平均が小さいほど異質性 属性とクラスタの相関が高いことになるため,p 値の 平均が小さい異質性属性をエゴネットの構造的特徴を 測るために意味を持つ属性として抽出する.以上が属 性抽出である. 次に形式概念分析を行う.一人一人の人間を形式文 脈における対象,抽出した異質性属性を属性とした形 式文脈を作り,形式概念分析を行い,形式概念を得る. 最後に特性照合として,得られた形式概念と学生の 授業出席に関する行動属性と照合するため 2 項検定を 行い,各行動属性において有意性の高い形式概念を抽 出する.

5

実験

5.1

実験方法

実験では,2012 年度の名古屋工業大学の 1 年生 3 クラスの打刻データより生成された友人ネットワーク (ノード(学生)数は 170,友人関係数は 658)を用い る.ここで用いる友人ネットワークは下村ら [9] が提案 した友人スコアを用いて生成した. このネットワークに 4 節で述べたオペレータの活用 スキーマを適用した.基本属性とオペレータは表 4 の 通りである.異質性属性について一次の属性 6(3× 2) 種類,二次の属性 12(3× 2 × 2) 種類の計 18 種類の属 性を生成する. 提案オペレータの活用スキーマ   入力 ネットワーク N = (V, E), 基本属性の集合 B,行動特性の集合 P 1. 属性抽出 1). いくつかの基本属性 B に異質性オペ レータを適用した属性集合 ˜A を取得し, その値に基づき四分位点で 2 値化した 属性の集合 ˜A を用意する  2). ノード集合 V の属性集合 ˜A についての 値と伊東ら [5] のトップダウンクラスタ と照合し,相関の高い属性の集合 ˆA を 抽出する 2. 形式概念分析 1). 対象集合を V ,属性集合を ˆA として形 式文脈 (V, ˆA) を作る 2). 形 式 文 脈 (V, ˆA) か ら 形 式 概 念 の 集 合 (V′ 1, ˆA′1), (V2′, ˆA′2), . . . (V1′, V2′, . . . V, ˆA′1, ˆA′2, . . .⊆ ˆA) を列挙する 3. 行動特性との照合 1). V1′, V2′, . . . 中で行動特性 p(p ∈ P )を 有する割合が,V 全体で p を有する割 合に比べて有意に高い場合を探すため 2 項検定を行う 2). 有意に高い V ” を対象集合とする形式 概念 (V ”, ˆA”) を抽出する     図 3: 提案オペレータの活用スキーマ 図 4: 実験手順

(5)

形式概念と照合する個人の特性は出席データから得 られる行動特性を利用する.行動特性は出席回数,遅 刻回数,平均入室時間差,平均退室時間差,前打刻率, 後打刻率の 6 種類であり,表 4 に記す.これらを 2 値 特性にするため,回数が第 3 四分位数より多い学生を 回数が多いとき 1,回数が第 1 四分位数より少ない学 生を回数が少ないとき 0 とした特性をそれぞれ生成し, 計 12 個の特性を利用する.行動特性の有意性を見るた め2項検定を実施し,p 値 5 %未満を有意味とする. 表 3: 実験で用いる基本属性とオペレータ 基本属性 オペレータ 次数 lu オペレータ エッジ数 ad オペレータ 島数 表 4: 行動特性 行動特性 説明 出席回数 最初から最後まで授業をうけた数 遅刻回数 遅刻した授業の数 平均入室時間差 開始打刻時刻と授業開始時刻の差 の平均 平均退室時間差 終了打刻時刻と授業終了時刻の差 の平均 前打刻率 ある教室において前にある IC カ ードリーダに打刻した割合 後打刻率 ある教室において後ろにある IC カードリーダに打刻した割合

5.2

実験結果

異質性属性の抽出の結果,異質性属性とクラスタの 相関である各異質性属性の p 値の平均は表 5 の通りで ある.この結果から,(次数中心性 × 局所独自性オペ レータ× 周辺多様性オペレータ)と(エッジ数 × 局 所独自性オペレータ)と(島数× 局所独自性オペレー タ)の 3 個の属性を抽出した. 次に,提案した異質性属性と従来属性である属性グ ラフをそれぞれ適用した形式概念分析の結果を示す.抽 出した 3 個の異質性属性を適用した形式概念分析では 103 個の形式概念を得た.103 個の形式概念と行動特性 の照合について,行動特性について「回数が多い」に おいて p 値 5 %未満で有意性が確認された形式概念の 個数は表 6,「回数が少ない」において p 値 5 %未満で有 表 5: 各異質性属性の p 値の平均 オペレータ 次数 エッジ数 島数 luオペレータ 0.114 0.097 0.100 adオペレータ 0.105 0.103 0.113 lu× lu 0.105 0.107 0.104 lu× ad 0.102 0.114 0.105 ad× lu 0.107 0.116 0.105 ad× ad 0.115 0.115 0.105 意性が確認された形式概念の個数は表 7 の通りである. また,比較として従来研究の属性である属性グラフを 適用した形式概念分析では 148 個の形式概念を得た. 表 6: 「回数が多い」において p 値 5 %未満である形 式概念の個数 出席回数 遅刻回数 平均入室時間差 提案 2 1 6 従来 0 2 0 前打刻率 後打刻率 平均退室時間差 提案 7 12 8 従来 0 0 0 表 7: 「回数が少ない」において p 値 5 %未満である 形式概念の個数 出席回数 遅刻回数 平均入室時間差 提案 6 7 2 従来 0 0 0 前打刻率 後打刻率 平均退室時間差 提案 13 8 4 従来 0 0 0

5.3

結果の考察

抽出した異質性属性 3 個において 2 個が局所独自性 オペレータを一次で適用した属性であった.このこと から周辺多様性オペレータより局所独自性オペレータ の方がエゴネットの構造的特徴を測るために意味を持 つ可能性がある. 従来属性では形式概念が得られなかった行動特性に おいて,提案属性では形式概念を得られた.また,ほ とんどの行動特性において従来属性での結果に比べて p 値 5 %未満で有意性が確認された形式概念が多く得 られた.この結果から,提案属性はエゴネットの構造

(6)

的特徴と行動特性との対応関係を明らかにすることに おいて,従来属性より有用であるといえる. 行動特性「出席回数が少ない」と「平均退室時間差 が小さい」において有意性の高い概念上位 3 個を表 8 に記す.これら 2 つの行動特性に現れた異質性属性が 一致した.一致した属性は表 9 の通りである.これら 3 つの異質性属性全てが低異質もしくは微低異質である ことから,異質性の低い学生は出席回数が少なく,平 均退室時間差が小さい可能性がある. 表 8: 「出席回数が少ない」と「平均退室時間差が小さ い」で有意性が高い概念上位 3 個の属性集合と p 値 出席回数が少ない 平均退室時間差が小さい 属性集合 p 値 属性集合 p 値 5,10 0.00 5 0.01 1,10 0.01 5,10 0.02 1,5,10 0.01 1 0.03 表 9: 「出席回数が少ない」と「平均退室時間差が小さ い」で一致した有意性の高い異質性属性 番号 異質性属性 1 次数× lu × ad 低異質 5 エッジ数× lu 低異質 10 島数× lu 微低異質 また,行動特性「平均入室時間差が大きい」と「前 打刻率が高い」において有意性の高い概念上位 3 個を 表 10 に記す.これら 2 つの行動特性において現れた形 式概念 3 個のうち 2 個が一致した.一致した形式概念 において共通の異質性属性を表 11 に記す.この結果か ら,エッジ数において異質性が高く,島数において異 質性が低いエゴネットを持つ学生は,平均入室時間差 が大きく,前打刻率が高い. 表 10: 「平均入室時間差が大きい」と「前打刻率が高 い」で有意性が高い概念上位 3 個の属性集合と p 値 平均入室時間差が大きい 前打刻率が高い 属性集合 p 値 属性集合 p 値 8,9 0.00 2,8,9 0.00 2,8,9 0.02 8,9 0.00 3,8,11 0.02 2,9 0.00 表 11: 「平均入室時間差が大きい」と「前打刻率が高 い」で一致した有意性の高い異質性属性 番号 異質性属性 8 エッジ数× lu 高異質 9 島数× lu 低異質

6

まとめと今後の課題

本研究では社会ネットワークにおける構造的特徴を 測るためのエゴと周辺の異質性に基づいた属性のため のオペレータを定義し,形式概念分析を用いて具体的 なエゴの振る舞いを分析した. 従来属性では有意味な概念が得られなかった行動特 性において,異質性属性では概念を得られた.また,ほ とんどの行動特性において,提案した異質性属性が従 来属性の有意性の高い概念数を上回った.これらのこ とから,提案属性はエゴネットの構造的特徴と行動特 性との対応関係を明らかにすることにおいて従来属性 より有用であるといえる. 今後の課題として,他の社会ネットワークにおける 適用や他の個人の特性との照合が挙げられる.

参考文献

[1] 金光淳 「社会ネットワーク分析の基礎――社会関 係資本論にむけて」勁草書房, 2003.

[2] K.Bruce. Norms and the Manipulation of Rela-tionships in a Work Context, in Social Networks in Urban Situations, Manchester Univ. Press, 1969.

[3] 安田 雪 「実践ネットワーク分析――関係を解く 理論と技法」新曜社,2001.

[4] P.Totterdell, D.Holman, A.Hukin. Social net-workers: measuring and examining individual dierences in propensity to connect with others. Social Networks 30. pp 283-296. 2008. [5] 伊東樹希, 菅田貞治, 武藤敦子, 犬塚信博. 時間的推 移を伴う友人関係の局所的ネットワーク分析, 第 76 回全国大会講演論文集, No.1, pp.375-376, 2014. [6] 林宏紀, 伊東樹希, 西尾典晃, 武藤敦子, 犬塚信博. エゴセントリックネットワークと形式概念分析を 利用した社会ネットワーク分析. 人工知能学会論 文誌 29(1), pp.177-181, 2014.

(7)

[7] L.C.Freeman. Cliques, Galois lattices, and the structure of human social groups, Social Net-works, 18, pp. 173-187, 1996.

[8] 夏目稔, 石榑隼人, 武藤敦子, 森山甲一, 犬塚信博. 友人ネットワークの構造属性と出退席打刻属性に よる形式概念, 信学会東海卒研発表会, 2018. [9] N.Inuzuka, T.Nakano, K.Shimomura. Friendship

Analysis Using Attendance Records to University Lecture Classes. IASK International Conference Teaching and Learning, pp.478-486, 2008.

参照

関連したドキュメント

国民の「知る自由」を保障し、

Series of numerical analysis to estimate structural frequency and modal damping were conducted for a two-dof model using the simulated external forces induced by impulse force and

※ 硬化時 間につ いては 使用材 料によ って異 なるの で使用 材料の 特性を 十分熟 知する こと

ひかりTV会員 提携 ISP が自社のインターネット接続サービス の会員に対して提供する本サービスを含めたひ

① 新株予約権行使時にお いて、当社または当社 子会社の取締役または 従業員その他これに準 ずる地位にあることを

むしろ会社経営に密接

 ①技術者の行動が社会的に大き    な影響を及ぼすことについて    の理解度.  ②「安全性確保」および「社会

または異なる犯罪に携わるのか,の糸ならず,社会構造のある層はなぜに他