2 JAWS web web Share = authorities ReShare = (hubs SNS i j i authorities j i i hubs 1 User i 情報が j によってシェアされる (authorities) j の情報をシェアする (hu

(1)

JAWS2012

_JAWS2012

ユーザー間実距離を用いた

_SNS

ユーザー評価

手法の構築と評価

Evaluation and Development reputation network for SNS user evaluation using

realistic distance

大塚孝信

Takanobu Otsuka

名工大グリーン・コンピューティング研究所，名古屋工業大学大学院情報工学専攻

Center for Green Computing, Department of Computer Science and Engineering, Graduate School of Engineering,Nagoya Institute of Technology

[email protected]

吉村卓也

Takuya Yoshimura

名古屋工業大学大学院情報工学専攻

Department of Computer Science and Engineering, Graduate School of Engineering, Nagoya Institute of Technology

[email protected]

伊藤孝行

Takayuki Ito

名工大グリーン・コンピューティング研究所，名古屋工業大学大学院産業戦略工学専攻

Center for Green Computing,School of Techno-Business Administration, Graduate School of Engineering, Nagoya Institute of Technology

[email protected]

keywords:social network, reputation network

Summary

In recent years, SNS services such as Facebook, Google+, and Twitter are becoming very popular. In such services, many sources of information are posted and shared, although user rankings are hardly considered. In this paper, we propose an new algorithm to evaluate user’s reputation based on its real physical distance. We consider various parameters, including user distance, favorites, and the numbers of friends in SNSs in our evaluation technique. We propose a new reputation network to measure the reliability of SNS information. The following are the features of our proposed method. 1) Ranking manipulation is difficult by using the geolocation data. 2) Can be to get better information. 3) Robust against malicious users.

1. はじめに

近年，Facebookに代表されるSNS(Social networking

Site)サービスのユーザー数が大幅に増加している．それに伴いユーザーの個人情報を抜き取る悪意のあるアプリケーションや誤った情報が拡散するといった問題が増えている．特に震災時には嘘の情報やデマ等が善意のユーザーによりTwitter上で拡散され，本当に必要な情報が埋もれてしまったといった事例も挙げられる．更に，Facebook ではアプリケーションの利用が盛んであるが，性格診断アプリや占いといった，一般的に多く利用されるアプリケーションを装い，ユーザーの個人情報や友人の情報を不正に取得するとともに，アプリケーションがユーザーになりすましてスパムメッセージを不特定多数に送信するといった悪質な事例が多く存在するようになっている．最近ではユーザーの投稿数やコメント数といったSNSのアクティビティをリンク構造と考え，ユーザー評価を行うサービスも存在する[Klout][Qrust]．しかし，リンク構造はSEO業者(Search Engine Opitimize)に代表されるような手法で偽装可能であり，リンク構造のみではユーザー評価に対する信頼性を確保するのは困難である．他にもユーザーの所属コミュニティやメッセージのやりとりによってユーザー同士の信頼度を計る研究も為されているが，パラメータをリンク構造に置き換えているものが多く，完全ではない．本研究では情報の偽装を防ぐことを目的とし，位置情報を利用することでユーザー間の距離をパラメータとして付加し，友人数などのSNS特有の各パラメータに重み付けをすることでSNSにおけるユーザー評価のアルゴリズムを構築するとともに筆者の Facebookデータを用いて評価実験を行った．本稿の構成を以下に示す．まず，2章で提案するアルゴリズムについて述べる．そして，3章において評価実験の結果と得られた知見について示す．その後，4章において本研究と関連する先行研究を紹介する．そして最後に，5章で本稿のまとめと今後の課題を示す．

(2)

2. ユーザ間距離を用いた評判ネットワークの

提案

2·1 基本の考え方 webページのランク付けに用いられる手法を用いてユーザーのランク付けを行う場合，webページのランキング手法に用いられるリンク要素を置き換えることで応用できる． • 自分の投稿した情報がシェアされた場合（Share） =出リンク（authorities） • 他のユーザーによって投稿された情報をシェアする場合（ReShare）=入リンク(hubs）このように考えることが出来る．これをSNS要素に置き換えるとユーザiの情報がユーザjによりシェアされた場合はユーザiによっての権威（authorities）でありユーザjの情報がユーザiによってシェアされた場合はユーザiにとってのハブ（hubs）となる．ユーザ間の関係をリンク構造に当てはめると図1となる． User i User j 情報が j によってシェアされる（authorities) j の情報をシェアする（hubs) 図 1 ユーザ間の関係 本研究では代表的なSNSサイトとしてFacebookを選び，評価実験には筆者のFacebookユーザーデータを用いることとした． 2·2 ユーザ間現実的距離の概念 ユーザー間の現実的距離とはSNSサイトのプロフィールに投稿された居住地や投稿情報に付与されたジオタグ等により情報をやりとりしたユーザー間の現実距離をkm 単位で算出することを指す．ユーザ間距離にはユーザーの居住地同士の現実距離とユーザーの投稿した情報同士の現実距離の2つのパターンが存在すると考える．本アルゴリズムではHITSやPagerankなどの単純なユーザ関係に加え，ユーザ間の現実的な距離（Distance）を考慮することとしている．これは単純にユーザ間の現実的距離が小さい場合は現実世界でユーザ同士が顔なじみである可能性が高いと仮定しているため，通常の友人関係での情報のやり取り同様に重要ではない情報をシェアする事が多く想定される．対してユーザ間の現実的な距離が離れている場合でも情報をシェアし合う仲と仮定し，現実的な距離が近い場合に比べ有益な情報が多く存在していると仮定しているためである．すなわち，SNS上において同僚や同級生同士の会話のような現実のコミュニケーションの延長でのやりとりと比較し，ユーザー間の実距離が離れていてもシェアされる情報の価値が高いと仮定している．ユーザ間の現実的な距離の例を図2に示す． User i User j authorities hubs User i User k authorities hubs 現実的な距離現実的な距離 図 2 ユーザ間の現実的な距離 この場合では現実的な距離が近いユーザi,kと比較しユーザi,jでは現実的な距離が遠いため情報の重みを距離によって考慮する必要がある．これにより，従来リンク/被リンクのみの単純な順位付けであったものをユーザ間の現実的な距離を考慮することによりリンクの重みを付加することができ，従来手法と比較した場合にユーザ評価をより正確に行うことが可能であると考える． 2·3 PageRankを応用したアルゴリズムの提案 GoogleのPageRankは「多くの良質なページからリンクされているページは，やはり良質なページである」という再帰的な関係をもとに，全てのページの重要度を判定している．PageRankとは単純な総和公式，その源は学術誌の間での論文参照構造の分析にさかのぼる公式である．[Toher 99]ページPiのPageRankは，r(Pi)と書くが，Piを指している全てのページのPageRankの総和となる．ここで，Bpは，Piを指すページ（バックリンク）の集合であり，_{|P j|}はページPjからの出リンクの個数である．この際，ページPiの入リンクとなるページのPageRankである値r(Pj)が未知であるが，反復法を用いて解決している．すなわち，最初に全てのページが同じPageRankの値（ウェブインデックスにあるページの個数をnとして，1/n）を持つと仮定する．そこでインデックスの各ページPiについてr(P i)を計算する．それらを繰り返し計算することにより算出することができる．計算式を以下に示す． rk+1(Pi) = ∑ Pj∈Bpi rk(pj) |Pj| この手続きはすべてのページPiに対して,r0(P i) = 1/n として開始され，PageRankの得点が最終的には安定した値に収束するものと期待され繰り返される．図3のような6つのインデックスのページを計算した場合次のような有向グラフが形成される．ここまでがPageRank の仕組みであるが， Distance-HITSと同じくwebページのランク付けをユーザの評価

(3)

1 2 3 5 6 4 図 3 web ページの有向グラフ とした上でユーザ間の現実的な距離情報を付加する．これにより以下計算式となる． rk+1(Pi) = ∑ Pj∈Bpi {rk(pj) |Pj| + αd(Pi, Pj)} 単純にdを足すだけではなくαを挿入することにより，パラメータの設定を容易としている．パラメータについては評価実験を含めて実施する際に最適な値を模索していく． 2·4 SNSの各パラメータと重み付け SNSには様々な要素が存在する．Facebookにおけるパラメータを以下に示す． •情報を他のユーザーに拡散する-シェア •自分の投稿した情報が他のユーザーにより拡散される-リシェア •自分がフォローしている友人数 •自分がフォローされている被友人数 •自分の投稿した情報が他のユーザーにより評価される-被いいね！数 •友人の投稿した情報を自分が評価する-いいね！数 •友人のウォールにコメントする-コメント数 •自分のウォールに友人がコメントする-被コメント数上記のように様々なパラメータが存在するが，本研究では自分の投稿した情報が他のユーザーにより拡散される行為（リシェア）をリンク構造のパラメータとして用いている．ユーザーによる投稿間の実距離についてはFacebook の提供するAPIでは取得できなかったため手作業で追加している．また，友人数についてはフォローしている友人数のみではなく，フォローされている被友人数を友人数で割ることとしている．これにより，友人数が多いだけのユーザーより，被友人数が多いユーザーの方が評価が高くなるよう配慮している．特にFacebookのような実名でのコミュニケーションを重視するSNSサービスに於いて，友人数はフォローすることで増やすことが可能であるが被友人数は相手の同意がない限り増やすことができないためである．

3. 評価

実

験

3·1 実 験設定 評価実験には筆者のFacebookデータを用いている．データはFacebookの提供するGraph.APIを用いており，ユーザー同士の投稿のシェアの記録を取得することができる．データには256人の友人（ノード）と3568件の投稿のシェア/リシェアの情報が記録されている．本研究ではシェアした回数よりも情報がシェアされることに重きを置くこととし，計算アルゴリズムにはDistance-Pagerank を用いることとした．筆者のFacebookネットワークを可視化したものを図4に示す． 図 4 筆者の Facebook ネットワーク このデータを用いて独自に開発した計算アプリケーションを用いてユーザー毎の固有値ベクトルをスコアとして算出している．アプリケーションの開発環境及び評価実験に使用した計算機環境を以下に示す． •使用言語：Java

(4)

•使用IDE：Eclipse Juno ver.4.2

• OS: Mac OSX 10.8

•使用計算機：MacBookPro 17inch (Early 2011)

• CPU: 2.66Ghz Intel Core i7 • Memory: 8GB 2067 MHz DDR3 アプリケーションはJavaによって記述されており，外部アプリケーションで出力したユーザー情報を.csv形式で取り込むことでスコア計算を行う．開発したアプリケーションはGUIインターフェースで操作可能であり，アプリケーションでは通常のPagerankのみでのスコア， Distance-Pagerankでのスコア，被友人数/友人数を考慮に入れたスコアを計算することが可能となっている．更に Pagerank,Distance-Pagerankと被友人数/友人数の重みを 0から1の範囲で調整することが可能である．計算したスコアは.csv形式で書き出しを可能としている．開発したアプリケーションを図5に示す．計算パラメータの選択重みの設定ユーザーID スコア 図 5 開発したスコア計算アプリケーション 3·2 実験結果筆者のFacebookデータを用いて実際に計算した結果を示す．以下の3種類について計算を行っている． (1) Pagerankのみで計算 (2) Distance-Pagerankでの計算 (3) Distance-Pagerankと被友人数/被友人数での計算計算には開発した計算アプリケーションを使用しており，縦軸はユーザーのスコア，横軸をユーザーIDとしている．散布図の作成には計算アプリケーションによって計算されたスコアをRを用いてグラフ化している．図6にPagerankのみでの計算結果を示す． Pagerank のみでの計算結果では投稿がシェアされることの多いアクティブユーザーの評価が高いことが分かる．筆者のネットワークで最も高いユーザーはITジャーナリスト，2位のユーザーはITエバンジェリストであるため，投稿が多 User ID Score スコアが最も高いユーザー ITジャーナリスト 図 6 Pagerank のみでの計算結果 くシェアされていることがわかる．2位以下についてはおおまかに2つのグループに分けられており，スコアが中間的なユーザー層，その他の多くのユーザーがスコアの低いユーザー層となっており，正規分布に類似した形となっている．次は，Distance-Pagerankでの計算結果を図7に示す． User ID Score スコアの変動したユーザー群 図 7 Distance-Pagerank の計算結果 図6に示すPagerankのみの結果と比較して，上位3位以下に変動が見られる．投稿間の実距離をパラメータとして用いることで投稿のシェアだけではなく，実距離が離れたユーザーから投稿をシェアされることでスコアが向上していることが分かる．また，下位ユーザーに関し

(5)

ては近くの友人や学校の同級生といった現実世界の延長としてコミュニケーションを行っているユーザーのスコアが下がっていることが分かる．距離をパラメータとして挿入することでスコアが中間的なユーザー層の順位が大きく入れ替わっており，実距離の遠いユーザーからリシェアされるユーザーのスコアが向上していることが分かる． Distance-Pagerankと友人数での計算結果を図8に示す．図7のDistance-Pagerankの結果と比較してあまり User ID Score スコアの変動したユーザー群 図 8 Distance-Pagerank と友人数での計算結果 変化はないが，一部の下位ユーザーのスコアが変動していることが分かる．これは被友人数を友人数で割った後にパラメータとして挿入しているため，機械的に友人数を増やしているユーザー，すなわち友人数のみ極端に多く被友人数が少ないユーザーが存在しないため，あまり変化が見られないものと考える． 3·3 考察評価実験により，実際のFacebookデータと現実的な距離をユーザー評価に結びつけることでリンク構造だけではない評価手法を提案した．本手法の特徴を以下に示す． (1) ジオロケーション情報を用いるためランキング偽装に対して強い．シェアする/シェアされただけのリンク構造による評価では自動スクリプトなどにより故意に評価を上げることが出来るがユーザーのジオロケーションに紐付いた情報間の距離は偽装しにくい (2) より良い情報を手に入れることができる．いたずらに情報のやり取りが多いだけではなく距離の離れているユーザーにも投稿がシェアされているという関係のほうが評価が高くなるため，より有益な情報の入手が可能となる． (3) 悪意のあるユーザーに対して強固である．良いユーザーからの情報を優先的に表示させることで悪意のあるアプリケーション等の拡散を防止できる．上記特徴はリンク構造のみの評価ではなく情報間の実距離を反映することにより実現できる．

4. 関

連

研究

4·1 SNSのユーザー評価に関する研究 webのコミュニケーションは年々増加しておりFacebook やGoogle+に代表されるSNSサービスで活発なコミュニケーションが行われている．しかし，さまざまな意見が書き込まれるものの，有用な情報のみを見つけることが困難である．また，偽の情報が拡散したり，悪意のあるアプリケーションを実行させるといった問題が挙げられている．オンラインオークションやwebページの評価をするために数多くの研究がなされている．また，SNSにおける「ソーシャルな強さ」を計る研究も数多くある．オンラインオークションではwebページ評価手法であるHITS を応用したANT(Auction Network Trust)という研究があり，webページのリンク構造をユーザーの取引情報に当てはめ，信頼度の高いユーザーをランキングすることを目的としている．[小林09]この研究はSNSサービスにも応用でき，取引ではなくユーザー間のコメントや友人関係に当てはめることでユーザー評価ができると考えている．しかし，コメント数や友人数は単純なスクリプトにより簡単に偽装が可能であることから“ 偽装しづらい “ パラメータを挿入する必要があると考えている．また，

webページの評価手法にはPageRankやHITSが多く用いられている．HITSはwebページへのauthorities, hubs のリンク構造によりページの固有ベクトルを求め，その値によりページ評価を行っている．Pagerankは多くの良質なページからリンクされているページは良質であるという考え方を用いている．この考え方は論文評価のシステムが発端であり，多くの良質な論文から引用される論文は良い論文であるという考え方をwebページに応用したものである．．これらの考え方をSNSのユーザー評価に当てはめた場合，HITSはコメント回数や友人関係などのリンク構造で表すことが出来る．PageRankの場合は SNSにおける「良質なユーザー」をどう決定するのかという問題が残る．PageRankの計算式を読み解くと良質なページの定義は多くのページにリンクされているかどうかを主なパラメータとしているため，先ほど述べたように単純なスクリプトによりリンク構造の偽装に遭遇しやすいと考える．例えば，リンク構造を利用した口コミ評価を行う手法[小倉08]などもある．また，webページとは異なりSNS特有の友人同士のアクティビティを利用しソーシャルな繋がりを重視した研究も数多く為されている．SNSサービスにはコミュニティという概念があり，同じ学校や同じ職場，同じクラブ活動など現実世界のコ

(6)

ミュニティと同じものや，現実世界とは関係がない趣味，嗜好のコミュニティといったものがある．これらソーシャルな繋がりがどのような要素によって決定しているかを研究したものがある.この研究によるとソーシャルな繋がりはユーザー同士の親密が最も深く，それらは訪問回数，友人数,友人間のメッセージのやりとりにより決定されるとあり[Eric 09]，必ずしも同一コミュニティにいるから親密とは限らない．しかし，活発な情報交換や訪問回数では友人同士のソーシャルな強さ(Social Strength)は計ることが出来るが，友人以外の有益な情報は得にくいと考える．また，本研究に類似した内容でユーザー間の距離をひとつのパラメータとして考えた研究もある．[Jackson 08][Bloch 07]この研究はユーザーをノードとして捉え，ネットワーク・トポロジーでのパス長を距離と考えたものである．例えば友人の友人からの情報をリシェアした場合は友人の情報をシェアするよりも有益という考え方である．パス長という考え方は新しいがwebページなどのリンク構造による評価ではないSNSならではの考え方でユーザ評価をできないか考えた．更に，友人の友人は友人であるという考え方に基づき，SNSのグループ構造を可視化した研究[Adams 12]，やVCGネットワークを用いて信頼度を測る研究[Zhang 12]もある．これらの考え方をSNSサービスに適用した場合，リンク構造のみに評価を頼ることになるため評価の詐称がしやすいとも言える．リンク構造を悪用し，webページの検索順位を上げるといった方法はSEO（Search Engene Optimization) 会社により多く行われている．これにより，アフィリエイトを目的としたwebサイトのような内容もないページがランキング上位に来ることでユーザーにとって必要な情報が手に入りにくくなる．よってSNSの評価手法にはユーザー間の実距離を用いることで従来とは違う評価手法を提案する．特にスマートデバイスが普及してきた現在にとってはジオロケーション情報は容易に取得できる．ジオロケーションは端末側をHackしない限りは偽装が困難であることからリンク構造と比較して高い信頼度を持つ．本研究ではユーザーのジオロケーションを用いてユーザー間の実距離を用いた評価手法を提案する． 4·2 Webページのランキング手法 Yahoo!やGoogleに代表される大手検索サイトをはじめとしてwebページの信頼性を計る指針としてHITS,PageRank などが用いられている．これらは主にページ同士のリンク関係に評価を依存しており，単純なスコアリングに基づいた評価とも言える．そのため，SNS におけるユーザ評価を行い「信頼」を担保するという意味でリンク関係のみを用いるのみでは評価が困難である．リンク構造の評価アルゴリズムにおいて，代表的なものにHITSと PageRank がある．HITS とはHypertext Induced Topic

Searchの略であり，クラインバーグらによって1998年

に発明された．HITSはPageRank同様webページに関

連した任意得点を作るのにハイパーリンク構造を用いている．しかしHITSとPageRankには重要な違いがある

PageRankは各ページに対して任意得点を1つ作成する

が，HITSは2つ作成する．HITSはwebページを権威

（authorities）とハブ(hubs）として考える．権威は沢山の入リンクを持つページであり，ハブは沢山の出リンクを持つページである．権威とハブは次の巡回的な主張が成り立つとき良い（good）と言われている．つまり，良い権威たちは良いハブたちによって指されており，良いハブたちは良い権威たちを示している．またHITSにはいくつかの問題点と[Mui 03]，多くの改良法が提案されている.[Li 02][手塚06] [Bharat 98]これをSNS要素に置き換えるとユーザiの情報がユーザjによりシェアされた場合はユーザiによっての権威（authorities）でありユーザ jの情報がユーザiによってシェアされた場合はユーザi にとってのハブ（hubs）となる．GoogleのPageRankは「多くの良質なページからリンクされているページは，やはり良質なページである」という再帰的な関係をもとに，全てのページの重要度を判定している．PageRankとは単純な総和公式，その源は学術誌の間での論文参照構造の分析にさかのぼる公式である.[Schillo 00]ページPiの PageRankは，r(Pi)と書くが，Piを指している全てのページのPageRankの総和となる．ここで，Bpは，Piを指すページ（バックリンク）の集合であり，_|P_j_|はページPjからの出リンクの個数である．この際，ページPi の入リンクとなるページのPageRankである値r(Pj)が未知であるが，反復法を用いて解決している．すなわち，最初に全てのページが同じPageRankの値（ウェブインデックスにあるページの個数をnとして，1 = n）を持つと仮定する．そこでインデックスの各ページPiについて r(P i)を計算する．それらを繰り返し計算することにより算出することができる．この手続きはすべてのページ Piに対して,r0(P i) = 1 = nとして開始され，PageRank の得点が最終的には安定した値に収束するものと期待され繰り返される．webページのランキング手法については多くのサービスでHITS，Pagerankが用いられており，リンク構造による評価により検索した際の表示順序を決定している． 4·3 オークションサイトにおけるユーザー評価手法 オークションなどではさまざまな手法を用いてユーザ評価を行っている．一般に，eBay，Yahoo! Auctions，などの，オンラインのオークションやショップで使われる評判メカニズムは，単純なスコアリングメカニズム（ sim-plescoring mechanism）である．単純なスコアリングメカニズムでは，単純な数値とその合計を用いて，買い手が売り手を評価したり，売り手が買い手を評価したりする．単純なスコアリングメカニズムの欠点については次節で説明する．評判メカニズム（reputation mechanism）は，マルチエージェントシステム，計算機科学，ゲーム

(7)

理論，生物学など，広い範囲で研究されている．特にマルチエージェントシステムの分野では多くの先行研究がある．文献[Mui 03][Mui 02]では，評判メカニズムを幅広く調査し，明快な階層型の分類を提案している．まず評判メカニズムは，個人型（Individual）とグループ型（Group）に分類される．本論文で注目する個人型は，さらに直接型（Direct）と間接型（Indirect）の評判システムに分類される．直接型の評判メカニズムはさらに，観察型（observed）と偶発型（encounter-derived）に分類される．間接型の評判メカニズムは，（事前）確率型（ prior-derived），グループ型（group-derived），および伝搬型（propagated）に分類される．．オンラインのオークションやショップの評判メカニズムはほとんどが，個人型，直接型，かつ観察型，もしくは，個人型，直接型，かつ偶発型に分類される．間接型でかつ伝搬型の間接的評判メカニズムを構築する研究[Schillo 00] [Sabater 02] [Yu 02] もある．これらの研究では，評判情報がエージェントからエージェントに渡されながら伝搬する．これらの評判メカニズムの研究の特徴は，自ら仮想的なエージェントの社会を作り，その中で評判メカニズムを構築し解析しているwebページをランキングするメカニズムも，web ページの評判メカニズムとして見る事ができる．さらに，インターネットオークションに関しては，その他の様々な観点から研究が行われている．インターネットオークションでは詐欺行為が問題になっており，オークションに内包されているデータから詐欺者を同定しようという研究が多い．代表的なものとして，オークションでの評価時間に着目したコミュニティ抽出[Pandit 07]や，オークション内の取引関係から確率推論を用いて特異なパターンを抽出し，詐欺者を同定する研究[Pandit 07]などがある．また，インターネットオークションにおけるユーザの信頼を解析した研究も行われている． 4·4 SNSにおけるユーザー評価の重要性 SNSにおいてはデマ情報の拡散などによりユーザーにとって有益ではない情報が多く伝搬されている．Facebook に代表されるようなSNS内でのアプリケーション連携をもつサービスでは，悪意のあるアプリケーション情報が伝搬されることにより個人情報の漏えいや，アカウント乗っ取り等が起きている．また，盗まれたアカウント情報により自分自身が他のユーザへスパムメールを送るなどといった事例もある．そのため，情報の信頼度を確認するためにユーザのランク付け手法が重要だと考えている. 現状の多くのサービスではユーザーにより投稿された情報をスパム解析ソフトウェアによる解析や目視によるチェックをすることによって有害な情報を抽出している．しかし，それらの手法では近年のユーザー数の増加には対応できておらず，実際にも全ての有害な情報を排除できているとは言い難い．これらの手法を用いる際にも有益な投稿を数多くしているユーザをランク付けし，ランク上位のユーザーに対しては有害情報のチェックを省くこととし，他のユーザの投稿情報のチェックに処理能力を割り当てるといったことも考えられる．ユーザ同士の信頼度を評価する評判ネットワークについてはいくつかの研究がある．ユーザの属するコミュニティによりソーシャル

深度（Social Tie)を算出する方法[Eric 09]やユーザ間の

関係をVCGメカニズムによりトラストネットワークとして算出する方法[Zhang 12]などが挙げられる．これらはユーザーの友人関係や所属コミュニティによってユーザのランク付けを行うアルゴリズムである我々はユーザー間の実際の距離をパラメータとして扱うことでユーザーのランク付の正確さに貢献できないか考えた．

5. ま

と

め

本論文では実際にFacebookのユーザー関係をネットワーク構造として捉え，既存のwebページの評価手法を用いた．これによりリンク構造だけの評価手法では故意的なスクリプトによるランキングの改ざんが可能であると考えている．しかし，ジオロケーションを外部から操作できない状態での情報間実距離を用いたランキング手法においては悪意のあるユーザーによるランキング操作が行いにくい．SNSサービスではユーザー数が増えるにつれ悪意のあるユーザーによる投稿を排除したりウイルスの埋め込まれたアプリケーションによる被害が多く報告されるようになってきている．そのため，ユーザー間距離をパラメータとして捉えることによりユーザーのランク付けの確実度を計る手法について提案した．今後は SNS特有のコメント数，いいね！数といったパラメータに関しても実装していく．特にFacebookやでは外部サイトとの連携でいいね！数を追加することがごく気軽に可能なため，パラメータとしては低く扱うべきだと感じている．そのため，適切な重みを付けた上で総合的に評価することを目標としているまた，現状では距離情報の取得が自動化されていないためFacebookAPIより自動で取得する機能を実装する必要がある．更に，計算の過程で判明した結果として少ないユーザー数で計算した場合，1 つのリシェアによりスコアが大きく左右されるといった問題もある．この問題はPagerank，HITS共にある問題であり，全てのページ（リシェア）の総和により計算を行うため，リシェアの総数が少ない場合はリシェアの数が少し変動しただけで結果が大きく変わってしまう．筆者一人のデータのみではユーザー数に限界があるため，他のユーザーデータを入手することで大規模なデータを用いることでより多くの実験を行うこととしている．この手法を用いることによりユーザランクによる情報の信頼度を計ることができる．また,SNSサービスにあるさまざまなパラメータを組み合わせることで評価手法として確立したい．SNSサービスにはさまざまなパラメータが存

(8)

在しており，SNSサービスによって異なることが多いが，各パラメータについてSNS毎にカテゴリを設定し定量化することとしている．今後はFacebookAPIからの距離の取得を自動化することでFacebookアプリケーションとしての開発を進めるとともに他ユーザーのデータを取得することで大規模な実験を行い，評価していく．謝辞本研究の一部は，内閣府の先端研究助成基金助成金（最先端・次世代研究開発プログラム）により助成を受けている．

♦

参考文

献

♦

[Klout] Klout.inc,”Discover and be recognized for how you influence the world.”,http://klout.com/home.

[Qrust] Overtex Group,”SNS 影響力スコアリング解析サービス Qrust.”,http://qru.st/.

[小倉 08] 小倉達矢, 宍戸開, 今藤紀子, 山口実靖, 淺谷耕一,” レビューサイトにおける良質なレビューの特性とそれを考慮した評判情報の抽出に関する一考察”, DEWS2008-Data Engineering Workshop,2008.

[小林 09] 小林真雄, 安藤哲志, 伊藤孝行,”Auction Network Trust : 電子商取引ネットワークにおけるユーザ間の関係を利用した評判メカニズム”, 電子情報通信学会論文誌,Vol.J92-D, No.11.2009. [Taher 99] Taher H. Haveliwala, “ Efficient Computation of

PageR-ank, ”1999 Stanford Technical Report.

[Brin 98] S. Brin and L. Page,“ The anatomy of a large-scale hyper textual web search engine, ” WWW7/Computer Networks, vol.30, no.1-7), pp. 107-117, 1998.

[Li 02] L. Li, Y. Shang, and W. Zhang,“ Improvement of hits-based algorithms on web documents, ” Proceedings of WWW2002, pp. 527-535, 2002.

[Eric 09] Eric Gilbert and Karrie Karahalios,“Predicting Tie Strength With Social Media, ”Proceedings of the 27th international confer-ence on human factors in computing systems, 2009.

[Josep 02] Josep M. Pujoi, Ramon Snguesa, and Jordi Delgado,“ Ex-tracting reputation in multi Agent Systems by Means of Social Net-work Topology, ”Proceedings of the first international joint confer-ence on Autonomous agents and multiagent systems, pp. 467-474, 2002.

[Amy 06] Amy N. Langville and Carl D. Meyer.“Google’s PageRank and Beyond: The Science of Search Engine Rankings, ” Princeton University Press, June 2006.

[Toher 99] Taher H. Haveliwala,“ Efficient Computation of PageR-ank, ”1999 Stanford Technical Report.

[Bloch 07] Bloch,F.and M.O.Jacsonjacson,”The Formation of Net-works with Transfers among Players”,Journal of Economic The-ory.2007

[Bharat 98] K. Bharat and M. R. Henzinger, “ Improved algorithms for topic distillation in a hyperlinked environment, ”Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 104-111, 1998. [Kleinberg 99] J. Kleinberg,“ Authoritative sources in a hyperlinked

environment, ”Journal of the ACM, vol. 46, no. 5, 1999.

[Rensnick 02] P. Resnick and R. Zeckhauser,“ Trust among strangers in internet transactions: Empirical analysis of ebayfs reputation sys-tem, ”The Economics of the Internet and E-Commerce, vol.11, pp. 127-157, 2002.

[Mui 03] L. Mui,“ Notions of reputation in multi-agents systems: A review, ”PhD thesis, Massachusetts Institute of Technology, 2003. [Mui 02] L. Mui, A. Halberstadt, and M. Mohtashemi,“ Notions of

reputation in multi-agent systems A review, ”Proceedings of the 1st International Joint Conference on Autonomous Agents and Multi-Agent Systems (AAMAS 2002), pp. 280-287, 2002.

[Schillo 00] M. Schillo, P. Funk, and M. Rovatsos,“ Using trust for detecting deceitful agents in artificial societies,“ Applied Artificial Intelligence, vol.14, no.8, pp.825-848,2000.

[Sabater 02] J. Sabater and C. Sierra, “ Reputation and social net-work analysis in multi-agent systems, ”Proceedings of the first in-ternational joint conference on autonomous agents and multiagent systems, pp. 475-482, 2002.

[Yu 02] B. Yu and M.P. Singh, “ An evidential model of distributed reputation management, ”Proceedings of the 1st International Joint Conference on Autonomous Agents and Multi-Agent Systems (AA-MAS 2002), pp. 294-301, 2002.

[Zhang 12] Haoqi Zhang, Edith Law, Robert C. Miller, Krzysztof Z. Gajos, David C. Parkes, and Eric Horvitz, “ Human Computation Tasks with Global Constraints: A Case Study, ”Proceedings of the ACM Conference on Human Factors in Computing, 2012. [Nongyui 04] Z. Gy.Nongyi, H. Garcia-Molina, and J. Pedersen,

“ Combating web spam with trust rank, ”Proceedings of the Thir-tieth international conference on very large data bases, pp. 576-587, VLDB Endowment, 2004.

[Pandit 07] Shashank Pandit, Duen Horng Chau, Samuel Wang, and Christos Faloutsos,“ Netprobe: a fast and scalable system for fraud detection in online auction networks, ”Proceedings of the 16th inter-national conference on World Wide Web (WWW’07), pp. 124-132, 2007.

[Pandit 07] S. Pandit, D.H. Chau, S. Wang, and C. Faloutsos,“ Net-probe: A fast and scalable system for fraud detection in online auc-tion networks, ”Proceedings of the 16th internaauc-tional conference on World Wide Web (WWW’07), pp. 201-210, 2007.

[手塚 06] 手塚友，浅野泰仁，西関隆夫，“ 現在の web における HITS について，”電子情報通信学会技術研究報告. COMP, コンピュテーション，vol.105，no.679，2006．

[Jackson 08] Matthew O.Jackson, ”SOCIAL AND ECONOMIC NETWORKS”,Princeton University Press,2008.

[Adams 12] Paul Adams,”GROUPED:How small groups of friends are key to influence on the social web”,New Riders,2012.

2 JAWS web web Share = authorities ReShare = (hubs SNS i j i authorities j i i hubs 1 User i 情報が j によってシェアされる (authorities) j の情報をシェアする (hu

JAWS2012

ユーザー間実距離を用いた

SNS

ユーザー評価

手法の構築と評価

Evaluation and Development reputation network for SNS user evaluation using

realistic distance

大塚 孝信

吉村 卓也

伊藤 孝行

1.

は じ め に

2.

ユーザ間距離を用いた評判ネットワークの

提案

3.

評 価

実

験

4.

関

連

研 究

5.

ま

と

め

♦

参 考 文

献

♦

_JAWS2012

_SNS

大塚孝信

吉村卓也

伊藤孝行

はじめに

評価

研究

参考文