属性付きグラフに対する効率的なコミュニティ問合せ処理
2
0
0
全文
(2) 情報処理学会第 81 回全国大会. 3.1 緩和 ATC 問題の定義 問題定義 1 に示した通り,ATC 問題は truss 構造 を多く含むコミュニティしか見つけることがで きない.しかし,これは実グラフにおいて,精 度を大幅に低下させる要因となる.本研究では𝑘 を可変とした(k, d)-truss,すなわち(*, d)-truss を 考え,緩和 ATC 問題を次のように定義する. 定義 3[(*, d)-truss]. クエリノード𝑣𝑞 が与えられ たとき,部分グラフ𝐻が(*, d)-truss であるとは, 𝑣𝑞 ∈ 𝐻を満たし,かつ𝐻が𝑑𝑖𝑠𝑡𝐻 (𝐻, 𝑣𝑞 ) ≥ 𝑑を満 たすことを言う. 問題定義 2[緩和 ATC 問題]. グラフ𝐺(𝑉, 𝐸),クエ リ𝑄 = (𝑣𝑞 , 𝑊𝑞 ),及びパラメータ𝑑が与えられた とき,𝑓 (𝐻, 𝑊𝑞 )が最大となる(*, d)-truss である部 分グラフ𝐻を見つける.. 図 1. F1-Score の比較. クエリ:先行研究[2]に基づき,ランダムなクエ リ𝑄 = {𝑣𝑞 , 𝑊𝑞 }を 100 回与える.属性集合はクエ リノードが含まれるコミュニティで最頻出な属 性値と,その他のコミュニティに最も現れない 属性値の 2 つを与える. 3.2 ビームサーチを用いた問合せ処理手法 評価指標:本実験では,各データセットで提供 問題定義 2 で示した緩和 ATC 問題の解法を提案 されている真のコミュニティと各手法が検出し する.本稿ではビームサーチを用いた緩和 ATC 問 たコミュニティの間の精度を F1-Score を用いて 題の解法を提案する. 評価する. ビームサーチは,幅優先探索のようにある状態 実験結果:実験結果を図 1 に示す.図 1 より,提 から遷移先の状態をキューにプッシュすること 案 手 法 はビ ー ム幅 を 十分 に 大 きく す るこ とで で,逐次的に探索木上を走査する探索手法であ LocATC と比較してより高い精度でコミュニティ る.そこに,ビーム幅𝐵というパラメータを加え, を推定できることがわかる.この理由はビーム 遷移先の状態数が𝐵を超えた場合,暫定評価の最 幅の増加に伴い,より多様な状態を保持しなが も良い𝐵個のみを探索し,残りの状態は枝刈りす ら探索したからであると考えられる.以上によ る.これにより,探索木の各レベル(深さ)にお り,提案手法の有効性を実験的に確認した. いて多様な状態遷移の可能性を保持しつつ,全 探索と比較して高速に探索を終える. 5 まとめ 提案手法では,まずビームサーチの初期状態 本稿では ATC 問題の構造的制約条件を緩和した としてクエリノードのみを要素とした部分グラ 緩和 ATC 問題を新たに定義し,ビームサーチを用 フを入力する.次に優先度付きキューからビー いた緩和 ATC 問題に対する素朴な解法を提案した. ム幅𝐵に応じて最良の𝐵個だけ部分グラフをポッ 我々の実験において提案手法は従来手法である プし,それぞれについてその部分グラフとその LocATC と比較してより正確に真のコミュニティ 隣接ノードからなる(k, d)-truss を2 ≤ 𝑘 ≤ 𝑘max に近いコミュニティを算出でき,実データに対 の範囲で計算し,見つかったそれぞれの(k, d)して有効であることを示した.今後の課題とし truss を個別に優先度付きキューにプッシュする. て,提案手法の高速化が挙げられる. ただし,𝑘maxは𝐺中の最も大きな(k, d)-truss にお ける𝑘の値とする.これを繰り返し,その過程で 謝辞 最も Attribute Score Function が高かった部分 本研究の一部は,科研費若手研究 (18K18057) グラフを解として出力する. ならびに JST ACT-I の支援を受けたものである. 4 評価実験 参考文献 本節では提案手法の精度を評価する.本実験 [1] Y. Zhou, et al., "Graph Clustering Based では𝐵 = 10および𝐵 = 30と設定した提案手法な on Structural/Attribute Similarities," らびに従来手法 LocATC [2]を比較する. PVLDB, 2009. データセット:先行研究 [2]で利用されていた [2] X. Huang et al., "Attribute-Driven Facebook データセットからノード ID 0, 107, お Community Search," PVLDB, 2017. よび 348 を中心とした Ego ネットワークを用いる.. 1-416. Copyright 2019 Information Processing Society of Japan. All Rights Reserved..
(3)
関連したドキュメント
業務繁忙時にも対 応できるよう、施 設に必要な従事者 を適正に配置する とともに、利用者 サービス向上、効 率的・効果的な管 理運営の観点を踏
研究開発活動の状況につきましては、新型コロナウイルス感染症に対する治療薬、ワクチンの研究開発を最優先で
The demand for kimonos has fallen with a more westernized lifestyle, and the industry requires a high value-added strategy and makes kimono more formal, expensive to survive.. But
シークエンシング技術の飛躍的な進歩により、全ゲノムシークエンスを決定す る研究が盛んに行われるようになったが、その研究から
21世紀に推進すべき重要な研究教育を行う横断的組織「フ
方法 理論的妥当性および先行研究の結果に基づいて,日常生活動作を構成する7動作領域より
Research Institute for Mathematical Sciences, Kyoto University...
大六先生に直接質問をしたい方(ご希望は事務局で最終的に選ばせていただきます) あり なし