QUICK REVIEW

[論文レビュー] Predicting Links and Inferring Attributes using a Social-Attribute Network (SAN)

Neil Zhenqiang Gong, Ameet Talwalkar|arXiv (Cornell University)|Dec 15, 2011

Complex Network Analysis Techniques参考文献 37被引用数 57

ひとこと要約

この論文は、教師ありおよび教師なしのリンク予測および属性推定アルゴリズムを統合することで、Social-Attribute Network (SAN) フレームワークを拡張し、欠落した属性を推定することでリンク予測の精度が向上することを示している。大規模かつ公開済みの Google+ データセットを用いて、複数のアルゴリズムで一貫した性能向上を確認し、属性推定が SAN におけるリンク予測を向上させることを確立している。

ABSTRACT

The eects of social inuence and homophily suggest that both network structure and node attribute information should inform the tasks of link prediction and node attribute inference. Recently, Yin et al. [28, 29] proposed Social-Attribute Network (SAN), an attribute-augmented social network, to integrate network structure and node attributes to perform both link prediction and attribute inference. They focused on generalizing the random walk with restart algorithm to the SAN framework and showed improved performance. In this paper, we extend the SAN framework with several leading supervised and unsupervised link prediction algorithms and demonstrate performance improvement for each algorithm on both link prediction and attribute inference. Moreover, we make the novel observation that attribute inference can help inform link prediction, i.e., link prediction accuracy is further improved by rst inferring missing attributes. We comprehensively evaluate these algorithms and compare them with other existing algorithms using a novel, largescale Google+ dataset, which we make publicly available 1 .

研究の動機と目的

ネットワーク構造とノード属性を統合した統一フレームワークにより、リンク予測とノード属性推定を向上させること。
両タスクに最新の教師ありおよび教師なし学習アルゴリズムを統合することで、Social-Attribute Network (SAN) モデルを拡張すること。
属性推定がリンク予測の性能を向上させるための事前段階として機能するかどうかを検証すること。
本稿で提案する拡張手法を、新たに公開された大規模な Google+ データセット上で評価すること。
SAN フレームワーク内での既存のアルゴリズムと比較して、提案手法の包括的評価を行うこと。

提案手法

ノード埋め込みや行列分解技術を含む、教師ありおよび教師なしのリンク予測アルゴリズムを統合することで、Social-Attribute Network (SAN) フレームワークを拡張する。
属性推定をリンク予測パイプラインに統合し、推定された属性を入力特徴として用いることで、リンク予測の性能を向上させる。
リンク予測と属性推定を統合的に最適化するマルチタスク学習アプローチを採用し、SAN フレームワーク内で実装する。
ランダムウォーク・リスタートアルゴリズムを SAN の文脈に適応させ、属性拡張ネットワークへの適用可能性を拡張する。
ネットワークトポロジーとノード属性の両方を低次元埋め込みに符号化するための特徴表現学習を適用する。
実世界のソーシャルインタラクションとユーザー属性から収集された Google+ データセットを用い、大規模な環境下でモデルの学習と評価を実施する。

実験結果

リサーチクエスチョン

RQ1教師ありおよび教師なしのリンク予測アルゴリズムは、SAN フレームワーク内に効果的に拡張可能であり、性能向上が達成可能か？
RQ2リンク予測の前に欠落したノード属性を推定することで、リンク予測の精度に測定可能な向上が見られるか？
RQ3提案手法は、リンク予測および属性推定タスクにおいて、既存のアルゴリズムと比較してどの程度の性能を示すか？
RQ4属性情報の統合が、ソーシャルネットワークにおけるリンク予測モデルの予測力にどの程度向上をもたらすか？
RQ5リンクの欠落や属性の欠落予測において、ネットワーク構造とノード属性の相対的寄与度はどの程度か？

主な発見

属性推定を前処理ステップとして統合することで、リンク予測精度が顕著に向上し、両タスク間の二重的利点が実証された。
評価に使用したすべての教師ありおよび教師なしアルゴリズムが、ベースライン手法と比較して、拡張された SAN フレームワーク内での適用で性能向上を示した。
提案されたフレームワークは、大規模な Google+ データセット上で複数の評価指標において一貫した向上を達成し、スケーラビリティとロバストネスを裏付けた。
著者らは、属性推定がリンク予測に有意義に寄与することを観察し、欠落した属性が予測信号の重要なソースである可能性を示唆した。
公開された Google+ データセットにより、リンク予測および属性推定研究の再現性と今後のベンチマークが可能になった。
拡張された SAN フレームワークは、両タスクにおいて既存のアルゴリズムを上回り、とくに属性データがスパースまたは不完全な状況下でも顕著な優位性を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。