QUICK REVIEW

[論文レビュー] Predicting Positive and Negative Links in Online Social Networks

Jure Leskovec, Daniel P. Huttenlocher|arXiv (Cornell University)|Mar 11, 2010

Complex Network Analysis Techniques参考文献 21被引用数 141

ひとこと要約

本論文は、オンラインのソーシャルネットワークにおけるリンクの符号（正または負）を予測するための機械学習フレームワークを提案する。局所的なネットワーク近傍からの構造的特徴を用い、負のエッジ情報を取り入れることで予測精度が著しく向上することを示している。特にウィキペディアでは、性能が0.6983から0.7114に向上した。また、さまざまなプラットフォーム（Epinions、Slashdot、ウィキペディア）におけるリンク形成の背後には、局所的な構造的バランスとステータス理論が共通して存在することが明らかになった。

ABSTRACT

We study online social networks in which relationships can be either positive (indicating relations such as friendship) or negative (indicating relations such as opposition or antagonism). Such a mix of positive and negative links arise in a variety of online settings; we study datasets from Epinions, Slashdot and Wikipedia. We find that the signs of links in the underlying social networks can be predicted with high accuracy, using models that generalize across this diverse range of sites. These models provide insight into some of the fundamental principles that drive the formation of signed links in networks, shedding light on theories of balance and status from social psychology; they also suggest social computing applications by which the attitude of one user toward another can be estimated from evidence provided by their relationships with other members of the surrounding social network.

研究の動機と目的

関係が正（例：フレンドシップ）または負（例：不信感）であるオンラインのソーシャルネットワークにおけるリンクの符号を予測するモデルを開発すること。
構造的バランスやステータス理論のような、符号付きネットワークにおける構造的パターンが、Epinions、Slashdot、ウィキペディアなど多様なオンラインプラットフォームに一般化するかを調査すること。
正のエッジの存在予測というタスクに特化した場合でも、負のエッジ情報を取り入れることで予測性能が向上するかを評価すること。
学習されたモデルを、構造的バランス理論およびステータス理論といった社会心理学的理論と比較し、それらの説明力の有効性を検証すること。
ネットワーク周辺の観察済み関係から、未観測のユーザーの態度を推定できるソーシャルコンピューティングアプリケーションを可能にすること。

提案手法

すべての他の符号付きエッジが与えられたもとで、2つのノード間のリンクの符号（正または負）を予測する二値分類タスクとしてエッジ符号予測問題を定式化する。
各ノードペアの周辺における局所的な符号付き近傍パターンを捉えるために、16種類の符号付き有向三頂点（triad）特徴を計算する。
正のエッジのみと、正および負のエッジの両方の特徴を用いてトレーニングしたロジスティック回帰モデルを比較し、予測性能を評価する。
正のエッジの4パスパターン（例：FFpp、BBpp）に基づく特徴セットを導入し、符号付き三頂点特徴と組み合わせることで、構造の複雑さをモデル化する。
Epinions、Slashdot、ウィキペディアの実データセットを用いて、交差検証フレームワークを用いてモデルの精度を評価する。
モデルの性能をランダム推測（0.50の精度）と比較し、全データセットでAUCに類似した指標を用いて改善度を評価する。

実験結果

リサーチクエスチョン

RQ1局所的なネットワーク構造のみを用いて、符号付きソーシャルネットワークにおけるリンクの符号を高い精度で予測できるか？
RQ2特に構造的バランス理論およびステータス理論に由来する社会心理学的原則が、観察された正および負のリンクのパターンを説明できるか？
RQ3負のエッジ情報を取り入れることで、正のエッジの存在予測性能が向上するか？
RQ4符号付きネットワークにはグローバルなステータス順序が存在するのか、それともバランス理論が予測するように、対立する派閥が形成されるのか？
RQ5符号付きネットワーク特徴に依存する予測モデルと、正のエッジのみに依存するモデルの間で、性能に差があるか？

主な発見

負のエッジ情報を取り入れることで、Epinions（0.5911 対 0.5612）およびSlashdot（0.5953 対 0.5579）でそれぞれ3ポイントの精度向上が達成され、ランダム推測に対する相対的改善率は50％に達した。
ウィキペディアでは、正および負の両方の特徴を使用したモデルが0.7114の精度を達成したのに対し、正の特徴のみを使用した場合の精度は0.6983であった。
結果から、負の関係は孤立しているのではなく、正の関係と相互に依存しており、より良い性能を得るためには両者を同時にモデル化する必要があることが示された。
すべての3つのデータセットにおいて、グローバルなステータス順序の存在に強く根拠がある。これは、ユーザーが他人を自己のステータス認識に基づいて暗黙的に順位付けしていることを示唆しており、ステータス理論と整合的である。
一方で、グローバルな派閥構造（すなわち2つの対立グループ）の証拠はほとんどなく、構造的バランスがグローバルレベルよりも局所レベルでより強く作用していることが示唆された。
本研究では、符号付きネットワーク特徴を用いてトレーニングされたモデルが、従来の手法を著しく上回ることを確認した。特に、負のエッジ信号が含まれている場合に顕著な性能向上が見られた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。