[論文レビュー] The Anatomy of the Facebook Social Graph
本研究では、2011年5月の匿名化データを用いて、7億2100万人のアクティブなFacebookユーザーを対象とした、これまでで最大規模のソーシャルネットワーク分析を実施した。Facebookのソーシャルグラフはほぼ完全に接続されており(1つの巨大成分に99.91%が含まれる)、平均パス長が4.7である小都市構造を示し、グローバルな疎らさにもかかわらず局所的な密集したネighborhoodを示す一方で、国籍と年齢の同質性に基づく強いコミュニティ構造も特定された。
We study the structure of the social graph of active Facebook users, the largest social network ever analyzed. We compute numerous features of the graph including the number of users and friendships, the degree distribution, path lengths, clustering, and mixing patterns. Our results center around three main observations. First, we characterize the global structure of the graph, determining that the social network is nearly fully connected, with 99.91% of individuals belonging to a single large connected component, and we confirm the "six degrees of separation" phenomenon on a global scale. Second, by studying the average local clustering coefficient and degeneracy of graph neighborhoods, we show that while the Facebook graph as a whole is clearly sparse, the graph neighborhoods of users contain surprisingly dense structure. Third, we characterize the assortativity patterns present in the graph by studying the basic demographic and network properties of users. We observe clear degree assortativity and characterize the extent to which "your friends have more friends than you". Furthermore, we observe a strong effect of age on friendship preferences as well as a globally modular community structure driven by nationality, but we do not find any strong gender homophily. We compare our results with those from smaller social networks and find mostly, but not entirely, agreement on common structural network characteristics.
研究の動機と目的
- 世界最大のソーシャルネットワーク、Facebookのグローバルな構造的特性をスケールで特徴づけること。
- Facebookのソーシャルグラフにおける接続性、パス長、クラスタリング、コミュニティ構造の程度を調査すること。
- 年齢、性別、国によるデモグラフィックなミキシングパターン、特に同質性の影響とネットワーク構造への影響を検討すること。
- より小さなソーシャルネットワークと比較し、大規模スケールにおける既知のネットワーク特性の一般化可能性を評価すること。
提案手法
- 2011年5月の匿名化データを用いて、アクティブユーザーの全Facebookソーシャルグラフ(n ≈ 721百万)を分析した。
- 単一のマシン上でストリーミングエッジ処理を用いて、ニューマン・ジップフ(NZ)アルゴリズムを用いて連結成分構造を計算した。
- 24コアのマシン上でHyperANFアルゴリズムを10回実行して、平均最短パス長を推定した。
- 局所的ネットワーク分析のため、50万ユーザー(100のログスケールで間隔をあけた各サイズの100ごとに5,000人)をリザボアサンプリングで選択した。
- サンプルされたユーザーのネ easily におけるクラスタリング係数および退化度の経験的百分位数を計算した。
- 大規模なデータ処理およびネットワーク特徴抽出のため、2,250台のマシンからなるHadoop/Hiveクラスタを活用した。
実験結果
リサーチクエスチョン
- RQ1Facebookのソーシャルグラフはどの程度グローバルに接続されており、ユーザー間の平均パス長はどれくらいか?
- RQ2ユーザーの局所的ネットワークネ easily は、グローバルなグラフ構造と比較して、密度やクラスタリングの点でどのように異なるか?
- RQ3年齢、性別、国籍といったデモグラフィック要因が、友人関係のパターンやネットワークミキシングに果たす役割は何か?
- RQ4Facebookネットワークのコミュニティ構造は、国および地域レベルでどのように現れるか?
- RQ5度の相関性や「友人パラドックス」のようなネットワーク特性が、現実世界のソーシャルネットワークにおいて大規模スケールで成立するか、どの程度成立するか?
主な発見
- Facebookのソーシャルグラフはほぼ完全に接続されており、アクティブユーザーの99.91%が1つの巨大連結成分に属している。
- 巨大成分内のユーザー間の平均最短パス長は4.7であり、グローバルスケールでの「六度の分離」現象を裏付けている。
- グローバルな疎らさにもかかわらず、ユーザーの局所的ネ easily は高いクラスタリングと退化度を示しており、個々の人物の周囲に密集した構造的コアが存在することが示唆された。
- 強い度の相関性が認められ、ユーザーは自分より多くの友人をもつ友人を常に持つことが確認され、大規模スケールでの「友人パラドックス」が成立している。
- 年齢の同質性は顕著であり、ユーザーは同年代の友人を強く好む傾向が強く、国籍はコミュニティ構造の主な駆動要因である。
- 地理的距離は国境を越えた友情に強く影響し、国レベルのコミュニティ構造は主に近接性および歴史的・文化的なつながりによって形作られている。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。