[論文レビュー] Analyzing the Facebook Friendship Graph
本研究では、社会的ネットワーク分析(SNA)手法を用いて、Facebookの友人関係グラフの大規模サンプルを分析した。カスタムWebスクレイピングエージェントを用いて約547,000人のユーザーおよび836,000本のエッジからなるデータを抽出・クリーニングした。主な発見として、巨大連結成分が存在し、平均路長が短い(5.00)、少数のノードに高い中心性が見られることが判明し、実世界の社会的ネットワークと構造的類似性を示している。
Online Social Networks (OSN) during last years acquired a huge and increasing popularity as one of the most important emerging Web phenomena, deeply modifying the behavior of users and contributing to build a solid substrate of connections and relationships among people using the Web. In this preliminary work paper, our purpose is to analyze Facebook, considering a significant sample of data reflecting relationships among subscribed users. Our goal is to extract, from this platform, relevant information about the distribution of these relations and exploit tools and algorithms provided by the Social Network Analysis (SNA) to discover and, possibly, understand underlying similarities between the developing of OSN and real-life social networks.
研究の動機と目的
- 実際のユーザーデータを用いて、Facebookの社会的ネットワークの構造的特性を調査すること。
- Facebookのようなオンライン社会的ネットワーク(OSN)が、現実の社会的ネットワークと類似したトポロジー的パターンを示すかどうかを評価すること。
- プライバシー方針を尊重しながらも、スケーラブルなデータ抽出パイプラインを構築・適用すること。
- SNAメトリクスおよびフィルタリング技術を用いて、大規模な友人関係グラフを可視化・分析すること。
- SNAツールを用いてOSNのダイナミクスおよびユーザーの役割を理解する可能性を検討すること。
提案手法
- Firefox/XPCOMおよびXULRunnerを用いたカスタムJavaベースのWebエージェントを開発し、公開可能なFacebookの友人リストページをクロールした。
- シードユーザーから3段階までの友人関係を再帰的に収集し、ファンページや企業を除外した。
- ユーザーIDをノードとし、友人関係を無向エッジとして、GraphML形式でデータを収集した。
- JavaのHashSetを用いたO(n log n)のデータクリーニングアルゴリズムを適用し、重複ノードおよびエッジを削除することで、クリーンな無向グラフを確保した。
- NodeXLを用いて、標準的なSNAメトリクス(次数、媒介性、近接性、PageRank、クラスタリング係数、固有ベクトル中心性)を算出した。
- 力による配置アルゴリズム(例:Fruchterman-Reingold)を用いてサブグラフを可視化し、中心性およびクラスタリングによるフィルタリングを適用した。
実験結果
リサーチクエスチョン
- RQ1Facebookの友人関係グラフのトポロジー的特徴、例えば直径、密度、平均路長は何か?
- RQ2Facebookネットワーク内のユーザーにわたる次数、媒介性、PageRankといった主要なネットワークメトリクスの分布はどのようになっているか?
- RQ3Facebookの構造的特性が、現実の社会的ネットワークとどの程度類似しているか?
- RQ4プライバシー制約を尊重しながらも、大規模OSNデータに効率的なデータ抽出およびクリーニング技術を適用できるか?
- RQ5SNAの可視化およびフィルタリング技術は、大規模な社会的グラフにおいて意味のあるパターンを効果的に明らかにできるか?
主な発見
- Facebookの友人関係グラフには、547,302個の固有のユーザー(頂点)と836,468本の固有の無向エッジが存在し、546,733ノードを含む大きな連結成分を形成している。
- ユーザー間の平均測地的距離(最短路長)は5.00であり、高い接続性を示し、スモールワールド構造であることが判明した。
- グラフの直径は10であり、ネットワーク上にいる任意の2人のユーザーは、10ステップ以内で到達可能であることを意味する。
- ノードの最大次数は4,958に達しており、少数の非常に高い接続性を持つユーザーが存在することが示された。一方、平均次数は3.057であった。
- わずか数個のノードが、1,000万を超える非常に高い媒介性中心性を示しており、互いに離れた部分を接続する上で重要な役割を果たしていることが明らかになった。
- クラスタリング係数の平均は0.053であり、中程度の局所的クラスタリングを示しているが、多くのノードがクラスタリング係数が0であるため、局所的な構造が疎であることも判明した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。