[논문 리뷰] The Anatomy of the Facebook Social Graph
이 연구는 2011년 5월 기준 익명화된 데이터를 바탕으로 한 7억 2100만 명의 활성 Facebook 사용자를 대상으로 한 사회망에서 가장 대규모로 수행된 분석을 제시한다. Facebook 사회망은 거의 완전히 연결되어 있으며(단일 거대성분에서 99.91%), 평균 경로 길이가 4.7인 소월드 구조를 보이며, 전반적인 희박성에도 불구하고 국소적으로는 높은 밀도를 보이며, 국적과 연령에 기반한 동질성에 의해 이끌리는 강력한 공동체 구조를 나타낸다.
We study the structure of the social graph of active Facebook users, the largest social network ever analyzed. We compute numerous features of the graph including the number of users and friendships, the degree distribution, path lengths, clustering, and mixing patterns. Our results center around three main observations. First, we characterize the global structure of the graph, determining that the social network is nearly fully connected, with 99.91% of individuals belonging to a single large connected component, and we confirm the "six degrees of separation" phenomenon on a global scale. Second, by studying the average local clustering coefficient and degeneracy of graph neighborhoods, we show that while the Facebook graph as a whole is clearly sparse, the graph neighborhoods of users contain surprisingly dense structure. Third, we characterize the assortativity patterns present in the graph by studying the basic demographic and network properties of users. We observe clear degree assortativity and characterize the extent to which "your friends have more friends than you". Furthermore, we observe a strong effect of age on friendship preferences as well as a globally modular community structure driven by nationality, but we do not find any strong gender homophily. We compare our results with those from smaller social networks and find mostly, but not entirely, agreement on common structural network characteristics.
연구 동기 및 목표
- 세계에서 가장 큰 사회망인 Facebook의 전반적인 구조적 특성을 대규모로 기술하기 위해.
- Facebook 사회망에서 연결성, 경로 길이, 군집화 및 공동체 구조의 정도를 조사하기 위해.
- 연령, 성별, 국적 등의 인구통계적 요소가 우정 패턴과 네트워크 혼합에 미치는 영향을 분석하고, 네트워크 구조에 미치는 영향를 조사하기 위해.
- 더 작은 사회망과의 비교를 통해 대규모 스케일에서 알려진 네트워크 특성의 일반화 가능성 평가하기 위해.
제안 방법
- 2011년 5월 기준 익명화된 데이터를 사용하여 활성 사용자 전체의 Facebook 사회망을 분석함 (n ≈ 7억 2100만).
- 단일 머신에서 스트리밍 엣지 처리를 통해 연결성 성분의 구조를 계산하기 위해 Newman-Zipf (NZ) 알고리즘을 적용함.
- 24코어 머신에서 10회 반복하여 HyperANF 알고리즘을 사용해 평균 최단 경로 길이를 추정함.
- 국소 네트워크 분석을 위해 50만 명의 사용자(100개의 로그 간격으로 나누어진 각 크기별로 5,000명씩)를 확률적 샘플링 방법으로 선별함.
- 샘플링된 사용자 국소 네트워크에서 군집 계수와 탈진성의 경험적 백분위수를 계산함.
- 대규모 데이터 처리 및 네트워크 특성 추출을 위해 2,250台의 머신으로 구성된 Hadoop/Hive 클러스터를 활용함.
실험 결과
연구 질문
- RQ1Facebook 사회망은 어느 정도 전반적으로 연결되어 있으며, 사용자 간 평균 경로 길이는 얼마인가?
- RQ2사용자의 국소 네트워크 이웃들은 전반적인 네트워크 구조와 비교해 밀도와 군집화 측면에서 어떻게 다른가?
- RQ3연령, 성별, 국적과 같은 인구통계적 요소가 우정 패턴과 네트워크 혼합에 어떤 역할을 하는가?
- RQ4Facebook 네트워크의 공동체 구조는 국가 및 지역 수준에서 어떻게 나타나는가?
- RQ5실제 세계의 대규모 사회망에서, 도수의 혼합성 및 '친구의 역설'과 같은 네트워크 특성이 어느 정도 유지되는가?
주요 결과
- Facebook 사회망은 거의 완전히 연결되어 있으며, 활성 사용자의 99.91%가 단일 거대성분에 속해 있다.
- 거대성분 내 사용자 간 평균 최단 경로 길이는 4.7로, 세계적으로 '여섯 단계의 분리' 현상이 확인된다.
- 전반적인 희박성에도 불구하고, 사용자의 국소 이웃 네트워크는 높은 군집화와 탈진성을 보이며, 개인 중심으로 높은 구조적 밀도를 가진 핵심 구조를 형성함을 시사한다.
- 강한 도수의 혼합성이 있으며, 사용자들은 항상 자신보다 더 많은 친구를 가진 친구를 가지고 있음을 확인하여, 대규모 스케일에서 친구의 역설이 확인된다.
- 연령에 기반한 동질성이 뚜렷하며, 사용자들은 유사한 연령대의 친구를 선호하는 경향을 보이며, 국적은 공동체 구조의 주요 결정 요소로 작용한다.
- 지리적 거리가 해외 친구 관계 형성에 강력한 영향을 미치며, 국가 수준의 공동체 구조는 주로 거리와 역사적·문화적 유대에 의해 형성된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.