Skip to main content
QUICK REVIEW

[논문 리뷰] Analyzing the Facebook Friendship Graph

Salvatore Catanese, Pasquale De Meo|arXiv (Cornell University)|2010. 11. 23.
Complex Network Analysis Techniques참고 문헌 24인용 수 34
한 줄 요약

이 연구는 사회적 네트워크 분석(SNA) 기법을 사용하여 약 547,000명의 사용자와 836,000개의 간선으로 구성된 대규모 페이스북 친구 관계 그래프를 분석한다. 자체 개발한 웹 스크래핑 에이전트를 통해 데이터를 추출하고 정제하였다. 주요 발견 결과로 거대한 연결 성분, 평균 경로 길이가 짧은(5.00), 일부 노드에서 높은 중심성 확보가 가능하여 실제 사회적 네트워크와 유사한 구조적 특성을 보였다.

ABSTRACT

Online Social Networks (OSN) during last years acquired a huge and increasing popularity as one of the most important emerging Web phenomena, deeply modifying the behavior of users and contributing to build a solid substrate of connections and relationships among people using the Web. In this preliminary work paper, our purpose is to analyze Facebook, considering a significant sample of data reflecting relationships among subscribed users. Our goal is to extract, from this platform, relevant information about the distribution of these relations and exploit tools and algorithms provided by the Social Network Analysis (SNA) to discover and, possibly, understand underlying similarities between the developing of OSN and real-life social networks.

연구 동기 및 목표

  • 실제 사용자 데이터를 활용하여 페이스북의 사회적 네트워크 구조적 특성을 조사하기 위해.
  • 페이스북과 같은 온라인 사회적 네트워크(OSN)가 실제 생활 사회 네트워크와 유사한 위상적 패턴을 보이는지 평가하기 위해.
  • 사용자 개인정보 보호 정책을 준수하면서도 확장 가능한 OSN 데이터 추출 파이프라인을 개발하고 적용하기 위해.
  • SNA 지표와 필터링 기법을 사용하여 대규모 친구 관계 그래프를 시각화하고 분석하기 위해.
  • SNA 도구가 OSN의 동적 특성과 사용자 역할을 이해하는 데 얼마나 유용한지 탐색하기 위해.

제안 방법

  • 기본 사용자에서 출발하여 공개 가능한 페이스북 친구 목록 페이지를 크롤링하기 위해 Firefox/XPCOM 및 XULRunner를 기반으로 한 커스터마이징된 자바 기반 웹 에이전트를 개발하였다.
  • 시드 사용자로부터 최대 3단계까지의 친구 관계를 재귀적으로 수집하였으며, 팬 페이지 및 기업 계정은 제외하였다.
  • 사용자 ID를 노드로, 우정 관계를 무방향 간선으로 하여 GraphML 형식으로 데이터를 수집하였다.
  • Java HashSet을 사용한 O(n log n) 알고리즘을 적용하여 중복된 노드와 간선을 제거함으로써 깔끔한 무방향 그래프를 확보하였다.
  • NodeXL를 사용하여 표준 SNA 지표(도수, 중간성, 가까움, 페이지랭크, 클러스터링 계수, 고유벡터 중심성)를 계산하였다.
  • 힘 기반 레이아웃 알고리즘(Fruchterman-Reingold 등)을 사용하여 서브그래프를 시각화하고 중심성 및 클러스터링 기반으로 필터링을 적용하였다.

실험 결과

연구 질문

  • RQ1페이스북의 친구 관계 그래프의 위상적 특성은 어떤가? (예: 지름, 조밀도, 평균 경로 길이)
  • RQ2도수, 중간성, 페이지랭크와 같은 핵심 네트워크 지표들이 페이스북 네트워크 내 사용자 간에 어떻게 분포되어 있는가?
  • RQ3페이스북의 구조적 특성이 실제 생활 사회 네트워크와 어느 정도 유사한가?
  • RQ4사용자 개인정보 보호 기준을 준수하면서도 대규모 OSN 데이터에 대해 효율적인 데이터 추출 및 정제 기법을 적용할 수 있는가?
  • RQ5SNA 시각화 및 필터링 기법이 거대한 사회적 그래프에서 의미 있는 패턴을 드러내는 데 얼마나 효과적인가?

주요 결과

  • 페이스북의 친구 관계 그래프는 547,302개의 고유한 사용자(정점)와 836,468개의 고유한 무방향 간선을 포함하며, 546,733개의 정점을 포함한 거대한 연결 성분을 형성한다.
  • 사용자 간의 평균 지오데식 거리(최단 경로 길이)는 5.00이며, 이는 높은 연결성과 함께 소월드 구조를 나타낸다.
  • 그래프의 지름은 10으로, 네트워크 내 두 사용자 간의 거리가 10단계를 초과하지 않음을 의미한다.
  • 어느 노드의 최대 도수도 4,958로, 소수의 매우 높은 연결성을 가진 사용자가 존재함을 시사하며, 평균 도수도 3.057이다.
  • 매우 낮은 수의 노드에서 중간성 중심성이 1,000만 이상으로 매우 높게 나타나, 이는 서로 떨어져 있는 네트워크의 부분을 연결하는 데 핵심적인 역할을 하고 있음을 나타낸다.
  • 클러스터링 계수의 평균은 0.053으로, 중간 정도의 국소적 클러스터링을 나타내지만, 많은 노드에서 클러스터링 계수가 0이므로 국소적 구조가 흐물흐물한 편임을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.