Skip to main content
QUICK REVIEW

[논문 리뷰] Topical homophily in online social systems.

Felipe Maciel Cardoso, Sandro Meloni|arXiv (Cornell University)|2017. 07. 20.
Complex Network Analysis Techniques인용 수 9
한 줄 요약

이 논문은 해시태그를 사용하여 사용자 관심사를 모델링하고 사회적 연결의 주제 기반 유사성을 측정하여 트위터에서 주제적 동질성(토픽럴 호모필리)을 조사한다. 연구 결과, 사용자들은 유사한 관심사를 공유하는 사람들과 더 높은 확률로 연결되며, 주제적 유사성이 관계 강도를 강력하게 예측함을 확인하였다. 이는 온라인 사회 시스템에서 동질성의 정량적 측정 가능성을 제시한다.

ABSTRACT

Understanding the dynamics of social interactions is crucial to comprehend human behavior. The emergence of online social media has enabled access to data regarding people relationships at a large scale. Twitter, specifically, is an information oriented network, with users sharing and consuming information. In this work, we study whether users tend to be in contact with people interested in similar topics, i.e., topical homophily. To do so, we propose an approach based on the use of hashtags to extract information topics from Twitter messages and model users' interests. Our results show that, on average, users are connected with other users similar to them and stronger relationships are due to a higher topical similarity. Furthermore, we show that topical homophily provides interesting information that can eventually allow inferring users' connectivity. Our work, besides providing a way to assess the topical similarity of users, quantifies topical homophily among individuals, contributing to a better understanding of how complex social systems are structured.

연구 동기 및 목표

  • 온라인 사회 네트워크에서 사용자들이 유사한 주제에 관심을 가진 사람들과 연결하는 경향이 있는지, 이를 주제적 동질성이라고 하는 현상에 대해 조사한다.
  • 해시태그를 주제 지표로 사용하여 트위터 데이터에서 사용자 관심사를 추출하고 모델링하는 방법을 개발한다.
  • 주제적 동질성의 정도를 정량화하고, 사회 네트워크 구조 형성에 미치는 역할을 평가한다.
  • 주제적 유사성이 온라인 사회 시스템에서 사용자 간 연결 패턴을 예측하거나 유추하는 데 사용될 수 있는지 평가한다.

제안 방법

  • 트위터 메시지에 포함된 해시태그를 추출하여 사용자 관심사를 식별하고 주제별로 분류한다.
  • 사용자가 사용하는 해시태그의 빈도와 분포를 기반으로 사용자 관심사 프로필을 구축한다.
  • 사용자 간 주제 유사성을 해시태그 프로필에 기반한 벡터 기반 유사도 측정 방법(예: 코사인 유사도)을 사용하여 계산한다.
  • 계산된 주제 유사성과 관련하여 사회 네트워크 연결을 분석하여 동질성 영향을 평가한다.
  • 주제 유사성과 관계 강도 간 상관관계를 검증하기 위해 통계 모델을 적용한다.

실험 결과

연구 질문

  • RQ1사용자들은 트위터에서 얼마나 많은 비율로 유사한 주제 관심사를 공유하는 사람들과 연결을 맺는가?
  • RQ2사용자 간 주제 유사성은 그들의 사회적 유대 강도와 얼마나 관련이 있는가?
  • RQ3주제적 동질성은 온라인 사회 네트워크에서 사용자 간 연결성을 예측하거나 유추하는 데 사용될 수 있는가?
  • RQ4대규모 트위터 상호작용에서 주제적 동질성의 정량적 크기는 어느 정도인가?

주요 결과

  • 평균적으로 사용자들은 유사한 주제 관심사를 공유하는 사람들과 더 높은 확률로 연결되어 있으며, 이는 트위터 네트워크에서 강한 주제적 동질성이 존재함을 시사한다.
  • 더 강한 사회적 유대관계는 사용자 간 주제 유사도 수준이 높을수록 유의미하게 관련되어 있다.
  • 해시태그 사용을 통해 유도된 주제 유사성은 사용자 간 연결 패턴을 신뢰할 수 있는 예측 요소로 제공한다.
  • 본 연구는 주제적 동질성을 정량화하여 공통된 관심사를 기반으로 한 사회 네트워크 구조 이해를 위한 측정 가능한 프레임워크를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.