[논문 리뷰] COEVOLVE: A Joint Point Process Model for Information Diffusion and Network Co-evolution
COEVOLVE는 다변량 하크스 과정을 사용해 재트윗을 모델링하고, 정보 기반 생존 과정을 사용해 링크 생성을 모델링함으로써 온라인 소셜 네트워크에서 정보 확산과 네트워크 공진화를 함께 모델링하는 공동 시간적 포인트 프로세스 모델을 제안한다. 두 과정 간 상호 영향을 고려하며, 모수 학습을 위한 효율적인 시뮬레이션과 볼록 최적화를 가능하게 하여 실제 티커 트위터 데이터에서 재트윗과 링크 이벤트 예측 성능이 기준 모델을 뛰어넘는다.
Information diffusion in online social networks is affected by the underlying network topology, but it also has the power to change it. Online users are constantly creating new links when exposed to new information sources, and in turn these links are alternating the way information spreads. However, these two highly intertwined stochastic processes, information diffusion and network evolution, have been predominantly studied separately, ignoring their co-evolutionary dynamics. We propose a temporal point process model, COEVOLVE, for such joint dynamics, allowing the intensity of one process to be modulated by that of the other. This model allows us to efficiently simulate interleaved diffusion and network events, and generate traces obeying common diffusion and network patterns observed in real-world networks. Furthermore, we also develop a convex optimization framework to learn the parameters of the model from historical diffusion and network evolution traces. We experimented with both synthetic data and data gathered from Twitter, and show that our model provides a good fit to the data as well as more accurate predictions than alternatives.
연구 동기 및 목표
- 온라인 소셜 네트워크에서 정보 확산과 네트워크 진화 간 상호 영향을 모델링하기 위해.
- 재트윗이 새로운 링크 형성으로 이어지고 반대로 링크 형성이 재트윗에 영향을 주는 방식을 포괄하는 공동 확률적 프레임워크를 개발하기 위해.
- 실제 이벤트 트레이스로부터 효율적인 시뮬레이션과 모수 학습을 가능하게 하기 위해.
- 각 과정을 별도로 다루는 모델과 비교해 재트윗 및 링크 이벤트 예측 정확도를 향상시키기 위해.
- 합성 데이터와 대규모 트위터 데이터셋에서 모델을 검증하여 실제 패턴을 잘 재현하는지 확인하기 위해.
제안 방법
- 각 재트윗의 강도가 원천의 신원과 영향력에 따라 달라지는 신원을 드러내는 자극을 가진 다변량 하크스 과정을 사용해 재트윗 이벤트를 모델링한다.
- 재트윗 강도에 의해 유도되는 생존 과정으로 링크 생성을 모델링하며, 새로운 링크는 활동성이 높은 정보 원천 쪽으로 우선적으로 형성된다.
- 효율적인 이벤트 샘플링을 위해 오가타의 알고리즘을 사용하며, 희소성 인식 샘플링을 최적화하여 O(nd log m) 복잡도를 달성한다.
- 관측된 확산 및 네트워크 진화 이벤트의 공동 우도를 최대화함으로써 모수 학습을 위한 볼록 최적화를 적용한다.
- 시간에 따라 변화하는 영향력과 이질적인 유도 커널을 통합하여 세밀한 시간 동적 특성을 포착한다.
- 연속 시간에서 혼합된 확산 및 네트워크 이벤트를 시뮬레이션하기 위해 거부 샘플링 프레임워크를 사용한다.
실험 결과
연구 질문
- RQ1온라인 소셜 네트워크에서 정보 확산과 네트워크 구조 형성의 공진화를 어떻게 모델링할 수 있는가?
- RQ2재트윗 이벤트가 새로운 사회적 링크 형성에 어떤 영향을 미치는가?
- RQ3분리된 모델과 비교해 공동 모델이 재트윗 및 링크 이벤트 예측 정확도를 향상시킬 수 있는가?
- RQ4이러한 공진화 시스템의 시뮬레이션과 모수 학습은 얼마나 효율적으로 수행될 수 있는가?
- RQ5모델은 캐스케이드 구조, 노드 차수, 네트워크 직경 등의 실제 세계 패턴을 어느 정도 잘 재현하는가?
주요 결과
- COEVOLVE 모델은 재트윗이 영향력 있는 원천으로 향하는 새로운 링크 형성으로 이어지는 정보 확산과 네트워크 진화 간 이중적 영향을 성공적으로 포착한다.
- 모델은 캐스케이드 크기, 깊이, 노드 차수 분포, 감소하는 네트워크 직경을 포함한 실제 세계 패턴과 매우 유사한 합성 데이터를 생성한다.
- 볼록 최적화를 통한 모수 학습은 효율적이고 확장 가능한 추론을 가능하게 하여 대규모 트위터 데이터셋에의 적용을 가능하게 한다.
- 실제 트위터 데이터에서 재트윗 및 링크 이벤트 예측 정확도 측정 기준으로 기준 모델보다 뚜렷이 뛰어난 성능을 보인다.
- 샘플링 절차는 O(nd log m) 복잡도를 가지며, 실제 네트워크에서 대규모 공진화 역학을 시뮬레이션하는 데 가능성을 제공한다.
- 재트윗에서 원천 신원을 드러내는 모델의 능력은 영향력 전파 및 링크 타겟팅 모델링의 정확도를 향상시킨다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.