Skip to main content
QUICK REVIEW

[논문 리뷰] Model-Independent Online Learning for Influence Maximization

Sharan Vaswani, Branislav Kveton|arXiv (Cornell University)|2017. 03. 01.
Advanced Bandit Algorithms Research인용 수 20
한 줄 요약

이 논문은 특정 확산 모델을 가정하지 않고 영향력 확산 최적화를 위한 모델 독립적인 온라인 학습 프레임워크를 제안한다. 이는 쌍별 도달 가능성 확률을 대체 목적함수로 사용하여, 특정 확산 모델을 가정하지 않고도 강건하고 통계적으로 효율적인 시드 선택을 가능하게 한다. 새로운 쌍별 영향력 반응 반투명 밴딧 피드백 모델을 갖춘 LinUCB 기반 알고리즘을 도입하여, 이전 연구 대비 네트워크 크기에 대한 의존도가 향상된 복귀 한계를 달성한다.

ABSTRACT

We consider influence maximization (IM) in social networks, which is the problem of maximizing the number of users that become aware of a product by selecting a set of "seed" users to expose the product to. While prior work assumes a known model of information diffusion, we propose a novel parametrization that not only makes our framework agnostic to the underlying diffusion model, but also statistically efficient to learn from data. We give a corresponding monotone, submodular surrogate function, and show that it is a good approximation to the original IM objective. We also consider the case of a new marketer looking to exploit an existing social network, while simultaneously learning the factors governing information propagation. For this, we propose a pairwise-influence semi-bandit feedback model and develop a LinUCB-based bandit algorithm. Our model-independent analysis shows that our regret bound has a better (as compared to previous work) dependence on the size of the network. Experimental evaluation suggests that our framework is robust to the underlying diffusion model and can efficiently learn a near-optimal solution.

연구 동기 및 목표

  • 실제로 알려져 있지 않거나 잘못 지정된 확산 모델을 가정하지 않고 사회적 네트워크 내에서 영향력 확산 최적화 문제를 해결하는 것.
  • 쌍별 도달 가능성 확률에 기반한 통계적으로 효율적이고 모델에 종속되지 않는 영향력 확산의 파arameter화 방법 개발.
  • 실시간으로 영향력 요소를 학습하면서 탐색과 이용의 균형을 이루는 온라인 학습 알고리즘 설계.
  • 기존 연구 대비 네트워크 크기에 대한 의존도를 줄여 온라인 영향력 확산 최적화에서 복귀 한계를 향상시키는 것.
  • 그래프 라플라시안 특징과 공액 기울기 해법을 사용하여 대규모 네트워크에 대해 실용적이고 확장 가능한 알고리즘 제공.

제안 방법

  • 진정한 영향력 확산 목적함수를 근사하는 단조성과 서브모듈라리티를 가지는 최대 도달 가능성에 기반한 대체 목적함수 제안.
  • 간선 수준의 피드백이 아닌 노드 쌍 간의 영향력 결과를 관찰하는 쌍별 영향력 반투명 밴딧 피드백 모델 도입.
  • 그래프 라플라시안 고유벡터에서 유도된 특징을 사용하여 영향력 과정을 선형 밴딧 문제로 모델링.
  • 도달 가능성 확률에 대한 상한 신뢰구간을 유지하고 누적 복귀를 최소화하는 시드 집합을 선택하는 LinUCB 기반 알고리즘 개발.
  • 실수형 라플라시안 정규화와 실수형 라플라시안 방정식 설정을 사용하여 파rameter 추정치를 효율적으로 업데이트.
  • 빠른 신뢰구간 업데이트를 위해 역행렬의 대각성분을 유지하기 위해 Sherman-Morrison 공식 활용.

실험 결과

연구 질문

  • RQ1IC 또는 LT와 같은 특정 확산 모델을 가정하지 않고도 영향력 확산 최적화를 효과적으로 해결할 수 있는가?
  • RQ2진정한 영향력 확산에 대해 좋은 근사가 되고, 동시에 단조성과 서브모듈라리티를 만족하는 대체 목적함수는 어떻게 구성할 수 있는가?
  • RQ3복귀를 최소화하면서 영향력 매개변수를 효율적으로 온라인으로 학습할 수 있는 피드백 구조는 무엇인가?
  • RQ4기존 방법 대비 네트워크 크기에 대해 유리하게 스케일링되는 복귀 한계를 도출할 수 있는가?
  • RQ5그래프 기반 특징 공학을 사용하여 실세계 네트워크에 대해 확장 가능하고 실용적인 알고리즘이 어떻게 설계될 수 있는가?

주요 결과

  • 최대 도달 가능성에 기반한 제안된 대체 목적함수는 진정한 영향력 확산 최적화 목적함수에 대해 강력한 근사치를 제공하여 효율적인 최적화를 가능하게 한다.
  • LinUCB 기반 알고리즘은 시간 영역에 대해 최적의 의존도를 가지며, 이전 연구 대비 네트워크 크기에 대한 스케일링이 향상된 복귀 한계를 달성한다.
  • 실제 네트워크에서의 실험 평가를 통해 기반 확산 모델에 대해 강건함이 입증되었다.
  • 라플라시안 고유벡터 특징의 사용은 효율적인 계산과 확장 가능한 추론을 가능하게 하며, 매 라운드당 O(dn²) 시간 내에 공액 기울기 방법으로 시스템을 해결한다.
  • 사전 계산된 ℓ₂ 노름과 Sherman-Morrison 공식을 통한 동적 업데이트를 활용하여 도달 가능성 확률의 신뢰구간을 효율적으로 계산한다.
  • 실험 결과는 알고리즘이 빠르게 수렴하고, 진정한 확산 모델이 알려져 있지 않거나 잘못 지정되어 있어도 거의 최적에 가까운 영향력 확산을 달성함을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.