QUICK REVIEW

[논문 리뷰] Online Influence Maximization (Extended Version)

Siyu Lei, Silviu Maniu|arXiv (Cornell University)|2015. 06. 03.

Spam and Phishing Detection참고 문헌 25인용 수 42

한 줄 요약

이 논문은 영향력 확산 비율이 초기에는 알려져 있지 않은 상황에서 소셜 네트워크 내에서 영향력 최적화를 위한 Online Influence Maximization (OIM) 프레임워크를 제안한다. 영향력 확산 비율 추정치를 실시간 피드백을 통해 반복적으로 갱신하면서, 여러 시행 동안 탐색과 활용 전략을 적용하여 시드 노드를 점진적으로 선택한다. 이로 인해 부분 정보 설정에서 전통적인 오프라인 방법에 비해 성능이 크게 향상된다.

ABSTRACT

Social networks are commonly used for marketing purposes. For example, free samples of a product can be given to a few influential social network users (or "seed nodes"), with the hope that they will convince their friends to buy it. One way to formalize marketers' objective is through influence maximization (or IM), whose goal is to find the best seed nodes to activate under a fixed budget, so that the number of people who get influenced in the end is maximized. Recent solutions to IM rely on the influence probability that a user influences another one. However, this probability information may be unavailable or incomplete. In this paper, we study IM in the absence of complete information on influence probability. We call this problem Online Influence Maximization (OIM) since we learn influence probabilities at the same time we run influence campaigns. To solve OIM, we propose a multiple-trial approach, where (1) some seed nodes are selected based on existing influence information; (2) an influence campaign is started with these seed nodes; and (3) users' feedback is used to update influence information. We adopt the Explore-Exploit strategy, which can select seed nodes using either the current influence probability estimation (exploit), or the confidence bound on the estimation (explore). Any existing IM algorithm can be used in this framework. We also develop an incremental algorithm that can significantly reduce the overhead of handling users' feedback information. Our experiments show that our solution is more effective than traditional IM methods on the partial information.

연구 동기 및 목표

사용자 간 영향력 확산 비율이 알려져 있거나 완전하지 않은 상황에서의 영향력 최적화 과제를 해결하기 위해.
영향력 캠페인을 실행하는 동안 실시간으로 영향력 확산 비율을 학습하는 프레임워크를 개발하기 위해.
사전에 영향력 확산 비율에 대한 지식이 없는 실세계 설정에서 영향력 캠페인의 효과를 향상시키기 위해.
반복적인 캠페인 동안 영향력 확산 비율 추정치 갱신에 따른 계산 오버헤드를 줄이기 위해.

제안 방법

다중 시행을 거치는 선택 및 실행 단계를 포함하는 온라인 영향력 최적화(OIM) 프레임워크를 제안한다.
탐색-활용 전략을 사용: 현재의 영향력 추정치를 활용해 시드 노드를 선택하거나, 신뢰도 구간을 이용해 불확실한 영역을 탐색한다.
공액 사전을 사용한 베이지안 갱신 메커니즘을 도입하여 영향력 확산 비율의 불확실성을 유지하고 개선한다.
이전 시행에서의 샘플을 재사용함으로써 그래프 갱신 시 계산 비용을 줄이는 점진적 알고리즘 CB-INC를 제안한다.
추정된 영향력 확산 비율을 기반으로 최신 IM 알고리즘(CELF, TIM+)을 선택 단계에 적용한다.
각 캠페인 시행에서의 사용자 피드백을 바탕으로 최대우도추정법(MLE)을 사용해 영향력 확산 비율 분포를 갱신한다.

실험 결과

연구 질문

RQ1초기 영향력 확산 비율이 알려져 있거나 불완전한 상황에서도 영향력 최적화를 효과적으로 수행할 수 있는가?
RQ2실시간 캠페인에서 새로운 영향력 확산 비율을 학습하는 것과 영향력 확산을 극대화하는 것 사이의 탐색-활용 전략이 어떻게 균형을 이룰 수 있는가?
RQ3점진적 그래프 갱신 기법은 영향력 확산에 손실을 빚지 않으면서 계산 효율성에 어떤 영향을 미치는가?
RQ4시험 수와 예산 배정 방식은 온라인 영향력 최적화의 성능에 어떤 영향을 미치는가?

주요 결과

DBLP 데이터셋에서 CB-INC는 비점진적 CB 대비 최대 16시간의 실행 시간 단축을 기록했으며, N ≥ 10일 경우 샘플 재사용률이 80–99%에 이르렀다.
CB 및 CB-INC는 τ 값에 따라 오라클(실제 영향력 그래프)의 3–15% 내외의 영향력 확산을 달성했으며, τ = 0.01일 때 가장 높은 확산을 기록했다.
CB-INC를 사용한 OIM의 영향력 확산은 시행 수가 증가할수록 오라클에 근접하게 일관되게 유지된다.
k 값이 작아질수록 효율성이 떨어지지만, k가 증가할수록 CB-INC는 CB 대비 더 큰 향상을 보였다.
작은 τ 값(예: 0.01)은 확산을 향상시키지만, 더 엄격한 전역 검사를 통해 효율성을 28–38% 감소시킨다.
NetPHY, NetHEPT, DBLP 데이터셋 전반에서 히وري스틱 방법(Redom, MaxDegree)에 비해 프레임워크가 영향력 확산과 효율성 면에서 뚜렷한 우월성을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.