Skip to main content
QUICK REVIEW

[论文解读] Model-Independent Online Learning for Influence Maximization

Sharan Vaswani, Branislav Kveton|arXiv (Cornell University)|Mar 1, 2017
Advanced Bandit Algorithms Research被引用 20
一句话总结

该论文提出了一种模型无关的在线学习框架,用于影响最大化问题,采用成对可达概率作为代理目标函数,从而在不假设特定扩散模型的前提下,实现鲁棒且统计高效的种子节点选择。该框架引入了一种基于LinUCB的算法,并提出了一种新颖的成对影响半- bandit反馈模型,其遗憾界在依赖网络规模方面相比先前工作有所改进。

ABSTRACT

We consider influence maximization (IM) in social networks, which is the problem of maximizing the number of users that become aware of a product by selecting a set of "seed" users to expose the product to. While prior work assumes a known model of information diffusion, we propose a novel parametrization that not only makes our framework agnostic to the underlying diffusion model, but also statistically efficient to learn from data. We give a corresponding monotone, submodular surrogate function, and show that it is a good approximation to the original IM objective. We also consider the case of a new marketer looking to exploit an existing social network, while simultaneously learning the factors governing information propagation. For this, we propose a pairwise-influence semi-bandit feedback model and develop a LinUCB-based bandit algorithm. Our model-independent analysis shows that our regret bound has a better (as compared to previous work) dependence on the size of the network. Experimental evaluation suggests that our framework is robust to the underlying diffusion model and can efficiently learn a near-optimal solution.

研究动机与目标

  • 为解决在社交网络中影响最大化问题,而无需依赖已知的扩散模型,因为在实际应用中该模型往往未知或错误指定。
  • 开发一种基于成对可达概率的、统计高效且与模型无关的影响传播参数化方法。
  • 设计一种在线学习算法,实现实时学习影响因子的同时,平衡探索与利用。
  • 通过减少对网络规模的依赖,改进在线影响最大化中的遗憾界,相比先前工作。
  • 通过图拉普拉斯特征与共轭梯度求解器,实现一种实用且可扩展的算法,适用于大规模网络。

提出的方法

  • 提出一种基于最大可达性的代理目标函数,该函数具有单调性与子模性,可近似真实的影响最大化目标。
  • 引入一种成对影响半- bandit反馈模型,该模型观测节点对之间的影响力结果,而非边级别的反馈。
  • 将影响过程建模为线性Bandit问题,使用从图拉普拉斯特征向量导出的特征。
  • 开发一种基于LinUCB的算法,维护可达概率的置信上界,并选择种子集合以最小化累积遗憾。
  • 采用拉普拉斯正则化,结合Sylvester方程形式化表达,并利用共轭梯度求解器高效更新参数估计。
  • 利用Sherman-Morrison公式维护逆矩阵的对角元素,以实现快速置信区间更新。

实验结果

研究问题

  • RQ1是否可以在不假设特定扩散模型(如IC或LT)的前提下,有效解决影响最大化问题?
  • RQ2如何构建一种代理目标函数,使其同时具备单调性、子模性,并良好逼近真实的影响传播?
  • RQ3何种反馈结构可实现影响参数的高效在线学习,同时最小化遗憾?
  • RQ4是否可以推导出一种遗憾界,其在依赖网络规模方面相比现有方法具有更优的扩展性?
  • RQ5如何通过基于图的特征工程,使算法在真实网络中具备可扩展性与实用性?

主要发现

  • 基于最大可达性的代理目标函数是真实影响最大化目标的强近似,可实现高效优化。
  • 基于LinUCB的算法实现了遗憾界,其对时间跨度的依赖达到最优,且在依赖网络规模方面相比先前工作具有改进的扩展性。
  • 框架对底层扩散模型具有鲁棒性,已在真实网络上通过实证评估得到验证。
  • 利用拉普拉斯特征向量特征可实现高效计算与可扩展推理,共轭梯度求解器每轮耗时O(dn²)。
  • 通过预计算的ℓ₂范数与Sherman-Morrison公式实现的动态更新,可高效计算可达概率的置信区间。
  • 实证结果表明,该算法收敛迅速,并在真实扩散模型未知或错误指定的情况下,仍能实现接近最优的影响传播。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。