QUICK REVIEW

[论文解读] Model-Independent Online Learning for Influence Maximization

Sharan Vaswani, Branislav Kveton|arXiv (Cornell University)|Mar 1, 2017

Advanced Bandit Algorithms Research被引用 20

一句话总结

该论文提出了一种模型无关的在线学习框架，用于影响最大化问题，采用成对可达概率作为代理目标函数，从而在不假设特定扩散模型的前提下，实现鲁棒且统计高效的种子节点选择。该框架引入了一种基于LinUCB的算法，并提出了一种新颖的成对影响半- bandit反馈模型，其遗憾界在依赖网络规模方面相比先前工作有所改进。

ABSTRACT

We consider influence maximization (IM) in social networks, which is the problem of maximizing the number of users that become aware of a product by selecting a set of "seed" users to expose the product to. While prior work assumes a known model of information diffusion, we propose a novel parametrization that not only makes our framework agnostic to the underlying diffusion model, but also statistically efficient to learn from data. We give a corresponding monotone, submodular surrogate function, and show that it is a good approximation to the original IM objective. We also consider the case of a new marketer looking to exploit an existing social network, while simultaneously learning the factors governing information propagation. For this, we propose a pairwise-influence semi-bandit feedback model and develop a LinUCB-based bandit algorithm. Our model-independent analysis shows that our regret bound has a better (as compared to previous work) dependence on the size of the network. Experimental evaluation suggests that our framework is robust to the underlying diffusion model and can efficiently learn a near-optimal solution.

研究动机与目标

为解决在社交网络中影响最大化问题，而无需依赖已知的扩散模型，因为在实际应用中该模型往往未知或错误指定。
开发一种基于成对可达概率的、统计高效且与模型无关的影响传播参数化方法。
设计一种在线学习算法，实现实时学习影响因子的同时，平衡探索与利用。
通过减少对网络规模的依赖，改进在线影响最大化中的遗憾界，相比先前工作。
通过图拉普拉斯特征与共轭梯度求解器，实现一种实用且可扩展的算法，适用于大规模网络。

提出的方法

提出一种基于最大可达性的代理目标函数，该函数具有单调性与子模性，可近似真实的影响最大化目标。
引入一种成对影响半- bandit反馈模型，该模型观测节点对之间的影响力结果，而非边级别的反馈。
将影响过程建模为线性Bandit问题，使用从图拉普拉斯特征向量导出的特征。
开发一种基于LinUCB的算法，维护可达概率的置信上界，并选择种子集合以最小化累积遗憾。
采用拉普拉斯正则化，结合Sylvester方程形式化表达，并利用共轭梯度求解器高效更新参数估计。
利用Sherman-Morrison公式维护逆矩阵的对角元素，以实现快速置信区间更新。

实验结果

研究问题

RQ1是否可以在不假设特定扩散模型（如IC或LT）的前提下，有效解决影响最大化问题？
RQ2如何构建一种代理目标函数，使其同时具备单调性、子模性，并良好逼近真实的影响传播？
RQ3何种反馈结构可实现影响参数的高效在线学习，同时最小化遗憾？
RQ4是否可以推导出一种遗憾界，其在依赖网络规模方面相比现有方法具有更优的扩展性？
RQ5如何通过基于图的特征工程，使算法在真实网络中具备可扩展性与实用性？

主要发现

基于最大可达性的代理目标函数是真实影响最大化目标的强近似，可实现高效优化。
基于LinUCB的算法实现了遗憾界，其对时间跨度的依赖达到最优，且在依赖网络规模方面相比先前工作具有改进的扩展性。
框架对底层扩散模型具有鲁棒性，已在真实网络上通过实证评估得到验证。
利用拉普拉斯特征向量特征可实现高效计算与可扩展推理，共轭梯度求解器每轮耗时O(dn²)。
通过预计算的ℓ₂范数与Sherman-Morrison公式实现的动态更新，可高效计算可达概率的置信区间。
实证结果表明，该算法收敛迅速，并在真实扩散模型未知或错误指定的情况下，仍能实现接近最优的影响传播。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。