[论文解读] Optimal Streaming Algorithms for Submodular Maximization with Cardinality Constraints
该论文提出了一种单遍流算法,用于在基数约束下最大化非单调子模函数,使用 O(k/ε²) 的内存。它通过基于阈值的贪心过程维护一个候选集,并通过任意能实现 α-近似率的离线下处理算法进行后处理,获得 α/(1+α) − ε 的近似保证,从而在精确后处理下实现 1/2 − ε 的近似率,在使用当前最先进的多项式时间算法(α = 0.385)时实现 0.2779 的近似率。
We study the problem of maximizing a non-monotone submodular function subject to a cardinality constraint in the streaming model. Our main contributions are two single-pass (semi-)streaming algorithms that use Õ(k)⋅poly(1/ε) memory, where k is the size constraint. At the end of the stream, both our algorithms post-process their data structures using any offline algorithm for submodular maximization, and obtain a solution whose approximation guarantee is α/(1+α)-ε, where α is the approximation of the offline algorithm. If we use an exact (exponential time) post-processing algorithm, this leads to 1/2-ε approximation (which is nearly optimal). If we post-process with the algorithm of [Niv Buchbinder and Moran Feldman, 2019], that achieves the state-of-the-art offline approximation guarantee of α = 0.385, we obtain 0.2779-approximation in polynomial time, improving over the previously best polynomial-time approximation of 0.1715 due to [Feldman et al., 2018]. One of our algorithms is combinatorial and enjoys fast update and overall running times. Our other algorithm is based on the multilinear extension, enjoys an improved space complexity, and can be made deterministic in some settings of interest.
研究动机与目标
- 解决在基数约束下非单调子模最大化问题中缺乏最优流算法的问题。
- 克服先前流算法在多项式时间内仅能达到 1/3 + 2/√2 ≈ 0.1715 近似率的局限性。
- 设计一种流算法,使任何现有的离线下子模最大化算法均可用于后处理,以提升近似保证。
- 在多项式空间和时间内实现接近最优的近似比(1/2 − ε),与已知的不可近似性下界一致。
- 提供一种确定性、组合式的算法,具有快速的单元素更新时间,这在非单调子模优化中较为罕见。
提出的方法
- 采用单遍流方法,通过动态阈值 κ 的基于阈值的贪心选择过程维护候选集 S1,1。
- 应用随机采样策略:创建 m = Θ(1/ε) 个独立的流样本,每个样本通过基于阈值的贪心算法处理,形成集合 Si,1。
- 构建并集集合 U = ∪i Si,1,作为任意离线下子模最大化算法后处理的输入。
- 使用离线下算法对 U 进行后处理,得到解 T,并返回 S1,1 和 T 中目标函数值更大的一个。
- 利用凸扩展和浓度不等式分析最终解的期望值,使用多线性扩展和受限尺度不变性。
- 利用条件概率和子模性,界定 O′₂ 对 S1,1 的边际增益,并证明 f(S1,1 ∪ (O1 ∩ U)) 的期望值接近 f(OPT)。
实验结果
研究问题
- RQ1能否仅使用 poly(k, 1/ε) 内存的流算法,实现对非单调子模最大化问题在基数约束下的 (1/2 − ε)-近似?
- RQ2是否可以将已在单调情形下成功的单阈值贪心方法,适配到非单调设置下的流计算中?
- RQ3能否通过后处理有效利用现有的高质量离线下子模最大化算法,使其在流模型中发挥作用?
- RQ4在仅使用 poly(k, 1/ε) 空间的前提下,非单调子模最大化在流模型中能达到的最优近似比是多少?
- RQ5能否设计一种确定性、组合式的流算法,实现非单调子模最大化问题的快速更新时间?
主要发现
- 所提算法实现了 α/(1+α) − ε 的近似比,其中 α 是后处理中使用的离线下算法的近似比。
- 若使用精确(指数时间)的离线下算法进行后处理,可实现 (1/2 − ε)-近似,与该问题在流模型中已知的 1/2 不可近似性下界一致。
- 当使用当前最先进的多项式时间离线下算法(α = 0.385)时,该方法实现了 0.2779 的近似率,优于此前最佳的 0.1715。
- 该算法仅使用 O(k/ε²) 内存,且每个元素的更新时间快,为 O((log k + log(1/α))/ε²),适用于大规模数据。
- 该算法是确定性和组合式的,在非单调子模最大化中较为罕见,且避免依赖连续松弛或复杂分布。
- 分析表明,E[f(S1,1 ∪ (O1 ∩ U))] ≥ (1 − 3ε)f(OPT) − κb,且最终解满足 E[max{f(S1,1), f(T)}] ≥ (α/(1+α) − 3ε)f(OPT),从而证明了主要的近似保证。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。