Skip to main content
QUICK REVIEW

[论文解读] Revisiting the Random Subset Sum Problem

Arthur da Cunha, Francesco d’Amore|arXiv (Cornell University)|Apr 29, 2022
Complexity and Algorithms in Graphs参考文献 27被引用 1
一句话总结

本文提供了随机子集和逼近一个基础结果的简化、直接证明,表明在 [−1,1] 上独立同分布的均匀随机变量 O(log(1/ε)) 个就足以以高概率 ε-逼近 [−1,1] 中的任意目标。该方法通过在子集和上追踪体积,利用条件期望和随机支配分析其期望增长,避免了先前证明中使用的复杂鞅变换,得到了具有显式常数的紧致浓度界限,明确了所需样本量。

ABSTRACT

The average properties of the well-known Subset Sum Problem can be studied by means of its randomised version, where we are given a target value z, random variables X_1, …, X_n, and an error parameter ε > 0, and we seek a subset of the X_is whose sum approximates z up to error ε. In this setup, it has been shown that, under mild assumptions on the distribution of the random variables, a sample of size 𝒪(log(1/ε)) suffices to obtain, with high probability, approximations for all values in [-1/2, 1/2]. Recently, this result has been rediscovered outside the algorithms community, enabling meaningful progress in other fields. In this work, we present an alternative proof for this theorem, with a more direct approach and resourcing to more elementary tools.

研究动机与目标

  • 提供定理 1 的更直观、更初等的证明,该定理表明在 [−1,1] 上独立同分布的均匀随机变量 O(log(1/ε)) 个足以以高概率 ε-逼近 [−1,1] 中的任意目标。
  • 用对子集和体积增长的直接分析(基于条件期望和随机支配)替代原始证明中对非线性变换和鞅理论的依赖。
  • 通过使论证更透明和易懂,阐明随机子集和问题中相变背后的概率机制。
  • 通过推导 hitting time 的浓度不等式中的显式常数,加强对所需样本量的定量界限。

提出的方法

  • 按顺序揭示 X1,…,Xn 变量时,追踪可被子集和 ε-逼近的 [−1,1] 区间体积。
  • 将 vt 定义为在 t 个变量后能获得 ε-逼近的 [−1,1] 比例,并通过条件期望分析其期望增长。
  • 采用两阶段分析:第一阶段从初始体积增长到 1/2,第二阶段从 1/2 增长到 1−ε/2,分别对 hitting time τ1 和 τ2 设定界限。
  • 通过几何和二项分布随机变量的随机支配关系,利用 Azuma-Hoeffding 不等式和马尔可夫不等式,对 τ1 和 τ2 的尾部概率进行界定。
  • 建立近似体积增长的期望下界为乘法因子,从而确保未覆盖部分的指数衰减。
  • 通过并集界和指数尾部估计结合两阶段分析,推导出总时间 τ = τ1 + τ2 达到 1−ε/2 覆盖率的浓度不等式。

实验结果

研究问题

  • RQ1能否在不依赖复杂鞅变换的前提下,为随机子集和逼近结果构造一个更简单、更直接的证明?
  • RQ2在 [−1,1] 上独立同分布的均匀随机变量中,为确保 [−1,1] 中所有目标以高概率被 ε-逼近,所需的最小数量是多少?
  • RQ3在过程中不丢弃任何子集和的前提下,如何分析可逼近值集合的期望增长?
  • RQ4在随机子集和问题中,可实现高概率逼近所需的样本量,能推导出哪些显式常数?
  • RQ5足够逼近覆盖的 hitting time 如何随机演化,且能否被紧密界定?

主要发现

  • 本文证明:对任意 ε ∈ (0, 1/3),在 [−1,1] 上独立同分布的均匀随机变量 O(log(1/ε)) 个就足以以高概率 ε-逼近 [−1,1] 中的所有目标。
  • 所需样本量被定量界定:当 t ≥ C′ log(1/ε),其中 C′ = 60 / log(17/16) 时,近似体积达到 1−ε/2 的概率至少为 1 − 2 exp(−1/(15²t)(t − C′ log(1/ε))²)。
  • 体积达到 1−ε/2 的 hitting time τ = τ1 + τ2 被几何和二项分布随机变量的和随机支配,从而实现精确的尾部界限。
  • 分析表明,期望体积增长被一个乘法因子下界控制,确保向完全覆盖的指数收敛。
  • 该证明避免了非线性变换和鞅理论,转而使用直接的条件期望分析和随机支配,使论证更透明、更直观。
  • 最终结果表明,一旦区间中 1−ε/2 的部分被覆盖,所有 z ∈ [−1,1] 都将被 2ε-逼近,从而以更清晰的表述和更紧的常数确认了原始定理。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。