QUICK REVIEW

[论文解读] Revisiting the Random Subset Sum Problem

Arthur da Cunha, Francesco d’Amore|arXiv (Cornell University)|Apr 29, 2022

Complexity and Algorithms in Graphs参考文献 27被引用 1

一句话总结

本文提供了随机子集和逼近一个基础结果的简化、直接证明，表明在 [−1,1] 上独立同分布的均匀随机变量 O(log(1/ε)) 个就足以以高概率 ε-逼近 [−1,1] 中的任意目标。该方法通过在子集和上追踪体积，利用条件期望和随机支配分析其期望增长，避免了先前证明中使用的复杂鞅变换，得到了具有显式常数的紧致浓度界限，明确了所需样本量。

ABSTRACT

The average properties of the well-known Subset Sum Problem can be studied by means of its randomised version, where we are given a target value z, random variables X_1, …, X_n, and an error parameter ε > 0, and we seek a subset of the X_is whose sum approximates z up to error ε. In this setup, it has been shown that, under mild assumptions on the distribution of the random variables, a sample of size 𝒪(log(1/ε)) suffices to obtain, with high probability, approximations for all values in [-1/2, 1/2]. Recently, this result has been rediscovered outside the algorithms community, enabling meaningful progress in other fields. In this work, we present an alternative proof for this theorem, with a more direct approach and resourcing to more elementary tools.

研究动机与目标

提供定理 1 的更直观、更初等的证明，该定理表明在 [−1,1] 上独立同分布的均匀随机变量 O(log(1/ε)) 个足以以高概率 ε-逼近 [−1,1] 中的任意目标。
用对子集和体积增长的直接分析（基于条件期望和随机支配）替代原始证明中对非线性变换和鞅理论的依赖。
通过使论证更透明和易懂，阐明随机子集和问题中相变背后的概率机制。
通过推导 hitting time 的浓度不等式中的显式常数，加强对所需样本量的定量界限。

提出的方法

按顺序揭示 X1,…,Xn 变量时，追踪可被子集和 ε-逼近的 [−1,1] 区间体积。
将 vt 定义为在 t 个变量后能获得 ε-逼近的 [−1,1] 比例，并通过条件期望分析其期望增长。
采用两阶段分析：第一阶段从初始体积增长到 1/2，第二阶段从 1/2 增长到 1−ε/2，分别对 hitting time τ1 和 τ2 设定界限。
通过几何和二项分布随机变量的随机支配关系，利用 Azuma-Hoeffding 不等式和马尔可夫不等式，对 τ1 和 τ2 的尾部概率进行界定。
建立近似体积增长的期望下界为乘法因子，从而确保未覆盖部分的指数衰减。
通过并集界和指数尾部估计结合两阶段分析，推导出总时间 τ = τ1 + τ2 达到 1−ε/2 覆盖率的浓度不等式。

实验结果

研究问题

RQ1能否在不依赖复杂鞅变换的前提下，为随机子集和逼近结果构造一个更简单、更直接的证明？
RQ2在 [−1,1] 上独立同分布的均匀随机变量中，为确保 [−1,1] 中所有目标以高概率被 ε-逼近，所需的最小数量是多少？
RQ3在过程中不丢弃任何子集和的前提下，如何分析可逼近值集合的期望增长？
RQ4在随机子集和问题中，可实现高概率逼近所需的样本量，能推导出哪些显式常数？
RQ5足够逼近覆盖的 hitting time 如何随机演化，且能否被紧密界定？

主要发现

本文证明：对任意 ε ∈ (0, 1/3)，在 [−1,1] 上独立同分布的均匀随机变量 O(log(1/ε)) 个就足以以高概率 ε-逼近 [−1,1] 中的所有目标。
所需样本量被定量界定：当 t ≥ C′ log(1/ε)，其中 C′ = 60 / log(17/16) 时，近似体积达到 1−ε/2 的概率至少为 1 − 2 exp(−1/(15²t)(t − C′ log(1/ε))²)。
体积达到 1−ε/2 的 hitting time τ = τ1 + τ2 被几何和二项分布随机变量的和随机支配，从而实现精确的尾部界限。
分析表明，期望体积增长被一个乘法因子下界控制，确保向完全覆盖的指数收敛。
该证明避免了非线性变换和鞅理论，转而使用直接的条件期望分析和随机支配，使论证更透明、更直观。
最终结果表明，一旦区间中 1−ε/2 的部分被覆盖，所有 z ∈ [−1,1] 都将被 2ε-逼近，从而以更清晰的表述和更紧的常数确认了原始定理。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。