[论文解读] Estimating Ratios of Normalizing Constants Using Linked Importance Sampling
本文提出链接重要性抽样(LIS),一种用于贝叶斯统计和统计物理中估计归一化常数之比的方法。通过在一系列中间分布的每个阶段使用类似桥接抽样的估计,LIS 在某些问题中(尤其是重尾分布或罕见事件)相比退火重要性抽样(AIS)实现了显著更高的估计精度,同时即使马尔可夫链未达到平衡状态,也能保持精确无偏性。
Ratios of normalizing constants for two distributions are needed in both Bayesian statistics, where they are used to compare models, and in statistical physics, where they correspond to differences in free energy. Two approaches have long been used to estimate ratios of normalizing constants. The `simple importance sampling' (SIS) or `free energy perturbation' method uses a sample drawn from just one of the two distributions. The `bridge sampling' or `acceptance ratio' estimate can be viewed as the ratio of two SIS estimates involving a bridge distribution. For both methods, difficult problems must be handled by introducing a sequence of intermediate distributions linking the two distributions of interest, with the final ratio of normalizing constants being estimated by the product of estimates of ratios for adjacent distributions in this sequence. Recently, work by Jarzynski, and independently by Neal, has shown how one can view such a product of estimates, each based on simple importance sampling using a single point, as an SIS estimate on an extended state space. This `Annealed Importance Sampling' (AIS) method produces an exactly unbiased estimate for the ratio of normalizing constants even when the Markov transitions used do not reach equilibrium. In this paper, I show how a corresponding `Linked Importance Sampling' (LIS) method can be constructed in which the estimates for individual ratios are similar to bridge sampling estimates. I show empirically that for some problems, LIS estimates are much more accurate than AIS estimates found using the same computation time, although for other problems the two methods have similar performance. Linked sampling methods similar to LIS are useful for other purposes as well.
研究动机与目标
- 开发一种比退火重要性抽样(AIS)更精确的替代方法,用于估计贝叶斯推断和统计物理中归一化常数之比。
- 解决简单重要性抽样和桥接抽样在分布重叠差或重尾时的局限性。
- 构建一种即使在马尔可夫链转移未达到平衡时也能保持精确无偏性的方法。
- 探讨通过桥接抽样估计链接中间分布是否能提高相比AIS的估计效率。
- 研究LIS在高维或多重模态设置下(尤其是孤立模态)优于AIS的条件。
提出的方法
- 提出链接重要性抽样(LIS)作为AIS的变体,其中相邻分布之间的每个比值估计均采用桥接抽样方法,而非简单重要性抽样。
- 使用由ηj参数化的中间分布序列,连接目标分布π0和π1,其间的转移由梅特罗波利斯-黑斯廷斯算法控制。
- 在包含当前和下一分布状态的扩展状态空间上采用联合抽样方案,确保对各比值乘积的无偏估计。
- 基于形式exp(−(ηj+1−ηj)(U(x,y1)−U(x,y0))),利用分布间的能量差推导扩展空间中状态间转移的接受概率。
- 提出一种灵活的框架,其中每个阶段的马尔可夫步数Kj可自适应调整,建议在每个阶段执行多次“巡游”(从高能态到低能态)可提升抽样质量。
- 将方法扩展为允许每个中间分布仅执行一次转移,旨在实现类似AIS的平滑估计,但通过桥接抽样组件实现更优的方差控制。
实验结果
研究问题
- RQ1基于序列中每个阶段的桥接抽样估计,是否能比AIS更优地估计归一化常数之比?
- RQ2在何种条件下LIS相比AIS能显著提升精度,特别是在高维或多重模态问题中?
- RQ3在LIS的顶层使用桥接抽样是否相比简单重要性抽样能进一步提升估计效率?
- RQ4在重尾分布或罕见事件问题中,LIS的表现如何,而AIS可能因重叠差而失效?
- RQ5自适应抽样策略(如每阶段执行多次“巡游”)是否能在不显著增加计算成本的前提下提升LIS性能?
主要发现
- 即使马尔可夫链转移未达到平衡,LIS也能对归一化常数之比产生精确无偏估计。
- 在重尾分布或罕见事件问题中,LIS相比AIS可实现显著更高的精度,尤其当中间分布被精心选择以改善重叠时。
- 在方差比为2的100维球状正态分布测试中,LIS与AIS表现相似,表明在高斯设置下无明显优势。
- LIS在涉及定义罕见事件的约束问题中尤其有前景,AIS可能因零概率区域而失效,而LIS能保持更好的混合性和精度。
- 当仅能获得有限数量的中间分布时(例如在序列重要性抽样中),LIS可优于AIS,因其在每步中具有更好的重叠性和更稳定的估计。
- 该方法在多重模态设置中依然稳健,即使分布包含孤立模态,也能实现期望估计,与AIS表现相似。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。