Skip to main content
QUICK REVIEW

[论文解读] Adjusted Scores for Discrete Langevin Algorithms

Armand Gissler, Saeed Saremi|arXiv (Cornell University)|Feb 17, 2026
Markov Chains and Monte Carlo Methods被引用 0
一句话总结

该论文将二进制超立方体上的离散Langevin采样器重新表述为持续时间 Glauber 动态的离散化,提出歧义性较小的分数函数(Gibbs 分数和 Glauber 分数),并分析带有马尔可夫调整的变体(DMALA、DMAPS)的收缩性及理论保证与实验。

ABSTRACT

Sampling from discrete distributions is a ubiquitous task in machine learning, recently revisited by the emergence of discrete diffusion models. While Langevin algorithms constitute the state of the art for continuous spaces, discrete versions lack similar theoretical guarantees when the step-size becomes small. In this paper, we address this limitation by interpreting discrete sampling algorithms as discretizations of continuous-time dynamics on the hypercube. In particular, we describe several score functions for discrete algorithms which result in approximations of Glauber dynamics for the correct target distribution. We also compute upper bounds for the contraction of these algorithms, with or without Metropolis adjustment.

研究动机与目标

  • 在有限空间上动机化从离散分布采样,并将离散 Langevin 方法与超立方体上的连续时间动力学联系起来。
  • 引入歧义性较小的分数函数(Gibbs 分数与 Glauber 分数),以定义在步长趋近于零时具有明确极限行为的离散化。
  • 推导并分析若干算法(DULA、DUPS、DMALA、DMAPS),并建立收缩性质与不变分布。
  • 给出理论上的收缩结果与不调整和马尔可夫调整采样器的误差界,并通过多峰目标的实验进行验证。

提出的方法

  • 将离散采样框定为在超立方体上的 Glauber 动力学离散化,给出生成矩阵。
  • 定义 Glauber score delta log p(x) 与 Gibbs score s(x),以在步长 → 0 时获得明确的极限行为。
  • 描述四种算法:DULA(离散的 ULA)、DMALA(其马尔可夫调整版本)、DUPS(离散未调整的近似采样器)、DMAPS(马尔可夫调整的近似采样器)。
  • 展示 DULA 与 DUPS 作为连续时间过程的离散化;在分数函数光滑性条件(β1、β2)与步长条件下推导收缩界。
  • 引入马尔可夫调整并推导基于接受的收缩界与不变性保证;将其与 Gibbs 采样和近似 Gibbs 动力学联系起来。

实验结果

研究问题

  • RQ1离散 Langevin 型采样器在 {−1,1}^d 上是否可以解释为底层连续时间 Glauber 动力学的离散化?
  • RQ2Gibbs 与 Glauber 分数是否在步长较小时提供明确、不易混淆的极限行为,这些分数如何影响收缩速率?
  • RQ3未调整的(DULA、DUPS)与马尔可夫调整的(DMALA、DMAPS)离散采样器的收缩速率与不变测度误差如何,与 Gibbs 采样相比如何?
  • RQ4在多峰目标(Ising、Curie–Weiss、比特混合)上,这些离散方法在混合性及对 p(·) 的逼近方面的表现如何?

主要发现

  • DULA 与 DUPS 可被视为具有适当分数的 Glauber 动力学离散化,在步长较小时在 Wasserstein 距离上具有收缩性。
  • 使用 Gibbs 分数可在较小步长下改善收缩界,且在满足条件时,随着步长趋于零,不变分布误差消失。
  • Glauber 分数结合 DUPS 使算法在小步长极限下表现得像 Gibbs 近似采样,且在较大步长时可能收敛更快。
  • 马尔可夫调整(DMALA、DMAPS)提供不变目标保证,并给出基于接受性属性和提议正则性的收缩界。
  • 在比特混合、Ising 与 Curie–Weiss 模型上的实验表明 DMAPS 与 DUPS 在某些区间优于 Gibbs 采样;DULA 在较小步长下提供较强的近似。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。