[论文解读] Neural Quantum States in Mixed Precision
论文从混合精度 MH MCMC 中推导采样偏差边界,并展示神经量子态 VMC 采样在半精度下可大部分运行,在不损失精度的情况下实现高达 3.5x 的加速。
Scientific computing has long relied on double precision (64-bit floating point) arithmetic to guarantee accuracy in simulations of real-world phenomena. However, the growing availability of hardware accelerators such as Graphics Processing Units (GPUs) has made low-precision formats attractive due to their superior performance, reduced memory footprint, and improved energy efficiency. In this work, we investigate the role of mixed-precision arithmetic in neural-network based Variational Monte Carlo (VMC), a widely used method for solving computationally otherwise intractable quantum many-body systems. We first derive general analytical bounds on the error introduced by reduced precision on Metropolis-Hastings MCMC, and then empirically validate these bounds on the use-case of VMC. We demonstrate that significant portions of the algorithm, in particular, sampling the quantum state, can be executed in half precision without loss of accuracy. More broadly, this work provides a theoretical framework to assess the applicability of mixed-precision arithmetic in machine-learning approaches that rely on MCMC sampling. In the context of VMC, we additionally demonstrate the practical effectiveness of mixed-precision strategies, enabling more scalable and energy-efficient simulations of quantum many-body systems.
研究动机与目标
- 在基于 MCMC 的神经网络量子态方法中,激励降低数值精度。
- 推导有限精度扰动在 Metropolis–Hastings 采样中的偏差的理论边界。
- 提出一个混合精度的 VMC 框架,在大部分计算保持高精度、仅对采样使用低精度。
- 在量子多体系统的神经量子态训练中展示实际加速与保持精度。
提出的方法
- 将 reduced precision 建模为对对数概率的加性扰动:log pi(x) -> log pi(x) + delta(x)。
- 使用 Doeblin 压缩与混合性质推导真分布与扰动后分布之间的全变分距离上界。
- 将边界限定在具有高斯噪声的 Local-MH,以获得依赖于噪声 sigma 和收敛率 r 的显式 TV 界。
- 开发一个两拷贝训练方案,其中一个高精度模型用于更新,另一个低精度模型用于采样。
- 在 RBMs 和 TFIM 基 NQS 架构上,经验性验证对数密度扰动的高斯性质并在降低精度下测试采样。

实验结果
研究问题
- RQ1降低精度的算术运算如何扰动 Metropolis–Hastings 采样器,以及对稳态分布产生的偏差是什么?
- RQ2混合精度采样是否能在不降低基态精度的前提下加速神经量子态变分蒙特卡罗?
- RQ3在 NQS/VMC 中以半精度进行采样时的实际加速和稳定性条件是什么?
- RQ4理论边界如何与在不同量子模型和网络架构中的经验性能相关?
主要发现
- 理论边界表明混合精度偏差随扰动和混合速率而变化;混合更快的混合导致偏差更小。
- 具有高斯噪声的 Local-MH 在轨迹快速混合时给出具体的 TV 上界(由收敛率 r 推动的紧致性)。
- 一个可行的混合精度 VMC 框架实现低精度采样,同时更新保持高精度。
- 经验结果显示在 RBMs 和 ResCNNs 上对 TFIM 及相关模型的训练性能不下降的情况下,采样速度提升可达 3.5x。
- 对数密度的高斯扰动在测试态中近似正态,支持边界中使用的高斯噪声模型。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。