QUICK REVIEW

[论文解读] Boltzmann Generators -- Sampling Equilibrium States of Many-Body Systems with Deep Learning

Frank Noé, Simon Olsson|arXiv (Cornell University)|Dec 4, 2018

Protein Structure and Dynamics参考文献 2被引用 67

一句话总结

论文提出 Boltzmann Generators，即可逆神经网络，将复杂的构型空间映射到潜在空间，以实现对 Boltzmann 样分布的一次性高效采样，从而进行自由能计算并在无需预先定义反应坐标的情况下发现新状态。

ABSTRACT

Computing equilibrium states in condensed-matter many-body systems, such as solvated proteins, is a long-standing challenge. Lacking methods for generating statistically independent equilibrium samples in "one shot", vast computational effort is invested for simulating these system in small steps, e.g., using Molecular Dynamics. Combining deep learning and statistical mechanics, we here develop Boltzmann Generators, that are shown to generate unbiased one-shot equilibrium samples of representative condensed matter systems and proteins. Boltzmann Generators use neural networks to learn a coordinate transformation of the complex configurational equilibrium distribution to a distribution that can be easily sampled. Accurate computation of free energy differences and discovery of new configurations are demonstrated, providing a statistical mechanics tool that can avoid rare events during sampling without prior knowledge of reaction coordinates.

研究动机与目标

激励在密集多体系统和蛋白质中采样平衡态的挑战。
提出基于神经网络的坐标变换，将构型映射到易于采样的潜在空间。
通过能量（KL 损失）和通过实例（最大似然）进行训练，以避免模式崩溃。
在模型系统和真实蛋白质中展示无偏采样和自由能计算，包括不连通的状态。

提出的方法

训练一个可逆的神经网络 F_zx，将来自高斯先验的潜在样本 z 转换为带有 Boltzmann 权重的构型 x。
通过 J_KL = E_z[u(F_zx(z)) - log R_zx(z)] 最小化生成分布与 Boltzmann 分布之间的 KL 散度，其中 R_zx 为雅可比行列式。
使用能量训练（KL）和通过示例训练（最大似然）来在采样低能态和保持熵之间取得平衡。
可选地包含反应坐标损失，以增强沿所选坐标的采样。
对生成的样本重新加权以得到 Boltzmann 分布，从而计算热力学可观测量。

实验结果

研究问题

RQ1神经网络是否能够学习一个坐标变换，在没有预先定义的反应坐标的情况下，产生来自 Boltzmann 分布的无偏的一次性样本？
RQ2Boltzmann Generators 在 metastable 高维系统中再现自由能差和采样跃迁态的效果有多高？
RQ3潜在空间表示是否有助于探索构型空间并实现对新的准稳态的采样？
RQ4是否有可能扩展到复杂分子和不连通状态，并在不进行大量分子动力学的情况下计算温度依赖的自由能？

主要发现

Boltzmann Generators 产生无偏的一次性样本，在重新加权后能够再现 Boltzmann 统计。
能量训练加上实例训练防止模式坍塌，并在模型系统中给出准确的自由能差。
潜在空间插值 between states 生成物理上有意义的低能路径。
对于像 BPTI 这样的复杂分子，该方法能够对全原子结构进行采样，并在重新加权支持下再现真实的键长/角分布。
使用多个 Boltzmann Generators 处理不连通状态，可以在无需预定义反应坐标的情况下直接计算自由能差，相比穷举 MD 和伞模型采样实现了显著加速。
将潜在空间搜索方法与潜在空间中的 Metropolis 蒙特卡洛结合，能够加快新状态和转变的发现。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。