[论文解读] Regularised Atomic Body-Ordered Permutation-Invariant Polynomials for the Construction of Interatomic Potentials
本文提出了一种原子体序排列不变多项式(aPIPs),这是一种系统性、对称性保持的框架,用于通过低体序多项式展开构建原子间势能。通过将能量显式分解为原子贡献项并结合定制化正则化,aPIPs 在保持与最先进核方法(如 SOAP-GAP)相当的可转移性的同时,显著提升了速度和可解释性,尤其在如 Burgers 路径测试等外推场景中表现更优。
We investigate the use of invariant polynomials in the construction of data-driven interatomic potentials for material systems. The "atomic body-ordered permutation-invariant polynomials" (aPIPs) comprise a systematic basis and are constructed to preserve the symmetry of the potential energy function with respect to rotations and permutations. In contrast to kernel based and artificial neural network models, the explicit decomposition of the total energy as a sum of atomic body-ordered terms allows to keep the dimensionality of the fit reasonably low, up to just 10 for the 5-body terms. The explainability of the potential is aided by this decomposition, as the low body-order components can be studied and interpreted independently. Moreover, although polynomial basis functions are thought to extrapolate poorly, we show that the low dimensionality combined with careful regularisation actually leads to better transferability than the high dimensional, kernel based Gaussian Approximation Potential.
研究动机与目标
- 开发一种系统性、对称性保持的原子间势能基函数,以维持排列和旋转不变性。
- 通过利用低维体序多项式项,解决如 SOAP-GAP 等高维模型在外推性能上的不足。
- 通过显式正则化低体序项,提升数据驱动原子间势能在可转移性和泛化能力方面的表现。
- 为高维核方法或神经网络模型提供一种更具可解释性和计算效率的替代方案。
提出的方法
- 通过系统性多项式展开,将总能量分解为原子体序项(1体、2体、……、5体),并保持排列和旋转不变性。
- 对每个体序项应用排列不变多项式(PIPs),确保在原子排列和旋转下保持不变。
- 对每项应用截断函数,以保证局域性和物理一致性。
- 对多项式系数施加正则化,以强制平滑性并防止出现非物理行为,特别是在数据稀疏区域。
- 模型在固态构型上进行训练(而非孤立团簇),以提升物理一致性和可转移性。
- 该框架使用 Julia 实现,并应用于钨、硅和钛体系,使用开源数据集和代码。
实验结果
研究问题
- RQ1具有排列不变性的系统性低体序多项式展开,能否实现与最先进核方法相当的高精度?
- RQ2对低维多项式系数施加正则化,如何提升在数据稀缺区域的泛化与外推能力?
- RQ3将能量分解为原子体序项是否能在不损失精度或效率的前提下提升可解释性?
- RQ4aPIP 框架是否在转移性测试(如钛中的 Burgers 路径)中优于 SOAP-GAP?
- RQ5与高维核方法相比,低维多项式拟合在多大程度上能超越训练数据范围进行泛化?
主要发现
- aPIP 模型在钨和硅数据集上的精度与 SOAP-GAP 相当,且评估速度显著更快(4-或5体项的评估速度至少快一个数量级)。
- 在钛的 Burgers 路径测试中,aPIP 模型的预测能量比 SOAP-GAP 更准确,尤其在远离训练数据的区域,表明其外推性能更优。
- 钛的训练数据在低温(100 K)下采样,导致3体空间覆盖稀疏;Burgers 路径穿过了训练数据极少或无数据的区域,因此是泛化能力的强测试。
- SOAP-GAP 在 Burgers 路径上表现欠佳,归因于该区域缺乏数据,凸显了高维拟合在外推中的局限性。
- aPIPs 中对低体序项的正则化,使模型在远离训练集的区域仍能保持平滑且物理上合理的响应,这对可靠外推至关重要。
- 该框架表明,低维、正则化的多项式模型在可转移性方面可超越高维核模型,尤其在非平凡的泛化任务中表现更优。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。