QUICK REVIEW

[论文解读] Micron-scale heterogeneous catalysis with Bayesian force fields from first principles and active learning

Anders Johansson, Yu Xie|arXiv (Cornell University)|Apr 26, 2022

Machine Learning in Materials Science被引用 23

一句话总结

作者开发了 FLARE，一种带主动学习的贝叶斯多体力场，用于在微米尺度上进行 H2 在 Pt(111) 上的从第一性原理级的反应性分子动力学，并在 Summit 上实现高达 0.5 万亿原子规模，同时具备不确定性量化和自主训练。

ABSTRACT

Quantum-mechanically accurate reactive molecular dynamics (MD) at the scale of billions of atoms has been achieved for the heterogeneous catalytic system of H$_2$/Pt(111) using the FLARE Bayesian force field. This achievement provides accelerated time-to-solution from first principles, with Bayesian active learning enabling efficient and autonomous training of the machine learning model. The resulting model is then deployed in LAMMPS on GPUs using the Kokkos performance portability library. The Bayesian force field provides quantitative uncertainty of predictions on every atomic environment, critical for detecting configurations in large reactive simulations that are outside of the training set. Scaling benchmarks were performed using real-application MD of the H$_2$/Pt(111) heterogeneous catalysis on the Summit supercomputer, with simulations reaching 0.5 trillion atoms on 4556 GPU nodes.

研究动机与目标

解决在微米尺度上以量子力学精度模拟异质催化的挑战。
开发可从第一性原理训练、快速、可扩展且具不确定性感知的 ML 力场。
通过贝叶斯主动学习实现自主数据获取，Efficiently 探索构型空间。
展示在领导级 HPC 上对 H2/Pt(111) 的大规模应用，且条件接近真实反应条件。

提出的方法

使用带有多体 ACE-B2 描述符和高斯过程回归的 FLARE 贝叶斯力场。
采用映射稀疏 GP 来预测能量/力/应力及每原子的不确定性，平均与方差的计算成本为 O(n_d^2)。
应用贝叶斯主动学习：带不确定性监控的 MD 触发 DFT 计算以丰富训练数据。
通过 Kokkos 将 GPU 上的 LAMMPS 集成，以实现高性能、可扩展的 MD。
扩展到微米长度、十亿原子系统，并通过描述符批处理和 GPU 加速对异质环境进行优化。

实验结果

研究问题

RQ1一个具有贝叶斯、不确定性感知的 ML 力场是否能够在大规模上再现 H/Pt 异质催化的第一性原理精度？
RQ2需要哪些数据效率与主动学习策略，才能以最少的 DFT 调用训练出这样的模型？
RQ3在领导级 HPC 上实现微米级反应性 MD 时，模型在速度、可扩展性和可靠性方面的表现如何？
RQ4模拟是否能再现与实验相关的 H2 解离与再结合在 Pt(111) 上的反应动力学和活化能？

主要发现

模型	原子数	速度	生产规模不确定性	主动学习
DeePMD	3.9 B	2.0	No	Yes
SNAP	20 B	6.21	No	No
FLARE	500 B	10.5	Yes	Yes

FLARE 实现了每个 GPU 节点 10.5 百万原子步/秒，在类似任务的最新 MLFF 中具有领先地位。
生产规模的模拟在 4556 Summit GPU 节点上达到 0.5 万亿原子，弱尺度接近完美扩展至 40B 原子。
不确定性量化与对速度的影响极小地耦合，能够原地检测不熟悉的构型。
贝叶斯主动学习显著降低了训练数据需求，只需 575 次 DFT 调用，相对于 AIMD 规模的数据生成。
与 DFT 的能量/力/应力的平均绝对误差分别为 1.7 meV/原子、91 meV/Å（ Pt）/74 meV/Å（ H），以及 0.6 meV/Å^3，优于 ReaxFF。
反应速率估计（活化能）与实验高度吻合（0.25 eV 对 0.23 eV）。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。