Skip to main content
QUICK REVIEW

[论文解读] Unified Representation for Machine Learning of Molecules and Crystals

Haoyan Huo, Matthias Rupp|arXiv (Cornell University)|Apr 21, 2017
Machine Learning in Materials Science被引用 32
一句话总结

本文提出了一种统一的、可微分的、多体张量表示方法,该方法对平移、旋转和原子核置换保持不变,可在单一希尔伯特空间中实现对分子和晶体的高精度机器学习。该方法在7,000种有机分子上的误差低于1 kcal/mol,在11,000种elsapolite晶体上的误差低于5 meV/atom,实现了对铂族/过渡金属体系相图的高通量预测。

ABSTRACT

Accurate simulations of atomistic systems from first principles are limited by computational cost. In high-throughput settings, machine learning can potentially reduce these costs significantly by accurately interpolating between reference calculations. For this, kernel learning approaches crucially require a single Hilbert space accommodating arbitrary atomistic systems. We introduce a many-body tensor representation that is invariant to translations, rotations and nuclear permutations of same elements, unique, differentiable, can represent molecules and crystals, and is fast to compute. Empirical evidence is presented for energy prediction errors below 1 kcal/mol for 7k organic molecules and 5 meV/atom for 11k elpasolite crystals. Applicability is demonstrated for phase diagrams of Pt-group/transition-metal binary systems.

研究动机与目标

  • 解决在核方法机器学习的共同希尔伯特空间中,为多样化原子系统(分子和晶体)创建单一通用表示的挑战。
  • 通过机器学习实现快速、精确的插值,克服第一性原理模拟的计算瓶颈。
  • 通过保持对平移、旋转和相同原子置换的不变性,确保学习过程的物理一致性。
  • 开发一种唯一、可微分且计算高效的表示方法,适用于高通量应用。
  • 展示该方法在复杂体系(如铂族/过渡金属二元合金相图)中的适用性。

提出的方法

  • 提出一种多体张量表示方法,编码至指定阶数的原子环境,捕捉多粒子间的相互作用。
  • 通过张量对称化和坐标变换,强制实现对平移、旋转和相同原子核置换的不变性。
  • 将表示构建为原子位置和类型的不同可微函数,支持基于梯度的优化。
  • 使用固定且紧凑的张量基,确保即使在大规模系统中也能实现快速计算。
  • 在统一表示上训练基于核的模型(如高斯过程)以预测能量。
  • 通过将其应用于分子和晶体数据集,验证表示的泛化能力。

实验结果

研究问题

  • RQ1能否通过单一、不变的张量表示,在共享希尔伯特空间中准确表示分子和晶体,以支持机器学习?
  • RQ2与先前方法相比,所提出的表示在能量估计中的预测误差降低程度如何?
  • RQ3该表示在包括复杂合金在内的多样化化学体系中泛化能力如何?
  • RQ4该表示能否支持金属体系中相图的高通量预测?
  • RQ5该表示在大规模模拟中的计算效率和可扩展性如何?

主要发现

  • 所提出的张量表示在7,000种有机分子的数据集上实现了低于1 kcal/mol的能量预测误差。
  • 对于11,000种elsapolite晶体,该方法的能量误差低于5 meV/atom,表明其在周期性系统中具有高精度。
  • 该表示可实现对铂族和过渡金属二元体系相图的准确预测,表明其具有强大的泛化能力。
  • 该方法计算高效且可微分,支持在高通量工作流中进行可扩展的训练和优化。
  • 统一的表示在平移、旋转和原子核置换下保持不变,确保了物理一致性。
  • 实证结果证实了该表示的唯一性及其在原子系统核方法机器学习中的适用性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。