Skip to main content
QUICK REVIEW

[论文解读] Unified theory of atom-centered representations and message-passing machine-learning schemes

Jigyasa Nigam, Sergey N. Pozdnyakov|arXiv (Cornell University)|Feb 3, 2022
Machine Learning in Materials Science参考文献 49被引用 42
一句话总结

该论文通过将原子中心密度相关性(ACDC)泛化为多中心表示,统一了原子中心和消息传递的机器学习框架,为原子坐标对称且协变的函数提供了完整的线性基。该框架可系统化构建不变和协变模型,在短程与长程结构-性质关系建模中兼具理论普遍性与实际性能。

ABSTRACT

Data-driven schemes that associate molecular and crystal structures with their microscopic properties share the need for a concise, effective description of the arrangement of their atomic constituents. Many types of models rely on descriptions of atom-centered environments, that are associated with an atomic property or with an atomic contribution to an extensive macroscopic quantity. Frameworks in this class can be understood in terms of atom-centered density correlations (ACDC), that are used as a basis for a body-ordered, symmetry-adapted expansion of the targets. Several other schemes, that gather information on the relationship between neighboring atoms using "message-passing" ideas, cannot be directly mapped to correlations centered around a single atom. We generalize the ACDC framework to include multi-centered information, generating representations that provide a complete linear basis to regress symmetric functions of atomic coordinates, and provides a coherent foundation to systematize our understanding of both atom-centered and message-passing, invariant and equivariant machine-learning schemes.

研究动机与目标

  • 统一原子建模中原子中心与消息传递的机器学习方案。
  • 将原子中心密度相关性(ACDC)泛化,以包含多中心、基于图的信息。
  • 为原子坐标的对称和协变函数提供完整的线性基。
  • 系统化理解材料科学中不变与协变深度学习架构。
  • 实现对短程与长程结构-性质关系建模的性能提升。

提出的方法

  • 通过邻居环境的张量积与对称自适应基函数,将ACDC泛化为多中心表示。
  • 通过在邻居间迭代求和与高阶收缩,引入消息传递ACDC表示。
  • 利用SO(3)的不可约表示和宇称标签,确保旋转与反演对称性。
  • 通过Clebsch-Gordan分解构建耦合基的协变特征,以生成更高阶的对称特征。
  • 采用密度技巧,通过在原子中心密度上操作,避免邻居数量增加导致的指数级扩展。
  • 使用径向和球谐基函数对连续表示进行离散化,以实现高效计算。

实验结果

研究问题

  • RQ1原子中心与消息传递框架如何在单一理论框架下被形式化统一?
  • RQ2多中心相关性在构建完整、对称且协变表示中的作用是什么?
  • RQ3广义ACDC形式化能否作为不变与协变机器学习模型的通用基?
  • RQ4消息传递表示与传统ACDC在捕捉长程结构效应方面有何比较?
  • RQ5这些表示在近似原子坐标对称函数方面的普遍性理论基础是什么?

主要发现

  • 广义ACDC框架为任意对称且协变的原子坐标函数提供了完整的线性基。
  • 消息传递ACDC表示在建模短程与长程结构-性质关系方面均实现了高精度。
  • 该框架通过统一的形式化,将图神经网络、张量场网络和传统ACDC方案等多样化模型整合为一体。
  • 通过Clebsch-Gordan规则迭代耦合协变特征,可在不损失对称性的前提下生成更丰富、更高阶的表示。
  • 通过基于密度的技巧避免了指数级扩展,使大规模原子环境的高效计算成为可能。
  • 该方法在理论上具有普遍性,等价于对称多项式的完整基,并已被证明可支持协变模型的通用函数逼近。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。