Skip to main content
QUICK REVIEW

[论文解读] Quantum machine learning in chemical compound space

Bing Huang, O. Anatole von Lilienfeld|arXiv (Cornell University)|Dec 14, 2020
Machine Learning in Materials Science被引用 2
一句话总结

本文综述了利用量子力学生成的合成数据和受物理启发的模型架构来加速化学化合物空间(CCS)虚拟探索的量子机器学习(QML)方法。通过结合从头计算的精确性与统计效率,QML 实现了在不牺牲物理严谨性的情况下,对大规模化学空间中新型分子和材料的可扩展、可迁移和可靠的发现。

ABSTRACT

Chemical compound space (CCS), the set of all theoretically conceivable combinations of chemical elements and (meta-)stable geometries that make up matter, is colossal. The virtual exploration of this space for the design and discovery of novel molecules and materials exhibiting desirable properties is therefore generally prohibitive for all but the smallest sub-sets and simplest properties, and typically relies heavily on access to substantial allocations on modern high-performance computing hardware. We review studies aimed at tackling this challenge using modern machine learning techniques based on (i) synthetic data generated using quantum mechanics based methods and (ii) model architectures inspired by quantum mechanics. Such Quantum based Machine Learning (QML) approaches combine the advantages of a first principles view on matter, i.e.~reflecting properly the underlying physics which guarantees universality and transferability of models across all of CCS, with the numerical efficiency of statistical surrogate models. While state-of-the-art approximations to quantum problems impose severe computational bottlenecks, recent QML based developments indicate the possibility of substantial acceleration without sacrificing the rigour and reliability of a physics based understanding of trends and relationships throughout CCS.

研究动机与目标

  • 解决在广阔化学化合物空间(CCS)中探索新型分子和材料所面临的计算成本过高的问题。
  • 通过将机器学习与量子力学原理相结合,克服传统高性能计算的局限性。
  • 通过基于从头计算物理原理的代理模型,实现在 CCS 中可扩展、可迁移和可靠的发现。
  • 在保持准确性和物理一致性的同时,减少量子化学近似中的计算瓶颈。

提出的方法

  • 利用基于量子力学的方法生成的合成数据集来训练机器学习模型。
  • 采用受量子力学原理启发的模型架构,以确保物理一致性和可迁移性。
  • 将从头计算量子化学与统计代理模型相结合,以平衡准确性和计算效率。
  • 利用现代机器学习技术来近似复杂量子性质,而无需显式求解薛定谔方程。
  • 通过嵌入物理对称性和守恒定律,设计在 CCS 中多样化化学组成和几何构型上具有良好泛化能力的模型。
  • 将量子力学洞见整合到神经网络架构中,以确保在性质预测中具有普遍性和可靠性。

实验结果

研究问题

  • RQ1量子机器学习模型是否能在整个化学化合物空间中实现高精度的分子性质预测?
  • RQ2受物理启发的架构在化学空间中如何提升机器学习模型的可迁移性和泛化能力?
  • RQ3与传统量子化学方法相比,QML 在多大程度上能够降低计算成本,同时保持物理保真度?
  • RQ4合成的量子数据是否能有效训练出在化学化合物空间中泛化能力超越训练集的模型?
  • RQ5第一性原理物理在实现大规模化学空间探索中可靠且普遍的预测中起到什么作用?

主要发现

  • QML 方法通过结合量子力学的精确性与统计效率,实现了对化学化合物空间的可扩展探索。
  • 物理信息模型架构确保了在多样化化学组成和几何构型之间的可迁移性和普遍性。
  • 从第一性原理方法生成的合成量子数据为机器学习模型提供了可靠且全面的训练数据。
  • 近期 QML 的发展表明,其在不损害物理预测可靠性的情况下,实现了显著的计算加速。
  • 将量子力学与机器学习相结合,在保持模型物理一致性的同时,实现了在大规模化学空间中更快的性质预测。
  • QML 模型展示了通过高效的代理建模克服量子化学近似中计算瓶颈的潜力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。