[论文解读] Transferable Machine Learning Potential X-MACE for Excited States using Integrated DeepSets
X-MACE 在 MACE 的基础上通过 DeepSets 基于自编码器学习非光滑的激发态势能面,并实现从基态模型到激发态的迁移学习,在圆锥交点周围提高准确性并实现跨分子转移。
Conical intersections serve as critical gateways in photochemical reactions, enabling rapid nonradiative transitions between potential energy surfaces that underpin fundamental processes such as photosynthesis or vision. Their calculation with quantum chemistry is, however, extremely computationally intensive and their modeling with machine learning poses a significant challenge due to their inherently non-smooth and complex nature. To address this challenge, we introduce a deep learning architecture designed to precisely model excited states and improve their accuracy around these critical, non-smooth regions. Our model integrates Deep Sets into the Message Passing Atomic Cluster Expansion (MACE) framework resulting in a smooth representation of the non-smooth excited-state potential energy surfaces. We validate our method using numerous molecules, showcasing a significant improvement in accurately modeling the energy landscape around conical intersections compared to conventional excited-state models. Additionally, we apply ground-state foundational machine learning models as a basis for excited states. By doing so, we showcase that the developed model is capable of transferring not only from the ground state to excited states, but also within chemical space to molecular systems beyond those included in the training dataset. This advancement not only enhances the fidelity of excited-state modeling, but also lays the foundations for the investigation of more complex molecular systems.
研究动机与目标
- 受到在圆锥交点附近准确建模激发态动力学的需求驱动,在布恩-奥本海默分解显著时实现对激发态势能面的平滑表示。
- 开发一种神经体系结构,提供对非平滑激发态势能面的平滑表示。
- 利用基态 MACE 表示实现对化学空间中激发态的迁移学习。
- 在圆锥交点周围 demostrated 改进的准确性,并评估对未见分子和更大色团的可迁移性。
提出的方法
- 在 MACE 框架中加入基于 DeepSets 的自编码器,以学习来自激发态能量的一组置换不变函数。
- 使用 DeepSets 编码器将绝热能量编码为一个置换不变的潜在向量。
- 通过从潜在表征构造一个厄米矩阵并计算其特征值来解码为能量表面。
- 在 MACE 内部使用读取块来预测不变函数,然后将其映射到绝热能量。
- 将 X-MACE(含自编码器与不含自编码器)与 SchNarc 和 SPaiNN 在多组数据集上进行对比,包括色团、烯烃和甲撑亚铵正离子。
- 通过对预训练的 MACE 模型在较小的激发态数据集上进行微调,展示迁移学习。
实验结果
研究问题
- RQ1一个基于集合的、置换不变的表征是否可以改进在圆锥交点附近的非平滑激发态表面的建模?
- RQ2引入自编码器来学习平滑的不变表征是否能提升能量、力与非对照耦合预测?
- RQ3在化学空间中,基态预训练模型在多大程度上可以迁移到激发态预测?
- RQ4与现有激发态模型(SchNarc、SPaiNN)相比,X-MACE 在精度和数据效率方面的表现如何?
- RQ5对于未见的色团和更大分子体系,迁移学习是否有效?
主要发现
| Model | System | Mean Absolute Error (MAE) | Energy (eV) | Force (eV/Å) | Smooth NACS (eV/Å) |
|---|---|---|---|---|---|
| SchNarc | Chromophores | 1.648 | - | - | - |
| SchNarc | Butene | 0.07586 | 0.19102 | 0.14164 | - |
| SchNarc | Ethene | 0.05992 | 0.16944 | 0.19648 | - |
| SchNarc | Methylenimmonium cation | 0.1190 | 0.3800 | 0.4311 | - |
| SPaiNN | Chromophores | 0.5762 | - | - | - |
| SPaiNN | Butene | 0.0475 | 0.10285 | 0.135 | - |
| SPaiNN | Ethene | 0.02793 | 0.08249 | 0.2108 | - |
| SPaiNN | Methylenimmonium cation | 0.1018 | 0.3323 | 0.4231 | - |
| E-MACE | Chromophores | 0.13256 | 0.13790 | - | - |
| E-MACE | Butene | 0.02350 | 0.08859 | 0.10118 | - |
| E-MACE | Ethene | 0.0048 | 0.0359 | 0.1027 | - |
| E-MACE | Methylenimmonium cation | 0.1295 | 0.2639 | 0.2540 | - |
- 带有自编码器的 X-MACE 相较于标准 MACE 和现有激发态模型,显著降低了能量与力误差。
- 在能量预测方面,X-MACE 常常比 SchNarc 的误差低一个数量级,约为 SPaiNN 的三分之一。
- 自编码器框架产生了更平滑的不变表征,减少了所需的模型规模并降低了数据集的误差分布。
- 基于基态 MACE 的迁移学习能够在仅需数据的 1% 时就实现精确的激发态预测,在低数据场景下优于从零开始训练。
- 对未见色团的迁移显示在基态预训练下误差下降(能量约降低 30%,力约降低 15%),表明跨领域的鲁棒泛化。
- 在各数据集中,X-MACE 在能量与力方面普遍优于 SchNarc 和 SPaiNN,并达到或超越它们在非对比耦合预测方面的水平。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。