Skip to main content
QUICK REVIEW

[论文解读] Directional Message Passing for Molecular Graphs

Johannes Gasteiger, Janek Groß|arXiv (Cornell University)|Mar 6, 2020
Computational Drug Discovery Methods被引用 345
一句话总结

DimeNet 引入带有球面对称傅里叶-贝塞尔基的定向信息传递,以编码原子之间的距离和角度,从而在分子性质预测上达到 state-of-the-art,并实现 MD 的平滑、可微分的力预测。

ABSTRACT

Graph neural networks have recently achieved great successes in predicting quantum mechanical properties of molecules. These models represent a molecule as a graph using only the distance between atoms (nodes). They do not, however, consider the spatial direction from one atom to another, despite directional information playing a central role in empirical potentials for molecules, e.g. in angular potentials. To alleviate this limitation we propose directional message passing, in which we embed the messages passed between atoms instead of the atoms themselves. Each message is associated with a direction in coordinate space. These directional message embeddings are rotationally equivariant since the associated directions rotate with the molecule. We propose a message passing scheme analogous to belief propagation, which uses the directional information by transforming messages based on the angle between them. Additionally, we use spherical Bessel functions and spherical harmonics to construct theoretically well-founded, orthogonal representations that achieve better performance than the currently prevalent Gaussian radial basis representations while using fewer than 1/4 of the parameters. We leverage these innovations to construct the directional message passing neural network (DimeNet). DimeNet outperforms previous GNNs on average by 76% on MD17 and by 31% on QM9. Our implementation is available online.

研究动机与目标

  • 在 GNN 中引入定向信息,以捕捉分子中的角度和扭转效应。
  • 使用球贝塞尔函数和球谐函数为距离和角度建立有原则性、正交的基表示。
  • 提出 DimeNet 架构,用于预测分子性质并实现能量守恒的分子动力学模拟。

提出的方法

  • 将信息嵌入为与原子对相关的定向嵌入,而非原子中心。
  • 用径向基函数表示距离,用二维球面傅里叶-贝塞尔基表示角度。
  • 更新并聚合定向消息嵌入,类比带有角度和距离相关相互作用的置信传播。
  • 确保旋转、平移、置换和反演不变性;为分子动力学实现连续可微。

实验结果

研究问题

  • RQ1如何将定向信息(邻居方向之间的角度)整合到分子图神经网络中?
  • RQ2球贝塞尔基与球谐基是否能提高表示原子间距离/角度的效率和准确性?
  • RQ3具备定向消息传递的 GNN 是否能在 QM9 和 MD17 基准上刷新最先进水平?

主要发现

目标单位PPGNSchNetPhysNetMEGNet-sCormorantDimeNet
µD0.0470.0330.05290.050.130.0286
αa030.1310.2350.06150.0810.0920.0469
ϵHOMOmeV40.34132.9433627.8
ϵLUMOmeV32.73424.7443619.7
ΔϵmeV60.06342.5666034.8
R2a020.5920.0730.7650.3020.6730.331
ZPVEmeV3.121.71.391.431.981.29
U0meV36.8148.1512288.02
UmeV36.8198.3413-7.89
HmeV36.3148.4212-8.11
GmeV36.4149.4012-8.98
cvcalmol K0.0550.0330.02800.0290.0310.0249
std. MAE%1.841.761.371.802.141.05
logMAE--−4.64−5.17−5.35−5.17−4.75−5.57
  • DimeNet 在 MD17 上平均领先前代 GNNs 76%,在 QM9 上领先 31%。
  • 使用球形贝塞尔基表示在提高性能的同时减少参数数量,相较于高斯径向基。
  • 消融表明定向信息和二维球面傅里叶-贝塞尔基对性能有实质性影响(例如 NSHBF=1 会降 MAE;去掉定向消息将严重损害结果)。
  • DimeNet 在 QM9 的 12 个目标中有 11 个达到最先进水平,且在 1000 个训练样本下提供具有竞争力的 MD 结果。
  • 该模型可两次连续可微,适用于同时预测能量和原子力,支持能量守恒的 MD 模拟。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。