Skip to main content
QUICK REVIEW

[论文解读] Neural Message Passing for Quantum Chemistry

Justin Gilmer, Samuel S. Schoenholz|arXiv (Cornell University)|Apr 4, 2017
Computational Drug Discovery Methods被引用 2,978
一句话总结

本文将基于图的神经网络重新表述为消息传递神经网络(MPNNs),并在 QM9 上实现了最新的结果,在大多数目标上以化学精度预测 DFT 级属性。它还引入了用于提高效率和性能的架构变体。

ABSTRACT

Supervised learning on molecules has incredible potential to be useful in chemistry, drug discovery, and materials science. Luckily, several promising and closely related neural network models invariant to molecular symmetries have already been described in the literature. These models learn a message passing algorithm and aggregation procedure to compute a function of their entire input graph. At this point, the next step is to find a particularly effective variant of this general approach and apply it to chemical prediction benchmarks until we either solve them or reach the limits of the approach. In this paper, we reformulate existing models into a single common framework we call Message Passing Neural Networks (MPNNs) and explore additional novel variations within this framework. Using MPNNs we demonstrate state of the art results on an important molecular property prediction benchmark; these results are strong enough that we believe future work should focus on datasets with larger molecules or more accurate ground truth labels.

研究动机与目标

  • 证明一个统一的消息传递框架能够直接从图表示学习分子性质。
  • 在 QM9 数据集上评估 MPNN,以将性能与既有基线进行对比基准。
  • 探索架构变体(边表示、读取/读出、塔结构)以最大化准确性和效率。
  • 研究在分子图中包含空间信息和氢原子处理的重要性。

提出的方法

  • 将消息传递神经网络(MPNN)框架定义为两阶段:消息传递与读取/读出。
  • 尝试多种消息函数(基于边、边网络、对消息)和读取/读出函数(GG-NN 风格和 set2set)。
  • 引入虚拟图元素(虚拟边、主节点)以实现长程信息流动。
  • 使用多塔结构(将隐藏状态分成更小的副本)以在不增加计算时间的情况下提高容量和速度。
  • 在 QM9 上对每个目标训练一个模型,进行超参数搜索,并与化学精度基准进行评估。

实验结果

研究问题

  • RQ1MPNNs 能否直接从图表示中学习分子性质,同时对图同构不变性保持不变?
  • RQ2不同的消息、更新和读取/读出选择如何影响 QM9 属性的精度?
  • RQ3包含空间信息和氢原子显式处理对预测性能有何影响?
  • RQ4架构创新(虚拟边、主节点、set2set、塔结构)是否在中等大小分子上提高了准确性和效率?

主要发现

  • MPNN 在所有 13 个 QM9 目标上实现了最先进的结果。
  • 最佳 MPNN 变体在 13 个目标中的 11 个达到化学精度(与 DFT 对齐的真实值)。
  • 仅在拓扑结构上运行的模型(无空间输入)在捕获长程相互作用时可在若干目标上达到化学精度。
  • 使用基于边网络的消息和 set2set 读取,在显式氢原子的情况下相较基线获得显著性能提升。
  • 多塔方法提供加速和更好的泛化,在大多数目标上优于单拷贝的 GG-NN。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。