Skip to main content
QUICK REVIEW

[论文解读] Hierarchical, rotation-equivariant neural networks to predict the structure of protein complexes

Stephan Eismann, Raphael J.L. Townshend|arXiv (Cornell University)|Jun 5, 2020
Computational Drug Discovery Methods参考文献 31被引用 7
一句话总结

该论文提出了一种分层的、旋转等变的神经网络,能够直接从原子坐标预测准确的蛋白质复合物结构,而无需依赖预计算的特征。通过结合基于点的表示、对旋转和平移的等变性、局部卷积以及分层下采样,该模型在结合现有评分函数时,提升了结构模型的评分性能,并能预测绝对精度,优于现有方法。

ABSTRACT

Predicting the structure of multi-protein complexes is a grand challenge in biochemistry, with major implications for basic science and drug discovery. Computational structure prediction methods generally leverage pre-defined structural features to distinguish accurate structural models from less accurate ones. This raises the question of whether it is possible to learn characteristics of accurate models directly from atomic coordinates of protein complexes, with no prior assumptions. Here we introduce a machine learning method that learns directly from the 3D positions of all atoms to identify accurate models of protein complexes, without using any pre-computed physics-inspired or statistical terms. Our neural network architecture combines multiple ingredients that together enable end-to-end learning from molecular structures containing tens of thousands of atoms: a point-based representation of atoms, equivariance with respect to rotation and translation, local convolutions, and hierarchical subsampling operations. When used in combination with previously developed scoring functions, our network substantially improves the identification of accurate structural models among a large set of possible models. Our network can also be used to predict the accuracy of a given structural model in absolute terms. The architecture we present is readily applicable to other tasks involving learning on 3D structures of large atomic systems.

研究动机与目标

  • 开发一种机器学习方法,直接从原子坐标识别准确的蛋白质复合物结构,而无需依赖手工设计的特征。
  • 解决对多蛋白复合物候选结构模型进行大规模评分的挑战。
  • 实现在包含数万个原子的系统中,从三维原子位置端到端学习。
  • 预测给定结构模型的绝对精度,而不仅仅是候选模型之间的相对排序。
  • 构建一种可泛化的架构,适用于蛋白质复合物以外的大规模三维原子系统学习任务。

提出的方法

  • 模型采用基于点的原子表示,将每个原子视为带有相关特征的三维坐标。
  • 通过几何深度学习原理强制实现旋转和平移的等变性,确保在空间变换下预测结果保持一致。
  • 应用局部卷积以捕捉每个原子周围的局部结构模式。
  • 通过分层下采样降低计算复杂度,同时保留多尺度下的结构层次。
  • 在原子坐标上进行端到端训练,以预测模型精度,不使用基于物理或统计的描述符。
  • 将该方法与现有评分函数结合,以提升其在识别高质量模型方面的性能。

实验结果

研究问题

  • RQ1深度学习模型能否直接从原子坐标学习识别准确的蛋白质复合物结构,而无需预定义的结构特征?
  • RQ2旋转和平移等变性在三维分子结构预测中的性能提升程度如何?
  • RQ3该模型能否预测结构模型的绝对精度,而不仅仅是候选模型之间的相对排序?
  • RQ4该分层的、基于点的架构在处理包含数万个原子的大分子系统时的有效性如何?
  • RQ5该架构能否泛化到其他涉及三维原子结构学习的任务?

主要发现

  • 所提出的神经网络在与现有评分函数结合时,显著提升了准确结构模型的识别能力。
  • 该模型实现了直接从原子坐标进行端到端学习,消除了对手工设计特征(如基于物理或统计的项)的依赖。
  • 通过分层下采样和局部卷积,该架构成功处理了包含数万个原子的分子系统。
  • 该网络能够预测给定结构模型的绝对精度,提供模型质量的定量度量。
  • 旋转和平移等变设计确保了同一复合物在不同空间取向下的预测结果保持一致。
  • 该方法具有可泛化性,可应用于其他涉及大规模原子系统三维结构学习的任务。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。