Skip to main content
QUICK REVIEW

[論文レビュー] Hierarchical, rotation-equivariant neural networks to predict the structure of protein complexes

Stephan Eismann, Raphael J.L. Townshend|arXiv (Cornell University)|Jun 5, 2020
Computational Drug Discovery Methods参考文献 31被引用数 7
ひとこと要約

本論文は、事前に計算された特徴量に依存せずに、原子座標から直接に正確なタンパク質複合体構造を予測できる階層的かつ回転等変換不変なニューラルネットワークを提案する。点表現、回転および平行移動に対する等変性、局所的畳み込み、階層的サブサンプリングを組み合わせることで、モデルのスコアリング性能が向上し、既存の手法よりも優れた性能を示す。スコアリング関数と組み合わせた場合、絶対的な精度の予測も可能となる。

ABSTRACT

Predicting the structure of multi-protein complexes is a grand challenge in biochemistry, with major implications for basic science and drug discovery. Computational structure prediction methods generally leverage pre-defined structural features to distinguish accurate structural models from less accurate ones. This raises the question of whether it is possible to learn characteristics of accurate models directly from atomic coordinates of protein complexes, with no prior assumptions. Here we introduce a machine learning method that learns directly from the 3D positions of all atoms to identify accurate models of protein complexes, without using any pre-computed physics-inspired or statistical terms. Our neural network architecture combines multiple ingredients that together enable end-to-end learning from molecular structures containing tens of thousands of atoms: a point-based representation of atoms, equivariance with respect to rotation and translation, local convolutions, and hierarchical subsampling operations. When used in combination with previously developed scoring functions, our network substantially improves the identification of accurate structural models among a large set of possible models. Our network can also be used to predict the accuracy of a given structural model in absolute terms. The architecture we present is readily applicable to other tasks involving learning on 3D structures of large atomic systems.

研究の動機と目的

  • 手作業で設計された特徴量に依存せずに、原子座標から正確なタンパク質複合体構造を直接同定する機械学習手法を開発すること。
  • 多数のタンパク質複合体の候補構造モデルのスコアリングという課題に取り組むこと。
  • 数万原子を含む系において、3次元原子位置からエンドツーエンドの学習を可能にすること。
  • 相対的な順位付けではなく、与えられた構造モデルの絶対的精度を予測すること。
  • タンパク質複合体を超えて、大規模な3次元原子系における学習に適用可能な汎用的なアーキテクチャを構築すること。

提案手法

  • 原子を点として表現し、各原子を3次元座標と関連する特徴量として扱う。
  • 幾何的ディープラーニングの原則を用いて回転および平行移動の等変性を強制し、空間的変換に対して一貫した予測を保証する。
  • 局所的畳み込みを用いて、各原子回りの局所的構造的パターンを捉える。
  • 階層的サブサンプリングにより計算複雑性を低減しながら、複数スケールにわたる構造的階層を保持する。
  • 物理的または統計的記述子を用いずに、原子座標からエンドツーエンドに訓練し、モデルの精度を予測する。
  • 既存のスコアリング関数と統合することで、高品質なモデルを同定する性能を向上させる。

実験結果

リサーチクエスチョン

  • RQ1事前に定義された構造的特徴量に依存せずに、ディープラーニングモデルが原子座標から正確なタンパク質複合体構造を同定できるか。
  • RQ2回転および平行移動の等変性は、3次元分子構造予測においてどの程度性能を向上させるか。
  • RQ3モデルは相対的な順位付けではなく、構造モデルの絶対的精度を予測できるか。
  • RQ4階層的で点ベースのアーキテクチャは、数万原子を含む大規模分子系を効果的に処理できるか。
  • RQ5このアーキテクチャは、3次元原子構造を対象とした他のタスクへも一般化可能か。

主な発見

  • 提案されたニューラルネットワークは、既存のスコアリング関数と組み合わせることで、正確な構造モデルの同定性能が顕著に向上する。
  • モデルは手作業で設計された特徴量(物理的または統計的要因に基づくもの)を一切使用せず、原子座標からエンドツーエンドの学習が可能である。
  • 階層的サブサンプリングと局所的畳み込みを用いることで、数万原子を含む分子系を効果的に処理できる。
  • ネットワークは、与えられた構造モデルの絶対的精度を予測でき、モデル品質の定量的指標を提供する。
  • 回転および平行移動の等変性設計により、同じ複合体の異なる空間的向きに対しても一貫した予測が保証される。
  • この手法は一般化可能であり、タンパク質複合体を超えて大規模な原子系の3次元構造学習に応用可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。