Skip to main content
QUICK REVIEW

[論文レビュー] Independent SE(3)-Equivariant Models for End-to-End Rigid Protein Docking

Octavian-Eugen Ganea, Xinyuan Huang|arXiv (Cornell University)|Nov 15, 2021
Protein Structure and Dynamics被引用数 53
ひとこと要約

tldr: EquiDock は、ペアワイズに独立な SE(3)-等変 graphs マッチングネットワークを導入し、タンパク質ペアの剛体ドッキングポーズを直接予測します。出力は初期配置や役割に対して不変であり、重いサンプリングやテンプレートを用いずに高速なエンドツーエンドのドッキングを実現します。

ABSTRACT

Protein complex formation is a central problem in biology, being involved in most of the cell's processes, and essential for applications, e.g. drug design or protein engineering. We tackle rigid body protein-protein docking, i.e., computationally predicting the 3D structure of a protein-protein complex from the individual unbound structures, assuming no conformational change within the proteins happens during binding. We design a novel pairwise-independent SE(3)-equivariant graph matching network to predict the rotation and translation to place one of the proteins at the right docked position relative to the second protein. We mathematically guarantee a basic principle: the predicted complex is always identical regardless of the initial locations and orientations of the two structures. Our model, named EquiDock, approximates the binding pockets and predicts the docking poses using keypoint matching and alignment, achieved through optimal transport and a differentiable Kabsch algorithm. Empirically, we achieve significant running time improvements and often outperform existing docking software despite not relying on heavy candidate sampling, structure refinement, or templates.

研究の動機と目的

  • Conformational changes なしで高速・エンドツーエンドの剛体タンパク質ドッキングを動機づける。
  • 出力を初期構成とタンパク質の役割に対して不変にするために SE(3)-等変性と可換性を課す。
  • ドッキングポーズ予測のためのペアワイズ独立な SE(3)-等変グラフマッチングネットワーク(IEGMN)を開発。
  • 結合ポケットをアラインするために注意機構ベースのキー・ポイントと最適輸送を使用し、キー・ポイントを用いた differentiable Kabsch によるポーズ回復を行う。
  • 標準ベンチマークで既存のドッキングソフトウェアと比べて速度向上と競争力のある精度を実証する。

提案手法

  • 各タンパク質を SE(3)-不変ノード/エッジ特徴を持つ k-NN グラフとして表現する。
  • Independent E(3)-Equivariant Graph Matching Networks (IEGMNs) を用いて、ペアワイズ SE(3)-等変性を保証する R(X1|X2) と t(X1|X2) を計算する。
  • 多頭アテンションを通じて各タンパク質の K 個の結合ポケットキー・ポイントを予測し、キー・ポイントを用いた differentiable Kabsch でアラインする。
  • 最終的な吻合リガンド位置の MSE 損失に加え、予測キー・ポイントと結合ポケット代理点を整列させる OT 損失を用いてトレーニングする。
  • ボディの重なりを抑制するソフトな非交差損失と、深さを捉える表面認識残基特徴を含める。

実験結果

リサーチクエスチョン

  • RQ1ペアワイズ独立な SE(3)-等変モデルは、結合前の未結合タンパク質構造から直接ドッキング変換を予測できるか?
  • RQ2SE(3)-等変性制約と可換性は、初期配置やタンパク質の役割に関係なく一貫したドッキング出力を保証するか?
  • RQ3アテンションベースのキー・ポイント選択と最適輸送を組み合わせることで、ドッキング中の結合ポケットを効果的に整列できるか?
  • RQ4微細なサンプリングやテンプレートを用いずに、 differentiable Kabsch アラインメントだけで正確なドッキングポーズを回復できるか?
  • RQ5EquiDock は標準データセットで、既存のドッキングツールと比較して速度と精度の点でどうなるか?

主な発見

  • EquiDock は、重い候補サンプリングやテンプレートを使用せずに、標準ベンチマークで最先端のドッキング性能に競合する。
  • モデルは人気のドッキングソフトウェアと比べて 80-500x の高速化を実現する。
  • IEGMN 層はペアワイズ独立の SE(3)-等変埋め込みを提供し、入力構成間の転送性を可能にする。
  • OT ベースの損失はキー・ポイントを結合ポケットを表現するよう効果的に導き、ポーズ整列を改善する。
  • 微分可能な Kabsch は、リガンドを受容体に整列させる一貫した剛体変換を生み出し、SE(3) 不変性と可換性を保持する。
  • 報告された表では、EquiDock は Complex RMSD および Interface RMSD の点で DIPS および DB5.5 テストセットにおいて、ベースラインを上回ることが多い。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。