Skip to main content
QUICK REVIEW

[論文レビュー] Uni-Mol Docking V2: Towards Realistic and Accurate Binding Pose Prediction

Eric Alcaide, Zhifeng Gao|arXiv (Cornell University)|May 20, 2024
Advanced Surface Polishing Techniques被引用数 6
ひとこと要約

Uni-Mol Docking V2 は PoseBusters で最先端の結合ポーズ予測を達成し、77.6% <2.0 Å RMSD と 95.29% Astex 的妥当性を示し、MLドッキングの以前の化学的不正確さに対処する。

ABSTRACT

In recent years, machine learning (ML) methods have emerged as promising alternatives for molecular docking, offering the potential for high accuracy without incurring prohibitive computational costs. However, recent studies have indicated that these ML models may overfit to quantitative metrics while neglecting the physical constraints inherent in the problem. In this work, we present Uni-Mol Docking V2, which demonstrates a remarkable improvement in performance, accurately predicting the binding poses of 77+% of ligands in the PoseBusters benchmark with an RMSD value of less than 2.0 Å, and 75+% passing all quality checks. This represents a significant increase from the 62% achieved by the previous Uni-Mol Docking model. Notably, our Uni-Mol Docking approach generates chemically accurate predictions, circumventing issues such as chirality inversions and steric clashes that have plagued previous ML models. Furthermore, we observe enhanced performance in terms of high-quality predictions (RMSD values of less than 1.0 Å and 1.5 Å) and physical soundness when Uni-Mol Docking is combined with more physics-based methods like Uni-Dock. Our results represent a significant advancement in the application of artificial intelligence for scientific research, adopting a holistic approach to ligand docking that is well-suited for industrial applications in virtual screening and drug design. The code, data and service for Uni-Mol Docking are publicly available for use and further development in https://github.com/dptech-corp/Uni-Mol.

研究の動機と目的

  • MLドッキング手法における物理的妥当性と化学的精度の問題に対処する。
  • 見たことのないタンパク質-リガンド複合体に対する PoseBusters ベンチマークの性能を向上させる。
  • 公開可能なコードとデータを備えた再現性のあるデータ処理とドッキングパイプラインを提供する。
  • 産業用仮想スクリーニングへの物理ベースのドッキングとの統合可能性を示す。

提案手法

  • ドッキングモデルを初期化するために Uni-Mol フレームワーク上で分子エンコーダとポケットエンコーダを事前学習する。
  • 水素を付加し、プロトン化情報と完全な重原子/残基を含むタンパク質データを準備する。
  • MOAD由来データでドッカーを訓練し、9:1 の訓練/検証分割で8つの V100 GPU 上で100エポック。
  • リガンドのサイズに合わせた立方体領域を基にしたポケットコンフォメーションを、10 Å マージンを設けて使用する。
  • 入力はポケットとリガンドコンフォメーションとして提供し、出力は3Dリガンドポーズ。効率化のためポケット特徴量は事前計算。
  • 精度を高め、補因子と水分子を取り入れるために、物理ベースの Uni-Dock と Uni-Mol Docking を組み合わせる。

実験結果

リサーチクエスチョン

  • RQ1PoseBusters 上で、手性反転や立体遮蔽なしに化学的に妥当なポーズをMLベースのドッキングで達成できるか?
  • RQ2再現性のあるデータ処理と入力生成が PoseBusters および Astex ベンチマークの性能に与える影響は何か?
  • RQ3物理ベースのドッキング(Uni-Dock)を Uni-Mol Docking と組み合わせることで、より高品質で物理的に妥当な予測が得られるか?
  • RQ4未見データに対する Uni-Mol Docking V2 の性能は、従来の ML ドッキングモデルと比較してどうか?
  • RQ5PoseBusters の標的における生化学空間のカバレッジはどれほどで、V2 は多様なタンパク質-リガンド複合をどう扱うのか?

主な発見

< 2.0 Å RMSD (%)PoseBusters (N=428)Astex (N=85)
DiffDock37.971.76
UMol45-
Vina52.357.65
Uni-Mol Docking58.982.35
AlphaFold latest73.6-
Uni-Mol Docking V277.695.29
  • Uni-Mol Docking V2 は PoseBusters で RMSD <2.0 Å のリガンドを 77.6%、Astex で 95.29% を達成(報告どおり)、従来のオープンソースモデルを上回る。
  • PoseBusters 複合体の 75% 以上 がすべての品質チェックを通過。
  • Uni-Mol Docking V2 は手性反転や立体 clash が観察されず、化学的に正確な予測を出す。
  • Uni-Dock と組み合わせると高品質な予測(RMSD <1.0 Å および <1.5 Å)が改善され、物理的妥当性は高いまま(>95%)を維持。
  • 標準化されたデータ処理パイプラインと公開コードにより再現可能な結果と他のドッキング手法との公開比較が可能になる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。