Skip to main content
QUICK REVIEW

[論文レビュー] MolCRAFT: Structure-Based Drug Design in Continuous Parameter Space

Yanru Qu, Keyue Qiu|arXiv (Cornell University)|Apr 18, 2024
Computational Drug Discovery Methods被引用数 9
ひとこと要約

MolCRAFTは連続パラメータ空間のSBDDモデルを導入し、ノイズ低減サンプリング戦略を用いて、基準レベルのVina親和性とベースラインと比較した際の3Dポーズ安定性を改善します。

ABSTRACT

Generative models for structure-based drug design (SBDD) have shown promising results in recent years. Existing works mainly focus on how to generate molecules with higher binding affinity, ignoring the feasibility prerequisites for generated 3D poses and resulting in false positives. We conduct thorough studies on key factors of ill-conformational problems when applying autoregressive methods and diffusion to SBDD, including mode collapse and hybrid continuous-discrete space. In this paper, we introduce MolCRAFT, the first SBDD model that operates in the continuous parameter space, together with a novel noise reduced sampling strategy. Empirical results show that our model consistently achieves superior performance in binding affinity with more stable 3D structure, demonstrating our ability to accurately model interatomic interactions. To our best knowledge, MolCRAFT is the first to achieve reference-level Vina Scores (-6.59 kcal/mol) with comparable molecular size, outperforming other strong baselines by a wide margin (-0.84 kcal/mol). Code is available at https://github.com/AlgoMole/MolCRAFT.

研究の動機と目的

  • オートレグレッセブと拡散モデルの ill-conformational 問題を検討することにより、SBDDにおける偽陽性を識別・改善する。
  • MolCRAFTを提案・実装すること、連続パラメータ空間で動作する統一的なSE-(3)等価モデル。
  • ノイズを低減させたパラメータ空間サンプリング戦略を開発し、実現性と効率を向上させる。
  • CrossDockedデータセット上で、強力なベースラインに対抗して最先端の結合親和性と立体配置の安定性を実証する。

提案手法

  • 分子とタンパク質ポケットを完全な連続パラメータ空間でモデル化し、SE-(3)等価性を保証する。
  • 離散→連続拡散ではなく潜在パラメータの連続更新を行うベイズフローネットワークフレームワークを用いる。
  • 連続座標と離散原子種を統一されたパラメータベクトルに表現し、サンプリング中に連続ノイズを適用する。
  • パラメータ空間でのノイズ低減サンプリング戦略を導入し、分散を低減し離散原子種のノイズサンプリングを回避する。
  • 閉形式のベイズ更新と、分子間相互作用と整合するターゲット分布を用いて学習を最適化する。
Figure 1 : Typical resulting implausible molecules from generative models. ( a ) Unusual 3-membered rings generated by AR, large fused rings with more than 7 atoms generated by diffusion models. ( b ) Examples of steric clashes by FLAG, and other ligand undergoing significant conformational rearrang
Figure 1 : Typical resulting implausible molecules from generative models. ( a ) Unusual 3-membered rings generated by AR, large fused rings with more than 7 atoms generated by diffusion models. ( b ) Examples of steric clashes by FLAG, and other ligand undergoing significant conformational rearrang

実験結果

リサーチクエスチョン

  • RQ1MolCRAFTは自己回帰型SBDDモデルで観察されるモード崩壊と ill-conformational 出力を抑制できるか。
  • RQ2連続パラメータ空間生成は、ハイブリッドな連続-離散拡散アプローチと比べて3D構成の実現性とドッキング現実性を改善するか。
  • RQ3MolCRAFTは自己回帰および拡散のベースラインと比較して、結合親和性・構成安定性・薬物様性特性でどう機能するか。

主な発見

  • MolCRAFTは相当な分子サイズで-6.59 kcal/molのリファレンスレベルのVinaスコアを達成し、ベースラインを上回る。
  • MolCRAFTは結合複合体における構成安定性が高く、立体衝突が少なく、再ドック後のRMSDが改善。
  • モデルはサンプリング効率が優れており、完全な分子生成を約30倍速く達成し高い生成成功率を示す。
  • MolCRAFTは多様な部分構造結合長/角度モードを捉え、自己回帰モデルと比較してモーダル崩壊を低減。
  • 実験はMolCRAFTがタンパク質-リガンド分布から結合動態を効果的に学習し、いくつかの指標でリファレンスレベルの性能に近づくことを示す。
Figure 2 : Bond length distribution of reference and generated molecules by autoregressive models (upper row) and non-autoregressive models (lower row) for top-5 frequent bond types.
Figure 2 : Bond length distribution of reference and generated molecules by autoregressive models (upper row) and non-autoregressive models (lower row) for top-5 frequent bond types.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。