Skip to main content
QUICK REVIEW

[論文レビュー] Structure-based Drug Design with Equivariant Diffusion Models

Arne Schneuing, Charles B. Harris|arXiv (Cornell University)|Oct 24, 2022
Computational Drug Discovery Methods被引用数 98
ひとこと要約

DiffSBDDは、タンパク質ポケットを条件とした新規リガンドを生成するSE(3)-等変な3D条件拡散モデルを提案します。構造ベースの創薬のためのインペインティングとジョイント ポケット–リガンド生成機能を備えています。

ABSTRACT

Structure-based drug design (SBDD) aims to design small-molecule ligands that bind with high affinity and specificity to pre-determined protein targets. Generative SBDD methods leverage structural data of drugs in complex with their protein targets to propose new drug candidates. These approaches typically place one atom at a time in an autoregressive fashion using the binding pocket as well as previously added ligand atoms as context in each step. Recently a surge of diffusion generative models has entered this domain which hold promise to capture the statistical properties of natural ligands more faithfully. However, most existing methods focus exclusively on bottom-up de novo design of compounds or tackle other drug development challenges with task-specific models. The latter requires curation of suitable datasets, careful engineering of the models and retraining from scratch for each task. Here we show how a single pre-trained diffusion model can be applied to a broader range of problems, such as off-the-shelf property optimization, explicit negative design, and partial molecular design with inpainting. We formulate SBDD as a 3D-conditional generation problem and present DiffSBDD, an SE(3)-equivariant diffusion model that generates novel ligands conditioned on protein pockets. Our in silico experiments demonstrate that DiffSBDD captures the statistics of the ground truth data effectively. Furthermore, we show how additional constraints can be used to improve the generated drug candidates according to a variety of computational metrics. These results support the assumption that diffusion models represent the complex distribution of structural data more accurately than previous methods, and are able to incorporate additional design objectives and constraints changing nothing but the sampling strategy.

研究の動機と目的

  • 3Dのタンパク質ポケットを条件として薬物様リガンドを生成することで、構造ベースの創薬を進展させる。
  • SE(3)-等変拡散フレームワークを用いたジョイント生成により、逐次生成の制限に対処する。
  • 再学習なしで、インペインティング、スキャフォールドホッピング、性質主導の最適化などの柔軟なタスクを可能にする。
  • 現実的なタンパク質–リガンドの文脈を持つベンチマークデータセットで性能を検証する。

提案手法

  • SBDDを3D条件付き拡散タスクとして定式化し、リガンド座標と原子種を再構成するSE(3)-等変ノイズ除去拡散確率モデル(DDPM)を訓練する。
  • タンパク質とリガンドを3Dグラフとして表現し、SE(3)-等変グラフニューラルネットワーク(EGNNs)で処理する。
  • デノイズ時にタンパク質ポケットノードを固定してポケット条件付きサンプリングを実装し、真の3D条件付けを実現する。
  • p(zL, zP) を学習する代替のジョイント生成モデルを提供し、修正された推論手順を通じて条件付きサンプリングを可能にする。
  • サンプリング時に固定サブ構造を置換することで、再学習なしにスキャフォールドホッピングとフラグメント成長を可能にするインペインティングを組み込む。
  • 反射を扱い、安定した3D生成を保証するために座標更新へ対称性崩しの変更を導入する。

実験結果

リサーチクエスチョン

  • RQ1特定のタンパク質ポケットを条件とした高親和性で薬物様のリガンドを生成できるSE(3)-等変拡散モデルは実現可能か?
  • RQ2ポケットとリガンドのジョイント生成は、ポケット条件付きアプローチと比較してドッキングスコアと多様性を向上させるか?
  • RQ3拡散ベースのインペインティングは、タスク特化データでの再学習なしに柔軟なスキャフォールドホッピングとフラグメントベース設計を可能にするか?
  • RQ4CrossDockedやBinding MOADのような現実的なデータセットで、DiffSBDDは新規リガンド設計とリード最適化の性能をどう示すか?

主な発見

  • DiffSBDDは、与えられたタンパク質ポケットに対して新規で多様なリガンドを生成し、競争力のあるドッキングスコアを示す。
  • インペインティングを伴うジョイントポケット–リガンド生成は、条件付き手法と比べてしばしばより高いドッキングスコアとリガンド特性の改善をもたらす。
  • フルアトム文脈(Cα表現と異なる)がドッキングスコアとドッキングポーズとの立体配置の整合性を改善する。
  • インペインティングベースの設計は、専用データセットでの再学習なしにスキャフォールドホッピング、詳細化、フラグメント結合・成長を可能にする。
  • このアプローチは、シード分子の周辺の局所的な化学空間を探索し、QEDやSAなどの性質を最適化することでリード最適化の柔軟性を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。