Skip to main content
QUICK REVIEW

[論文レビュー] Functional-Group-Based Diffusion for Pocket-Specific Molecule Generation and Elaboration

Haitao Lin, Yufei Huang|arXiv (Cornell University)|May 30, 2023
Computational Drug Discovery Methods被引用数 10
ひとこと要約

D3FG は、機能基を剛体フラグメントとして、リンクャーを原子として扱う機能基ベースの拡散モデルを導入し、ポケット特異的な分子とその発展を生成する。現実的な3D構造と競争力のある結合親和性を達成する。

ABSTRACT

In recent years, AI-assisted drug design methods have been proposed to generate molecules given the pockets' structures of target proteins. Most of them are atom-level-based methods, which consider atoms as basic components and generate atom positions and types. In this way, however, it is hard to generate realistic fragments with complicated structures. To solve this, we propose D3FG, a functional-group-based diffusion model for pocket-specific molecule generation and elaboration. D3FG decomposes molecules into two categories of components: functional groups defined as rigid bodies and linkers as mass points. And the two kinds of components can together form complicated fragments that enhance ligand-protein interactions. To be specific, in the diffusion process, D3FG diffuses the data distribution of the positions, orientations, and types of the components into a prior distribution; In the generative process, the noise is gradually removed from the three variables by denoisers parameterized with designed equivariant graph neural networks. In the experiments, our method can generate molecules with more realistic 3D structures, competitive affinities toward the protein targets, and better drug properties. Besides, D3FG as a solution to a new task of molecule elaboration, could generate molecules with high affinities based on existing ligands and the hotspots of target proteins.

研究の動機と目的

  • 機能基を剛体フラグメントとして、リンクャーを質点として用いることにより、ポケット特異的分子の現実的な生成を促進する。
  • 既存のリガンドとタンパク質ホットスポットに基づいて、より高結合親和性を持つリガンドを生成する分子展開を実現する。
  • 原子レベル生成への依存を減らし、フラグメント構造の実現性と正確性を向上させる。
  • 機能基ベースのコーパスと CrossDocked2020 のデータセット拡張を確立し、フラグメントレベルのモデリングを支援する。

提案手法

  • 分子を機能基(剛体)とリンクャー(質点)に分解し、それらの位置・向き・種類を拡散を通じて共同モデル化する。
  • デノイジング時に離散タイプラベルを予測するため、機能基/リンクャー型に対して吸収拡散を用いる。
  • 3D位置にはガウス拡散、姿勢にはSO(3)上の等方拡散を適用し、SE(3)-不変ニューラルネットワークでパラメータ化された学習済みデノイザー G, F, H を用いる。
  • アミノ酸、機能基、リンクャーからなる不均一グラフを扱うため、joint と two-stage の二つの生成スキームを採用する。
  • デノイザーに SE(3) 同変性と対称性を保証するため、等変グラフニューラルネットワーク(IPA/LoCS)を用いる。
Figure 1: An illustration of the workflows of D3FG of the two schemes.
Figure 1: An illustration of the workflows of D3FG of the two schemes.

実験結果

リサーチクエスチョン

  • RQ1機能基ベースの拡散は、原子レベル手法よりも現実的な3D断片や薬効団のモチーフにより適合できるか。
  • RQ2two-stage と joint 生成スキームは結合親和性と分子の現実性の観点で異なるトレードオフを提供するか。
  • RQ3既存リガンドとポケットホットスポットに基づいて高親和性リガンドを生成する分子展開をモデルは行えるか。
  • RQ4拡張された機能基ベースのコーパスは CrossDocked2020 における現実的断片のカバレッジをどのように改善するか。
  • RQ5D3FG 生成分子とベースラインとの比較薬物性プロファイル(QED、SA、LogP、Lipinski)はどうなるか。

主な発見

  • D3FG(Stage)は joint 変体よりも現実的な分子生成で優れており、TargetDiff に対して競争力のある親和性を示す。
  • D3FG は TargetDiff に匹敵する結合親和性を達成し、いくつかのベースラインよりも優れている。
  • D3FG は機能基の分布が実在の薬物分子により近い分布を示し、MAE および JSD 指標によって示される。
  • two-stage スキームは joint スキームやいくつかのベースラインよりも結合親和性スコア(Vina/Gnina)と薬物性(QED、SA、Lipinski)を向上させる。
  • D3FG は Pocket2Mol、DiffSBDD、LiGAN などのベースラインと比較して信頼性の高い3D構造リアリズムと原子種分布の改善を示す。
Figure 3: Atom type distribution and metrics.
Figure 3: Atom type distribution and metrics.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。