Skip to main content
QUICK REVIEW

[論文レビュー] Learning Subpocket Prototypes for Generalizable Structure-based Drug Design

Zaixi Zhang, Qi Liu|arXiv (Cornell University)|May 22, 2023
Computational Drug Discovery Methods被引用数 8
ひとこと要約

DrugGPSはsubpocketプロトタイプを学習し、階層的な3Dグラフ変換器とプロトタイプ強化モチーフ生成を用いて、未見ポケットへの構造ベース薬物設計を一般化し、OOD設定でベースラインより優れる。

ABSTRACT

Generating molecules with high binding affinities to target proteins (a.k.a. structure-based drug design) is a fundamental and challenging task in drug discovery. Recently, deep generative models have achieved remarkable success in generating 3D molecules conditioned on the protein pocket. However, most existing methods consider molecular generation for protein pockets independently while neglecting the underlying connections such as subpocket-level similarities. Subpockets are the local protein environments of ligand fragments and pockets with similar subpockets may bind the same molecular fragment (motif) even though their overall structures are different. Therefore, the trained models can hardly generalize to unseen protein pockets in real-world applications. In this paper, we propose a novel method DrugGPS for generalizable structure-based drug design. With the biochemical priors, we propose to learn subpocket prototypes and construct a global interaction graph to model the interactions between subpocket prototypes and molecular motifs. Moreover, a hierarchical graph transformer encoder and motif-based 3D molecule generation scheme are used to improve the model's performance. The experimental results show that our model consistently outperforms baselines in generating realistic drug candidates with high affinities in challenging out-of-distribution settings.

研究の動機と目的

  • 構造ベースの薬物設計(SBDD)を動機づけ、未見ポケットへの一般化を課題とする。
  • サブポケットレベルの生化学的事前知識を活用して一般化可能なモデルを構築する。
  • 階層エンコーダとグローバル相互作用グラフを開発し、生成を情報づけする。
  • サブポケット埋め込みとグローバル相互作用に導かれたプロトタイプ強化文脈でモチーフごとに分割して分子を生成する、リアルさと親和性を向上。

提案手法

  • ポケット-リガンド文脈を階層的3Dグラフ変換器で符号化するため、原子レベルおよび残基レベルのグラフを構築する。
  • サブポケット埋め込みをクラスタリングしてサブポケットプロトタイプを定義し、TF-IDF重み付きエッジを用いてグローバルなプロトタイプ–モチーフ相互作用グラフを構築する。
  • サブポケット埋め込みとグローバル相互作用に導かれたプロトタイプ強化モチーフ生成パイプラインを導入する。
  • 焦点モチーフ選択、モチーフ付着予測、回転角予測を組み込んだモチーフごとにリガンドを生成する。
  • 焦点原子/モチーフ予測、モチーフ型、付着、ねじれ角(von Mises)、距離初期化を含む多タスク損失で訓練する。
  • 分子モチーフに対するマスク&回復訓練戦略で条件付き生成p(G^mol|G^pro)を学習する。

実験結果

リサーチクエスチョン

  • RQ1サブポケットレベルのプロトタイプは、構造ベースの薬物設計における未知のタンパク質ポケットへの一般化を可能にするか。
  • RQ2サブポケットプロトタイプと分子モチーフ間のグローバル相互作用グラフは、分布外ポケットでの生成品質と親和性を改善するか。
  • RQ3原子-残基レベルのポケット情報を階層的に符号化することは、生成のリアリズムと薬物様適性にどのような影響を与えるか。
  • RQ4焦点モチーフ導入によるモチーフごと生成は、原子ごと生成よりSBDDにおいて効率的で妥当性が高いか。

主な発見

MethodsVina Score (kcal/mol, ↓)High Affinity (↑)QED (↑)SA (↑)LogPLip. (↑)Sim. Train (↓)Div. (↑)Time (↓)
Testset-7.145 2 2.24-0.465 2 0.250.736 2 0.120.941 2 2.254.468 2 1.54---
LiGAN-6.032 2 1.890.194 2 0.260.365 2 0.270.615 2 0.20-0.015 2 2.484.002 2 0.920.410 2 0.220.667 2 0.151819.8 2 560.7
AR-6.114 2 1.660.235 2 0.230.483 2 0.180.662 2 0.190.210 2 1.764.688 2 0.450.394 2 0.210.650 2 0.1315986.4 2 9851.0
GraphBP-6.745 2 1.820.378 2 0.290.455 2 0.190.710 2 0.180.457 2 2.104.783 2 0.340.378 2 0.260.659 2 0.121162.8 2 438.5
Pocket2Mol-6.869 2 2.190.413 2 0.230.524 2 0.240.726 2 0.210.830 2 2.174.892 2 0.220.364 2 0.190.695 2 0.172827.3 2 1456.8
FLAG-6.956 2 1.920.445 2 0.220.552 2 0.200.737 2 0.190.745 2 2.094.904 2 0.140.388 2 0.180.704 2 0.181289.1 2 378.0
DrugGPS-7.276 2 2.140.565 2 0.230.613 2 0.220.743 2 0.180.913 2 2.154.917 2 0.120.360 2 0.210.681 2 0.151007.8 2 554.1
  • DrugGPSは、分布外分割の下でベースライン(LiGAN、AR、GraphBP、Pocket2Mol、FLAG)を上回り、生成分子の結合親和性と薬物様適性が向上している。
  • ポケットベースのクラスタ分割分割下で、DrugGPSは高い親和性を維持し、多様で薬物様な分子と実在的なサブ構造を生成する。
  • グローバルなサブポケットプロトタイプ–モチーフ相互作用グラフとプロトタイプ拡張が、ポケット間知識をエンコードして生成を改善する。
  • アブレーション実験より、階層的符号化と相互作用グラフが性能に不可欠である。
  • 化学的に妥当な付着剪定とRDKitチェックにより、生成分子の100%有効性を達成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。