Skip to main content
QUICK REVIEW

[논문 리뷰] Functional-Group-Based Diffusion for Pocket-Specific Molecule Generation and Elaboration

Haitao Lin, Yufei Huang|arXiv (Cornell University)|2023. 05. 30.
Computational Drug Discovery Methods인용 수 10
한 줄 요약

D3FG는 기능군을 강체 조각으로, 링커를 질량 점으로 취급하는 기능군 기반 확산 모델을 도입하여 포켓 특이적 분자와 그 확장을 생성하고, 현실적인 3D 구조와 경쟁력 있는 결합 친화도(바인딩 어피니티)를 달성합니다.

ABSTRACT

In recent years, AI-assisted drug design methods have been proposed to generate molecules given the pockets' structures of target proteins. Most of them are atom-level-based methods, which consider atoms as basic components and generate atom positions and types. In this way, however, it is hard to generate realistic fragments with complicated structures. To solve this, we propose D3FG, a functional-group-based diffusion model for pocket-specific molecule generation and elaboration. D3FG decomposes molecules into two categories of components: functional groups defined as rigid bodies and linkers as mass points. And the two kinds of components can together form complicated fragments that enhance ligand-protein interactions. To be specific, in the diffusion process, D3FG diffuses the data distribution of the positions, orientations, and types of the components into a prior distribution; In the generative process, the noise is gradually removed from the three variables by denoisers parameterized with designed equivariant graph neural networks. In the experiments, our method can generate molecules with more realistic 3D structures, competitive affinities toward the protein targets, and better drug properties. Besides, D3FG as a solution to a new task of molecule elaboration, could generate molecules with high affinities based on existing ligands and the hotspots of target proteins.

연구 동기 및 목표

  • 기능군을 강체 조각으로, 링커를 질량 점으로 사용하여 포켓 특이적 분자의 현실적인 생성을 촉진한다.
  • 기존 리간드와 단백질 핫스팟을 기반으로 더 높은 친화도를 가진 리간드를 생성하기 위한 분자 확장을 가능하게 한다.
  • 조각 구조의 실행 가능성과 정확도를 개선하기 위해 원자 수준 생성에 대한 의존도를 감소시킨다.
  • fragment 수준 모델링을 지원하기 위해 CrossDocked2020에 대한 기능군 기반 코퍼스 및 데이터셋 확장을 구축한다.

제안 방법

  • 분자들을 기능군들(강체)과 링커들(질량 점)로 분해하고, 위치, 방향, 유형을 확산을 통해 공동으로 모델링한다.
  • 소멸 확산을 사용하여 기능군/링커 유형의 이산 레이블을 노이즈 제거(denoising) 중에 예측한다.
  • 3D 위치에 가우시안 확산을 적용하고 방향에 대해 SO(3)에서 등방성 확산을 적용하며, SE(3)-불변 신경망으로 매개변수화된 학습된 denoisers G, F, H를 사용한다.
  • 아미노산, 기능군, 링커로 구성된 이질적 그래프를 처리하기 위해 두 가지 생성 체계(joint와 two-stage)를 활용한다.
  • denoisers에서 SE(3)-등가성 및 대칭 특성을 보장하기 위해 등변 그래프 신경망(IPA/LoCS)을 활용한다.
Figure 1: An illustration of the workflows of D3FG of the two schemes.
Figure 1: An illustration of the workflows of D3FG of the two schemes.

실험 결과

연구 질문

  • RQ1기능군 기반 확산이 원자 수준 방법보다 더 현실적인 3D 조각과 pharmacophore에 정렬되는 모티프를 생성할 수 있는가?
  • RQ2two-stage와 joint 생성 체계가 결합 친화도와 분자 현실성 측면에서 서로 다른 트레이드오프를 제공하는가?
  • RQ3기존 리간드와 포켓 핫스팟을 기반으로 높은 친화도를 가진 리간드를 생성하여 분자 확장을 수행할 수 있는가?
  • RQ4연장된 기능군 기반 코퍼스가 CrossDocked2020에서 현실적 조각의 커버리지를 어떻게 개선하는가?
  • RQ5D3FG가 생성한 분자와 기준치(baselines)의 약물성 특성(QED, SA, LogP, Lipinski)의 비교 프로필은 어떠한가?

주요 결과

  • D3FG (Stage)가 더 현실적인 분자를 생성하는 데 있어 joint 변형보다 우수하고 TargetDiff에 비해 경쟁력 있는 친화력을 보인다.
  • D3FG는 TargetDiff에 비견될 만한 결합 친화력을 달성하며 여러-baseline보다 낫다.
  • D3FG는 MAE 및 JSD 지표로 나타난 바와 같이 실물 약물 분자와 더 유사한 기능군 분포를 가진 분자를 생성한다.
  • two-stage 체계가 joint 체계 및 여러 baseline보다 Vina/Gnina의 결합 친화도 점수와 QED, SA, Lipinski 같은 약물 특성을 더 우수하게 제공한다.
  • D3FG는 Pocket2Mol, DiffSBDD, LiGAN 등의 baseline에 비해 신뢰할 수 있는 3D 구조적 현실성과 향상된 원자 유형 분포를 보여준다.
Figure 3: Atom type distribution and metrics.
Figure 3: Atom type distribution and metrics.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.