[논문 리뷰] Structure-based Drug Design with Equivariant Diffusion Models
DiffSBDD는 단백질 포켓에 조건화된 신규 리간드를 생성하기 위해 SE(3)-등변 3D-조건부 확산 모델을 제안하며, 구조 기반 약물 설계를 위한 인페인팅 및 포켓–리간드 공동 생성 기능을 제공합니다.
Structure-based drug design (SBDD) aims to design small-molecule ligands that bind with high affinity and specificity to pre-determined protein targets. Generative SBDD methods leverage structural data of drugs in complex with their protein targets to propose new drug candidates. These approaches typically place one atom at a time in an autoregressive fashion using the binding pocket as well as previously added ligand atoms as context in each step. Recently a surge of diffusion generative models has entered this domain which hold promise to capture the statistical properties of natural ligands more faithfully. However, most existing methods focus exclusively on bottom-up de novo design of compounds or tackle other drug development challenges with task-specific models. The latter requires curation of suitable datasets, careful engineering of the models and retraining from scratch for each task. Here we show how a single pre-trained diffusion model can be applied to a broader range of problems, such as off-the-shelf property optimization, explicit negative design, and partial molecular design with inpainting. We formulate SBDD as a 3D-conditional generation problem and present DiffSBDD, an SE(3)-equivariant diffusion model that generates novel ligands conditioned on protein pockets. Our in silico experiments demonstrate that DiffSBDD captures the statistics of the ground truth data effectively. Furthermore, we show how additional constraints can be used to improve the generated drug candidates according to a variety of computational metrics. These results support the assumption that diffusion models represent the complex distribution of structural data more accurately than previous methods, and are able to incorporate additional design objectives and constraints changing nothing but the sampling strategy.
연구 동기 및 목표
- 구조 기반 약물 설계를 3D 포켓 조건화 리간드 생성으로 발전시키고, 3D 단백질 포켓에 조건화된 약물 유사 리간드를 생성합니다.
- 연속적 생성의 한계를 SE(3)-등변 확산 프레임워크의 공동 사용으로 해결합니다.
- 재학습 없이도 인페인팅, 스캐폴드 호핑, 특성 주도 최적화와 같은 유연한 작업을 가능하게 합니다.
- 현실적인 단백질–리간드 컨텍스트를 가진 벤치마크 데이터셋에서 성능을 검증합니다.
제안 방법
- SBDD를 3D-조건부 확산 작업으로 형식화하고, 리간드 좌표와 원자 타입을 재구성하기 위해 SE(3)-등변 디노이징 확산 확률 모델(DDPM)을 학습합니다.
- 단백질과 리간드를 SE(3)-등변 그래프 신경망(EGNN)이 처리하는 3D 그래프로 표현합니다.
- denoising 중에 단백질 포켓 노드를 고정시켜 포켓 조건부 sampling을 구현하여 진정한 3D 조건화를 가능하게 합니다.
- zL, zP의 p를 학습하고 수정된 추론 절차를 통해 조건부 샘플링을 가능하게 하는 대안적 공동 생성 모델을 제공합니다.
- 샘플링 중 고정된 부분구조를 교체하여 재학습 없이도 스캐폴드 호핑 및 프래그먼트 성장에 의한 인페인팅을 가능하게 합니다.
- 좌표 업데이트에 대한 대칭성 깨짐 수정을 도입하여 반사 동작을 처리하고 일관된 3D 생성을 보장합니다.
실험 결과
연구 질문
- RQ1SE(3)-등변 확산 모델이 특정 단백질 포켓에 조건화된 고친화성의 약물 유사 리간드를 생성할 수 있는가?
- RQ2공동 포켓–리간드 생성이 포켓 조건부 접근보다 도킹 점수와 다변성에 개선을 가져오는가?
- RQ3DiffSBDD의 확산 기반 인페인팅이 작업별 데이터 재학습 없이도 유연한 스캐폴드 호핑 및 프래그먼트 기반 설계를 가능하게 하는가?
- RQ4CrossDocked 및 Binding MOAD와 같은 현실 데이터셋에서 de novo 리간드 설계 및 리드 최적화에서 DiffSBDD의 성능은 어떠한가?
주요 결과
- DiffSBDD는 주어진 단백질 포켓에 대해 신생이고 다양한 리간드를 생성하고 도킹 점수가 경쟁력 있습니다.
- 포켓–리간드 공동 생성과 인페인팅은 조건부 방법에 비해 도킹 점수와 리간드 특성이 더 높게 나타나는 경우가 많습니다.
- 전체 원자 컨텍스트(대신 Cα 표현) 가 도킹 점수와 도킹 포즈와의 구합 일치도를 개선합니다.
- 인페인팅 기반 설계는 재학습 없이도 스캐폴드 호핑, 확장, 프래그먼트 합병 및 성장 등을 가능하게 합니다.
- 이 접근법은 seed 분자 주위의 국소 화학 공간을 탐색하고 QED 및 SA와 같은 특성을 최적화함으로써 리드 최적화를 위한 유연성을 보여 줍니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.