[논문 리뷰] Generating 3D Molecular Structures Conditional on a Receptor Binding Site with Deep Generative Models
이 논문은 변분 오토인코더와 컨volution 신경망을 사용하여 3D 수용체 결합 부위를 조건으로 삼아 3D 분자 구조를 생성하는 최초의 딥 생성 모델을 제시한다. 수용체와 리간드의 원자 밀도 격자를 각각 별도의 잠재 공간으로 인코딩하고, 디코더를 통해 새로운 리간드 원자 밀도를 생성하며, 이러한 밀도에 이산 원자를 맞추어 유효하고 고유한 분자를 생성한다. 이는 잠재 공간 내 시드 구조에 가까울수록 유의미한 결합 친화도를 가지며, 그에 따라 개선되는 유효한 분자들을 생성한다.
Deep generative models have been applied with increasing success to the generation of two dimensional molecules as SMILES strings and molecular graphs. In this work we describe for the first time a deep generative model that can generate 3D molecular structures conditioned on a three-dimensional (3D) binding pocket. Using convolutional neural networks, we encode atomic density grids into separate receptor and ligand latent spaces. The ligand latent space is variational to support sampling of new molecules. A decoder network generates atomic densities of novel ligands conditioned on the receptor. Discrete atoms are then fit to these continuous densities to create molecular structures. We show that valid and unique molecules can be readily sampled from the variational latent space defined by a reference `seed' structure and generated structures have reasonable interactions with the binding site. As structures are sampled farther in latent space from the seed structure, the novelty of the generated structures increases, but the predicted binding affinity decreases. Overall, we demonstrate the feasibility of conditional 3D molecular structure generation and provide a starting point for methods that also explicitly optimize for desired molecular properties, such as high binding affinity.
연구 동기 및 목표
- 2D 분자 생성 및 가상 스크리닝의 한계를 극복하여 3D 수용체 결합 부위를 조건으로 삼는 딥 생성 모델을 개발한다.
- 구조적으로 다양하면서도 목표 단백질에 효과적으로 결합하는 신규의 약물 유사 분자를 조건부로 생성할 수 있도록 한다.
- 기존 생성 모델에서 3D 구조 조건이 부족한 문제를 해결하며, 일반적으로 2D 표현식이나 리간드 특성에 의존하는 경향이 있다.
- 학습된 잠재 공간을 수용체 기하학에 조건화하여 유효한 3D 분자 구조를 생성할 수 있음을 입증한다.
- 잠재 공간 내 시드 기반 구조에서 멀어질수록 분자의 신규성과 예측된 결합 친화도 사이의 상충 관계를 탐색한다.
제안 방법
- 수용체와 리간드 양쪽에 3D 원자 밀도 격자를 입력 표현으로 사용하여 분자 기하학을 공간적으로 인코딩한다.
- 수용체와 리간드에 대해 별도의 인코더 및 디코더 네트워크를 갖춘 조건부 변분 오토인코더(VAE)를 적용하여 분리된 잠재 표현을 학습한다.
- 다양한 공간 해상도에서 구조적 정보를 전파하기 위해 수용체 인코더에서 디코더로 스킵 연결을 도입한다.
- 연속적인 원자 밀도 격자를 이산적이고 유효한 3D 분자 구조로 변환하기 위해 새로운 원자 맞춤 및 결합 추가 알고리즘을 적용한다.
- 실제와 생성된 원자 밀도 격자를 구분하기 위해 GAN 판별자를 도입하여 생성된 리간드 밀도의 현실성 향상을 도모한다.
- 생성된 분자의 결합 친화도를 예측하기 위해 딥 네트워크(gnina)를 사용하여 생성된 구조의 평가를 가능하게 한다.
실험 결과
연구 질문
- RQ1딥 생성 모델은 3D 수용체 결합 부위를 조건으로 삼아 유효한 3D 분자 구조를 생성할 수 있는가?
- RQ2잠재 공간 내 시드 기반 구조에서 멀어질수록 생성된 분자의 다양성은 어떻게 변화하는가?
- RQ3생성된 분자들이 수용체 결합 부위와 유사한 상호작용을 유지하는 정도는 어느 정도인가?
- RQ4모델은 약물 유사 특성과 합리적인 결합 친화도를 유지하면서도 새로운 스caffolds를 생성할 수 있는가?
- RQ5잠재 공간에 수용체 정보를 포함시킬 경우 생성된 리간드의 품질과 유효성은 어떻게 영향을 받는가?
주요 결과
- 모델은 평균 유효성 비율이 80%를 초과하는 유효한 3D 분자 구조를 생성하며, 대부분의 생성된 분자는 고유하다.
- 시드 기반 구조에 가까운 위치에서 샘플링한 분자들은 향상된 예측된 결합 친화도를 보이며, 시드와 유사한 크기와 스caffolds를 유지한다.
- 샘플링 변동성이 증가함에 따라 분자의 신규성이 증가하지만 예측된 결합 친화도는 감소하며, 높은 변동성 요인에서는 Tanimoto 계수 값이 0.5 이하로 떨어진다.
- 변동성 요인이 5.0일 때 생성된 분자들은 시드와의 Tanimoto 계수 약 0.2를 기록하여 완전한 구조적 이탈을 나타낸다.
- 비극성이며 수용액에 노출되지 않는 결합 부위를 가진 수용체는 낮은 고리형 극성 표면적(TPSA)을 가지는 리간드를 생성하지만, 노출된 부위는 높은 TPSA를 가지는 분자를 생성한다.
- 시드 구조 없이 생성된 분자는 화학적 구조와 결합 방식에서 모두 완전히 다름을 보여주며, 이는 시드가 생성을 이끄는 데 핵심적인 역할을 한다는 것을 시사한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.