[论文解读] Generating 3D Molecular Structures Conditional on a Receptor Binding Site with Deep Generative Models
该论文提出了首个基于变分自编码器和卷积神经网络、以3D受体结合位点为条件的深度生成模型,用于生成3D分子结构。该模型分别将受体和配体的原子密度网格编码至独立的潜在空间,通过解码器生成新型配体的原子密度,并将离散原子拟合到这些密度上,从而生成具有合理结合亲和力、结构有效且唯一的分子,且其性能随潜在空间中与种子结构距离的缩短而提升。
Deep generative models have been applied with increasing success to the generation of two dimensional molecules as SMILES strings and molecular graphs. In this work we describe for the first time a deep generative model that can generate 3D molecular structures conditioned on a three-dimensional (3D) binding pocket. Using convolutional neural networks, we encode atomic density grids into separate receptor and ligand latent spaces. The ligand latent space is variational to support sampling of new molecules. A decoder network generates atomic densities of novel ligands conditioned on the receptor. Discrete atoms are then fit to these continuous densities to create molecular structures. We show that valid and unique molecules can be readily sampled from the variational latent space defined by a reference `seed' structure and generated structures have reasonable interactions with the binding site. As structures are sampled farther in latent space from the seed structure, the novelty of the generated structures increases, but the predicted binding affinity decreases. Overall, we demonstrate the feasibility of conditional 3D molecular structure generation and provide a starting point for methods that also explicitly optimize for desired molecular properties, such as high binding affinity.
研究动机与目标
- 开发一种深度生成模型,以3D受体结合位点为条件生成3D分子结构,克服2D分子生成和虚拟筛选的局限性。
- 实现新型、类药物分子的条件化生成,这些分子在结构上具有多样性,同时能有效结合目标蛋白。
- 解决现有生成模型中缺乏3D结构条件的问题,这些模型通常依赖2D表示或配体性质。
- 证明基于受体几何结构学习的潜在空间生成有效3D分子结构的可行性。
- 探索在潜在空间中远离参考种子结构采样时,分子新颖性与预测结合亲和力之间的权衡。
提出的方法
- 使用3D原子密度网格作为受体和配体的输入表示,实现分子几何结构的空间编码。
- 采用条件变分自编码器(VAE),配备受体和配体的独立编码器与解码器网络,学习解耦的潜在表示。
- 引入从受体编码器到解码器的跳跃连接,以在多个空间分辨率上传播结构信息。
- 应用一种新颖的原子拟合与键添加算法,将连续的原子密度网格转换为离散、有效的3D分子结构。
- 训练生成对抗网络(GAN)判别器,以区分真实与生成的原子密度网格,提升生成配体密度的真实性。
- 使用深度神经网络(gnina)预测生成分子的结合亲和力,从而评估生成结构的质量。
实验结果
研究问题
- RQ1深度生成模型能否基于3D受体结合位点生成有效的3D分子结构?
- RQ2当采样点在潜在空间中远离参考种子结构时,生成分子的多样性如何变化?
- RQ3生成的分子在多大程度上能维持与受体结合位点的有利相互作用?
- RQ4该模型能否在保持类药物性质和合理结合亲和力的同时生成新颖的骨架结构?
- RQ5将受体信息包含在潜在空间中,如何影响生成配体的质量与有效性?
主要发现
- 该模型生成的有效3D分子结构平均有效性率超过80%,且大多数生成分子具有唯一性。
- 在接近参考种子结构的潜在空间中采样生成的分子表现出更高的预测结合亲和力,并保持与种子分子相似的大小和骨架结构。
- 随着采样变异性的增加,分子新颖性提升,但预测结合亲和力下降,当变异因子较高时,Tanimoto系数降至0.5以下。
- 在变异因子为5.0时,生成分子与种子分子的Tanimoto系数约为0.2,表明结构已完全分化。
- 具有疏水性、溶剂不可及结合位点的受体生成的配体具有更低的拓扑极性表面积(TPSA),而暴露的结合位点则生成TPSA更高的分子。
- 未使用种子结构生成的分子在化学结构和结合模式上均完全不同,凸显了种子在引导生成过程中的关键作用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。