QUICK REVIEW

[论文解读] Multi-Objective De Novo Drug Design with Conditional Graph Generative Model

Yibo Li, Liangren Zhang|arXiv (Cornell University)|Jan 18, 2018

Computational Drug Discovery Methods参考文献 46被引用 31

一句话总结

该论文提出了一种用于多目标从头药物设计的条件图生成模型，采用无需原子级循环单元的序列化图生成框架，高效生成结构有效且复杂的分子。其在有效性方面优于基于SMILES的模型，并在生成具有特定骨架、类药物性质、合成可及性以及同时抑制JNK3和GSK3β的分子方面实现了高富集率。

ABSTRACT

Recently, deep generative models have revealed itself as a promising way of performing de novo molecule design. However, previous research has focused mainly on generating SMILES strings instead of molecular graphs. Although current graph generative models are available, they are often too general and computationally expensive, which restricts their application to molecules with small sizes. In this work, a new de novo molecular design framework is proposed based on a type sequential graph generators that do not use atom level recurrent units. Compared with previous graph generative models, the proposed method is much more tuned for molecule generation and have been scaled up to cover significantly larger molecules in the ChEMBL database. It is shown that the graph-based model outperforms SMILES based models in a variety of metrics, especially in the rate of valid outputs. For the application of drug design tasks, conditional graph generative model is employed. This method offers higher flexibility compared to previous fine-tuning based approach and is suitable for generation based on multiple objectives. This approach is applied to solve several drug design problems, including the generation of compounds containing a given scaffold, generation of compounds with specific drug-likeness and synthetic accessibility requirements, as well as generating dual inhibitors against JNK3 and GSK3$β$. Results show high enrichment rates for outputs satisfying the given requirements.

研究动机与目标

通过转向分子图生成，解决基于SMILES的生成在从头药物设计中的局限性。
开发一种可扩展、高效的图生成模型，适用于更大分子，克服现有图模型的计算瓶颈。
基于多样化的化学与药理学约束，实现灵活的多目标分子生成。
与基于序列的方法相比，提升生成分子的有效性与化学相关性。
在真实世界药物设计任务中证明该方法的有效性，包括基于骨架的生成与双靶点抑制剂设计。

提出的方法

该方法采用一种序列化图生成器，以原子为单位逐个构建分子，无需依赖原子级循环单元，从而提升训练效率与可扩展性。
采用条件变分自编码器框架，基于特定目标（如骨架包含或期望的理化性质）引导生成过程。
在ChEMBL数据库的分子图上进行端到端训练，支持大而复杂的分子生成。
通过潜在空间条件控制实现条件控制，支持灵活的非微调生成，适用于多种目标。
该框架支持无条件与条件生成，推理过程由目标性质的已学习潜在表示引导。
通过可微分的图构建过程强制保证图的有效性，从而在生成过程中最小化无效输出。

实验结果

研究问题

RQ1图生成模型是否能在生成化学有效且多样化的分子结构方面优于基于SMILES的模型？
RQ2条件图生成模型是否能有效生成具有多种期望目标的分子，如特定骨架与类药物性质？
RQ3该模型在真实药物数据库（如ChEMBL）中常见的更大、更复杂的分子上是否具备良好的可扩展性？
RQ4该模型是否能以高富集率生成针对两个关键药物靶点（如JNK3和GSK3β）的双功能抑制剂？
RQ5与基于微调的方法相比，条件生成方法在多目标药物设计中是否展现出更高的灵活性？

主要发现

与基于SMILES的基线模型相比，该图基模型在生成分子中的有效性显著更高，证明其具有更优的结构保真度。
该模型成功生成了在目标骨架、类药物性质与合成可及性方面高度富集的分子，证实其在多目标设计中的有效性。
在针对JNK3与GSK3β的双功能抑制剂生成中，该方法实现了高富集率，表明其在多药理学药物发现中具有强大潜力。
该模型在更大分子上表现出良好的可扩展性，成功生成了此前许多图生成模型难以触及的ChEMBL数据库结构。
通过潜在空间条件控制的条件生成方法，在灵活性与多种目标下的性能表现均优于基于微调的方法。
由于避免了原子级循环机制，该框架在复杂分子图上仍保持了高生成效率与化学有效性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。