Skip to main content
QUICK REVIEW

[论文解读] Chemi-net: a graph convolutional network for accurate drug property prediction

Ke Liu, Xiangyan Sun|arXiv (Cornell University)|Mar 16, 2018
Computational Drug Discovery Methods参考文献 17被引用 39
一句话总结

Chemi-Net 是一种基于图卷积网络(GCN)的深度学习模型,无需依赖领域特定的描述符或指纹即可预测药物的吸收、分布、代谢和排泄(ADME)特性。该模型在分子图上端到端训练,相较于安进公司广泛使用的行业标准方法 Cubist,在一次真实的对比研究中显著提升了预测准确性。

ABSTRACT

Absorption, distribution, metabolism, and excretion (ADME) studies are critical for drug discovery. Conventionally, these tasks, together with other chemical property predictions, rely on domain-specific feature descriptors, or fingerprints. Following the recent success of neural networks, we developed Chemi-Net, a completely data-driven, domain knowledge-free, deep learning method for ADME property prediction. To compare the relative performance of Chemi-Net with Cubist, one of the popular machine learning programs used by Amgen, a large-scale ADME property prediction study was performed on-site at Amgen. The results showed that our deep neural network method improved current methods by a large margin. We foresee that the significantly increased accuracy of ADME prediction seen with Chemi-Net over Cubist will greatly accelerate drug discovery.

研究动机与目标

  • 开发一种不依赖手工设计的化学指纹或领域特定描述符的深度学习模型,用于药物性质预测。
  • 在工业药物发现中,提升现有机器学习方法在 ADME 性质预测方面的准确性。
  • 构建一个完全数据驱动、可端到端训练的框架,直接从图结构化的分子数据中学习分子表征。
  • 在安进公司的真实环境中,将该模型与最先进的行业标准方法(Cubist)进行对比验证。

提出的方法

  • Chemi-Net 使用图卷积网络(GCN)处理分子图,其中原子为节点,化学键为边。
  • 该模型采用消息传递机制,通过聚合邻近原子的信息,迭代更新节点表征。
  • 它应用可学习的滤波器,以捕捉分子图中局部的分子子结构及分层结构模式。
  • 通过在所有原子级表征上进行全局池化操作,获得最终的分子表征。
  • 最终的预测头使用全连接层,从池化后的分子嵌入中输出预测的 ADME 性质。
  • 整个模型通过标准反向传播算法进行端到端训练,回归任务使用均方误差损失函数。

实验结果

研究问题

  • RQ1基于图卷积网络的深度学习模型是否能在预测 ADME 性质方面超越传统机器学习方法?
  • RQ2在真实药物发现场景中,数据驱动的、无特征的方法在多大程度上能匹配或超越 Cubist 等行业标准工具的性能?
  • RQ3GCN 架构在无需化学指纹的情况下,能否有效从分子图中直接学习有意义的分子表征?
  • RQ4在分子图上进行端到端训练是否能提升药物性质预测的泛化能力与预测准确性?

主要发现

  • 在安进公司进行的大规模现场 ADME 性质预测研究中,Chemi-Net 显著优于广泛使用的机器学习程序 Cubist。
  • 与 Cubist 相比,该模型在预测准确性方面实现了显著提升,证明了基于 GCN 的表征学习在药物性质预测中的有效性。
  • 性能提升在多个 ADME 相关性质上保持一致,表明该方法具有广泛的适用性。
  • 结果表明,Chemi-Net 的数据驱动、领域无关方法可加速药物发现,通过实现更准确的早期阶段性质预测。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。