[论文解读] GraphAF: a Flow-based Autoregressive Model for Molecular Graph Generation
GraphAF 是一种基于流的自回归分子图生成模型,在高有效性和效率方面表现突出,能够快速密度建模,并在强化学习后实现更优的性质优化。
Molecular graph generation is a fundamental problem for drug discovery and has been attracting growing attention. The problem is challenging since it requires not only generating chemically valid molecular structures but also optimizing their chemical properties in the meantime. Inspired by the recent progress in deep generative models, in this paper we propose a flow-based autoregressive model for graph generation called GraphAF. GraphAF combines the advantages of both autoregressive and flow-based approaches and enjoys: (1) high model flexibility for data density estimation; (2) efficient parallel computation for training; (3) an iterative sampling process, which allows leveraging chemical domain knowledge for valency checking. Experimental results show that GraphAF is able to generate 68% chemically valid molecules even without chemical knowledge rules and 100% valid molecules with chemical rules. The training process of GraphAF is two times faster than the existing state-of-the-art approach GCPN. After fine-tuning the model for goal-directed property optimization with reinforcement learning, GraphAF achieves state-of-the-art performance on both chemical property optimization and constrained property optimization.
研究动机与目标
- 在化学有效性和属性优化约束下,推动药物发现与材料科学中的分子图生成。
- 开发一种基于流的自回归框架,能够建模分子数据密度并实现高效的训练与采样。
- 通过价键约束在生成过程中融入化学领域知识,并通过强化学习实现面向目标的优化。
- 在标准分子数据集上评估 GraphAF,以在有效性、唯一性、新颖性和重建能力方面与最先进方法进行比较。
提出的方法
- 将分子图生成建模为一个顺序决策过程,其中节点和边按自回归方式生成。
- 使用去量化和高斯条件,定义从基高斯到离散图结构的可逆流。
- 使用关系型 GCN(R-GCN)通过神经网络为均值和尺度参数(g_mu, g_alpha)生成节点和边的条件分布。
- 通过掩码和基于 BFS 的图排序实现高效并行训练,使单次前向传播即可进行精确的似然计算。
- 通过在采样过程中整合价键检查并添加氢以满足价态,保证化学有效性。
- 可选的强化学习微调(PPO),以带有相似性约束的惩罚化对数P和QED来实现受约束的性质优化。
实验结果
研究问题
- RQ1GraphAF 是否能够在实现高效并行训练的同时,准确建模分子图的数据密度?
- RQ2自回归流方法是否在有效性和重建精度方面优于现有的图生成模型?
- RQ3与基线相比,GraphAF 在密度建模、生成以及性质/受约束性质优化方面的表现如何?
- RQ4基于价键约束和强化学习对生成分子质量与有效性的影响是什么?
主要发现
| 方法 | 有效性 | 无检查时的有效性 | 唯一性 | 新颖性 | 重建 |
|---|---|---|---|---|---|
| JT-VAE | 100% | — | 100% ‡ | 100% ‡ | 76.7% |
| GCPN | 100% | 20% † | 99.97% ‡ | 100% ‡ | — |
| MRNN | 100% | 65% | 99.89% | 100% | — |
| GraphAF | 100% | 68% | 99.10% | 100% | 100% |
- 在生成过程中应用价键规则时,GraphAF 达到 100% 的有效性。
- 若不进行价键检查,GraphAF 仍可达到 68% 的有效性,高于先前的自回归方法。
- 在同样的硬件上,训练 GraphAF 明显更快(约 4 小时),比 GCPN(约 8–24 小时)更短。
- GraphAF 在 ZINC250k、QM9 和 MOSES 数据集上的密度建模和生成方面达到了或超过最先进水平。
- 通过强化学习微调,在惩罚性对数 P 上达到最先进的结果,QED 分数相当,在受约束性质优化方面表现强劲。
- 在通用图上,GraphAF 的 MMD 指标与 GraphRNN 和 GNF 相竞争。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。