QUICK REVIEW

[论文解读] GraphDF: A Discrete Flow Model for Molecular Graph Generation

Youzhi Luo, Keqiang Yan|arXiv (Cornell University)|Feb 1, 2021

Machine Learning in Materials Science参考文献 42被引用 30

一句话总结

GraphDF 引入一种用于分子图生成的离散潜变量流，使用可逆模移变换，在生成与优化任务上相对于现有方法实现更优的性能。

ABSTRACT

We consider the problem of molecular graph generation using deep models. While graphs are discrete, most existing methods use continuous latent variables, resulting in inaccurate modeling of discrete graph structures. In this work, we propose GraphDF, a novel discrete latent variable model for molecular graph generation based on normalizing flow methods. GraphDF uses invertible modulo shift transforms to map discrete latent variables to graph nodes and edges. We show that the use of discrete latent variables reduces computational costs and eliminates the negative effect of dequantization. Comprehensive experimental results show that GraphDF outperforms prior methods on random generation, property optimization, and constrained optimization tasks.

研究动机与目标

结合离散数据表示和化学规则来推动分子图生成的研究。
提出一个用于图生成的离散潜变量流框架。
实现无需去量化和雅可比行列式计算的高效生成。
通过键价检查和自回归结构来确保化学有效性。
通过随机生成和优化实验来验证方法的有效性。

提出的方法

将图表示为按顺序的节点和边生成步骤，并使用离散潜变量。
对节点和边分别使用多项式分布的潜变量 z_i 和 z_ij。
应用离散模移变换 q(z) = (z + mu) mod t 将潜变量映射到图元素。
通过一个共享的关系型 GCN（以生成的子图为条件）计算 mu_i^d 和 mu_ij^d。
通过带离散可逆映射的最大似然训练；推理采用 BFS 排序和离散逆变换。
可选地使用强化学习（PPO）进行属性优化和约束优化的微调。

实验结果

研究问题

RQ1离散潜变量流能否准确建模分子图的分布，避免去量化引入的失真？
RQ2在分子图生成任务中，离散流模型是否优于连续潜变量流模型？
RQ3通过 GCN 条件引入图结构信息如何影响生成质量和化学有效性？
RQ4与最先进基线相比，GraphDF 在属性优化和约束优化基准上的影响如何？

主要发现

GraphDF 在多个数据集上的若干分子生成任务中优于现有方法。
在报告的结果中，该模型在随机生成实验中实现了 100% 的有效性和重建率。
使用模移流的离散潜变量通过避免雅可比计算降低计算成本，并消除了去量化相关问题。
带有价数检查的顺序自回归生成有助于确保化学有效性和输出多样性。
GraphDF 在属性优化（Penalized logP 和 QED）以及在相似性约束下的约束优化方面表现出色。
该方法在超出分子图的通用图数据上也体现出竞争力。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。