[论文解读] Synthesizable Molecular Generation via Soft-constrained GFlowNets with Rich Chemical Priors
S3-GFN 将可合成性作为软约束引入基于 SMILES 的 GFlowNets,使用对比回放并以预训练的 SMILES 先验来生成高奖励、可合成的分子。
The application of generative models for experimental drug discovery campaigns is severely limited by the difficulty of designing molecules de novo that can be synthesized in practice. Previous works have leveraged Generative Flow Networks (GFlowNets) to impose hard synthesizability constraints through the design of state and action spaces based on predefined reaction templates and building blocks. Despite the promising prospects of this approach, it currently lacks flexibility and scalability. As an alternative, we propose S3-GFN, which generates synthesizable SMILES molecules via simple soft regularization of a sequence-based GFlowNet. Our approach leverages rich molecular priors learned from large-scale SMILES corpora to steer molecular generation towards high-reward, synthesizable chemical spaces. The model induces constraints through off-policy replay training with a contrastive learning signal based on separate buffers of synthesizable and unsynthesizable samples. Our experiments show that S3-GFN learns to generate synthesizable molecules ($\geq 95\%$) with higher rewards in diverse tasks.
研究动机与目标
- 推动从头设计分子以产生可用于湿实验验证的可合成化合物。
- 利用大规模 SMILES 先验引导生成进入化学上合理、可合成的空间。
- 引入软正则化框架,将约束执行与标量奖励分离。
- 在多样化设计任务和约束更新中展示鲁棒性能。
提出的方法
- 以经过训练的 SMILES 语言模型(GP-MolFormer)作为化学先验开始。
- 使用带相对轨迹平衡的后训练 GFlowNet 目标,在可合成空间 X′ 内学习后验 p(x) ∝ R(x) p_prior(x)。
- 为可合成(正样本)和不可合成(负样本)维护两个回放缓冲区,以支持离策略学习。
- 在回放训练中引入对比辅助损失(L_aux),抑制负轨迹相对于正轨迹的影响。
- 对正样本使用 on-policy RTB 更新,使用回放基础的对比更新来分离正负区域。
- 允许外部搜索算子(如变异、遗传搜索)以丰富回放缓冲区并提升效率。
实验结果
研究问题
- RQ1在没有硬反应基MDP的情况下,基于 SMILES 的带软约束的生成是否能实现高可合成性?
- RQ2通过对比回放进行分布正则化如何影响可合成区域内的采样质量?
- RQ3带有丰富 SMILES 先验的后训练是否能在提高可合成分子奖励的同时保持期望化学性质?
- RQ4约束的变化如何影响模型鲁棒性,模型多久能对新的合成约束重新对齐?
- RQ5与反应式 GFlowNets 比较,在结构基对接和逆合成验证方面,S3-GFN 的性能如何?
主要发现
- S3-GFN 在多种分子设计任务中实现了可合成性率超过 95%,同时保持具竞争力的奖励。
- 对比辅助损失在可合成区域内有效集中概率质量,并抑制不可合成区域。
- S3-GFN 产生更高的 Top-100 sEH 奖励,并保留来自先验的药物性属性(如 QED 等)。
- 在基于结构的对接任务中,S3-GFN 达到比若干基于反应的基线更低的平均 Vina 分数和更高的 AiZynthFinder 成功率。
- 当约束改变时,S3-GFN 保留更高的正样本比例和唯一性,且重新对齐速度快于奖励塑形基线。
- 在样本有限且存在外部探索时,S3-GFN 的 AUC Top-10 与非 GFN 基线相比具竞争力或更优,并在遗传探索下性能提升。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。