QUICK REVIEW

[論文レビュー] Synthesizable Molecular Generation via Soft-constrained GFlowNets with Rich Chemical Priors

Hyeonah Kim, Minsu Kim|arXiv (Cornell University)|Feb 4, 2026

Machine Learning in Materials Science被引用数 0

ひとこと要約

S3-GFNは、事前学習済みSMILES priorを用いた contrastive replay により、SMILESベースのGFlowNetsにソフト制約を課し、高報酬・合成可能な分子を生成する。

ABSTRACT

The application of generative models for experimental drug discovery campaigns is severely limited by the difficulty of designing molecules de novo that can be synthesized in practice. Previous works have leveraged Generative Flow Networks (GFlowNets) to impose hard synthesizability constraints through the design of state and action spaces based on predefined reaction templates and building blocks. Despite the promising prospects of this approach, it currently lacks flexibility and scalability. As an alternative, we propose S3-GFN, which generates synthesizable SMILES molecules via simple soft regularization of a sequence-based GFlowNet. Our approach leverages rich molecular priors learned from large-scale SMILES corpora to steer molecular generation towards high-reward, synthesizable chemical spaces. The model induces constraints through off-policy replay training with a contrastive learning signal based on separate buffers of synthesizable and unsynthesizable samples. Our experiments show that S3-GFN learns to generate synthesizable molecules ($\geq 95\%$) with higher rewards in diverse tasks.

研究の動機と目的

湿板実験の検証に資する新規分子設計を動機づける。
化学的に妥当で合成可能な空間へ生成を誘導する大規模なSMILES priorを活用する。
制約適用をスカラー報酬から分離するソフト正則化フレームワークを導入する。
さまざまな設計タスクと制約更新に対して堅牢な性能を示す。

提案手法

化学的事前知識としてGP-MolFormerを事前学習済みSMILES言語モデルとして出発点とする。
相対的軌道平衡を用いた後訓練のGFlowNet目的を用いて、合成可能空間X′内で事後分布p(x) ∝ R(x) p_prior(x)を学習する。
オフポリシー学習を支えるため、合成可能（陽性）サンプルと非合成可能（陰性）サンプルの2つのリプレイバッファを維持する。
リプレイ訓練中に陽性に対して陰性軌道を抑制する対比補助損失（L_aux）を導入する。
陽性サンプルにはオンポリシーのRTB更新を適用し、陽性と陰性領域を分離する対比更新をリプレイベースで行う。
リプレイバッファを豊富にし効率を高めるために、突然変異や遺伝的探索などの外部探索演算子を有効にする。

実験結果

リサーチクエスチョン

RQ1ソフト制約付きのSMILESベース生成は、ハードな反応ベースMDPを用いずに高い合成可能性を達成できるか。
RQ2対比リプレイによる分布正則化は、合成可能領域内のサンプリングマスにどのような影響を与えるか。
RQ3豊富なSMILES priorを用いた後訓練は、望ましい化学特性を保持しつつ合成可能な分子の報酬を高めるか。
RQ4制約変更はモデルの頑健性にどう影響し、どの程度早く新しい合成制約へ再調整できるか。
RQ5構造ベースのドッキングおよび retrosynthesis検証におけるS3-GFNの性能は、反応ベースのGFlowNetsと比べてどうか。

主な発見

S3-GFNは、他の分子設計タスクにおいても競争力のある報酬を維持しつつ合成可能性率を95%超で達成する。
対比補助損失は合成可能領域内の確率質量を効果的に集中させ、非合成可能領域を抑制する。
S3-GFNはpriorから継承した薬物様性を維持しつつ、Top-100のsEH報酬を高める。
構造ベースのドッキングタスクでは、S3-GFNは複数の反応ベースのベースラインより平均Vinaスコアが低く、AiZynthFinderの成功率が高い。
制約が変化してもS3-GFNは陽性比と一意性を高く保ち、報酬整形ベースラインより再調整が速い。
外部探索を伴うサンプル数が限られた設定でも、S3-GFNは非-GFNベースラインと比較してTop-10のAUCを競合または上回り、遺伝的探索により性能が向上する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。