[논문 리뷰] Synthesizable Molecular Generation via Soft-constrained GFlowNets with Rich Chemical Priors
S3-GFN은 사전 학습된 SMILES 선행 정보를 이용한 대비 재생을 통해 SMILES 기반 GFlowNets에서 합성 가능성을 소프트 제약으로 유도하고, 고보상이며 합성 가능한 분자를 생성한다.
The application of generative models for experimental drug discovery campaigns is severely limited by the difficulty of designing molecules de novo that can be synthesized in practice. Previous works have leveraged Generative Flow Networks (GFlowNets) to impose hard synthesizability constraints through the design of state and action spaces based on predefined reaction templates and building blocks. Despite the promising prospects of this approach, it currently lacks flexibility and scalability. As an alternative, we propose S3-GFN, which generates synthesizable SMILES molecules via simple soft regularization of a sequence-based GFlowNet. Our approach leverages rich molecular priors learned from large-scale SMILES corpora to steer molecular generation towards high-reward, synthesizable chemical spaces. The model induces constraints through off-policy replay training with a contrastive learning signal based on separate buffers of synthesizable and unsynthesizable samples. Our experiments show that S3-GFN learns to generate synthesizable molecules ($\geq 95\%$) with higher rewards in diverse tasks.
연구 동기 및 목표
- 실험실 실험 검증을 위한 합성 가능 화합물을 생성하는 신합성 분자 설계에 대한 동기를 부여한다.
- 화학적으로 타당하고 합성 가능 공간으로의 생성을 이끌기 위해 대규모 SMILES 선행 정보를 활용한다.
- 제약 강제화와 스칼라 보상을 분리하는 소프트 정규화 프레임워크를 도입한다.
- 다양한 설계 작업과 제약 업데이트에 걸쳐 견고한 성능을 입증한다.
제안 방법
- 화학 선행으로서 사전 학습된 SMILES 언어 모델(GP-MolFormer)에서 시작한다.
- 합성 가능 공간 X′ 내에서 p(x) ∝ R(x) p_prior(x)를 학습하기 위해 상대 궤적 균형을 갖는 사후 GFlowNet 목표를 사후 학습에 사용한다.
- 오프 폴리시 학습을 지원하기 위해 합성 가능(양의) 샘플과 비합성 가능(음의) 샘플용 두 개의 재생 버퍼를 유지한다.
- 리플레이 학습 중 양의 궤적에 비해 음의 궤적을 억제하는 대비 보조 손실(L_aux)을 도입한다.
- 양의 샘플에 대해 온-폴리시 RTB 업데이트를 적용하고, 양성/음성 구역을 분리하기 위해 재생 기반 대비 업데이트를 적용한다.
- 재생 버퍼를 풍부하게 하고 효율성을 높이기 위해 돌연변이, 유전적 검색 등 외부 탐색 연산자를 활성화한다.
실험 결과
연구 질문
- RQ1소프트 제약이 있는 SMILES 기반 생성이 하드 반응 기반 MDP 없이도 높은 합성 가능성을 달성할 수 있는가?
- RQ2대비 재생을 통한 분포 규제가 합성 가능 영역 내 샘플링 질량에 어떤 영향을 미치는가?
- RQ3풍부한 SMILES 선행 정보를 활용한 사후 학습이 합성 가능 분자에 대한 보상을 증가시키면서도 바람직한 화학적 특성을 보존하는가?
- RQ4제약 변화가 모델의 견고성에 어떤 영향을 미치며 모델이 새로운 합성 제약에 얼마나 빨리 재조정될 수 있는가?
- RQ5구조 기반 도킹 및 레트로합성 검증에서 반응 기반 GFlowNets와 비교하여 S3-GFN의 성능은 어떠한가?
주요 결과
- S3-GFN은 분자 설계 과제 전반에서 경쟁력 있는 보상을 유지하면서 합성 가능성 비율이 95%를 상회한다.
- 대비 보조 손실은 합성 가능 영역 내 확률 질량을 효과적으로 집중시키고 비합성 가능 영역을 억제한다.
- S3-GFN은 상위 100개 sEH 보상을 더 높게 얻고 선행 정보로부터 물려받은 약물 유사 특성(QED 등)을 유지한다.
- 구조 기반 도킹 작업에서 S3-GFN은 더 낮은(더 나은) 평균 Vina 스코어와 더 높은 AiZynthFinder 성공률을 달성한다.
- 제약이 변할 때 S3-GFN은 더 높은 양의 비율과 고유성을 보존하고 보상 형태 변경 기준선보다 더 빠르게 재정렬한다.
- 샘플 제한 환경에서 외부 탐색이 있을 때 S3-GFN은 비-GFN 기준선에 비해 AUC Top-10이 경쟁력 있거나 우수하며 유전적 탐색으로 성능이 향상된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.