[논문 리뷰] SynFlowNet: Design of Diverse and Novel Molecules with Synthesis Constraints
SynFlowNet은 반응 기반 액션 공간을 갖춘 GFlowNet을 사용하여 합성 가능 분자를 생성하고 높은 다양성과 바람직한 약물 유사 특성을 달성합니다. 다양성을 유지하면서 합성 가능성 측면에서 파편 기반 GFlowNets보다 우수합니다.
Generative models see increasing use in computer-aided drug design. However, while performing well at capturing distributions of molecular motifs, they often produce synthetically inaccessible molecules. To address this, we introduce SynFlowNet, a GFlowNet model whose action space uses chemical reactions and purchasable reactants to sequentially build new molecules. By incorporating forward synthesis as an explicit constraint of the generative mechanism, we aim at bridging the gap between in silico molecular generation and real world synthesis capabilities. We evaluate our approach using synthetic accessibility scores and an independent retrosynthesis tool to assess the synthesizability of our compounds, and motivate the choice of GFlowNets through considerable improvement in sample diversity compared to baselines. Additionally, we identify challenges with reaction encodings that can complicate traversal of the MDP in the backward direction. To address this, we introduce various strategies for learning the GFlowNet backward policy and thus demonstrate how additional constraints can be integrated into the GFlowNet MDP framework. This approach enables our model to successfully identify synthesis pathways for previously unseen molecules.
연구 동기 및 목표
- 합성 경로를 보장하는 합성 인식 신규 분자 설계에 대한 동기를 부여한다.
- 문서화된 화학 반응과 구입 가능한 반응물로 구성된 액션 공간을 가진 GFlowNet 프레임워크를 제안한다.
- 합성 제약 생성이 경쟁력 있거나 우수한 합성 가능성 및 품질 지표를 산출함을 입증한다.
- 다양성, SA/QED, 및 합성 경로 측면에서 반응 기반 액션 공간과 파편 기반 GFlowNets를 비교한다.
제안 방법
- 화학 반응과 반응물을 통해 분자를 구성하기 위해 다섯 가지 순방향 액션 타입(Stop, AddFirstReactant, ReactUni, ReactBi, AddReactant)을 정의한다.
- 반응을 SMARTS 템플릿으로 표현하고 미리 계산된 마스크를 사용하여 호환성을 보장한다.
- 그래프 트랜스포머와 각 액션 타입별로 분리된 MLP를 사용하여 순방향 및 역방향 정책을 매개변수화한다.
- 상태 흐름과 정책을 학습하기 위해 궤적 균형 목표로 학습한다.
- 사전에 학습된 프록시 모델로부터 예측된 sEH 결합 에너지에 비례하는 보상을 사용하고 온도 매개변수 beta로 보상 조절을 적용한다.
- QED, SA 점수, SCScore, 리간드 효율성, 타당성, 고유성 및 다양성으로 평가하고 AiZynthFinder 레트로합성 검증을 추가로 사용한다.

실험 결과
연구 질문
- RQ1화학 반응 주도 액션 공간에서 학습된 GFlowNet이 파편 기반 액션 공간과 비교할 만한 보상과 다양성을 가진 분자를 생성할 수 있는가?
- RQ2반응 기반 액션 공간이 SA/SC 점수 및 역합성 도구로 평가했을 때 생성 분자의 합성 가능성을 향상시키는가?
주요 결과
- SynFlowNet은 파편 기반 GFlowNet보다 더 나은 SA 및 SC 점수와 더 나은 QED 점수를 달성한다.
- SynFlowNet은 평균적으로 더 높은 리간드 효율을 달성한다.
- 쌍별 Tanimoto 다양성(Morgan 지문)은 0.81로, 제약된 액션 공간에도 불구하고 다양성이 유지됨을 나타낸다.
- AiZynthFinder 레트로합성 검증에서 SynFlowNet 분자의 47%가 성공 경로를 가졌으며 파편 GFlowNet은 0%였다.
- SynFlowNet 분자는 sEH 타겟에 대해 QED를 제외한 네 가지 지표에서 ChEMBL 활성 물질과 일치한다.
- SynFlowNet은 합성 인지 생성 가능성을 가능하게 하며 상위 분자 중 약 절반이 합성 가능한 경로를 가진다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.