[論文レビュー] SynFlowNet: Design of Diverse and Novel Molecules with Synthesis Constraints
SynFlowNetは、反応ベースのアクション空間を持つGFlowNetを用いて合成可能な分子を生成し、多様性が高く薬物様特性にも好適。合成性の面でフラグメントベースのGFlowNetsを上回りつつ、多様性を維持する。
Generative models see increasing use in computer-aided drug design. However, while performing well at capturing distributions of molecular motifs, they often produce synthetically inaccessible molecules. To address this, we introduce SynFlowNet, a GFlowNet model whose action space uses chemical reactions and purchasable reactants to sequentially build new molecules. By incorporating forward synthesis as an explicit constraint of the generative mechanism, we aim at bridging the gap between in silico molecular generation and real world synthesis capabilities. We evaluate our approach using synthetic accessibility scores and an independent retrosynthesis tool to assess the synthesizability of our compounds, and motivate the choice of GFlowNets through considerable improvement in sample diversity compared to baselines. Additionally, we identify challenges with reaction encodings that can complicate traversal of the MDP in the backward direction. To address this, we introduce various strategies for learning the GFlowNet backward policy and thus demonstrate how additional constraints can be integrated into the GFlowNet MDP framework. This approach enables our model to successfully identify synthesis pathways for previously unseen molecules.
研究の動機と目的
- 合成経路を保証する合成意識を持つ新規分子設計を動機づける。
- 記載された化学反応と入手可能な試薬から構成されるアクション空間を持つGFlowNetフレームワークを提案する。
- 合成制約付き生成が競争力のあるまたは優れた合成性と品質指標をもたらすことを示す。
- 多様性、SA/QED、合成経路の観点から反応ベースアクション空間とフラグメントベースのGFlowNetを比較する。
提案手法
- 化学反応と反応物を用いて分子を構築するため、5つの正方向アクションタイプ(Stop, AddFirstReactant, ReactUni, ReactBi, AddReactant)を定義する。
- 反応をSMARTSテンプレートで表現し、適合性を保証するために事前計算済みマスクを使用する。
- 前方・後方ポリシーをグラフトランスフォーマーと各アクションタイプごとの別々のMLPでパラメータ化する。
- 軌跡バランス目的で訓練し、状態の流れとポリシーを学習する。
- 事前学習済み代理モデルから予測されたsEH結合エネルギーに比例した報酬を用い、β温度パラメータで報酬をモジュレーションする。
- QED、SAスコア、SCScore、リガンド効率、妥当性、独自性、多様性の評価に加え、AiZynthFinder逆合成検証を行う。

実験結果
リサーチクエスチョン
- RQ1化学反応主導のアクション空間で訓練されたGFlowNetは、フラグメントベースのアクション空間と同等またはそれ以上の報酬と多様性を持つ分子を生成できるか?
- RQ2反応ベースのアクション空間はSA/SCスコアと逆合成ツールによる評価で、生成分子の合成可能性を改善するか?
主な発見
- SynFlowNet はフラグメントベースの GFlowNet よりSAおよびSCスコアが高く、QEDスコアもより高い。
- SynFlowNet は平均してリガンド効率が高い。
- ペアワイズTanimoto多様性(Morgan指紋)は0.81で、制約されたアクション空間にもかかわらず多様性が維持されていることを示す。
- AiZynthFinderの逆合成では、SynFlowNet分子の47%が有効な経路を持つのに対し、フラグメントGFlowNetは0%だった。
- SynFlowNet分子はsEHターゲットに対してChEMBLアクティブと4つの指標で一致する(QEDを除く)。
- SynFlowNetは合成意識生成を可能にし、上位分子の約半数が実行可能な合成経路を持つ。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。