Skip to main content
QUICK REVIEW

[論文レビュー] Multi-Objective De Novo Drug Design with Conditional Graph Generative Model

Yibo Li, Liangren Zhang|arXiv (Cornell University)|Jan 18, 2018
Computational Drug Discovery Methods参考文献 46被引用数 31
ひとこと要約

本論文は、原子レベルの再帰的ユニットに依存せずに、有効で複雑な分子構造を効率的に生成できる、順次的グラフ生成フレームワークを用いた多目的のデ・ノボ薬物設計のための条件付きグラフ生成モデルを提案している。SMILESベースのモデルに比べて有効性が高く、特定のスケルトン、薬物的適合性、合成可能性、およびJNK3とGSK3βの二重阻害を含む望ましい性質を持つ分子の豊度を高く生成する。

ABSTRACT

Recently, deep generative models have revealed itself as a promising way of performing de novo molecule design. However, previous research has focused mainly on generating SMILES strings instead of molecular graphs. Although current graph generative models are available, they are often too general and computationally expensive, which restricts their application to molecules with small sizes. In this work, a new de novo molecular design framework is proposed based on a type sequential graph generators that do not use atom level recurrent units. Compared with previous graph generative models, the proposed method is much more tuned for molecule generation and have been scaled up to cover significantly larger molecules in the ChEMBL database. It is shown that the graph-based model outperforms SMILES based models in a variety of metrics, especially in the rate of valid outputs. For the application of drug design tasks, conditional graph generative model is employed. This method offers higher flexibility compared to previous fine-tuning based approach and is suitable for generation based on multiple objectives. This approach is applied to solve several drug design problems, including the generation of compounds containing a given scaffold, generation of compounds with specific drug-likeness and synthetic accessibility requirements, as well as generating dual inhibitors against JNK3 and GSK3$β$. Results show high enrichment rates for outputs satisfying the given requirements.

研究の動機と目的

  • デ・ノボ薬物設計におけるSMILESベースの生成の限界を克服するため、原子レベルの再帰的ユニットに依存しない分子グラフ生成に移行する。
  • 既存のグラフモデルの計算的ボトルネックを克服し、より大きな分子を対象としたスケーラブルで効率的なグラフ生成モデルを開発する。
  • 多様な化学的および薬理的制約に基づいて、柔軟で多目的の分子生成を可能にする。
  • シーケンスベースのアプローチと比較して、生成された分子の有効性と化学的関連性を向上させる。
  • 実際の薬物設計タスク、特にスケルトンベースの生成や二重標的阻害剤生成において、本手法の有効性を実証する。

提案手法

  • 本手法は、原子レベルの再帰的ユニットに依存せず、原子を段階的に構築することで分子を生成する順次的グラフ生成器を採用し、トレーニングの効率性とスケーラビリティを向上させる。
  • 特定の目的(例:スケルトンの含意や望ましい物理化学的性質)に基づいて生成を誘導するため、条件付き変分オートエンコーダーの枠組みを用いる。
  • モデルは、ChEMBLデータベースの分子グラフからエンドツーエンドにトレーニングされ、大規模で複雑な分子の生成を可能にする。
  • 条件付き制御は、潜在空間の条件付けにより実装され、複数の目的に対して微調整を伴わずに柔軟な生成が可能になる。
  • フレームワークは、無条件生成と条件付き生成の両方をサポートし、ターゲット性質の学習済み潜在表現に基づいて推論が行われる。
  • グラフの有効性は、微分可能でグラフ構築プロセスにより強制され、生成中に無効な出力を最小限に抑える。

実験結果

リサーチクエスチョン

  • RQ1グラフ生成モデルは、SMILESベースのモデルに比べて、化学的に有効で多様な分子構造を効果的に生成できるか?
  • RQ2条件付きグラフ生成モデルは、特定のスケルトンや薬物的適合性といった複数の望ましい目的を持つ分子を効果的に生成できるか?
  • RQ3本モデルは、ChEMBLのような実際の薬物データベースに見られるような、より大きな分子や複雑な分子に対してもスケーラブルか?
  • RQ4JNK3とGSK3βという2つの関連する標的に対して、二重阻害剤を高い豊度で生成できるか?
  • RQ5微調整ベースの手法と比較して、条件付き生成アプローチは、多目的薬物設計においてより柔軟性を提供するか?

主な発見

  • グラフベースのモデルは、SMILESベースのベースラインと比較して、生成された分子の有効性率が著しく高く、構造の忠実性に優れていることが示された。
  • 本モデルは、ターゲットスケルトン、薬物的適合性、合成可能性の高い分子を豊富に生成し、多目的設計における有効性を確認した。
  • JNK3とGSK3βに対する二重阻害剤生成において、本手法は高い豊度率を達成し、多効果薬物の発見における強い可能性を示した。
  • 本モデルは、ChEMBLデータベースからの構造を、従来多くのグラフ生成モデルが到達できなかった大規模分子に対しても効果的にスケーリングした。
  • 潜在空間の条件付けによる条件付き生成は、微調整ベースのアプローチを上回る柔軟性と性能を、多様な目的において示した。
  • 原子レベルの再帰的構造が存在しないため、複雑な分子グラフに対しても、高い生成効率と化学的有効性を維持した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。