QUICK REVIEW

[論文レビュー] Latent Molecular Optimization for Targeted Therapeutic Design

Tristan Aumentado‐Armstrong|arXiv (Cornell University)|Sep 5, 2018

Computational Drug Discovery Methods参考文献 50被引用数 38

ひとこと要約

本論文は、グラフニューラルネットワークと変分オートエンコーダーを用いて、タンパク質の結合部位とリガンドを連続的ベクトル空間に埋め込むことで、高親和性で薬物様性を持つ分子を勾配ベース最適化可能な潜在的分子最適化フレームワークを提案する。この手法は、ランダムなリガンドと比較して顕著に優れた結合親和性予測を達成しており、ドッキング検証において92.9％の最適化リガンドがランダムな対応物を上回った。

ABSTRACT

We devise an approach for targeted molecular design, a problem of interest in computational drug discovery: given a target protein site, we wish to generate a chemical with both high binding affinity to the target and satisfactory pharmacological properties. This problem is made difficult by the enormity and discreteness of the space of potential therapeutics, as well as the graph-structured nature of biomolecular surface sites. Using a dataset of protein-ligand complexes, we surmount these issues by extracting a signature of the target site with a graph convolutional network and by encoding the discrete chemical into a continuous latent vector space. The latter embedding permits gradient-based optimization in molecular space, which we perform using learned differentiable models of binding affinity and other pharmacological properties. We show that our approach is able to efficiently optimize these multiple objectives and discover new molecules with potentially useful binding properties, validated via docking methods.

研究の動機と目的

創薬における標的分子設計の課題に取り組むこと。具体的には、特定のタンパク質標的に高い結合親和性を示し、望ましい薬理的特性を有する分子を生成することを目的とする。
従来の手法における離散的化学空間と微分不能なスコア関数の制限を克服し、学習済み潜在空間における連続的で勾配ベースの最適化を可能にすること。
各新しい標的に向けた膨大な生化学的データを必要とせず、既存のタンパク質-リガンド複合体データから一般化可能で、タンパク質結合部位の転送可能な表現を活用すること。
結合親和性および内在的分子特性（例：薬物様性、毒性）の微分可能モデルを学習することで、デ・ノボ分子設計の効率性と有効性を向上させること。
シミュレートされたドッキングを用いて、最適化された分子が予測された結合親和性においてランダムなリガンドを上回ることを検証すること。

提案手法

グラフ畳み込みネットワーク（GCN）が、残留物と原子のグラフとして扱うことで、3次元タンパク質結合部位をベクトルシグネチャPに符号化する。
ジョイントツリー変分オートエンコーダー（JTVAE）が、リガンドのSMILES文字列を連続的潜在ベクトルCに埋め込み、分子構造の微分可能操作を可能にする。
3つの微分可能なニューラルネットワークを学習する：直接マッパー（P → C）、結合親和性推定器（C, P → B）、特性回帰器（C → 薬物様性、毒性、合成容易性）。
学習済みモデルに従い、標的部位の埋め込みPと多目的損失関数を用いて、潜在的化学空間（C）における勾配ベース最適化を実行する。
最適化プロセスは、予測された親和性と薬理的スコアからの勾配を逆伝播させることで、潜在ベクトルCを精緻化する新しい分子を生成する。
rDockを用いたドッキングシミュレーションにより、最適化リガンドとJTVAE事前分布からのランダムサンプルを比較することで、予測された結合親和性を検証する。

実験結果

リサーチクエスチョン

RQ1タンパク質結合部位とリガンドの潜在的表現が、効果的で勾配ベースの最適化を可能にするか？
RQ2結合親和性と薬理的特性の微分可能モデルが、有効に学習され、連続的潜在空間における分子最適化を効果的にガイドできるか？
RQ3既存のタンパク質-リガンド複合体データから得た知識を活用することで、各標的に対して膨大な特化データを必要とせずに、複数のタンパク質標的へ一般化可能か？
RQ4ドッキングシミュレーションによる検証において、最適化された分子がランダムなリガンドよりも顕著に優れた予測された結合親和性を達成できるか？
RQ5この手法は、望ましい薬物様性を維持しつつ、どの程度結合親和性を向上させることができるか？

主な発見

961件のテストケースのうち631件（65.7％）で、最適化リガンドのDSXスコアがランダムな対応物を下回り（強い結合を示す）、予測された親和性の向上が確認された。
DSX < -100（強い結合を示す）ドッキング複合体においては、477件の最適化リガンドのうち443件がランダム対応物を上回り、この高親和性サブセットでは92.9％の成功率を示した。
全ケースにおいて、ランダムと最適化リガンドのDSXスコア差（Δ）の中央値は14.5、平均は9.3、標準偏差は51.5であった。
高親和性サブセット（DSX < -100）では、Δの中央値は35.4、平均は36.4、標準偏差は26.3であり、結合予測における顕著で一貫した改善が示された。
この手法は、ランダムな分子よりも顕著に既知のバインダーに類似した構造的特徴を有する分子を生成でき、構造的関連性の向上を示唆した。
最適化中にドッキングを必要としないように、微分可能なスコア関数を学習することで、効率的なエンドツーエンドの学習と最適化を実現した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。