Skip to main content
QUICK REVIEW

[論文レビュー] Generating 3D Molecular Structures Conditional on a Receptor Binding Site with Deep Generative Models

Tomohide Masuda, Matthew Ragoza|arXiv (Cornell University)|Oct 16, 2020
Computational Drug Discovery Methods参考文献 38被引用数 26
ひとこと要約

本論文は、変分オートエンコーダーと畳み込みニューラルネットワークを用いて、3D受容体結合部位を条件として、3D分子構造を生成する初めての深層生成モデルを提示する。受容体とリガンドの原子密度グリッドを別々の潜在空間に符号化し、デコーダーによって新しいリガンドの原子密度を生成し、これらの密度に離散的原子を適合させることで、妥当で一意の分子を生成する。生成された分子は、潜在空間におけるシード構造に近いほど結合親和性が向上する。

ABSTRACT

Deep generative models have been applied with increasing success to the generation of two dimensional molecules as SMILES strings and molecular graphs. In this work we describe for the first time a deep generative model that can generate 3D molecular structures conditioned on a three-dimensional (3D) binding pocket. Using convolutional neural networks, we encode atomic density grids into separate receptor and ligand latent spaces. The ligand latent space is variational to support sampling of new molecules. A decoder network generates atomic densities of novel ligands conditioned on the receptor. Discrete atoms are then fit to these continuous densities to create molecular structures. We show that valid and unique molecules can be readily sampled from the variational latent space defined by a reference `seed' structure and generated structures have reasonable interactions with the binding site. As structures are sampled farther in latent space from the seed structure, the novelty of the generated structures increases, but the predicted binding affinity decreases. Overall, we demonstrate the feasibility of conditional 3D molecular structure generation and provide a starting point for methods that also explicitly optimize for desired molecular properties, such as high binding affinity.

研究の動機と目的

  • 2D分子生成やバーチャルスクリーニングの限界を克服し、3D受容体結合部位を条件として3D分子構造を生成する深層生成モデルを開発すること。
  • 構造的に多様でありながら、標的タンパク質に効果的に結合する新規のドラッグライク分子を条件付きで生成できることを可能にすること。
  • 既存の生成モデルが主に2D表現やリガンドの性質に依存しているのに対し、3D構造的条件付けの欠如を是正すること。
  • 受容体の幾何学的形状に条件づけられた学習された潜在空間から、妥当な3D分子構造を生成可能であることを示すこと。
  • 潜在空間における参照シード構造から離れるに従って、分子の新規性と予測された結合親和性のトレードオフを調査すること。

提案手法

  • 受容体およびリガンドの両方の入力表現として3D原子密度グリッドを用い、分子幾何学の空間的符号化を可能にする。
  • 受容体およびリガンドのための別々のエンコーダーとデコーダーを持つ条件付き変分オートエンコーダー(VAE)を採用し、分離された潜在表現を学習する。
  • 複数の空間スケールで構造的情報を伝達するために、受容体エンコーダーからデコーダーへのスキップ接続を導入する。
  • 連続的な原子密度グリッドを離散的で妥当な3D分子構造に変換する、新しい原子適合およびボンド追加アルゴリズムを適用する。
  • 生成された原子密度グリッドと実際のグリッドを区別するためのGANディスクライマーを訓練し、生成されたリガンド密度の現実性を向上させる。
  • 生成された分子の結合親和性を予測するためのディープニューラルネットワーク(gnina)を用い、生成構造の評価を可能にする。

実験結果

リサーチクエスチョン

  • RQ1深層生成モデルは、3D受容体結合部位を条件として、妥当な3D分子構造を生成できるか?
  • RQ2潜在空間における参照シード構造から離れるに従って、生成された分子の多様性はどのように変化するか?
  • RQ3生成された分子が、受容体結合部位と有益な相互作用を維持する程度はどの程度か?
  • RQ4モデルは、新規なスケルトンを生成しつつ、ドラッグライク性と妥当な結合親和性を保持できるか?
  • RQ5潜在空間に受容体情報を組み込むことで、生成されたリガンドの品質と妥当性はどのように向上するか?

主な発見

  • 本モデルは、平均して80%を超える妥当性率を達成し、生成された分子の多くが一意である。
  • 参照シード構造に近い位置でサンプリングされた分子は、予測された結合親和性が向上し、シードと同程度のサイズとスケルトンを維持する。
  • サンプリングのばらつきが増すにつれて、分子の新規性は上昇するが、予測された結合親和性は低下し、変動要因が高くなるとTanimoto係数が0.5未満に低下する。
  • 変動要因が5.0の場合、生成された分子はシードとTanimoto係数約0.2にまで低下し、完全な構造的分岐を示す。
  • 疎水性で溶媒にアクセスできない結合部位を有する受容体は、低分子量のトポロジカル極性表面積(TPSA)を持つリガンドを生成するが、露出した部位は高いTPSAを持つ分子を生成する。
  • シード構造なしに生成された分子は、化学的構造および結合モードの両面で完全に異なるため、シードが生成をガイドする役割を果たしていることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。