[論文レビュー] Generating 3D Molecules for Target Protein Binding
GraphBP は、等変な局所座標系とフロー型生成を用いて、連続的な3D空間内に原子を順次配置することで、特定のタンパク質結合部位に結合する3D分子を生成します。
A fundamental problem in drug discovery is to design molecules that bind to specific proteins. To tackle this problem using machine learning methods, here we propose a novel and effective framework, known as GraphBP, to generate 3D molecules that bind to given proteins by placing atoms of specific types and locations to the given binding site one by one. In particular, at each step, we first employ a 3D graph neural network to obtain geometry-aware and chemically informative representations from the intermediate contextual information. Such context includes the given binding site and atoms placed in the previous steps. Second, to preserve the desirable equivariance property, we select a local reference atom according to the designed auxiliary classifiers and then construct a local spherical coordinate system. Finally, to place a new atom, we generate its atom type and relative location w.r.t. the constructed local coordinate system via a flow model. We also consider generating the variables of interest sequentially to capture the underlying dependencies among them. Experiments demonstrate that our GraphBP is effective to generate 3D molecules with binding ability to target protein binding sites. Our implementation is available at https://github.com/divelab/GraphBP.
研究の動機と目的
- ターゲットタンパク質結合部位を条件として3D分子を生成することで、構造ベースの創薬につなぐ。
- 生成過程で3Dの幾何学的構造と化学相互作用の両方を捉える。
- 3D空間を離散化することなく連続的な原子配置を可能にしつつ、変換の等変性を維持する。
- 連続生成を通じて原子種と空間座標間の依存関係をモデル化する。
提案手法
- タンパク質-リガンド複合体を成長中の3Dグラフとして表現し、文脈を3D GNNでエンコードする。
- 補助分類器を用いて局所的な参照原子を選択し、等変配置のための局所的な球座標系を構築する。
- 自己回帰フローモデルを用いて原子種と相対位置(d, theta, phi)を生成し、新しい原子を配置する。
- 変数を逐次生成する(a_t, d_t, theta_t, phi_t)ことで、原子種と幾何学の依存関係を捉える。
- 原子配置尤度と補助分類器損失(L_ap, L_cc, L_fc)を含む結合目的関数で訓練する。
実験結果
リサーチクエスチョン
- RQ1GraphBP は、指定されたタンパク質結合部位に結合親和性を示す3D分子を生成できるか?
- RQ2局所座標系を伴う逐次生成は、剛体変換下で等変性を保持するか?
- RQ3構造ベースの創薬タスクにおける GraphBP の性能は LiGAN 系と比較してどうか?
- RQ4原子種と幾何学の依存関係を捉える上で、逐次生成の順序が与える影響は何か?
主な発見
- GraphBP は、ターゲット結合部位への結合親和性を持つ3D分子の生成において、ベースラインより高い性能を示す。
- 局所的な球座標系を構築して原子配置を行うことで等変性を保持する。
- 逐次生成は原子種と幾何学の依存関係を捉え、配置の品質を向上させる。
- 実験にはCrossDocked2020を用い、LiGAN-priorおよびLiGAN-posteriorのベースラインに対して有意な改善を示す。
- 原子は離散化された格子ではなく、任意の連続位置で生成され、柔軟な配置を可能にする。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。