[論文レビュー] Equivariant 3D-Conditional Diffusion Models for Molecular Linker Design
DiffLinkerを導入します。これはE(3)-等変な3D条件付き拡散モデルで、事前に結合点を定義する必要なく、任意の数の分子フラグメントをつなぐリンク原子を生成でき、必要に応じてタンパク質ポケットで条件付けします。
Fragment-based drug discovery has been an effective paradigm in early-stage drug development. An open challenge in this area is designing linkers between disconnected molecular fragments of interest to obtain chemically-relevant candidate drug molecules. In this work, we propose DiffLinker, an E(3)-equivariant 3D-conditional diffusion model for molecular linker design. Given a set of disconnected fragments, our model places missing atoms in between and designs a molecule incorporating all the initial fragments. Unlike previous approaches that are only able to connect pairs of molecular fragments, our method can link an arbitrary number of fragments. Additionally, the model automatically determines the number of atoms in the linker and its attachment points to the input fragments. We demonstrate that DiffLinker outperforms other methods on the standard datasets generating more diverse and synthetically-accessible molecules. Besides, we experimentally test our method in real-world applications, showing that it can successfully generate valid linkers conditioned on target protein pockets.
研究の動機と目的
- fragmentation-based drug design challenges を解決するために、任意の数のフラグメント間のリンク生成を実現する。
- データからリンク接続を学習して事前定義された attachment points を不要にする。
- 3Dポケット情報を取り入れて化学的に妥当でポケット適合のリンクを生成する。
- リンク生成における化学的関連性、合成容易性、多様性で最先端を達成する。
- ポケット条件付けを伴う現実の構造ベースドラッグデザインシナリオへの適用性を示す。
提案手法
- DiffLinkerを提案します。これは、入力フラグメントと任意のタンパク質ポケットからなるコンテキストuを含む、3D原子点群上で動作する条件付き拡散モデルです。
- 学習可能なデノising関数 φとしてE(3)-等変グラフニューラルネットワーク(EGNN)を用い、リンク原子座標と原子タイプをノイズ除去するノイズを予測します。
- 等変性を定義します:もし f が O(3)-等変で、φ が z_t と u の結合変換に対して等変であれば、p(z_0|u) は O(3)-等変となる。
- リンクノードを更新し、コンテキストノードは固定のまま、z_t と固定コンテキストuを単一のグラフで同時にモデル化します。これにより、コンテキストの重心を中心に配置して並進不変性を確保します。
- 別に訓練したGNNを用いてリンクサイズを予測し、学習された分布からリンクサイズをサンプルします。
- オプションでポケット原子をuに含め、4 Åの距離カットオフを適用してグラフ密度を低減し、衝突を考慮した生成を可能にします。
実験結果
リサーチクエスチョン
- RQ1E(3)-等変拡散モデルは、明示的な attachment point 指定なしに任意数の入力フラグメントのリンクを生成できるか?
- RQ2ポケット情報で条件付けすると、リンク生成の衝突を減らし、薬物設計関連指標(QED、SAなど)を改善できるか?
- RQ32つ以上のフラグメントを結ぶ場合に、標準ベンチマークでDiffLinkerは既存手法(DeLinker、3DLinker)に対してどの程度新規性・再現性・適合性を示すか?
- RQ4モデルは新規性と多様性を改善するためにリンクサイズを選択的にサンプルできるか?コア指標の損失を最小限に抑えつつ?
- RQ5現実的なポケット制約を伴う構造ベース薬物設計アプリケーションで実用的か?
主な発見
| Dataset | Method | QED ↑ | SA ↓ | # Rings ↑ | Valid, % | Unique, % | Novel, % |
|---|---|---|---|---|---|---|---|
| ZINC | DeLinker + ConfVAE + MMFF | 0.64 | 3.11 | 0.21 | 98.3 | 44.2 | 47.1 |
| ZINC | 3DLinker (given anchors) | 0.65 | 3.11 | 0.23 | 99.3 | 29.0 | 41.2 |
| ZINC | 3DLinker | 0.65 | 3.14 | 0.24 | 71.5 | 29.2 | 41.9 |
| ZINC | DiffLinker | 0.68 | 3.01 | 0.25 | 93.8 | 24.0 | 30.3 |
| ZINC | DiffLinker (given anchors) | 0.68 | 3.03 | 0.26 | 97.6 | 22.7 | 32.4 |
| ZINC | DiffLinker (sampled size) | 0.65 | 3.19 | 0.32 | 90.6 | 51.4 | 42.9 |
| ZINC | DiffLinker (given anchors, sampled size) | 0.65 | 3.24 | 0.36 | 94.8 | 50.9 | 47.7 |
| CASF | DeLinker + ConfVAE + MMFF | 0.35 | 4.05 | 0.35 | 95.7 | 51.6 | 55.6 |
| CASF | DiffLinker | 0.41 | 4.00 | 0.34 | 85.3 | 40.5 | 41.8 |
| CASF | DiffLinker (given anchors) | 0.40 | 4.03 | 0.38 | 90.2 | 37.3 | 48.4 |
| CASF | DiffLinker (sampled size) | 0.40 | 4.06 | 0.30 | 63.7 | 60.0 | 49.3 |
| CASF | DiffLinker (given anchors, sampled size) | 0.40 | 4.10 | 0.38 | 68.4 | 57.1 | 56.9 |
| GEOM | 3DLinker | 0.36 | 3.56 | 0.00 | 16.3 | 73.7 | — |
| GEOM | DiffLinker | 0.48 | 2.99 | 0.75 | 94.0 | 34.7 | 68.6 |
| GEOM | DiffLinker (given anchors) | 0.49 | 3.01 | 0.79 | 94.0 | 35.0 | 68.4 |
| GEOM | DiffLinker (sampled size) | 0.45 | 3.27 | 0.75 | 87.2 | 62.4 | 76.0 |
| GEOM | DiffLinker (given anchors, sampled size) | 0.46 | 3.33 | 0.83 | 88.8 | 63.6 | 76.0 |
- DiffLinkerはZINCおよびCASFベンチマークで、基準法と比較してQEDを高く、SAおよび環数を競合的に示す。
- DiffLinkerは高い有効性と顕著な多様性を示し、真のリンクに対するSC_RDKit類似性が向上。
- リンクサイズをサンプリングすると新規性と独自性が改善され、主要指標への影響は小さい。
- GEOMで2つ以上のフラグメントへ拡張した場合、DiffLinkerは適合性と回復率で適応した3DLinkerを大きく上回り、より環を多く含むリンクを生成。
- ポケット条件付けされたDiffLinkerは、ターゲットポケットに対して衝突が最小限のリンクを生成可能で、全原子ポケット情報が提供されると特に顕著。
- DiffLinkerはポケット条件付けをサポートし、構造ベース薬物設計に適した現実的でポケット認識のあるリンクを生成。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。