[論文レビュー] DiffBP: Generative Diffusion of 3D Molecules for Target Protein Binding
DiffBP は対象タンパク質を条件として完全原子・非自己回帰拡散モデルを用いて3D分子構造を生成し、結合親和性の向上と現実的な薬物様性を目指す。
Generating molecules that bind to specific proteins is an important but challenging task in drug discovery. Previous works usually generate atoms in an auto-regressive way, where element types and 3D coordinates of atoms are generated one by one. However, in real-world molecular systems, the interactions among atoms in an entire molecule are global, leading to the energy function pair-coupled among atoms. With such energy-based consideration, the modeling of probability should be based on joint distributions, rather than sequentially conditional ones. Thus, the unnatural sequentially auto-regressive modeling of molecule generation is likely to violate the physical rules, thus resulting in poor properties of the generated molecules. In this work, a generative diffusion model for molecular 3D structures based on target proteins as contextual constraints is established, at a full-atom level in a non-autoregressive way. Given a designated 3D protein binding site, our model learns the generative process that denoises both element types and 3D coordinates of an entire molecule, with an equivariant network. Experimentally, the proposed method shows competitive performance compared with prevailing works in terms of high affinity with proteins and appropriate molecule sizes as well as other drug properties such as drug-likeness of the generated molecules.
研究の動機と目的
- タンパク質結合部位を条件とした非自己回帰で物理学的に一貫した分子生成を動機づける。
- エネルギーに基づく結合分布推論を用いて、逐次的生成ステップではなく全原子分子構造をモデル化する。
- 3D幾何対称性を尊重するためにSE(3) 等変性と質量中心制約を適用する。
- 結合親和性と薬物様性の点で最先端の自動回帰法とDiffBPを比較評価する。
提案手法
- 完全原子分子の連続座標と離散原子タイプに対する拡散モデルを用いて p(M|P) を定式化する。
- デノイザーとしてSE(3)-等変性グラフニューラルネットワークを用い、復元された座標と原子タイプを予測する。
- 並進不変性を保証するためにゼロ中心質量制約を適用し、回転不変性は拡散プロセスに任せる。
- 生成時に分子とタンパク質表面の重なりを抑制する交差正則化損失を組み込む。
- 拡散入力を安定化させるために事前生成GNNを用いて分子サイズと質量中心を事前生成する。
実験結果
リサーチクエスチョン
- RQ1非自己回帰の拡散モデルはターゲットタンパク質結合部位を条件として全原子分子を生成できるか?
- RQ2SE(3) 等変性とCoM(質量中心)制約を課すことは、物理的妥当性とドッキング性能を改善するか?
- RQ3生成された分子はサイズ分布、親和性、薬物様性の観点で自動回帰ベースラインとどのように比較されるか?
- RQ4交差正則化項が分子の有効性とドッキング品質に与える影響は?
- RQ5拡散ベースのアプローチは薬物様分布近傍で有利な化学特性(QED, SA, LPSK, etc.)などを持つ分子を生み出すか?
主な発見
- DiffBP は主要な自動回帰法と比較して結合親和性スコアで競争力を示しつつ、サイズがバランスの取れた分子(大半が中程度のサイズ)と有利な薬物様性を持つ分子を生成する。
- 質量中心と等変性デノイジングを通じてSE(3)不変性を維持し、物理的に妥当な3D構造を実現する。
- DiffBP は自己回帰生成に共通する早期打ち切り問題を回避し、薬物様レンジに沿ったより広い分子サイズ分布を生み出す。
- 交差正則化項を組み込むと分子の有効性とドッキング性能が向上する。
- ベースラインと比較して、DiffBP は競争力のある QED、SA、LPSK スコアを示し、サイズ群によって利点が異なる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。