[論文レビュー] Protein Structure and Sequence Generation with Equivariant Denoising Diffusion Probabilistic Models
完全にデータ駆動の拡散モデルが大型タンパク質構造、配列、ロタマーを生成し、物理的に妥当でコンパクトなトポロジー制約の条件付けが可能。
Proteins are macromolecules that mediate a significant fraction of the cellular processes that underlie life. An important task in bioengineering is designing proteins with specific 3D structures and chemical properties which enable targeted functions. To this end, we introduce a generative model of both protein structure and sequence that can operate at significantly larger scales than previous molecular generative modeling approaches. The model is learned entirely from experimental data and conditions its generation on a compact specification of protein topology to produce a full-atom backbone configuration as well as sequence and side-chain predictions. We demonstrate the quality of the model via qualitative and quantitative analysis of its samples. Videos of sampling trajectories are available at https://nanand2.github.io/proteins .
研究の動機と目的
- スケールで特定の3D構造と化学的性質を持つタンパク質設計を促進する。
- タンパク質構造、配列、ロタマーのための完全にデータ駆動の生成モデルを提示する。
- コンパクトなトポロジー制約を条件として多様で物理的に妥当なタンパク質を生成できるようにする。
提案手法
- 実験データで訓練されたデノイジング拡散確率モデルを用いて、バックボーン座標、回転、配列、サイドチェーントーションを生成する。
- 回転不変性・並進不変性と等価性を保証する不変点注意機構を備えた等価性トランスフォーマーを用いる。
- SU(2)上でSLERPを用いて回転を補間する拡散と、マスク付き言語モデル風の離散拡散による離散配列の拡散。
- 構造・配列・ロタマーそれぞれの拡散モデルを別個に訓練し、ブロックレベルでトポロジーを符号化するコンパクト制約条件付けスキームを採用する。
- 回転不変デノイザを訓練するためにフレーム整列点誤差(FAPE)損失を組み込む。
実験結果
リサーチクエスチョン
- RQ1拡散モデルは diverse PDB ドメインのトポロジー全体にわたって大規模で物理的に妥当なタンパク質構造を生成できるか?
- RQ2生成されたバックボーンに条件付けて、配列設計とロタマーパッキングをどの程度うまく実現できるか?
- RQ3コンパクトなトポロジー制約が制御可能なタンパク質生成とインペインティングをどの程度導くか?
- RQ4構造と配列の共同拡散モデル化と別個に行う場合の影響は?
主な発見
- モデルは現実的な水素結合パターンとバックボーン幾何を伴う高品質で多様なタンパク質構造を生成する。
- 配列設計とロタマーパッキングはベースラインと同程度かそれより速く、回復率も競争力がある。
- このモデルはインペインティングと制御設計をサポートし、トポロジー変更、ループ設計、可変長ループを含む。
- 構造と配列の結合モデリングは文脈的に妥当なインペインティングを示し、完全アトムのループおよびIg設計の可能性を提示。
- サンプルはRamachandran分布や結合長・角度分布などの生物物理学的プライアに密接に対応している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。