QUICK REVIEW

[論文レビュー] Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics

Nima Shoghi, Yuxuan Liu|arXiv (Cornell University)|Feb 2, 2026

Protein Structure and Dynamics被引用数 0

ひとこと要約

STAR-MD は SE(3) 等方性を持つ自己回帰拡散モデルで、結合した時空注意機構によりマイクロ秒のスケールで物理的に妥当なタンパク質軌道を生成し、長期ダイナミクスで従来モデルを上回る。ATLAS における安定した高品質のロールアウトを実現し、長期へ外挿する。

ABSTRACT

Molecular dynamics (MD) simulations remain the gold standard for studying protein dynamics, but their computational cost limits access to biologically relevant timescales. Recent generative models have shown promise in accelerating simulations, yet they struggle with long-horizon generation due to architectural constraints, error accumulation, and inadequate modeling of spatio-temporal dynamics. We present STAR-MD (Spatio-Temporal Autoregressive Rollout for Molecular Dynamics), a scalable SE(3)-equivariant diffusion model that generates physically plausible protein trajectories over microsecond timescales. Our key innovation is a causal diffusion transformer with joint spatio-temporal attention that efficiently captures complex space-time dependencies while avoiding the memory bottlenecks of existing methods. On the standard ATLAS benchmark, STAR-MD achieves state-of-the-art performance across all metrics--substantially improving conformational coverage, structural validity, and dynamic fidelity compared to previous methods. STAR-MD successfully extrapolates to generate stable microsecond-scale trajectories where baseline methods fail catastrophically, maintaining high structural quality throughout the extended rollout. Our comprehensive evaluation reveals severe limitations in current models for long-horizon generation, while demonstrating that STAR-MD's joint spatio-temporal modeling enables robust dynamics simulation at biologically relevant timescales, paving the way for accelerated exploration of protein function.

研究の動機と目的

ナノ秒を超える長時間軌道生成の必要性を動機付け、既存モデルの制約に対処する。
結合した時空注意を備えた自己回帰 SE(3) 拡散モデルを開発し、非分離型の空間-時間ダイナミクスを捉える。
ブロック因果注意と文脈ノイズ摂動のような訓練技術を通じて安定した長時間ロールアウトを実現する。
ATLAS 100 ns 軌道で最先端の性能を示し、240 ns および 1 μs のホライズンへ頑健に外挿する。
非マルコフ的な粗視化ダイナミクスと記憶効果を Mori-Zwanzig の形式論に基づいて理論的正当化する。

提案手法

各残基ごとの平行移動と回転を表す SE(3) 上の自己回帰拡散フレームワーク。
非分離的な時空依存を捉えるための残基フレーム・トークン上で動作する結合した時空注意。
長期ホライズン生成を効率化するための KV キャッシュを備えたブロック拡散型因果訓練。
ロールアウト時の誤差蓄積を緩和する訓練および推論時の文脈ノイズ摂動。
複数の時間スケールを扱う適応的レイヤ正規化による連続時間条件付け。
履歴依存性と非分離メモリカーネルを正当化する Mori-Zwanzig 総論を用いた理論的基盤。

実験結果

リサーチクエスチョン

RQ1STAR-MD は大きなタンパク質に対してマイクロ秒スケールの物理的に妥当な軌道を生成できるか？
RQ2結合した時空注意は空間-時間を先に捉えるアーキテクチャよりも連成した時空ダイナミクスをより良く捉えるか？
RQ3訓練が 100 ns のみの場合でも STAR-MD は 240 ns および 1 μs の長期ホライズンへ適切に外挿できるか？
RQ4長時間の安定性と構造的妥当性を最も改善するアーキテクチャおよび訓練選択は何か？
RQ5STAR-MD は構象カバー、妥当性、ダイナミック忠実度の点で最先端の軌道モデルと比較してどうか？

主な発見

Cov Valid	Dynamic Fidelity	Validity	Model	JSD ↓	Rec ↑	tICA ↑	RMSD ↓	AutoCor ↓	VAMP-2 ↓	CA% ↑	AA% ↑	CA+AA% ↑
0.31	0.67	0.17	MD (Oracle)	0.31	0.67	0.17	0.00	0.00	0.02	98.37	98.07	96.43
0.56 ± 0.01	0.28 ± 0.01	0.12 ± 0.00	MDGen	0.56	0.28	0.12	0.38	0.05	0.38	71.83	95.03	68.31
0.59 ± 0.01	0.20 ± 0.01	N/A	AlphaFolding	1.76	0.12	0.11	3.31	0.06	1.56	0.11	0.11	0.11
0.52 ± 0.01	0.38 ± 0.01	0.48 ± 0.01	MDGen	0.52	0.38	0.48	0.25	0.01	0.63	63.25	87.83	56.60
0.51 ± 0.01	0.42 ± 0.02	0.35 ± 0.01	ConfRover-W	0.51	0.42	0.35	0.39	0.01	0.44	44.71	73.13	36.51
0.55 ± 0.02	0.45 ± 0.02	0.33 ± 0.02	ConfRover-W	0.55	0.45	0.33	0.38	0.03	0.54	54.74	62.32	36.91
0.44 ± 0.01	0.59 ± 0.01	0.20 ± 0.02	STAR-MD	0.44	0.59	0.20	0.03	0.01	0.85	85.16	97.57	83.15
0.46 ± 0.01	0.61 ± 0.02	0.13 ± 0.02	STAR-MD	0.46	0.61	0.13	0.10	0.02	0.89	88.47	89.81	79.93

STAR-MD は ATLAS 100 ns ベンチマークにおいて構象カバー、構造的妥当性、ダイナミック忠実度の全てで最先端の性能を達成した。
STAR-MD は長時間のロールアウト（最大 1 μs）において高い構造的妥当性と広い構象カバーを維持し、急激な劣化を招くベースラインを上回った。
結合した時空注意と文脈ノイズを用いた自己回帰拡散は長時間の生成を頑健にし、誤差蓄積を抑制する。
STAR-MD は 240 ns および 1 μs の軌道へ外挿可能で、品質指標は競争力を保つ一方、代替手法はより早く劣化する。
理論的分析は非マルコフ的な粗視化ダイナミクスを履歴依存カーネルの必要性と結びつけ、モデル設計を正当化する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。