Skip to main content
QUICK REVIEW

[论文解读] EigenFold: Generative Protein Structure Prediction with Diffusion Models

Bowen Jing, Ezra Erives|PubMed|Apr 5, 2023
Protein Structure and Dynamics被引用 39
一句话总结

EigenFold 引入了基于扩散的生成框架,通过将结构建模为一组简谐振荡器并使用特征模态级联扩散来为给定序列采样蛋白质结构分布。它在单结构精度上与竞争方法匹配,并提供一个不确定性感知的结构集合。

ABSTRACT

Protein structure prediction has reached revolutionary levels of accuracy on single structures, yet distributional modeling paradigms are needed to capture the conformational ensembles and flexibility that underlie biological function. Towards this goal, we develop EigenFold, a diffusion generative modeling framework for sampling a distribution of structures from a given protein sequence. We define a diffusion process that models the structure as a system of harmonic oscillators and which naturally induces a cascading-resolution generative process along the eigenmodes of the system. On recent CAMEO targets, EigenFold achieves a median TMScore of 0.84, while providing a more comprehensive picture of model uncertainty via the ensemble of sampled structures relative to existing methods. We then assess EigenFold's ability to model and predict conformational heterogeneity for fold-switching proteins and ligand-induced conformational change. Code is available at https://github.com/bjing2016/EigenFold.

研究动机与目标

  • 动机:说明需要生成模型来捕捉蛋白质的构象集合与柔性。
  • 开发符合蛋白质图结构的简谐扩散过程,并实现对结构集合的高效采样。
  • 利用特征模态(法向模)投影实现逐级分辨生成,使用较少的推断步骤。
  • 整合一个 SE(3)-等变的评分模型,并使用 OmegaFold 嵌入来引导结构生成。
  • 评估单一结构的精度以及模型捕捉构象多样性和不确定性的能力。

提出的方法

  • 在蛋白结构图上用简谐势定义前向扩散以编码化学约束。
  • 将扩散投影到简谐矩阵的特征模态中,以分析模态层面的收敛性和刚度。
  • 引入逐级分辨率采样程序,先激活较弱的模态再逐步增加细节。
  • 使用带张量积层的图神经网络训练一个 SE(3)-等变的评分模型。
  • 使用从前向/反向SDE推导的近似ELBO对样本进行排名以进行样本选择。

实验结果

研究问题

  • RQ1在一个简谐能量景观上的扩散模型是否能够从固定序列抽样出真实的蛋白质结构?
  • RQ2对多结构进行采样是否揭示模型不确定性并与真实误差相关?
  • RQ3EigenFold 在折叠转换和配体诱导变化下,能够多大程度上建模构象多样性与柔性?

主要发现

模型RMSD_Cα 平均/中位数 (Å)TMScore 平均/中位数GDT-TS 平均/中位数lDDT_Cα 平均/中位数
AlphaFold23.30 / 1.640.87 / 0.950.86 / 0.910.90 / 0.93
ESMFold3.99 / 2.030.85 / 0.930.83 / 0.880.87 / 0.90
OmegaFold5.26 / 2.620.80 / 0.890.77 / 0.840.83 / 0.89
RoseTTAFold5.72 / 3.170.77 / 0.840.71 / 0.750.79 / 0.82
EigenFold7.37 / 3.500.75 / 0.840.71 / 0.790.78 / 0.85
  • EigenFold 在近期 CAMEO 目标的单结构预测中实现中值 TMScore 为 0.84。
  • 采样结构集合提供对模型不确定性的洞察,并在多项指标上与地面真实精度相关。
  • 从前向/反向轨迹计算的近似 ELBO 与绝对结构精度相关,便于内部对样本进行排序。
  • EigenFold 的单结构精度与 RoseTTAFold 相当,但在某些指标上落后 AlphaFold2 和 ESMFold。
  • 该方法由于特征模态级联方法,能够在 100–300 推断步内进行采样。
  • EigenFold 能在折叠转换和 apo/holo 数据集上建模构象多样性,显示集合多样性与地面真实构象多样性的中等相关性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。