Skip to main content
QUICK REVIEW

[论文解读] HelixFold-Multimer: Elevating Protein Complex Structure Prediction to New Heights

Xiaomin Fang, Jie Gao|arXiv (Cornell University)|Apr 16, 2024
Enzyme Structure and Function被引用 6
一句话总结

HelixFold-Multimer 在蛋白质复合物结构预测方面显著提升,尤其在抗原-抗体、纳米体-抗原和肽-蛋白界面方面,在若干情景中优于 AlphaFold-Multimer,并且在 PaddleHelix 平台公开可用。

ABSTRACT

While monomer protein structure prediction tools boast impressive accuracy, the prediction of protein complex structures remains a daunting challenge in the field. This challenge is particularly pronounced in scenarios involving complexes with protein chains from different species, such as antigen-antibody interactions, where accuracy often falls short. Limited by the accuracy of complex prediction, tasks based on precise protein-protein interaction analysis also face obstacles. In this report, we highlight the ongoing advancements of our protein complex structure prediction model, HelixFold-Multimer, underscoring its enhanced performance. HelixFold-Multimer provides precise predictions for diverse protein complex structures, especially in therapeutic protein interactions. Notably, HelixFold-Multimer achieves remarkable success in antigen-antibody and peptide-protein structure prediction, greatly surpassing AlphaFold 3. HelixFold-Multimer is now available for public use on the PaddleHelix platform, offering both a general version and an antigen-antibody version. Researchers can conveniently access and utilize this service for their development needs.

研究动机与目标

  • 提升多链蛋白质复合物结构预测的准确性,超越以单体为焦点的模型。
  • 通过将领域专业知识整合到架构、特征与训练中,改善跨链相互作用建模。
  • 为治疗性蛋白质相互作用(包括抗原-抗体和肽-蛋白质复合物)提供可靠预测。
  • 在 PaddleHelix 平台提供面向公众、注重易用性的版本(通用与抗原-抗体专用)。

提出的方法

  • 在 HelixFold 与 HelixFold-Single 基础上开发两种版本的 HelixFold-Multimer(通用与抗原-抗体专用)。
  • 以 DockQ 作为主要度量,对比 AlphaFold 与 RoseTTAFold 的基准。
  • 使用 pLDDT、PTM、iPTM 以及一个置信分数来评估模型可靠性并与 DockQ 相关联。
  • 在 curated 数据集上进行评估:异二聚体蛋白质复合物、蛋白质-肽复合物、抗原-抗体以及纳米体-抗原界面。
  • 分析跨物种性能以及抗原序列与训练数据的同源性,以理解泛化能力。

实验结果

研究问题

  • RQ1HelixFold-Multimer 是否在预测异二聚体蛋白质复合物和肽-蛋白界面方面超越 AlphaFold-Multimer?
  • RQ2相较基线,HelixFold-Multimer 在抗原-抗体与纳米体-抗原界面上的表现如何?
  • RQ3模型置信度指标(CFS、iPTM、pLDDT)与 antibody 相关预测的 DockQ 精度之间的关系如何?
  • RQ4抗原来源物种与其序列与训练数据的同源性是否影响预测精度?

主要发现

  • 异二聚体复合物的中位 DockQ,使用 HelixFold-Multimer 为 0.304,与 AlphaFold(0.316)相近。
  • HelixFold-Multimer 在异二聚体复合物上达到 57.8% 的准确率(DockQ > 0.23),高于 AlphaFold 的 53.6%。
  • 对于蛋白-肽对接,HelixFold-Multimer 的中位 DockQ 为 0.295,DockQ > 0.23 的成功率为 68.9%,优于 AlphaFold 的中位 0.262 和 54.1% 的成功率。
  • 抗体-抗原界面:HelixFold-Multimer 的平均 DockQ 为 0.390,DockQ > 0.23 的占比 52.7%,对比 AlphaFold 的 0.195 平均值与 RoseTTAFold 0.?(较低)。
  • 纳米体-抗原界面:中位 DockQ 0.703,平均 0.538,DockQ > 0.23 占比 69.2%,优于 AlphaFold 与 RoseTTAFold。
  • VH-VL 抗体界面:HelixFold-Multimer 中位 DockQ 0.823 vs AlphaFold 0.774 与 RoseTTAFold 0.653;DockQ > 0.8 的比例为 59.5% vs 37.4%(AlphaFold)和 19.1%(RoseTTAFold)。
  • 置信度指标(CFS 与 iPTM)与 DockQ 显著相关,表明对抗体设计具有可依赖的置信引导。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。