[论文解读] HelixFold-Multimer: Elevating Protein Complex Structure Prediction to New Heights
HelixFold-Multimer 在蛋白质复合物结构预测方面显著提升,尤其在抗原-抗体、纳米体-抗原和肽-蛋白界面方面,在若干情景中优于 AlphaFold-Multimer,并且在 PaddleHelix 平台公开可用。
While monomer protein structure prediction tools boast impressive accuracy, the prediction of protein complex structures remains a daunting challenge in the field. This challenge is particularly pronounced in scenarios involving complexes with protein chains from different species, such as antigen-antibody interactions, where accuracy often falls short. Limited by the accuracy of complex prediction, tasks based on precise protein-protein interaction analysis also face obstacles. In this report, we highlight the ongoing advancements of our protein complex structure prediction model, HelixFold-Multimer, underscoring its enhanced performance. HelixFold-Multimer provides precise predictions for diverse protein complex structures, especially in therapeutic protein interactions. Notably, HelixFold-Multimer achieves remarkable success in antigen-antibody and peptide-protein structure prediction, greatly surpassing AlphaFold 3. HelixFold-Multimer is now available for public use on the PaddleHelix platform, offering both a general version and an antigen-antibody version. Researchers can conveniently access and utilize this service for their development needs.
研究动机与目标
- 提升多链蛋白质复合物结构预测的准确性,超越以单体为焦点的模型。
- 通过将领域专业知识整合到架构、特征与训练中,改善跨链相互作用建模。
- 为治疗性蛋白质相互作用(包括抗原-抗体和肽-蛋白质复合物)提供可靠预测。
- 在 PaddleHelix 平台提供面向公众、注重易用性的版本(通用与抗原-抗体专用)。
提出的方法
- 在 HelixFold 与 HelixFold-Single 基础上开发两种版本的 HelixFold-Multimer(通用与抗原-抗体专用)。
- 以 DockQ 作为主要度量,对比 AlphaFold 与 RoseTTAFold 的基准。
- 使用 pLDDT、PTM、iPTM 以及一个置信分数来评估模型可靠性并与 DockQ 相关联。
- 在 curated 数据集上进行评估:异二聚体蛋白质复合物、蛋白质-肽复合物、抗原-抗体以及纳米体-抗原界面。
- 分析跨物种性能以及抗原序列与训练数据的同源性,以理解泛化能力。
实验结果
研究问题
- RQ1HelixFold-Multimer 是否在预测异二聚体蛋白质复合物和肽-蛋白界面方面超越 AlphaFold-Multimer?
- RQ2相较基线,HelixFold-Multimer 在抗原-抗体与纳米体-抗原界面上的表现如何?
- RQ3模型置信度指标(CFS、iPTM、pLDDT)与 antibody 相关预测的 DockQ 精度之间的关系如何?
- RQ4抗原来源物种与其序列与训练数据的同源性是否影响预测精度?
主要发现
- 异二聚体复合物的中位 DockQ,使用 HelixFold-Multimer 为 0.304,与 AlphaFold(0.316)相近。
- HelixFold-Multimer 在异二聚体复合物上达到 57.8% 的准确率(DockQ > 0.23),高于 AlphaFold 的 53.6%。
- 对于蛋白-肽对接,HelixFold-Multimer 的中位 DockQ 为 0.295,DockQ > 0.23 的成功率为 68.9%,优于 AlphaFold 的中位 0.262 和 54.1% 的成功率。
- 抗体-抗原界面:HelixFold-Multimer 的平均 DockQ 为 0.390,DockQ > 0.23 的占比 52.7%,对比 AlphaFold 的 0.195 平均值与 RoseTTAFold 0.?(较低)。
- 纳米体-抗原界面:中位 DockQ 0.703,平均 0.538,DockQ > 0.23 占比 69.2%,优于 AlphaFold 与 RoseTTAFold。
- VH-VL 抗体界面:HelixFold-Multimer 中位 DockQ 0.823 vs AlphaFold 0.774 与 RoseTTAFold 0.653;DockQ > 0.8 的比例为 59.5% vs 37.4%(AlphaFold)和 19.1%(RoseTTAFold)。
- 置信度指标(CFS 与 iPTM)与 DockQ 显著相关,表明对抗体设计具有可依赖的置信引导。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。