[论文解读] Generalizable Protein Interface Prediction with End-to-End Learning.
SASNet 是一种端到端的深度学习模型,仅使用原子坐标和原子种类即可预测蛋白质-蛋白质相互作用界面,其性能优于依赖手工特征的最先进方法。尽管在未包含形变建模的偏倚数据集上进行训练,该模型在形变蛋白质复合物上仍表现出良好的泛化能力,表明其已学习到蛋白质的基本结构与动态原理。
Predicting how proteins interact with one another - that is, which surfaces of one protein bind to which surfaces of another protein - is a central problem in biology. Here we present Siamese Atomic Surfacelet Network (SASNet), the first end-to-end learning method for protein interface prediction. Despite using only spatial coordinates and identities of atoms as inputs, SASNet outperforms state-of-the-art methods that rely on complex, hand-selected features. These results are particularly striking because we train the method entirely on a significantly biased data set that does not account for the fact that proteins deform when binding to one another. Nonetheless, our network maintains high performance, without retraining, when tested on real cases in which proteins do deform. This suggests that it has learned fundamental properties of protein structure and dynamics, which has important implications for a variety of key problems related to biomolecular structure.
研究动机与目标
- 开发一种端到端学习方法,用于蛋白质相互作用界面预测,以避免依赖手工选择的结构特征。
- 提高对结合过程中发生构象变化的真实世界蛋白质复合物的泛化能力。
- 评估在未包含形变数据的偏倚数据集上训练、但未显式学习形变的模型,是否仍能在形变情况下表现良好。
- 探索模型是否通过自监督表征学习,学习到了蛋白质的内在结构与动态特性。
提出的方法
- SASNet 采用孪生网络架构,对两个蛋白质结构进行对称处理,实现其界面区域的联合表征学习。
- 它使用原子表面元(atomic surfacelets)——一种学习得到的局部表面表征——在原子层面编码空间与化学信息。
- 该模型仅以原子坐标和元素种类作为输入,通过端到端训练,无需任何手工设计的特征。
- 它利用对比学习目标,促使不同蛋白质对中相似的界面区域具有相似的嵌入表征,即使在结构差异较大的蛋白质对之间也能实现。
- 网络架构设计为对刚体变换保持不变,从而确保对结构变化的鲁棒性。
实验结果
研究问题
- RQ1仅使用原子坐标和原子种类,端到端深度学习模型能否以高精度预测蛋白质-蛋白质相互作用界面?
- RQ2在未发生形变的偏倚数据集上训练的模型,是否能泛化到实际结合过程中蛋白质发生形变的情况?
- RQ3该模型在多大程度上学习到了蛋白质的基本结构与动态特性,而非仅仅记忆了训练数据?
- RQ4与依赖复杂手工特征的最先进方法相比,端到端模型的性能如何?
主要发现
- SASNet 在仅使用原始原子坐标和原子种类作为输入的情况下,性能优于现有使用复杂手工特征的最先进方法。
- 即使未在形变案例上进行显式训练,该模型在包含蛋白质形变的测试案例中仍保持高性能。
- 对形变复合物的泛化能力表明,SASNet 已学习到超越训练数据偏倚的蛋白质结构与动态的底层原理。
- 端到端方法的成功表明,对于高精度界面预测,复杂的特征工程可能并非必要。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。