Skip to main content
QUICK REVIEW

[论文解读] Quantification of the effect of mutations using a global probability model of natural sequence variation

Thomas A. Hopf, John Ingraham|arXiv (Cornell University)|Oct 15, 2015
Evolution and Genetic Dynamics参考文献 62被引用 289
一句话总结

本文提出了一种自然序列变异的全局概率模型,用于量化突变对蛋白质功能的影响。通过利用自然序列多样性中编码的进化约束,该方法使用一种统计能量函数——称为进化哈密顿量(evolutionary Hamiltonian)——以高精度预测突变效应,尤其在与进化中相似的选择压力下表现优异,例如抗生素耐药性。

ABSTRACT

Modern biomedicine is challenged to predict the effects of genetic variation. Systematic functional assays of point mutants of proteins have provided valuable empirical information, but vast regions of sequence space remain unexplored. Fortunately, the mutation-selection process of natural evolution has recorded rich information in the diversity of natural protein sequences. Here, building on probabilistic models for correlated amino-acid substitutions that have been successfully applied to determine the three-dimensional structures of proteins, we present a statistical approach for quantifying the contribution of residues and their interactions to protein function, using a statistical energy, the evolutionary Hamiltonian. We find that these probability models predict the experimental effects of mutations with reasonable accuracy for a number of proteins, especially where the selective pressure is similar to the evolutionary pressure on the protein, such as antibiotics.

研究动机与目标

  • 开发一种计算方法,利用自然序列变异数据量化氨基酸突变的功能影响。
  • 对蛋白质序列中氨基酸的共变替换进行建模,以推断残基位置上的进化约束。
  • 将该模型应用于预测蛋白质中实验测得的突变效应,特别是在抗生素耐药性等选择压力下。
  • 建立一个统计框架,将蛋白质序列中的进化模式与功能结果相连接。
  • 通过利用自然变异的全局模式,提高对未经测试突变的预测准确性。

提出的方法

  • 该方法使用在天然蛋白质序列上训练的全局概率模型,估算每个位置发生氨基酸替换的可能性。
  • 通过最大熵模型引入残基之间的成对相关性,以捕捉共进化模式。
  • 进化哈密顿量被定义为序列概率的负对数,作为统计能量函数用于对突变效应进行排序。
  • 该模型在大规模多序列比对上进行校准,以反映不同蛋白质家族中的进化约束。
  • 通过将模型预测的能量变化与点突变的实验测量效应进行比较,评估预测准确性。
  • 该方法在多种蛋白质上进行了验证,特别是那些处于强选择压力下的蛋白质,如抗生素耐药性蛋白。

实验结果

研究问题

  • RQ1基于自然序列变异的全局概率模型在多大程度上能准确预测蛋白质点突变的功能效应?
  • RQ2在自然序列多样性中捕获的进化约束与实验测量的突变效应之间相关性如何?
  • RQ3进化哈密顿量能否作为可靠的统计能量函数,用于量化单个残基及其相互作用对蛋白质功能的贡献?
  • RQ4在不同选择压力下(如抗生素耐药性)模型性能如何变化?
  • RQ5该模型对实验检测未覆盖的序列空间区域中的未经测试突变,其预测能力如何?

主要发现

  • 进化哈密顿量模型对突变效应的预测具有合理的准确性,尤其在与自然进化中相似选择压力下的蛋白质中表现更优。
  • 该模型在抗生素耐药性等蛋白质中实现了高预测准确性,尤其是在有实验数据支持的情况下。
  • 模型捕捉到的残基相互作用显著提升了预测性能,优于仅考虑单个残基的模型。
  • 该方法即使在缺乏实验数据的情况下,也能成功识别功能关键残基及其协同效应。
  • 该模型在多种蛋白质家族中表现稳健,显示出对未表征序列的泛化能力。
  • 本研究表明,自然序列变异已包含足够信息以预测突变的功能影响,从而减少对昂贵实验检测的依赖。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。