Skip to main content
QUICK REVIEW

[论文解读] Spin models inferred from patient data faithfully describe HIV fitness landscapes and enable rational vaccine design

Karthik Shekhar, Claire Ruberman|arXiv (Cornell University)|Jun 9, 2013
HIV Research and Treatment参考文献 41被引用 87
一句话总结

该论文表明,尽管基于非平衡、免疫驱动进化的患者源HIV序列推断出的自旋模型,仍能忠实再现HIV的内在适应度景观,从而实现对病毒适应度排序的准确预测。该研究结合模拟与变分理论,表明群体水平的免疫多样性可实现对序列空间的全面采样,使基于流行率的模型在理性疫苗设计中有效识别突变脆弱性。

ABSTRACT

Mutational escape from vaccine induced immune responses has thwarted the development of a successful vaccine against AIDS, whose causative agent is HIV, a highly mutable virus. Knowing the virus' fitness as a function of its proteomic sequence can enable rational design of potent vaccines, as this information can focus vaccine induced immune responses to target mutational vulnerabilities of the virus. Spin models have been proposed as a means to infer intrinsic fitness landscapes of HIV proteins from patient-derived viral protein sequences. These sequences are the product of non-equilibrium viral evolution driven by patient-specific immune responses, and are subject to phylogenetic constraints. How can such sequence data allow inference of intrinsic fitness landscapes? We combined computer simulations and variational theory \'{a} la Feynman to show that, in most circumstances, spin models inferred from patient-derived viral sequences reflect the correct rank order of the fitness of mutant viral strains. Our findings are relevant for diverse viruses.

研究动机与目标

  • 确定从患者源病毒序列推断出的适应度景观——受非平衡免疫选择影响——是否能准确反映病毒的内在适应度。
  • 解决一个悖论:为何缺乏平衡采样的非平衡序列数据仍能产生可靠的适应度预测?
  • 确立基于患者序列中突变相关性的自旋模型忠实反映HIV真实适应度景观的条件。
  • 为最大熵模型在预测体外适应度和临床结果方面的成功提供机制性解释。

提出的方法

  • 作者使用计算机模拟在宿主网络中的病毒进化,模拟在遗传多样性宿主之间传播,每个宿主具有特定的免疫压力。
  • 每个宿主的病毒准种通过非平衡的突变-选择过程在离散世代中演化,适应度由结合内在适应度和宿主特异性免疫场的有效哈密顿量决定。
  • 应用最大熵原理,从多序列比对(MSA)推断自旋模型,利用单一位点和双一位点突变概率构建形式为 H₀[⃗s] = ΣJij s_i s_j + Σh_i s_i 的玻尔兹曼分布。
  • 基于费曼方法的变分理论用于推导模型参数的自洽方程,确保推断模型统计量与模拟数据的一致性。
  • 通过比较预测菌株能量(H₀[⃗s])的排序与实际体外适应度测量值及模拟的内在适应度,评估适应度景观。
  • 通过使用时间平均的有效哈密顿量,考虑代际之间的系统发育相关性,使非平衡数据的推断成为可能。

实验结果

研究问题

  • RQ1能否从非平衡、患者源的病毒序列中推断出自旋模型,以准确反映HIV的内在适应度景观?
  • RQ2为何基于免疫驱动、非平衡进化的流行率景观会与体外测量的内在适应度相关?
  • RQ3最大熵模型在何种条件下无法恢复真实的适应度排序?
  • RQ4群体水平的免疫反应遗传多样性如何实现对病毒序列空间的全面采样?

主要发现

  • 从患者源HIV序列推断出的自旋模型即使在数据源于非平衡、免疫驱动进化的情况下,也能准确再现不同突变株的内在适应度排序。
  • 模型预测能量(H₀[⃗s])与体外适应度测量值之间具有稳健的相关性,原因在于不同宿主的免疫压力共同采样了病毒蛋白的完整序列空间。
  • 群体中遗传多样性免疫反应的存在,确保患者数据中的突变相关性反映的是潜在的适应度约束,而不仅仅是局部免疫选择。
  • 本研究表明,最大熵模型并非仅是统计工具,当群体范围的免疫压力足够多样且非均匀时,它们能够捕捉真实的适应度景观。
  • 变分理论框架成功调和了非平衡序列数据与平衡统计力学之间的矛盾,验证了将 H₀[⃗s] 作为内在适应度代理的合理性。
  • 即使存在补偿性突变,模型的预测能力仍得以保持,因为多个突变的集体适应度惩罚由推断出的 J_ij 耦合项所捕获。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。