Skip to main content
QUICK REVIEW

[论文解读] Epistasis and Shapes of Fitness Landscapes

Niko Beerenwinkel, Lior Pachter|ArXiv.org|Mar 29, 2006
Sports Analytics and Performance参考文献 28被引用 55
一句话总结

本文提出一种基于基因型多面体(genotope)——即等位基因频率向量的凸包——的几何框架,通过剖分方法对适应度景观形状进行分类,揭示所有基因互作关系,包括高阶上位性。该方法应用于HIV和果蝇数据,无需假设参数化适应度模型,即可检测到先前未发现的上位性互作。

ABSTRACT

The relationship between the shape of a fitness landscape and the underlying gene interactions, or epistasis, has been extensively studied in the two-locus case. Gene interactions among multiple loci are usually reduced to two-way interactions. We present a geometric theory of shapes of fitness landscapes for multiple loci. A central concept is the genotope, which is the convex hull of all possible allele frequencies in populations. Triangulations of the genotope correspond to different shapes of fitness landscapes and reveal all the gene interactions. The theory is applied to fitness data from HIV and Drosophila melanogaster. In both cases, our findings refine earlier analyses and reveal previously undetected gene interactions.

研究动机与目标

  • 开发一种适应度景观形状的几何理论,以捕捉所有可能的基因互作,包括超越成对效应的高阶上位性。
  • 解决传统基于ANOVA的上位性分析的局限性,后者未能考虑多基因座适应度景观的组合结构。
  • 利用基因型多面体及其正则剖分,表征多基因座系统可能的适应度景观形状的完整集合。
  • 将该方法应用于HIV和黑腹果蝇(Drosophila melanogaster)的真实生物适应度数据,以发现隐藏的上位性互作。
  • 实现从实验数据中无需假设适应度函数形式的适应度景观结构的模型自由推断。

提出的方法

  • 将基因型多面体定义为群体中所有可能的等位基因频率向量的凸包,以几何多面体形式表示基因型空间。
  • 利用基因型多面体的正则剖分来编码适应度景观的形状,其中每个单形对应于在最适群体中共同存在的基因型集合。
  • 应用次级多面体构造,将基因型多面体的剖分与适应度互作的组合结构联系起来。
  • 利用剖分的GKZ向量计算给定基因型出现在最适群体中的概率,该概率基于等位基因频率分布推导得出。
  • 识别剖分中的最小非面和非单形,以确定哪些基因型组合无法在最适群体中共存。
  • 将该方法应用于已发表的HIV(三基因座、双等位基因)和果蝇(五基因座、双等位基因)的适应度数据,结合测量误差建模与剖分分析。

实验结果

研究问题

  • RQ1如何在超越成对上位性的基础上,完整捕捉适应度景观的组合结构?
  • RQ2何种几何对象编码了多基因座系统中所有可能的基因互作?
  • RQ3如何从实验数据中推断适应度景观形状,而无需假设参数化模型?
  • RQ4哪些基因型组合可以在最适群体中共存,哪些不能?
  • RQ5基因型多面体剖分中的紧致包(tight span)和最小非面具有何种生物学意义?

主要发现

  • 黑腹果蝇五基因座系统的适应度景观是五维基因型多面体的剖分,共划分为110个单形,如图7.7所示。
  • 果蝇基因型多面体的剖分包含332个最小非面,其中包括一个非四面体:{00100, 00010, 11000, 01011},表明这四个基因型无法在最适群体中共存。
  • 对于果蝇数据,基因型10110在最适群体中出现的概率为69.2%(由GKZ向量83/120推导得出)。
  • 果蝇基因型多面体的紧致包为三维,f-向量为(110, 214, 127, 22),其中包含两个一维
  • 该方法在HIV和果蝇数据集中检测到先前未发现的上位性互作,改进了依赖线性模型的早期分析。
  • 由于连锁不平衡,人类群体的基因型多面体维度预期远低于SNP数量所暗示的维度,使得未来数据下在人类基因型多面体上研究适应度景观成为可行。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。