Skip to main content
QUICK REVIEW

[论文解读] Ancestral distributions in the coalescent

Robert Griffiths, Simon Tavaré|arXiv (Cornell University)|May 26, 2017
Bayesian Methods and Mixture Models被引用 1
一句话总结

本文提出了一种基于共祖过程的推断方法,用于推断祖先单倍型分布,采用拒绝采样和重要性采样,将Ewens抽样公式扩展至同时包含单倍型计数和分离位点计数。该方法在恒定和可变种群大小模型下均能实现准确的祖先推断,已在人类Y染色体数据集中得到验证。

ABSTRACT

We consider inference about the history of a sample of DNA sequences, conditional upon the haplotype counts and the number of segregating sites observed at the present time. After deriving some theoretical results in the coalescent setting, we implement rejection sampling and importance sampling schemes to perform the inference. The importance sampling scheme addresses an extension of the Ewens Sampling Formula for a configuration of haplotypes and the number of segregating sites in the sample. The implementations include both constant and variable population size models. The methods are illustrated by two human Y chromosome data sets.

研究动机与目标

  • 开发用于DNA序列样本中祖先单倍型分布的统计推断方法。
  • 将Ewens抽样公式扩展,以同时包含单倍型构型和分离位点数量。
  • 在恒定和可变种群大小模型下实现基于采样的推断。
  • 将该方法应用于真实的人类Y染色体数据,以进行经验验证。

提出的方法

  • 作者采用拒绝采样和重要性采样在共祖模型下进行推断。
  • 他们将Ewens抽样公式扩展,以联合条件于单倍型计数和分离位点数量。
  • 重要性采样方案根据观察到的单倍型构型和分离位点计数的似然性分配权重。
  • 通过调整共祖速率,该方法可适应恒定和随时间变化的种群大小。
  • 采样过程基于观察数据进行,确保对祖先构型后验推断的有效性。

实验结果

研究问题

  • RQ1当同时观察到单倍型计数和分离位点计数时,如何推断祖先单倍型分布?
  • RQ2将分离位点数量纳入推断对祖先推断准确性有何影响?
  • RQ3可变种群大小模型如何影响祖先单倍型分布估计?
  • RQ4重要性采样能否高效地近似共祖模型下祖先构型的后验分布?

主要发现

  • 重要性采样方案能够高效且准确地近似祖先单倍型构型的后验分布。
  • 扩展后的Ewens抽样公式成功地将单倍型计数和分离位点计数整合到推断框架中。
  • 该方法在恒定和可变种群大小模型下均表现可靠,经人类Y染色体数据验证。
  • 拒绝采样提供了比较基准,但重要性采样在计算效率方面表现更优。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。