Skip to main content
QUICK REVIEW

[论文解读] Interspecies correlation for the Brownian trait evolution with unknown phylogeny

Serik Sagitov, Krzysztof Bartoszek|arXiv (Cornell University)|Jan 25, 2012
Evolution and Paleontology Studies参考文献 4被引用 2
一句话总结

本文提出了一种统计框架,用于在系统发育树未知的情况下,利用布朗运动建模物种间的表型特征演化。通过将物种树建模为条件分支过程,并推导出样本均值方差与样本方差均值的精确公式,该框架提供了考虑树拓扑结构和特征演化不确定性在内的种间相关系数的闭式表达式。

ABSTRACT

A simple way to model phenotypic evolution is to assume that after splitting, the trait values of the sister species diverge as independent Brownian motions. Relying only on a prior distribution for the underlying species tree (conditioned on the number, n, of extant species) we study the random vector (X_1,...,X_n) of the observed trait values. In this paper we derive compact formulae for the variance of the sample mean and the mean of the sample variance for the vector (X_1,...,X_n). The key ingredient of these formulae is the correlation coefficient between two trait values randomly chosen from (X_1,...,X_n). This interspecies correlation coefficient takes into account not only variation due to the random sampling of two species out of n and the stochastic nature of Brownian motion but also the uncertainty in the phylogenetic tree. The latter is modeled by a (supercritical or critical) conditioned branching process. In the critical case we modify the Aldous-Popovic model by assuming a proper prior for the time of origin.

研究动机与目标

  • 在物种树拓扑结构不确定的情况下建模表型演化。
  • 量化系统发育不确定性对 n 个现存物种的特征方差与相关性的影响。
  • 推导特征数据关键抽样矩的闭式表达式(样本均值方差与样本方差均值)。
  • 通过在临界分支过程中引入起源时间的适当先验,扩展 Aldous-Popovic 模型。

提出的方法

  • 将物种树建模为超临界或临界条件分支过程,以表示系统发育不确定性。
  • 假设特征演化在物种分化事件后的分支上遵循独立的布朗运动。
  • 推导在随机树和现存物种数 n 条件下,特征值 (X₁,…,Xₙ) 的联合分布。
  • 通过整合所有可能的树拓扑结构和分支长度,计算两个随机选择的特征值之间的种间相关系数。
  • 利用全方差定律,推导出样本均值方差与样本方差均值的精确公式。
  • 通过在起源时间上引入适当的先验,对 Aldous-Popovic 模型进行修改,以稳定临界分支过程。

实验结果

研究问题

  • RQ1系统发育不确定性如何影响 n 个现存物种特征均值的抽样分布?
  • RQ2当物种树未被观测且随机建模时,种间相关系数的精确形式是什么?
  • RQ3样本均值方差与样本方差均值如何依赖于物种数量和分支过程参数?
  • RQ4在临界分支过程模型中,对起源时间引入适当先验是否能提高模型稳定性?
  • RQ5在此随机树模型下,特征向量 (X₁,…,Xₙ) 关键矩的闭式表达式是什么?

主要发现

  • 种间相关系数以闭式表达,其依赖于物种数量 n 和分支过程参数。
  • 样本均值方差被证明是种间相关系数与 n 的函数,且明确依赖于树的随机结构。
  • 样本方差均值被显式推导,为方差估计中的系统发育依赖性提供了校正。
  • 在临界情况下,对起源时间引入适当先验可确保矩的定义良好,并稳定模型。
  • 样本均值方差与样本方差均值的推导公式简洁,适用于推断的计算处理。
  • 该模型同时考虑了树拓扑与分支长度的不确定性,为比较方法中固定树假设提供了更具鲁棒性的替代方案。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。