Skip to main content
QUICK REVIEW

[논문 리뷰] Interspecies correlation for the Brownian trait evolution with unknown phylogeny

Serik Sagitov, Krzysztof Bartoszek|arXiv (Cornell University)|2012. 01. 25.
Evolution and Paleontology Studies참고 문헌 4인용 수 2
한 줄 요약

이 논문은 종 간 표현형 형질 진화를 모델링하기 위한 통계적 프레임워크를 개발한다. 계통수의 구조가 알려져 있지 않은 상황에서 브라운 운동을 사용한다. 종 계통수를 조건부 분열 과정으로 모델링하고, 표본 평균의 분산과 표본 분산의 평균에 대한 정확한 수식을 유도함으로써, 계통수의 위상과 형질 진화의 불확실성을 모두 고려한 종 간 상관계수의 닫힌 형식 표현을 제공한다.

ABSTRACT

A simple way to model phenotypic evolution is to assume that after splitting, the trait values of the sister species diverge as independent Brownian motions. Relying only on a prior distribution for the underlying species tree (conditioned on the number, n, of extant species) we study the random vector (X_1,...,X_n) of the observed trait values. In this paper we derive compact formulae for the variance of the sample mean and the mean of the sample variance for the vector (X_1,...,X_n). The key ingredient of these formulae is the correlation coefficient between two trait values randomly chosen from (X_1,...,X_n). This interspecies correlation coefficient takes into account not only variation due to the random sampling of two species out of n and the stochastic nature of Brownian motion but also the uncertainty in the phylogenetic tree. The latter is modeled by a (supercritical or critical) conditioned branching process. In the critical case we modify the Aldous-Popovic model by assuming a proper prior for the time of origin.

연구 동기 및 목표

  • 종 계통수 위상에 대한 불확실성 하에서 표현형 진화를 모델링하기 위해.
  • 진화적 계통수의 불확실성이 n개의 현존 종에서 형질 분산과 상관계수에 미치는 영향을 정량화하기 위해.
  • 형질 데이터의 주요 표본 모멘트(표본 평균의 분산과 표본 분산의 평균)에 대한 닫힌 형식 수식을 도출하기 위해.
  • 에이드우스-포포비치 모델을 개선하기 위해 임계 분열 과정에서 기원 시점에 적절한 사전분포를 도입하기 위해.

제안 방법

  • 계통수의 불확실성을 표현하기 위해 초임계 또는 임계 조건부 분열 과정으로 종 계통수를 모델링한다.
  • 형질 진화가 분화 사건 이후 지점에서 독립적인 브라운 운동을 따른다고 가정한다.
  • 랜덤 계통수와 현존 종의 수 n에 조건부하여 형질 값(X₁,…,Xₙ)의 공동분포를 유도한다.
  • 모든 가능한 계통수 위상과 지점 길이에 걸쳐 통합하여, 두 개의 무작위로 선택된 형질 값 간의 종 간 상관계수를 계산한다.
  • 전체 분산의 법칙을 사용하여 표본 평균의 분산과 표본 분산의 평균에 대한 정확한 수식을 도출한다.
  • 임계 분열 과정의 안정성을 높이기 위해 기원 시점에 적절한 사전분포를 도입함으로써 에이드우스-포포비치 모델을 수정한다.

실험 결과

연구 질문

  • RQ1계통수의 불확실성은 n개의 현존 종에서 형질 평균의 표본 분포에 어떻게 영향을 미치는가?
  • RQ2종 계통수가 관측되지 않고 확률적으로 모델링될 경우, 종 간 상관계수의 정확한 형태는 무엇인가?
  • RQ3표본 평균의 분산과 표본 분산의 평균은 종의 수와 분열 과정의 매개수에 따라 어떻게 달라지는가?
  • RQ4기원 시점에 대한 적절한 사전분포를 도입함으로써 임계 분열 과정 모델의 안정성을 향상시킬 수 있는가?
  • RQ5이 랜덤 계통수 모델 하에서 형질 벡터(X₁,…,Xₙ)의 주요 모멘트에 대한 닫힌 형식 수식은 무엇인가?

주요 결과

  • 종 간 상관계수는 닫힌 형식으로 유도되었으며, 종의 수 n과 분열 과정의 매개수에 따라 달라진다.
  • 표본 평균의 분산은 종 간 상관계수와 n에 따라 함수적으로 표현되며, 계통수의 확률적 구조에 명시적인 의존성이 있다.
  • 표본 분산의 평균은 명시적으로 유도되었으며, 분산 추정에서 계통적 의존성에 대한 보정을 제공한다.
  • 임계 경우에서 기원 시점에 대한 적절한 사전분포를 포함함으로써 모멘트가 잘 정의되고 모델이 안정화된다.
  • 표본 평균의 분산과 표본 분산의 평균에 대한 도출된 수식은 간결하며 추론에 대해 계산적으로 다룰 수 있다.
  • 모델은 계통수 위상과 지점 길이의 불확실성을 모두 반영하여, 비교 방법에서 고정된 계통수 가정에 비해 더 견고한 대안을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.