Skip to main content
QUICK REVIEW

[논문 리뷰] Inferring species trees directly from SNP and AFLP data: full coalescent analysis without those pesky gene trees

David Bryant, Remco Bouckaert|arXiv (Cornell University)|2009. 10. 21.
Genetic diversity and population structure참고 문헌 29인용 수 2
한 줄 요약

이 논문은 SNAPP에 구현된 다항식 시간 알고리즘을 소개하며, 유전자 수목 추정 없이 다종 분할 공생 모델 하에서 SNP 및 AFLP 데이터로부터 직접 종 수목을 추론한다. 이 방법은 끝점 모델을 사용하여 모든 가능한 유전자 수목을 통합적으로 통합함으로써 정확한 종 수목, 분화 시점 및 집단 크기 추정을 가능하게 한다. 이는 이분형 마커에서의 정확한 추정을 가능하게 한다.

ABSTRACT

The multi-species coalescent provides an elegant theoretical framework for estimating species trees and species demographics from genetic markers. Practical applications of the multi-species coalescent model are, however, limited by the need to integrate or sample over all gene trees possible for each genetic marker. Here we describe a polynomial-time algorithm that computes the likelihood of a species tree directly from the markers under a finite-sites model of mutation, effectively integrating over all possible gene trees. The method applies to independent (unlinked) biallelic markers such as well-spaced single nucleotide polymorphisms (SNPs), and we have implemented it in SNAPP, a Markov chain Monte-Carlo sampler for inferring species trees, divergence dates, and population sizes. We report results from simulation experiments and from an analysis of 1997 amplified fragment length polymorphism (AFLP) loci in 69 individuals sampled from six species of {\em Ourisia} (New Zealand native foxglove).

연구 동기 및 목표

  • 다종 분할 공생 모델 하에서 모든 가능한 유전자 수목을 통합하는 데 발생하는 계산적 병목 현상을 해결하기 위해.
  • SNP 및 AFLP와 같은 이분형 마커에서 직접 종 수목의 우도를 계산하는 방법을 개발하기 위해.
  • 마르코프 체인 몬테카를로 샘플링을 사용하여 종 수목, 분화 시점 및 집단 크기의 효율적인 추정을 가능하게 하기 위해.
  • 실제 데이터에 적용하기 위해, 6개 Ourisia 종에 걸쳐 69명의 개체에서 수집한 대규모 AFLP 데이터셋을 분석하기 위해.

제안 방법

  • 이 방법은 끝점 모델을 사용하여 유전자 수목을 명시적으로 나열하지 않고도 이분형 마커에서 종 수목의 우도를 직접 계산한다.
  • 모든 가능한 유전자 수목의 형질 및 분지 길이를 통합하는 다항식 시간 알고리즘을 적용하여, 유전자 수목에 대한 마르코프 체인 몬테카를로 샘플링이 필요 없도록 한다.
  • 이 방법은 SNAPP로 구현되었으며, 이는 종 수목, 분화 시점 및 집단 크기를 동시에 추정하는 베이지안 MCMC 샘플러이다.
  • 이 알고리즘은 이분형 마커의 경우, 주어진 마커 패턴을 관측할 확률을 모든 가능한 유전자 수목 구성에 대해 합산함으로써 계산할 수 있다는 사실을 활용한다.
  • 돌연변이가 유한한 상태 수를 가진 이산적 위치에서 발생한다고 모델링하여, 공생 모델 하에서 사이트 패턴 확률을 정확하게 계산할 수 있다.

실험 결과

연구 질문

  • RQ1유전자 수목 추정 없이 SNP 및 AFLP 데이터로부터 종 수목을 직접 추론할 수 있는가?
  • RQ2제안된 방법이 유전자 수목 기반 접근 방식에 비해 계산 비용을 줄이며 정확한 종 수목 추정을 달성하는가?
  • RQ3고도의 누락 데이터와 다형성 수준이 높은 실세계의 AFLP 데이터에 대해 이 방법의 성능은 어떠한가?
  • RQ4이 방법은 종 수목 구조와 함께 분화 시점 및 집단 크기를 신뢰성 있게 추정할 수 있는가?

주요 결과

  • 이 방법은 유전자 수목 샘플링 없이 다종 분할 공생 모델 하에서 우도를 직접 계산함으로써 계산 부담을 줄이며 정확한 종 수목 추정을 달성한다.
  • 시뮬레이션 실험 결과, 복잡한 민족학적 시나리오에서도 종 수목의 형질을 고도로 정확하게 복원함을 보였다.
  • 6개 Ourisia 종에 걸쳐 69명의 개체에서 수집한 1,997개의 AFLP 유전자좌 분석 결과, 분화 시점과 집단 크기를 추정한 잘 지지된 종 수목을 도출하였다.
  • 이 방법은 AFLP 마커에서 흔히 볼 수 있는 누락 데이터 및 높은 다형성 수준에 대해 강건함을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.