[논문 리뷰] Hierarchical Bayesian model of population structure reveals convergent adaptation to high altitude in human populations
이 연구는 복잡한 민족학적 역사를 가진 인류 집단에서의 선택을 탐지하기 위해 계층적 베이지안 모델을 도입하여, 쌍별 분석에 비해 검정력과 거짓 양성률을 개선했다. 아메리카와 아시아의 고산 지역 집단에 적용한 결과, 저산소 상태에 대한 공통된 유전적 적응이 확인되었으며, 양 대륙에서 유사한 생물학적 경로가 드러났다.
Detecting genes involved in local adaptation is challenging and of fundamental importance in evolutionary, quantitative, and medical genetics. To this aim, a standard strategy is to perform genome scans in populations of different origins and environments, looking for genomic regions of high differentiation. Because shared population history or population sub-structure may lead to an excess of false positives, analyses are often done on multiple pairs of populations, which leads to i) a global loss of power as compared to a global analysis, and ii) the need for multiple tests corrections. In order to alleviate these problems, we introduce a new hierarchical Bayesian method to detect markers under selection that can deal with complex demographic histories, where sampled populations share part of their history. Simulations show that our approach is both more powerful and less prone to false positive loci than approaches based on separate analyses of pairs of populations or those ignoring existing complex structures. In addition, our method can identify selection occurring at different levels (i.e. population or region-specific adaptation), as well as convergent selection in different regions. We apply our approach to the analysis of a large SNP dataset from low- and high-altitude human populations from America and Asia. The simultaneous analysis of these two geographic areas allows us to identify several new candidate genome regions for altitudinal selection, and we show that convergent evolution among continents has been quite common. In addition to identifying several genes and biological processes involved in high altitude adaptation, we identify two specific biological pathways that could have evolved in both continents to counter toxic effects induced by hypoxia.
연구 동기 및 목표
- 공동된 민족학적 역사를 가진 인류 집단에서 국소적 적응을 탐지하는 데 도전하는 것 — 이는 기존의 게놈 스캔 방법에 혼동을 줄 수 있음.
- 쌍별 집단 비교의 한계를 극복하는 것 — 통계적 검정력 저하와 다중 검정 보정이 필요함.
- 다양한 지리적 지역의 다수 집단을 동시에 분석하여, 지역 특이적 및 공통된 선택 신호를 탐지하는 것.
- 고산지대 저산소 상태에 대한 적응으로 인해 선택을 받은 유전자 영역과 생물학적 경로를 식별하는 것.
- 집단 수준의 선택과 지역 특이적 또는 공통된 적응을 다른 계층 수준에서 구분하는 것.
제안 방법
- 다수 집단 간의 집단 구조와 공통 조상 역사를 모델링하는 계층적 베이지안 프레임워크 개발.
- 집단 역사와 하위 구조를 모델에 통합하여 민족학적 혼동으로 인한 거짓 양성률를 감소시키는 것.
- 각 유전자 마커에서 선택 계수의 사후 분포를 추정하기 위해 마르코프 체인 몬테카를로(MCMC) 방법 사용.
- 계층적 사전 분포를 통해 다양한 선택 제도(예: 집단 특이적 vs. 대륙 간 공통 선택)를 허용하는 것.
- 다양한 민족학적 시나리오 하에서 시뮬레이션을 수행하여 방법의 통계적 검정력과 I형 오류율을 검증하는 것.
- 남미와 아시아의 저산소 및 고산 지역 집단에서의 대규모 SNP 데이터셋에 모델을 적용하여 선택 신호를 탐지하는 것.
실험 결과
연구 질문
- RQ1계층적 베이지안 모델은 복잡한 민족학적 역사를 가진 집단에서 기존의 쌍별 방법에 비해 선택 탐지 능력을 얼마나 향상시킬 수 있는가?
- RQ2안데스와 티베트 고원과 같은 서로 다른 대륙의 고산 지역 집단에서 공통된 선택을 받는 유전자 영역이 존재하는가?
- RQ3모델은 지역 특이적 적응과 지리적 지역 간 공통된 적응을 구분할 수 있는가?
- RQ4고산지대 인류 집단에서 선택이 농도를 보이는 생물학적 경로는 무엇이며, 이 경로들이 대륙 간에 겹치는가?
- RQ5공동된 집단 역사가 고려될 경우 진정한 양성 선택 신호의 식별에 어떤 영향을 미치는가?
주요 결과
- 시뮬레이션 결과, 계층적 베이지안 모델은 기존의 FST 기반 쌍별 방법에 비해 더 높은 통계적 검정력과 낮은 거짓 양성률을 보였다.
- 이 방법은 남미와 아시아의 고산 지역 집단에서 선택을 받는 다수의 후보 유전자 영역을 성공적으로 탐지했다.
- 고산지대에 대한 공통된 적응은 대륙 간에 흔히 발생했으며, 특정 유전자 영역에서 공통된 선택 신호가 확인되었다.
- 산소 농도 유지와 미토콘드리아 기능과 관련된 두 가지 생물학적 경로가 저산소 상태에 대한 공통적 진화의 주요 타겟으로 규명되었다.
- 모델은 지역 특이적 및 대륙 간 공통적 적응을 포함한 다양한 계층 수준에서 선택 신호를 드러냈다.
- 이전에 고산지대 적응과 관련이 있다고 제기된 여러 유전자가 더 높은 신뢰도로 재확인되었으며, 이는 모델의 신뢰성에 대한 지원이 되었다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.