QUICK REVIEW
[论文解读] Genetic similarity versus genetic ancestry groups as sample descriptors in human genetics
Graham Coop|arXiv (Cornell University)|Jul 23, 2022
Genetic Associations and Epidemiology被引用 21
一句话总结
本文认为遗传祖源分组标签不精确且常常具有误导性,并建议改用对样本的遗传相似性/相关性等明确陈述来描述样本。
ABSTRACT
A common sample descriptor in human genomics studies is that of 'genetic ancestry group', with terms such as 'European genetic ancestry' or 'East Asian genetic ancestry' frequently used in publications to describe the genetics of groups of individuals based on the analysis of their genotypes. In this Perspective, I argue that these terms are imprecise and potentially misleading and that, for most applications, simple statements of genetic similarity represent a more accurate description.
研究动机与目标
- 阐明为何遗传祖源分组标签不精确且可能具有误导性。
- 解释遗传相似性/相关性如何提供更准确、便于沟通的样本描述。
- 讨论在人类遗传学中数据子集划分、分析和解释的实际影响。
提出的方法
- 回顾遗传变异、祖源与遗传相似性的概念基础。
- 分析常见的祖源标签方法(如PCA聚类、STRUCTURE/ADMIXTURE、基因型单倍型的局部祖源)如何作为描述符发挥作用。
- 论证这些标签在有效传达遗传相似性而非界定的祖先群体方面的作用。
- 提出术语的转变,转而描述样本之间的遗传相似性(如‘在PC轴上与XX样本在遗传上相似’)等表述。
- 讨论描述跨时间史时期的祖源的局限性、潜在时间框架及替代方案。
实验结果
研究问题
- RQ1在人类遗传学中何时以及为何使用遗传祖源分组标签?这些标签实际描述了什么?
- RQ2使用祖源标签描述遗传数据及健康关联性的局限性与风险是什么?
- RQ3研究人员如何重新框定样本描述,以强调遗传相似性和相关性而非祖先类别?
- RQ4转向基于相似性的描述符在数据子集划分、分析与跨研究沟通方面将产生何种实际影响?
主要发现
- 遗传祖源标签是对参考面板遗传相似性的代理性陈述,而非对已定义祖先群体的精确描述。
- 祖源标签可能产生误导,暗示同质群体并将遗传因素与社会/环境因素混为一谈。
- 存在连续的遗传变异,而非离散的;祖先标签往往依赖参考面板和所选时间框架,导致研究之间的不稳定性。
- 研究人员为了方法论原因常对数据进行子集化,使清晰的基于相似性的描述符在匹配和对照方面更准确且具有信息性。
- 转向“遗传相似性/相关性”描述符将提高清晰度,减少与祖源语言相关的负担。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。