Skip to main content
QUICK REVIEW

[论文解读] Database likelihood ratios and familial DNA searching

Klaas Slooten, Ronald Meester|arXiv (Cornell University)|Jan 20, 2012
Forensic and Genetic Research参考文献 4被引用 2
一句话总结

本文提出了一种用于家族DNA搜寻的似然比框架,通过整合目标个体与数据库中所有成员之间的亲缘指数,计算基于证据的似然比和后验概率。该框架引入了两种选择方法——一种使用先验概率以提高准确性,另一种不使用先验概率,从而能够在量化置信区间内可靠识别DNA数据库中的亲属,该方法已在荷兰国家DNA数据库中得到验证。

ABSTRACT

Familial Searching is the process of searching in a DNA database for relatives of a certain individual. It is well known that in order to evaluate the genetic evidence in favour of a certain given form of relatedness between two individuals, one needs to calculate the appropriate likelihood ratio, which is in this context called a Kinship Index. Suppose that the database contains, for a given type of relative, at most one related individual. Given prior probabilities for being the relative for all persons in the database, we derive the likelihood ratio for each database member in favour of being that relative. This likelihood ratio takes all the Kinship Indices between the target individual and the members of the database into account. We also compute the corresponding posterior probabilities. We then discuss two methods to select a subset from the database that contains the relative with a known probability, or at least a useful lower bound thereof. One method needs prior probabilities and yields posterior probabilities, the other does not. We discuss the relation between the approaches, and illustrate the methods with familial searching carried out in the Dutch National DNA Database.

研究动机与目标

  • 开发一种统计框架,用于使用似然比评估家族DNA搜寻中的遗传证据。
  • 整合目标个体与数据库中所有成员之间的亲缘指数,以计算相关性的证据。
  • 利用先验概率,为每个数据库成员是亲属的后验概率推导出后验概率。
  • 提出两种方法,用于选择包含真实亲属的候选者子集,且该选择的概率已知或有界。
  • 使用来自荷兰国家DNA数据库的真实数据验证该方法。

提出的方法

  • 该方法通过聚合目标个体与每个数据库成员之间的亲缘指数,为每个数据库成员计算似然比。
  • 采用贝叶斯方法,基于先验概率推导出每个数据库成员为亲属的后验概率。
  • 一种选择方法使用先验概率计算后验概率,并根据高后验支持度选择候选者。
  • 另一种方法避免使用先验概率,采用基于阈值的选择策略,可保证包含真实亲属的概率下限。
  • 似然比由在相关性假设下观察到的基因分型概率与在无关性假设下观察到的概率之比推导得出。
  • 该框架已应用于荷兰国家DNA数据库,以评估其性能和可靠性。

实验结果

研究问题

  • RQ1当数据库中存在多个候选者时,如何为家族DNA搜寻计算似然比?
  • RQ2如何最优地选择一个数据库成员子集,使其以已知或有界的概率包含真实亲属?
  • RQ3先验概率如何影响识别亲属时后验概率的准确性?
  • RQ4使用先验信息与实现选择可靠性的保证下限之间存在何种权衡?
  • RQ5所提出的该方法在使用国家级DNA数据库数据的真实家族搜寻场景中表现如何?

主要发现

  • 每个数据库成员的似然比通过结合目标个体与数据库中所有个体之间的亲缘指数计算得出,为相关性提供了稳健的证据度量。
  • 后验概率通过贝叶斯更新推导得出,从而能够整合关于每个个体为亲属可能性的先验信念。
  • 使用先验概率的方法可产生更准确的后验概率,从而实现对潜在亲属的更好排序与选择。
  • 不使用先验概率的方法可提供包含真实亲属的概率下限,确保在缺乏先验信息时仍具备可靠性。
  • 该框架已成功应用于荷兰国家DNA数据库,证明其在真实家族搜寻场景中的可行性与统计合理性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。