QUICK REVIEW

[논문 리뷰] Database likelihood ratios and familial DNA searching

Klaas Slooten, Ronald Meester|arXiv (Cornell University)|2012. 01. 20.

Forensic and Genetic Research참고 문헌 4인용 수 2

한 줄 요약

이 논문은 가족 내 DNA 검색을 위한 우도비 프레임워크를 제안하며, 대상 개인과 데이터베이스 내 모든 구성원 간의 친연지수를 통합하여 증거 기반의 우도비와 사후 확률을 계산한다. 두 가지 선택 방법을 도입하여 정확도를 높이는 방법과 이를 생략하는 방법을 제공함으로써, 양측의 신뢰도 경계를 정량화한 채로 DNA 데이터베이스 내 친족을 신뢰성 있게 식별할 수 있도록 한다. 이는 네덜란드 국립 DNA 데이터베이스에서 검증되었다.

ABSTRACT

Familial Searching is the process of searching in a DNA database for relatives of a certain individual. It is well known that in order to evaluate the genetic evidence in favour of a certain given form of relatedness between two individuals, one needs to calculate the appropriate likelihood ratio, which is in this context called a Kinship Index. Suppose that the database contains, for a given type of relative, at most one related individual. Given prior probabilities for being the relative for all persons in the database, we derive the likelihood ratio for each database member in favour of being that relative. This likelihood ratio takes all the Kinship Indices between the target individual and the members of the database into account. We also compute the corresponding posterior probabilities. We then discuss two methods to select a subset from the database that contains the relative with a known probability, or at least a useful lower bound thereof. One method needs prior probabilities and yields posterior probabilities, the other does not. We discuss the relation between the approaches, and illustrate the methods with familial searching carried out in the Dutch National DNA Database.

연구 동기 및 목표

유전적 증거 평가를 위한 통계적 프레임워크를 개발하여 우도비를 활용한 가족 내 DNA 검색에 응용한다.
대상 개인과 데이터베이스 내 모든 구성원 간의 친연지수를 통합하여 관련성 증거를 계산한다.
사전 확률을 사용하여 각 데이터베이스 구성원이 친족일 확률에 대한 사후 확률을 유도한다.
진짜 친족을 포함하는 후보자 집합을 알려진 확률 또는 경계 확률로 선택하는 두 가지 방법을 제안한다.
네덜란드 국립 DNA 데이터베이스의 실제 데이터를 사용하여 접근법을 검증한다.

제안 방법

해당 방법은 대상자와 각 개인 간의 친연지수를 집계하여 각 데이터베이스 구성원에 대해 우도비를 계산한다.
베이지안 접근법을 사용하여 사전 확률을 바탕으로 각 데이터베이스 구성원이 친족일 사후 확률을 유도한다.
한 선택 방법은 사전 확률을 사용하여 사후 확률을 계산하고, 높은 사후 지지도를 기반으로 후보자를 선정한다.
다른 방법은 사전 확률을 회피하고 임계값 기반 선택을 통해 진짜 친족을 포함할 확률의 하한을 보장한다.
우도비는 관련성 가정 하에서 유전적 프로파일의 확률을 비관계자 가정 하와 비교하여 유도된다.
이 프레임워크는 성능과 신뢰성을 평가하기 위해 네덜란드 국립 DNA 데이터베이스에 적용되었다.

실험 결과

연구 질문

RQ1데이터베이스에 다수의 후보자가 존재할 경우, 가족 내 DNA 검색을 위한 우도비는 어떻게 계산할 수 있는가?
RQ2진짜 친족을 포함하는 데이터베이스 구성원의 부분집합을 선택하는 최적의 방법은 무엇인가? 이 선택의 확률은 알려져 있거나 경계되어야 한다.
RQ3사전 확률은 친족 식별에서 사후 확률의 정확도에 어떤 영향을 미치는가?
RQ4사전 정보를 사용하는 것과 선택 신뢰도의 보장된 하한을 얻는 것 사이의 상충 관계는 무엇인가?
RQ5제안된 방법은 국가 DNA 데이터베이스 데이터를 사용한 실제 가족 내 검색 상황에서 어떻게 성능을 발휘하는가?

주요 결과

각 데이터베이스 구성원에 대한 우도비는 대상자와 데이터베이스 내 모든 개인 간의 친연지수를 통합하여 계산되며, 이는 관련성에 대한 강력한 증거 측도를 제공한다.
사후 확률은 베이지안 업데이트를 통해 도출되며, 각 개인이 친족일 가능성이 사전 믿음의 통합을 가능하게 한다.
사전 확률을 사용하는 방법은 더 정확한 사후 확률을 도출하여 잠재적 친족의 순위 매기기와 선정에 더 유리하다.
사전 확률을 사용하지 않는 방법은 진짜 친족을 포함할 확률의 하한을 보장하므로, 사전 정보가 없더라도 신뢰성 있는 결과를 보장한다.
이 프레임워크는 네덜란드 국립 DNA 데이터베이스에 성공적으로 적용되어 실제 가족 내 검색 상황에서의 실현 가능성과 통계적 타당성을 입증했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.