QUICK REVIEW

[논문 리뷰] A statistical model of COVID-19 testing in populations: effects of sampling bias and testing errors

Lucas Böttcher, Maria R. D’Orsogna|arXiv (Cornell University)|2021. 05. 24.

SARS-CoV-2 detection and testing참고 문헌 31인용 수 20

한 줄 요약

이 논문은 코로나19 유병률 추정에서 위양성, 위음성 및 검사 편향을 보정하는 통계 모델을 제시한다. 오차율과 표본 편향을 고려한 이진 검사 결과를 모델링함으로써, 실제 검사 데이터로부터 진짜 감염 유병률과 사망률 비율을 최대우도추정법으로 추정할 수 있는 프레임워크를 제공하며, 편향과 오류로 인해 공식 사례 보고에 심각한 왜곡이 발생하고 있음을 드러낸다.

ABSTRACT

We develop a statistical model for the testing of disease prevalence in a population. The model assumes a binary test result, positive or negative, but allows for biases in sample selection and both type I (false positive) and type II (false negative) testing errors. Our model also incorporates multiple test types and is able to distinguish between retesting and exclusion after testing. Our quantitative framework allows us to directly interpret testing results as a function of errors and biases. By applying our testing model to COVID-19 testing data and actual case data from specific jurisdictions, we are able to estimate and provide uncertainty quantification of indices that are crucial in a pandemic, such as disease prevalence and fatality ratios. This article is part of the theme issue 'Data science approach to infectious disease surveillance'.

연구 동기 및 목표

코로나19 패an드레미크 시기 동안 편향되고 정확도가 떨어지는 검사로 인한 진짜 질병 유병률 추정의 심각한 과제를 해결하기 위해.
위양성률(FPR)과 위음성률(FNR)이 보고된 사례 수와 감시 지표에 미치는 영향을 정량화하기 위해.
특히 증상이 있거나 고위험군이 공식 사례 데이터에 과잉으로 포함된 경우를 고려한 검사 표본 편향을 보정하기 위해.
편향된 검사와 검사 오류를 보정함으로써 진짜 감염 사망률(IFR)을 추정하기 위해.
이진 검사 결과와 알려진 오차율을 가진 모든 전염병에 적용 가능한 일반화 가능한 프레임워크를 제공하기 위해.

제안 방법

지정된 위양성률(FPR)과 위음성률(FNR)을 가진 이진 검사 결과(양성/음성)를 위한 통계 모델을 개발한다.
감염자에 대한 선호적 검사(FPR > 0) 또는 취약자에 대한 선호적 검사(FPR < 0)를 모델링하기 위해 검사 편향 매개변수 b를 통합한다.
관측된 검사 데이터로부터 진짜 감염 비율 f와 편향 매개변수 b를 추정하기 위해 최대우도추정(MLE)을 사용한다.
관측된 검사 결과를 진짜 기저 유병률로 매핑하는 보정된 양성률 함수 µ(f, b, FPR, FNR)를 유도한다.
무작위 표본 채취를 통한 혈액항체검사와 PCR 검사를 금표로 사용하여 독일 갠게르트의 실제 데이터를 적용한다.
편향되지 않은 표본(15.53%)과 편향된 공식 보고(10%) 사이의 관측된 차이를 바탕으로 편향(b = -0.50)을 추정한다.

실험 결과

연구 질문

RQ1위양성 및 위음성 검사 오류는 실생활 데이터에서 보고된 사례 유병률을 어떻게 왜곡하는가?
RQ2증상이 있거나 고위험군을 우선적으로 검사하는 것이 보고된 감염률에 어느 정도 편향을 초래하는가?
RQ3통계 모델이 검사 오류와 표본 편향을 동시에 보정하여 진짜 감염 유병률을 추정할 수 있는가?
RQ4검사 편향과 오류율은 공식 사례 및 사망 데이터에서 감염 사망률(IFR) 추정에 어떻게 영향을 미치는가?
RQ5편향된 검사가 실시간 전염병 감시 지표의 신뢰성에 어떤 영향을 미치는가?

주요 결과

노르트라인베스트팔렌에서 모델은 b = -0.50의 검사 편향을 추정하여 공식 검사 데이터에 감염자가 현저하게 과잉 포함되어 있음을 시사하며, 이는 갠게르트가 핫스팟이었을 가능성이 있다.
편향되지 않은 표본 데이터(f = 15.53%)를 사용하여, 공식 보고된 양성률 10%를 진짜 기저 유병률 15.53%로 보정한다.
편향을 보정한 후 감염 사망률(IFR)은 0.36% (95% 신뢰구간: 0.29%–0.45%)로 추정되며, 편향을 간과할 경우 오해의 소지가 있는 관측된 IFR와 대비된다.
더 높은 편향된 양성률 20%는 b = 0.31의 추정된 검사 편향을 암시하며, 이는 모델이 데이터 입력에 민감함을 보여준다.
모델은 양성 검사 편향(b > 0)이 진짜 IFR를 과소평가하고, 음성 편향(b < 0)이 이를 과대평가함을 보여주며, 이는 편향 보정의 필요성을 강조한다.
이 프레임워크는 진짜 유병률과 IFR와 같은 핵심 역학 지표의 불확실성 정량화를 가능하게 하여 공중보건 의사결정의 신뢰도를 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.