QUICK REVIEW

[논문 리뷰] Cough Against COVID: Evidence of COVID-19 Signature in Cough Sounds

Piyush Bagad, Aman Dalmia|arXiv (Cornell University)|2020. 09. 17.

Music and Audio Processing참고 문헌 30인용 수 96

한 줄 요약

저자들은 의뢰된 기침 소리의 AI 분석이 COVID-19를 AUC 0.72로 탐지할 수 있으며, 질병 유병률이 5%일 때 데이터셋 3,621명 RT-PCR 결과를 가진 데이터로 테스트 능력을 43% 증가시킬 수 있음을 보인다.

ABSTRACT

Testing capacity for COVID-19 remains a challenge globally due to the lack of adequate supplies, trained personnel, and sample-processing equipment. These problems are even more acute in rural and underdeveloped regions. We demonstrate that solicited-cough sounds collected over a phone, when analysed by our AI model, have statistically significant signal indicative of COVID-19 status (AUC 0.72, t-test,p <0.01,95% CI 0.61-0.83). This holds true for asymptomatic patients as well. Towards this, we collect the largest known(to date) dataset of microbiologically confirmed COVID-19 cough sounds from 3,621 individuals. When used in a triaging step within an overall testing protocol, by enabling risk-stratification of individuals before confirmatory tests, our tool can increase the testing capacity of a healthcare system by 43% at disease prevalence of 5%, without additional supplies, trained personnel, or physical infrastructure

연구 동기 및 목표

자원이 제한된 환경에서 COVID-19 테스트 능력을 보강하기 위한 확장 가능한 비침습적 선별을 동기 부여한다.
RT-PCR 결과와 연결된 대규모 미생물 확인 기침 데이터셋을 수집·정리한다.
AI 모델을 사용하여 의뢰된 기침 소리에서 통계적으로 유의한 COVID-19 신호를 입증한다.

제안 방법

End-to-end CNN 모델 (ResNet-18) 은 2초 기침 구간에서 얻은 로그-멜 스펙트로그램을 처리한다.
데이터 증강은 외부 노이즈와 시간-주파수 마스킹으로 포함된다.
가중치를 초기화하기 위한 오픈 소스 기침 데이터셋에서의 프리트레이닝; RT-PCR 라벨 노이즈를 다루기 위한 라벨 스무딩.
추론은 세그먼트 예측을 중앙값으로 집계하며, 각 개인에 대해 세 기침 샘플의 최대치를 사용한다.
삼중 계층화된 교차 검증 5-fold를 사용하고 삼진에 대한 민감도 중심의 평가를 강조한다.

실험 결과

연구 질문

RQ1의료 미생물학적으로 확인된 데이터에서 AI를 사용해 의뢰된 기침 소리로 COVID-19 상태를 탐지할 수 있는가?
RQ2무증상의 개인의 기침 소리에서 COVID-19 시그니처가 검출 가능한가?
RQ3제안된 기침 기반 선별이 서로 다른 질병 유병률에서 테스트 능력에 어떤 영향을 미치는가?
RQ4사전학습과 라벨 스무딩이 모델 성능에 어떤 기여를 하는가?
RQ5세그먼트 길이와 앙상블이 분류 성능에 어떤 영향을 주는가?

주요 결과

COVID-19 시그니처는 기침 소리에 통계적으로 유의미하며(p<0.01; CI 95% 0.61–0.83) AUC 0.72이다.
무증상 인원에서도 모델 성능이 무작위 수준을 상회하며 신호가 있음을 시사한다.
5% 유병률에서의 선별 구성은 유효 테스트 능력을 43% 증가시킬 수 있다.
프리트레이닝은 AUC를 크게 향상시킨다(약 17% 이득).
라벨 스무딩은 AUC와 민감도 90%에서 특이도를 개선하고 모델 보정을 향상시킨다.
2초 오디오 구간이 1초 구간보다 우수하며, 깊은 모델과 얕은 모델의 앙상블이 최상의 성능을 yield한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.