QUICK REVIEW

[論文レビュー] Cough Against COVID: Evidence of COVID-19 Signature in Cough Sounds

Piyush Bagad, Aman Dalmia|arXiv (Cornell University)|Sep 17, 2020

Music and Audio Processing参考文献 30被引用数 96

ひとこと要約

著者は、要請された咳音のAI分析がCOVID-19を検出し、AUCの0.72で検出でき、5%の疾病流行率で検査能力を43%向上させることができる、RT-PCR結果を持つ3,621名のデータセットを用いて示している。

ABSTRACT

Testing capacity for COVID-19 remains a challenge globally due to the lack of adequate supplies, trained personnel, and sample-processing equipment. These problems are even more acute in rural and underdeveloped regions. We demonstrate that solicited-cough sounds collected over a phone, when analysed by our AI model, have statistically significant signal indicative of COVID-19 status (AUC 0.72, t-test,p <0.01,95% CI 0.61-0.83). This holds true for asymptomatic patients as well. Towards this, we collect the largest known(to date) dataset of microbiologically confirmed COVID-19 cough sounds from 3,621 individuals. When used in a triaging step within an overall testing protocol, by enabling risk-stratification of individuals before confirmatory tests, our tool can increase the testing capacity of a healthcare system by 43% at disease prevalence of 5%, without additional supplies, trained personnel, or physical infrastructure

研究の動機と目的

スケーラブルで非侵襲的なトリアージを動機づけ、資源が限られた場所でCOVID-19検査能力を補強する。
RT-PCR結果に結びついた大規模で生物学的に確認された咳データセットを収集・整理する。
AIモデルを用いて、要請された咳音のCOVID-19信号を統計的に有意に示す。

提案手法

エンドツーエンドのCNNモデル（ResNet-18）が、2秒間の咳セグメントから導出されたlog-melスペクトログラムを処理する。
外部ノイズや時間周波数マスキングを用いたデータ拡張を含む訓練。
重みを初期化するため Open-source coughデータセットでの事前学習；RT-PCRラベルノイズを処理するためのラベルスムージング。
推論はセグメント予測を中央値で集約；個々の被験者については3つの咳サンプルの最大値を使用。
評価は5-foldの5分割による3重層クロスバリデーションを用い、トリアージの高感度を重視。

実験結果

リサーチクエスチョン

RQ1AIを用いた微生物学的に確認されたデータから、要請された咳音からCOVID-19の状態を検出できるか？
RQ2無症候性個体の咳音にCOVID-19の署名が検出可能か？
RQ3提案された咳ベースのトリアージは、異なる疾病流行率で検査能力へどのような影響を与えるか？
RQ4事前学習とラベルスムージングがモデル性能にどの程度寄与するか？
RQ5セグメント長とアンサンブルは分類性能にどう影響するか？

主な発見

咳音のCOVID-19署名は統計的に有意である（p<0.01；95% CI 0.61–0.83）、AUCは0.72。
無症候性の個人でもモデルの性能はランダムを上回り、症状がなくても検出可能な信号を示す。
5%の流行率でのトリアージ設定は、実効検査能力を43%向上させる。
事前学習はAUCを顕著に改善（事前学習で約17%の獲得）。
ラベルスムージングは感度90%でAUCと特異度を改善し、モデルのキャリブレーションを向上させる。
2秒の音声セグメントは1秒のセグメントより優れ、深層と浅層モデルのアンサンブルが最良の性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。