QUICK REVIEW

[논문 리뷰] Recognizing Abnormal Heart Sounds Using Deep Learning

Jonathan Rubin, Rui Abreu|arXiv (Cornell University)|2017. 07. 14.

Phonocardiography and Auscultation Techniques참고 문헌 18인용 수 37

한 줄 요약

이 논문은 메르-주파수 체프스트랄 계수(MFCC) 히트맵과 합성곱 신경망(CNN)을 사용하여 정상 및 비정상 심장음을 분류하기 위한 딥러닝 접근법을 제시한다. 이 방법은 수정된 손실 함수를 통해 민감도와 특이도를 최적화하여, 2016년 PhysioNet 챌린지에서 95%의 특이도와 73%의 민감도를 기록했으며, 단일 CNN을 사용해 48支 중 8위를 기록했으며, 특이도에서는 다른 팀을 압도하고 최상위 앙상블 기반 모델과 유사한 성능을 보였다.

ABSTRACT

The work presented here applies deep learning to the task of automated cardiac auscultation, i.e. recognizing abnormalities in heart sounds. We describe an automated heart sound classification algorithm that combines the use of time-frequency heat map representations with a deep convolutional neural network (CNN). Given the cost-sensitive nature of misclassification, our CNN architecture is trained using a modified loss function that directly optimizes the trade-off between sensitivity and specificity. We evaluated our algorithm at the 2016 PhysioNet Computing in Cardiology challenge where the objective was to accurately classify normal and abnormal heart sounds from single, short, potentially noisy recordings. Our entry to the challenge achieved a final specificity of 0.95, sensitivity of 0.73 and overall score of 0.84. We achieved the greatest specificity score out of all challenge entries and, using just a single CNN, our algorithm differed in overall score by only 0.02 compared to the top place finisher, which used an ensemble approach.

연구 동기 및 목표

딥러닝을 활용하여 정상 및 비정상 심장음을 자동으로 분류하는 시스템을 개발하기 위해.
의료 진단에서 잘못된 분류의 비용 감수성 특성을 고려하여 민감도와 특이도 간의 트레이드오프를 최적화하기 위해.
실제 노이즈가 많은 PCG 기록 환경에서 앙상블 방법과 경쟁 가능한 성능을 보이는 강력한 단일-CNN 솔루션을 만들기 위해.
2016년 PhysioNet Computing in Cardiology 챌린지에서 저품질 및 노이즈가 많은 심장음 기록을 분류하는 데에 이 방법을 평가하기 위해.

제안 방법

모델은 S1 심장음에서 시작하여 로지스틱 회귀 숨겨진 반 Markov 모델을 사용해 심장음 파형을 개별 심장박동으로 분할한다.
각 분할된 심장박동은 시간-주파수 에너지 분포를 표현하기 위해 멜-주파수 체프스트랄 계수(MFCC)를 사용해 2차원 스펙트로그램(히트맵)으로 변환된다.
딥러닝 합성곱 신경망(CNN)은 이러한 MFCC 히트맵을 정상 또는 비정상으로 분류하도록 훈련되며, 자동으로 특징 추출을 수행한다.
CNN은 민감도와 특이도 간 균형을 직접 최적화하는 수정된 손실 함수를 사용해 훈련되며, 임상적 우선순위를 반영한다.
모델은 다양한 신호 품질을 가진 건강한 사람과 환자로부터의 기록을 포함한 2016년 PhysioNet 챌린지 데이터셋에서 평가된다.
성능는 가중 민감도와 특이도를 사용해 측정되며, 총점은 두 값의 평균으로 계산된다.

실험 결과

연구 질문

RQ1노이즈가 많은 단일 채널 PCG 기록에서 단일 딥러닝 CNN이 정상 및 비정상 심장음을 효과적으로 분류할 수 있는가?
RQ2민감도와 특이도 트레이드오프를 최적화하는 비용 감수성 손실 함수는 심장음 분류의 임상적 관련성을 어떻게 향상시키는가?
RQ3단일 CNN이 실생활 의료 챌린지 환경에서 앙상블 방법과 유사한 성능을 달성할 수 있는가?
RQ4신호 품질이 자동 심장음 분석에서 딥러닝 모델의 성능에 얼마나 큰 영향을 미치는가?

주요 결과

제안된 방법은 0.9521의 특이도를 기록하여 챌린지 참가자 중 가장 높은 기록을 달성했으며, 가짜 양성 결과를 강력하게 제어함을 보여주었다.
모델은 0.7278의 민감도를 기록하여 비정상 케이스를 탐지하는 데 중간 정도의 능력을 보였으며, 특히 노이즈가 많은 기록에서 유사한 성능를 유지했다.
총점 0.8399로 48팀 중 8위를 기록했으며, 상위 팀의 앙상블 기반 솔루션과 0.02의 차이로 매우 근접한 성능를 보였다.
기준 성능 기준 팀(점수: 0.7057)을 상당한 격차로 앞서며, 본 방법의 강건성과 효과성을 확인했다.
단일 CNN만을 사용했음에도 불구하고 앙상블 기반 모델과 유사한 성능를 달성하여, 강력한 일반화 능력과 효율성을 시사했다.
모델의 성능는 양호한 품질의 기록과 열악한 품질의 기록 모두에서 안정적이었으며, 실생활 데이터 변동성에 대한 내성적 특성을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.