QUICK REVIEW

[논문 리뷰] Feature Extraction for Machine Learning Based Crackle Detection in Lung Sounds from a Health Survey

Morten Grønnesby, Juan Carlos Aviles Solis|arXiv (Cornell University)|2017. 05. 31.

Phonocardiography and Auscultation Techniques참고 문헌 21인용 수 27

한 줄 요약

이 논문은 대규모 건강 조사 데이터셋을 사용하여 청취기로 기록된 폐음에서의 자동 균열 감지를 위한 저차원적이고 계산 효율적인 기계학습 파이프라인을 제안한다. 시간 도메인 및 주파수 도메인 특징을 조합한 5차원 특징 벡터를 추출하고 RBF 커널을 사용한 SVM로 학습함으로써, 이 방법은 86% 정밀도와 84% 재현율을 달성하여 이전의 접근 방식을 능가하며 표준 하드웨어에서 실시간 구동이 가능하다.

ABSTRACT

In recent years, many innovative solutions for recording and viewing sounds from a stethoscope have become available. However, to fully utilize such devices, there is a need for an automated approach for detecting abnormal lung sounds, which is better than the existing methods that typically have been developed and evaluated using a small and non-diverse dataset. We propose a machine learning based approach for detecting crackles in lung sounds recorded using a stethoscope in a large health survey. Our method is trained and evaluated using 209 files with crackles classified by expert listeners. Our analysis pipeline is based on features extracted from small windows in audio files. We evaluated several feature extraction methods and classifiers. We evaluated the pipeline using a training set of 175 crackle windows and 208 normal windows. We did 100 cycles of cross validation where we shuffled training sets between cycles. For all the division between training and evaluation was 70%-30%. We found and evaluated a 5-dimenstional vector with four features from the time domain and one from the spectrum domain. We evaluated several classifiers and found SVM with a Radial Basis Function Kernel to perform best. Our approach had a precision of 86% and recall of 84% for classifying a crackle in a window, which is more accurate than found in studies of health personnel. The low-dimensional feature vector makes the SVM very fast. The model can be trained on a regular computer in 1.44 seconds, and 319 crackles can be classified in 1.08 seconds. Our approach detects and visualizes individual crackles in recorded audio files. It is accurate, fast, and has low resource requirements. It can be used to train health personnel or as part of a smartphone application for Bluetooth stethoscopes.

연구 동기 및 목표

대규모 건강 조사에서 청취기를 통해 기록된 폐음에서 균열을 자동으로 탐지할 수 있는 확장 가능한 방법을 개발하기 위해.
이전 방법들이 작은 비다양성 데이터셋과 수동 애너테이션에 의존하는 한계를 극복하기 위해.
교육을 받은 의료진이나 스마트폰 기반 블루투스 청취기 애플리케이션에 통합 가능한 저자원, 실시간 솔루션을 설계하기 위해.
교차검증을 통해 특징 추출 방법과 분류기의 성능을 평가하여 균열 감지에서 최적의 성능을 도출하기 위해.

제안 방법

이 방법은 폐음 오디오 파일을 분석하기 위해 고정된 길이의 작은 윈도우로 나누어 처리한다.
각 윈도우에서 네 개의 시간 도메인 특징(예: 제로 크로싱 레이트, 에너지, 엔트로피, 쿠르토시스)과 한 개의 주파수 도메인 특징(예: 스펙트럼 중심)을 포함한 5차원 특징 벡터를 추출한다.
모델의 정확성 평가를 위해 무작위로 70%-30%로 분할된 100중 교차검증을 실시한다.
성능 비교를 통해 RBF 커널을 사용한 서포트 벡터 머신(SVM)이 최적의 분류기로 선정되었다.
학습 데이터는 균열 윈도우 175개와 정상 윈도우 208개로 구성되며, 모든 학습 세트는 사이클 동안 무작위로 셔플된다.
시스템은 오디오 파일 내 개별 균열을 시각화할 수 있으며, 실시간 추론을 지원한다.

실험 결과

연구 질문

RQ1폐음에서 균열을 감지하기 위해 시간 도메인 및 주파수 도메인 특징의 최적 조합은 무엇인가?
RQ2다양하고 대규모인 건강 조사 데이터셋에서 다양한 분류기의 성능은 어떻게 비교되는가?
RQ3저차원 특징 벡터는 실시간 구동에 적합한 고정밀도, 저자원 감지에 가능하게 하는가?
RQ4전문가가 애너테이션한 데이터 기반으로 기존 접근 방식과 비교해 본다면, 제안된 방법의 정밀도와 재현율은 어떻게 되는가?

주요 결과

네 개의 시간 도메인 특징과 한 개의 주파수 도메인 특징을 조합한 제안된 5차원 특징 벡터가 가장 뛰어난 감지 성능을 보였다.
RBF 커널을 사용한 SVM가 모든 다른 분류기보다 뛰어나 86% 정밀도와 84% 재현율을 달성하여 균열 분류에서 뛰어난 성능을 보였다.
표준 컴퓨터에서 학습이 단 1.44초 만에 완료되어 높은 계산 효율성을 입증했다.
시스템은 1.08초 만에 319개의 균열을 분류하여 실시간 응용 프로그램에 적합함을 확인했다.
이 방법은 건강 관계자들이 수행한 연구에서 보고된 성능을 뛰어넘어 강력한 임상 잠재력을 보였다.
저차원 특징 공간과 효율적인 분류기는 스마트폰과 같은 저자원 장치에의 배포를 가능하게 했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.