[논문 리뷰] A Comparison of 1-D and 2-D Deep Convolutional Neural Networks in ECG Classification
본 논문은 1-D ECG 신호 입력과 2-D ECG 이미지 입력을 AlexNet 유사 CNN으로 비교하고, ImageNet 가중치로 초기화된 2-D CNN이 MIT-BIH에서 98% 정확도를 달성하며 데이터가 제한될 때 특히 20–35 dB SNR 구간에서도 강건하다는 것을 보인다.
Effective detection of arrhythmia is an important task in the remote monitoring of electrocardiogram (ECG). The traditional ECG recognition depends on the judgment of the clinicians' experience, but the results suffer from the probability of human error due to the fatigue. To solve this problem, an ECG signal classification method based on the images is presented to classify ECG signals into normal and abnormal beats by using two-dimensional convolutional neural networks (2D-CNNs). First, we compare the accuracy and robustness between one-dimensional ECG signal input method and two-dimensional image input method in AlexNet network. Then, in order to alleviate the overfitting problem in two-dimensional network, we initialize AlexNet-like network with weights trained on ImageNet, to fit the training ECG images and fine-tune the model, and to further improve the accuracy and robustness of ECG classification. The performance evaluated on the MIT-BIH arrhythmia database demonstrates that the proposed method can achieve the accuracy of 98% and maintain high accuracy within SNR range from 20 dB to 35 dB. The experiment shows that the 2D-CNNs initialized with AlexNet weights performs better than one-dimensional signal method without a large-scale dataset.
연구 동기 및 목표
- 피로로 인한 인간 실수를 줄이기 위한 신뢰할 수 있는 자동 ECG 부정맥 탐지를 촉진한다.
- CNN을 이용한 2-D 영상 표현이 ECG 분류에서 1-D 신호 입력보다 성능을 발휘하는지 조사한다.
- 제한된 데이터에서 과적합을 완화하기 위해 2-D ECG 분류기의 ImageNet 사전학습의 영향력을 평가한다.
제안 방법
- ECG 신호를 2-D CNN 입력용 이미지 표현으로 변환한다.
- AlexNet 유사 네트워크를 사용하여 1-D ECG 신호 입력과 2-D 이미지 입력 간의 정확도와 강건성을 비교한다.
- 2-D 네트워크를 ImageNet에서 사전 학습된 가중치로 초기화하고 ECG 이미지에 대해 미세조정한다.
- MIT-BIH 부정맥 데이터베이스에서 성능을 평가한다.
- 20 dB에서 35 dB까지의 SNR 구간에서 강건성을 평가한다.
실험 결과
연구 질문
- RQ1제한된 학습 데이터에서 2-D 이미지 기반 CNN이 1-D 신호 기반 CNN보다 ECG 분류에서 더 나은 성능을 보이는가?
- RQ2ImageNet 사전학습이 2-D ECG 분류기가 더 높은 정확도와 강건성을 얻는 데 도움이 되는가?
- RQ3두 입력 표현에 대해 잡음 수준(SNR 20–35 dB)에 따라 성능이 어떻게 달라지는가?
주요 결과
- ImageNet 가중치로 초기화된 2-D CNN이 1-D 입력 방법보다 더 높은 정확도를 달성한다.
- MIT-BIH에서 제안된 2-D 방법은 98% 정확도에 도달한다.
- 2-D 방식은 20–35 dB의 SNR 구간에서 높은 정확도를 유지한다.
- 학습 데이터가 많지 않을 때 ImageNet 사전 학습된 2-D 네트워크가 과적합 완화에 도움을 준다.
- 대규모 라벨링 데이터셋이 없을 때 이미지 기반 ECG 분류의 이점을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.