[論文レビュー] ECG arrhythmia classification using a 2-D convolutional neural network
著者らはECGビートを128×128のグレースケール画像に変換し、2-D CNNを用いて8種類のビートを分類し、高い精度を達成し、MIT-BIHデータで10-fold cross-validationで検証している。彼らはAlexNetとVGGNetと比較し、データ拡張と最新の訓練技術を採用している。
In this paper, we propose an effective electrocardiogram (ECG) arrhythmia classification method using a deep two-dimensional convolutional neural network (CNN) which recently shows outstanding performance in the field of pattern recognition. Every ECG beat was transformed into a two-dimensional grayscale image as an input data for the CNN classifier. Optimization of the proposed CNN classifier includes various deep learning techniques such as batch normalization, data augmentation, Xavier initialization, and dropout. In addition, we compared our proposed classifier with two well-known CNN models; AlexNet and VGGNet. ECG recordings from the MIT-BIH arrhythmia database were used for the evaluation of the classifier. As a result, our classifier achieved 99.05% average accuracy with 97.85% average sensitivity. To precisely validate our CNN classifier, 10-fold cross-validation was performed at the evaluation which involves every ECG recording as a test data. Our experimental results have successfully validated that the proposed CNN classifier with the transformed ECG images can achieve excellent classification accuracy without any manual pre-processing of the ECG signals such as noise filtering, feature extraction, and feature reduction.
研究の動機と目的
- 自動的なECG不整脈検出を動機づけ、診断の一貫性を改善し、デバイス間での頑健なモニタリングを可能にする。
- 手動特徴抽出やノイズフィルタリングを回避するためにECG画像上で動作する2-D CNNを提案する。
- 標準的なCNNアーキテクチャと性能を評価し、強力なクロスバリデーション結果を確立する。
提案手法
- 各ECGビートをQ波ピークを中心とした128×128グレースケール画像へ変換する。
- 3×3カーネルとバッチ正規化、ドロップアウト、Xavier初期化を取り入れたVGGNetに触発された2-D CNNを設計・最適化する。
- ビートごとに9 variantsを切り抜くことでデータ拡張を行い、クラスをバランスさせ感度を向上させる。
- 初期学習率0.001のAdam最適化器と指数的減衰を使用し、平均感度で検証し、安定化後に停止する。
- MIT-BIHデータと10-fold stratified cross-validationを用いてAlexNetとVGGNetと比較する。
実験結果
リサーチクエスチョン
- RQ11-DのECG信号を2-D画像に変換することで、手動前処理なしにCNNで効果的な不整脈分類が可能か。
- RQ2データ拡張はまれな不整脈クラスの感度と全体の精度を向上させるか。
- RQ3提案した2-D CNNはMIT-BIHデータ上で確立されたCNNアーキテクチャ(AlexNet、VGGNet)とどう比較されるか。
- RQ4トレーニング戦略(バッチ正規化の配置、活性化の選択、初期化)がECG画像入力の性能に与える影響は何か。
主な発見
- 提案された2-D CNNは10-fold cross-validationで平均精度99.05%、平均感度97.85%を達成。
- データ拡張を用いると、モデルは0.989 AUC、99.05%の精度、97.85%の平均感度、98.55%のPPVを達成。
- AlexNetとVGGNetと比較すると、拡張を用いた提案モデルが総合精度とAUCで最良を示し、拡張を用いたAlexNetは特異度とPPVで最良を示す。
- 感度の拡張による改善は、APC、VFW、VEBクラスでとくに顕著で、それぞれ2.89%、2.75%、4.72%の獲得。
- この手法はECG画像上でノイズ除去や特徴抽出を明示的に行うことを避け、10-fold cross-validationにより記録間の頑健な評価を保証する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。