QUICK REVIEW

[論文レビュー] Recognizing Abnormal Heart Sounds Using Deep Learning

Jonathan Rubin, Rui Abreu|arXiv (Cornell University)|Jul 14, 2017

Phonocardiography and Auscultation Techniques参考文献 18被引用数 37

ひとこと要約

本論文は、メル周波数 cepstral コefficient (MFCC) ヒートマップと畳み込みニューラルネットワーク (CNN) を用いて、正常および異常な心音を分類するためのディープラーニング手法を提示する。この手法は、感度と特異度の最適化を図る修正された損失関数を用い、2016年 PhysioNet チャレンジにおいて95％の特異度と73％の感度を達成し、48チーム中8位となり、単一の CNN として特異度で他を上回り、上位のアンサンブルベースのモデルとほぼ同等の性能を示した。

ABSTRACT

The work presented here applies deep learning to the task of automated cardiac auscultation, i.e. recognizing abnormalities in heart sounds. We describe an automated heart sound classification algorithm that combines the use of time-frequency heat map representations with a deep convolutional neural network (CNN). Given the cost-sensitive nature of misclassification, our CNN architecture is trained using a modified loss function that directly optimizes the trade-off between sensitivity and specificity. We evaluated our algorithm at the 2016 PhysioNet Computing in Cardiology challenge where the objective was to accurately classify normal and abnormal heart sounds from single, short, potentially noisy recordings. Our entry to the challenge achieved a final specificity of 0.95, sensitivity of 0.73 and overall score of 0.84. We achieved the greatest specificity score out of all challenge entries and, using just a single CNN, our algorithm differed in overall score by only 0.02 compared to the top place finisher, which used an ensemble approach.

研究の動機と目的

ディープラーニングを用いて、正常および異常な心音を自動的に分類するためのシステムを開発すること。
医療診断における誤分類のコストセンシティブな性質に対処し、感度と特異度のトレードオフを最適化すること。
実世界のノイズの多いPCG記録において、アンサンブル手法と同等の性能を示す、堅牢で単一のCNNに依存するソリューションを構築すること。
2016年 PhysioNet Computing in Cardiology チャレンジのデータセットを用いて、低品質でノイズの多い心音記録の分類を評価すること。

提案手法

S1心音を起点として、論理的回帰を用いた隠れ半マルコフモデルを用いて、心音波形を個々の心拍に分割する。
各分割された心拍は、メル周波数 cepstral コefficient (MFCC) を用いて2次元のスペクトログラム（ヒートマップ）に変換され、時間周波数エネルギー分布を表現する。
深層畳み込みニューラルネットワーク (CNN) を用いて、これらのMFCCヒートマップを正常または異常として分類する。このプロセスにより、自動的な特徴抽出が行われる。
CNNは、臨床的優先順位を反映するように、感度と特異度のバランスを直接最適化する修正された損失関数を用いて学習される。
モデルは、健康および疾患を有する被験者からの信号品質が異なる記録を含む、2016年 PhysioNet チャレンジのデータセットを用いて評価される。
性能は、重み付き感度と特異度を用いて測定され、全体のスコアは両者の平均値として計算される。

実験結果

リサーチクエスチョン

RQ1ノイズの多い単一チャネルPCG記録から、単一のディープCNNが正常および異常な心音を効果的に分類できるか？
RQ2感度と特異度のトレードオフを最適化するコストセンシティブな損失関数は、心音分類における臨床的関連性をどのように向上させるか？
RQ3単一のCNNは、実世界の医療チャレンジ環境においてアンサンブル手法と同等の性能を達成できるか？
RQ4信号品質の悪さが、自動心音分析におけるディープラーニングモデルの性能にどの程度影響を及えるか？

主な発見

提案手法は、参加チームの中で最高水準の0.9521の特異度を達成し、誤って陽性と判定するケース（偽陽性）の制御が優れていることを示した。
感度は0.7278を達成し、特にノイズの多い記録においても異常例を検出する能力は中程度の水準であった。
全体スコア0.8399は、48チーム中8位であり、上位のアンサンブルベースのソリューションと0.02の差にとどまった。
ベンチマークエントリ（スコア：0.7057）を大きく上回ったことから、本手法の堅牢性と有効性が確認された。
単一のCNNのみを用いても、アンサンブルベースのモデルとほぼ同等の性能を達成したため、強力な一般化能力と効率性を示した。
良好な信号品質の記録から不良な信号品質の記録まで、モデルの性能は安定しており、実世界のデータ変動に耐性があることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。