Skip to main content
QUICK REVIEW

[论文解读] Recognizing Abnormal Heart Sounds Using Deep Learning

Jonathan Rubin, Rui Abreu|arXiv (Cornell University)|Jul 14, 2017
Phonocardiography and Auscultation Techniques参考文献 18被引用 37
一句话总结

本文提出一种基于深度学习的方法,利用梅尔频率倒谱系数(MFCC)热图与卷积神经网络(CNN)对正常和异常心音进行分类。该方法通过改进的损失函数优化灵敏度与特异性,于2016年PhysioNet挑战赛中实现95%的特异性与73%的灵敏度,在48支队伍中排名第八,仅使用单一CNN模型,其特异性表现优于其他模型,且与顶尖的集成模型方法表现接近。

ABSTRACT

The work presented here applies deep learning to the task of automated cardiac auscultation, i.e. recognizing abnormalities in heart sounds. We describe an automated heart sound classification algorithm that combines the use of time-frequency heat map representations with a deep convolutional neural network (CNN). Given the cost-sensitive nature of misclassification, our CNN architecture is trained using a modified loss function that directly optimizes the trade-off between sensitivity and specificity. We evaluated our algorithm at the 2016 PhysioNet Computing in Cardiology challenge where the objective was to accurately classify normal and abnormal heart sounds from single, short, potentially noisy recordings. Our entry to the challenge achieved a final specificity of 0.95, sensitivity of 0.73 and overall score of 0.84. We achieved the greatest specificity score out of all challenge entries and, using just a single CNN, our algorithm differed in overall score by only 0.02 compared to the top place finisher, which used an ensemble approach.

研究动机与目标

  • 开发一种基于深度学习的自动化系统,用于对正常与异常心音进行分类。
  • 通过优化灵敏度与特异性之间的权衡,解决医疗诊断中误分类的代价敏感性问题。
  • 构建一种稳健的单CNN解决方案,在真实世界中噪声较多的PCG录音中,性能可与集成方法相媲美。
  • 在2016年PhysioNet计算心脏病学挑战赛中评估该方法,该挑战要求对低质量且嘈杂的心音录音进行分类。

提出的方法

  • 该方法使用逻辑回归隐半马尔可夫模型,从S1心音开始,将心音波形分割为单个心动周期。
  • 每个分割后的心动周期通过梅尔频率倒谱系数(MFCC)转换为二维频谱图(热图),以表示时频能量分布。
  • 训练一个深度卷积神经网络(CNN),对这些MFCC热图进行分类,判断其为正常或异常,实现自动特征提取。
  • CNN采用改进的损失函数进行训练,直接优化灵敏度与特异性之间的平衡,反映临床优先考虑。
  • 在2016年PhysioNet挑战赛数据集上评估该模型,该数据集包含来自健康与患病个体的多种信号质量的录音。
  • 性能通过加权灵敏度与特异性进行衡量,总分计算为两者平均值。

实验结果

研究问题

  • RQ1单个深度CNN能否有效对来自嘈杂、单通道PCG录音的正常与异常心音进行分类?
  • RQ2一种优化灵敏度与特异性权衡的成本敏感损失函数,在心音分类中如何提升临床相关性?
  • RQ3在真实世界医疗挑战环境中,单个CNN能否实现与集成方法相当的性能?
  • RQ4信号质量在多大程度上影响深度学习模型在自动化心音分析中的表现?

主要发现

  • 所提方法实现了0.9521的特异性,为所有参赛作品中的最高值,表明对假阳性具有极强的控制能力。
  • 模型实现了0.7278的灵敏度,表明其在检测异常病例方面具备中等能力,尤其在噪声较大的录音中表现稳定。
  • 总得分为0.8399,在48支队伍中位列第8名,仅比排名第一的集成方法低0.02分。
  • 与基准参赛作品(得分:0.7057)相比,性能有显著提升,证实了本方法的稳健性与有效性。
  • 尽管仅使用单一CNN,其性能已接近集成方法,表明具备强大的泛化能力与效率。
  • 模型在高质量与低质量信号录音中均表现出稳定性能,表明对真实世界数据的多样性具有强鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。