Skip to main content
QUICK REVIEW

[论文解读] SSC-UNet: UNet with Self-Supervised Contrastive Learning for Phonocardiography Noise Reduction

Lizy Abraham, Siobhan Coughlan|arXiv (Cornell University)|Jan 7, 2026
Phonocardiography and Auscultation Techniques被引用 0
一句话总结

本论文提出 SSC-UNet,一种基于自监督 Noise2Noise 的去噪模型,结合对比学习用于心音图,提升在没有干净数据情况下的噪声抑制并保留病理特征。

ABSTRACT

Congenital Heart Disease (CHD) remains a significant global health concern affecting approximately 1\% of births worldwide. Phonocardiography has emerged as a supplementary tool to diagnose CHD cost-effectively. However, the performance of these diagnostic models highly depends on the quality of the phonocardiography, thus, noise reduction is particularly critical. Supervised UNet effectively improves noise reduction capabilities, but limited clean data hinders its application. The complex time-frequency characteristics of phonocardiography further complicate finding the balance between effectively removing noise and preserving pathological features. In this study, we proposed a self-supervised phonocardiography noise reduction model based on Noise2Noise to enable training without clean data. Augmentation and contrastive learning are applied to enhance its performance. We obtained an average SNR of 12.98 dB after filtering under 10~dB of hospital noise. Classification sensitivity after filtering was improved from 27\% to 88\%, indicating its promising pathological feature retention capabilities in practical noisy environments.

研究动机与目标

  • 解决清洁心音图数据用于去噪的稀缺性。
  • 基于 Noise2NoiseDevelop 一个端到端的自监督去噪模型。
  • 结合对比学习以保留病理特征并减少幻觉。
  • 在多样的真实世界噪声场景中评估去噪性能,并评估对 CHD 分类的影响。
  • 展示鲁棒性以及对其他生理信号潜在的泛化能力。

提出的方法

  • 采用带 BiLSTM 跳跃连接的四层 U-Net(LU-Net)以保留时间细节。
  • 通过投影头将瓶颈特征投射到对比空间。
  • 使用组合损失进行训练:重构损失(MSE)+ 对比损失以将同一样本的增强进行聚类。
  • 通过在嘈杂的 PCG 输入中注入额外失真来实现 Noise2Noise 启发式训练,无需干净目标。
  • 实现一个对比学习框架,其中正样本对为同一样本的增强,负样本为其他样本,优化一个稳定性感知的潜在空间。
  • 在增强的 PCG 数据上进行端到端训练并与基线去噪模型进行对比评估。

实验结果

研究问题

  • RQ1无需干净数据即可训练的自监督去噪模型是否能在嘈杂心音图上实现具有竞争力的 SNR 提升?
  • RQ2对比学习是否有助于在基于 UNet 的 PCG 去噪中保留致病特征并减少幻觉?
  • RQ3SSC-UNet 在不同噪声类型(白噪声、粉红噪声、红噪声、医院噪声、肺部噪声)和噪声水平下的表现如何?
  • RQ4在嘈杂条件下去噪对下游 CHD 分类鲁棒性的影响是什么?

主要发现

  • SSC-UNet 在多种噪声条件下在输出 SNR 方面优于传统的基于 UNet 的去噪方法。
  • 在 0 dB 医院噪声下,SSC-UNet 的 SNR 为 14 dB,高于 FCN、U-Net 和 LU-Net 基线。
  • 对比学习有助于降低模糊和幻觉,改善病理性 PCG 特征的保留。
  • 该方法在嘈杂条件下提升了下游五类 CHD 分类的性能,与无去噪相比具有优势。
  • t-SNE 可视化显示对比学习在潜在空间中对不同 PCG 模式的聚类更清晰且无需标签。
  • 该方法对多种噪声类型具有鲁棒性,且对其他生理信号具有潜在的适用性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。