QUICK REVIEW

[논문 리뷰] SSC-UNet: UNet with Self-Supervised Contrastive Learning for Phonocardiography Noise Reduction

Lizy Abraham, Siobhan Coughlan|arXiv (Cornell University)|2026. 01. 07.

Phonocardiography and Auscultation Techniques인용 수 0

한 줄 요약

논문은 SSC-UNet을 제안하는데, 자기지도 기반 Noise2Noise 기반 노이즈 제거 모델로 청진음(phonocardiography)에서 노이즈 감소를 개선하고 병리적 특징을 보존한다.

ABSTRACT

Congenital Heart Disease (CHD) remains a significant global health concern affecting approximately 1\% of births worldwide. Phonocardiography has emerged as a supplementary tool to diagnose CHD cost-effectively. However, the performance of these diagnostic models highly depends on the quality of the phonocardiography, thus, noise reduction is particularly critical. Supervised UNet effectively improves noise reduction capabilities, but limited clean data hinders its application. The complex time-frequency characteristics of phonocardiography further complicate finding the balance between effectively removing noise and preserving pathological features. In this study, we proposed a self-supervised phonocardiography noise reduction model based on Noise2Noise to enable training without clean data. Augmentation and contrastive learning are applied to enhance its performance. We obtained an average SNR of 12.98 dB after filtering under 10~dB of hospital noise. Classification sensitivity after filtering was improved from 27\% to 88\%, indicating its promising pathological feature retention capabilities in practical noisy environments.

연구 동기 및 목표

청진 음성 데이터의 청정 데이터 부족 문제를 해결한다.
Noise2Noise를 기반으로 한 엔드-투-엔드 자기지도 노이즈 제거 모델을 개발한다.
대조 학습을 도입해 병리학적 특징을 보존하고 현혹현상을 줄인다.
다양한 실제 노이즈 시나리오에서의 노이즈 제거 성능을 평가하고 CHD 분류에 대한 영향력을 평가한다.
다양한 노이즈 유형에 대한 강건성과 다른 생리 신호로의 일반화 가능성을 보여준다.

제안 방법

BiLSTM 스킵 연결을 갖춘 4단계 U-Net(LU-Net)을 도입하여 시간적 디테일을 보존한다.
프로젝션 헤드를 통해 병목 특성을 대조 공간에 매핑한다.
재구성 손실(MSE)과 같은 손실과 같은 샘플의 증강을 클러스터링하는 대조 손실을 결합하여 학습한다.
Clean 타깃 없이 노이즈 PCG 입력에 추가 왜곡을 주입하여 Noise2Noise에서 영감을 얻은 학습을 수행한다.
양성 쌍은 동일 샘플의 증강이고 음성은 다른 샘플인 대조 학습 프레임워크를 구현하여 안정성 인식 잠재 공간을 최적화한다.
증강된 PCG 데이터에 대한 엔드-투-엔드 학습을 사용하고 베이스라인 노이즈 제거 모델과 비교한다.

실험 결과

연구 질문

RQ1자연스러운 데이터를 필요로 하지 않는 자기지도 노이즈 제거 모델이 노이즈가 있는 심음도에서 경쟁력 있는 SNR 향상을 달성할 수 있는가?
RQ2대조 학습이 PCG의 UNet 기반 노이즈 제거에서 병원성 특징 보존과 현혹현상 감소에 도움이 되는가?
RQ3다양한 노이즈 유형(화이트, 핑크, 레드, 병원, 흉부) 및 노이즈 수준에서 SSC-UNet의 성능은 어떠한가?
RQ4노이즈 조건에서 노이즈 제거가 다운스트림 CHD 분류의 강건성에 미치는 영향은 무엇인가?

주요 결과

SSC-UNet은 여러 노이즈 조건에서 출력 SNR 측면에서 전통적인 UNet 기반 노이즈 제거보다 우수하다.
0 dB 병원 소음에서 SSC-UNet은 FCN, U-Net, LU-Net 베이스라인보다 높은 SNR인 14 dB를 달성한다.
대조 학습은 블러링과 현혹현상을 줄여 병리학적 PCG 특징의 보존을 향상시킨다.
이 방법은 노이즈 조건 하에서 다운스트림 다섯 클래스 CHD 분류 성능을 노이즈 제거 없이보다 향상시킨다.
t-SNE 시각화는 대조 학습이 라벨 없이도 잠재 공간에서 서로 다른 PCG 패턴의 더 명확한 클러스터링을 가져옴을 보여준다.
이 접근법은 다양한 노이즈 유형에 대해 강건성을 시연하며 다른 생리적 신호에도 적용 가능성을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.