Skip to main content
QUICK REVIEW

[논문 리뷰] Unified Removal of Raindrops and Reflections: A New Benchmark and A Novel Pipeline

Xingyu Liu, Zewei He|arXiv (Cornell University)|2026. 03. 17.
Image Enhancement Techniques인용 수 0
한 줄 요약

본 논문은 통합 강수방울 제거 및 반사 제거(UR3) 작업을 정의하고, 실제 촬영 RainDrop 및 ReFlection(RDRF) 데이터셋을 도입하며, 두 단계 설계와 Modulate&Gate 제어 모듈을 갖춘 확산 기반 파이프라인(DiffUR3)을 제안하여 두 가지 저하 현상을 함께 제거합니다.

ABSTRACT

When capturing images through glass surfaces or windshields on rainy days, raindrops and reflections frequently co-occur to significantly reduce the visibility of captured images. This practical problem lacks attention and needs to be resolved urgently. Prior de-raindrop, de-reflection, and all-in-one models have failed to address this composite degradation. To this end, we first formally define the unified removal of raindrops and reflections (UR$^3$) task for the first time and construct a real-shot dataset, namely RainDrop and ReFlection (RDRF), which provides a new benchmark with substantial, high-quality, diverse image pairs. Then, we propose a novel diffusion-based framework (i.e., DiffUR$^3$) with several target designs to address this challenging task. By leveraging the powerful generative prior, DiffUR$^3$ successfully removes both types of degradations. Extensive experiments demonstrate that our method achieves state-of-the-art performance on our benchmark and on challenging in-the-wild images. The RDRF dataset and the codes will be made public upon acceptance.

연구 동기 및 목표

  • raindrop과 reflection 제거를 동시에 요구하는 실용적이고 실제 환경에 맞는 UR3를 Introduce한다.
  • 실제 촬영 하강물방울-반사 저하 이미지와 깨끗한 ground truth를 포함하는 real-shot 데이터셋(RDRF)을 만든다.
  • 생성 priors를 이용해 두 저하를 함께 제거하는 이중 단계 확산 기반 프레임워크(DiffUR3)를 개발한다.
  • 압축 아티팩트 이후 충실도(fidelity)를 개선하기 위해 이중 conditioning 신호를 효과적으로 융합하는 모듈을 설계한다.
  • RDRF 및 도전적인 실제 이미지에서 최첨단 성능을 보여주는 포괄적 실험을 제공한다.

제안 방법

  • Stage I: Restoration은 DRSformer를 사용하여 저품질 입력 I_lq로부터 예비 클린 이미지 I_s를 생성한다.
  • Stage II: Multi-condition generation은 Stable Diffusion을 바탕으로 I_lq와 I_s를 conditioning signal으로 VAE 잠재 공간에 인코딩한다.
  • Modulate&Gate 모듈은 교차 주의 기반 상호 작용 및 공간 주의에 의해 듀얼 컨디션 잠재 I_lq와 I_s를 노이즈 확산 잠재 z_t와 적응적으로 융합하여 변조된 컨디션 잠재를 생성한다.
  • Fidelity Encoder를 추가하여 VAE 압축으로 인한 왜곡을 완화하고 ground-truth 재구성 손실(L1)을 통해 VAE 디코더에 충실도 특성을 주입한다.
  • 참조 색상과 정렬되도록 색 보정을 통해 출력 색상을 보정한다.

실험 결과

연구 질문

  • RQ1강수방울 제거와 반사 제거를 통합된 프레임워크에서 효과적으로 다룰 수 있는가(두 작업을 분리된 두 가지 태스크로 다루지 않고 통합 가능성)?
  • RQ2다중 컨디션 입력을 갖춘 확산 priors 기반 파이프라인이 실제 UR3 데이터에서 cascaded 또는 단일 저하 방법보다 우수한가?
  • RQ3UR3 복원에서 높은 충실도와 주관적 품질을 달성하기 위해 Modulate&Gate, Fidelity Encoder 등의 구성 요소가 얼마나 중요한가?
  • RQ4DiffUR3가 RDRF 벤치마크를 넘어 야생(real-world) 및 raindrop-만 시나리오에 얼마나 일반화되는가?
  • RQ5고퀄리티의 실제 촬영 데이터가 강인한 UR3 모델 학습에 어떤 영향을 미치는가?

주요 결과

유형방법장소RDRF-testingPSNRSSIMLPIPSMUSIQCLIPIQA+HyperIQA
OursDiffUR 3 50-29.410.93720.081374.720.67050.7043
  • DiffUR3는 PSNR, SSIM, LPIPS 및 무참조 IQA 지표에서 RDRF-테스트 세트에 대해 최첨단 성능을 달성한다.
  • Modulate&Gate 모듈은 듀얼 컨디션을 단순 연결이나 단일 컨디션 입력으로 융합하는 베이스라인보다 결과를 상당히 개선한다.
  • Fidelity Encoder의 포함은 ablation 중에서도 PSNR, SSIM, LPIPS를 모두 최상으로 개선하여 ground truth에 대한 충실도가 증가했음을 나타낸다.
  • 다수의 베이스라인(raindrop-만, reflection-만, cascaded, all-in-one)과 비교할 때, Stage II 및 FE를 적용한 DiffUR3가 일관되게 더 높은 정량 점수와 더 나은 시각 품질을 제공한다.
  • 사용자 연구에서 RDRF-테스트 이미지에서 DiffUR3가 경쟁 방법보다 전문가들에 의해 선호된다는 결과가 나왔다.
  • DiffUR3는 raindrop-만 데이터셋 및 RDRF-야생 세트로 일반화되어 실제 조건에 대한 강건성을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.