Skip to main content
QUICK REVIEW

[논문 리뷰] Joint Sub-bands Learning with Clique Structures for Wavelet Domain Super-Resolution

Zhisheng Zhong, Tiancheng Shen|arXiv (Cornell University)|2018. 09. 12.
Advanced Image Processing Techniques인용 수 35
한 줄 요약

이 논문은 단일 이미지 초해상도에서 텍스처 세부 정보 복원을 향상시키기 위해 클리크 구조를 가진 업샘플링 모듈을 사용하여 고주파 수상대 계수를 공동으로 학습하는 웨이블릿 도메인 딥 러닝 프레임워크인 슈퍼-해상도 클리크넷(SRCliqueNet)을 제안한다. 네 개의 웨이블릿 수상대에 걸쳐 에지 인식 특징 전파를 활용하고, 특징 추출을 위해 리스-클리크 블록을 도입함으로써, 기준 데이터셋에서 최신 기술(SOTA) 수준의 PSNR 및 SSIM 성능를 달성하며, 특히 미세한 텍스처와 날카운 에지 유지에서 뛰어난 성능을 보인다.

ABSTRACT

Convolutional neural networks (CNNs) have recently achieved great success in single-image super-resolution (SISR). However, these methods tend to produce over-smoothed outputs and miss some textural details. To solve these problems, we propose the Super-Resolution CliqueNet (SRCliqueNet) to reconstruct the high resolution (HR) image with better textural details in the wavelet domain. The proposed SRCliqueNet firstly extracts a set of feature maps from the low resolution (LR) image by the clique blocks group. Then we send the set of feature maps to the clique up-sampling module to reconstruct the HR image. The clique up-sampling module consists of four sub-nets which predict the high resolution wavelet coefficients of four sub-bands. Since we consider the edge feature properties of four sub-bands, the four sub-nets are connected to the others so that they can learn the coefficients of four sub-bands jointly. Finally we apply inverse discrete wavelet transform (IDWT) to the output of four sub-nets at the end of the clique up-sampling module to increase the resolution and reconstruct the HR image. Extensive quantitative and qualitative experiments on benchmark datasets show that our method achieves superior performance over the state-of-the-art methods.

연구 동기 및 목표

  • CNN 기반 초해상도 방법에서 흔히 발생하는 과도한 부드러움과 텍스처 세부 정보 손실 문제를 해결하기 위해.
  • 변환 도메인에서 웨이블릿 수상대 간 상호의존성을 모델링하여 고주파 수상대 재구성 성능를 향상시키기 위해.
  • 클리크 기반 특징 집합을 사용하여 네 개의 웨이블릿 수상대 계수를 공동 예측하고 재구성하는 새로운 업샘플링 모듈을 설계하기 위해.
  • 최대한의 정보 흐름을 확보하기 위해 리스-클리크 블록을 도입하여 특징 추출 능력을 향상시키기 위해.
  • 광범위한 정량적 및 정성적 평가를 통해 공동 수상대 학습 및 웨이블릿 도메인 최적화의 효과를 검증하기 위해.

제안 방법

  • 모든 레이어가 클리크 구조로 연결되어 정보 흐름과 특징 전파를 최대화하는 리스-클리크 블록을 특징 추출 모듈로 사용한다.
  • 네 개의 하위 네트워크로 구성된 클리크 업샘플링 모듈을 도입하여 네 개의 수상대(LL, LH, HL, HH)에 대한 고해상도 웨이블릿 계수를 공동 예측한다.
  • 서브넷 간 스킵 연결을 통해 수상대 간 에지 특징 상관관계를 활용하고, 고주파 성분의 공동 최적화를 가능하게 한다.
  • 수상대 계수 예측 후, 예측된 계수로부터 최종 고해상도 이미지를 재구성하기 위해 역방향 이산 웨이블릿 변환(IDWT)을 적용한다.
  • 질감과 구조적 무결성을 유지하기 위해 인지적 손실과 L1 손실을 사용하여 엔드 투 엔드로 네트워크를 훈련시킨다.
  • 성능 향상을 위해 자가 앙상블 전략을 적용하여 SRCliqueNet+ 버전을 도출한다.

실험 결과

연구 질문

  • RQ1웨이블릿 수상대 계수의 공동 학습이 단일 이미지 초해상도에서 텍스처 세부 정보 복원에 기여하는가?
  • RQ2수상대 간 상호관계를 모델링하는 클리크 구조 업샘플링 모듈이 웨이블릿 도메인 초해상도에서 기존 업샘플링 방식을 능가하는가?
  • RQ3리스-클리크 블록이 표준 잔차 또는 조밀한 블록에 비해 초해상도 네트워크에서 특징 표현력과 정보 흐름을 향상시키는가?
  • RQ4픽셀 공간 최적화에 비해 웨이블릿 도메인 최적화가 PSNR, SSIM 및 시각적 품질 측면에서 어떻게 성능가능한가?
  • RQ5제안된 방법이 다양한 확대 배율과 기준 데이터셋에 대해 얼마나 일반화되는가?

주요 결과

  • 2× 확대에서 Set5 데이터셋에서 PSNR 38.23 dB, SSIM 0.963을 기록하여 모든 최신 기술(SOTA) 방법을 능가한다.
  • 4× 확대에서 Set14 데이터셋에서 PSNR 32.61 dB, SSIM 0.903을 기록하며, EDSR 및 D-DBPN을 초월하며, 자가 앙상블 적용 시 추가 성능 향상(SRCliqueNet+)을 보였다.
  • 시각적 비교 결과, SRCliqueNet은 간판의 글자나 줄무늬 제스처와 같은 더 날카운 텍스처를 훨씬 더 적은 흐림으로 재구성한다.
  • 클리크 업샘플링을 통한 공동 수상대 학습은 높은 고주파 성분 유지에 기여하며, 모든 데이터셋에서 더 높은 SSIM 및 PSNR 값으로 확인되었다.
  • 절단 분석 결과, 리스-클리크 블록과 클리크 업샘플링 모듈이 성능 향상에 필수적이며, 각 구성 요소가 최종 성능에 크게 기여하는 것으로 확인되었다.
  • SRCliqueNet+는 4× 확대에서 Set14 데이터셋에서 PSNR 32.67 dB, SSIM 0.903을 기록하여 자가 앙상블 전략의 효과를 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.