Skip to main content
QUICK REVIEW

[论文解读] Deeply-Recursive Convolutional Network for Image Super-Resolution

Jiwon Kim, Jung Kwon Lee|arXiv (Cornell University)|Nov 14, 2015
Advanced Image Processing Techniques参考文献 22被引用 49
一句话总结

该论文提出了一种深度递归卷积网络(DRCN)用于图像超分辨率,通过在最多16次递归传递中重用单个卷积层,实现了无参数增加的大感受野(41×41),从而在性能上达到最先进水平。为稳定训练,引入了递归监督和跳跃连接,显著提升了在Set5、Set14、B100和Urban100等基准测试中的PSNR和SSIM。

ABSTRACT

We propose an image super-resolution method (SR) using a deeply-recursive convolutional network (DRCN). Our network has a very deep recursive layer (up to 16 recursions). Increasing recursion depth can improve performance without introducing new parameters for additional convolutions. Albeit advantages, learning a DRCN is very hard with a standard gradient descent method due to exploding/vanishing gradients. To ease the difficulty of training, we propose two extensions: recursive-supervision and skip-connection. Our method outperforms previous methods by a large margin.

研究动机与目标

  • 解决在模型容量有限的情况下建模图像超分辨率中长距离像素依赖关系的挑战。
  • 通过使用递归权重共享,克服深度网络在超分辨率任务中参数爆炸和过拟合的局限性。
  • 改善深度递归网络的训练稳定性,此类网络在反向传播过程中易出现梯度消失/爆炸问题。
  • 通过整合多个递归层级的预测结果,提升在标准超分辨率基准测试(如Set5、Urban100)上的性能。
  • 实现完整图像重建,无需裁剪边缘像素,与某些先前方法需后处理不同。

提出的方法

  • 采用深度递归卷积网络(DRCN),反复应用单个共享卷积层(最多16次),在不增加参数的情况下将感受野扩展至41×41。
  • 通过在每个递归层级的特征图上生成中间高分辨率预测,引入递归监督,再将这些预测进行集成以生成最终输出。
  • 从输入的低分辨率图像直接向重建层添加跳跃连接,以保留高层语义和空间信息。
  • 采用三部分架构:嵌入网络(初始特征提取)、推理网络(递归卷积层)和重建网络(上采样与反卷积)。
  • 使用随机梯度下降进行训练,配合学习率衰减和权重衰减,除自连接外,递归权重初始化为零。
  • 训练时展开递归网络,以通过所有递归层级反向传播,实现端到端优化。

实验结果

研究问题

  • RQ1具有共享权重的深度递归网络是否能比深度不断增加的标准深度网络在图像超分辨率性能上表现更优?
  • RQ2增加递归传递次数如何影响模型恢复高频细节的能力,并提升PSNR/SSIM?
  • RQ3递归监督是否能显著改善存在梯度消失/爆炸问题的递归网络的训练稳定性和性能?
  • RQ4从输入到重建层的跳跃连接在超分辨率等高相关性任务中,能在多大程度上提升性能?
  • RQ5所提方法能否在包括城市和自然场景在内的多样化数据集上泛化,并优于现有最先进方法?

主要发现

  • 在×3超分辨率任务中,Set5数据集上的递归深度从1增加到16,PSNR持续提升,16次递归模型达到最佳性能。
  • 来自不同递归层级的中间预测结果的集成,显著优于任一单一递归深度的结果,证明了递归监督的有效性。
  • 该方法在所有基准数据集上均达到最先进PSNR和SSIM得分:Set5(×3时为33.52 dB)、Set14(×3时为30.85 dB)、B100(×3时为30.25 dB)和Urban100(×3时为28.54 dB)。
  • 该模型在Titan X GPU上处理288×288图像约需一秒,表明尽管存在深度递归,推理效率依然很高。
  • 定性结果表明,与SRCNN、A+、RFL和SelfEx相比,该方法在复杂图案和精细细节中能生成更清晰的边缘和更好的纹理保持效果。
  • 由于具备全尺寸输出生成能力,该方法无需裁剪边缘像素,与某些先前方法不同。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。