[论文解读] Momentum-Net: Fast and convergent iterative neural network for inverse problems
本文提出Momentum-Net,这是首个针对一般可微(非)凸数据拟合项和凸可行集,能保证收敛到不动点的迭代神经网络(INN)架构。通过将动量和大化法整合进具有可学习重构器的分块模型基图像重建(MBIR)框架中,Momentum-Net在稀疏视角计算机断层扫描(CT)和光场摄影应用中,相较于现有INN和最先进MBIR方法,实现了更快的收敛速度和更优的重建精度。
Iterative neural networks (INN) are rapidly gaining attention for solving inverse problems in imaging, image processing, and computer vision. INNs combine regression NNs and an iterative model-based image reconstruction (MBIR) algorithm, often leading to both good generalization capability and outperforming reconstruction quality over existing MBIR optimization models. This paper proposes the first fast and convergent INN architecture, Momentum-Net, by generalizing a block-wise MBIR algorithm that uses momentum and majorizers with regression NNs. For fast MBIR, Momentum-Net uses momentum terms in extrapolation modules, and noniterative MBIR modules at each iteration by using majorizers, where each iteration of Momentum-Net consists of three core modules: image refining, extrapolation, and MBIR. Momentum-Net guarantees convergence to a fixed-point for general differentiable (non)convex MBIR functions (or data-fit terms) and convex feasible sets, under two asymptomatic conditions. To consider data-fit variations across training and testing samples, we also propose a regularization parameter selection scheme based on the "spectral spread" of majorization matrices. Numerical experiments for light-field photography using a focal stack and sparse-view computational tomography demonstrate that, given identical regression NN architectures, Momentum-Net significantly improves MBIR speed and accuracy over several existing INNs; it significantly improves reconstruction quality compared to a state-of-the-art MBIR method in each application.
研究动机与目标
- 解决现有用于反问题的迭代神经网络(INN)缺乏收敛性保证的问题。
- 在保持高重建精度的同时,加速模型基图像重建(MBIR)。
- 开发一个统一框架,结合深度学习重构器与可证明收敛的优化方法的优势。
- 提出一种基于大化矩阵谱分布的正则化参数选择方案,以实现训练和测试数据间鲁棒的泛化能力。
- 在稀疏视角计算断层扫描和光场摄影中实现最先进性能。
提出的方法
- 提出Momentum-Net,一种统一了动量外推、通过大化法实现的非迭代MBIR以及可学习图像重构器的INN架构。
- 在外推模块中引入带动量项的分块MBIR,以加速收敛。
- 利用大化矩阵实现每轮迭代中MBIR子问题的非迭代求解,降低计算成本。
- 在两种渐近条件下,为一般可微(非)凸数据拟合函数和凸可行集提供了收敛性证明。
- 基于大化矩阵的谱分布,开发了正则化参数选择方案,以应对训练和测试数据间的数据拟合差异。
- 采用松弛参数ρ ∈ (0,1)平衡输入与重构器输出,并根据正则化强度提供最优选择的指导原则。
实验结果
研究问题
- RQ1能否设计一种迭代神经网络架构,以保证对一般(非)凸数据拟合项和凸可行集的收敛性?
- RQ2如何有效结合动量与大化法,与可学习重构器协同,以加速收敛而不牺牲重建精度?
- RQ3在训练和测试样本间存在数据拟合差异的情况下,正则化参数γ的高效选择策略是什么?
- RQ4重构器架构选择(如sCNN与dCNN)和松弛参数ρ的选择如何影响性能与收敛性?
- RQ5所提方法能否在真实反问题中超越现有INN和最先进MBIR方法?
主要发现
- 在稀疏视角CT和光场摄影中,Momentum-Net即使在使用相同重构器架构的情况下,也实现了比现有INN更快的收敛速度和更高的重建精度。
- 在稀疏视角CT中,Momentum-Net将RMSE降低至2.4 HU(相较最优方法的7.1 HU),实现66%的性能提升。
- 在光场摄影中,Momentum-Net实现了32.4 dB的PSNR(相较最优方法的28.1 dB),RMSE为5.7×10−2 m(相较最优方法的13.8×10−2 m)。
- 该方法在较弱条件下仍可证明收敛,即使使用扩张型重构器,而此前INN依赖于严格的非扩张性假设。
- 基于谱分布的正则化参数选择方案显著提升了在多样化数据拟合条件下的泛化能力。
- 在高正则化场景(如光场)中,ρ = 1−ε优于ρ = 0.5;而在中等正则化场景(如CT)中,ρ = 0.5表现最优,验证了所提选择指导原则的有效性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。