QUICK REVIEW
[论文解读] Revisiting Multi-Step Nonlinearity Compensation with Machine Learning
Charlotte K. Häger, Henry D. Pfister|arXiv (Cornell University)|Apr 22, 2019
Optical Network Technologies参考文献 30被引用 9
一句话总结
本文挑战了当前普遍认为数字反向传播(DBP)中步骤越少越高效的假设,表明通过联合优化滤波器系数与稀疏MIMO滤波器分解的多步机器学习方法,可实现更优的性能-复杂度权衡。通过使用随机梯度下降(SGD)进行监督学习以参数化基于模型的DBP算法,该方法将硬件复杂度降低了近两个数量级,同时在低精度定点实现下仍保持高精度。
ABSTRACT
For the efficient compensation of fiber nonlinearity, one of the guiding principles appears to be: fewer steps are better and more efficient. We challenge this assumption and show that carefully designed multi-step approaches can lead to better performance-complexity trade-offs than their few-step counterparts.
研究动机与目标
- 挑战数字反向传播(DBP)中步骤越少越高效的既定假设,以实现光纤非线性补偿。
- 证明通过联合优化滤波器系数的多步DBP在复杂度-性能权衡方面优于单步或少数步骤的方法。
- 探索机器学习技术(特别是SGD的监督学习)如何应用于优化基于模型的DSP算法,而无需依赖黑箱神经网络。
- 研究多步架构在通过稀疏滤波器分解降低硬件复杂度并提高系数量化鲁棒性方面的优势。
提出的方法
- 使用监督机器学习与随机梯度下降(SGD)联合优化多步数字反向传播(DBP)中有限冲激响应(FIR)滤波器系数。
- 采用参数化模型方法,其中函数fθ表示时域CD滤波的分步傅里叶方法(SSFM),θ对应每一步中使用的滤波器抽头。
- 在SGD中引入L1-范数正则化,以在子带处理中诱导MIMO滤波器的稀疏性,将非零系数数量减少至约8%,性能损失极小。
- 通过交替使用无记忆旋转与短时延(FD)滤波器,提出PMD补偿滤波器的多步分解,模拟反向传播模型。
- 在训练期间引入“伪量化”机制,以联合优化定点实现,使DBP中系数字宽从8–9位降低至5–6位,且性能无下降。
- 使用张量表示法对子带与PMD补偿中的多抽头MIMO滤波器进行建模,支持结构化优化与硬件感知设计。
实验结果
研究问题
- RQ1基于联合滤波器系数优化的多步DBP是否在复杂度与精度方面优于单步或少数步骤的DBP?
- RQ2在DBP中增加步骤数并结合稀疏滤波器分解,是否能在不牺牲性能的前提下提升硬件效率?
- RQ3SGD等机器学习技术是否可有效应用于优化基于模型的DSP算法(如CD与PMD滤波器),而非依赖神经网络作为通用函数逼近器?
- RQ4在定点实现中,跨步骤联合优化滤波器系数对系数量化鲁棒性有何影响?
- RQ5用于PMD补偿的多步架构是否可通过SGD有效训练,并以低硬件复杂度集成至DBP中?
主要发现
- 在时域DBP中对多步FIR滤波器系数进行联合优化,可将硬件复杂度降低近两个数量级——使用5-和3抽头滤波器即可达到与70抽头滤波器相当的精度。
- 在SGD中使用L1-范数正则化,使子带处理中MIMO滤波器的稀疏度达92%,每步非零系数数从637个减少至约50个,性能损失可忽略。
- 通过交替使用4维旋转与短时延(FD)滤波器的多步PMD补偿架构,实现了低硬件复杂度的分布式PMD补偿,且可通过SGD进行训练。
- 在训练中引入“伪量化”机制,使DBP实现中系数字宽从8–9位降至5–6位,且性能无任何负面影响。
- 28-nm CMOS ASIC综合结果证实,采用短FIR滤波器的多步DBP在芯片面积与功耗约束下完全可行。
- 实证结果表明,多步架构具有大量性能相近的邻近参数配置,使其对量化引起的扰动具有强鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。