[论文解读] High speed and reconfigurable optronic neural network with digital nonlinear activation
本文提出一种高速、可重构的自由空间光子神经网络,采用4f系统与数字非线性激活,仅用三层即在MNIST数据集上实现93.66%的准确率。该系统利用DMD和仅相位型SLM编程权重与偏置,实现快速、可扩展且可编程的光学推理,具有低空间复杂度与高能效。
With its unique parallel processing capability, optical neural network has shown low-power consumption in image recognition and speech processing. At present, the manufacturing technology of programmable photonic chip is not mature, and the realization of optical neural network in free-space is still a hot spot of intelligent optical computing. In this article, based on MNIST datasets and 4f system, three-layer optical neural networks are constructed, whose recognition accuracy can reach 93.66%. Our network is programmable, high speed, reconfigurable and is better than the existing free-space optical neural network in terms of spatial complexity.
研究动机与目标
- 开发一种高速、可重构的光学神经网络,以克服固定衍射或光电混合系统存在的局限性。
- 降低自由空间光学神经网络的空间复杂度并提升可扩展性。
- 通过数字非线性激活与可编程光学元件,仅用三层即实现高识别准确率。
- 展示一种具有低延迟与低功耗的系统,适用于实时智能光学计算。
提出的方法
- 网络利用4f光学系统通过傅里叶变换执行矩阵乘法,实现高效的空域卷积。
- 输入图像通过马赫-曾德尔干涉仪(MZI)预处理,利用正交偏振光波的强度叠加实现WX + B运算。
- 通过仅相位型空间光调制器(SLM)加载表示学习权重与偏置的相位掩模,同时DMD控制输入信号并实现可重构性。
- 输出光场由高速sCMOS相机捕获,并通过ReLU或SoftMax函数进行数字激活。
- 该系统具有可扩展性:通过将数字输出反馈至DMD并更新SLM相位掩模,可实现额外层的引入。
- 整个系统延迟极低——每层仅数毫秒,得益于光速传播以及高速DMD/SLM器件的高带宽特性。
实验结果
研究问题
- RQ1自由空间光子神经网络能否在层数极少且空间复杂度低的情况下实现高识别准确率?
- RQ2如何在不使用固定衍射元件的情况下实现光学神经网络的可重构性与可扩展性?
- RQ3在纯光学卷积架构中,使用数字非线性激活的系统性能如何?
- RQ4此类系统能否在保持高速与低功耗的同时,实现与数字或混合神经网络相当的准确率?
- RQ5可编程光学元件(DMD、SLM)的集成如何影响系统延迟与能效?
主要发现
- 三层光子神经网络在MNIST数据集上实现了93.66%的识别准确率,优于多项现有的自由空间与衍射光学网络。
- 单层版本实现了86.06%的准确率,表明增加网络深度可带来显著的性能提升。
- 系统具有极低延迟——每层仅数毫秒,得益于光速传播与高速DMD/SLM器件。
- 能效估计约为4.94×10^17 FLOPs每焦耳,显著低于传统数字系统,表明功耗更低。
- 采用可编程DMD与SLM实现了完全可重构与可扩展性,支持动态调整网络参数与层数。
- 基于MZI的光学预处理通过正交偏振光波的强度叠加,成功模拟了线性变换WX + B,实现了高效的模拟计算。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。