[论文解读] Stochastic Optimization of Nonlinear Nanophotonic Media for Artificial Neural Inference
本文提出了一种随机优化框架,用于训练非线性纳米光子介质,以利用光实现人工神经网络推理。通过利用亚波长散射体作为可训练权重,该系统可将光学波前(如编码的图像)转换为表示计算输出的聚焦能量分布,从而实现高密度、超高速的光学计算,其表达能力远超传统光子器件。
We show that optical waves passing through a nanophotonic medium can perform artificial neural computing. Complex information, such as an image, is encoded in the wave front of an input light. The medium continuously transforms the wave front to realize highly sophisticated computing tasks such as image recognition. At the output, the optical energy is concentrated to well defined locations, which for example can be interpreted as the identity of the object in the image. These computing media can be as small as tens of wavelengths and offer ultra-high computing density. They exploit sub-wavelength linear and nonlinear scatterers to realize complex input-output mapping far beyond the capabilities of traditional nanophotonic devices. All structural degrees of freedom can be used as training weights, forming a vast parameter space with strong expressive power.
研究动机与目标
- 开发一种训练具有非线性散射体的纳米光子介质以执行复杂光学计算任务的方法。
- 仅通过工程化光子结构的物理特性实现人工神经网络推理,无需电子元件。
- 通过利用所有结构自由度作为可训练参数,在巨大参数空间中实现高计算密度。
- 证明光学波前可通过非线性介质转换,产生对应于计算结果的可解释输出能量分布。
- 探索亚波长、非线性纳米光子系统在图像识别等任务中的表达能力。
提出的方法
- 系统将输入信息(如图像)编码到光束的波前中。
- 由线性和非线性亚波长散射体组成的纳米光子介质,作为神经网络推理的可微分物理模型。
- 应用随机优化来调节介质的结构参数,以将输入波前映射到期望的输出能量分布。
- 将介质中所有结构自由度用作可训练权重,形成具有强大表达能力的高维参数空间。
- 根据光学能量的空间集中程度,将输出解释为计算结果(如图像识别中的物体身份)。
- 该方法实现了对物理介质的端到端训练,通过波前变换实现复杂输入-输出映射。
实验结果
研究问题
- RQ1能否通过随机优化训练非线性纳米光子介质以实现人工神经网络推理?
- RQ2光子介质中的亚波长散射体在多大程度上可实现超越传统纳米光子器件的复杂输入-输出映射?
- RQ3将所有结构自由度用作可训练参数,对系统表达能力有何影响?
- RQ4能否通过此类介质将光学波前转换为对应于计算结果的可解释输出模式?
- RQ5此类系统在超高速度、全光学计算方面具有何种潜力?
主要发现
- 纳米光子介质通过将光学波前转换为对应于计算输出的聚焦能量分布,成功实现了人工神经网络推理。
- 该系统实现了高计算密度,器件尺寸理论上可小至数十个波长。
- 将所有结构自由度用作可训练权重,显著增强了系统的表达能力,远超传统纳米光子器件。
- 非线性散射体实现了仅靠线性系统无法实现的复杂输入-输出映射。
- 该方法表明,可通过仅光学波前调控训练物理光子结构,实现图像识别等复杂计算任务。
- 该框架支持对物理介质的端到端训练,可对整个结构进行优化以实现期望的计算结果。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。