Skip to main content
QUICK REVIEW

[论文解读] On-Chip Optical Convolutional Neural Networks

Hengameh Bagherian, Scott A. Skirlo|arXiv (Cornell University)|Aug 9, 2018
Neural Networks and Reservoir Computing参考文献 1被引用 57
一句话总结

论文提出一种基于光子学的卷积神经网络架构,在芯片上实现,使用 MZI 网络、光学非线性和时延线进行快速、低功耗的 CNN 推断,时间复用的光学计算。它还讨论一种混合光电子方法及实际挑战。

ABSTRACT

Convolutional Neural Networks (CNNs) are a class of Artificial Neural Networks(ANNs) that employ the method of convolving input images with filter-kernels for object recognition and classification purposes. In this paper, we propose a photonics circuit architecture which could consume a fraction of energy per inference compared with state of the art electronics.

研究动机与目标

  • 推动对比GPU和传统电子学之外的节能高吞吐 CNN 推断的需求。
  • 介绍一种能够在芯片上实现卷积核、池化和非线性的集成光子架构。
  • 详细描述一种时分复用的光学矩阵乘法方法,以在 CNN 各层实现内核点积运算。
  • 讨论实际实现选项,包括全光实现和光电子混合设置,并概述工程挑战。

提出的方法

  • 使用一组 Mach-Zehnder 干涉仪(MZI)网络,通过 Reck 对从 SVD 分解得到的单位元件 M_i = U Σ V 的编码实现核矩阵。
  • 将核/像素补丁编码为相干光脉冲,并逐补丁地与核矩阵执行点积以获得时间序列输出。
  • 对输出应用光学非线性(例如石墨烯饱和吸收体),使其具备类似 CNN 的激活函数。
  • 使用光学延迟线将核点积重新打包成用于下一层的新输入补丁,使在光子平台上实现多层 CNN。
  • 将池化处理视为带步长的卷积,并通过延迟线/分路网络实现重新打包以形成下一层补丁。
  • 可选地讨论一种光电子混合配置,以减轻实现挑战并利用模拟 CMOS 非线性和存储元件。

实验结果

研究问题

  • RQ1一个光子集成电路是否能够在与电子对等的准确度下执行 CNN 的卷积、池化和非线性?
  • RQ2光学卷积在典型 CNN(如 AlexNet 规模)上能提供哪些能耗和速度优势,有限因素是什么?
  • RQ3MZI 相位编码误差和非线性如何影响光学 CNN 的推断准确性?
  • RQ4在保持在芯片上的前提下,哪些可行的架构(全光还是混合光学)可以最大化吞吐量并最小化功耗?

主要发现

  • 一种光学卷积架构可能达到每秒数百万次推断,约每次推断 2 mJ。
  • 据称该系统比 GPU 启用的 AlexNet 推断快约 30 倍,同时总功率相似。
  • 完全片上光子实现依赖于 MZI 网络进行矩阵乘法、光学非线性,以及通过时延线实现的精确时间分复用重新打包。
  • 一种光电子混合设置可以通过用 CMOS 模拟电路和存储器实现困难的光学元件来降低芯片面积和复杂度。
  • 能量与性能的说法取决于实际器件带宽和探测器速度,附录中给出详细的能耗分析。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。