QUICK REVIEW

[论文解读] On-Chip Optical Convolutional Neural Networks

Hengameh Bagherian, Scott A. Skirlo|arXiv (Cornell University)|Aug 9, 2018

Neural Networks and Reservoir Computing参考文献 1被引用 57

一句话总结

论文提出一种基于光子学的卷积神经网络架构，在芯片上实现，使用 MZI 网络、光学非线性和时延线进行快速、低功耗的 CNN 推断，时间复用的光学计算。它还讨论一种混合光电子方法及实际挑战。

ABSTRACT

Convolutional Neural Networks (CNNs) are a class of Artificial Neural Networks(ANNs) that employ the method of convolving input images with filter-kernels for object recognition and classification purposes. In this paper, we propose a photonics circuit architecture which could consume a fraction of energy per inference compared with state of the art electronics.

研究动机与目标

推动对比GPU和传统电子学之外的节能高吞吐 CNN 推断的需求。
介绍一种能够在芯片上实现卷积核、池化和非线性的集成光子架构。
详细描述一种时分复用的光学矩阵乘法方法，以在 CNN 各层实现内核点积运算。
讨论实际实现选项，包括全光实现和光电子混合设置，并概述工程挑战。

提出的方法

使用一组 Mach-Zehnder 干涉仪（MZI）网络，通过 Reck 对从 SVD 分解得到的单位元件 M_i = U Σ V 的编码实现核矩阵。
将核/像素补丁编码为相干光脉冲，并逐补丁地与核矩阵执行点积以获得时间序列输出。
对输出应用光学非线性（例如石墨烯饱和吸收体），使其具备类似 CNN 的激活函数。
使用光学延迟线将核点积重新打包成用于下一层的新输入补丁，使在光子平台上实现多层 CNN。
将池化处理视为带步长的卷积，并通过延迟线/分路网络实现重新打包以形成下一层补丁。
可选地讨论一种光电子混合配置，以减轻实现挑战并利用模拟 CMOS 非线性和存储元件。

实验结果

研究问题

RQ1一个光子集成电路是否能够在与电子对等的准确度下执行 CNN 的卷积、池化和非线性？
RQ2光学卷积在典型 CNN（如 AlexNet 规模）上能提供哪些能耗和速度优势，有限因素是什么？
RQ3MZI 相位编码误差和非线性如何影响光学 CNN 的推断准确性？
RQ4在保持在芯片上的前提下，哪些可行的架构（全光还是混合光学）可以最大化吞吐量并最小化功耗？

主要发现

一种光学卷积架构可能达到每秒数百万次推断，约每次推断 2 mJ。
据称该系统比 GPU 启用的 AlexNet 推断快约 30 倍，同时总功率相似。
完全片上光子实现依赖于 MZI 网络进行矩阵乘法、光学非线性，以及通过时延线实现的精确时间分复用重新打包。
一种光电子混合设置可以通过用 CMOS 模拟电路和存储器实现困难的光学元件来降低芯片面积和复杂度。
能量与性能的说法取决于实际器件带宽和探测器速度，附录中给出详细的能耗分析。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。