Skip to main content
QUICK REVIEW

[论文解读] Quantum Recurrent Unit: A Parameter-Efficient Quantum Neural Network Architecture for NISQ Devices

Tzong-Daw Wu, Hsi-Sheng Goan|arXiv (Cornell University)|Jan 26, 2026
Quantum Computing Algorithms and Architecture被引用 0
一句话总结

本论文提出了 Quantum Recurrent Unit (QRU),一种针对 NISQ 设备的参数高效量子神经网络,使用 C-SWAP 门实现信息选择,深度和参数在序列长度上保持不变,并在振荡预测、癌症分类和 MNIST 上展示出色性能。

ABSTRACT

The rapid growth of modern machine learning (ML) models presents fundamental challenges in parameter efficiency and computational resource requirements. This study introduces the Quantum Recurrent Unit (QRU), a novel quantum neural network (NN) architecture specifically designed to address these challenges while remaining compatible with Noisy Intermediate-Scale Quantum (NISQ) devices. QRU leverages quantum controlled-SWAP (C-SWAP; Fredkin) gates to implement an information selection mechanism inspired by classical Gated Recurrent Units (GRUs), enabling selective processing of temporal information via quantum operations. Through its innovative recurrent architecture featuring measurement results feedforward state propagation and shared parameters across time steps, QRU achieves constant circuit depth and constant parameter count regardless of input sequence length, effectively circumventing stringent NISQ hardware constraints. We systematically validate QRU through three progressive experiments: (1) oscillatory behavior prediction, where 72-parameter QRU matches 197-parameter classical GRU performance; (2) Wisconsin Diagnostic Breast Cancer classification, where 35 parameters achieve 96.13% accuracy comparable to 167-parameter artificial NNs; and (3) MNIST handwritten digit recognition, where 132 parameters reach 98.05% accuracy, outperforming a 27,265-parameter convolutional NN. These results demonstrate that QRU consistently achieves comparable or superior performance with significantly fewer parameters than classical NNs while maintaining constant quantum circuit depth. The architecture's quantum-native design, combining C-SWAP-based information selection with novel recurrent processing, suggests QRU's potential as a fundamental building block for next-generation ML systems, offering a promising pathway toward more efficient and scalable quantum ML architectures.

研究动机与目标

  • 证明在 NISQ 硬件上实现参数高效 ML 的需求。
  • 提出 QRU 作为具有恒定深度和随序列长度参数数量的量子循环架构。
  • 展示 QRU 在振荡预测、威斯康星州乳腺癌分类和 MNIST 上的性能。
  • 表明 QRU 能在远少于参数的情况下达到或超过经典神经网络的性能。

提出的方法

  • 使用量子受控 SWAP(C-SWAP)门实现受门控循环单元启发的信息选择。
  • 采用带有测量结果向前传播状态的循环架构。
  • 在时间步之间共享参数以维持恒定的参数数量。
  • 实现独立于输入序列长度的恒定电路深度。

实验结果

研究问题

  • RQ1在固定、较小的参数预算下,QRU 是否能够在 NISQ 设备上达到与经典 RNN 相竞争或更优的性能?
  • RQ2随着输入序列变长,QRU 是否保持恒定的电路深度和参数数量?
  • RQ3与更大规模的经典网络相比,QRU 在标准基准(振荡预测、乳腺癌分类、MNIST)上的表现如何?

主要发现

  • 在振荡预测中,72 参数的 QRU 与 197 参数的经典 GRU 相匹配。
  • 在威斯康星诊断性乳腺癌分类中,35 参数的 QRU 实现 96.13% 的准确率,与 167 参数的人工神经网络相当。
  • 在 MNIST 识别中,132 参数的 QRU 达到 98.05% 的准确率,优于 27,265 参数的卷积神经网络。
  • 在各任务中,QRU 以显著更少的参数实现具有竞争力或更优的性能,且深度保持恒定。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。