[논문 리뷰] Quantum Recurrent Unit: A Parameter-Efficient Quantum Neural Network Architecture for NISQ Devices
본 논문은 NISQ 디바이스에서 C-SWAP 게이트를 사용하는 매개변수 효율적인 양자 신경망인 Quantum Recurrent Unit (QRU)를 제안하며, 시퀀스 길이에 관계없이 깊이와 매개변수 수가 상수인 구조를 갖고, 진동 예측, 암 진단 분류, MNIST에서 강한 성능을 보임을 보인다.
The rapid growth of modern machine learning (ML) models presents fundamental challenges in parameter efficiency and computational resource requirements. This study introduces the Quantum Recurrent Unit (QRU), a novel quantum neural network (NN) architecture specifically designed to address these challenges while remaining compatible with Noisy Intermediate-Scale Quantum (NISQ) devices. QRU leverages quantum controlled-SWAP (C-SWAP; Fredkin) gates to implement an information selection mechanism inspired by classical Gated Recurrent Units (GRUs), enabling selective processing of temporal information via quantum operations. Through its innovative recurrent architecture featuring measurement results feedforward state propagation and shared parameters across time steps, QRU achieves constant circuit depth and constant parameter count regardless of input sequence length, effectively circumventing stringent NISQ hardware constraints. We systematically validate QRU through three progressive experiments: (1) oscillatory behavior prediction, where 72-parameter QRU matches 197-parameter classical GRU performance; (2) Wisconsin Diagnostic Breast Cancer classification, where 35 parameters achieve 96.13% accuracy comparable to 167-parameter artificial NNs; and (3) MNIST handwritten digit recognition, where 132 parameters reach 98.05% accuracy, outperforming a 27,265-parameter convolutional NN. These results demonstrate that QRU consistently achieves comparable or superior performance with significantly fewer parameters than classical NNs while maintaining constant quantum circuit depth. The architecture's quantum-native design, combining C-SWAP-based information selection with novel recurrent processing, suggests QRU's potential as a fundamental building block for next-generation ML systems, offering a promising pathway toward more efficient and scalable quantum ML architectures.
연구 동기 및 목표
- NISQ 하드웨어에서 매개변수 효율적인 ML의 필요성을 제시한다.
- QRU를 시퀀스 길이에 따라 상수 깊이와 매개변수 수를 갖는 양자 순환 아키텍처로 제안한다.
- 진동 예측, Wisconsin Breast Cancer 분류, 그리고 MNIST에서 QRU의 성능을 시연한다.
- 훨씬 적은 매개변수로도 QRU가 고전 NN의 성능에 비등하거나 이를 능가할 수 있음을 보인다.
제안 방법
- 게이티드 순환 단위에서 영감을 얻은 정보 선택을 구현하기 위해 양자 제어-SWAP (C-SWAP) 게이트를 사용한다.
- 측정 결과를 상태 전파에 피드포워드하는 순환 아키텍처를 사용한다.
- 동일한 매개변수들을 시간 단계에 걸쳐 공유하여 상수 매개변수 수를 유지한다.
- 입력 시퀀스 길이에 무관하게 상수 회로 깊이를 달성한다.
실험 결과
연구 질문
- RQ1고정되고 소량의 매개변수 예산으로 NISQ 디바이스에서 QRU가 고전 RNN과 경쟁력 있는 또는 우수한 성능을 달성할 수 있는가?
- RQ2입력 시퀀스가 길어질 때 QRU가 상수 회로 깊이와 매개변수 수를 유지하는가?
- RQ3표준 벤치마크(oscillatory prediction, breast cancer classification, MNIST)에서 QRU의 성능은 더 큰 고전 네트워크에 비해 어떤가?
주요 결과
- 진동 예측에서, 72 매개변수 QRU는 197 매개변수 클래식 GRU와 일치한다.
- Wisconsin Diagnostic Breast Cancer 분류에서 35 QRU 매개변수는 96.13% 정확도를 달성하며, 167 매개변수 인공 NN과 비슷하다.
- MNIST 인식에서 132 QRU 매개변수는 98.05% 정확도에 도달하여 27,265 매개변수 합성곱 NN을 능가한다.
- 전 과제에서, QRU는 상당히 적은 매개변수와 상수 깊이로 경쟁력 있거나 우수한 성능을 달성한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.