[논문 리뷰] WTHaar-Net: a Hybrid Quantum-Classical Approach
WTHaar-Net은 전역 Hadamard 혼합을 Haar 웨이블릿 변환으로 대체하여 하이브리드 양자–고전 CNN에서 매개변수 감소 및 CIFAR-10과 Tiny-ImageNet에서 경쟁력 있는 정확도를 달성하고, 양자 구현은 IBM 하드웨어에서 검증되었습니다.
Convolutional neural networks rely on linear filtering operations that can be reformulated efficiently in suitable transform domains. At the same time, advances in quantum computing have shown that certain structured linear transforms can be implemented with shallow quantum circuits, opening the door to hybrid quantum-classical approaches for enhancing deep learning models. In this work, we introduce WTHaar-Net, a convolutional neural network that replaces the Hadamard Transform used in prior hybrid architectures with the Haar Wavelet Transform (HWT). Unlike the Hadamard Transform, the Haar transform provides spatially localized, multi-resolution representations that align more closely with the inductive biases of vision tasks. We show that the HWT admits a quantum realization using structured Hadamard gates, enabling its decomposition into unitary operations suitable for quantum circuits. Experiments on CIFAR-10 and Tiny-ImageNet demonstrate that WTHaar-Net achieves substantial parameter reduction while maintaining competitive accuracy. On Tiny-ImageNet, our approach outperforms both ResNet and Hadamard-based baselines. We validate the quantum implementation on IBM Quantum cloud hardware, demonstrating compatibility with near-term quantum devices.
연구 동기 및 목표
- 비전용 매개변수 및 계산을 줄이기 위한 하이브리드 양자-고전 모델의 동기를 부여합니다.
- CNN의 프런트 엔드 변환으로 Haar Wavelet Transform(HWT)을 제안하여 공간적 국소성을 활용합니다.
- 근시 디바이스용 HWT의 양자 친화적 분해를 제공합니다.
- 표준 벤치마크에서 정확도와 효율성의 경험적 이점을 입증합니다.
- IBM Quantum 하드웨어에서 양자 구현을 검증하고 교란에 대한 강건성을 분석합니다.
제안 방법
- Conv2D 공간 컨볼루션을 변환 도메인 CNN 레이어의 프런트 엔드로 Haar 웨이블릿 변환(HWT)으로 대체합니다.
- 학습 가능한 스케일링 A_i, 채널별 1x1 V_i, 그리고 Haar 도메인에서 학습 가능한 소프트 임계값 T_i를 갖는 다경로 변환 도메인 필터링 스킴(P 경로)을 구현합니다.
- 변환 도메인 출력에 소프트 임계값 비선형성을 적용하고 역 2D Haar 변환을 적용하기 전에 경로 간 합을 수행합니다.
- 근시 디바이스에 적합한 구조화된 Hadamard 게이트를 사용한 2D Haar 변환의 양자 회로 분해를 제공합니다.
- CIFAR-10 및 Tiny-ImageNet에서 매개변수 및 정확도 지표와 함께 Hadamard 기반 및 ResNet 베이스라인과 비교합니다.
- MNIST에서 패치 기반 실험을 사용하여 IBM Quantum 하드웨어에서 양자 Haar 구현을 검증하고 부호 회복의 도전을 분석합니다.

실험 결과
연구 질문
- RQ1전역 Hadamard 혼합을 Haar 웨이블릿 변환으로 대체하는 것이 표준 비전 벤치마크에서 정확도를 보존하거나 개선하면서 매개변수 효율성을 높이는가?
- RQ2Haar 기반 양자 구현이 얕은 회로로 구현되고 이미지 변환 작업에 대해 근시 수준의 양자 디바이스에서 검증될 수 있는가?
- RQ3Hadamard 기반 또는 고전적 베이스라인에 비해 Haar 기반 변환이 이미지 음영 perturbation에 대한 강건성에 어떤 영향을 주는가?
- RQ4전환 도메인 합성곱과 전통적 공간 합성곱 간의 트레이드오프는 MAC, 매개변수, 고해상도 데이터셋에서의 성능 측면에서 어떤 차이가 있는가?
주요 결과
- WTHaar-Net은 CIFAR-10에서 3-path Haar 퍼셉트론을 사용할 때 최대 약 26-27%의 매개변수 감소를 달성하면서도 기준선 정확도에 맞추거나 근접합니다.
- Tiny-ImageNet에서 3-path Haar 변형은 70.84% top-1 정확도(단일 크롭)와 73.24%(10-크롭)를 달성하며 매개변수 효율성에서 경쟁적이며 일부 설정에서 ResNet 및 Hadamard 기반 베이스라인을 능가합니다.
- Tiny-ImageNet 전반에서 Haar 기반 모델은 Hadamard만 사용하는 변형보다 더 나은 정확도와 국소화를 보이며, 3-path Haar는 70.84% top-1(단일 크롭)으로 Hadamard 66.65% top-1(단일 크롭) 대비 우수합니다.
- CIFAR-10의 경우, 3-path WTHaar-ResNet-20은 91.28% 테스트 정확도를 달성합니다(ResNet-20은 91.66%). 매개변수 감소율은 26.64%입니다.
- 양자 실험은 IBM Quantum 디바이스에서 Haar 변환 구현을 4-퀴빗 패치 구성으로 검증하고, 대표 패치에서 양자 및 고전 Haar 출력 간의 근사 일치(MSE 0.023)를 보입니다.
- 노이즈 분석은 측정으로 인한 부호 모호성이 주요 한계로 지적되며, 구조화된 HWT는 현실적 노이즈 하에서도 전체 변환 구조를 유지합니다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.