[논문 리뷰] Backpropagation scaling in parameterised quantum circuits
이 논문은 commuting-generator 및 commuting-block 매개변수화 양자 회로를 도입하여 백프로파게이션과 유사한 기울기 추정을 회로 평가를 크게 줄인 횟수로 가능하게 하며, 특정 경우에는 고전적 백프로파게이션 규모에 근접한다.
The discovery of the backpropagation algorithm ranks among one of the most important moments in the history of machine learning, and has made possible the training of large-scale neural networks through its ability to compute gradients at roughly the same computational cost as model evaluation. Despite its importance, a similar backpropagation-like scaling for gradient evaluation of parameterised quantum circuits has remained elusive. Currently, the most popular method requires sampling from a number of circuits that scales with the number of circuit parameters, making training of large-scale quantum circuits prohibitively expensive in practice. Here we address this problem by introducing a class of structured circuits that are not known to be classically simulable and admit gradient estimation with significantly fewer circuits. In the simplest case -- for which the parameters feed into commuting quantum gates -- these circuits allow for fast estimation of the gradient, higher order partial derivatives and the Fisher information matrix. Moreover, specific families of parameterised circuits exist for which the scaling of gradient estimation is in line with classical backpropagation, and can thus be trained at scale. In a toy classification problem on 16 qubits, such circuits show competitive performance with other methods, while reducing the training cost by about two orders of magnitude.
연구 동기 및 목표
- 변분 양자 알고리즘에서 빠른 기울기 평가의 필요성을 동기화한다.
- 병렬 기울기 추정을 가능하게 하는 회로 클래스( commuting-generator 와 commuting-block )를 도입한다.
- 기울기와 고차도함수를 양자 자원을 감소시켜 계산할 수 있는 조건을 도출한다.
- 제안된 회로 계열에서 Fisher 정보 및 양자 자연 경사 정보를 탐구한다.
제안 방법
- C(θ) = ⟨0|U†(θ) H U(θ)|0⟩ 로, U(θ)=∏j exp(−i θj Gj) 및 Gj들은 교환 생성자를 정의한다.
- 교환생성자 회로의 경우 단일 회로에서 후처리를 통해 편향되지 않은 기울기 추정치를 얻을 수 있으며, 도함수당 분산이 O(1/M)이다.
- 차수 t까지의 모든 도함수는 적절한 관측자 Oα와 대각화 유닛ary를 사용해 병렬로 추정될 수 있으며, 분산은 O(1/M)로 스케일한다.
- 블록들이 내부적으로 교환 생성자를 가지며 블록 간 고정된 교환 관계를 갖는 commuting-block 회로를 도입하여 B개의 블록에 대해 2B−1 회로로 기울기를 추정할 수 있다.
- 명시적 구성(X-생성자 해안) 제시 및 Pauli 구조와 안정자 기법을 이용해 기울기를 병렬로 측정하는 방법 논의.
- 교환생성자 회로의 Fisher 정보는 인코딩 상태에서 생성자들의 공분산으로 축소되며, 양자 자연 경사를 가능하게 한다; 어떤 경우에는 F를 고전적으로 평가하는 것이 가능할 수 있다.
실험 결과
연구 질문
- RQ1구조화된 회로 설계를 통해 매개변수화 양자 회로의 기울기 추정이 실제로 확장 가능하게 만들어질 수 있는가?
- RQ2어떤 구조적 제약하에서 교환생성자 및 교환블록 회로가 회로 평가와 유사한 자원 비용으로 병렬 기울기 추정을 허용하는가?
- RQ3이들 회로 계열에서 Fisher 정보 행렬은 어떻게 작용하며, 이를 효율적 최적화에 활용할 수 있는가?
- RQ4단일 블록 회로에 비해 commuting-block 회로의 표현력은 어느 정도이며, 이것이 학습 성능에 어떤 영향을 미치는가?
- RQ5백프로파게이션과 유사한 규모화를 보여주고 실용적 학습 이점을 제공하는 구체적이고 구현 가능한 회로 구성들이 있는가?
주요 결과
- 교환생성자 회로는 단일 회로에서 편향되지 않은 기울기 추정이 가능하며, 병렬로 측정된 모든 도함수에 대해 분산이 O(1/M)으로 스케일된다.
- Pauli-곱 생성자에 대해 기울기 추정은 기본 회로에 비해 회로 깊이의 상한이 O(N/ log N)로 구현될 수 있어 효율적 병렬화가 가능하다.
- 고차도함수(order t)는 병렬로 추정될 수 있으며, 분산은 t에 대해 지수적으로 증가하지만 작은 t에는 여전히 가능하여 근사적인 2차 최적화를 가능하게 한다.
- 교환생성자 회로의 Fisher 정보는 인코딩 상태에서 생성자들의 공분산으로 축소되며, 양자 자연 경사를 가능하게 한다; 어떤 경우에는 F를 고전적으로 평가하는 것이 가능할 수 있다.
- comuting-block 회로는 단일 블록 회로를 넘어 표현력을 확장하면서도 기울기 스케일링 이점을 보존하며, B 블록에 대한 기울기 추정을 위해서는 단지 2B−1 회로가 필요하다.
- 장난감 16-퀀비트 분류 문제는 표준 방법에 비해 약 두 자릿수의 학습 비용 감소를 보여주고, 경쟁력 있는 정확도를 보인다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.