Skip to main content
QUICK REVIEW

[논문 리뷰] Quantum Supremacy Circuit Simulation on Sunway TaihuLight

Riling Li, Bujiao Wu|arXiv (Cornell University)|2018. 04. 13.
Quantum Computing Algorithms and Architecture참고 문헌 11인용 수 21
한 줄 요약

이 논문은 Sunway TaihuLight 슈퍼컴퓨터에서 보편적인 랜덤 회로를 위한 고성능 양자 회로 시뮬레이터를 제시하며, 전체 상태벡터 계산에서는 49-qubit 회로를 깊이 39까지, 단일 보-amplitude 샘플링에서는 깊이 55까지 시뮬레이션한다. 시뮬레이터는 동적 프로그래밍 기반의 분할 및 최적화된 메모리 액세스를 통해 이전 시스템에 비해 큐비트 수와 회로 깊이에서 뛰어난 성능을 달성한다.

ABSTRACT

With the rapid progress made by industry and academia, quantum computers with dozens of qubits or even larger size are being realized. However, the fidelity of existing quantum computers often sharply decreases as the circuit depth increases. Thus, an ideal quantum circuit simulator on classical computers, especially on high-performance computers, is needed for benchmarking and validation. We design a large-scale simulator of universal random quantum circuits, often called 'quantum supremacy circuits', and implement it on Sunway TaihuLight. The simulator can be used to accomplish the following two tasks: 1) Computing a complete output state-vector; 2) Calculating one or a few amplitudes. We target the simulation of 49-qubit circuits. For task 1), we successfully simulate such a circuit of depth 39, and for task 2) we reach the 55-depth level. To the best of our knowledge, both of the simulation results reach the largest depth for 49-qubit quantum supremacy circuits.

연구 동기 및 목표

  • 고전적 고성능 컴퓨터에서 대규모 보편 랜덤 회로를 시뮬레이션할 수 있는 확장 가능한 양자 회로 시뮬레이터를 개발한다.
  • 높은 정밀도로 양자 우월성 회로를 시뮬레이션하여 근접한 양자 장치의 성능을 평가하고 검증한다.
  • 이전에 보고된 바보다 더 깊은 회로 깊이와 더 큰 큐비트 수를 달성함으로써 고전적 시뮬레이션의 한계를 극복한다.
  • 정밀도 평가 및 검증을 위해 전체 상태벡터 시뮬레이션과 타겟된 보-amplitude 샘플링을 모두 가능하게 한다.
  • Sunway TaihuLight의 아키텍처에 맞는 메모리 대역폭 인식 알고리즘과 동적 로드 밸런싱을 통해 성능을 최적화한다.

제안 방법

  • 대규모 양자 회로를 분산 계산에 적합한 하위 회로로 분해하기 위해 새로운 동적 프로그래밍 기반의 분할 기법을 도입한다.
  • 상태벡터 진화(작업 1)와 선택적 보-amplitude 샘플링(작업 2)을 분리하는 하이브리드 계산 모델을 구현하여 자원 활용도를 최적화한다.
  • Sunway TaihuLight 아키텍처에 최적화된 메모리 대역폭 인식 알고리즘을 사용해 메모리 액세스 패턴을 최적화하여 지연을 감소시키고 노드 수준 성능을 향상시킨다.
  • 주요 시험 환경으로 7×7 큐비트 격자를 사용하였으며, 부분적 보-amplitude 샘플링을 위해 7×8 및 8×8로 확장하였다.
  • 깊은 회로(최대 깊이 55)에서 단일 보-amplitude를 추출하기 위해 49-qubit 상태벡터 간의 내적 계산을 적용하였다.
  • 최대 131,072개의 코어 그룹에서 강한 스케일링을 달성하였으며, 성능 분석 결과 ETH의 단일 노드 구현 대비 1.84배 빠른 성능을 기록하였다.

실험 결과

연구 질문

  • RQ1고전적 슈퍼컴퓨터 자원을 사용할 때 49-qubit 보편 랜덤 회로의 최대 회로 깊이는 얼마인가?
  • RQ2Sunway TaihuLight와 같은 현대의 엑사스케일 시스템에서 49-qubit 회로의 전체 상태벡터를 이전 기록을 초월해 시뮬레이션할 수 있는가?
  • RQ3고성능 하드웨어에서 깊은 양자 회로에 대해 타겟된 보-amplitude 샘플링을 얼마나 효율적으로 수행할 수 있는가?
  • RQ4Sunway TaihuLight의 다수의 코어와 고대역폭 아키텍처에서 성능을 극대화하기 위해 필요한 아키텍처적 및 알고리즘적 최적화는 무엇인가?
  • RQ5깊은 회로에서 시뮬레이션된 결과 확률 분포는 이론적 Porter-Thomas 분포와 어느 정도 일치하는가?

주요 결과

  • 131,072개의 코어 그룹을 사용하여 4.2시간 만에 깊이 39의 49-qubit 전체 상태벡터를 성공적으로 계산하였으며, Sunway TaihuLight 전체 계산 능력의 80%를 활용하였다.
  • 단일 보-amplitude 샘플링에서는 49-qubit 회로의 깊이 55까지 도달하여 이 큐비트 수에서의 새로운 기록을 수립하였다.
  • 깊이 35와 39에서 시뮬레이션된 49-qubit 회로의 결과 확률 분포는 이론적 Porter-Thomas 분포와 밀도적으로 유사하여 양자 랜덤 행동을 확인하였다.
  • 유사한 하드웨어 조건에서 ETH의 단일 노드 구현 대비 1.84배 빠른 성능을 기록하여 메모리 액세스 최적화의 효과를 입증하였다.
  • 이 방법은 더 큰 격자로 확장 가능하여 7×8 및 8×8 큐비트로 확장되었으며, 깊이 35까지의 7×8 회로에서 부분적 보-amplitude 샘플링(2^37–2^42개의 보-amplitude)을 수행할 수 있었다.
  • 깊이 39에서 49-qubit 회로를 시뮬레이션한 결과 이전에 보고된 40-depth 한계를 초월하여, 이 깊이에서 49-qubit 양자 우월성이 고전적으로 시뮬레이터로 가능하다는 것을 증명하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.