Skip to main content
QUICK REVIEW

[论文解读] Reconstruction of a Photonic Qubit State with Quantum Reinforcement Learning

Shang Yu, F. Albarrán-Arriagada|arXiv (Cornell University)|Aug 28, 2018
Neural Networks and Reservoir Computing被引用 2
一句话总结

本文提出了一种半量子强化学习协议,仅使用有限数量的副本即可重建未知的光子量子比特态。通过迭代地利用单次测量和反馈信号(奖励/惩罚)调整光子代理量子比特,该方法在50次迭代内实现了超过88%的保真度,展示了在资源受限场景下量子态重建的可扩展方法。

ABSTRACT

An experiment is performed to reconstruct an unknown photonic quantum state with a limited amount of copies. A semi-quantum reinforcement learning approach is employed to adapt one qubit state, an agent, to an unknown quantum state, an environment, by successive single-shot measurements and feedback, in order to achieve maximum overlap. The experimental learning device herein, composed of a quantum photonics setup, can adjust the corresponding parameters to rotate the agent system based on the measurement outcomes 0 or 1 in the environment (i.e., reward/punishment signals). The results show that, when assisted by such a quantum machine learning technique, fidelities of the deterministic single-photon agent states can achieve over 88% under a proper reward/punishment ratio within 50 iterations. This protocol offers a tool for reconstructing an unknown quantum state when only limited copies are provided, and can also be extended to higher dimensions, multipartite, and mixed quantum state scenarios.

研究动机与目标

  • 解决在仅有少量未知态副本可用时的量子态重建挑战。
  • 开发一种基于反馈的学习协议,使光子代理能够自适应地调整其态以匹配未知目标态。
  • 展示利用量子机器学习技术在光子系统中实现态重建的可行性。
  • 将该方法扩展至更高维度、多体以及混合量子态,超越单量子比特系统。

提出的方法

  • 使用光量子平台实现一个强化学习代理,通过根据测量结果调整其态参数来演化。
  • 每次对未知态进行单次测量后,环境提供二元反馈(结果为1时奖励,结果为0时惩罚)。
  • 代理态通过受控酉操作进行旋转,以响应反馈,其调整遵循最大化与未知态重叠的学习规则。
  • 学习过程为迭代式,每个回合包括一次测量和参数更新,最多重复50次。
  • 奖励/惩罚比例经过调节,以优化收敛性和重建态的保真度。
  • 该协议通过单光子态和线性光学元件在实验中实现。

实验结果

研究问题

  • RQ1能否仅使用有限数量的副本,训练光子代理以重建未知的单光子量子比特态?
  • RQ2奖励/惩罚比例如何影响态重建过程的保真度和收敛速度?
  • RQ3该强化学习方法在多大程度上可扩展至更高维度和纠缠量子态?
  • RQ4在有限迭代次数和实际实验约束条件下,重建态的最大可实现保真度是多少?

主要发现

  • 当采用合适的奖励/惩罚比例时,该协议在重建代理态与未知目标态之间实现了超过88%的保真度。
  • 在50次迭代内观察到保真度提升,表明学习过程收敛迅速。
  • 实验装置成功实现了基于反馈的光子量子比特和单次测量的量子机器学习协议。
  • 该方法对副本数量有限具有鲁棒性,适用于态制备成本高或稀少的场景。
  • 该方法在原则上可扩展至更高维度的量子比特系统和多体纠缠态。
  • 结果表明,半量子强化学习在光子量子信息系统的实际量子态重建中具有可行性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。