Skip to main content
QUICK REVIEW

[论文解读] Reinforcement-learning based matterwave interferometer in a shaken optical lattice

Liang-Ying Chih, Murray Holland|arXiv (Cornell University)|Jun 21, 2021
Cold Atom Physics and Bose-Einstein Condensates参考文献 38被引用 33
一句话总结

本文提出了一种基于强化学习(RL)的物质波干涉仪设计,应用于抖动光学晶格中,利用RL优化模拟分束器、镜子和再结合器的晶格抖动协议。该方法在加速度敏感度方面优于标准布喇格干涉测量,展示了RL在复杂多路径系统中构建高性能量子传感器的潜力。

ABSTRACT

We demonstrate the design of a matterwave interferometer to measure acceleration in one dimension with high precision. The system we base this on consists of ultracold atoms in an optical lattice potential created by interfering laser beams. Our approach uses reinforcement learning, a branch of machine learning, that generates the protocols needed to realize lattice-based analogs of optical components including a beam splitter, a mirror, and a recombiner. The performance of these components is evaluated by comparison with their optical analogs. The interferometer's sensitivity to acceleration is quantitatively evaluated using a Bayesian statistical approach. We find the sensitivity to surpass that of standard Bragg interferometry, demonstrating the future potential for this design methodology.

研究动机与目标

  • 开发一种基于一维光学晶格中超冷原子的高精度物质波干涉仪,用于加速度传感。
  • 克服在设计多路径干涉仪复杂量子控制协议时,直观或经典优化方法的局限性。
  • 应用无模型强化学习,发现抖动晶格中分束器、镜子和再结合器的非直观、高保真度控制协议。
  • 使用贝叶斯统计分析评估干涉仪性能,量化其对加速度的敏感度。
  • 证明RL设计的协议在敏感度方面可超越传统布喇格干涉测量。

提出的方法

  • 使用无模型深度强化学习(DDQN)学习抖动光学晶格的最优时变相位调制函数 φ(t)。
  • 将状态定义为时间演化算符在相关动量子空间(例如 |±4ℏkL⟩)中的矩阵元。
  • 将动作定义为在特征频率 12ωr 下正弦相位调制的离散振幅。
  • 采用基于目标幺正操作保真度(例如分束器或镜子操作)的奖励函数,以指导学习过程。
  • 使用双深度Q网络(DDQN)算法、Adam优化器和经验回放训练智能体。
  • 通过贝叶斯统计推断验证性能,量化对加速度的敏感度。

实验结果

研究问题

  • RQ1强化学习能否在抖动光学晶格中发现物质波干涉仪组件(分束器、镜子、再结合器)的高保真度控制协议?
  • RQ2RL设计的干涉仪在加速度敏感度方面是否优于标准布喇格干涉测量?
  • RQ3无模型RL能否在设计复杂多路径量子干涉仪方面超越基于人类直觉或经典优化的方法?
  • RQ4控制频率的选择(例如 12ωr)如何影响镜子和分束器组件的性能?
  • RQ5RL设计的干涉仪可实现的敏感度是多少?与现有基准相比在定量上如何?

主要发现

  • RL设计的干涉仪在加速度敏感度方面超越了标准布喇格干涉测量,展现出关键性能优势。
  • 在固定振幅调制下,分束器和镜子组件的通道保真度最高达到0.8,且通过RL优化进一步提升。
  • 最优抖动协议具有非直观性,凸显了RL发现超越人类设计偏见的新解决方案的能力。
  • 贝叶斯统计框架的使用证实了干涉仪的高精度,敏感度以最小可检测加速度量化。
  • 该方法成功利用了抖动晶格的多路径特性,学习到利用布洛赫态丰富动力学的控制策略。
  • 超参数调优(例如学习率 α=0.001,γ=0.99)使训练稳定,并在8,000至20,000个回合内收敛,具体取决于任务。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。