QUICK REVIEW

[论文解读] Generative training of quantum Boltzmann machines with hidden units

Nathan Wiebe, Leonard Wossnig|arXiv (Cornell University)|May 23, 2019

Quantum Computing Algorithms and Architecture参考文献 37被引用 32

一句话总结

本文提出了两种针对同时具有可观测单元和隐藏单元的量子玻尔兹曼机进行生成训练的高效量子算法，以量子相对熵作为目标函数。第一种方法针对隐藏哈密顿量可对易的情况，采用变分上界；第二种方法利用高阶差分与酉算符的线性组合来近似梯度，两者在高效吉布斯态制备的前提下均实现了高效训练。

ABSTRACT

In this article we provide a method for fully quantum generative training of quantum Boltzmann machines with both visible and hidden units while using quantum relative entropy as an objective. This is significant because prior methods were not able to do so due to mathematical challenges posed by the gradient evaluation. We present two novel methods for solving this problem. The first proposal addresses it, for a class of restricted quantum Boltzmann machines with mutually commuting Hamiltonians on the hidden units, by using a variational upper bound on the quantum relative entropy. The second one uses high-order divided difference methods and linear-combinations of unitaries to approximate the exact gradient of the relative entropy for a generic quantum Boltzmann machine. Both methods are efficient under the assumption that Gibbs state preparation is efficient and that the Hamiltonian are given by a sparse row-computable matrix.

研究动机与目标

解决长期以来使用量子相对熵作为目标函数时，训练含隐藏单元的量子玻尔兹曼机的挑战。
克服因隐藏单元存在导致对数项中部分迹运算带来的梯度计算数学困难。
开发适用于大规模系统且保持精度的实用高效量子算法，实现生成训练的可扩展性。
通过学习能紧密逼近目标密度算符的哈密顿量，实现对复杂量子态的量子生成建模。
在真实量子硬件约束（包括噪声态制备）下，确保梯度估计的鲁棒性与精度。

提出的方法

针对隐藏单元哈密顿量相互对易的受限量子玻尔兹曼机，提出量子相对熵的变分上界，实现梯度计算的可处理性。
采用高阶差分方法近似量子相对熵的精确梯度，以数值近似替代解析导数。
利用酉算符的线性组合（LCU）技术模拟所需量子操作，包括时间演化与态制备，误差可控。
应用量子幅度估计算法与均值中位数估计法，降低所有参数维度上梯度估计的失败概率。
通过稀疏哈密顿量模拟实现高效的吉布斯态制备，确保在合理假设下整体算法保持高效。
结合迹范数误差界与切尔诺夫型集中不等式，控制梯度估计过程的总失败概率。

实验结果

研究问题

RQ1能否使用量子相对熵作为损失函数，高效训练含隐藏单元的量子玻尔兹曼机？
RQ2哪些技术可克服由于相对熵对数项中部分迹运算导致的梯度计算不可行性？
RQ3是否可利用量子模拟技术实现对通用量子玻尔兹曼机的高效梯度估计？
RQ4如何控制吉布斯态制备与哈密顿量模拟中的误差传播，以确保整体算法精度？
RQ5所提训练算法在访问数据密度矩阵与哈密顿量预言机时的查询复杂度是多少？

主要发现

所提出的变分上界方法可实现对一类隐藏哈密顿量可对易的受限量子玻尔兹曼机的高效训练，避免了难以处理的梯度计算。
采用高阶差分与LCU的一般方法，梯度估计的总查询复杂度为 $\tilde{O}\left(\sqrt{\frac{N}{z}}\frac{D\|H(\theta)\|d\mu^{5}\alpha}{\epsilon^{3}}\right)$，其中隐藏了对数因子。
通过重复梯度估计并取中位数，可确保总失败概率小于 1/3，样本数量按 $O(\log D)$ 缩放。
为吉布斯态制备与哈密顿量模拟推导出误差界，显示近似线性的误差传播，支持可控的精度权衡。
在吉布斯态制备高效且哈密顿量为稀疏、行可计算矩阵的假设下，该方法具有高效性。
该框架实现了含隐藏单元的量子玻尔兹曼机的完整量子生成训练，解决了量子机器学习领域的一个重大开放问题。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。