Skip to main content
QUICK REVIEW

[论文解读] Quantum algorithms for supervised and unsupervised machine learning

Seth Lloyd, Masoud Mohseni|arXiv (Cornell University)|Jul 1, 2013
Quantum Computing Algorithms and Architecture参考文献 5被引用 563
一句话总结

本文提出了一种用于监督式与非监督式机器学习的量子算法,通过利用量子随机存取存储器(qRAM)与量子线性代数技术,实现了相较于经典方法的指数级加速。结果表明,聚类分配与k均值聚类可在 O(log(MN)) 时间内完成,相较经典方法的多项式时间 O(poly(MN)) 显著提升,从而实现对高维‘大量子数据’的高效处理,并增强了隐私保护。

ABSTRACT

Machine-learning tasks frequently involve problems of manipulating and classifying large numbers of vectors in high-dimensional spaces. Classical algorithms for solving such problems typically take time polynomial in the number of vectors and the dimension of the space. Quantum computers are good at manipulating high-dimensional vectors in large tensor product spaces. This paper provides supervised and unsupervised quantum machine learning algorithms for cluster assignment and cluster finding. Quantum machine learning can take time logarithmic in both the number of vectors and their dimension, an exponential speed-up over classical algorithms.

研究动机与目标

  • 开发可在高维向量与大规模数据集上实现指数级加速的量子算法,以解决机器学习任务。
  • 解决经典算法随向量数量与维度增加而呈现多项式增长的计算瓶颈问题。
  • 利用量子计算实现高效的监督式聚类分配与非监督式k均值聚类。
  • 探索在仅需 O(log(MN)) 量子比特查询大小为 O(MN) 的数据库时,量子机器学习在隐私保护方面的优势。

提出的方法

  • 利用量子随机存取存储器(qRAM)在 O(log N) 时间内将经典数据加载为量子态,实现对高维向量的叠加。
  • 采用量子傅里叶变换与量子线性系统算法等量子算法,在多项式对数时间 O(poly(log N)) 内对量子态进行后处理。
  • 应用量子相位估计算法在 O(log N) 时间内计算量子态之间的内积与距离,实现相较于经典采样的指数级加速。
  • 基于量子绝热量算法开发Lloyd k均值算法的量子版本,以 O(k log k MN) 时间完成聚类分配。
  • 通过使用多个量子态副本与厄米算符,将距离评估推广至非线性度量,实现更高阶多项式距离度量。
  • 利用量子计数在 O(ε⁻¹ q log N) 步骤内以精度 ε 估计算符的期望值,其中 q 为态副本数量。

实验结果

研究问题

  • RQ1量子算法是否可在高维空间中对向量分类与聚类任务实现相较于经典算法的指数级加速?
  • RQ2如何利用量子随机存取存储器(qRAM)高效地将经典数据以量子形式加载与处理,以支持机器学习?
  • RQ3与经典方法相比,计算大尺寸高维向量之间距离与内积的量子复杂度为何?
  • RQ4能否利用量子绝热量算法以量子加速近似求解 NP 难的 k均值聚类问题?
  • RQ5量子机器学习在多大程度上通过限制对原始数据库的查询次数来增强数据隐私?

主要发现

  • 在 N 维空间中对 M 个向量进行聚类分配,可在量子计算机上以 O(log(MN)) 时间完成,相较经典算法所需的 O(poly(MN)) 时间实现指数级加速。
  • 基于量子绝热量算法的量子 k均值算法运行时间为 O(k log k MN),为非监督聚类任务提供了指数级加速。
  • 量子算法可在 O(log N) 时间内估计高维向量之间的内积与距离,而经典方法需 O(poly(N)) 时间。
  • qRAM 的使用使得在 O(log N) 步骤内准备编码经典数据的量子态成为可能,从而实现对指数级大向量空间的高效访问。
  • 量子机器学习提供了增强的隐私保护:仅需 O(log(MN)) 个量子比特即可查询大小为 O(MN) 的数据库,从而将数据暴露范围限制在指数级小的范围内。
  • 即使对于可观测宇宙全部信息量(约 2³⁰⁰ 比特),仅需几百步操作,小型量子计算机即可表示并分析该数据。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。