Skip to main content
QUICK REVIEW

[论文解读] Coarse-grained lattice protein folding on a quantum annealer

Tomáš Babej, Christopher Ing|arXiv (Cornell University)|Nov 2, 2018
Cellular Automata and Applications参考文献 16被引用 27
一句话总结

本论文提出了一种改进的伊辛哈密顿量编码方法,用于在量子退火机上进行格点蛋白折叠,实现了在平面格点上对10个残基的Chignolin和在立方格点上对8个残基的Trp-Cage的高效折叠,使用的是D-Wave 2000Q。Chignolin的时间-解算(TTS)为0.377秒,Trp-Cage为3.805秒,创下基于量子退火的三维格点蛋白折叠新纪录。

ABSTRACT

Lattice models have been used extensively over the past thirty years to examine the principles of protein folding and design. These models can be used to determine the conformation of the lowest energy fold out of a large number of possible conformations. However, due to the size of the conformational space, new algorithms are required for folding longer proteins sequences. Preliminary work was performed by Babbush et al. (2012) to fold a small peptide on a planar lattice using a quantum annealing device. We extend this work by providing improved Ising-type Hamiltonian encodings for the problem of finding the lowest energy conformation of a lattice protein. We demonstrate a decrease in quantum circuit complexity from quadratic to quasilinear in certain cases. Additionally, we generalize to three spatial dimensions in order to obtain results with higher correlation to the actual atomistic 3D structure of the protein and outline our heuristic approach for splitting large problem instances into smaller subproblems that can be directly solved with the current D-Wave 2000Q architecture. To the best of our knowledge, this work sets a new record for lattice protein folding on a quantum annealer by folding Chignolin (10 residues) on a planar lattice and Trp-Cage (8 residues) on a cubic lattice.

研究动机与目标

  • 为克服使用量子退火解决更长序列格点蛋白折叠时的计算不可行性。
  • 将平面格点折叠推广至三维立方格点,以提升结构精度。
  • 通过优化伊辛哈密顿量编码,将量子线路复杂度从二次方降低至准线性,实现资源效率提升。
  • 通过将大实例分解为与D-Wave 2000Q架构兼容的小型子问题,实现更大蛋白的可扩展折叠。
  • 展示量子退火在平面HP模型之外的可行性,包括多残基相互作用和真实的三维空间约束。

提出的方法

  • 开发了一种新型伊辛型哈密顿量编码方法,在特定情况下将线路复杂度从二次方降低至准线性,提升资源效率。
  • 将折叠模型扩展至三维立方格点,以更真实地反映蛋白质的三维结构,并实现更精确的能量最小化。
  • 实施了一种启发式子问题分解策略,将大型蛋白折叠问题映射到D-Wave 2000Q的2048量子比特、有限连通性的Chimera图上。
  • 使用反向退火及后处理技术(如单自旋翻转)以提高成功概率并减少时间-解算(TTS)。
  • 采用混合经典-量子方法:量子退火识别低能量构象,随后通过基于约束的分子动力学模拟进行优化。
  • 采用二进制网格坐标系统进行量子比特映射,并施加约束以确保自避免性及残基间固定间距(3.8 Å)在格点上。

实验结果

研究问题

  • RQ1量子退火能否有效用于三维空间中的格点蛋白折叠,从而在结构保真度上超越平面模型?
  • RQ2伊辛哈密顿量编码能否被优化,以实现格点蛋白折叠中从二次方到准线性量级的复杂度降低?
  • RQ3在当前一代量子退火机上,折叠如Chignolin和Trp-Cage等小蛋白的可实现成功概率和时间-解算(TTS)是多少?
  • RQ4如何将大型蛋白折叠问题分解为适合D-Wave 2000Q硬件约束的子问题?
  • RQ5量子退火能否在寻找超过小序列的格点蛋白低能量构象方面超越经典方法?

主要发现

  • 作者首次成功在立方格点上使用量子退火机折叠了蛋白质,证明了使用量子硬件实现三维格点折叠的可行性。
  • Chignolin(10个残基)在平面格点上成功折叠,时间-解算(TTS)为0.377秒,创下基于量子退火的格点蛋白折叠新纪录。
  • Trp-Cage(8个残基)在立方格点上成功折叠,时间-解算(TTS)为3.805秒,在包含正确解的子问题中成功概率为0.099。
  • 总体成功概率为2.42×10⁻⁵,需约190,262次采样才能以99%的置信度找到基态。
  • 改进的哈密顿量编码在特定情况下将量子线路复杂度从二次方降低至准线性,显著提升资源效率。
  • 该算法在多个量子处理单元(QPUs)上天然具备并行性,可通过分布式执行实现未来可扩展性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。