Skip to main content
QUICK REVIEW

[论文解读] An efficient deterministic perturbation theory for selected configuration interaction methods

Norm M. Tubman, Daniel S. Levine|arXiv (Cornell University)|Aug 6, 2018
Advanced Chemical Physics Studies参考文献 1被引用 26
一句话总结

本文提出了一种高效、完全确定性的二阶微扰论(PT2)算法,用于选择配置相互作用(SCI)方法,通过快速排序技术与优化的数据结构,使PT2修正的计算速度比近期的随机方法快数个数量级。该方法实现了高精度与可扩展性,仅使用适度的计算资源即可实现F₂等困难体系的收敛,并表明紧凑的参考SCI波函数能显著加速PT2收敛。

ABSTRACT

The interplay between advances in stochastic and deterministic algorithms has recently led to development of interesting new selected configuration interaction (SCI) methods for solving the many body Schrödinger equation. The performance of these SCI methods can be greatly improved with a second order perturbation theory (PT2) correction, which is often evaluated in a stochastic or hybrid-stochastic manner. In this work, we present a highly efficient, fully deterministic PT2 algorithm for SCI methods and demonstrate that our approach is orders of magnitude faster than recent proposals for stochastic SCI+PT2. We also show that it is important to have a compact reference SCI wave function, in order to obtain optimal SCI+PT2 energies. This indicates that it advantageous to use accurate search algorithms such as 'ASCI search' rather than more approximate approaches. Our deterministic PT2 algorithm is based on sorting techniques that have been developed for modern computing architectures and is inherently straightforward to use on parallel computing architectures. Related architectures such as GPU implementations can be also used to further increase the efficiency. Overall, we demonstrate that the algorithms presented in this work allow for efficient evaluation of trillions of PT2 contributions with modest computing resources.

研究动机与目标

  • 开发一种快速、确定性的替代方案,用于选择配置相互作用(SCI)方法中的随机PT2修正。
  • 解决尽管SCI中随机方法日益普及,但高效确定性PT2算法仍显不足的问题。
  • 提升强关联体系(如F₂和过渡金属配合物)中SCI+PT2计算的效率与精度。
  • 证明紧凑的参考波函数可显著加快PT2收敛速度并提高精度。
  • 实现在现代并行与GPU架构上的可扩展、高性能SCI+PT2计算。

提出的方法

  • 该方法利用针对现代计算架构优化的快速排序算法,高效组织并处理大量配置相互作用行列式。
  • 在排序前通过位串哈希转换为64位整数,减少内存访问并加速PT2评估期间的数据查找。
  • 通过预先计算的电子激发部分贡献,实现快速对角矩阵元计算,降低每条连接的计算时间。
  • 通过系统性地评估参考SCI波函数的所有单激发与双激发连接,计算完整的PT2能量。
  • 该方法具有天然的并行性,由于其规则的内存访问模式和数据并行操作,非常适合GPU加速。
  • 通过确定性枚举并求和所有相关矩阵元,避免随机采样,确保结果可重现性,并在精度上优于随机方法。

实验结果

研究问题

  • RQ1完全确定性的PT2算法是否能在速度与精度上超越近期的随机与混合随机方法,应用于SCI方法?
  • RQ2参考波函数的紧凑性对SCI+PT2计算收敛速度与精度有何影响?
  • RQ3在现代高性能计算架构上,确定性PT2的性能如何随体系大小与基组大小而变化?
  • RQ4优化的数据结构与排序技术是否能显著降低评估数万亿项PT2矩阵元的计算成本?
  • RQ5即使考虑数值精度,确定性PT2是否在根本上优于随机方法?

主要发现

  • 该确定性PT2算法在SCI+PT2计算中比近期随机方法快两个数量级。
  • 该算法成功收敛了F₂的基态能量,该体系此前在标准SCI方法中难以处理。
  • 在大cc-pVQZ基组计算中,排序前将位串哈希为64位整数,使速度提升两倍。
  • 通过ASCI搜索获得的紧凑参考SCI波函数,显著加快PT2收敛并提升整体精度。
  • 该方法仅使用适度计算资源即可评估数万亿项PT2贡献,展示了在并行与GPU架构上的高度可扩展性。
  • 确定性方法在本质上比随机方法更精确,因其消除了采样误差并确保了可重现性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。