Skip to main content
QUICK REVIEW

[论文解读] Slow Down or Halt: Saving the Optimal Energy for Scalable HPC Systems

Li Tan, Zizhong Chen|arXiv (Cornell University)|Nov 10, 2014
Cloud Computing and Resource Management被引用 2
一句话总结

本文在现代 CMOS 约束条件下,通过对比 race-to-halt 与 CP-aware 空闲时间重分配技术,研究了可扩展 HPC 系统中的能效问题。结果表明,由于电压调节余量极小,两种方法在能效方面的性能差距显著缩小,大规模集群实验验证了 CP-aware 重分配方法依然有效,但其优势不如以往认为的那样显著。

ABSTRACT

The presence of pervasive slack provides ample opportunities for achieving energy efficiency for HPC systems nowadays. Regardless of communication slack, classic energy saving ap-proaches for saving energy during the slack otherwise include race-to-halt and CP-aware slack reclamation, which reply on power scaling techniques to adjust processor power states ju-diciously during the slack. Existing efforts demonstrate CP-aware slack reclamation is superior to race-to-halt in energy saving capability. In this paper, we formally model our ob-servation that the energy saving capability gap between the two approaches is significantly narrowed down on today’s processors, given that state-of-the-art CMOS technologies allow insignificant variation of supply voltage as operating frequency of a processor scales. Experimental results on a large-scale power-aware cluster validate our findings.

研究动机与目标

  • 分析现代 HPC 系统中 race-to-halt 与 CP-aware 空闲时间重分配技术之间的能效差距。
  • 研究先进 CMOS 技术中有限的电压调节能力对节能技术相对性能的影响。
  • 在大规模功耗感知集群上评估 CP-aware 空闲时间重分配与 race-to-halt 技术的实际节能效果。
  • 确定在当前硬件约束下,CP-aware 空闲时间重分配是否仍具有显著优势。

提出的方法

  • 对 race-to-halt 与 CP-aware 空闲时间重分配技术之间节能能力差异进行形式化建模。
  • 利用功耗调节技术在空闲(空闲时间)期间调整处理器功耗状态。
  • 分析在频率调节过程中,电源电压变化极小对节能效果的影响。
  • 通过大规模功耗感知集群上的实验验证,比较不同方法的能效表现。
  • 使用真实工作负载轨迹,在实际 HPC 条件下评估性能表现。

实验结果

研究问题

  • RQ1在现代 CMOS 约束条件下,race-to-halt 与 CP-aware 空闲时间重分配技术之间的节能能力差距如何变化?
  • RQ2有限的电压调节能力在多大程度上影响了 CP-aware 空闲时间重分配技术的有效性?
  • RQ3在当今的处理器上,CP-aware 空闲时间重分配是否仍优于 race-to-halt 技术的能效表现?
  • RQ4当频率调节过程中电源电压变化可忽略不计时,功耗调节技术的表现如何?

主要发现

  • 在现代处理器上,race-to-halt 与 CP-aware 空闲时间重分配技术之间的节能能力差距显著缩小。
  • 先进 CMOS 技术限制了电源电压的可调范围,从而削弱了 CP-aware 技术的优势。
  • CP-aware 空闲时间重分配技术仍优于 race-to-halt,但其性能优势不如以往世代显著。
  • 在大规模功耗感知集群上的实验结果证实,在当前硬件约束下,两种技术的性能差距正在缩小。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。