Skip to main content
QUICK REVIEW

[论文解读] Execution replay and debugging

Michiel Ronsse, Koenraad De Bosschere|ArXiv.org|Nov 6, 2000
Parallel Computing and Optimization Techniques参考文献 26被引用 37
一句话总结

本文全面综述了用于调试非确定性并行与分布式程序的执行重放技术,提出一种两阶段方法:在运行过程中记录程序执行轨迹,并以确定性方式重放这些轨迹以供调试。主要贡献在于通过使用向量时钟和消息追踪等技术,以最小性能开销捕获并重放执行事件,使标准循环调试工具能够应用于本质上非确定性的系统。

ABSTRACT

As most parallel and distributed programs are internally non-deterministic -- consecutive runs with the same input might result in a different program flow -- vanilla cyclic debugging techniques as such are useless. In order to use cyclic debugging tools, we need a tool that records information about an execution so that it can be replayed for debugging. Because recording information interferes with the execution, we must limit the amount of information and keep the processing of the information fast. This paper contains a survey of existing execution replay techniques and tools.

研究动机与目标

  • 解决手写并行与分布式程序缺乏有效调试工具的问题,这些程序本质上具有非确定性。
  • 克服传统调试器在面对非确定性行为(如海森堡错误)时因时间干扰而失效的局限性。
  • 通过确定性重放,使标准循环调试技术(如断点设置与数据竞争检测)能够应用于并行与分布式程序。
  • 识别并分类顺序、并行与分布式程序中非确定性的来源,以指导轨迹收集与重放设计。
  • 综述并评估现有执行重放方法,重点关注最小化性能与存储开销,同时确保重放的确定性。

提出的方法

  • 采用两阶段执行重放模型:在正常运行期间记录程序执行轨迹,随后使用相同输入和记录的事件进行确定性重放。
  • 应用向量时钟以追踪事件之间的因果关系,并在重放过程中检测数据竞争,尤其适用于共享内存系统。
  • 采用窥探矩阵时钟,在数据竞争检测中通过丢弃因果无关的内存操作来减少内存开销。
  • 对消息传递库(如MPI、PVM)进行插桩,以记录发送与接收操作,包括非阻塞测试操作,确保重放的确定性。
  • 对于泛洪接收操作,记录实际发送者,以便在重放时替换为点对点接收,消除非确定性。
  • 使用带标签的消息与检查点技术,以模拟或部分重放执行,尤其适用于PVM等分布式系统或Athapascan等混合系统。

实验结果

研究问题

  • RQ1如何捕获并确定性地重放并行与分布式程序中的非确定性行为,以支持标准调试?
  • RQ2并行与分布式程序中非确定性的主要来源是什么?它们与顺序程序中的来源有何不同?
  • RQ3哪些技术能够在确保准确完整重放的同时,最小化性能与存储开销?
  • RQ4如何使具有泛洪接收操作的消息传递系统在重放过程中实现确定性?
  • RQ5尽管在轨迹与消息日志方面已取得进展,为何输入重放问题在执行重放中仍是一个未解难题?

主要发现

  • 通过使重放执行过程确定性化,执行重放技术使标准循环调试工具能够应用于非确定性并行与分布式程序。
  • 向量时钟在重放过程中通过追踪内存操作之间的因果依赖关系,有效检测数据竞争。
  • 窥探矩阵时钟通过丢弃因果无关的操作,显著降低了数据竞争检测中的内存开销。
  • 在消息传递系统(如MPI、PVM)中进行消息日志记录可实现确定性重放,但必须显式记录非阻塞测试操作以确保正确性。
  • 通过记录实际发送者,泛洪接收操作可被确定性化,使重放过程能将其替换为点对点接收。
  • 尽管已有进展,但现有工具仍无法完全支持程序输入(如键盘输入、文件I/O)的确定性重放,这在调试流程中留下了一个关键缺口。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。