Skip to main content
QUICK REVIEW

[论文解读] Codes Can Reduce Queueing Delay in Data Centers

Longbo Huang, Sameer Pawar|arXiv (Cornell University)|Feb 7, 2012
Advanced Data Storage Technologies参考文献 7被引用 18
一句话总结

本文提出了一种新颖的调度算法——阻塞单次调度(Blocking-one Scheduling, BoS),并结合线性网络编码,以减少数据中心存储系统中的数据检索延迟。通过允许多个服务器之间灵活地复用访问编码数据,该方法相比基于复制的策略将平均请求延迟降低了最多17%,同时吞吐量损失仅为O(1/r²),即使在冗余因子较低的情况下也表现出显著优势。

ABSTRACT

In this paper, we quantify how much codes can reduce the data retrieval latency in storage systems. By combining a simple linear code with a novel request scheduling algorithm, which we call Blocking-one Scheduling (BoS), we show analytically that it is possible to reduce data retrieval delay by up to 17% over currently popular replication-based strategies. Although in this work we focus on a simplified setting where the storage system stores a single content, the methodology developed can be applied to more general settings with multiple contents. The results also offer insightful guidance to the design of storage systems in data centers and content distribution networks.

研究动机与目标

  • 量化编码相对于复制在数据中心存储系统中降低延迟的潜力。
  • 解决在具有非独立同分布请求依赖关系的编码系统中分析排队延迟的挑战。
  • 设计一种实用的调度算法,以实现对编码存储系统进行清晰的解析建模。
  • 证明编码可在服务器利用率方面提供多路复用增益,从而减少热门数据的争用。
  • 为数据中心和内容分发网络中的低延迟存储系统提供设计洞见。

提出的方法

  • 提出阻塞单次调度(BoS)算法,该算法在首项请求处理完成前阻塞后续请求,从而消除调度决策中的依赖性。
  • 将系统建模为连续时间马尔可夫链,状态用于跟踪队列长度和请求类型(分组或组)。
  • 推导稳态概率π_l、π_l^p和π_l^g的递归方程,以计算平均延迟。
  • 采用指数服务时间与泊松请求到达模型,以模拟真实的数据中心工作负载。
  • 应用类型-1和类型-2截断,推导不同队列状态下状态概率的递归关系。
  • 利用推导出的稳态概率计算平均分组和请求延迟,给出π_{2r}^p、π_{2r}^g以及π_{2r+2m}^p、π_{2r+2m}^g的显式表达式。

实验结果

研究问题

  • RQ1即使在冗余因子较低的情况下,编码是否仍能相比复制减少数据中心中的数据检索延迟?
  • RQ2在编码存储系统中,延迟降低与吞吐量损失之间的根本权衡是什么?
  • RQ3如何设计一种调度算法,以实现对编码系统进行解析建模,同时性能下降最小?
  • RQ4编码在减少热门数据对象争用方面提供了多大的多路复用增益?
  • RQ5所提出的阻塞单次调度(BoS)算法与传统复制在延迟和吞吐量方面相比如何?

主要发现

  • 在冗余因子r=2的示例中,所提出的编码系统结合BoS算法,相比复制方案,平均请求延迟至少降低了7%。
  • 在所分析的设置中,该系统相比基于复制的策略,平均数据检索延迟最高可降低17%。
  • 由于BoS导致的吞吐量损失为O(1/r²),当r=2时,系统可达到最大可能吞吐量的96%。
  • 分析表明,编码通过允许任意两台四台服务器中的任意两台服务一个文件,提供了多路复用增益,而复制则将每个分组限制在两台固定服务器上。
  • 在BoS下,请求级延迟与分组级延迟之间的期望延迟差被解析推导,并显示其值较小,验证了模型的准确性。
  • 推导出的稳态概率递归方程可精确计算编码系统的延迟性能,从而实现与复制方案的定量比较。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。