Skip to main content
QUICK REVIEW

[论文解读] The Case for Reliable Software Transactional Networking

Marco Canini, Petr Kuznetsov|arXiv (Cornell University)|May 31, 2013
Distributed systems and fault tolerance参考文献 12被引用 4
一句话总结

本文提出了一种软件定义网络(SDN)控制平面的事务接口,以确保在控制器发生故障的情况下,仍能实现并发网络策略更新的一致性与原子性组合。证明了在异步网络中,单个控制器崩溃时,一致的策略组合是不可能的,但识别出更强的系统模型和算法解决方案,从而在形式化复杂度分析下实现可靠性。

ABSTRACT

Software-defined networking (SDN) is a novel paradigm that out-sources the control of packet-forwarding switches to a set of software controllers. The most fundamental task of these controllers is the correct implementation of the network policy, i.e., the intended network behavior. In essence, such a policy specifies the rules by which packets must be forwarded across the network. This paper initiates the study of the SDN control plane as a distributed system. We introduce a formal model describing the interaction between the data plane and a distributed control plane (consisting of a collection of fault-prone controllers). Then we formulate the problem of consistent composition of concurrent network policy updates. The composition is enabled via a transactional interface with all-or-nothing semantics. The system behaves as though committed updates are installed atomically and every data packet traverses the network instantaneously, respecting a sequential composition of previously installed committed updates. Updates that cannot be composed are aborted and do not affect the data plane. We show that in the asynchronous environment, it is impossible to achieve consistent policy composition that tolerates a single controller crash. We then discuss stronger variants of the model that allow for solving the problem and study algorithmic complexities of such solutions. 1

研究动机与目标

  • 将SDN控制平面形式化为与故障易发控制器集合交互的分布式系统。
  • 解决在分布式、不可靠环境中并发网络策略更新的一致性组合挑战。
  • 设计具有全有或全无语义的事务接口,以确保原子性和顺序行为。
  • 识别在故障条件下实现可靠策略组合的系统模型和算法解决方案。

提出的方法

  • 使用故障易发控制器的模型,形式化数据平面与分布式控制平面之间的交互。
  • 定义事务接口,确保更新以原子方式应用或完全中止。
  • 将网络建模为已提交的更新被即时且顺序地安装。
  • 使用分布式系统理论,证明在异步系统中单个控制器崩溃下的不可能性结果。
  • 引入更强的系统模型(例如,包含故障检测器或同步假设的模型),以使问题的可解变体成为可能。
  • 在这些增强模型下,分析解决方案的算法复杂度。

实验结果

研究问题

  • RQ1在具有故障易发控制器的异步、分布式SDN控制平面中,能否实现并发网络策略更新的一致性组合?
  • RQ2为克服单个控制器崩溃下策略组合的一致性不可能性,需要哪些系统假设?
  • RQ3事务接口如何在并发更新和故障存在的情况下确保原子性和顺序行为?
  • RQ4在更强的系统模型下,可靠策略组合的算法复杂度如何?
  • RQ5在控制器故障存在的情况下,能提供哪些形式化保证以确保正确性和一致性?

主要发现

  • 在异步环境中,即使仅发生单个控制器崩溃,一致的策略组合也是不可能的,这是由于分布式共识的基本限制。
  • 该不可能性结果在标准异步系统假设下依然成立,即使仅存在单一故障。
  • 更强的模型——如包含故障检测器或同步假设的模型——可使问题的可解变体成为可能。
  • 本文识别出在这些增强模型下解决问题的必要且充分条件。
  • 在更强模型下的算法解决方案表现出形式化的复杂度边界,其复杂度以消息开销和时间开销进行分析。
  • 事务接口确保所有更新均以原子方式应用或完全不应用,从而保持网络的一致性和顺序行为。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。