[论文解读] Stratos: A Network-Aware Orchestration Layer for Virtual Middleboxes in Clouds
Stratos 是一个网络感知的编排层,通过软件定义网络(SDN)实现云环境中虚拟中间件的正确且高效的组合与配置。它通过轻量级、虚拟化感知的流调度确保转发正确性,并通过流量工程、动态流分布和网络感知的弹性扩展实现可扩展、资源高效的资源配置,与基线方案相比,资源使用量最高可减少三分之一。
Enterprises want their in-cloud services to leverage the performance and security benefits that middleboxes offer in traditional deployments. Such virtualized deployments create new opportunities (e.g., flexible scaling) as well as new challenges (e.g., dynamics, multiplexing) for middlebox management tasks such as service composition and provisioning. Unfortunately, enterprises lack systematic tools to efficiently compose and provision in-the-cloud middleboxes and thus fall short of achieving the benefits that cloud-based deployments can offer. To this end, we present the design and implementation of Stratos, an orchestration layer for virtual middleboxes. Stratos provides efficient and correct composition in the presence of dynamic scaling via software-defined networking mechanisms. It ensures efficient and scalable provisioning by combining middlebox-specific traffic engineering, placement, and horizontal scaling strategies. We demonstrate the effectiveness of Stratos using an experimental prototype testbed and large-scale simulations.
研究动机与目标
- 企业希望在云部署中利用中间件(如防火墙、入侵检测系统)的性能和安全优势,但缺乏系统化的工具来组合和配置这些中间件。
- 现有解决方案由于中间件的有状态特性以及数据包处理(如 NAT、会话终止)导致转发错误,尤其在动态扩展时更为严重。
- 当前的资源配置策略效率低下且不可扩展,常因网络瓶颈和缺乏协调而导致过度配置或资源利用率低下。
- 本文旨在设计并实现 Stratos,一种新型编排层,确保云环境中虚拟中间件的正确服务链组合与高效、可扩展的资源配置。
提出的方法
- Stratos 使用作为 Floodlight 模块实现的转发控制器,通过轻量级、虚拟化感知的 SDN 机制管理流调度,通过适度过度配置中间件链来避免调度歧义。
- 它采用多级资源配置策略:首先通过流分布处理瞬态瓶颈,且无需预先知晓瓶颈成因。
- 对于持久性瓶颈,它应用网络感知的水平扩展和虚拟机迁移,由流量工程和部署算法指导,以最小化网络占用并最大化资源利用率。
- 资源控制器使用线性规划(LP)计算最优流分布,并基于跨机架带宽和流量体积指标做出部署/迁移决策。
- 系统将流分布(非协调)与部署(协调)解耦,通过租户分区和模块化部署实现控制器的水平扩展。
- 一个原型实现(约 12,000 行 Java 代码)包含一个转发控制器和一个独立的资源控制器,通过真实测试平台和大规模仿真进行了评估。
实验结果
研究问题
- RQ1在云环境中存在数据包处理和动态资源配置的情况下,如何正确组合虚拟中间件链?
- RQ2哪些机制能够实现在不了解瓶颈类型前提下的高效、可扩展的虚拟中间件资源配置?
- RQ3网络感知的流分布与部署在多租户云部署中能在多大程度上减少资源消耗并提高利用率?
- RQ4Stratos 在高租户负载下如何扩展?其控制器能否支持数百个租户的实时资源配置决策?
主要发现
- Stratos 实现了 0% 的错误率,确保了转发组合的正确性,优于现有最先进技术在数据包处理和动态资源配置下约 19% 的错误率。
- 该组合机制对每个流和每个数据包处理中间件的额外开销仅为 1ms,支持低延迟操作。
- 与基线方案相比,Stratos 最多可将资源使用量减少三分之一,实现了更高的实例利用率(例如,50% 的实例处理 >12Mbps 流量,而 UniformFlow 中不足 3Mbps)。
- 网络利用率显著提升:Stratos 通过使中间件链更接近实际需求而实现跨机架流量增加,85% 的链路满足 30% 的需求,而 UniformFlow 中仅为 20%。
- 资源控制器在单台服务器上可维持每秒 51 次流分布操作和 67 次部署操作,支持数百个租户。
- 转发控制器可借助现有 SDN 技术实现扩展,且系统的控制逻辑足够响应迅速,可支持动态工作负载下的实时资源配置。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。