QUICK REVIEW

[論文レビュー] Correctness and Performance for Stateful Chained Network Functions

Junaid Khalid, Aditya Akella|arXiv (Cornell University)|Dec 5, 2016

Software-Defined Networks and 5G被引用数 43

ひとこと要約

CHCは、共有メモリーストアに状態を外部化し、論理クロックとメタデータを用いて一貫性のある状態管理を実現することで、ステートフルで動的に管理されるネットワーク機能（NF）チェーン全体で正しさ（COE）と高いパフォーマンスを保証する画期的なNFVフレームワークである。CHCは1NFあたり9.42Gbpsのスループットを達成し、0.6μs未満のレイテンシーオーバーヘッドを実現し、障害発生時にも高速かつ正しく回復可能であり、重複更新の抑制も可能である。

ABSTRACT

Network functions virtualization (NFV) allows operators to employ NF chains to realize custom policies, and dynamically add instances to meet demand or for failover. NFs maintain detailed per- and cross-flow state which needs careful management, especially during dynamic actions. Crucially, state management must: (1) ensure NF chain-wide correctness and (2) have good performance. To this end, we built ame, an NFV framework that leverages an external state store coupled with state management algorithms and metadata maintenance for correct operation even under a range of failures. Our evaluation shows that CHC can support ~10Gbps per-NF throughput and <0.6mus increase in median per-NF packet processing latency, and chain-wide correctness at little additional cost.

研究の動機と目的

ステートフルで動的にスケーリングされたり、障害が発生したりするNFインスタンスを管理する際、既存のNFVフレームワークに見られる正しさとパフォーマンスの欠如を是正すること。
動的トラフィック再割り当て、障害、共有状態の更新の下でも、チェーン全体の正しさ（COE）を保証すること。
特にフェイルオーバーやロードバランシング時における状態管理に起因するパフォーマンスオーバーヘッドを最小限に抑えること。
NF、ルート、データストアの障害から効率的で低レイテンシな回復を可能にするとともに、状態の一貫性を維持すること。
遅延や障害が発生する上流NFによる、余計な重複状態更新を抑制すること。

提案手法

CHCはNFの状態をメモリ上に保持する永続的で外部のデータストアに外部化することで、障害発生後も状態の可用性を確保する。
チェーンの入口に論理クロックを導入し、パケットの順序を追跡することで、分散されたNFインスタンス間での相対的な順序付けを可能にする。
データストアおよびNFにメタデータログを維持することで、処理中のパケットと更新操作を追跡し、重複抑制と正しく回復可能となるようにする。
CHCはスコープに配慮したトラフィックパーティショニングと、状態アクセスパターンの認識を活用し、インスタンス間の共有状態の調整を最小限に抑える。
共有状態の更新処理をデータストアにオフロードし、一貫性を保つためにシリアライズすることで、NFでの調整オーバーヘッドを低減する。
障害回復プロトコルは論理クロックと操作ログを活用し、障害なしの実行と同一の状態を再構築することで、COEを保証する。

実験結果

リサーチクエスチョン

RQ1共有状態とフローごとの状態を併用する状況下でも、動的スケーリング、フェイルオーバー、トラフィック再割り当てが発生しても、ステートフルなNFチェーンが正しさ（COE）を維持できるか？
RQ2高スループットなNFチェーンにおいて、状態管理を最適化することで、ほぼゼロに近いパフォーマンスオーバーヘッドを達成できるか？
RQ3論理クロックとメタデータログは、ネットワーク遅延や遅延が発生するNFによる重複状態更新を抑制できるか？
RQ4NF、ルート、またはデータストアの障害からの回復に伴うパフォーマンスオーバーヘッドはどの程度か？正しさを保証しつつ。
RQ5障害や負荷状態下において、既存のフレームワークと比較してCHCはレイテンシ、スループット、一貫性保証の観点でどのように差をつけるか？

主な発見

CHCは1NFあたり9.42Gbpsのスループットを達成し、スタンドアロンNFの最大スループットと同等であり、パフォーマンス劣化が最小限であることが示された。
状態管理に起因する1NFあたりのパケット処理レイテンシの中央値増加は0.6μs未満であり、ワークロード全体で0.02–0.54μsの範囲に収まった。
フェイルオーバー時、CHCは[28]と比較してパケット処理レイテンシを6倍改善し、[16]と比較して強一貫性の共有状態更新を99%高速に実行した。
CHCは重複パケットおよび状態更新を効果的に抑制し、50%の負荷下で重複更新数を545から0に削減し、誤検出・誤検出を完全に排除した。
障害回復は効率的である：ルート障害回復は<41.2μs、データストア障害回復は10台のNATインスタンスを含む状況でも≤388.2msであり、150msのチェックポイント間隔を維持した。
CHCはオフパス検出器シナリオで11のトロイの木の署名をすべて正しく検出できたが、OpenNFはチェーン全体の順序保証がないため、最大11の署名を漏れてしまった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。