Skip to main content
QUICK REVIEW

[論文レビュー] Emergence-as-Code for Self-Governing Reliable Systems

Anatoly A. Krasnovsky|arXiv (Cornell University)|Feb 5, 2026
Software System Performance and Reliability被引用数 0
ひとこと要約

tldr: エンドツーエンドの旅の信頼性を、旅の意図と実行時の証拠を結合して計算可能にし、境界付きのSLOとガバナンス成果物を生み出し、GitOps風ループで自動的に整合されるようにするビジョン。

ABSTRACT

SLO-as-code has made per-service} reliability declarative, but user experience is defined by journeys whose reliability is an emergent property of microservice topology, routing, redundancy, timeouts/fallbacks, shared failure domains, and tail amplification. As a result, journey objectives (e.g., "checkout p99 < 400 ms") are often maintained outside code and drift as the system evolves, forcing teams to either miss user expectations or over-provision and gate releases with ad-hoc heuristics. We propose Emergence-as-Code (EmaC), a vision for making journey reliability computable and governable via intent plus evidence. An EmaC spec declares journey intent (objective, control-flow operators, allowed actions) and binds it to atomic SLOs and telemetry. A runtime inference component consumes operational artifacts (e.g., tracing and traffic configuration) to synthesize a candidate journey model with provenance and confidence. From the last accepted model, the EmaC compiler/controller derives bounded journey SLOs and budgets under explicit correlation assumptions (optimistic independence vs. pessimistic shared fate), and emits control-plane artifacts (burn-rate alerts, rollout gates, action guards) that are reviewable in a Git workflow. An anonymized artifact repository provides a runnable example specification and generated outputs.

研究の動機と目的

  • マイクロサービスアーキテクチャにおける個別サービスSLOとエンドツーエンド旅の信頼性のドリフトに対処する。
  • 旅の意図を表現し、それを原子SLOとテレメトリに結びつける宣言型の EmaC 仕様を提案する。
  • 推論主導のパイプラインを導入し、明示的な相関仮定の下で旅モデルと境界付きSLOを導出する。
  • Derive a governance contract that translates derived SLOs and budgets into actionable control-plane artifacts (alerts, gates, rollouts) within a MAPE-K loop.
  • Git中心のワークフローを通じて、監査可能・バージョン管理・保守的な自動化を実現する。

提案手法

  • 旅レベルのレジリエンスのためのSLO-as-codeの意図+証拠拡張を定義する。
  • 旅グラフに沿って可用性と待ち時間を組み合わせる小さな演算子代数を導入する。
  • 出力: 由来・信頼性・起源を含むトポロジー認識旅モデルを合成するランタイム推論コンポーネントを記述する。
  • 明示的な相関仮定の下で、最後に受理されたモデルから境界付き旅SLO、予算、制御平面成果物を導く。
  • 出力成果物には burn-rate アラート、段階的配信ゲート、アクションガードが含まれ、すべて Git の差分として公開可能。

実験結果

リサーチクエスチョン

  • RQ1弱い信号とトポロジー証拠・インシデントを組み合わせて故障ドメインの推論(運命の共有)をどのように実行できるか。
  • RQ2リトライ、タイムアウト、ヘッジを跨いだ尾部遅延を分析性を保つようにどう組み合わせるべきか。
  • RQ3推定デルタが自動的に成果物を更新するか、レビューベースの検討を要するかを決定する信頼度/ゲーティングルールは何か。
  • RQ4反事実分析は、ゲートに有用な境界内で旅の分布と予算に影響を与える変更を予測できるか。
  • RQ5不確実性の提示とガバナンスワークフローは、維持可能な旅SLOの所有をどのようにサポートするべきか。

主な発見

  • EmaC は明示的な意図とトポロジーおよびテレメトリの証拠から旅レベルのSLOと予算を計算可能にする。
  • SLOは独立性と共有 fate の仮定を明示した区間として提示され、保守的な境界を生み出す。
  • ガバナンス契約は導出された旅SLOを実用的なコントロールプレーン成果物(アラート、ゲート、ロールアウト制約)に翻訳する。
  • 意図と最後に受理されたモデルの生成マニフェストを、レビューダiffとして公開可能な GitOps 風ストレージでサポートする。
  • 匿名化された成果物リポジトリは、実行可能な旅の仕様と生成された出力(Prometheus/Argo Rollouts)を示す。
  • このフレームワークは、監査可能な自動化を支えるドリフト認識と出自追跬を強調する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。