Skip to main content
QUICK REVIEW

[論文レビュー] Visual Insights into Agentic Optimization of Pervasive Stream Processing Services

Boris Sedlak, Víctor Casamayor Pujol|arXiv (Cornell University)|Feb 19, 2026
Context-Aware Activity Recognition Systems被引用数 0
ひとこと要約

論文は、コンテキスト認識型の二部構成プラットフォームとエージェントである MUDAP と RASK を提示し、共存エッジのストリーム処理サービスの SLO を満たすための多次元で自動スケーリングを行う。エージェントが学習して時間とともに SLO の実現を改善する様子も可視化する。

ABSTRACT

Processing sensory data close to the data source, often involving Edge devices, promises low latency for pervasive applications, like smart cities. This commonly involves a multitude of processing services, executed with limited resources; this setup faces three problems: first, the application demand and the resource availability fluctuate, so the service execution must scale dynamically to sustain processing requirements (e.g., latency); second, each service permits different actions to adjust its operation, so they require individual scaling policies; third, without a higher-level mediator, services would cannibalize any resources of services co-located on the same device. This demo first presents a platform for context-aware autoscaling of stream processing services that allows developers to monitor and adjust the service execution across multiple service-specific parameters. We then connect a scaling agent to these interfaces that gradually builds an understanding of the processing environment by exploring each service's action space; the agent then optimizes the service execution according to this knowledge. Participants can revisit the demo contents as video summary and introductory poster, or build a custom agent by extending the artifact repository.

研究の動機と目的

  • 動的リソース制約下でエッジデバイス上の広範囲なストリーム処理の自動スケーリングを促進する。
  • 従来の CPU スケーリングを超えた、サービス固有の微細なパラメータ調整を可能にする。
  • 環境ダイナミクスを学習し多サービス構成を最適化するスケーリングエージェント的手法を提供する。
  • エージェントの内部モデルと SLO 実現への影響の可視化を実証する。)
  • method:[

提案手法

  • REST API によるサービス実行とリソースの細粒度調整のための MUDAP の導入。
  • RASK を提示し、時系列データから回帰ベースのモデルを構築してパラメータの SLO への影響を解釈する。
  • モデルと SLO 目標を数値ソルバーと組み合わせてグローバルなスケーリングアクションを推定する。
  • エッジデバイス上で複数の共存サービスの自律的・分散型スケーリングを可能にする。
  • エージェントが学習した世界モデルとその SLO 実現への影響を時間とともに可視化する。

実験結果

リサーチクエスチョン

  • RQ1多次元スケーリングプラットフォーム(MUDAP)はエッジデバイス上のストリーム処理サービスの細粒度制御をどのように可能にするか。
  • RQ2スケーリングエージェント(RASK)は時系列データから SLO 実現へのパラメータ影響を予測するモデルを学習できるか。
  • RQ3回帰ベースのモデルと数値ソルバーを統合することで、複数の共存サービスに対する効果的で分散型の自動スケーリングが得られるか。
  • RQ4エージェント主導のスケーリングは、ベースラインや非エージェントアプローチと比較して SLO 実現をどの程度改善できるか。

主な発見

  • デモンストレーションは、エージェント主導のスケーリングによって SLO 実現が 56% から 98% に300秒で向上することを示す。
  • 300秒の実行期間で、エージェントは最適配置のパレートフロントに沿った設定を選択して高い SLO 実現を維持する。
  • この手法は、環境モデルの精度を高めるために Q 学習などの典型的な RL 手法よりもサンプル効率が良い。
  • RASK はエッジデバイス上で動作し、複数の共存サービスの自律的かつ堅牢なスケーリングを可能にする。
  • アーティファクトリポジトリと視覚的デモは、研究者が新しいサービスやパラメータへスケーリングエージェントを拡張するのを可能にする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。