Skip to main content
QUICK REVIEW

[논문 리뷰] A reliability- and latency-driven task allocation framework for workflow applications in the edge-hub-cloud continuum

Andreas Kouloumpris, Georgios L. Stavrinides|arXiv (Cornell University)|2026. 02. 20.
Cloud Computing and Resource Management인용 수 0
한 줄 요약

이 논문은 지연 및 신뢰성을 공동으로 최적화하기 위해 엣지, 허브, 클라우드 간 워크플로우 작업을 배치하는 정확한 다목적 이진 정수 선형 프로그래밍 프레임워크를 제시하며, 시간 중복성과 포괄적 제약 조건을 포함한다.

ABSTRACT

A growing number of critical workflow applications leverage a streamlined edge-hub-cloud architecture, which diverges from the conventional edge computing paradigm. An edge device, in collaboration with a hub device and a cloud server, often suffices for their reliable and efficient execution. However, task allocation in this streamlined architecture is challenging due to device limitations and diverse operating conditions. Given the inherent criticality of such workflow applications, where reliability and latency are vital yet conflicting objectives, an exact task allocation approach is typically required to ensure optimal solutions. As no existing method holistically addresses these issues, we propose an exact multi-objective task allocation framework to jointly optimize the overall reliability and latency of a workflow application in the specific edge-hub-cloud architecture. We present a comprehensive binary integer linear programming formulation that considers the relative importance of each objective. It incorporates time redundancy techniques, while accounting for crucial constraints often overlooked in related studies. We evaluate our approach using a relevant real-world workflow application, as well as synthetic workflows varying in structure, size, and criticality. In the real-world application, our method achieved average improvements of 84.19% in reliability and 49.81% in latency over baseline strategies, across relevant objective trade-offs. Overall, the experimental results demonstrate the effectiveness and scalability of our approach across diverse workflow applications for the considered system architecture, highlighting its practicality with runtimes averaging between 0.03 and 50.94 seconds across all examined workflows.

연구 동기 및 목표

  • 엣지-허브-클라우드 워크플로우 응용에서 신뢰성과 적시 실행의 필요성을 제시한다.
  • 신뢰성과 지연 사이의 균형을 유지하면서 태스크를 엣지, 허브, 클라우드 디바이스에 매핑하기 위한 정확한 최적화 프레임워크를 제안한다.
  • 시간 중복성(이중/삼중 실행)과 현실적인 제약 조건(메모리, 저장소, 에너지, 대역폭, 연결성)을 포함한다.
  • 엣지-허브-클라우드 아키텍처 내의 실제 워크플로우와 합성 워크플로우에서 효과성과 확장성을 입증한다.

제안 방법

  • 문제를 다목적 이진 정수 선형 계획(BILP)으로 형식화한다.
  • 원래의 태스크 그래프(TG)에서 중간 엣지-허브-클라우드 그래프(EG)로, 이어 최종 신뢰성 인식 그래프(REG)로의 두 단계 태스크 그래프 변환을 사용한다.
  • 연산에 대해 Eik = Lik Pik, 데이터 전송에 대해 CEik→jl을 사용하여 연산 및 통신 비용을 포착한다.
  • 애플리케이션 중요도와 임계값 VT_DE 및 VT_TE에 의해 구동되는 취약성 기반 실행 모드(SE/DE/TE)를 사용하여 신뢰성을 모델링한다.
  • REG 변환 내에서 시간 중복성(이중/삼중 실행)과 다수결/검증을 포함한다.
  • 설계 시 오프라인에서 해결하여 신뢰성과 지연 간의 파레토 최적 거래를 얻는다.
Figure 1: Examples of transforming an application’s initial TG $G$ into its corresponding intermediate EG $\dot{G}$ and final REG $\ddot{G}$ .
Figure 1: Examples of transforming an application’s initial TG $G$ into its corresponding intermediate EG $\dot{G}$ and final REG $\ddot{G}$ .

실험 결과

연구 질문

  • RQ1엣지-허브-클라우드 아키텍처에서 태스크 할당을 어떻게 공동으로 신뢰성과 지연을 최적화하도록 공식화할 수 있는가?
  • RQ2장치 및 네트워크 제약 하에서 시간 중복 기법(SE/DE/TE)이 전체 애플리케이션 신뢰성과 지연에 미치는 영향은 무엇인가?
  • RQ3정확한 BILP 기반 접근법이 엣지-허브-클라우드 연속체 내의 실제 UAV 기반 및 합성 워크플로우에 확장될 수 있는가?
  • RQ4응용 중요도 수준이 엣지, 허브, 클라우드 간의 할당 및 중복 전략에 어떤 영향을 미치는가?

주요 결과

  • 본 접근법은 실제 UAV 기반 점검 워크플로우에서 베이스라인 전략에 비해 평균적으로 신뢰성 84.19%, 지연 49.81% 향상을 달성한다.
  • 실험에 포함된 모든 워크플로우에서 런타임은 0.03초에서 50.94초 사이로 평균적으로 나타나며, 실용적인 오프라인 적용 가능성을 시사한다.
  • 프레임워크는 엣지-허브-클라우드 설정에서 메모리, 저장소, 연산/통신 지연, 에너지 및 신뢰성 제약을 동시에 반영한다.
  • 시간 중복성은 취약성 및 중요도에 따라 태스크별 실행 모드(SE/DE/TE)를 명시적으로 선택하는 구조화된 두 단계 그래프 변환을 통해 통합된다.
  • 실험적 평가에는 구조, 규모 및 중요도 수준에 걸쳐 확장성을 입증하기 위해 실제 워크플로와 다양한 합성 워크플로가 포함된다.
Figure 3: Normalized overall reliability and latency, and percentage of allocated tasks (primary and replicas) per device, with respect to $w_{\mathrm{rel}}$ and $w_{\mathrm{lat}}$ , for the real-world workflow.
Figure 3: Normalized overall reliability and latency, and percentage of allocated tasks (primary and replicas) per device, with respect to $w_{\mathrm{rel}}$ and $w_{\mathrm{lat}}$ , for the real-world workflow.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.