Skip to main content
QUICK REVIEW

[논문 리뷰] A General Framework for Learning-Augmented Online Allocation

Ilan Reuven Cohen, Debmalya Panigrahi|arXiv (Cornell University)|2023. 01. 01.
Optimization and Search Problems인용 수 1
한 줄 요약

이 논문은 단일 에이전트당 하나의 학습된 파라미터를 사용하여, 제작기간, 산타 클로스, 내쉬 복지, ℓp-최소화와 같은 다양한 최소화 및 최대화 목표 함수에 대해 거의 최적의 경쟁 비율을 달성하는 온라인 분할 할당에 대한 통합된 학습 보조 프레임워크를 제안한다. 이 방법은 목표 함수의 동차성과 단조성에 기반한 새로운 EP-할당 규칙을 활용하여, 파라미터 오차에 대한 내성과 샘플된 인스턴스로부터의 학습 가능성을 보장한다.

ABSTRACT

Online allocation is a broad class of problems where items arriving online have to be allocated to agents who have a fixed utility/cost for each assigned item so to maximize/minimize some objective. This framework captures a broad range of fundamental problems such as the Santa Claus problem (maximizing minimum utility), Nash welfare maximization (maximizing geometric mean of utilities), makespan minimization (minimizing maximum cost), minimization of 𝓁_p-norms, and so on. We focus on divisible items (i.e., fractional allocations) in this paper. Even for divisible items, these problems are characterized by strong super-constant lower bounds in the classical worst-case online model. In this paper, we study online allocations in the learning-augmented setting, i.e., where the algorithm has access to some additional (machine-learned) information about the problem instance. We introduce a general algorithmic framework for learning-augmented online allocation that produces nearly optimal solutions for this broad range of maximization and minimization objectives using only a single learned parameter for every agent. As corollaries of our general framework, we improve prior results of Lattanzi et al. (SODA 2020) and Li and Xian (ICML 2021) for learning-augmented makespan minimization, and obtain the first learning-augmented nearly-optimal algorithms for the other objectives such as Santa Claus, Nash welfare, 𝓁_p-minimization, etc. We also give tight bounds on the resilience of our algorithms to errors in the learned parameters, and study the learnability of these parameters.

연구 동기 및 목표

  • 고전적 온라인 할당에서 강한 초수상수 경쟁 하한을 극복하기 위해 기계 학습 예측을 통합하고자 한다.
  • 다양한 최소화 및 최대화 목표 함수에 걸쳐 거의 최적의 알고리즘 설계를 통합하고자 한다.
  • 학습된 파라미터의 오차에 대한 알고리즘의 내성과 이러한 파라미터의 분포에서의 학습 가능성에 대해 연구하고자 한다.
  • 기존의 로드 밸런싱 결과를 더 넓은 목적 함수 클래스로 일반화하고자 한다. 이는 산타 클로스 및 내쉬 복지와 같은 목표 함수를 포함한다.
  • 최대화 및 최소화 문제 모두에 적용 가능한 일관된 프레임워크를 제공하고자 하며, 이는 단조성과 동차성을 만족하는 잘 정의된 목적 함수에 대해 적용 가능하다.

제안 방법

  • 목적 함수의 동차성에서 유도된 거듭제곱 α에 의해 스케일링되는, 항목 값과 학습된 파라미터의 가중 곱에 기반한 일반적인 EP-할당 규칙을 제안한다.
  • 문제를 단위 목적 함수 값 기준으로 변환하기 위해, 항목 값들을 각 에이전트당 최적 목적 함수 값 ℓf_i로 정규화하는 단계를 사용한다.
  • 샘플된 인스턴스들에 대한 경험 평균에서 유도된 파라미터 벡터 w*를 사용하여 최적의 이중 변수를 근사함으로써, 높은 확률로 성능을 보장한다.
  • 노이즈에 대한 내성 분석을 통해, 파라미터 오차는 목적 함수 값을 최대 η 배 이내로 확대함을 보여주며, 변동에 대해 성능 유지 가능성을 입증한다.
  • 초가역성/하위가역성 가정을 활용하여, 샘플된 인스턴스들을 사용해 기댓값에서 (1±O(ǫ))-근사해를 얻을 수 있는 파라미터를 학습할 수 있음을 증명한다.
  • 동차성과 단조성을 통해 문제를 볼록 유사한 구조로 축소함으로써, 다양한 목표 함수에 대해 기존에 다소 다를 수 있었던 알고리즘 기법들을 통합적으로 다룰 수 있도록 한다.

실험 결과

연구 질문

  • RQ1에이전트당 하나의 학습된 파라미터로 다양한 온라인 할당 목표 함수에서 거의 최적의 해를 달성할 수 있는가?
  • RQ2학습된 파라미터의 오차에 대해 제안된 알고리즘이 얼마나 내성적인가?
  • RQ3문제 인스턴스의 분포로부터 최적의 학습된 파라미터를 효율적으로 학습할 수 있는가?
  • RQ4이 프레임워크는 이전에 서로 다른 알고리즘 접근법을 사용했던 최대화 및 최소화 목표 함수를 통합할 수 있는가?
  • RQ5이 프레임워크가 작동하기 위해 필요한 목적 함수의 구조적 성질(예: 단조성, 동차성)은 무엇이며, 그것이 충분한가?

주요 결과

  • 최소화 목표 함수의 경우 1+ǫ, 최대화 목표 함수의 경우 1−ǫ의 경쟁 비율을 달성하며, 에이전트당 하나의 학습된 파라미터만 사용한다.
  • 알고리즘은 파라미터 오차에 대해 내성적이다: 학습된 가중치가 η-근사일 경우, 목적 함수 값은 최대 η 배 이내로 악화된다.
  • 잘 정의된 목적 함수의 경우, 고려된 샘플 인스턴스들에 대해 기댓값에서 최대화 문제에서는 적어도 (1−Ω(ǫ))·T 이상, 최소화 문제에서는 최대 (1+O(ǫ))·T 이내의 해를 확률적으로 달성한다.
  • 이 방법은 로드 밸런싱에 대한 이전 결과를 산타 클로스 및 내쉬 복지와 같은 새로운 목표 함수로 일반화하며, 이러한 문제들에 대해 처음으로 학습 보조 기반 거의 최적 알고리즘을 제공한다.
  • 이 프레임워크는 모든 최소화 및 최대화 문제에 대해 단조성과 동차성을 만족하는 목적 함수에 적용 가능하며, 이는 ℓp-노름, 제작기간, 내쉬 복지와 같은 표준 온라인 할당 목적 함수를 포함한다.
  • 작은 항목과 분포에 대한 약한 가정 하에, O(m/ǫ · log m)개의 독립적인 샘플 인스턴스로부터 학습된 파라미터를 효율적으로 추정할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.