QUICK REVIEW

[논문 리뷰] EECBS: A Bounded-Suboptimal Search for Multi-Agent Path Finding

Jiaoyang Li, Wheeler Ruml|arXiv (Cornell University)|2020. 10. 03.

Robotic Path Planning Algorithms참고 문헌 28인용 수 28

한 줄 요약

이 논문은 다중 에이전트 경로 찾기(MAPF)를 위한 유계-비최적 탐색 알고리즘인 EECBS를 제안한다. EECBS는 명시적 추정 탐색(EES)을 통해 온라인 학습을 활용해 비가역 휴리스틱을 생성함으로써 고수준 노드 선택을 빠르게 한다. EECBS는 네 가지 핵심 개선 사항을 통해 최신 기술인 ECBS, BCP-7, eMDD-SAT를 능가하며, 1분 이내에 최대 1,000명의 에이전트를 포함한 인스턴스를 해결하면서 최적해의 2% 이내의 해를 보장한다.

ABSTRACT

Multi-Agent Path Finding (MAPF), i.e., finding collision-free paths for multiple robots, is important for many applications where small runtimes are necessary, including the kind of automated warehouses operated by Amazon. CBS is a leading two-level search algorithm for solving MAPF optimally. ECBS is a bounded-suboptimal variant of CBS that uses focal search to speed up CBS by sacrificing optimality and instead guaranteeing that the costs of its solutions are within a given factor of optimal. In this paper, we study how to decrease its runtime even further using inadmissible heuristics. Motivated by Explicit Estimation Search (EES), we propose Explicit Estimation CBS (EECBS), a new bounded-suboptimal variant of CBS, that uses online learning to obtain inadmissible estimates of the cost of the solution of each high-level node and uses EES to choose which high-level node to expand next. We also investigate recent improvements of CBS and adapt them to EECBS. We find that EECBS with the improvements runs significantly faster than the state-of-the-art bounded-suboptimal MAPF algorithms ECBS, BCP-7, and eMDD-SAT on a variety of MAPF instances. We hope that the scalability of EECBS enables additional applications for bounded-suboptimal MAPF algorithms.

연구 동기 및 목표

수백 명의 에이전트를 포함한 대규모 환경에서 최적 MAPF 알고리즘의 확장성 한계를 해결하기 위해.
해의 품질 보장을 유지하면서 유계-비최적 MAPF의 런타임을 줄이기 위해.
ECBS에서 포커스 탐색을 명시적 추정 탐색(EES)으로 대체하고 온라인 학습을 활용해 비가역 휴리스틱을 사용함으로써 ECBS를 개선하기 위해.
최근 CBS 개선 사항—충돌 회피, 충돌 우선순위 지정, 대칭성 추론, WDG 휴리스틱—을 새로운 EECBS 프레임워크에 적응시키기 위해.
다양한 MAPF 벤치마크에서 ECBS, BCP-7, eMDD-SAT에 비해 EECBS의 우수성을 실험적으로 검증하기 위해.

제안 방법

EECBS는 고수준 탐색에서 ECBS의 포커스 탐색을 명시적 추정 탐색(EES)으로 대체하여 학습된 비가역 비용 추정치에 기반해 노드 우선순위를 정한다.
온라인 학습을 사용해 각 고수준 노드 아래의 해 비용을 동적으로 추정함으로써, 가역성 조건이 필요 없이도 더 빠른 수렴을 가능하게 한다.
알고리즘은 네 가지 CBS 개선 사항을 통합한다: 충돌 회피, 충돌 우선순위 지정, 대칭성 추론, 그리고 정렬 및 탐색 효율성을 향상시키기 위한 WDG 휴리스틱.
고수준 노드 전개는 학습된 비가역 휴리스틱을 사용한 EES에 의해 이끌리며, 저수준 경로 탐색은 충돌을 해결하기 위해 제약 조건이 적용된 A* 알고리즘을 사용한다.
해의 비용은 사용자가 지정한 최적해의 요소 범위 내에서 유계되며, 이는 비최적성 보장을 보장한다.
프레임워크는 다양한 에이전트 수와 비최적성 요소를 가진 여섯 가지 표준 MAPF 벤치마크 지도에서 평가된다.

실험 결과

연구 질문

RQ1ECBS의 포커스 탐색을 EES로 대체함으로써 런타임을 크게 줄일 수 있을까? 동시에 유계-비최적성은 유지될까?
RQ2온라인 학습은 MAPF의 고수준 노드 선택을 위한 유용한 비가역 휴리스틱을 생성하는 데 얼마나 효과적인가?
RQ3표준 CBS 개선 사항(예: 충돌 회피, 대칭성 추론)이 EECBS 프레임워크로 효과적으로 이식될 수 있을까?
RQ4최신 기술인 ECBS, BCP-7, eMDD-SAT와 비교했을 때 EECBS의 성능과 확장성은 어떠한가?
RQ5EECBS는 엄격한 시간 제한 내에서 대규모 MAPF 인스턴스(예: 1,000명의 에이전트)를 처리하면서도 근최적 해 품질을 유지할 수 있을까?

주요 결과

모든 네 가지 개선 사항을 적용한 EECBS+(EECBS+)는 여섯 개의 모든 벤치마크 지도에서 ECBS, BCP-7, eMDD-SAT를 뛰어넘는 성능을 보이며, 런타임과 성공률 측면에서 모두 뛰어난 결과를 얻었다.
평균적으로 EECBS+는 ECBS보다 두 배 이상 많은 에이전트 수의 인스턴스를 1분 이내에 해결했으며, 특히 den520d와 warehouse-10-2-10-2-1과 같은 큰 지도에서 두드러진 성능을 보였다.
ECBS와 EECBS+가 모두 해결한 1,081개의 인스턴스에서 평균 해 비용은 EECBS+가 1,958, ECBS가 1,967이었으며, 이는 해 품질에 대한 악화가 없음을 시사한다.
작은 지도에서 비최적성 요소가 낮은 경우 BCP-7과 eMDD-SAT가 ECBS를 능가했지만, EECBS+는 모든 지도 크기와 에이전트 수에서 세 알고리즘을 모두 앞섰다.
EES와 온라인 학습의 조합은 ECBS보다 더 빠른 수렴을 가능하게 했으며, 특히 휴리스틱이 음의 상관관계를 보일 경우 두드러진 성능 향상을 보였다.
EECBS+는 den312d와 180명의 에이전트를 가진 랜덤 지도에서 거의 모든 인스턴스를 해결했지만, ECBS는 같은 시간 제한 내에서 몇 개 또는 전혀 해결하지 못했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.