QUICK REVIEW

[논문 리뷰] AdaEvolve: Adaptive LLM Driven Zeroth-Order Optimization

Mert Cemri, Shubham Agrawal|arXiv (Cornell University)|2026. 02. 23.

Natural Language Processing Techniques인용 수 0

한 줄 요약

AdaEvolve는 LLM 유도 진화를 계층적 적응 최적화기로 재구성하여 누적 개선 신호를 사용해 탐색, 섬 간 자원 배분, 메타 가이드 전략을 조정하고, 185개의 열린 문제에서 오픈 소스 벤치마크를 능가합니다.

ABSTRACT

The paradigm of automated program generation is shifting from one-shot generation to inference-time search, where Large Language Models (LLMs) function as semantic mutation operators within evolutionary loops. While effective, these systems are currently governed by static schedules that fail to account for the non-stationary dynamics of the search process. This rigidity results in substantial computational waste, as resources are indiscriminately allocated to stagnating populations while promising frontiers remain under-exploited. We introduce AdaEvolve, a framework that reformulates LLM-driven evolution as a hierarchical adaptive optimization problem. AdaEvolve uses an "accumulated improvement signal" to unify decisions across three levels: Local Adaptation, which dynamically modulates the exploration intensity within a population of solution candidates; Global Adaptation, which routes the global resource budget via bandit-based scheduling across different solution candidate populations; and Meta-Guidance which generates novel solution tactics based on the previously generated solutions and their corresponding improvements when the progress stalls. We demonstrate that AdaEvolve consistently outperforms the open-sourced baselines across 185 different open-ended optimization problems including combinatorial, systems optimization and algorithm design problems.

연구 동기 및 목표

정적이고 단일 실행의 LLM-가이드 생성에서 진화 프레임워크의 추론 시점 적응 탐색으로의 전환을 동기화한다.
하나의 통합 개선 신호를 사용하여 탐색, 자원 예산 편성, 메타 전략 생성을 조정하는 적응형 다층 제어 프레임워크를 개발한다.
AdaEvolve의 견고성 및 일반화를 다양한 최적화 및 알고리즘 설계 벤치마크에 걸쳐 입증한다.
누적 개선 신호가 섬 내 탐색, 섬 간 자원 배분 및 정체를 벗어나기 위한 메타 가이던스를 어떻게 안내하는지 보여준다.

제안 방법

AdaEvolve를 LLM에 의해 돌연변이된 실행 가능한 프로그램들의 병렬 하위집단으로 구성된 섬(population of islands)에 대한 계층적 동적 최적화로 정의한다.
각 섬에 대해 누적 개선 신호 G_t^(k)를 사용해 탐색 대 exploitation의 균형을 맞추는 로컬 탐색 강도 I_t^(k)를 도출한다.
전역 자원 할당을 감쇠 규모의 밴딧(UCB)으로 모델링하여 전역적으로 정규화된 개선을 바탕으로 섬을 선택해 지역 최적 편향을 피한다.
전역 정체가 발생한 경우 별도의 LLM을 호출해 고수준 해결 전술을 생성하고 이를 돌연변이 프롬프트에 주입하는 Level 3 메타가이던스를 도입한다.
모든 섬이 정체될 때 대안 솔루션을 탐색하기 위해 시드 프로그램을 가진 새로운 섬을 생성한다.
레벨 1이 매 이터레이션마다 강도를 조정하고, 레벨 2가 섬 간 자원 배분을 수행하며, 레벨 3가 메타 가이던스를 작동시키는 알고리즘 요약을 제공한다.

Figure 1 : AdaEvolve overview. Left: Standard LLM-guided search relies on fixed optimization policies, with static schedules, uniform resource allocation, and rigid prompts. Center: AdaEvolve introduces hierarchical adaptivity by dynamically modulating exploration intensity, reallocating compute acr

실험 결과

연구 질문

RQ1누적 개선 신호가 섬 내 탐색, 섬 간 자원 배분, 및 LLM 주도 프로그램 최적화의 메타 가이던스의 조정에 효과적으로 작용할 수 있는가?
RQ2계층적 적응 제어가 OpenEvolve, GEPA, ShinkaEvolve와 같은 고정 스케줄 벤치마크에 비해 성능을 향상시키고 매뉴얼 조정을 줄이는가?
RQ3AdaEvolve의 적응성 메커니즘이 조합 기하학, 시스템 최적화, 알고리즘 설계와 같은 다양한 문제군에 일반화되는가?
RQ4시스템 2 수준의 메타 가이던스를 통해 수치적 적응 및 밴딧 기반 할당이 실패할 때 정체를 탈출하는 데 도움이 되는가?

주요 결과

AdaEvolve가 185개의 최적화/알고리즘 설계 문제에서 일관되게 오픈 소스 벤치마크를 능가한다.
Circle Packing 및 Heilbronn 문제에서 최고 성과를 달성하며, 때로는 인간 혹은 AlphaEvolve 해법에 근접하거나 이를 능가한다.
ADR S 벤치마크에서 인간에 대등한 성능을 달성하고, 다양한 백본(GPT-5, Gemini-3-Pro)에서도 강한 일반화를 보인다.
소거 실험은 세 가지 적응 단계 모두 기여함을 보여주고, 메타 가이던스가 일부 작업에서 가장 큰 이득을 제공한다.
Frontier-CS(172개 문제) 전반에서 AdaEvolve가 다른 방법들에 비해 평균 성능을 뚜렷한 차이로 향상시켜, 개방형 문제에 대한 유효성을 입증한다.

Figure 2 : Comparison of the evolutionary algorithms on Circle Packing (Square $n=26$ ) and Heilbronn Triangles ( $n=11$ ) problems using GPT-5 backbone for all of them. $n$ is a parameter of the optimization problems we explain in Table 7 .

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.