[논문 리뷰] AgenticGEO: A Self-Evolving Agentic System for Generative Engine Optimization
AgenticGEO는 GEO를 콘텐츠 조건부 제어 문제로 공식화하고 코이볼딩 MAP-Elites 전략 아카이브와 경량 비판자를 사용하여 블랙박스 생성 엔진에 적응하며 엔진 피드백을 줄이면서 최첨단 성능을 달성했다.
Generative search engines represent a transition from traditional ranking-based retrieval to Large Language Model (LLM)-based synthesis, transforming optimization goals from ranking prominence towards content inclusion. Generative Engine Optimization (GEO), specifically, aims to maximize visibility and attribution in black-box summarized outputs by strategically manipulating source content. However, existing methods rely on static heuristics, single-prompt optimization, or engine preference rule distillation that is prone to overfitting. They cannot flexibly adapt to diverse content or the changing behaviors of generative engines. Moreover, effectively optimizing these strategies requires an impractical amount of interaction feedback from the engines. To address these challenges, we propose AgenticGEO, a self-evolving agentic framework formulating optimization as a content-conditioned control problem, which enhances intrinsic content quality to robustly adapt to the unpredictable behaviors of black-box engines. Unlike fixed-strategy methods, AgenticGEO employs a MAP-Elites archive to evolve diverse, compositional strategies. To mitigate interaction costs, we introduce a Co-Evolving Critic, a lightweight surrogate that approximates engine feedback for content-specific strategy selection and refinement, efficiently guiding both evolutionary search and inference-time planning. Through extensive in-domain and cross-domain experiments on two representative engines, AgenticGEO achieves state-of-the-art performance and demonstrates robust transferability, outperforming 14 baselines across 3 datasets. Our code and model are available at: https://github.com/AIcling/agentic_geo.
연구 동기 및 목표
- 비정상적으로 변하는 블랙박스 GE 동작 속에서 GEO(생성 엔진 출력)의 가시성 및 기여도 향상을 목표로 한다.
- 다양한 콘텐츠에 유연하게 쓰기 전략을 적응시키는 자체 진화 프레임워크를 개발한다.
- 도메인에 걸친 강건한 최적화를 유지하면서 비용이 많이 드는 엔진 피드백 의존도를 줄인다.
제안 방법
- GEO를 콘텐츠 조건부 최적화 문제로 공식화한다.
- 다양한 콘텐츠를 위한 재작성 전략의 Quality-Diversity MAP-Elites 아카이브를 유지한다.
- 전략 선택 및 추론 계획을 이끄는 공동 진화 경량 비판자를 도입한다.
- 초기 아카이브의 감독 타깃으로 부트스트랩하기 위한 오프라인 비판자 정렬을 도입한다.
- 제한된 GE 피드백으로 아카이브와 비판자의 온라인 공동 진화를 수행한다.
- 비판자 안내 계획에 따른 추론 중 에이전트식 다중 턴 재작성.

실험 결과
연구 질문
- RQ1AgenticGEO가 엔진과 도메인 전반에서 최신 GEO 기준선과 비교하여 어떤 성능을 보이는가?
- RQ2본 접근법이 미지의 도메인으로의 일반화에서 성능을 유지할 수 있는가?
- RQ3각 공동 진화 구성요소(아카이브, 비판자, Evolver)가 성능에 미치는 영향은 무엇인가?
- RQ4최적화가 가시성과 귀속성을 높이면서 시맨틱한 의미를 보존하는가?
주요 결과
| 방법 | GEO-Bench 단어 | GEO-Bench 품사 | GEO-Bench 전체 | Llama-3.3-70B-Instruct 단어 | Llama-3.3-70B-Instruct 품사 | Llama-3.3-70B-Instruct 전체 |
|---|---|---|---|---|---|---|
| No optimization | 20.05 | 20.26 | 20.21 | 19.19 | 19.33 | 19.20 |
| Keyword Stuffing | 20.73 | 20.86 | 20.69 | 19.99 | 20.16 | 20.02 |
| Unique Words | 17.59 | 17.94 | 17.78 | 16.78 | 16.66 | 16.56 |
| Easy-To-Understand | 20.10 | 20.19 | 20.05 | 18.72 | 18.93 | 18.85 |
| Authoritative | 20.41 | 20.93 | 20.60 | 19.41 | 19.48 | 19.47 |
| Technical Words | 21.22 | 20.97 | 21.23 | 19.55 | 19.59 | 19.50 |
| Fluency Optimization | 20.66 | 20.85 | 20.70 |
- AgenticGEO는 두 가지 대표적인 생성 엔진에서 최첨단 성능을 달성했으며, 기준선 대비 평균 46.4%의 이익을 보였다.
- GE 피드백의 41.2% 만으로 성능의 98.1%를 유지하여 감독 필요가 감소함을 보여 준다.
- 도메인 내외 설정에서 3개 데이터세트에서 14개의 기준선보다 우수하다.
- 진화하는 비판자는 비용이 많이 드는 엔진 피드백을 효과적으로 대체하고 엔진 아키텍처 및 규모 전반에 걸쳐 일반화한다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.