[논문 리뷰] Reasoner-Executor-Synthesizer: Scalable Agentic Architecture with Static O(1) Context Window
RES를 도입하는 세 계층의 에이전트 아키텍처로, 의도 파싱, 결정적 데이터 검색, 그리고 서사 생성을 분리하고, O(1) 토큰 복잡도를 달성하며 원시 기록을 LLM에 노출하지 않아 데이터 환각을 제거한다.
Large Language Models (LLMs) deployed as autonomous agents commonly use Retrieval-Augmented Generation (RAG), feeding retrieved documents into the context window, which creates two problems: the risk of hallucination grows with context length, and token cost scales linearly with dataset size. We propose the Reasoner-Executor-Synthesizer (RES) architecture, a three-layer design that strictly separates intent parsing (Reasoner), deterministic data retrieval and aggregation (Executor), and narrative generation (Synthesizer). The Executor uses zero LLM tokens and passes only fixed-size statistical summaries to the Synthesizer. We formally prove that RES achieves O(1) token complexity with respect to dataset size, and validate this on ScholarSearch, a scholarly research assistant backed by the Crossref API (130M+ articles). Across 100 benchmark runs, RES achieves a mean token cost of 1,574 tokens regardless of whether the dataset contains 42,000 or 16.3 million articles. The architecture eliminates data hallucination by construction: the LLM never sees raw records. KEYWORDS LLM agents; agentic architecture; hallucination elimination; token optimization; context window; retrieval-augmented generation; deterministic execution; scholarly metadata; Crossref API; O(1) complexity.
연구 동기 및 목표
- 대형 컨텍스트 윈도우에 의존하는 LLM 구동 자율 에이전트에서 데이터 환각과 토큰 비용을 줄이려는 동기를 제시한다.
- 데이터 중심 작업의 관심사를 분리하기 위해 세 계층 아키텍처(Reasoner, Executor, Synthesizer)를 제안한다.
- 데이터셋 크기에 대해 상수 토큰 복잡도를 달성하면서도 정확한 학술 검색 및 종합을 보존한다.
제안 방법
- 엄격한 관심사 분리를 가진 세 계층 RES 아키텍처를 제안한다: Reasoner(의도 파싱), Executor(결정적 검색 및 집계), Synthesizer(서사 생성).
- Executor는 LLM 토큰을 전혀 사용하지 않고 고정 크기의 통계 요약을 Synthesizer에 전달한다.
- 데이터셋 크기에 대해 RES가 O(1) 토큰 복잡도를 달성함을 형식적으로 증명한다.
- Crossref API를 이용한 ScholarSearch에서 130M+ articles로 검증한다.
- 데이터세트 크기에 독립적인 안정적인 토큰 비용을 보고하며 100회의 벤치마크 실행에 걸쳐 경험적으로 평가한다(42,000에서 16.3 million articles까지).
- LLM이 원시 기록을 전혀 보지 않으므로 구성상 데이터 환각이 제거됨을 입증한다.
실험 결과
연구 질문
- RQ1데이터셋 크기에 대해 토큰 사용량을 O(1)로 묶는 세 계층 아키텍처(Reasoner, Executor, Synthesizer)가 가능할까?
- RQ2Executor를 통한 결정론적 데이터 검색이 RAG 기반 에이전트의 LLM 환각을 감소시키거나 제거하는가?
- RQ3RES를 사용할 때 매우 큰 말뭉치에서의 학술 검색 작업의 실질적 토큰 비용은 어느 정도인가?
주요 결과
- RES는 100회 실행에서 데이터세트 크기와 무관하게 평균 토큰 비용 1,574 토큰을 달성한다(42k 대 16.3M 기사).
- Executor는 Synthesizer에 고정 크기의 통계 요약을 전달하여 LLM이 원시 기록에 노출되지 않도록 하며(환각 위험 감소).
- Crossref API를 이용한 ScholarSearch에서 대형 학술 코퍼스에 대한 확장성을 보여준다.
- 형식적 분석에 따라 이 아키텍처는 데이터셋 크기에 대해 O(1) 토큰 복잡도를 제공한다.
- 맥락 창 확장에 비해 토큰 비용을 크게 줄이면서도 성능을 유지한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.