[논문 리뷰] Large Language Models as Delivery Rider: Generating Instant Food Delivery Riders' Routing Decision with LLM Agent Framework
본 논문은 LLM-DR을 소개합니다. 이는 경험에 기반한, CoT 기반 LLM 에이전트 프레임워크로, 데이터 기반 페르소나와 실세계 주문 데이터를 활용해 온디맨드 배송에서 이질적인 라이더의 라우팅 의사결정을 시뮬레이션합니다.
The utilization of Large Language Models (LLMs) to power human-like agents has shown remarkable potential in simulating individual mobility pattern. However, a significant gap remains in modeling cohorts of agents in dynamic and interactive systems where they must take strategic routing decisions to response mobility-specific task. To bridge this gap, we introduce LLM-DR, a novel agent framework designed to simulate the heterogeneous decision-making of riders in the on-demand instant delivery task scenario. Our framework is founded on two principles: 1) Empirically-grounded personas, where we use unsupervised clustering on a large-scale, real-world trajectory dataset to identify four distinct rider work strategies; and 2) Reasoning-based routing process, where each persona is instantiated as an LLM agent that employs a structured Chain-of-Thought (CoT) process to make human-like routing choices. This framework enables the construction of high-fidelity simulations to investigate how the strategic composition of a rider workforce influences system-level outcomes regarding their mobility pattern. We validate our framework on an real-world instant deliver order datasets, demonstrating its capacity to model complex rider behavior in an interactive market scenario. This work provides pioneering findings in agentic mobility system empowered by LLM.
연구 동기 및 목표
- 실세계 궤적 데이터에서 비지도 클러스터링을 통해 구별되는 라이더 작업 전략을 식별한다.
- 실제 주문을 LLM 기반 라이더 에이전트에 방송하는 고충실도 인터랙티브 시뮬레이션을 개발한다.
- 각 페르소나 기반 에이전트에서 체인 오브 생각(CoT) 추론을 가능하게 하여 인간에 가까운 라우팅 의사결정을 반영한다.
- 이질적인 라이더 인구에서 시스템 수준의 결과(효율성, 수익, 커버리지)를 분석한다.
제안 방법
- 실험 데이터로 라이더 에이전트를 클러스터링하여 네 가지 페르소나를 형성하는 데 기반을 둔다: Full-time Workhorse, Lunch-Peak Specialist, Super Stacker, Dinner-Peak Core.
- 실세계 주문 데이터로 구동되는 이산시계 시뮬레이션 환경을 만들고 10분 간 방송하며 2 km 이내를 커버한다.
- 각 페르소나를 구조화된 프롬프트를 사용하여 몇 샷 Chain-of-Thought 추론 과정을 강제하는 LLM 에이전트로 구현한다.
- 매 단계마다 에이전트 의사결정에 따라 상태를 업데이트하고 경로 API를 사용해 완료 시간과 이동 거리를 계산하며 수익 및 이동 횟수를 기록한다.

실험 결과
연구 질문
- RQ1실험적으로 유도된 라이더 페르소나가 온디맨드 배송에서의 라우팅 의사결정과 시스템 성능에 어떤 영향을 미치는가?
- RQ2CoT 추론을 갖춘 LLM 에이전트가 실세계 데이터에서 관찰되는 이질적이고 전략적인 라이더 행동을 재현할 수 있는가?
- RQ3동적 주문 시장에서 이질적 라이더 인력이 시스템 차원의 효율성, 수익 분배, 공간 커버리지에 미치는 영향은 무엇인가?
주요 결과
| 페르소나 | 주문 | 주행거리 (km) | 주문당 주행거리 (km) | 수익 (¥) |
|---|---|---|---|---|
| Full-time Workhorse | 24.00 | 110.15 | 3.86 | 118.75 |
| Lunch-Peak Specialist | 21.25 | 71.26 | 3.15 | 103.00 |
| Super Stacker | 19.75 | 86.64 | 3.69 | 101.75 |
| Dinner-Peak Core | 17.67 | 78.68 | 3.95 | 94.67 |
| Average | 20.67 | 75.60 | 3.66 | 104.54 |
- 클러스터링에서 도출된 네 가지 데이터 기반 라이더 페르소나: Full-time Workhorse, Lunch-Peak Specialist, Super Stacker, 및 Dinner-Peak Core.
- LLM 주도 에이전트가 페르소나 일관된 라우팅 및 의사결정 패턴(예: 누적 적재 행동, 시간 창 집중)을 보인다.
- 실제 베이징 주문 데이터로 수행한 시뮬레이션은 페르소나별로 다른 이동 패턴을 산출하며, 이들의 전략적 목표와 일치한다.
- 페르소나 간 평균 지표는 서로 다른 주문 수, 주행 거리, 수익 프로파일을 나타내며 효율성과 거리 간의 트레이드오프를 반영한다.
- 수익 및 주행 거리 분해는 고수익이 서로 다른 전략(일정한 작업 대 누적 적재)에서 기인함을 시사한다.
- 프레임워크는 LLM에 의해 구동되는 고충실도 다에이전트 모빌리티 생성을 시연한다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.