Skip to main content
QUICK REVIEW

[論文レビュー] Large Language Models as Delivery Rider: Generating Instant Food Delivery Riders' Routing Decision with LLM Agent Framework

Chengbo Zhang, Zuopeng Xiao|arXiv (Cornell University)|Mar 13, 2026
Transportation and Mobility Innovations被引用数 0
ひとこと要約

論文は、データ駆動のペルソナと実データを用いたCoTベースのLLMエージェントフレームワークであるLMM-DRを紹介し、オンデマンド配達における異種ライダーのルーティング決定を模擬する。

ABSTRACT

The utilization of Large Language Models (LLMs) to power human-like agents has shown remarkable potential in simulating individual mobility pattern. However, a significant gap remains in modeling cohorts of agents in dynamic and interactive systems where they must take strategic routing decisions to response mobility-specific task. To bridge this gap, we introduce LLM-DR, a novel agent framework designed to simulate the heterogeneous decision-making of riders in the on-demand instant delivery task scenario. Our framework is founded on two principles: 1) Empirically-grounded personas, where we use unsupervised clustering on a large-scale, real-world trajectory dataset to identify four distinct rider work strategies; and 2) Reasoning-based routing process, where each persona is instantiated as an LLM agent that employs a structured Chain-of-Thought (CoT) process to make human-like routing choices. This framework enables the construction of high-fidelity simulations to investigate how the strategic composition of a rider workforce influences system-level outcomes regarding their mobility pattern. We validate our framework on an real-world instant deliver order datasets, demonstrating its capacity to model complex rider behavior in an interactive market scenario. This work provides pioneering findings in agentic mobility system empowered by LLM.

研究の動機と目的

  • 実世界の軌跡データから無監視クラスタリングを用いて異なるライダーワーク戦略を識別する。
  • 現実の注文データを放送する高忠実度の対話型シミュレーションをLLMベースのライダーエージェントに対して開発する。
  • 各ペルソナ主導のエージェントにChain-of-Thought推論を組み込み、人間のようなルーティング決定を再現する。
  • 異種ライダー集団下でのシステムレベルのアウトカム(効率、収益、カバー率)を分析する。

提案手法

  • 経験データに基づいてライダーエージェントをクラスタリングし、4つのペルソナを形成する:Full-time Workhorse、Lunch-Peak Specialist、Super Stacker、Dinner-Peak Coreを構築する。
  • 実世界の注文データにより駆動される離散時間シミュレーション環境を作成し、2km以内で10分ごとに放送する。
  • 各ペルソナを、Few-shotのChain-of-Thought推論プロセスを課す構造化プロンプトを用いてLLMエージェントとして具現化する。
  • 各ステップでエージェントの意思決定に基づいて状態を更新し、ルーティングAPIを使用して完了時間と移動距離を算出する;収益と配達回数を記録する。
Figure 1: Workflow of LLM-DR
Figure 1: Workflow of LLM-DR

実験結果

リサーチクエスチョン

  • RQ1データ駆動のライダー・ペルソナは、オンデマンド配達におけるルーティング決定とシステム性能にどのような影響を与えるか?
  • RQ2CoT推論を備えたLLMエージェントは、実世界データに観察される異質で戦略的なライダーベースの挙動を再現できるか?
  • RQ3動的なオーダーマーケットにおける異種ライダー労働力のシステムレベル影響(効率、収益分配、空間カバー)はどうなるか?

主な発見

PersonaOrdersMileage (km)Mileage per Order (km)Earnings (¥)
Full-time Workhorse24.00110.153.86118.75
Lunch-Peak Specialist21.2571.263.15103.00
Super Stacker19.7586.643.69101.75
Dinner-Peak Core17.6778.683.9594.67
Average20.6775.603.66104.54
  • クラスタリングからデータ駆動の4つのライダー・ペルソナが出現する:Full-time Workhorse、Lunch-Peak Specialist、Super Stacker、Dinner-Peak Core。
  • LLM駆動のエージェントはペルソナ一貫のルーティングと意思決定パターンを示す(例:積み重ね行動、時間窓重視)。
  • 北京市の実データを用いたシミュレーションは、ペルソナごとに異なる移動パターンを生み出し、彼らの戦略的目標と一致する。
  • ペルソナ間の平均指標は、受注数、走行距離、収益プロファイルに差があり、効率と距離のトレードオフを反映している。
  • 収益と走行距離の分解は、高収益は異なる戦略(安定した労働 vs. 積み重ね)から来ることを示している。
  • このフレームワークは、LLMsによって推進される高忠実度の多エージェント移動生成を実証している。
Figure 2: Routing trajectories of delivery rider agents
Figure 2: Routing trajectories of delivery rider agents

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。