Skip to main content
QUICK REVIEW

[论文解读] Specification-Driven Generation and Evaluation of Discrete-Event World Models via the DEVS Formalism

Zheyu Chen, Zhuohuan Li|arXiv (Cornell University)|Mar 4, 2026
Simulation Techniques and Applications被引用 0
一句话总结

论文提出一个管线,将从自然语言规范合成可执行的离散事件世界模型,使用 DEVS 形式,并通过基于轨迹的评估确保规范符合性与长时域的一致性。它实现按需自适应与可验证的、模块化的世界模型,结合显式结构与学习行为。

ABSTRACT

World models are essential for planning and evaluation in agentic systems, yet existing approaches lie at two extremes: hand-engineered simulators that offer consistency and reproducibility but are costly to adapt, and implicit neural models that are flexible but difficult to constrain, verify, and debug over long horizons. We seek a principled middle ground that combines the reliability of explicit simulators with the flexibility of learned models, allowing world models to be adapted during online execution. By targeting a broad class of environments whose dynamics are governed by the ordering, timing, and causality of discrete events, such as queueing and service operations, embodied task planning, and message-mediated multi-agent coordination, we advocate explicit, executable discrete-event world models synthesized directly from natural-language specifications. Our approach adopts the DEVS formalism and introduces a staged LLM-based generation pipeline that separates structural inference of component interactions from component-level event and timing logic. To evaluate generated models without a unique ground truth, simulators emit structured event traces that are validated against specification-derived temporal and semantic constraints, enabling reproducible verification and localized diagnostics. Together, these contributions produce world models that are consistent over long-horizon rollouts, verifiable from observable behavior, and efficient to synthesize on demand during online execution.

研究动机与目标

  • 在手工设计的仿真器与隐式神经模型之间为代理系统中的世界模型提供中间路径的动机。
  • 提出可访问、可执行的离散事件世界模型,使用 DEVS 形式从自然语言规范中合成。
  • 开发一个两阶段的 LLM 驱动生成流水线,将结构推断与组件级行为实现分离。
  • 引入基于轨迹的评估框架,以对照规范派生的时序与语义约束验证模型。
  • 在在线执行过程中实现按需的世界模型合成与自适应。

提出的方法

  • 采用 DEVS 形式将世界动力学建模为相互作用的原子组件与耦合组件,具有显式状态、时序和事件语义。
  • 使用分阶段的 LLM 驱动生成流水线,先进行结构合成(PlanTree),再进行行为合成以实现原子模型并组装耦合模型。
  • 使用接口契约和 JSON模式来解耦组件并实现并行、可扩展的生成。
  • 通过接口摘要实现自适应耦合,使父模型与地面实况子组件接口对齐。
  • 生成发出结构化事件轨迹(JSONL)的仿真器,以实现对可观测行为的规范驱动评估。
  • 通过基于轨迹、对照自然语言规范派生的时序/语义约束来评估模型的符合性。

实验结果

研究问题

  • RQ1如何从自然语言环境描述生成可执行的离散事件世界模型?
  • RQ2基于 DEVS 的模块化合成是否能为生成的仿真器提供可靠的长时域行为与可验证性?
  • RQ3在没有唯一地面真实实现的情况下,如何评估此类仿真器?
  • RQ4基于轨迹、规范驱动的评估框架是否能在在线执行中实现有针对性的诊断和健壮的自适应?

主要发现

  • 该方法从自然语言中合成可执行的基于 DEVS 的世界模型。
  • 通过 PlanTree 的结构化合成实现可扩展、契约驱动的组件生成。
  • 行为合成为每个组件创建时序与状态转移动作,保持模块化。
  • 基于轨迹的评估对照规范的时序和语义约束,便于定位违规之处。
  • 该框架支持按需合成与自适应耦合,以保持与实现组件的一致性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。