[論文レビュー] Specification-Driven Generation and Evaluation of Discrete-Event World Models via the DEVS Formalism
要約: 本論文は、DEVS形式を用いて自然言語仕様から実行可能な離散イベント世界モデルを合成するパイプラインを提示し、仕様適合性と長期的整合性を検証するトレースベースの評価を行う。これにより、明示的構造と学習済み挙動を組み合わせた、オンデマンド適応と検証可能なモジュール式世界モデルを実現する。
World models are essential for planning and evaluation in agentic systems, yet existing approaches lie at two extremes: hand-engineered simulators that offer consistency and reproducibility but are costly to adapt, and implicit neural models that are flexible but difficult to constrain, verify, and debug over long horizons. We seek a principled middle ground that combines the reliability of explicit simulators with the flexibility of learned models, allowing world models to be adapted during online execution. By targeting a broad class of environments whose dynamics are governed by the ordering, timing, and causality of discrete events, such as queueing and service operations, embodied task planning, and message-mediated multi-agent coordination, we advocate explicit, executable discrete-event world models synthesized directly from natural-language specifications. Our approach adopts the DEVS formalism and introduces a staged LLM-based generation pipeline that separates structural inference of component interactions from component-level event and timing logic. To evaluate generated models without a unique ground truth, simulators emit structured event traces that are validated against specification-derived temporal and semantic constraints, enabling reproducible verification and localized diagnostics. Together, these contributions produce world models that are consistent over long-horizon rollouts, verifiable from observable behavior, and efficient to synthesize on demand during online execution.
研究の動機と目的
- エージェント系システムにおける世界モデルの手作業で設計したシミュレータと暗黙的ニューラルモデルの中間点を動機づける。
- 自然言語仕様から実行可能な離散イベント世界モデルをDEVS形式で合成することを提案。
- 構造推論と部品レベル挙動を分離する、二段階のLLM駆動生成パイプラインを開発。
- 仕様-derivedの時間的および意味的制約に対してモデルを検証するトレースベース評価フレームワークを導入。
- オンライン実行中に世界モデルをオンデマンドで合成・適応できるようにする。
提案手法
- DEVS形式を採用して、明示的な状態・タイミング・イベントセマンティクスを持つ相互作用する原子モデルと結合モデルとして世界ダイナミクスをモデル化。
- 構造的合成(PlanTree)を最初に行い、次に原子モデルを実装して結合モデルを組み立てる、段階的なLLM生成パイプラインを使用。
- コンポーネントをデカップリングし並列・スケーラブルな生成を可能にするために、インターフェース契約とJSONスキーマを活用。
- 親モデルと実データサブコンポーネントのインターフェースを整合させるために、インターフェース要約を介した適応的結合を実装。
- 構造化イベント traces(JSONL)を発して仕様駆動の観測挙動評価を可能にするシミュレータを生成。
- 自然言語仕様から導出された時間的・意味的制約に対してトレースベースの適合性でモデルを評価。
実験結果
リサーチクエスチョン
- RQ1自然言語の環境記述から実行可能な離散イベント世界モデルをどのように生成するか?
- RQ2DEVSベースのモジュラー合成は生成されたシミュレータに対して長期の信頼できる挙動と検証性を提供できるか?
- RQ3唯一のGround-truth実装が存在しない場合、どのようにそのようなシミュレータを評価するか?
- RQ4トレースベースの仕様駆動評価フレームワークはオンライン実行中のターゲット診断と堅牢な適応を可能にするか?
主な発見
- 本手法は自然言語から合成された実行可能なDEVSベースの世界モデルを生み出す。
- PlanTreeによる構造的合成はスケーラブルで契約駆動のコンポーネント生成を可能にする。
- 挙動的合成はモジュール性を保ちながら、各コンポーネントのタイミング・状態遷移ロジックを作成する。
- トレースベースの評価は仕様に対する時間的・意味的制約を検証し、違反箇所の局所化を可能にする。
- 本フレームワークはオンデマンドの合成と適応的結合をサポートし、実装コンポーネントとの整合性を維持する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。