Skip to main content
QUICK REVIEW

[论文解读] TriCEGAR: A Trace-Driven Abstraction Mechanism for Agentic AI

Roham Koohestani, Ateş Görpelioğlu|arXiv (Cornell University)|Jan 30, 2026
Multi-Agent Systems and Negotiation被引用 0
一句话总结

TriCEGAR 通过从执行轨迹学习谓词树抽象来实现对行动性 AI 的运行时验证状态抽象,构建 AMDP,并进行带异常检测的概率模型检验。

ABSTRACT

Agentic AI systems act through tools and evolve their behavior over long, stochastic interaction traces. This setting complicates assurance, because behavior depends on nondeterministic environments and probabilistic model outputs. Prior work introduced runtime verification for agentic AI via Dynamic Probabilistic Assurance (DPA), learning an MDP online and model checking quantitative properties. A key limitation is that developers must manually define the state abstraction, which couples verification to application-specific heuristics and increases adoption friction. This paper proposes TriCEGAR, a trace-driven abstraction mechanism that automates state construction from execution logs and supports online construction of an agent behavioral MDP. TriCEGAR represents abstractions as predicate trees learned from traces and refined using counterexamples. We describe a framework-native implementation that (i) captures typed agent lifecycle events, (ii) builds abstractions from traces, (iii) constructs an MDP, and (iv) performs probabilistic model checking to compute bounds such as Pmax(success) and Pmin(failure). We also show how run likelihoods enable anomaly detection as a guardrailing signal.

研究动机与目标

  • 在随机环境下,激励对行动性 AI 的自动化、鲁棒性保障需求。
  • 引入 TriCEGAR,通过从执行轨迹自动化状态抽象用于运行时验证。
  • 实现在线构建 Agentic MDP (AMDP) 和概率模型检验以获得定量保证。
  • 提供一个框架原生实现,集成轨迹捕获、抽象学习、MDP 构 induction,以及异常检测。

提出的方法

  • 捕获代理生命周期事件以产生带类型的执行轨迹。
  • 从轨迹中学习谓词树,形成把具体状态映射到抽象状态的抽象映射。
  • 在抽象状态上构建一个 MDP,转移由轨迹频次估计得到。
  • 应用概率模型检验(PCTL)以计算边界,如 Pmax(Diamond 成功) 和 Pmin(Diamond 失败)。
  • 利用观测轨迹得到的反例来 refine 抽象,以减少虚假行为。
  • 使用感知到的概率模型执行基于运行概率的异常检测。

实验结果

研究问题

  • RQ1如何通过直接从轨迹学习状态抽象来实现对行动性 AI 的运行时验证自动化?
  • RQ2是否可以在线、基于轨迹的 AMDP 被学习并与概率模型检验结合,用以对行动性行为进行边界约束?
  • RQ3反例如何引导谓词的 refined 以减少虚假验证结果?
  • RQ4在学习模型下的运行可能性是否可以作为操作过程中的有效异常信号?

主要发现

  • TriCEGAR 用从轨迹派生的学习谓词树取代手动状态映射。
  • 构建的 AMDP 以谓词树的叶节点作为状态,转移反映工具类型的动作并从轨迹中取得概率。
  • 概率模型检验给出定量边界,如 Pmax(Diamond 成功) 和 Pmin(Diamond 失败) 的值,用于行动性工作流。
  • 该框架支持在线更新:轨迹逐步到达,抽象和 AMDP 在各步之间 refine,概率边界随之更新。
  • 在诱导模型下的运行可能性提供执行过程中的异常检测信号。
  • 早期原型展示了从轨迹捕获到 MDP 诱导再到 PCTL 查询的端到端工作流。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。