Skip to main content
QUICK REVIEW

[论文解读] Mining Beyond the Bools: Learning Data Transformations and Temporal Specifications

Sam Nicholas Kouteili, William Fishell|arXiv (Cornell University)|Mar 5, 2026
Formal Methods in Verification被引用 0
一句话总结

本文通过使用 TSL f 和 Syntax-Guided Synthesis 将规范挖掘扩展到数据丰富的时序属性,以学习数据转换,然后从挖掘的规范中合成反应控制器,具备高样本效率和强泛化能力。

ABSTRACT

Mining specifications from execution traces presents an automated way of capturing characteristic system behaviors. However, existing approaches are largely restricted to Boolean abstractions of events, limiting their ability to express data-aware properties. In this paper, we extend mining procedures to operate over richer datatypes. We first establish candidate functions in our domain that cover the set of traces by leveraging Syntax Guided Synthesis (SyGuS) techniques. To capture these function applications temporally, we formalize the semantics of TSL$_f$, a finite-prefix interpretation of Temporal Stream Logic (TSL) that extends LTL$_f$ with support for first-order predicates and functional updates. This allows us to unify a corresponding procedure for learning the data transformations and temporal specifications of a system. We demonstrate our approach synthesizing reactive programs from mined specifications on the OpenAI-Gymnasium ToyText environments, finding that our method is more robust and orders of magnitude more sample-efficient than passive learning baselines on generalized problem instances.

研究动机与目标

  • 从执行轨迹自动提取表达性强的时序和数据感知规范以提升自动化能力。
  • 开发一个挖掘管道,发现对数据进行转换的函数及其时序关系。
  • 形式化 Temporal Stream Logic (TSL f) 的有限前缀解释,以处理数据与时间。
  • 集成 Syntax-Guided Synthesis 以推断变量的更新函数。
  • 在 OpenAI-Gym ToyText 环境中从挖掘的规范中演示反应控制器的合成。

提出的方法

  • 引入支持数据转换和一阶谓词的 TSL f—— Temporal Stream Logic 的有限前缀版本。
  • 提出使用 SyGuS 的自下而上的函数发现过程,在每个时间步为每个变量找到更新函数。
  • 贪心地合并约束组,形成覆盖所有转移的紧凑函数集(算法 2)。
  • 通过对函数输入进行排序以确定跨轨迹的更新,构造良好形成的 TSL f 轨迹(算法 3 和 4)。
  • 将轨迹提升到函数应用轨迹,并在扩展的 Bolt 框架下对活跃性(F)和安全性(G)属性进行规范挖掘,得到一个合取 G φ ∧ F ψ。
  • 通过从挖掘的 TSL f 规范中使用 Issy 演示反应控制器的合成,并在 OpenAI-Gym ToyText 环境上进行评估。
Mining Beyond the Bools: Learning Data Transformations and Temporal Specifications

实验结果

研究问题

  • RQ1我们是否能够从包含任意数据类型的轨迹中挖掘出表达性的数据转换函数和时序规范?
  • RQ2如何将 SyGuS 集成以发现能够解释轨迹演化的变量更新函数?
  • RQ3在学习数据感知的时序规范后,是否能在鲁棒性和样本效率方面优于基线的反应控制器合成?
  • RQ4在有限前缀轨迹的背景下,TSL f 与标准 TSL 之间的表达差距及其对可实现性的影响如何?
  • RQ5挖掘出的活跃性和安全性规范是否能泛化到未见过的时序关系任务配置?

主要发现

MethodTrainTest48121620501005001000
SpecMining(TSL f)fixedvar_conf2442505050----
var_confvar_conf4550505050----
fixedvar_size2450505050----
  • TSL f 能从包含非布尔数据的轨迹中挖掘出数据转换函数和时序规范。
  • 在保留少量示例(≤20)的情况下,对保留的 ToyText 配置实现了完美胜率。
  • 与基线相比,使用 TSL f 的规范挖掘在样本效率和对未见棋盘尺寸与孔位的泛化方面显著更优。
  • 在类似 FrozenLake 的任务中,挖掘出的活跃性与安全性规范能够进行稳健的、超越记忆化位置的关系推理。
  • 该方法在样本效率方面较被动模仿基线(如随机 Mealy、行为克隆、决策树)提升一个数量级,并且优于缺乏动作语义的位爆 LTL f 基线。
  • 挖掘出的规范表达了关系性不变量(如将玩家坐标与洞坐标进行比较),并能在不同棋盘配置中泛化。
Figure 3 : Function discovery procedure. After choosing input-output pairs, the SyGuS solver determines unique functions for each constraint. Constraints are merged by their synthesized functions, at which point smaller constraint sets attempt to merge into larger ones, eliminating spurious function
Figure 3 : Function discovery procedure. After choosing input-output pairs, the SyGuS solver determines unique functions for each constraint. Constraints are merged by their synthesized functions, at which point smaller constraint sets attempt to merge into larger ones, eliminating spurious function

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。