QUICK REVIEW

[논문 리뷰] Mining Beyond the Bools: Learning Data Transformations and Temporal Specifications

Sam Nicholas Kouteili, William Fishell|arXiv (Cornell University)|2026. 03. 05.

Formal Methods in Verification인용 수 0

한 줄 요약

논문은 TSL f와 SyGuS를 사용하여 데이터가 풍부한 시간적 속성으로의 명세 마이닝을 확장하고, 데이터 변환을 학습한 뒤 샘플 효율성과 일반화가 강한 상태 반응 제어기를 마이닝된 명세로부터 합성합니다.

ABSTRACT

Mining specifications from execution traces presents an automated way of capturing characteristic system behaviors. However, existing approaches are largely restricted to Boolean abstractions of events, limiting their ability to express data-aware properties. In this paper, we extend mining procedures to operate over richer datatypes. We first establish candidate functions in our domain that cover the set of traces by leveraging Syntax Guided Synthesis (SyGuS) techniques. To capture these function applications temporally, we formalize the semantics of TSL$_f$, a finite-prefix interpretation of Temporal Stream Logic (TSL) that extends LTL$_f$ with support for first-order predicates and functional updates. This allows us to unify a corresponding procedure for learning the data transformations and temporal specifications of a system. We demonstrate our approach synthesizing reactive programs from mined specifications on the OpenAI-Gymnasium ToyText environments, finding that our method is more robust and orders of magnitude more sample-efficient than passive learning baselines on generalized problem instances.

연구 동기 및 목표

Execution traces로부터 표현력이 풍부한 시간적이고 데이터 인지 명세를 자동으로 추출하는 것의 동기 부여.
데이터 변환 함수와 그 시간적 관계를 발견하는 마이닝 파이프라인 개발.
데이터와 시점을 처리하기 위한 Temporal Stream Logic(TSL f)의 유한 접두 해석 formalization.
변수 간 업데이트를 추론하기 위한 Syntax-Guided Synthesis 통합.
OpenAI-Gym ToyText 환경에서 마이닝된 명세로부터 반응 제어기 합성 시연.

제안 방법

데이터 변환과 1차 주문 술어를 지원하는 TSL f의 유한 접두 버전 도입.
각 시간 스텝에서 모든 변수의 업데이트 함수를 찾기 위한 SyGuS 기반 하향식 함수 발견 절차 제안.
제약 그룹을 탐욕적으로 병합하여 모든 전이을 포괄하는 간결한 함수 집합 형성(알고리즘 2).
트레이스를 업데이트를 결정적으로 만들기 위해 함수 입력을 순위화하여 잘 구성된 TSL f 트레이스 구성(알고리즘 3 및 4).
트레이스를 함수 적용 트레이스로 승격하고 Liveness(F) 및 Safety(G) 속성을 위한 확장된 Bolt 프레임워크로 명세 마이닝을 적용하여 합성적(CONJUNCTION) G φ ∧ F ψ를 얻음.
마이닝된 TSL f 명세로부터 Issy를 통한 반응 제어기 합성 시연 및 OpenAI-Gym ToyText 환경에서 평가.

Mining Beyond the Bools: Learning Data Transformations and Temporal Specifications

실험 결과

연구 질문

RQ1트레이스로부터 불리언 외의 임의의 데이터 타입을 포함하는 표현력 있는 데이터 변환 함수와 시간적 명세를 마이닝할 수 있는가?
RQ2SyGuS를 어떻게 통합하여 트레이스 진화를 설명하는 변수 업데이트 함수를 발견할 수 있는가?
RQ3데이터 인식적이고 시간적 명세를 학습하는 것이 기준선 대비 로버스트성과 샘플 효율성을 개선하는가?
RQ4유한 트레이스의 맥락에서 TSL f와 표준 TSL 사이의 표현력 차이는 무엇이며 그것이 실현성에 어떤 영향을 미치는가?
RQ5마이닝된 Liveness와 Safety 명세가 시간-관계 태스크의 보지 않은 구성에 일반화되는가?

주요 결과

Method	Train	Test	4	8	12	16	20	50	100	500	1000
SpecMining(TSL f)	고정	var_conf	24	42	50	50	50	-	-	-	-
var_conf	var_conf	45	50	50	50	50	-	-	-	-	-
고정	var_size	24	50	50	50	50	-	-	-	-	-

TSL f는 불리언이 아닌 데이터로 구성된 트레이스로부터 데이터 변환 함수와 시간적 명세를 모두 마이닝할 수 있다.
20개의 예시(≤20)만으로도 보유하지 않은 ToyText 구성에서 완벽한 승리 비율을 달성한다.
기준선과 비교하여 TSL f 명세 마이닝은 샘플 효율성이 현저히 높고 보지 않은 보드 크기와 구멍 위치에 더 잘 일반화된다.
FrozenLake와 유사한 태스크에서 마이닝된 Liveness와 Safety 명세는 memorized 위치를 넘어서는 강건한 관계 추론을 가능케 한다.
수동적 모방 기반 기준선(예: 확률적 Mealy, 행동 복제, 의사결정 트리)에 비해 샘플 효율성이 크게 향상되며 비작용 의미를 갖는 LTL f 기반의 기준선보다 우수한 성능을 보이고, 보드 구성 간 일반화가 가능하다.
마이닝된 명세는 보드 구성 간 일반화되는 관계적 불변식(예: 플레이어 좌표와 구멍 좌표의 비교)을 표현한다.

Figure 3 : Function discovery procedure. After choosing input-output pairs, the SyGuS solver determines unique functions for each constraint. Constraints are merged by their synthesized functions, at which point smaller constraint sets attempt to merge into larger ones, eliminating spurious function

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.