QUICK REVIEW

[论文解读] Better Quality in Synthesis through Quantitative Objectives

Roderick Bloem, Krishnendu Chatterjee|arXiv (Cornell University)|Apr 17, 2009

Formal Methods in Verification参考文献 14被引用 32

一句话总结

本文提出了一种框架，通过将定性规范与字典序均值支付目标相结合，以优先考虑实现质量，从而合成最优的反应式系统。该文提出了求解字典序均值支付博弈和字典序均值支付公平博弈的算法，即使最优策略需要无限记忆，也能实现具有有限记忆的最优或$\varepsilon$-最优实现。

ABSTRACT

Most specification languages express only qualitative constraints. However, among two implementations that satisfy a given specification, one may be preferred to another. For example, if a specification asks that every request is followed by a response, one may prefer an implementation that generates responses quickly but does not generate unnecessary responses. We use quantitative properties to measure the "goodness" of an implementation. Using games with corresponding quantitative objectives, we can synthesize "optimal" implementations, which are preferred among the set of possible implementations that satisfy a given specification. In particular, we show how automata with lexicographic mean-payoff conditions can be used to express many interesting quantitative properties for reactive systems. In this framework, the synthesis of optimal implementations requires the solution of lexicographic mean-payoff games (for safety requirements), and the solution of games with both lexicographic mean-payoff and parity objectives (for liveness requirements). We present algorithms for solving both kinds of novel graph games.

研究动机与目标

为解决纯定性规范在反应式系统合成中的局限性，即无法区分在定性上正确但本质不同的实现方式。
通过定量目标（特别是字典序均值支付属性）定义正确实现之间的偏好顺序。
实现最优或近似最优的实现，以最小化不希望出现的行为，如不必要的响应或延迟响应。
形式化并求解为实现该合成所必需的新一类博弈——字典序均值支付博弈和字典序均值支付公平博弈。
在同时存在安全性和生存性约束的条件下，建立可实现性与$\varepsilon$-最优性的可判定性与复杂度界限。

提出的方法

使用字典序均值支付自动机为转移分配实数奖励的元组，以建模多个定量目标，如最小化不必要的授予和减少响应延迟。
将合成问题简化为求解安全性质的字典序均值支付博弈，以及求解生存性性质的字典序均值支付公平博弈。
对字典序均值支付博弈采用无记忆策略，证明其足以获得最优解。
为字典序均值支付公平博弈引入有限状态的$\varepsilon$-最优策略构造方法，即使最优策略需要无限记忆。
应用博弈论算法计算初始状态的值，并确定定量规范的可实现性。
使用Mealy机器表示合成的控制器，其算法可在相对于博弈复杂度的多项式时间内构造最优或$\varepsilon$-最优实现。

实验结果

研究问题

RQ1能否在反应式合成中有效整合定量目标，以在满足定性规范的实现中偏好更优的实现？
RQ2需要何种类型的博弈论目标来捕捉关键质量属性，如最小化不必要的操作和响应延迟？
RQ3字典序均值支付博弈的最优策略是否为无记忆策略？其求解的复杂度如何？
RQ4当最优策略需要无限记忆时，能否在有限状态下合成$\varepsilon$-最优实现？
RQ5在存在生存性约束和字典序均值支付目标的情况下，可实现性与$\varepsilon$-可实现性有何不同？

主要发现

字典序均值支付博弈在无记忆策略下是确定的，且在NP ∩ coNP中可判定，从而可高效合成最优实现。
对于字典序均值支付公平博弈，最优策略可能需要无限记忆，但对于任意$\vec{\varepsilon} > \vec{0}$，均存在$\varepsilon$-最优的有限状态策略。
对于安全性质，决定可实现性与$\vec{c}$-可实现性的复杂度属于NP ∩ coNP；对于生存性性质，复杂度属于NP。
对于生存性性质，极限-$\vec{c}$-可实现性在coNP中可判定，而$\vec{c}$-可实现性在NP中可判定。
对于安全性质，最优Mealy机器可在$O(|E|^{4d+6} \cdot |\vec{r}|)$时间内构造；对于生存性性质，在$\vec{\varepsilon}$-最优性下，构造时间复杂度为$O(|S|^{|p|} \cdot |E|^{4d+6} \cdot |\vec{r}| + \frac{1}{\varepsilon})$。
该框架通过字典序组合均值支付目标，实现了最小化不必要响应和响应延迟的实现合成。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。