QUICK REVIEW

[论文解读] Extracting Automata from Recurrent Neural Networks Using Queries and Counterexamples

Gail Garfinkel Weiss, Yoav Goldberg|arXiv (Cornell University)|Nov 27, 2017

Machine Learning and Algorithms参考文献 18被引用 61

一句话总结

该论文提出基于精确学习的方法，使用 Angluin 的 L* 算法和 RNNs 作为 oracle 来提取描述 RNN 状态动态的确定性有限自动机，并对等价查询进行抽象以回答。

ABSTRACT

We present a novel algorithm that uses exact learning and abstraction to extract a deterministic finite automaton describing the state dynamics of a given trained RNN. We do this using Angluin's L* algorithm as a learner and the trained RNN as an oracle. Our technique efficiently extracts accurate automata from trained RNNs, even when the state vectors are large and require fine differentiation.

研究动机与目标

激发并形式化从有限字母表中提取一个 DFA，使其镜像训练好的 RNN 接收器可观察行为的问题。
提出一个将精确学习（L* 算法）与对 RNN 的有限状态抽象相结合的通用框架，以回答等价查询。
证明该方法能够产生小型、准确的 DFA，并揭示指示 RNN 泛化差距的对抗性输入。

提出的方法

将训练好的 RNN 当作 L* 的教师，通过用 RNN 的分类来回答成员资格查询。
使用 RNN 状态空间的有限抽象 A^{R,p} 来对抗 L* 生成的 DFA A 的等价查询作出回答，并在需要时细化分区 p。
通过基于支持向量机(SVM)的分割细化抽象，以分离 R-状态并产生新的 A-状态，确保细化由具体输入所证实。
在 RNN 与当前 DFA 或其抽象之间出现分类冲突时返回对例，确保所提取自动机的正确性。
利用最短的对例以保持 DFA 的紧凑并提高提取的自动机的泛化能力。

实验结果

研究问题

RQ1是否可以通过将 RNN 作为 oracle，使用精确学习来学习一个在可观测上等价于训练好的 RNN 接收器的 DFA？
RQ2如何使用高维 RNN 状态空间的有限抽象来回答等价查询，同时不牺牲正确性？
RQ3提取的 DFA 是否对长序列具有泛化性，且该过程是否能揭示对抗性输入或 RNN 的错误泛化？
RQ4哪些细化策略（例如基于 SVM 的分区）在 DFA 大小与对 RNN 的一致性之间实现最佳平衡？
RQ5所提出的方法与以往的量化或随机采样方法在从 RNN 合成紧凑、准确的自动机方面有何比较？

主要发现

该方法在几秒内从在 Tomita 语法及更复杂语言上训练的 GRU/LSTM 网络中提取出准确、且往往较小的 DFA。
基于量化的分区产生非常大、通常不可实用规模的 DFA，而所提出的基于 L* 的抽象方法能生成紧凑且准确的自动机。
该方法揭示对抗性输入和泛化差距，随机采样可能错过，包括对看似完美模型的错误分类对例。
提取的 DFA 对长序列具有良好泛化能力（实验长度达 1000），尽管训练/测试准确率与网络相当。
该框架在多种架构和语言下均有效，突出其对特定网络类型以外的鲁棒适用性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。