QUICK REVIEW
[論文レビュー] Extracting Automata from Recurrent Neural Networks Using Queries and Counterexamples
Gail Garfinkel Weiss, Yoav Goldberg|arXiv (Cornell University)|Nov 27, 2017
Machine Learning and Algorithms参考文献 18被引用数 61
ひとこと要約
論文は、AngluinのL*アルゴリズムとRNNをオラクルとして使用して、RNNの状態ダイナミクスを記述する決定性有限オートマトンを抽出し、同等性クエリに答えるための抽象化を用いる厳密学習ベースの手法を提示します。
ABSTRACT
We present a novel algorithm that uses exact learning and abstraction to extract a deterministic finite automaton describing the state dynamics of a given trained RNN. We do this using Angluin's L* algorithm as a learner and the trained RNN as an oracle. Our technique efficiently extracts accurate automata from trained RNNs, even when the state vectors are large and require fine differentiation.
研究の動機と目的
- 有限アルファベットの下で訓練済みRNN-acceptorの観測可能な挙動を写すDFAを抽出する問題を動機づけ、形式化する。
- 正確な学習(L*アルゴリズム)とRNNの有限状態抽象化を組み合わせて、同等性クエリに答える一般的なフレームワークを提案する。
- 本手法が小さく正確なDFAを生み出すこと、ならびにRNNの汎化ギャップを示す敵対的入力を明らかにすることを実証する。)
提案手法
- 訓練済みRNNをL*の教師と見なし、メンバーシップクエリに対してRNNの分類で回答する。
- RNN状態空間の有限抽象 A^{R,p} を用いて、L*によって生成されたDFA A に対する同等性クエリに回答し、必要に応じて分割 p を改良する。
- サポートベクターマシン(SVM)に基つく分割を用いてR状態を分離し新しいA状態を生成するように抽象化を改良し、改良が具体的入力によって正当化されることを保証する。
- RNNと現在のDFAまたはその抽象化との間で分類矛盾が生じた場合に反例を返し、抽出された自動機の正確さを保証する。
- 最短の反例を活用してDFAを小さく保ち、抽出された自動機の汎化を向上させる。
実験結果
リサーチクエスチョン
- RQ1RNNをオラクルとして用い、正確な学習でDFAを訓練済みRNN-acceptorと観測的に同値に学習できるか。
- RQ2高次元のRNN状態空間の有限抽象を用いて、正確さを犠牲にすることなく同等性クエリに答えるにはどうすればよいか?
- RQ3抽出されたDFAは長い系列に対して一般化するか、またこの過程はRNNの敵対的入力や誤一般化を明らかにできるか?
- RQ4どの改良戦略(例:SVMベースの分割)がDFAのサイズとRNNへの忠実度の最適なバランスを取れるか?
- RQ5提案手法は、RNNからコンパクトで正確な自動機を合成する際の、従来の量子化やランダムサンプリング法とどのように比較されるか?
主な発見
- 本手法は、Tomita文法やより複雑な言語で訓練されたGRU/LSTMネットワークから、短時間で精度の高い、しばしば小さなDFAを抽出する。
- 量子化ベースの分割はしばしば大規模で実用的でないDFAを生む一方、提案されたL*ベースの抽象化手法はコンパクトで正確な自動機を生成する。
- この手法は、ランダムサンプリングでは見逃されがちな敵対的入力や一般化ギャップを明らかにし、見かけ上完璧なモデルに対しても誤分類の反例を含む。
- 抽出されたDFAは、実験では長さ1000までの長い系列に対しても良く一般化し、訓練とテストの精度はネットワークと同等である。
- このフレームワークは複数のアーキテクチャと言語に渡って効果的であり、特定のネットワークタイプを超えた堅牢な適用性を示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。