QUICK REVIEW

[論文レビュー] Learning Equations for Extrapolation and Control

Subham Sekhar Sahoo, Christoph H. Lampert|arXiv (Cornell University)|Jun 19, 2018

Model Reduction and Neural Networks参考文献 10被引用数 45

ひとこと要約

この論文は Equation Learner を分割単位を含むよう拡張した（EQL÷）ことで、データから簡潔で外挿可能な式を発見し、それらを前方ダイナミクスとロボット制御に非常に少ない試行回数で適用できるようにする。

ABSTRACT

We present an approach to identify concise equations from data using a shallow neural network approach. In contrast to ordinary black-box regression, this approach allows understanding functional relations and generalizing them from observed data to unseen parts of the parameter space. We show how to extend the class of learnable equations for a recently proposed equation learning network to include divisions, and we improve the learning and model selection strategy to be useful for challenging real-world data. For systems governed by analytical expressions, our method can in many cases identify the true underlying equation and extrapolate to unseen domains. We demonstrate its effectiveness by experiments on a cart-pendulum system, where only 2 random rollouts are required to learn the forward dynamics and successfully achieve the swing-up task.

研究の動機と目的

物理系の真の基礎関係を捉える解釈可能なモデルの必要性を喚起する。
分割を扱えるように Equation Learner を拡張し、訓練の安定性とモデル選択を改善する。
外挿能力を示し、最小データで現実世界の制御タスクに適用可能であることを示す。

提案手法

EQL アーキテクチャの最終層に分割単位を導入して EQL÷ を形成する。
ポールを避けて勾配を導く閾値 θ を用いた正則化分割活性化 hθ(a,b) を使用する。
訓練中に負または禁止される分母を抑制するペナルティ項 Pθ を追加する。
訓練中に θ(t) を減少させるカリキュラムを実装し、正確な分割の段階的学習を可能にする。
スパース性を促進し、コンパクトなモデルを最終的に固定する三段階の正則化スケジュール（L1 から準 L0 挙動へ）を使用する。
補間検証誤差と正規化されたスパース性を同時に最適化するモデル選択基準（Vint-S および Vint&ex の派生）を提案し、可能であれば外挿検証も考慮する。

実験結果

リサーチクエスチョン

RQ1分割ユニットを備えた拡張された式学習ネットワークは、データから基礎となる解析式を正確に同定できるか。
RQ2分割対応型モデルは、標準的なニューラルネットやシンボリック回帰器よりも未知領域へ外挿する信頼性が高いか。
RQ3特に外挿データがある場合、最も単純で正しい式を識別するためにどのようにモデル選択を行うべきか。
RQ4EQL÷ を用いた学習済み前方ダイナミクスは、非常に少ない探索的試行でロボット制御を有効に可能にするか。

主な発見

EQL÷ は未知の領域へ外挿することができ、基礎の EQL では識別できない真の基礎方程式を複数の実験で特定できる。
分割を多用する式において、EQL÷ は外挿品質で MLP、SVR、Eureqa を上回り、補間面でも時に優れている。
外挿データがある場合、Vint&ex モデル選択群は多数の候補の中から正しい式を安定して同定することが多く、40点の外挿ポイントで十分なことが多い。
4入力までの複雑な式の学習では、EQL÷ および Eureqa は一貫して良好な外挿性能を達成する一方、元の EQL は分割なしでは苦戦する。
本手法は前方ダイナミクスの学習と、少数のランダムロールアウトでのスイングアップ制御タスクの解法を実証している。
このアプローチは実装されており、再現性とさらなる研究を促進するために利用可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。