Skip to main content
QUICK REVIEW

[论文解读] Learning Equations for Extrapolation and Control

Subham Sekhar Sahoo, Christoph H. Lampert|arXiv (Cornell University)|Jun 19, 2018
Model Reduction and Neural Networks参考文献 10被引用 45
一句话总结

本文将 Equation Learner 扩展为包含除法单元(EQL÷),使从数据中发现简洁、可外推的方程成为可能,并将其应用于前向动力学与机器人控制,且试验极少。

ABSTRACT

We present an approach to identify concise equations from data using a shallow neural network approach. In contrast to ordinary black-box regression, this approach allows understanding functional relations and generalizing them from observed data to unseen parts of the parameter space. We show how to extend the class of learnable equations for a recently proposed equation learning network to include divisions, and we improve the learning and model selection strategy to be useful for challenging real-world data. For systems governed by analytical expressions, our method can in many cases identify the true underlying equation and extrapolate to unseen domains. We demonstrate its effectiveness by experiments on a cart-pendulum system, where only 2 random rollouts are required to learn the forward dynamics and successfully achieve the swing-up task.

研究动机与目标

  • 激发需要可解释模型,以捕捉物理系统中真正的底层关系。
  • 将 Equation Learner 拓展到处理除法,并改进训练稳定性与模型选择。
  • 演示外推能力及在极少数据下对现实世界控制任务的适用性。

提出的方法

  • 在 EQL 架构的最后一层引入除法单元,形成 EQL÷。
  • 使用带阈值 θ 的正则化除法激活 hθ(a,b),以避免极点并引导梯度。
  • 在训练过程中加入惩罚项 Pθ,抑制负数或禁用分母。
  • 实施一个课程学习,令 θ(t) 在训练中逐渐降低,以实现对精确除法的逐步学习。
  • 采用三阶段正则化计划以促进稀疏性,然后固定简洁模型(先 L1 再近似 L0 行为)。
  • 提出一种模型选择标准(Vint-S 与 Vint&ex 变体),联合优化插值验证误差与归一化稀疏性(如有可用,则包含外推验证)。

实验结果

研究问题

  • RQ1带除法单元的扩展方程学习网络是否能够从数据中准确识别潜在的解析表达式?
  • RQ2具备除法能力的模型是否比标准神经网络与符号回归在未见区域的外推更可靠?
  • RQ3应如何进行模型选择以识别最简单正确的方程,尤其是在有外推数据的情况下?
  • RQ4使用 EQL÷ 学到的前向动力学能否在极少的探索性试验下实现对机器人系统的有效控制?

主要发现

  • EQL÷ 可以外推到未见领域,并在多项实验中识别出真实的潜在方程,而基线 EQL 则做不到。
  • 在以除法为主的公式上,EQL÷ 在外推质量上优于 MLP、SVR 和 Eureqa,有时在插值上也优于。
  • 有外推数据时,Vint&ex 模型选择变体在众多候选中可靠地识别正确公式;40 个外推点通常足够。
  • 在学习最多四个输入的复杂公式时,EQL÷ 与 Eureqa 一致地实现良好外推性能,而原始的 EQL 在没有除法时表现不佳。
  • 该方法展示了学习前向动力学并用极少的随机探索完成摆动上升控制任务。
  • 该方法已实现并对外可用,便于复现与进一步研究。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。