[论文解读] Simplifying Hamiltonian and Lagrangian Neural Networks via Explicit Constraints
论文展示了通过使用带显式约束的拉格朗日乘子法在笛卡尔坐标下学习哈密顿量和拉格朗日量(CHNNs 与 CLNNs)在准确性和数据效率方面明显优于隐式约束方法,尤其对于混沌和扩展体系统。
Reasoning about the physical world requires models that are endowed with the right inductive biases to learn the underlying dynamics. Recent works improve generalization for predicting trajectories by learning the Hamiltonian or Lagrangian of a system rather than the differential equations directly. While these methods encode the constraints of the systems using generalized coordinates, we show that embedding the system into Cartesian coordinates and enforcing the constraints explicitly with Lagrange multipliers dramatically simplifies the learning problem. We introduce a series of challenging chaotic and extended-body systems, including systems with N-pendulums, spring coupling, magnetic fields, rigid rotors, and gyroscopes, to push the limits of current approaches. Our experiments show that Cartesian coordinates with explicit constraints lead to a 100x improvement in accuracy and data efficiency.
研究动机与目标
- 激发需要具有捕捉物理约束的归纳偏置,以提升动力学学习的效果。
- 提出从广义坐标转向带显式约束执行的笛卡尔坐标的转变。
- 开发有约束的哈密顿神经网络(CHNNs)和有约束的拉格朗日神经网络(CLNNs)。
- 展示其在刚性扩展体系统和复杂三维动力学中的适用性。
提出的方法
- 将问题嵌入笛卡尔坐标中,以简化需要学习的哈密顿量/拉格朗日量函数。
- 通过拉格朗日乘子和扩展作用量 S[z, λ] 明确实现全约束(可约束)条件。
- 使用投影 P(z) 和动力学方程 ẋ = P(z)J∇H(z) 推导受约束动力学(以及对应的拉格朗日形式)。
- 对质量矩阵进行参数化,并用神经网络学习 H 或 L,使用学得的 M^{-1} 和分块对角结构。
- 提供一个在笛卡尔坐标中嵌入扩展刚体、距离约束和可编程约束图的框架。
实验结果
研究问题
- RQ1将问题嵌入笛卡尔坐标并使用显式约束,是否比广义坐标简化了所学习的哈密顿量/拉格朗日量函数?
- RQ2CHNNs 和 CLNNs 是否能够在混沌和三维扩展体系统上实现比 HNNs 和 DeLaNs 等隐式方法更高的精度和数据效率?
- RQ3在笛卡尔坐标中如何表示扩展刚体及其关节以学习哈密顿量/拉格朗日量?
- RQ4在使用显式约束时,对长期轨迹预测和能量守恒有何影响?
- RQ5在一系列具有挑战性的物理系统(N 摆、磁力摆、陀螺仪、刚性转子)中,该方法的有效性如何?
主要发现
- 笛卡尔坐标表述得到的哈密顿量/拉格朗日量更简单、易于学习。
- CHNNs/CLNNs 在所测试的系统上实现了相对于 HNNs 和 DeLaNs 的 10 倍到 100 倍的精度和数据效率提升。
- 使用带拉格朗日乘子的显式约束可实现对混沌和三维扩展体动力学的准确长期预测。
- 在笛卡尔坐标中质量矩阵可通过基于 Cholesky 的参数化实现半正定结构的学习。
- 该框架支持在任意维度使用约束图和距离/关节约束嵌入扩展体及关节。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。