QUICK REVIEW

[論文レビュー] Deep Lagrangian Networks: Using Physics as Model Prior for Deep Learning

Michael Lutter, Christian Ritter|arXiv (Cornell University)|Jul 10, 2019

Model Reduction and Neural Networks参考文献 38被引用数 80

ひとこと要約

DeLaN は Euler-Lagrange 力学をニューラルネットワークへエンコードし、物理的妥当性を備えたロボットのダイナミクスを学習する。これにより、頑健な外挿とオンライン学習による制御を実現する。

ABSTRACT

Deep learning has achieved astonishing results on many tasks with large amounts of data and generalization within the proximity of training data. For many important real-world applications, these requirements are unfeasible and additional prior knowledge on the task domain is required to overcome the resulting problems. In particular, learning physics models for model-based control requires robust extrapolation from fewer samples - often collected online in real-time - and model errors may lead to drastic damages of the system. Directly incorporating physical insight has enabled us to obtain a novel deep model learning approach that extrapolates well while requiring fewer samples. As a first example, we propose Deep Lagrangian Networks (DeLaN) as a deep network structure upon which Lagrangian Mechanics have been imposed. DeLaN can learn the equations of motion of a mechanical system (i.e., system dynamics) with a deep network efficiently while ensuring physical plausibility. The resulting DeLaN network performs very well at robot tracking control. The proposed method did not only outperform previous model learning approaches at learning speed but exhibits substantially improved and more robust extrapolation to novel trajectories and learns online in real-time

研究の動機と目的

具現化された体現システムの物理モデルを学習させ、少数のサンプルからの頑健な外挿と安全なオンライン更新を実現する。
オイラー–ラグランジュ方程式を介して物理法則を組み込みつつ、システム構造に対して一般的なネットワークのトポロジーを提案する。
慣性と非保存力の微分可能な表現を用いて、モデルのエンドツーエンド訓練を可能にする。
オンラインデータを用いた仮想ロボットと実機ロボットでのリアルタイム学習と制御性能を実証する。

提案手法

慣性行列 H(q) を L(q) L(q)^T と表現し、L の対角成分を正に保つことで対称性と正定値性を保証する。
非保存力 g(q) を別個のニューラルネットワーク・ヘッドでモデル化する。
学習済みの L および g を用いて、オイラー・ラグランジュ方程式を満たすよう f^{-1}(q, qdot, qddot; θ, ψ) を定式化する。
予測トルクと真のトルクとの損失を最小化するエンドツーエンド訓練を行い、L の非一意性に対処するための追加正則化項を導入する。
L および g 成分を通じたリアルタイムの逆伝播を可能にするよう、解析的に微分を計算する。
H，dH/dt および制御に必要な偏導関数を得るため、特化したラグランジアン層を用いて一回のフォワードパスを生成する。

実験結果

リサーチクエスチョン

RQ1Neural Network ベースの表現（H(q) および g(q) を介して）によって、ロボットシステムの物理的に妥当で正確なモデルを提供できるか。
RQ2Lagrangian 構造を強制することは、 unseen な軌道や速度への外挿を標準のフィードフォワードモデルと比較して改善するか。
RQ3DeLaN を用いたオンライン学習は、安定性や妥当性を損なうことなく、リアルタイム制御ループで実現可能か。
RQ4シミュレートおよび実機ロボットにおいて、DeLaN は解析的な物理モデルおよび純粋なデータ駆動ネットワークと比べてどのように性能を発揮するか。

主な発見

DeLaN は慣性成分、コリオリ/遠心成分、重力といったダイナミクスの構成要素をデータから学習し、実験で真の成分と一致する。
新規の軌道やより高速な運動への外挿は、学習データが限定的な場合でも DeLaN の方が標準のフィードフォワードネットワークより有意に良好である。
オンライン制御では、DeLaN は頑健な追従を実現し、ランダム初期化からでも新しい軌道へ適応可能である。
物理的な Barrett WAM に対して、DeLaN の追従性能は解析モデルと競合し、複雑なケーブル駆動効果の下でのダイナミクス学習も可能である。
シミュレーションおよび実機実験を通じて、DeLaN はベースラインモデルと比較してサンプル効率と外挿能力の向上を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。