[논문 리뷰] Deep Lagrangian Networks: Using Physics as Model Prior for Deep Learning
DeLaN은 물리적 타당성을 갖춘 로봇 동역학을 학습하기 위해 Euler-Lagrange 역역학을 신경망에 인코딩하여, 제어를 위한 강력한 외삽 및 온라인 학습을 가능하게 한다.
Deep learning has achieved astonishing results on many tasks with large amounts of data and generalization within the proximity of training data. For many important real-world applications, these requirements are unfeasible and additional prior knowledge on the task domain is required to overcome the resulting problems. In particular, learning physics models for model-based control requires robust extrapolation from fewer samples - often collected online in real-time - and model errors may lead to drastic damages of the system. Directly incorporating physical insight has enabled us to obtain a novel deep model learning approach that extrapolates well while requiring fewer samples. As a first example, we propose Deep Lagrangian Networks (DeLaN) as a deep network structure upon which Lagrangian Mechanics have been imposed. DeLaN can learn the equations of motion of a mechanical system (i.e., system dynamics) with a deep network efficiently while ensuring physical plausibility. The resulting DeLaN network performs very well at robot tracking control. The proposed method did not only outperform previous model learning approaches at learning speed but exhibits substantially improved and more robust extrapolation to novel trajectories and learns online in real-time
연구 동기 및 목표
- 구조화된 시스템에서 물리적 모델 학습을 동기를 부여하여 적은 샘플로부터의 강력한 외삽과 안전한 온라인 업데이트를 가능하게 한다.
- Euler–Lagrange 방정식을 통해 물리를 강제하는 네트워크 토폴로지를 제안하되 시스템 구조에는 일반성을 유지한다.
- 관성 및 비보존력의 미분가능한 표현으로 모델을 엔드투엔드 학습할 수 있도록 한다.
- 온라인 데이터를 사용하여 시뮬레이션 및 물리적 로봇에서 실시간 학습 및 제어 성능을 시연한다.
제안 방법
- 관성 행렬 H(q)를 L(q)L(q)^T로 표현하되 L의 대각 원소가 양수가 되도록 하여 대칭성과 양의 정부호성을 보장한다.
- 비보존력 g(q)는 별도의 신경망 헤드로 모델링한다.
- 학습된 L 및 g를 사용하여 Euler–Lagrange 방정식을 만족하도록 f^{-1}(q, qdot, qddot; θ, ψ)을 형식화한다.
- 예측 토크와 실제 토크 사이의 손실을 최소화하여 엔드투엔드로 학습하고, L의 비고유성에 대응하기 위한 추가 규제 항을 둔다.
- L 및 g 구성요소를 통해 실시간 역전파를 가능하게 하도록 도함수를 해석적으로 계산한다.
- 제어에 필요한 H, dH/dt 및 편미분을 얻기 위해 단일 순전파를 제공하는 특수화된 Lagrangian 계층을 사용한다.
실험 결과
연구 질문
- RQ1H(q) 및 g(q)를 통해 라그랑주 역학의 신경망 기반 표현이 로봇 시스템에 대해 물리적으로 타당하고 정확한 모델을 제공할 수 있는가?
- RQ2라그랑주 구조를 강제하는 것이 일반적인 피드포워드 모델과 비교했을 때, 보지 않은 궤적과 속도로의 외삽을 개선하는가?
- RQ3DeLaN을 사용한 실제 시간 제어 루프에서 동역학의 온라인 학습이 안정성이나 타당성을 희생하지 않으면서 가능한가?
- RQ4시뮬레이션 및 실제 로봇에서 DeLaN이 해석 물리 모델 및 순수 데이터 기반 네트워크에 비해 어떤 성능을 보이는가?
주요 결과
- DeLaN은 데이터에서 관성, 코리올리스/원심력, 중력의 동역학 구성요소를 학습하여 실험에서 실제 구성요소와 일치한다.
- 새로운 궤적과 더 높은 속도에 대한 외삽은 학습 데이터가 제한적일 때 특히 표준 피드포워드 네트워크보다 DeLaN에서 현저히 더 좋다.
- 온라인 제어에서 DeLaN은 견고한 추적을 달성하고 무작위 초기화에서 시작하는 새로운 궤적에 적응할 수 있다.
- 물리적 Barrett WAM에서 DeLaN의 추적 성능은 해석 모델과 경쟁력이 있으며 복잡한 케이블 구동 효과하에서 동역학을 학습할 수 있다.
- 시뮬레이션과 실제 로봇 실험에 걸쳐 DeLaN은 대조군 모델에 비해 샘플 효율성과 외삽 능력이 향상됨을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.