Skip to main content
QUICK REVIEW

[論文レビュー] SPARK: Skeleton-Parameter Aligned Retargeting on Humanoid Robots with Kinodynamic Trajectory Optimization

Hanwen Wang, Qiayuan Liao|arXiv (Cornell University)|Mar 12, 2026
Human Motion and Animation被引用数 0
ひとこと要約

SPARKは二段階パイプラインを提案します: (1) URDFベースのスケルトン較正を用いて人間の動作をロボット形状に整合させ、(2) 漸進的な運動力学軌道最適化を通じて強制的に実行可能な参照を生成し、RLベースの制御へ適用します。

ABSTRACT

Human motion provides rich priors for training general-purpose humanoid control policies, but raw demonstrations are often incompatible with a robot's kinematics and dynamics, limiting their direct use. We present a two-stage pipeline for generating natural and dynamically feasible motion references from task-space human data. First, we convert human motion into a unified robot description format (URDF)-based skeleton representation and calibrate it to the target humanoid's dimensions. By aligning the underlying skeleton structure rather than heuristically modifying task-space targets, this step significantly reduces inverse kinematics error and tuning effort. Second, we refine the retargeted trajectories through progressive kinodynamic trajectory optimization (TO), solved in three stages: kinematic TO, inverse dynamics, and full kinodynamic TO, each warm-started from the previous solution. The final result yields dynamically consistent state trajectories and joint torque profiles, providing high-quality references for learning-based controllers. Together, skeleton calibration and kinodynamic TO enable the generation of natural, physically consistent motion references across diverse humanoid platforms.

研究の動機と目的

  • URDF較正を用いて骨格構造をロボット形状へ整合させ、 人間の動作データと humanoid 制御を橋渡しする。
  • タスク空間の人間データから、段階的な軌道最適化を通じて高品質で動的に実行可能なモーションリファレンスを生成する。
  • RLベースのモーション追従と学習効率を向上させるために、トルクプロファイルと状態軌道を提供する。

提案手法

  • タスク空間の人間モーションをURDFベースの人間スケルトンと一般化座標軌道に変換する。
  • 関節と体節を跨ぐ休止姿勢のキーフレームを一致させることにより、ターゲットロボットの寸法に合わせて人間URDFを較正する。
  • ロボットに合わせたURDF上で較正された一般化座標をリプレイしてIKを解決し、ロボット一貫のタスク空間リファレンスを得る。
  • 漸進的な運動力学軌道最適化を適用する:まず運動学的TO(KTO)、次に逆ダイナミクス(ID)、そして最終的に全体の運動力学TO(KDTO)を行い、運動学的および動的実現性を確保する。
  • KTO/ID/KDTOでは、前段の解から初期化して、ダイナミクスを徐々に強制しつつ IK 目標を追跡する。
  • 接触、衝突、ワ wrench制約(Contact Wrench Coneを含む)を課し、関節制限とスイング足の制約を満たす。

実験結果

リサーチクエスチョン

  • RQ1URDFベースのスケルトン較正は、従来のルート-to-キーフレームスケーリング法と比較して、さまざまなヒューマノイドプラットフォームに対する逆運動学の再ターゲティング精度を改善できるか。
  • RQ2漸進的な運動力学的軌道最適化(KTO -> ID -> KDTO)は、再ターゲットされた動作の動的実現性とトルクの一貫性をどの程度向上させるか。
  • RQ3関節トルクと接触ワrenchリファレンスを提供することは、ダイナミックな humanoid 動作のRLポリシー学習を加速させるか。
  • RQ4URDF較正がIK誤差指標とその後のRLトレーニングデータ品質に与える影響はどの程度か。
  • RQ5SPARKパイプラインは、SMPLベース表現以外の多様なヒューマノイド形状とモーション形式にも一般化可能か。

主な発見

  • URDF較正は、従来のGMRベースのリターゲティングと比較して、複数のヒューマノイドプラットフォームでIK誤差を大幅に低減する。
  • AMASSデータを複数のロボット(例:Unitree G1、H1、T1、PM01、Kuavo 4Pro)へリターゲットした際、平均身長ごとの位置誤差(E_mpbpe)が大幅に低減する。
  • 段階的な運動力学的最適化パイプラインは、人間モーション参照から動的に一貫した状態軌道とトルクプロファイルを生成する。
  • 生成されたリファレンスは、特に横転のような高度にダイナミックな動作の場合、単なる運動学的リターゲティングよりも豊富な監視を提供し、RLベースの追従を促進する。
  • このフレームワークは、SMPL形状パラメータに依拠するのではなく、URDFスケルトンを較正することにより、さまざまなモーション形式へと暗黙的なスケルトンを用いて一般化される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。