Skip to main content
QUICK REVIEW

[论文解读] Towards Embodied AI with MuscleMimic: Unlocking full-body musculoskeletal motor learning at scale

Chengkun Li, Cheryl Wang|arXiv (Cornell University)|Mar 26, 2026
Robotic Locomotion and Control被引用 0
一句话总结

MuscleMimic 是一个开源框架,可在数百种动作上训练通用策略,实现 GPU 加速仿真,且有两个经过验证的全身实现用于肌肉驱动的运动模仿学习。

ABSTRACT

Learning motor control for muscle-driven musculoskeletal models is hindered by the computational cost of biomechanically accurate simulation and the scarcity of validated, open full-body models. Here we present MuscleMimic, an open-source framework for scalable motion imitation learning with physiologically realistic, muscle-actuated humanoids. MuscleMimic provides two validated musculoskeletal embodiments - a fixed-root upper-body model (126 muscles) for bimanual manipulation and a full-body model (416 muscles) for locomotion - together with a retargeting pipeline that maps SMPL-format motion capture data onto musculoskeletal structures while preserving kinematic and dynamic consistency. Leveraging massively parallel GPU simulation, the framework achieves order-of-magnitude training speedups over prior CPU-based approaches while maintaining comprehensive collision handling, enabling a single generalist policy to be trained on hundreds of diverse motions within days. The resulting policy faithfully reproduces a broad repertoire of human movements under full muscular control and can be fine-tuned to novel motions within hours. Biomechanical validation against experimental walking and running data demonstrates strong agreement in joint kinematics (mean correlation r = 0.90), while muscle activation analysis reveals both the promise and fundamental challenges of achieving physiological fidelity through kinematic imitation alone. By lowering the computational and data barriers to musculoskeletal simulation, MuscleMimic enables systematic model validation across diverse dynamic movements and broader participation in neuromuscular control research. Code, models, checkpoints, and retargeted datasets are available at: https://github.com/amathislab/musclemimic

研究动机与目标

  • 推动需要经过验证的全身肌肉骨骼模型用于运动控制研究的需求。
  • 将 MuscleMimic 作为一个可扩展模仿学习的开源框架,具有生理学上真实、肌肉驱动的人形体模型。
  • 提供两个经过验证的 MSK 实现(上肢和全身)及一个重定向流水线,将动作捕捉数据映射到 MSK 结构,同时保留生物力学约束。
  • 在步行和奔跑等运动中展示训练效率和生物力学验证。
  • 表明大规模 MSK 运动学习能够实现系统性模型验证并促进更广泛的研究参与。

提出的方法

  • 两种 MSK 实现:一个固定根部的上肢模型,具备 126 条肌肉用于双手操作;一个全身模型,具备 416 条肌肉用于驱动。
  • 通过 MuJoCo Warp 的 GPU 加速物理仿真,在数千个环境中并行化仿真与学习。
  • 一个重定向流水线(GMR-Fit 和 Mocap-Body 替代方案),将 SMPL 格式的动作捕捉数据映射到 MSK 模型,同时保持生物力学约束。
  • 基于策略的强化/模仿学习,通过 carefully balanced 的环境数量和 rollout horizon 来最大化稳定性与吞吐量。
  • 激活动力学模型:act' = (ctrl - act) / tau(ctrl, act) 其中状态相关的 tau,且无穿透角,产生的肌肉激活作为 EMG 包络的代理。
  • 在步行/奔跑数据集上进行经验评估,以验证运动学、运动力学、地面反力和 EMG 相关性,以及对训练超参数(E、批量大小)的消融。

实验结果

研究问题

  • RQ1一个在数百种多样且肌肉驱动的动作上训练出的通用策略,能否在完全肌肉控制下重现人类动作的广泛 repertoire?
  • RQ2使用 GPU 加速的 MSK 仿真是否使得在 CPU 引擎上不可行的可扩展模仿学习成为可能?
  • RQ3在动态任务如步行和奔跑中,基于 MSK 的运动输出(运动学、运动力学、类似 EMG 的激活)与实验人类数据的吻合程度如何?
  • RQ4重定向方法的质量对学习策略性能和生物力学保真度有何影响?
  • RQ5从通用的 MSK 策略进行微调,在数小时内就能适应新动作,而不是需要几天?

主要发现

  • MuscleMimic 实现了大规模、肌肉驱动的动作模仿,并在 CPU 方法上实现了数量级级的训练加速。
  • 单一通用策略可以在数百种动作上进行训练,覆盖 MyoFullBody(416 条肌肉)和 MyoBimanualArm(126 条肌肉),具有高成功率(约 92–99%)和较高的帧覆盖率。
  • 生物力学验证显示步行的平均关节运动学相关性约 r ≈ 0.90,奔跑约 r ≈ 0.81;关节动力学相关性较低但合理(步行跑步机数据约 ≈ 0.79)。
  • 合成肌肉激活与人类 EMG 呈正相关(大约在 0.2–0.6 的范围,覆盖不同肌肉),凸显仅通过运动学模仿难以达到生理保真度的挑战。
  • GMR-Fit 重定向在将 AMASS/Mocap 数据映射到 MSK 模型时,相较 Mocap-Body 提供更高的关节/运动学保真度,关节角度/速度误差更低,情节回报更高。
  • 对学习到的 MSK 策略进行新动作的微调通常需要显著更少的步骤(例如温和动作 < 1 亿步骤;动态动作约 10 亿步骤),远少于从零开始的训练。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。