[论文解读] Active inference body perception and action for humanoid robots
该论文首次在真实人形机器人(iCub)上实现了基于自由能原理的主动推理身体感知与动作模型,通过最小化预测与观测感官输入(视觉与本体感觉)之间的预测误差,实现对感知与动作的自适应、闭环控制。该模型在传感器噪声和模型偏差条件下表现出色,相较于经典逆运动学方法,在精度和鲁棒性方面表现更优,同时保持了较低的计算成本。
Providing artificial agents with the same computational models of biological systems is a way to understand how intelligent behaviours may emerge. We present an active inference body perception and action model working for the first time in a humanoid robot. The model relies on the free energy principle proposed for the brain, where both perception and action goal is to minimise the prediction error through gradient descent on the variational free energy bound. The body state (latent variable) is inferred by minimising the difference between the observed (visual and proprioceptive) sensor values and the predicted ones. Simultaneously, the action makes sensory data sampling to better correspond to the prediction made by the inner model. We formalised and implemented the algorithm on the iCub robot and tested in 2D and 3D visual spaces for online adaptation to visual changes, sensory noise and discrepancies between the model and the real robot. We also compared our approach with classical inverse kinematics in a reaching task, analysing the suitability of such a neuroscience-inspired approach for real-world interaction. The algorithm gave the robot adaptive body perception and upper body reaching with head object tracking (toddler-like), and was able to incorporate visual features online (in a closed-loop manner) without increasing the computational complexity. Moreover, our model predicted involuntary actions in the presence of sensorimotor conflicts showing the path for a potential proof of active inference in humans.
研究动机与目标
- 在人形机器人中实现基于神经科学启发的主动推理框架,用于实时身体感知与动作。
- 通过在iCub机器人上验证模型,弥合自由能原理的理论与实际机器人技术之间的鸿沟。
- 展示一种自适应、闭环的感官融合方法,能够在保持低计算复杂度的同时处理传感器噪声与模型-执行器偏差。
- 在真实世界的抓取任务中,将主动推理方法与经典逆运动学进行对比。
- 探索主动推理在建模不自主运动反应(如橡胶手错觉等感觉运动冲突现象)中的潜力。
提出的方法
- 该模型通过变分自由能最小化,推断机器人的潜在身体状态(如关节角度),以减少观测与预测感官输入之间的预测误差。
- 通过在变分自由能界上进行梯度下降来更新感知,以贝叶斯式推理过程整合视觉与本体感觉信号。
- 动作作为对预测误差的反射性响应生成,通过优化相同的自由能泛函以减少感官意外性。
- 算法采用速度控制、时间离散化框架实现,以简化动作计算并确保实时性能。
- 感官预测的生成模型源自前向运动学,实现在不增加计算负载的前提下在线自适应。
- 通过向自由能求和中添加新的感官项,该框架支持模态无关的扩展,实现灵活的感官融合。
实验结果
研究问题
- RQ1基于自由能原理的主动推理能否在真实人形机器人中实现鲁棒、自适应的身体感知与动作?
- RQ2当存在高感官噪声以及机器人模型与真实本体动力学存在偏差时,该模型表现如何?
- RQ3主动推理框架是否能在抓取精度与适应性方面超越经典逆运动学?
- RQ4该模型是否能预测在感觉运动冲突场景(如橡胶手错觉)中的不自主运动反应?
- RQ5能否在不增加计算复杂度的前提下,以闭环方式在线整合感官特征?
主要发现
- 主动推理模型使iCub机器人能够在实时条件下,于二维与三维视觉空间中实现自适应的上肢抓取与头部目标跟踪。
- 该算法在传感器噪声与模型偏差条件下,抓取精度高于经典逆运动学方法。
- 即使在以闭环方式整合新视觉特征时,模型仍保持恒定的计算复杂度。
- 在感觉运动冲突场景中,系统表现出对视觉刺激的不自主运动,与橡胶手错觉的预测一致。
- 当预测误差被最小化时,系统收敛至平衡点(如手-物体接触点),表明行为具有稳定性和目标导向性。
- 通过自由能优化,模型成功减少了内部模型与真实观测之间的差异,展现出对不确定性与模型偏差的鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。