[论文解读] Towards Robotic Assembly by Predicting Robust, Precise and Task-oriented Grasps.
本文提出一种级联深度学习方法,通过联合优化抓取鲁棒性、精度和任务性能,实现机器人装配中稳健、精确且面向任务的抓取。该方法在自监督模拟环境中,通过程序化生成物体进行课程学习训练,实现在真实世界齿轮和支架装配任务中分别达到1.44mm和4.28mm的插入误差。
Robust task-oriented grasp planning is vital for autonomous robotic precision assembly tasks. Knowledge of the objects' geometry and preconditions of the target task should be incorporated when determining the proper grasp to execute. However, several factors contribute to the challenges of realizing these grasps such as noise when controlling the robot, unknown object properties, and difficulties modeling complex object-object interactions. We propose a method that decomposes this problem and optimizes for grasp robustness, precision, and task performance by learning three cascaded networks. We evaluate our method in simulation on three common assembly tasks: inserting gears onto pegs, aligning brackets into corners, and inserting shapes into slots. Our policies are trained using a curriculum based on large-scale self-supervised grasp simulations with procedurally generated objects. Finally, we evaluate the performance of the first two tasks with a real robot where our method achieves 4.28mm error for bracket insertion and 1.44mm error for gear insertion.
研究动机与目标
- 解决在不确定性条件下进行机器人装配时,规划稳健、精确且面向任务的抓取的挑战。
- 在机器人控制存在噪声和物体属性未知的情况下,将物体几何形状和任务先决条件整合到抓取规划中。
- 提升在精密装配任务中常见的复杂物体-物体交互场景下的性能。
- 开发一种可扩展的自监督训练流程,利用程序化物体生成实现可泛化的抓取策略。
提出的方法
- 该方法采用三个级联的神经网络,将抓取规划分解为鲁棒性、精度和任务性能优化三个阶段。
- 抓取策略通过基于课程学习的方法,在大规模自监督模拟环境中进行训练,对象为程序化生成的物体。
- 该框架引入几何先验和任务特定先验,以指导抓取选择并提升泛化能力。
- 系统在模拟环境中对三个装配任务进行了评估:齿轮销插入、支架角对齐和形状槽插入。
- 在真实世界中对两个任务进行了部署,以验证在真实条件下的性能表现。
- 该方法同时优化抓取质量和任务成功率,确保与最终装配目标的一致性。
实验结果
研究问题
- RQ1如何改进机器人抓取规划,以在装配任务中同时确保鲁棒性、精度和面向任务的性能?
- RQ2自监督模拟结合程序化物体生成在多大程度上能够实现向真实世界机器人装配任务的泛化?
- RQ3级联神经网络能否有效分解并优化复杂交互中的多个抓取质量标准?
- RQ4在模拟数据上采用课程学习如何提升策略的泛化能力,并促进在精密装配任务中的真实世界迁移?
- RQ5使用学习得到的、面向任务的抓取策略,在真实世界机器人装配中可达到何种精度水平?
主要发现
- 该方法在真实世界齿轮销插入任务中实现了1.44mm的插入误差,表现出高精度。
- 在支架角对齐任务中,该方法实现了4.28mm的误差,表明其在复杂对齐任务中表现优异。
- 级联网络架构有效实现了对鲁棒性、精度和任务性能的同步分解与优化。
- 通过程序化生成物体的自监督训练,实现了无需人工标注数据的有效策略学习。
- 基于课程学习的训练策略提升了策略泛化能力,成功实现在两个不同装配任务的真实世界部署。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。