Skip to main content
QUICK REVIEW

[论文解读] DexTac: Learning Contact-aware Visuotactile Policies via Hand-by-hand Teaching

Xingyu Zhang, Chaofan Zhang|arXiv (Cornell University)|Jan 29, 2026
Tactile and Sensory Interactions被引用 0
一句话总结

DexTac 将手把手的运动知觉演示与多维视触觉传感结合,学习预测力和接触区域(CoP)的接触感知策略,以实现灵巧操作,特别在注射任务中取得高成功率。它展示了强泛化和数据效率,且触觉控制器实现接触感知执行。

ABSTRACT

For contact-intensive tasks, the ability to generate policies that produce comprehensive tactile-aware motions is essential. However, existing data collection and skill learning systems for dexterous manipulation often suffer from low-dimensional tactile information. To address this limitation, we propose DexTac, a visuo-tactile manipulation learning framework based on kinesthetic teaching. DexTac captures multi-dimensional tactile data-including contact force distributions and spatial contact regions-directly from human demonstrations. By integrating these rich tactile modalities into a policy network, the resulting contact-aware agent enables a dexterous hand to autonomously select and maintain optimal contact regions during complex interactions. We evaluate our framework on a challenging unimanual injection task. Experimental results demonstrate that DexTac achieves a 91.67% success rate. Notably, in high-precision scenarios involving small-scale syringes, our approach outperforms force-only baselines by 31.67%. These results underscore that learning multi-dimensional tactile priors from human demonstrations is critical for achieving robust, human-like dexterous manipulation in contact-rich environments.

研究动机与目标

  • 提供高质量的多模态专家演示,捕捉关节状态、RGB 视觉和触觉数据(包括接触区域信息)。
  • 学习一个接触感知策略,在灵巧操作中同时预测力和接触区域(CoP)。
  • 部署一个将策略预测与触觉线索结合的触觉控制器,实时控制手指力和接触区域。
  • 在具挑战性的一手注射任务中展示更高的成功率,并显示对未见注射器尺寸的泛化能力。

提出的方法

  • 通过手把手的运动教练来收集多模态专家数据,使用指尖护套遮挡人手以减少域偏移。
  • 捕捉RGB图像、GelStereo BioTip 传感器的触觉图像、关节状态,以及每个指尖的作用力与压力中心(CoP)。
  • 训练基于 ACT 的策略网络,将多模态状态映射到动作块,包括关节变化、触觉力和 CoP。
  • 引入潜在变量 z,并带有 KL 散度项以正则化策略潜在空间并实现序列级规划。
  • 部署带有触觉控制器的系统,使用预测的力和 CoP 来调整受力的位参考,从而实现接触感知的运动。
  • 将策略学习公式化为不完美模仿学习,损失在动作块上最小化 L1 误差,并包含 KL 正则化项。

实验结果

研究问题

  • RQ1将触觉信息,尤其是 CoP,纳入是否能提升注射任务中的灵巧操作性能?
  • RQ2接触感知策略对未见注射器尺寸的零-shot 泛化能力如何?
  • RQ3随着演示数据量增加,性能如何扩展(数据效率)?

主要发现

  • DexTac 在不同尺寸的注射器上平均成功率为 91.67%,比仅力的基线高出 31.67%。
  • 对 20 mL 注射器实现零-shot 转移,成功率为 65%,显示强泛化能力。
  • 消融实验表明去除触觉传感或 CoP 会降低性能,而触觉+CoP 组合获得最高的成功率。
  • 数据效率显示随着演示增多,性能提升,约在每个尺寸 30 次演示时趋于稳定。
  • 纯粹的触觉实验表明在动态抓握与推拉任务中视觉有帮助,而在持续接触情形中可用最少视觉输入实现。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。