[论文解读] Plan Explicability and Predictability for Robot Task Planning
本文引入了计划可解释性与可预测性作为机器人任务规划的度量指标,以增强人类的理解与信任。通过条件随机场(CRFs),该方法学习人类对动作的标签模式,将其映射为抽象任务,使机器人能够生成更易理解且可预测的计划。评估结果表明,与标准规划器相比,可解释性提高了25%,且人类评分显著更高。
Intelligent robots and machines are becoming pervasive in human populated environments. A desirable capability of these agents is to respond to goal-oriented commands by autonomously constructing task plans. However, such autonomy can add significant cognitive load and potentially introduce safety risks to humans when agents behave unexpectedly. Hence, for such agents to be helpful, one important requirement is for them to synthesize plans that can be easily understood by humans. While there exists previous work that studied socially acceptable robots that interact with humans in "natural ways", and work that investigated legible motion planning, there lacks a general solution for high level task planning. To address this issue, we introduce the notions of plan {\it explicability} and {\it predictability}. To compute these measures, first, we postulate that humans understand agent plans by associating abstract tasks with agent actions, which can be considered as a labeling process. We learn the labeling scheme of humans for agent plans from training examples using conditional random fields (CRFs). Then, we use the learned model to label a new plan to compute its explicability and predictability. These measures can be used by agents to proactively choose or directly synthesize plans that are more explicable and predictable to humans. We provide evaluations on a synthetic domain and with human subjects using physical robots to show the effectiveness of our approach
研究动机与目标
- 解决缺乏通用的高层任务规划方法,以提升人类可理解性的问题。
- 降低因人类居住环境中机器人行为难以理解而引发的认知负荷与安全风险。
- 通过任务-动作标签建模人类对机器人计划的解读方式,使机器人能够生成更具可解释性与可预测性的计划。
- 开发一种基于学习的方法,无需预先了解人类心理模型,即可推断人类对机器人动作的解读。
- 通过仿真与真人实验(使用实体机器人)对方法进行实证评估,证明了计划可理解性的提升。
提出的方法
- 本文将人类对机器人计划的理解建模为一种标签化过程,其中动作被关联到抽象任务(例如:'拿起杯子')。
- 使用人类标注的示例训练条件随机场(CRFs),以学习人类将动作映射到任务的标签方案。
- 可解释性通过成功标注为有意义任务的动作所占比例来计算,使用学习到的CRF模型。
- 可预测性通过任务转换的序列连贯性来衡量,反映从先前任务预测下一个任务的难易程度。
- 该框架将可解释性与可预测性整合进规划过程,使规划器能够优先选择更具可解释性的计划。
- 通过合成仿真与真实世界的人类实验(使用实体机器人)对方法进行评估,采用基于视频的标签与主观评分。
实验结果
研究问题
- RQ1我们能否以反映人类对机器人任务计划理解的方式,定义并度量计划的可解释性与可预测性?
- RQ2在不了解人类心理模型的前提下,如何学习人类将动作与抽象任务关联的标签方案?
- RQ3机器人能否在保持计划质量的同时,生成显著更具可解释性与可预测性的计划?
- RQ4人类受试者在多大程度上更倾向于评价具有可解释性感知的规划所生成的计划,而非标准规划?
- RQ5所提出的可解释性度量是否与人类对计划可理解性的主观判断具有相关性?
主要发现
- FF-EXPD规划器的可解释动作比例达到97.3%,而OPT规划器为77.8%,表明在动作-任务标签方面有显著提升。
- FF-EXPD的平均可解释性得分为0.98,显著高于OPT的0.78,配对t检验的p值 < 0.001。
- 人类受试者对FF-EXPD计划的平均评分为9.65分(满分10分),而OPT为6.92分,显示出强烈的主观偏好。
- FF-EXPD与OPT的Cronbach’s α值分别为0.78和0.67,表明人类标签与评分具有可靠的内部一致性。
- 结果证实,所提出的可解释性度量与人类解读及主观可理解性高度一致。
- 该方法在未见过的问题上也表现出良好的泛化能力,已在8个不同塔高设置的测试场景中得到验证。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。