[论文解读] Modeling Human Temporal Uncertainty in Human-Agent Teams
本文提出了一种基于网络的协作包装游戏,用于建模人机团队中的时间不确定性。利用亚马逊 Mechanical Turk 上 100 名众包工作者的数据,研究发现对人类时间变异性的拟合效果最佳的是对数正态分布,其在个体订单和整体任务持续时间方面均优于其他重尾和轻尾分布。
A Probabilistic Simple Temporal Network (PSTN) is a formalism for representing and reasoning about actions subject to temporal constraints, where some action durations may be uncontrollable, modeled using continuous probability density functions. Recent work aims to manage this kind of uncertainty during execution by approximating a PSTN by a Simple Temporal Network with Uncertainty (STNU) (for which well-known execution strategies exist) and using an STNU execution strategy to execute the PSTN, hoping that its probabilistic action durations will not cause any constraint violations. This paper presents significant improvements to the robust execution of PSTNs. Our approach is based on a recent, faster algorithm for finding negative cycles in non-DC STNUs. We also formally prove that many of the constraints included in others' work are unnecessary and that our algorithm can take advantage of a flexible real-time execution algorithm to react to observations of contingent durations that may fall outside the fixed STNU bounds. The paper presents an empirical evaluation of our approach that provides evidence of its effectiveness in robustly executing PSTNs derived from a publicly available benchmark.
研究动机与目标
- 解决自动化机器人调度中人类时间不确定性的建模空白。
- 设计一种可扩展的在线人机协作任务,以捕捉精确的时间数据。
- 通过实证方法评估哪种概率分布最能拟合团队合作中的人类动作时间。
- 为未来提升人机协作流畅性的自动化调度策略提供依据。
提出的方法
- 开发了一款基于浏览器的协作包装游戏,模拟履行中心的工作流程。
- 通过内部计时器记录单个动作的持续时间及整体任务的完成时间。
- 通过亚马逊 Mechanical Turk 招募 100 名参与者,在受控条件下完成游戏。
- 收集了三轮连续订单的时间数据,包括机器人配送延迟和人类取货延迟。
- 使用拟合优度检验,将实测数据与标准概率分布(如正态分布、指数分布、对数正态分布、威布尔分布、伽马分布)进行拟合。
- 使用统计评估方法(如 AIC、BIC、Kolmogorov-Smirnov 检验)比较微粒级和宏观时间层级上的模型表现。
实验结果
研究问题
- RQ1哪种概率分布最能拟合协作式人机任务中的人类时间不确定性?
- RQ2人类时间变异性在单个任务订单与完整交互过程之间有何差异?
- RQ3同一分布是否能有效拟合学习效应和重复交互中的人类时间?
- RQ4在线游戏中获得的精确时间数据如何用于改进自动化调度以提升人机协作流畅性?
- RQ5对数正态分布是否在多样化的人机交互场景中均能稳健地建模人类时间?
主要发现
- 对数正态分布对所有测试分布的人类时间数据均提供了最佳拟合,依据 AIC、BIC 和 Kolmogorov-Smirnov 检验结果。
- 对数正态模型在拟合单个订单持续时间与总任务持续时间方面,均优于其他重尾分布(如威布尔分布、伽马分布)和轻尾分布(如正态分布、指数分布)。
- 在学习效应影响下,对数正态分布的拟合依然稳健,表明其在重复交互中表现一致。
- 该模型在微观(单个订单)和宏观(整个任务)两个层面均表现出高精度,表明其适用于动态调度系统。
- 研究结果支持在实时机器人调度中使用对数正态分布来表示人类时间不确定性,以提升协作流畅性。
- 该实验框架可实现可扩展、精确的时间与流畅性指标测量,为未来人机交互研究提供支持。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。