[论文解读] On the use of expectations for detecting and repairing human-machine miscommunication
本文在 DIALOGOS 语音对话系统中提出了一种双重期望机制,用于检测和修复人机沟通中的误解:通过预测来预判用户输入,并利用基于语用的期望来追踪话语连贯性。通过结合两者,系统提升了对用户发起的修复的检测能力,并在对新手用户的实地测试中实现了 84% 的事务成功率。
In this paper I describe how miscommunication problems are dealt with in the spoken language system DIALOGOS. The dialogue module of the system exploits dialogic expectations in a twofold way: to model what future user utterance might be about (predictions), and to account how the user's next utterance may be related to previous ones in the ongoing interaction (pragmatic-based expectations). The analysis starts from the hypothesis that the occurrence of miscommunication is concomitant with two pragmatic phenomena: the deviation of the user from the expected behaviour and the generation of a conversational implicature. A preliminary evaluation of a large amount of interactions between subjects and DIALOGOS shows that the system performance is enhanced by the uses of both predictions and pragmatic-based expectations.
研究动机与目标
- 解决语音人机对话系统中检测和修复误解的挑战。
- 研究用户行为偏离预期和会话含义如何表征误解。
- 通过整合预测性期望与语用性期望,提升系统的鲁棒性。
- 通过认知与话语建模,改进任务导向型语音语言系统中的对话管理。
提出的方法
- 基于格里森会话准则(Gricean conversational maxims)并针对人机交互进行调整,对用户期望进行建模,包括相关性、数量和真实性。
- 基于对话上下文实施预测,以预判用户下一句的发言主题。
- 使用分层上下文结构(上下文层级)来追踪焦点转移并维持话语连贯性。
- 当用户发言偏离预测并产生会话含义时,检测误解。
- 当通过语用期望违背检测到不一致时,启动修复子对话。
- 利用集成预测与语用期望机制的对话模块,指导理解与响应生成。
实验结果
研究问题
- RQ1在语音对话系统中,用户行为偏离预测在多大程度上可作为误解的信号?
- RQ2会话含义在用户交互过程中检测系统错误时发挥什么作用?
- RQ3基于语用的期望如何提升对用户发起修复的检测能力?
- RQ4将预测与语用期望相结合,在真实世界语音对话应用中在多大程度上提升了系统性能?
主要发现
- 将预测性期望与语用性期望相结合,显著提升了系统检测和响应误解的能力。
- 当系统通过语用期望追踪话语连贯性时,对用户发起修复的检测更加可靠。
- DIALOGOS 系统在包含 923 次对话的实地测试中,实现了 84% 的事务成功率。
- 系统通过识别用户行为偏离预期并启动适当的修复子对话,成功处理了识别错误。
- 上下文层级模型通过将话语与适当的先前焦点关联,有效支持理解,增强了语义一致性。
- 基于 923 次对话的实证数据表明,语用期望在真实世界语音对话应用的鲁棒性中发挥了实质性作用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。