Skip to main content
QUICK REVIEW

[论文解读] SlugBot: Developing a Computational Model and Framework of a Novel Dialogue Genre

Kevin K. Bowden, Jiaqi Wu|arXiv (Cornell University)|Jan 1, 2018
Topic Modeling参考文献 36被引用 11
一句话总结

本文提出了话语关系对话模型(DRDM),这是一种新颖的计算框架,用于社交机器人(如SlugBot)在开放领域中的多轮对话,利用宾州话语树库关系(如EXPANSION、CONTINGENCY)来构建连贯、由系统发起的对话。该模型通过模块化架构实现,结合领域特定的知识图谱UniSlug,实现了高质量、主题丰富的互动,平均可维持超过8轮对话,显著提升用户参与度。

ABSTRACT

One of the most interesting aspects of the Amazon Alexa Prize competition is that the framing of the competition requires the development of new computational models of dialogue and its structure. Traditional computational models of dialogue are of two types: (1) task-oriented dialogue, supported by AI planning models,or simplified planning models consisting of frames with slots to be filled; or (2)search-oriented dialogue where every user turn is treated as a search query that may elaborate and extend current search results. Alexa Prize dialogue systems such as SlugBot must support conversational capabilities that go beyond what these traditional models can do. Moreover, while traditional dialogue systems rely on theoretical computational models, there are no existing computational theories that circumscribe the expected system and user behaviors in the intended conversational genre of the Alexa Prize Bots. This paper describes how UCSC's SlugBot team has combined the development of a novel computational theoretical model, Discourse Relation Dialogue Model, with its implementation in a modular system in order to test and refine it. We highlight how our novel dialogue model has led us to create a novel ontological resource, UniSlug, and how the structure of UniSlug determine show we curate and structure content so that our dialogue manager implements and tests our novel computational dialogue model.

研究动机与目标

  • 开发一种新型对话计算模型,支持超越传统任务导向或搜索导向框架的开放领域多轮对话。
  • 解决Alexa Prize对话类型缺乏理论与计算模型的问题,该类型要求持续、吸引人且连贯的开放领域互动。
  • 设计一种可扩展的对话系统架构,通过基于正式话语关系的语篇连贯性,支持系统发起的对话。
  • 构建一个领域特定的知识库UniSlug,以支持对话策略选择与多样化主题的内容结构化。
  • 评估系统发起对话策略在真实对话环境中维持用户参与度与语篇连贯性的有效性。

提出的方法

  • 提出话语关系对话模型(DRDM),利用宾州话语树库中的四种高层话语关系(EXPANSION、COMPARISON、CONTINGENCY、TEMPORAL)来建模对话连贯性。
  • 构建模块化对话系统架构,其中对话管理由话语关系驱动,基于语义与关系内容实现系统发起的对话轮次。
  • 开发UniSlug,一个大规模集成本体,整合多个模式源,以表示世界知识并支持话语感知的对话策略。
  • 采用基于流程的对话管理机制,将内容组织为特定主题、可重用的对话流程,以支持持续且吸引人的互动。
  • 使用基于强化学习的重排序模型,基于用户反馈进行训练,以优化响应选择并实时提升对话质量。
  • 实现基于模板的生成系统,以实现高控制力与个性化;同时探索序列到序列模型(如使用Transformer的Slug2Slug)用于生成式响应,但最终因数据量不足与鲁棒性限制而选择保留模板方法。

实验结果

研究问题

  • RQ1如何设计一种计算对话模型,以支持超越任务导向或搜索导向框架的开放领域多轮对话?
  • RQ2在系统发起的对话中,哪些话语关系最有效地维持连贯性与用户参与度?
  • RQ3如何构建并利用大规模领域特定知识图谱,以支持动态、连贯的对话策略?
  • RQ4与用户发起或检索式方法相比,系统发起对话策略在多大程度上能维持用户参与度并延长对话时长?
  • RQ5如何建模用户情绪状态与幸福感,并以何种方式回应,以增强对话的亲密感与满意度?

主要发现

  • SlugBot中的系统发起模块生成的响应,平均可维持超过8轮用户对话,显著优于用户发起或检索式策略。
  • 负责涵盖42个主题的通用闲聊的流程管理器,平均每场对话用户参与度达8.1轮,平均得分3.35,表明在维持开放领域对话方面表现优异。
  • 检索式与用户发起策略在每场唯一对话中使用时间不足1.4轮,表明其在维持长对话方面效果有限。
  • 使用UniSlug——一个经过精心整理的集成本体——使在新闻、电影、科技等多样化主题上实现了内容结构化与一致连贯的对话。
  • 尽管训练了基于Transformer的序列到序列模型(Slug2Slug),团队仍选择保留模板生成方法,原因在于数据不足与鲁棒性问题,凸显了端到端生成模型在开放领域对话中的当前局限性。
  • 将强化学习与用户反馈结合,提升了响应排序效果,表明自适应、反馈驱动的对话策略可显著提升真实场景下的系统性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。