QUICK REVIEW

[论文解读] Open-Domain Conversational Agents: Current Progress, Open Problems, and Future Directions

Stephen Roller, Y-Lan Boureau|arXiv (Cornell University)|Jun 22, 2020

Topic Modeling参考文献 149被引用 42

一句话总结

本立场论文概述了构建开放域对话代理的期望特征、当前进展和存在的开放问题，强调持续学习、引人入胜的内容以及良好行为，并偏向作者团队的工作。

ABSTRACT

We present our view of what is necessary to build an engaging open-domain conversational agent: covering the qualities of such an agent, the pieces of the puzzle that have been built so far, and the gaping holes we have not filled yet. We present a biased view, focusing on work done by our own group, while citing related work in each area. In particular, we discuss in detail the properties of continual learning, providing engaging content, and being well-behaved -- and how to measure success in providing them. We end with a discussion of our experience and learnings, and our recommendations to the community.

研究动机与目标

定义超越人类的开放域对话代理的长期目标，并将其与图灵式测试区分开来。
识别并界定构成吸引人的开放域聊天机器人所需的关键特征（持续学习、引人入胜的内容、举止得当）。
总结作者团队在端到端对话建模与知识整合方面的主要方法与实验。
讨论评估进展的机制以及在实际环境中部署开放域代理的实际挑战。

提出的方法

回顾并综合最近关于端到端对话模型及其组成部分（记忆、知识对接、生成与评估）的工作。
描述用于持续在线训练的数据源策略，以及静态与动态基准的使用。
讨论来自互动的反馈学习，包括自我反馈与隐式质量信号及其对强化学习的影响。
探讨通过检索和动态来源进行知识更新，并比较生成式与基于检索的方法。

实验结果

研究问题

RQ1哪些特征定义一个卓越的开放域对话代理，以及如何对其进行衡量？
RQ2在持续学习、知识更新和长期对话中的记忆方面，主要挑战与差距有哪些？
RQ3代理如何从互动信号中学习以在没有显式监督评分的情况下提升对话质量？
RQ4开放域模型在保持话题时效性的同时，应如何平衡参与性、正确性与安全性？

主要发现

持续学习需要在线训练、来自互动的学习信号，以及动态知识更新，遗忘与数据分布漂移是尚未解决的问题。
从对话反馈学习可以提高性能，但将对话特定信号与外部因素区分开来仍然具有挑战性。
生成模型在大规模预训练和解码改进的情况下可以超越检索模型，但在一致性和多样性方面仍然存在问题。
诸如控制生成（特异性、重复、提问）和非似然训练等技术在提升互动性、减少非理想输出方面具有潜力。
记忆、推理和常识仍是主要鸿沟；当前方法通常依赖短期历史和检索，而非长期、整合的知识。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。