Skip to main content
QUICK REVIEW

[论文解读] Learning to Select Knowledge for Response Generation in Dialog Systems

Rongzhong Lian, Min Xie|arXiv (Cornell University)|Feb 13, 2019
Topic Modeling参考文献 21被引用 23
一句话总结

本文提出了一种新颖的端到端神经模型,通过联合学习知识的先验(仅话语)和后验(话语与回应)分布,提升了对话系统中的响应生成质量。在训练过程中,通过最小化这两个分布之间的KL散度,模型即使在推理阶段没有真实回应的情况下,也能学习到合适的知识,从而在Persona-Chat和Wizard-of-Wikipedia数据集上的自动评估与人工评估中均显著优于基线模型。

ABSTRACT

End-to-end neural models for intelligent dialogue systems suffer from the problem of generating uninformative responses. Various methods were proposed to generate more informative responses by leveraging external knowledge. However, few previous work has focused on selecting appropriate knowledge in the learning process. The inappropriate selection of knowledge could prohibit the model from learning to make full use of the knowledge. Motivated by this, we propose an end-to-end neural model which employs a novel knowledge selection mechanism where both prior and posterior distributions over knowledge are used to facilitate knowledge selection. Specifically, a posterior distribution over knowledge is inferred from both utterances and responses, and it ensures the appropriate selection of knowledge during the training process. Meanwhile, a prior distribution, which is inferred from utterances only, is used to approximate the posterior distribution so that appropriate knowledge can be selected even without responses during the inference process. Compared with the previous work, our model can better incorporate appropriate knowledge in response generation. Experiments on both automatic and human evaluation verify the superiority of our model over previous baselines.

研究动机与目标

  • 为解决现有端到端对话模型在生成信息量不足的响应时的局限性,通过引入外部知识来改进。
  • 克服训练过程中知识选择不当的挑战,即模型仅依赖话语驱动的先验分布而缺乏回应引导。
  • 弥合先验与后验知识分布之间的差异,实现在推理阶段无需真实回应即可实现准确的知识选择。
  • 通过显式建模真实回应中使用知识的分布,提升响应的相关性与信息量。

提出的方法

  • 模型在训练期间从输入话语和真实回应中推断出知识的后验分布。
  • 仅从话语中学习知识的先验分布,从而在推理阶段无需回应信息即可实现知识选择。
  • 通过最小化先验与后验分布之间的KL散度,确保先验近似后验,从而引导有效知识选择。
  • 通过从先验分布中进行可微采样实现知识选择,随后通过拼接或逐元素融合的方式与响应生成网络结合。
  • 将该框架集成到序列到序列架构中,并在Persona-Chat和Wizard-of-Wikipedia数据集上进行评估。
  • 通过将其应用于SOTA的基于Transformer的模型LIC,进一步验证了方法的有效性,结果显示知识检索指标持续提升。

实验结果

研究问题

  • RQ1建模先验与后验知识分布是否能提升对话系统中的知识选择能力?
  • RQ2先验与后验知识分布之间的差异如何影响知识选择与响应生成?
  • RQ3仅使用先验信息训练以近似后验的模型,能否在推理阶段有效泛化?
  • RQ4联合学习先验与后验分布是否能生成更具信息量与相关性的响应?

主要发现

  • 与基线方法相比,该模型在Persona-Chat数据集上的知识检索F1分数实现了三倍提升。
  • 人工评估显示,该模型生成的响应在信息量和上下文相关性方面显著优于基线模型。
  • 该模型在正确选择知识并有意义地融入响应方面,优于强基线模型如MemNet和LIC。
  • 在Wizard-of-Wikipedia数据集上,该模型生成的响应更具连贯性与知识依托性,相关性与多样性均得到提升。
  • 将知识选择机制集成到LIC Transformer模型中,显著提升了困惑度与知识检索指标。
  • 消融实验证实,先验与后验分布的联合使用至关重要,移除任一组件均导致性能下降。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。