Skip to main content
QUICK REVIEW

[论文解读] Semantically Conditioned LSTM-based Natural Language Generation for Spoken Dialogue Systems

Tsung-Hsien Wen, Milica Gašić|arXiv (Cornell University)|Aug 7, 2015
Speech and dialogue systems参考文献 39被引用 126
一句话总结

本文提出了一种基于语义条件LSTM的神经网络,用于对话系统中的自然语言生成,能够在未对齐的数据上进行端到端训练,无需手工规则。该模型通过交叉熵损失联合优化句子规划与表面实现,生成流畅、多样且符合人类偏好的响应,适用于多个领域。

ABSTRACT

Natural language generation (NLG) is a critical component of spoken dialogue and it has a significant impact both on usability and perceived quality. Most NLG systems in common use employ rules and heuristics and tend to generate rigid and stylised responses without the natural variation of human language. They are also not easily scaled to systems covering multiple domains and languages. This paper presents a statistical language generator based on a semantically controlled Long Short-term Memory (LSTM) structure. The LSTM generator can learn from unaligned data by jointly optimising sentence planning and surface realisation using a simple cross entropy training criterion, and language variation can be easily achieved by sampling from output candidates. With fewer heuristics, an objective evaluation in two differing test domains showed the proposed method improved performance compared to previous methods. Human judges scored the LSTM system higher on informativeness and naturalness and overall preferred it to the other systems.

研究动机与目标

  • 解决基于规则的NLG系统存在的局限性,后者生成的响应僵化、重复,且在不同领域和语言间难以扩展。
  • 通过从未对齐的言语-语义对中进行数据驱动学习,减少NLG对人工模板和启发式规则的依赖。
  • 通过深度神经架构直接从数据中学习语言变化与流畅性,提升自然语言生成质量。
  • 通过端到端训练实现可扩展、多语言且领域可适应的NLG,仅需最少的人工干预。
  • 在两个不同的对话领域中,通过客观指标与人工评估对比基线,评估模型性能。

提出的方法

  • 提出一种语义条件长短期记忆(SC-LSTM)单元,将句子规划与表面实现联合建模于单一循环架构中。
  • 在未对齐的训练数据上使用简单的交叉熵损失函数进行端到端训练,无需启发式规则或预定义模板。
  • 通过堆叠多层SC-LSTM构建深层架构,以提升表征能力与生成质量。
  • 采用反向重排序机制,利用语言模型对候选序列进行重排序,以优化生成输出的流畅性。
  • 通过从输出分布中进行随机采样生成多样化响应,自然捕捉语言变化。
  • 采用联合优化框架,使模型能直接从原始言语-语义对中学习语义到文本的映射。

实验结果

研究问题

  • RQ1基于神经网络的NLG系统在未对齐数据上进行训练,是否能在流畅性与自然度方面优于基于规则和模板的系统?
  • RQ2语义条件LSTM模型在无显式启发式规则的情况下,能在多大程度上生成语言上多样的响应?
  • RQ3所提出的端到端训练方法在客观与主观评估中,与现有统计及语料库NLG方法相比表现如何?
  • RQ4该模型是否能在不同领域(如餐厅与酒店信息)之间实现良好泛化,且仅需极少配置调整?
  • RQ5与浅层模型(sc-lstm)相比,深层架构(+deep)在自动评估与人工评估中是否显著提升生成质量?

主要发现

  • SC-LSTM模型在旧金山餐厅与酒店两个领域中,均在BLEU与ROUGE两项客观指标上表现最佳。
  • 人工评估显示,SC-LSTM系统在信息量与自然度方面显著优于基线模型,且对深层变体(+deep)有强烈偏好。
  • 在成对偏好测试中,深层SC-LSTM模型(+deep)表现出统计显著的偏好,表明其感知质量更优。
  • 模型生成了多样、流畅且上下文恰当的响应,表现为前五名输出展现出句法多样性与自然表达。
  • 该系统展现出强大的领域泛化能力,在仅需极少架构调整的情况下,即可在两个不同本体上实现高性能。
  • 由于无需启发式规则且依赖端到端训练,该系统实现了更快的开发速度,并更易于扩展至新领域与新语言。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。