Skip to main content
QUICK REVIEW

[论文解读] Multi-lingual Dialogue Act Recognition with Deep Learning Methods

Jiřı́ Martı́nek, Pavel Král|arXiv (Cornell University)|Apr 11, 2019
Speech and dialogue systems参考文献 26被引用 4
一句话总结

本文提出两种基于深度学习的多语言对话行为(DA)识别方法,采用word2vec嵌入:一种在所有语言上联合训练的多语言模型,以及一种使用CCA对齐语义空间的跨语言模型。多语言模型优于跨语言方法,在Verbmobil语料库上,Bi-LSTM达到74.9%的准确率,表现出与单语系统相当的最先进性能。

ABSTRACT

This paper deals with multi-lingual dialogue act (DA) recognition. The proposed approaches are based on deep neural networks and use word2vec embeddings for word representation. Two multi-lingual models are proposed for this task. The first approach uses one general model trained on the embeddings from all available languages. The second method trains the model on a single pivot language and a linear transformation method is used to project other languages onto the pivot language. The popular convolutional neural network and LSTM architectures with different set-ups are used as classifiers. To the best of our knowledge this is the first attempt at multi-lingual DA recognition using neural networks. The multi-lingual models are validated experimentally on two languages from the Verbmobil corpus.

研究动机与目标

  • 为神经网络为基础的NLP中多语言对话行为识别方法的稀缺性提供解决方案。
  • 通过在对话系统中实现跨语言迁移学习,减少人工标注工作量。
  • 评估使用word2vec嵌入的深度神经网络在多语言DA识别中的有效性。
  • 比较多语言训练与基于CCA投影的中间语言迁移方法。
  • 评估对话历史和不同神经架构对DA识别性能的影响。

提出的方法

  • 在所有语言的对话行为标注数据合并池上训练单一多语言分类器,使用共享的word2vec嵌入。
  • 采用中间语言策略,即仅在一个语言上训练模型,其他语言通过CCA投影到其语义空间。
  • 采用两种神经架构:使用最大池化的CNN和用于序列建模的双向LSTM。
  • 以word2vec嵌入作为输入特征,并在Verbmobil语料库上进行微调实验。
  • 将对话历史作为输入上下文以提升分类性能。
  • 使用准确率和F1-score在Verbmobil语料库的英语和德语数据上评估模型。

实验结果

研究问题

  • RQ1能否使用共享的word2vec嵌入,在多语言对话行为数据上有效训练单一深度神经网络?
  • RQ2通过CCA投影将非中间语言映射到中间语言的语义空间,是否能实现有效的跨语言对话行为识别?
  • RQ3在多语言DA识别任务中,不同神经架构(CNN与Bi-LSTM)的表现如何?
  • RQ4在多大程度上,引入对话历史能提升DA识别准确率?
  • RQ5在Verbmobil语料库上,微调预训练的word2vec嵌入是否对多语言DA识别有帮助?

主要发现

  • 多语言模型在使用Bi-LSTM并结合对话历史时,F1得分为74.9%,优于跨语言方法。
  • 基于CCA投影的跨语言模型在从英语预测德语DA时,F1得分仅为34.0%,表明迁移能力有限。
  • Bi-LSTM架构在所有设置中均优于两种CNN配置,达到最高的F1得分74.9%。
  • 对话历史在几乎所有配置中均提升了性能,最佳结果出现在Bi-LSTM模型中包含历史信息时。
  • word2vec嵌入的微调未提升性能,表明预训练嵌入在此任务中已达到最优。
  • 所提出的多语言模型在Verbmobil测试集上达到最先进性能,F1得分为74.9%,与单语系统相当。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。