Skip to main content
QUICK REVIEW

[论文解读] A Persona-Based Neural Conversation Model

Jiwei Li, Michel Galley|arXiv (Cornell University)|Mar 19, 2016
Topic Modeling参考文献 32被引用 181
一句话总结

引入说话者和说话对象(对话方)的人物嵌入到 Seq2Seq 对话模型中,以提升一致性与流畅性,在开放域 Twitter 与电视剧对话数据上在困惑度和 Bleu 上取得提升。

ABSTRACT

We present persona-based models for handling the issue of speaker consistency in neural response generation. A speaker model encodes personas in distributed embeddings that capture individual characteristics such as background information and speaking style. A dyadic speaker-addressee model captures properties of interactions between two interlocutors. Our models yield qualitative performance improvements in both perplexity and BLEU scores over baseline sequence-to-sequence models, with similar gains in speaker consistency as measured by human judges.

研究动机与目标

  • 在神经响应生成中解决说话者一致性问题。
  • 学习并将人物表征注入到 Seq2Seq 解码器。
  • 建模单一说话者和双人对话中的说话者–被称呼者设置,以捕捉个人风格与互动风格。

提出的方法

  • 将说话者人物编码为可训练嵌入 v_i,并在每个时间步将其注入到解码器 LSTM 中。
  • 通过构造交互向量 V_{i,j} = tanh(W1 v_i + W2 v_j) 并将其加入解码,扩展为说话者-对话对象模型。
  • 在大型对话语料库(Twitter、电视剧剧本)上端到端训练,使用反向传播。
  • 使用束搜索(B=200)进行解码,并对 N-best 列表进行重新排序,评分函数结合 p(R|M,v)、p(M|R) 以及长度惩罚。
  • 使用困惑度和 Bleu 进行评估,并进行人类判断以评估一致性。

实验结果

研究问题

  • RQ1人物嵌入能否提升开放域对话中的回应一致性和多样性?
  • RQ2说话者模型和说话者–被称呼者模型相较于非人物 Seq2Seq 基线,在困惑度和 Bleu 上是否表现更好?
  • RQ3当说话者与不同被称呼对象互动时,二元交互模型对生成有何影响?
  • RQ4解码与重新排序策略对输出质量与一致性有何影响?

主要发现

模型目标Bleu
Standard LSTMMLE0.92%
Speaker ModelMLE1.12% (+21.7%)
Standard LSTMMMI1.41%
Speaker ModelMMI1.66% (+11.7%)
  • 说话者模型在 Twitter Persona 数据集上相对于标准 Seq2Seq 将困惑度降低约 10%(困惑度 42.2 vs 47.2)。
  • 在 Twitter Persona 数据集上,Speaker Model 相比标准 Seq2Seq 在 MLE 下 Bleu 提升达到 +21.7%;在 MMI 下提升为 +11.7%。
  • 在 TV-series 数据集上,Speaker 和 Speaker-Addressee 模型相对于标准 Seq2Seq将困惑度降低约 7–8%,Bleu 提升约 10–14%。
  • 定性分析表明,Speaker Model 产生多样且具说话者特征的回应并存在一定的一致性下降,而 Speaker-Addressee 模型表现出二元互动敏感性(如个性化的被称呼对象回应)。
  • 人工评估显示,在多数比较中人物模型被评为比基线更一致(56.7% 明显更一致;在排除平局时为 6.1% 明显更一致)。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。