QUICK REVIEW
[论文解读] A Persona-Based Neural Conversation Model
Jiwei Li, Michel Galley|arXiv (Cornell University)|Mar 19, 2016
Topic Modeling参考文献 32被引用 181
一句话总结
引入说话者和说话对象(对话方)的人物嵌入到 Seq2Seq 对话模型中,以提升一致性与流畅性,在开放域 Twitter 与电视剧对话数据上在困惑度和 Bleu 上取得提升。
ABSTRACT
We present persona-based models for handling the issue of speaker consistency in neural response generation. A speaker model encodes personas in distributed embeddings that capture individual characteristics such as background information and speaking style. A dyadic speaker-addressee model captures properties of interactions between two interlocutors. Our models yield qualitative performance improvements in both perplexity and BLEU scores over baseline sequence-to-sequence models, with similar gains in speaker consistency as measured by human judges.
研究动机与目标
- 在神经响应生成中解决说话者一致性问题。
- 学习并将人物表征注入到 Seq2Seq 解码器。
- 建模单一说话者和双人对话中的说话者–被称呼者设置,以捕捉个人风格与互动风格。
提出的方法
- 将说话者人物编码为可训练嵌入 v_i,并在每个时间步将其注入到解码器 LSTM 中。
- 通过构造交互向量 V_{i,j} = tanh(W1 v_i + W2 v_j) 并将其加入解码,扩展为说话者-对话对象模型。
- 在大型对话语料库(Twitter、电视剧剧本)上端到端训练,使用反向传播。
- 使用束搜索(B=200)进行解码,并对 N-best 列表进行重新排序,评分函数结合 p(R|M,v)、p(M|R) 以及长度惩罚。
- 使用困惑度和 Bleu 进行评估,并进行人类判断以评估一致性。
实验结果
研究问题
- RQ1人物嵌入能否提升开放域对话中的回应一致性和多样性?
- RQ2说话者模型和说话者–被称呼者模型相较于非人物 Seq2Seq 基线,在困惑度和 Bleu 上是否表现更好?
- RQ3当说话者与不同被称呼对象互动时,二元交互模型对生成有何影响?
- RQ4解码与重新排序策略对输出质量与一致性有何影响?
主要发现
| 模型 | 目标 | Bleu |
|---|---|---|
| Standard LSTM | MLE | 0.92% |
| Speaker Model | MLE | 1.12% (+21.7%) |
| Standard LSTM | MMI | 1.41% |
| Speaker Model | MMI | 1.66% (+11.7%) |
- 说话者模型在 Twitter Persona 数据集上相对于标准 Seq2Seq 将困惑度降低约 10%(困惑度 42.2 vs 47.2)。
- 在 Twitter Persona 数据集上,Speaker Model 相比标准 Seq2Seq 在 MLE 下 Bleu 提升达到 +21.7%;在 MMI 下提升为 +11.7%。
- 在 TV-series 数据集上,Speaker 和 Speaker-Addressee 模型相对于标准 Seq2Seq将困惑度降低约 7–8%,Bleu 提升约 10–14%。
- 定性分析表明,Speaker Model 产生多样且具说话者特征的回应并存在一定的一致性下降,而 Speaker-Addressee 模型表现出二元互动敏感性(如个性化的被称呼对象回应)。
- 人工评估显示,在多数比较中人物模型被评为比基线更一致(56.7% 明显更一致;在排除平局时为 6.1% 明显更一致)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。