QUICK REVIEW

[论文解读] A Persona-Based Neural Conversation Model

Jiwei Li, Michel Galley|arXiv (Cornell University)|Mar 19, 2016

Topic Modeling参考文献 32被引用 181

一句话总结

引入说话者和说话对象（对话方）的人物嵌入到 Seq2Seq 对话模型中，以提升一致性与流畅性，在开放域 Twitter 与电视剧对话数据上在困惑度和 Bleu 上取得提升。

ABSTRACT

We present persona-based models for handling the issue of speaker consistency in neural response generation. A speaker model encodes personas in distributed embeddings that capture individual characteristics such as background information and speaking style. A dyadic speaker-addressee model captures properties of interactions between two interlocutors. Our models yield qualitative performance improvements in both perplexity and BLEU scores over baseline sequence-to-sequence models, with similar gains in speaker consistency as measured by human judges.

研究动机与目标

在神经响应生成中解决说话者一致性问题。
学习并将人物表征注入到 Seq2Seq 解码器。
建模单一说话者和双人对话中的说话者–被称呼者设置，以捕捉个人风格与互动风格。

提出的方法

将说话者人物编码为可训练嵌入 v_i，并在每个时间步将其注入到解码器 LSTM 中。
通过构造交互向量 V_{i,j} = tanh(W1 v_i + W2 v_j) 并将其加入解码，扩展为说话者-对话对象模型。
在大型对话语料库（Twitter、电视剧剧本）上端到端训练，使用反向传播。
使用束搜索（B=200）进行解码，并对 N-best 列表进行重新排序，评分函数结合 p(R|M,v)、p(M|R) 以及长度惩罚。
使用困惑度和 Bleu 进行评估，并进行人类判断以评估一致性。

实验结果

研究问题

RQ1人物嵌入能否提升开放域对话中的回应一致性和多样性？
RQ2说话者模型和说话者–被称呼者模型相较于非人物 Seq2Seq 基线，在困惑度和 Bleu 上是否表现更好？
RQ3当说话者与不同被称呼对象互动时，二元交互模型对生成有何影响？
RQ4解码与重新排序策略对输出质量与一致性有何影响？

主要发现

模型	目标	Bleu
Standard LSTM	MLE	0.92%
Speaker Model	MLE	1.12% (+21.7%)
Standard LSTM	MMI	1.41%
Speaker Model	MMI	1.66% (+11.7%)

说话者模型在 Twitter Persona 数据集上相对于标准 Seq2Seq 将困惑度降低约 10%（困惑度 42.2 vs 47.2）。
在 Twitter Persona 数据集上，Speaker Model 相比标准 Seq2Seq 在 MLE 下 Bleu 提升达到 +21.7%；在 MMI 下提升为 +11.7%。
在 TV-series 数据集上，Speaker 和 Speaker-Addressee 模型相对于标准 Seq2Seq将困惑度降低约 7–8%，Bleu 提升约 10–14%。
定性分析表明，Speaker Model 产生多样且具说话者特征的回应并存在一定的一致性下降，而 Speaker-Addressee 模型表现出二元互动敏感性（如个性化的被称呼对象回应）。
人工评估显示，在多数比较中人物模型被评为比基线更一致（56.7% 明显更一致；在排除平局时为 6.1% 明显更一致）。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。