[论文解读] Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memory
ECM 生成开放域对话的回复,不仅相关且语法正确,而且在情感上也具有连贯性,方法是将情感类别嵌入、内部情感记忆和外部情感词汇记忆整合到序列到序列框架中。
Perception and expression of emotion are key factors to the success of dialogue systems or conversational agents. However, this problem has not been studied in large-scale conversation generation so far. In this paper, we propose Emotional Chatting Machine (ECM) that can generate appropriate responses not only in content (relevant and grammatical) but also in emotion (emotionally consistent). To the best of our knowledge, this is the first work that addresses the emotion factor in large-scale conversation generation. ECM addresses the factor using three new mechanisms that respectively (1) models the high-level abstraction of emotion expressions by embedding emotion categories, (2) captures the change of implicit internal emotion states, and (3) uses explicit emotion expressions with an external emotion vocabulary. Experiments show that the proposed model can generate responses appropriate not only in content but also in emotion.
研究动机与目标
- 解决在大规模对话生成中引入情感的挑战。
- 开发一个端到端的神经模型,产生内容合适且情感一致的回复。
- 引入三种机制——情感类别嵌入、内部情感记忆和外部情感记忆——以控制情感表达。
- 在为大规模训练自动标注的情感标注数据上进行训练。
- 评估情感感知生成是否同时提升内容质量和情感准确性。
提出的方法
- 将编码器-解码器序列到序列模型扩展为使用 GRU,以在情感类别 e 条件下处理输入 X 并生成响应 Y。
- 将情感类别向量 v_e 嵌入并与上下文 c_t 以及前一词嵌入 e(y_{t-1}) 一起注入解码器。
- 引入一个内部记忆 M^I_e,t,带有读写门,以在解码过程中建模动态情感状态,并确保在生成结束时衰减至零。
- 添加一个外部情感记忆,包含单独的情感词汇表和一个类型选择器 alpha_t,用于在情感与通用词生成之间加权,从而实现显式情感表达。
- 使用一个损失函数进行训练,该损失将标记预测的交叉熵、情感/通用词选择的监督,以及一个正则化项以确保内部情感衰减相结合。
- 通过在 NLPCC 数据上训练情感分类器来给一个大型基于 STC 的语料库 (ESTC) 标注六个情感类别,然后在 (post, response, emotion) 三元组上训练 ECM。
实验结果
研究问题
- RQ1在给定指定情感类别的情况下,神经编码器-解码器框架是否能够生成内容恰当且情感连贯的回复?
- RQ2情感类别嵌入、内部记忆和外部记忆是否比基线的 seq2seq 模型在情感准确性和回复自然性方面有所提升?
- RQ3对所提出的记忆模块和情感词汇表的消融实验如何影响困惑度和情感准确性?
- RQ4通过外部记忆进行显式情感词生成是否有助于产生可识别的情感表达?
主要发现
- ECM 在情感准确性(0.773)上超过基线和变体,表明情感表达能力提升。
- ECM 的困惑度(65.9)优于 Seq2Seq,但略低于 Emb 基线,反映了对内容和情感生成的双重监督。
- 消融实验显示外部记忆对情感准确性提升最大,内部记忆有助于平衡语法和情感,而移除外部记忆会降低情感表达。
- 人工评估显示 ECM 在 Content 和 Emotion 分数上均高于 Seq2Seq 和 Emb,在成对测试中对 ECM 有明显偏好。
- ECM 展示了在多样情感类别条件下生成回复的能力,显式情感词有助于增强表达力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。