[论文解读] EmoGraph: Capturing Emotion Correlations using Graph Networks
EmoGraph 提出了一种图神经网络框架,通过多标签情绪数据集中的共现统计信息建模情绪之间的相互关联,从而在分类中捕捉情绪间的非对称依赖关系,提升情绪识别性能,尤其在低资源情绪上表现显著,实现了多标签和单标签情绪分类任务的最先进性能,宏F1指标大幅提升,特别是对罕见情绪如“surprise”和“trust”。
Most emotion recognition methods tackle the emotion understanding task by considering individual emotion independently while ignoring their fuzziness nature and the interconnections among them. In this paper, we explore how emotion correlations can be captured and help different classification tasks. We propose EmoGraph that captures the dependencies among different emotions through graph networks. These graphs are constructed by leveraging the co-occurrence statistics among different emotion categories. Empirical results on two multi-label classification datasets demonstrate that EmoGraph outperforms strong baselines, especially for macro-F1. An additional experiment illustrates the captured emotion correlations can also benefit a single-label classification task.
研究动机与目标
- 解决现有情绪识别模型将情绪独立处理、忽略其内在相互依赖关系和模糊关系的局限性。
- 探索如何捕捉并利用情绪关联,以提升多标签和单标签情绪识别任务中的分类性能。
- 利用真实数据集中的情绪共现统计信息,而非依赖对称或预设的情绪结构,建模非对称情绪依赖关系。
- 通过与高资源情绪(如“joy”和“optimism”)的结构化关系,提升对低资源情绪(如“surprise”和“trust”)的分类性能。
- 证明所学习的情绪关联在多标签任务之外的泛化能力,可扩展至单标签分类任务。
提出的方法
- 每个情绪在图中表示为一个节点,边的权重通过归一化的共现统计信息确定,以反映情绪对之间的非对称依赖关系。
- 使用 M_i,i 对共现矩阵 M 进行归一化,以编码一个情绪给定另一个情绪的条件概率,捕捉方向性相关性。
- 应用图神经网络(GNN),特别是 GCN 和 GAT,聚合情绪节点的邻域信息,学习每个情绪的上下文表示。
- 模型集成预训练编码器(如 BERT 或带注意力的 LSTM)对输入文本进行编码,随后通过 GNN 层利用图结构依赖关系优化情绪表示。
- 最终分类头端到端训练,以预测多标签或单标签情绪输出,所有情绪类别共享参数,以提升泛化能力。
- 图结构基于真实数据统计构建,而非理论模型,确保与真实文本中情绪表达模式的实证相关性。
实验结果
研究问题
- RQ1通过图网络建模情绪间关联是否能提升多标签情绪分类性能,尤其是在低资源情绪上?
- RQ2情绪之间的非对称共现统计信息与对称或预设情绪结构相比,在捕捉有意义的情绪依赖关系方面表现如何?
- RQ3从多标签数据集中学习到的情绪关联在多大程度上能泛化到单标签情绪分类任务中?
- RQ4引入图学习的依赖关系是否能为罕见情绪(如“surprise”和“trust”)带来更鲁棒的表示?
- RQ5不同 GNN 架构(GCN 与 GAT)在捕捉情绪关联及提升宏F1等分类指标方面表现如何?
主要发现
- EmoGraph 在 SemEval-2018 多标签情绪分类数据集上优于强基线模型,相比 BERT 提升 3.1% 宏F1,相比 DATN 提升 2.5%。
- 模型在低资源情绪上取得最显著提升:'surprise' 的 F1 从 BERT 的 18.7% 提升至 BERT-GAT 的 31.9%,'trust' 从 6.9% 提升至 14.8%。
- 在 IEMOCAP 单标签数据集上,EmoGraph 使用 LSTM 编码器时平均 F1 提升 8.5%,使用 BERT 编码器时提升 3.4%,展现出强大泛化能力。
- 尽管 'fear' 在图中无直接连接,其 F1 仍提升 10% 以上,表明式 (4) 中的 W1 共享表示学习有助于优化。
- 图可视化部分与 Plutchik 的情绪轮一致,证实所学依赖关系反映了已知情绪结构,尽管部分偏差(如 'surprise' 靠近 'joy')反映了真实语言中的偏见。
- 使用归一化的共现统计信息(G_i,j^1)能有效捕捉非对称情绪依赖,其在建模真实世界情绪关系方面优于对称共现矩阵。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。