Skip to main content
QUICK REVIEW

[论文解读] Tracking Sentiment in Mail: How Genders Differ on Emotional Axes

Saif M. Mohammad, T.Y. Yang|arXiv (Cornell University)|Sep 24, 2013
Sentiment Analysis and Opinion Mining参考文献 32被引用 172
一句话总结

本文提出了一种众包词汇-情绪词典,用于分析不同邮件类型中性别差异的情感表达。通过情感分析与可视化,研究发现女性在工作邮件中更常使用喜悦-悲伤类词汇,而男性则更偏好恐惧-信任类术语,为情感感知邮件工具和心理健康监测提供了洞见。

ABSTRACT

With the widespread use of email, we now have access to unprecedented amounts of text that we ourselves have written. In this paper, we show how sentiment analysis can be used in tandem with effective visualizations to quantify and track emotions in many types of mail. We create a large word--emotion association lexicon by crowdsourcing, and use it to compare emotions in love letters, hate mail, and suicide notes. We show that there are marked differences across genders in how they use emotion words in work-place email. For example, women use many words from the joy--sadness axis, whereas men prefer terms from the fear--trust axis. Finally, we show visualizations that can help people track emotions in their emails.

研究动机与目标

  • 通过众包方法构建大规模、高覆盖率的词汇-情绪关联词典,用于书面文本的情感与情绪分析。
  • 利用该词典研究情感语言在不同类型邮件(情书、仇恨邮件、自杀遗书)中的差异。
  • 考察工作邮件中基于性别的情感表达差异,重点关注特定情感轴线。
  • 设计并展示可视化工具,使个人能够追踪自身邮件通信中的情感内容。
  • 支持实际应用场景,如心理健康风险检测、基于情感的邮件搜索,以及数字通信中情感交流的改善。

提出的方法

  • 通过在 Amazon Mechanical Turk 上众包标注,基于洛氏分类法(Roget’s Thesaurus)作为词汇义项来源,构建大规模词汇-情绪词典。
  • 实施质量控制措施,确保多位标注者之间情绪标注的一致性与可靠性。
  • 根据埃克曼的基本情绪理论,将词汇映射到八种基本情绪(喜悦、悲伤、愤怒、恐惧、信任、厌恶、惊讶、期待)。
  • 使用 Google N-gram 语料库对词汇进行频率筛选,仅保留高频词汇以确保稳健性。
  • 将词典应用于分析三类不同邮件语料的情感内容:情书、仇恨邮件与自杀遗书。
  • 将情感分析与邮件服务(如 Gmail)集成,通过视觉反馈实现实时情感基调追踪。

实验结果

研究问题

  • RQ1情书、仇恨邮件与自杀遗书中的情感词汇分布有何差异?
  • RQ2在工作邮件中,性别差异在情感表达上如何体现,特别是在喜悦-悲伤与恐惧-信任轴线上?
  • RQ3众包情绪词典能否有效捕捉非正式书面交流中的细微情感内容?
  • RQ4邮件情感基调的可视化在多大程度上能帮助用户监控与管理其情感表达?
  • RQ5邮件中的情感分析能否有助于心理困扰的早期检测,或改善人际沟通?

主要发现

  • 女性的工作邮件中,喜悦-悲伤情感轴相关词汇的使用显著多于男性邮件。
  • 男性的工作邮件中,与恐惧-信任情感轴相关的词汇频率更高,表明其情感表达具有独特特征。
  • 该情绪词典成功捕捉了三类邮件在情感基调上的有意义差异,其中自杀遗书表现出高水平的悲伤与恐惧。
  • 情书以高频率使用喜悦与信任类词汇为特征,而仇恨邮件则表现出高频率的愤怒、厌恶与恐惧。
  • 情感趋势随时间的可视化揭示了可检测的情感基调变化,支持其在个人情感自我监控中的应用。
  • 该方法表明,邮件中的情感分析既可靠又具可操作性,尤其在结合用户友好的视觉反馈时效果更佳。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。