Skip to main content
QUICK REVIEW

[论文解读] Humor in Collective Discourse: Unsupervised Funniness Detection in the New Yorker Cartoon Caption Contest

Dragomir Radev, Amanda Stent|arXiv (Cornell University)|Jun 26, 2015
Topic Modeling参考文献 12被引用 29
一句话总结

本文提出了一种无监督方法,通过语言和结构特征(如情感、以人为中心、词汇中心性)检测《纽约客》漫画标题的幽默感。研究发现,负面情感、对人物的提及以及反映集体共识的标题最能预测幽默感,该结论通过在50幅漫画上进行的超过298,000条标题的亚马逊机械 Turk 评估得到验证。

ABSTRACT

The New Yorker publishes a weekly captionless cartoon. More than 5,000 readers submit captions for it. The editors select three of them and ask the readers to pick the funniest one. We describe an experiment that compares a dozen automatic methods for selecting the funniest caption. We show that negative sentiment, human-centeredness, and lexical centrality most strongly match the funniest captions, followed by positive sentiment. These results are useful for understanding humor and also in the design of more engaging conversational agents in text and multimodal (vision+text) systems. As part of this work, a large set of cartoons and captions is being made available to the community.

研究动机与目标

  • 开发无监督方法,按幽默程度对漫画标题进行排序,超越二元幽默分类。
  • 识别在集体用户生成标题中与感知幽默相关联的语言和结构特征。
  • 通过亚马逊机械 Turk 的人工判断评估这些特征,以确定哪些特征最能预测幽默感。
  • 发布一个大规模、带注释的《纽约客》漫画标题及漫画内容语料库,供公众研究和共享任务使用。
  • 理解集体智慧和语义中心性在多模态、基于文本的语篇中幽默检测中的作用。

提出的方法

  • 使用 TF-IDF 和词嵌入,从 50 幅《纽约客》漫画比赛的 298,224 条标题中构建词汇网络。
  • 应用 LexRank 方法,识别每场比赛中最具中心性(语义代表性)的标题,作为集体共识的度量。
  • 使用图聚类检测标题的主题群组,并基于聚类大小评估标题的中心性。
  • 使用基于词典的方法提取情感得分,区分正向和负向情感。
  • 通过统计对人物、社会关系和个人代词的提及次数来衡量以人为中心的程度。
  • 通过句法复杂度、具体性(与漫画物体的一致性)以及格式异常来评估标题质量。

实验结果

研究问题

  • RQ1在集体话语环境中,哪些语言和结构特征最能预测漫画标题的幽默感?
  • RQ2情感、以人为中心和词汇中心性等特征与原创性、语法正确性等传统指标相比,在预测幽默感方面表现如何?
  • RQ3在多大程度上,通过词汇中心性或聚类大小衡量的集体共识,比个体异常标题更能预测幽默感?
  • RQ4无监督方法在幽默感排序方面与官方编辑选择和反笑话相比表现如何?
  • RQ5负面情感和人物提及等特征是否能持续优于其他语言线索,在幽默检测中表现更优?

主要发现

  • 负面情感是幽默感最强的预测因子,在最显著的一致性条件(s4)下得分为 1.69,优于正向情感。
  • 以人为中心性(对人物、关系和代词的提及)是第二强预测因子,在 s4 中得分为 1.45,与以往关于社会幽默的研究结果一致。
  • 词汇中心性(通过 LexRank 和聚类大小测量)是第三有效的特征,得分为 1.39(OR2)和 -4.40(OR3R),表明集体共识与幽默感相关。
  • 正向情感和格式正确性分别为第四和第五强的特征,在 s3 中得分为 0.83 和 0.61。
  • 官方获胜者(NY1)在 s4 中得分为 3.57,表明人类判断高度一致,但其整体预测能力仍低于负面情感和以人为中心性。
  • 50 幅漫画、298,224 条标题以及人工标注的物体信息已公开发布,以支持未来幽默感检测的研究和共享任务。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。