[论文解读] HUMOR: A Crowd-Annotated Spanish Corpus for Humor Analysis.
本论文介绍了 HUMOR,这是一个通过网络众包方式收集的西班牙语语料库,包含 27,000 条推文,附有幽默标签和可笑程度评分,由来自全球的 1,300 名标注者完成。其 Krippendorff's alpha 值为 0.5710,可作为自然语言处理中幽默检测与主观性分析的基础资源。
Computational Humor involves several tasks, such as humor recognition, humor generation, and humor scoring, for which it is useful to have human-curated data. In this work we present a corpus of 27,000 tweets written in Spanish and crowd-annotated by their humor value and funniness score, with about four annotations per tweet, tagged by 1,300 people over the Internet. It is equally divided between tweets coming from humorous and non-humorous accounts. The inter-annotator agreement Krippendorff's alpha value is 0.5710. The dataset is available for general use and can serve as a basis for humor detection and as a first step to tackle subjectivity.
研究动机与目标
- 创建一个大规模、公开可用的西班牙语推文语料库,对幽默性和可笑程度进行标注,以支持计算幽默研究。
- 解决多语言幽默数据集稀缺的问题,特别是西班牙语在自然语言处理任务中的缺乏。
- 支持在低资源语言(如西班牙语)中进行幽默检测、可笑程度评分和主观语言理解的研究。
- 为评估模型在社交媒体文本中识别幽默与主观性方面提供基准。
提出的方法
- 该语料库基于从幽默与非幽默西班牙语推特账号中收集的 27,000 条推文构建,保持平衡。
- 每条推文平均获得每位用户约四次标注,包括幽默性标签(幽默/非幽默)和数值量表上的可笑程度评分。
- 通过互联网从 1,300 名个体进行众包标注,以确保语言覆盖范围广泛且多样化。
- 使用 Krippendorff's alpha 测量标注者间的一致性,得出值为 0.5710,表明标注者之间具有一致性。
- 该数据集已公开发布,旨在用于训练和评估幽默检测与评分模型。
实验结果
研究问题
- RQ1在对西班牙语推文进行幽默与可笑程度标注时,标注者之间的一致性水平如何?
- RQ2众包方法在生成西班牙语社交媒体文本可靠幽默标注方面有多有效?
- RQ3该语料库在多大程度上能支持低资源语言(如西班牙语)中计算幽默系统的发展?
- RQ4该数据集能否作为自然语言处理中幽默检测与主观性分析的可行基准?
主要发现
- HUMOR 语料库包含 27,000 条西班牙语推文,幽默与非幽默来源数量相等,确保了平衡的代表性。
- 每条推文平均获得四次标注,有助于实现稳健且可靠的标注结果。
- 通过 Krippendorff's alpha 测量的标注者间一致性达到 0.5710,表明标注者之间具有一致性。
- 该数据集可公开使用,支持幽默检测与主观语言理解方面的研究。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。