QUICK REVIEW

[论文解读] An implemented model of punning riddles

Kim Binsted, Graéme Ritchie|ArXiv.org|Jun 13, 1994

Humor Studies and Applications参考文献 7被引用 63

一句话总结

本文提出 J A P E-1，一个可实现的符号化模型，通过词汇条目和两种核心结构（语义关系的模式和表层形式的模板）生成双关语谜题。该系统成功生成了可识别的笑话，但多数笑话质量较低，在人工评估中的平均得分为 5 分制中的 1.5 分，表明尽管在质量与词汇精确度方面仍有提升空间，该方法在计算幽默生成方面已具备可行性。

ABSTRACT

In this paper, we discuss a model of simple question-answer punning, implemented in a program, JAPE, which generates riddles from humour-independent lexical entries. The model uses two main types of structure: schemata, which determine the relationships between key words in a joke, and templates, which produce the surface form of the joke. JAPE succeeds in generating pieces of text that are recognizably jokes, but some of them are not very good jokes. We mention some potential improvements and extensions, including post-production heuristics for ordering the jokes according to quality.

研究动机与目标

开发一种可计算实现的、形式化的双关语谜题符号模型。
使用结构化的语言规则，从与幽默无关的词汇库中生成幽默且可识别的笑话。
根据人类标准评估自动生成的双关语谜题的质量。
识别当前设计的局限性，并提出改进方案以提升笑话质量。
探索通过形式化符号计算建模语言幽默的可行性。

提出的方法

该模型使用模式来定义目标词与其同音词之间的语义关系，通过结合两者的含义形成一个虚假短语。
模板用于生成谜题的表层结构，包括问题与笑点的构建。
系统依赖于包含定义含义、词类和同音词的词汇库，以支持词替换双关语。
J A P E-1 通过将同音词代入常见名词短语来生成谜题，从而制造双关意义。
评估过程由人工评委根据 5 分制评分标准对生成的笑话进行评分，以评估其可识别性与幽默质量。
评估后提出启发式方法，用于按质量筛选和排序笑话，包括优化词汇条目和剔除表现不佳的模板。

实验结果

研究问题

RQ1符号化计算模型能否生成可识别为笑话的双关语谜题？
RQ2自动生成的双关语谜题质量与人工创作的版本相比如何？
RQ3哪些结构和词汇因素会影响生成谜题的幽默感或失败原因？
RQ4哪些模板与模式的组合能持续产生高质量的笑话？
RQ5如何改进词汇定义以提升笑话的质量与连贯性？

主要发现

J A P E-1 能够成功生成可被识别为笑话的文本，证明符号模型可以产生可识别的幽默输出。
人工评委给出的笑话平均得分为 1.5/5，表明大多数生成的笑话被认为质量较低或‘令人失望’。
一位评委给出的高分笑话（5/5）在另一位评委处得分却很低，表明人工评估存在不一致，可能具有主观性。
如 use_syn 这类模板会产生非笑话（例如：'你用什么去打等待队列？一个池塘排队。'），原因在于对模式生成的定义使用不当。
class_has_rev 模板表现更优（平均得分为 2 分），表明模板设计对笑话质量有显著影响。
词汇条目若定义过于宽泛（例如将 'hanger' 定义为 'device'），会导致笑话逻辑不通，凸显出需要更丰富的词汇元数据。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。