Skip to main content
QUICK REVIEW

[論文レビュー] An implemented model of punning riddles

Kim Binsted, Graéme Ritchie|ArXiv.org|Jun 13, 1994
Humor Studies and Applications参考文献 7被引用数 63
ひとこと要約

本稿では、語彙的エントリと2つのコア構造(意味的関係のスキーマと表層構造のテンプレート)を用いて、ユーモラスな言葉遊びのなぞなぞを生成する実装済みの記号的モデル、J A P E-1 を提示する。このシステムは認識可能なジョークを効果的に生成するが、多くのジョークは低品質と評価され、人間による評価では平均1.5点(5段階評価)にとどまり、計算的ユーモア生成の可能性は示しているものの、品質と語彙的正確性の面で改善の余地があることが示された。

ABSTRACT

In this paper, we discuss a model of simple question-answer punning, implemented in a program, JAPE, which generates riddles from humour-independent lexical entries. The model uses two main types of structure: schemata, which determine the relationships between key words in a joke, and templates, which produce the surface form of the joke. JAPE succeeds in generating pieces of text that are recognizably jokes, but some of them are not very good jokes. We mention some potential improvements and extensions, including post-production heuristics for ordering the jokes according to quality.

研究の動機と目的

  • 言葉遊びのなぞなぞを形式的・記号的にモデル化し、計算的に実装可能なモデルを開発すること。
  • 構造的な言語ルールに従い、ユーモアに依存しない語彙から、面白く認識可能なジョークを生成すること。
  • 自動生成された言葉遊びのなぞなぞの質を人間基準と照らし合わせて評価すること。
  • 現在の設計における制限を特定し、より良いジョーク品質を実現するための改善策を提案すること。
  • 形式的記号的計算によって言語的ユーモアをモデル化する可能性を検討すること。

提案手法

  • モデルは、ターゲット語とその同音異義語の間の意味的関係を定義するスキーマを用い、意味を組み合わせて擬似表現を形成する。
  • テンプレートは、なぞなぞの表層構造、特に質問とオチの構成を生成する。
  • システムは、意味、品詞、同音異義語が明確に定義された語彙に依存しており、語の置換による言葉遊びを可能にする。
  • J A P E-1 は、同音異義語を一般的な名詞句に置き換えることで、二重の意味を持つ表現を生成する。
  • 評価では、人間のジャッジが生成されたジョークを5段階評価尺度でスコア付けし、認識可能性とユーモラスな質を評価する。
  • 評価後のヒューリスティクスを提案し、ジョークの質に基づいてフィルタリングおよび順位付けを行う。これには語彙エントリの精錬と、低性能なテンプレートの削除が含まれる。

実験結果

リサーチクエスチョン

  • RQ1記号的計算モデルは、ジョークとして認識可能な言葉遊びのなぞなぞを生成できるか?
  • RQ2自動生成された言葉遊びのなぞなぞの質は、人間が作成した例と比べてどうか?
  • RQ3ジョークの面白さや失敗に寄与する構造的および語彙的要因は何か?
  • RQ4どのテンプレートとスキーマの組み合わせが一貫して高品質なジョークを生み出すか?
  • RQ5語彙的定義をどのように改善すれば、ジョークの質と整合性を向上させられるか?

主な発見

  • J A P E-1 は、ジョークとして識別可能なテキストを効果的に生成し、記号的モデルが認識可能なユーモラスな出力を生成できることを示している。
  • 人間ジャッジによる平均スコアは5段階中1.5点であり、多数の生成ジョークが低品質または「悲惨」と感じられることを示している。
  • 1人のジャッジが5点(最高)と評価した高得点のジョークも、他のジャッジからは低く評価されたため、人間評価に一貫性がなく、主観的である可能性があることが示された。
  • use_syn テンプレートは、スキーマによって生成された定義の不適切な使用により、非ジョーク(例:「待つ列をたたくのに何を使いますか? プール・キューです。」)を生み出した。
  • class_has_rev テンプレートはより良い結果(平均2点)を示し、テンプレート設計がジョーク品質に顕著に影響することを示している。
  • 「ハンガー」を「装置」といった一般的すぎる定義を持つ語彙エントリは、整合性のないジョークを生み出した。これは、より豊かな語彙メタデータの必要性を強調している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。