Skip to main content
QUICK REVIEW

[论文解读] A Public Reference Implementation of the RAP Anaphora Resolution Algorithm

Long Qiu, Min‐Yen Kan|ArXiv.org|Jun 17, 2004
Natural Language Processing Techniques参考文献 6被引用 75
一句话总结

本文提出了 JavaRAP,这是一个公开的、独立的 RAP 指代消解算法的参考实现,用于解析第三人称代词、词汇指代和同位复指代词。它以 Charniak (2000) 分析器的输出作为输入,输出指代-回指对或执行原位替换,其在 MUC-6 共指任务上的准确率为 57.9%,与先前文献结果一致。

ABSTRACT

This paper describes a standalone, publicly-available implementation of the Resolution of Anaphora Procedure (RAP) given by Lappin and Leass (1994). The RAP algorithm resolves third person pronouns, lexical anaphors, and identifies pleonastic pronouns. Our implementation, JavaRAP, fills a current need in anaphora resolution research by providing a reference implementation that can be benchmarked against current algorithms. The implementation uses the standard, publicly available Charniak (2000) parser as input, and generates a list of anaphora-antecedent pairs as output. Alternately, an in-place annotation or substitution of the anaphors with their antecedents can be produced. Evaluation on the MUC-6 co-reference task shows that JavaRAP has an accuracy of 57.9%, similar to the performance given previously in the literature (e.g., Preiss 2002).

研究动机与目标

  • 为基准测试目的,提供一个公开可获取的、独立的 RAP 指代消解算法参考实现。
  • 通过提供一个标准实现,支持可复现研究,以便与新型指代消解算法进行比较。
  • 使研究人员能够使用一个一致且文档齐全的工具,评估并扩展 RAP 算法。
  • 证明 RAP 算法在标准共指评估基准上保持具有竞争力的性能。

提出的方法

  • RAP 算法以 Java 实现为 JavaRAP,使用 Charniak (2000) 依存句法分析器作为输入,进行句法和语义分析。
  • 系统通过句法和语义约束识别指代,包括性、数以及句法核心成分的匹配。
  • 应用一组消解规则,基于语言学特征将代词和词汇指时代词与最可能的回指词关联。
  • 该实现支持两种输出模式:列出指代-回指对,或在输入文本中执行原位替换。
  • 该算法结合句法分析、语义角色标注和词汇约束,以确定回指候选。
  • 在 MUC-6 共指任务上使用标准指标进行评估,以衡量准确率。

实验结果

研究问题

  • RQ1能否开发一个公开的、独立的 RAP 算法实现,作为指代消解研究的参考基准?
  • RQ2RAP 算法在标准共指评估数据集上的性能与现有实现相比如何?
  • RQ3RAP 算法在使用标准自然语言处理工具的情况下,能在多大程度上解析第三人称代词、词汇指代和同位复指代词?
  • RQ4RAP 算法在 MUC-6 数据集上的准确率是否与文献中先前报告的结果一致?

主要发现

  • JavaRAP 在 MUC-6 共指任务上实现了 57.9% 的共指消解准确率,与文献中先前报告的性能水平一致。
  • 该实现成功解析了第三人称代词、词汇指代,并识别出同位复指代词,使用标准解析和语言学规则。
  • 该系统提供两种输出选项:指代-回指对列表和原位替换,增强了其在下游应用中的实用性。
  • 通过使用 Charniak (2000) 分析器作为输入,该实现确保与广泛使用的自然语言处理流程兼容,并促进了可复现性。
  • JavaRAP 的公开可用性使得能够与新型指代消解算法进行直接比较,推动了该领域的发展。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。