Skip to main content
QUICK REVIEW

[论文解读] Integrating selectional preferences in WordNet

Eneko Agirre, David Martínez|ArXiv.org|Apr 11, 2002
Natural Language Processing Techniques参考文献 9被引用 42
一句话总结

本文提出一种方法,通过使用上下文消歧的训练语料从无标注语料中学习动词类别的选择偏好,将类别到类别的选择偏好整合到WordNet中。该方法能够将偏好继承至较少见的词义,并通过基准任务的实验结果证明了其可行性和有效性。

ABSTRACT

Selectional preference learning methods have usually focused on word-to-class relations, e.g., a verb selects as its subject a given nominal class. This paper extends previous statistical models to class-to-class preferences, and presents a model that learns selectional preferences for classes of verbs, together with an algorithm to integrate the learned preferences in WordNet. The theoretical motivation is twofold: different senses of a verb may have different preferences, and classes of verbs may share preferences. On the practical side, class-to-class selectional preferences can be learned from untagged corpora (the same as word-to-class), they provide selectional preferences for less frequent word senses via inheritance, and more important, they allow for easy integration in WordNet. The model is trained on subject-verb and object-verb relationships extracted from a small corpus disambiguated with WordNet senses. Examples are provided illustrating that the theoretical motivations are well founded, and showing that the approach is feasible. Experimental results on a word sense disambiguation task are also provided.

研究动机与目标

  • 将选择偏好学习从词到类的关系扩展至动词类别的类别到类别的偏好。
  • 开发一种从无标注语料中学习动词类别选择偏好的模型。
  • 实现所学偏好的集成,以增强WordNet的词汇资源实用性。
  • 通过利用动词类别的继承偏好支持词义消歧。
  • 通过实证评估验证类别级别偏好的理论优势。

提出的方法

  • 该模型从一个小规模、已消歧的语料中提取的主语-动词和宾语-动词关系中学习选择偏好。
  • 基于共享的句法和语义行为,识别并将动词词义分组为类别。
  • 统计模型计算动词类别与名词类别之间的偏好得分,捕捉典型的论元偏好。
  • 通过继承机制,将类别级别偏好传播至较少见的词义。
  • 通过在WordNet的词汇结构中扩展类别到类别的偏好链接,将所学偏好集成到WordNet中。
  • 该方法使用一个小规模人工消歧语料作为训练数据,避免对大规模人工标注的依赖。

实验结果

研究问题

  • RQ1能否仅使用消歧训练数据,从未标注语料中有效学习类别到类别的选择偏好?
  • RQ2与词级别偏好相比,类别级别偏好是否能提升词义消歧性能?
  • RQ3能否通过从动词类别继承,可靠地推断出较少见词义的偏好?
  • RQ4将类别级别偏好集成到WordNet在技术与结构上是否可行?
  • RQ5类别级别偏好的理论优势(如不同词义间的共享偏好)在实践中是否成立?

主要发现

  • 该模型成功地仅使用消歧训练数据,从未标注语料中学习到类别到类别的选择偏好。
  • 类别级别偏好实现了有效的继承,为训练数据中未直接观察到的罕见词义提供了合理的偏好。
  • 将所学偏好集成到WordNet中,显著提升了该词汇资源在自然语言处理任务中的实用性。
  • 在词义消歧任务上的实验结果表明,所提方法带来了可测量的性能提升。
  • 该方法验证了类别级别偏好的理论优势,包括动词词义间的共享偏好以及对数据稀疏性的鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。