QUICK REVIEW

[論文レビュー] Integrating selectional preferences in WordNet

Eneko Agirre, David Martínez|ArXiv.org|Apr 11, 2002

Natural Language Processing Techniques参考文献 9被引用数 42

ひとこと要約

本稿では、感覚の明確化された訓練データを用いて、未タグ付きコーパスから動詞の語類の好みを学習することで、WordNetにクラス同士の選択性好みを統合する手法を提案する。このアプローチにより、頻度の低い語の意味への好みの継承が可能となり、語の意味の解釈性能が向上し、ベンチマークタスクにおける実験結果を通じて、実現可能性と有効性が示された。

ABSTRACT

Selectional preference learning methods have usually focused on word-to-class relations, e.g., a verb selects as its subject a given nominal class. This paper extends previous statistical models to class-to-class preferences, and presents a model that learns selectional preferences for classes of verbs, together with an algorithm to integrate the learned preferences in WordNet. The theoretical motivation is twofold: different senses of a verb may have different preferences, and classes of verbs may share preferences. On the practical side, class-to-class selectional preferences can be learned from untagged corpora (the same as word-to-class), they provide selectional preferences for less frequent word senses via inheritance, and more important, they allow for easy integration in WordNet. The model is trained on subject-verb and object-verb relationships extracted from a small corpus disambiguated with WordNet senses. Examples are provided illustrating that the theoretical motivations are well founded, and showing that the approach is feasible. Experimental results on a word sense disambiguation task are also provided.

研究の動機と目的

語の意味の解釈を語の意味からクラスへの関係を超えて、動詞の語類同士の関係にまで拡張する。
未タグ付きコーパスから動詞の語類の選択性好みを学習するモデルを開発する。
学習された好みをWordNetに統合し、語彙的リソースの有用性を高める。
動詞の語類からの好みの継承を活用して、語の意味の解釈を支援する。
理論的な利点（例えば、語類間での好みの共有）が実際のデータで実証可能かどうかを実証的評価で検証する。

提案手法

モデルは、小規模な感覚の明確化されたコーパスから抽出された主語-動詞および目的語-動詞関係から選択性好みを学習する。
同じ文法的・意味的挙動を共有する動詞の意味を同定し、グループ化することで語類に分類する。
統計モデルが動詞語類と名詞語類の間で好みスコアを計算し、典型的な項の好みを捉える。
好みは継承によって伝達され、頻度が低い語の意味に語類レベルの好みが割り当てられる。
学習された好みは、クラス同士の好みリンクを追加することで、WordNetの語彙的構造を拡張することによって統合される。
このアプローチは、大規模な手動アノテーションに依存しないように、小規模で手動で感覚の明確化されたコーパスを訓練データとして使用する。

実験結果

リサーチクエスチョン

RQ1感覚の明確化された訓練データを用いて、未タグ付きコーパスからクラス同士の選択性好みを効果的に学習できるか？
RQ2語類レベルの好みは、語レベルの好みと比較して語の意味の解釈性能を向上させるか？
RQ3頻度が低い語の意味に対する好みは、動詞の語類からの継承によって信頼性高く推定可能か？
RQ4WordNetへの語類レベルの好みの統合は技術的・構造的に可能か？
RQ5理論的な利点（例えば、語類間での好みの共有）は、実際のデータでも成り立つか？

主な発見

モデルは、感覚の明確化された訓練データのみを用いて、未タグ付きコーパスからクラス同士の選択性好みを成功裏に学習した。
語類レベルの好みは、効果的な継承を可能にし、訓練データに直接観測されない希少な語の意味に対しても妥当な好みを提供した。
学習された好みをWordNetに統合することで、自然言語処理タスクにおける語彙的リソースの有用性が向上した。
語の意味の解釈タスクにおける実験結果から、提案手法を用いることで明確な性能向上が得られた。
本手法は、語類レベルの好みの理論的利点（動詞の意味間での好みの共有、データのスパarsityに対するロバストネスなど）が実際のデータでも成立することを検証した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。