Skip to main content
QUICK REVIEW

[論文レビュー] Centering in Japanese Discourse

Marilyn Walker, Masayo Iida|ArXiv.org|Sep 24, 1996
Natural Language Processing Techniques被引用数 27
ひとこと要約

本稿は、日本語の話法におけるゼロ代名詞の解決のための、センターイング理論に基づく計算モデルを提案する。従来、必要とされてきた文法的機能の共有は、実際には不要であることが示された。トピックの曖昧性を導入し、言語特異的なCfリスト順序付けを用いてセンターイングアルゴリズムを適応させることで、追加のメカニズムを必要とせず、正確に代名詞の指し示し先を予測できる。これにより、日本語および英語のシステムにおいて、最小限の言語パラメータ化で言語に依存しない話法処理モジュールが実現可能となる。

ABSTRACT

In this paper we propose a computational treatment of the resolution of zero pronouns in Japanese discourse, using an adaptation of the centering algorithm. We are able to factor language-specific dependencies into one parameter of the centering algorithm. Previous analyses have stipulated that a zero pronoun and its cospecifier must share a grammatical function property such as {\sc Subject} or {\sc NonSubject}. We show that this property-sharing stipulation is unneeded. In addition we propose the notion of {\sc topic ambiguity} within the centering framework, which predicts some ambiguities that occur in Japanese discourse. This analysis has implications for the design of language-independent discourse modules for Natural Language systems. The centering algorithm has been implemented in an HPSG Natural Language system with both English and Japanese grammars.

研究の動機と目的

  • センターイング理論を用いて、日本語話法におけるゼロ代名詞の解決のための計算モデルを開発すること。
  • ゼロ代名詞とその先行詞との間で、文法的機能の共有(例:主語/目的語)を事前に規定する必要を排除すること。
  • 従来のモデルが非文法的と誤分類する日本語話法における曖昧性を扱うこと。
  • トピックの曖昧性を、センターイングフレームワーク内での形式的メカニズムとして提案し、従来の研究で見過ごされた話法現象を説明すること。
  • 言語特異的な依存関係を1つのパラメータ(Cfリスト順序付け)に集約することで、言語に依存しない話法処理を可能とすること。

提案手法

  • バックワード・センター(Cb)とフォワード・センター(Cf)を用い、スコア順に並べた提示の明確さに基づいて、話法的注意のシフトをモデル化するようにセンターイングアルゴリズムを適応する。
  • Cbの保持またはシフトに基づいて話法遷移を定義し、Cbが直前の発話で実現されたCfの中から最もスコアの高いものでなければならないという制約を適用する。
  • 未表現の項が文脈とCbに応じてトピックまたは非トピックとして解釈可能であるという、トピックの曖昧性をメカニズムとして導入する。
  • Cbを用いて、話法の提示度と連続性に基づき、ゼロ代名詞がトピックとして割り当てられる状況を決定する。
  • HPSGに基づくNLPシステムにアルゴリズムを実装し、英語および日本語の文法を併用する。日本語には言語特異的なCfリスト順序付けを適用する。
  • 最小対照対(例:話題マーク「wa」の有無)を用いて、曖昧性解消の妥当性を検証する。

実験結果

リサーチクエスチョン

  • RQ1ゼロ代名詞の解消が、代名詞とその先行詞との間で文法的機能の共有を要求しない形で、日本語話法にモデル化可能か?
  • RQ2なぜ一部のゼロ代名詞の解釈は、従来のモデルが文法的機能共有制約に違反するとみなすにもかかわらず、依然として文法的とされるのか?
  • RQ3トピックの曖昧性を、センターイングフレームワーク内で形式的に捉えるにはどうすればよいか? これにより、従来の研究で説明がつかなかった解釈を説明できるか?
  • RQ4センターイングアルゴリズムをどの程度、言語に依存しない形にできるか? たった1つの言語特異的パラメータで十分か?
  • RQ5センターイングモデルは、話法の文脈とCbに基づいて、ゼロ代名詞のトピック的解釈と非トピック的解釈の両方を予測できるか?

主な発見

  • 従来、日本語のゼロ代名詞解消に必要とされてきた「性質共有制約」は、反例によって不要であることが示された。この制約が存在すると、非文法的と誤って予測される事例が存在する。
  • 従来の研究で見過ごされていた「トピックの曖昧性」が、非明示的な話題マーク(例:「wa」)がないにもかかわらず、ゼロ代名詞が話題として解釈されるような解釈を説明する。
  • センターイングアルゴリズムは、バックワード・センター(Cb)が提示度が高く、話法の実体と一致する場合、ゼロ代名詞にトピックとしての地位を割り当てられることを正確に予測している。
  • 新しい実体がCbに変わると、シフト-1遷移が発生し、新しい主語が最も提示度の高い実体である解釈が優先されることを、モデルは正しく予測している。
  • アルゴリズムの性能は、英語および日本語の両方で一貫しており、言語特異的パラメータが1つ(Cfリスト順序付け)であるため、言語に依存しない話法モジュールへの応用が可能である。
  • 最小対照対(例:話題マーク「wa」の有無)の比較により、トピックの曖昧性が実在の話法現象であり、モデルが正確に捉えていることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。